Psychiatric disorders represent one of the most significant global health challenges, affecting over 970 million people worldwide and imposing a substantial economic burden. Despite advances in neuroimaging and multi-omics technologies, clinical practice still relies heavily on symptom-based diagnostic systems that suffer from diagnostic instability, marked heterogeneity within categories, and limited predictive power for treatment response. In recognition of these limitations, the National Institute of Mental Health (NIMH) Research Domain Criteria (RDoC) framework has emphasized the need for biologically guided approaches that move beyond descriptive symptom clusters toward mechanistically grounded markers. Building on the RDoC foundation, which reconceptualizes mental health and illness as varying degrees of dysfunction across interconnected psychological and biological systems, precision psychiatry has emerged as a transformative paradigm driven by advances in data acquisition and artificial intelligence analysis tools. Aligned with emerging precision psychiatry roadmaps that emphasize continuously evolving, biology-informed diagnostic frameworks, these computational approaches offer unprecedented opportunities to integrate genetic, neuroimaging, behavioral, and environmental information beyond traditional categorical diagnostic systems toward integrated, personalized, biologically informed interventions. The primary goal of the clinical practice is identifying reliable quantitative markers that enhance diagnostic precision, enable earlier detection, facilitate treatment selection, and monitor disease progression. However, despite demonstrated potential, computational psychiatry approaches face major technical challenges and clinical integration barriers. Current methods prioritize classification accuracy over explainability and clinical translation factors, therefore remain fragmented without comprehensive integrated pipelines. Key methodological challenges include site-related variability in multi-site studies, lack of robust multimodal and multi-scale feature integration frameworks, and limited availability of data-driven stratification approaches for translating complex multimodal data into clinically meaningful patient subgroups. To address these technical gaps, this thesis develops and validates the steps of a comprehensive end-to-end analytical framework for quantitative marker extraction in psychiatric disorders, integrating multi-site data harmonization, advanced multimodal feature extraction, and clinically relevant stratification strategies. The research advances three key methodological developments: (i) establishing robust harmonization frameworks for multi-site neuroimaging data using ComBat technique (ComBating batch effect) that effectively remove technical variability while preserving biologically meaningful signals across multiple spatial scales and imaging modalities; (ii) implementing integrated feature extraction strategies that capture both multi-domain relationships, across neuroimaging, genetic, environmental, and clinical variables, and multi-scale patterns within single neuroimaging domains; and (iii) developing data-driven stratification pipelines leveraging Topological Data Analysis (TDA) for unsupervised extraction of multimodal feature combinations and clustering of clinically meaningful subgroups. Two novel complementary TDA-based stratification frameworks were implemented to enable systematic patient subtyping and marker discovery. The proposed methodologies are tested across multiple psychiatric conditions, including mood, developmental and behavioral, brain-gut axis disorders, with applications focusing also on healthy control populations, including both single individuals and twin pairs. Comprehensive analyses demonstrate ComBat’s effectiveness in harmonizing structural and functional neuroimaging measures across sites applied on healthy control samples, from voxel-level morphometry to resting-state networks. Advanced multivariate feature extraction approaches, including statistical twin modeling, Partial Least Squares methods, and TDA for Major Depression Disorder (MDD) stratification, reveal complex associations among genetic, environmental, and multimodal and multi-scale brain patterns, identifying transdiagnostic signatures across mood disorders. Furthermore, TDA-based pipelines applied on MDD sample simultaneously identify optimal predictive features and clinical patient subgroups, unifying feature discovery and stratification to bridge statistical modeling and clinical insights. Spatial Analysis of Functional Enrichment applied on TDA graph revealed domain-specific predictive patterns, with environmental, neuroimaging, and functional brain features respectively linked to symptom severity, medical comorbidities, and treatment resistance. In parallel, a community detection framework with cross-cohort validation confirmed these findings, simultaneously extracting predictive features and identifying clinically interpretable patient subgroups with distinct feature–outcome profiles. Taken together, these convergent results demonstrate that multimodal integration of genetic, environmental, and brain features is essential to disentangle psychiatric disorders’ heterogeneity, establishing quantitative markers necessary for effective personalized stratification and the transition from symptom-based to biologically informed clinical practice. The developed methodologies provide robust, interpretable, and clinically relevant developments for each stage of a comprehensive computational framework aimed to advance precision psychiatry through integrated marker discovery and patient subtyping. By enabling more accurate patient stratification and marker discovery, this work contributes to moving psychiatry beyond symptom-based diagnostics toward biologically grounded and personalized clinical practice.

I disturbi psichiatrici rappresentano una delle sfide più rilevanti per la salute globale, interessando oltre 970 milioni di persone e imponendo un notevole peso socioeconomico. Nonostante i progressi delle tecniche di neuroimaging e delle scienze omiche, la pratica clinica si basa ancora in larga parte su sistemi diagnostici focalizzati sulla descrizione dei sintomi, caratterizzati da instabilità diagnostica, marcata eterogeneità interna e limitata capacità predittiva rispetto alla risposta ai trattamenti. Per superare tali limiti, il framework dei Research Domain Criteria (RDoC) del National Institute of Mental Health (NIMH) ha promosso approcci guidati dalla biologia, capaci di andare oltre la semplice descrizione dei cluster sintomatologici verso l’identificazione di marcatori con basi meccanicistiche. In questa direzione si colloca la psichiatria di precisione, un paradigma emergente che, grazie ai progressi nell’acquisizione dei dati e negli strumenti di intelligenza artificiale, propone modelli diagnostici basati su gradi di disfunzione di sistemi psicologici e biologici interconnessi. In linea con le roadmap emergenti della psichiatria di precisione, che enfatizzano framework diagnostici dinamici e biologicamente informati, questi approcci computazionali offrono opportunità senza precedenti per integrare informazioni genetiche, di neuroimaging, comportamentali e ambientali, superando i sistemi categoriali tradizionali verso interventi personalizzati e biologicamente informati. L’obiettivo principale della pratica clinica è identificare marcatori quantitativi affidabili in grado di migliorare la precisione diagnostica, consentire una diagnosi più precoce, supportare la selezione dei trattamenti e monitorare l’evoluzione della malattia. Tuttavia, nonostante il loro potenziale, gli approcci di psichiatria computazionale incontrano ancora rilevanti sfide tecniche e difficoltà di integrazione clinica. Le metodologie attuali tendono a privilegiare l’accuratezza di classificazione rispetto all’interpretabilità e alla traslazione clinica, rimanendo frammentate e prive di pipeline integrate. Tra le principali criticità emergono la variabilità legata ai siti di acquisizione negli studi multicentrici, la mancanza di framework robusti per l’integrazione multimodale e multiscala delle feature e la limitata disponibilità di approcci data-driven per tradurre dati multimodali complessi in sottogruppi clinicamente significativi. Per affrontare queste lacune metodologiche, questa tesi sviluppa e valida un framework analitico end-to-end per l’estrazione di marcatori quantitativi nei disturbi psichiatrici, integrando armonizzazione dei dati multi-sito, estrazione avanzata di feature multimodali e strategie di stratificazione clinicamente rilevanti. La ricerca introduce tre principali sviluppi metodologici: (i) la definizione di framework robusti per l’armonizzazione dei dati di neuroimaging multi-sito tramite la tecnica ComBat (Combating Batch Effects), capaci di rimuovere la variabilità tecnica preservando i segnali biologicamente significativi su diverse scale spaziali e modalità di imaging; (ii) l’implementazione di strategie di estrazione di feature integrate, in grado di catturare sia relazioni multi-dominio tra neuroimaging, genetica, ambiente e clinica, sia pattern multiscala all’interno dei singoli domini neurobiologici; (iii) lo sviluppo di pipeline di stratificazione data-driven basate su Topological Data Analysis (TDA) per l’estrazione non supervisionata di combinazioni multimodali di feature e l’identificazione di sottogruppi clinicamente interpretabili. Sono stati implementati due framework TDA complementari per consentire una stratificazione sistematica dei pazienti e la scoperta di marcatori. Le metodologie proposte sono state testate su diverse condizioni psichiatriche, tra cui disturbi dell’umore, disturbi dello sviluppo e comportamentali e disturbi dell’asse intestino-cervello, includendo anche popolazioni di controllo sano, singoli individui e coppie di gemelli. Le analisi dimostrano l’efficacia di ComBat nell’armonizzazione delle misure strutturali e funzionali di neuroimaging tra diversi siti, dalle misure voxel-wise fino alle reti cerebrali a riposo. Approcci multivariati avanzati, inclusi modelli statistici gemellari, metodi di Partial Least Squares e TDA applicati alla stratificazione del disturbo depressivo maggiore (MDD), rivelano associazioni complesse tra fattori genetici, ambientali e pattern cerebrali multimodali e multiscala, identificando firme transdiagnostiche nei disturbi dell’umore. Inoltre, le pipeline TDA applicate al campione MDD consentono di identificare simultaneamente feature predittive ottimali e sottogruppi clinici, unificando la scoperta di marcatori e la stratificazione per colmare il divario tra modellazione statistica e interpretazione clinica. L’analisi spaziale di arricchimento funzionale applicata al grafo TDA evidenzia pattern predittivi dominio-specifici, con fattori ambientali associati alla gravità dei sintomi, misure di neuroimaging correlate alle comorbidità mediche e caratteristiche funzionali legate alla resistenza al trattamento. In parallelo, un framework di community detection con validazione cross-coorte conferma questi risultati, identificando sottogruppi clinicamente interpretabili con profili distinti di relazioni tra feature e outcome. Nel complesso, questi risultati convergenti dimostrano che l’integrazione multimodale di caratteristiche genetiche, ambientali e cerebrali è essenziale per affrontare l’eterogeneità dei disturbi psichiatrici, fornendo marcatori quantitativi necessari per una stratificazione personalizzata efficace e per la transizione da una pratica clinica basata sui sintomi a una biologicamente informata. Le metodologie sviluppate offrono contributi robusti, interpretabili e clinicamente rilevanti a ciascuna fase di un framework computazionale completo volto ad avanzare la psichiatria di precisione attraverso la scoperta integrata di marcatori e la stratificazione dei pazienti, contribuendo a superare i limiti della diagnosi tradizionale verso una pratica clinica personalizzata e fondata su basi biologiche.

Methodological advances in the precision psychiatry roadmap: topological stratification using gene -environment - brain features

EMMA, TASSI
2026

Abstract

Psychiatric disorders represent one of the most significant global health challenges, affecting over 970 million people worldwide and imposing a substantial economic burden. Despite advances in neuroimaging and multi-omics technologies, clinical practice still relies heavily on symptom-based diagnostic systems that suffer from diagnostic instability, marked heterogeneity within categories, and limited predictive power for treatment response. In recognition of these limitations, the National Institute of Mental Health (NIMH) Research Domain Criteria (RDoC) framework has emphasized the need for biologically guided approaches that move beyond descriptive symptom clusters toward mechanistically grounded markers. Building on the RDoC foundation, which reconceptualizes mental health and illness as varying degrees of dysfunction across interconnected psychological and biological systems, precision psychiatry has emerged as a transformative paradigm driven by advances in data acquisition and artificial intelligence analysis tools. Aligned with emerging precision psychiatry roadmaps that emphasize continuously evolving, biology-informed diagnostic frameworks, these computational approaches offer unprecedented opportunities to integrate genetic, neuroimaging, behavioral, and environmental information beyond traditional categorical diagnostic systems toward integrated, personalized, biologically informed interventions. The primary goal of the clinical practice is identifying reliable quantitative markers that enhance diagnostic precision, enable earlier detection, facilitate treatment selection, and monitor disease progression. However, despite demonstrated potential, computational psychiatry approaches face major technical challenges and clinical integration barriers. Current methods prioritize classification accuracy over explainability and clinical translation factors, therefore remain fragmented without comprehensive integrated pipelines. Key methodological challenges include site-related variability in multi-site studies, lack of robust multimodal and multi-scale feature integration frameworks, and limited availability of data-driven stratification approaches for translating complex multimodal data into clinically meaningful patient subgroups. To address these technical gaps, this thesis develops and validates the steps of a comprehensive end-to-end analytical framework for quantitative marker extraction in psychiatric disorders, integrating multi-site data harmonization, advanced multimodal feature extraction, and clinically relevant stratification strategies. The research advances three key methodological developments: (i) establishing robust harmonization frameworks for multi-site neuroimaging data using ComBat technique (ComBating batch effect) that effectively remove technical variability while preserving biologically meaningful signals across multiple spatial scales and imaging modalities; (ii) implementing integrated feature extraction strategies that capture both multi-domain relationships, across neuroimaging, genetic, environmental, and clinical variables, and multi-scale patterns within single neuroimaging domains; and (iii) developing data-driven stratification pipelines leveraging Topological Data Analysis (TDA) for unsupervised extraction of multimodal feature combinations and clustering of clinically meaningful subgroups. Two novel complementary TDA-based stratification frameworks were implemented to enable systematic patient subtyping and marker discovery. The proposed methodologies are tested across multiple psychiatric conditions, including mood, developmental and behavioral, brain-gut axis disorders, with applications focusing also on healthy control populations, including both single individuals and twin pairs. Comprehensive analyses demonstrate ComBat’s effectiveness in harmonizing structural and functional neuroimaging measures across sites applied on healthy control samples, from voxel-level morphometry to resting-state networks. Advanced multivariate feature extraction approaches, including statistical twin modeling, Partial Least Squares methods, and TDA for Major Depression Disorder (MDD) stratification, reveal complex associations among genetic, environmental, and multimodal and multi-scale brain patterns, identifying transdiagnostic signatures across mood disorders. Furthermore, TDA-based pipelines applied on MDD sample simultaneously identify optimal predictive features and clinical patient subgroups, unifying feature discovery and stratification to bridge statistical modeling and clinical insights. Spatial Analysis of Functional Enrichment applied on TDA graph revealed domain-specific predictive patterns, with environmental, neuroimaging, and functional brain features respectively linked to symptom severity, medical comorbidities, and treatment resistance. In parallel, a community detection framework with cross-cohort validation confirmed these findings, simultaneously extracting predictive features and identifying clinically interpretable patient subgroups with distinct feature–outcome profiles. Taken together, these convergent results demonstrate that multimodal integration of genetic, environmental, and brain features is essential to disentangle psychiatric disorders’ heterogeneity, establishing quantitative markers necessary for effective personalized stratification and the transition from symptom-based to biologically informed clinical practice. The developed methodologies provide robust, interpretable, and clinically relevant developments for each stage of a comprehensive computational framework aimed to advance precision psychiatry through integrated marker discovery and patient subtyping. By enabling more accurate patient stratification and marker discovery, this work contributes to moving psychiatry beyond symptom-based diagnostics toward biologically grounded and personalized clinical practice.
Methodological advances in the precision psychiatry roadmap: topological stratification using gene -environment - brain features
22-gen-2026
Inglese
I disturbi psichiatrici rappresentano una delle sfide più rilevanti per la salute globale, interessando oltre 970 milioni di persone e imponendo un notevole peso socioeconomico. Nonostante i progressi delle tecniche di neuroimaging e delle scienze omiche, la pratica clinica si basa ancora in larga parte su sistemi diagnostici focalizzati sulla descrizione dei sintomi, caratterizzati da instabilità diagnostica, marcata eterogeneità interna e limitata capacità predittiva rispetto alla risposta ai trattamenti. Per superare tali limiti, il framework dei Research Domain Criteria (RDoC) del National Institute of Mental Health (NIMH) ha promosso approcci guidati dalla biologia, capaci di andare oltre la semplice descrizione dei cluster sintomatologici verso l’identificazione di marcatori con basi meccanicistiche. In questa direzione si colloca la psichiatria di precisione, un paradigma emergente che, grazie ai progressi nell’acquisizione dei dati e negli strumenti di intelligenza artificiale, propone modelli diagnostici basati su gradi di disfunzione di sistemi psicologici e biologici interconnessi. In linea con le roadmap emergenti della psichiatria di precisione, che enfatizzano framework diagnostici dinamici e biologicamente informati, questi approcci computazionali offrono opportunità senza precedenti per integrare informazioni genetiche, di neuroimaging, comportamentali e ambientali, superando i sistemi categoriali tradizionali verso interventi personalizzati e biologicamente informati. L’obiettivo principale della pratica clinica è identificare marcatori quantitativi affidabili in grado di migliorare la precisione diagnostica, consentire una diagnosi più precoce, supportare la selezione dei trattamenti e monitorare l’evoluzione della malattia. Tuttavia, nonostante il loro potenziale, gli approcci di psichiatria computazionale incontrano ancora rilevanti sfide tecniche e difficoltà di integrazione clinica. Le metodologie attuali tendono a privilegiare l’accuratezza di classificazione rispetto all’interpretabilità e alla traslazione clinica, rimanendo frammentate e prive di pipeline integrate. Tra le principali criticità emergono la variabilità legata ai siti di acquisizione negli studi multicentrici, la mancanza di framework robusti per l’integrazione multimodale e multiscala delle feature e la limitata disponibilità di approcci data-driven per tradurre dati multimodali complessi in sottogruppi clinicamente significativi. Per affrontare queste lacune metodologiche, questa tesi sviluppa e valida un framework analitico end-to-end per l’estrazione di marcatori quantitativi nei disturbi psichiatrici, integrando armonizzazione dei dati multi-sito, estrazione avanzata di feature multimodali e strategie di stratificazione clinicamente rilevanti. La ricerca introduce tre principali sviluppi metodologici: (i) la definizione di framework robusti per l’armonizzazione dei dati di neuroimaging multi-sito tramite la tecnica ComBat (Combating Batch Effects), capaci di rimuovere la variabilità tecnica preservando i segnali biologicamente significativi su diverse scale spaziali e modalità di imaging; (ii) l’implementazione di strategie di estrazione di feature integrate, in grado di catturare sia relazioni multi-dominio tra neuroimaging, genetica, ambiente e clinica, sia pattern multiscala all’interno dei singoli domini neurobiologici; (iii) lo sviluppo di pipeline di stratificazione data-driven basate su Topological Data Analysis (TDA) per l’estrazione non supervisionata di combinazioni multimodali di feature e l’identificazione di sottogruppi clinicamente interpretabili. Sono stati implementati due framework TDA complementari per consentire una stratificazione sistematica dei pazienti e la scoperta di marcatori. Le metodologie proposte sono state testate su diverse condizioni psichiatriche, tra cui disturbi dell’umore, disturbi dello sviluppo e comportamentali e disturbi dell’asse intestino-cervello, includendo anche popolazioni di controllo sano, singoli individui e coppie di gemelli. Le analisi dimostrano l’efficacia di ComBat nell’armonizzazione delle misure strutturali e funzionali di neuroimaging tra diversi siti, dalle misure voxel-wise fino alle reti cerebrali a riposo. Approcci multivariati avanzati, inclusi modelli statistici gemellari, metodi di Partial Least Squares e TDA applicati alla stratificazione del disturbo depressivo maggiore (MDD), rivelano associazioni complesse tra fattori genetici, ambientali e pattern cerebrali multimodali e multiscala, identificando firme transdiagnostiche nei disturbi dell’umore. Inoltre, le pipeline TDA applicate al campione MDD consentono di identificare simultaneamente feature predittive ottimali e sottogruppi clinici, unificando la scoperta di marcatori e la stratificazione per colmare il divario tra modellazione statistica e interpretazione clinica. L’analisi spaziale di arricchimento funzionale applicata al grafo TDA evidenzia pattern predittivi dominio-specifici, con fattori ambientali associati alla gravità dei sintomi, misure di neuroimaging correlate alle comorbidità mediche e caratteristiche funzionali legate alla resistenza al trattamento. In parallelo, un framework di community detection con validazione cross-coorte conferma questi risultati, identificando sottogruppi clinicamente interpretabili con profili distinti di relazioni tra feature e outcome. Nel complesso, questi risultati convergenti dimostrano che l’integrazione multimodale di caratteristiche genetiche, ambientali e cerebrali è essenziale per affrontare l’eterogeneità dei disturbi psichiatrici, fornendo marcatori quantitativi necessari per una stratificazione personalizzata efficace e per la transizione da una pratica clinica basata sui sintomi a una biologicamente informata. Le metodologie sviluppate offrono contributi robusti, interpretabili e clinicamente rilevanti a ciascuna fase di un framework computazionale completo volto ad avanzare la psichiatria di precisione attraverso la scoperta integrata di marcatori e la stratificazione dei pazienti, contribuendo a superare i limiti della diagnosi tradizionale verso una pratica clinica personalizzata e fondata su basi biologiche.
BRAMBILLA, PAOLO
MAGGIONI, ELEONORA
File in questo prodotto:
File Dimensione Formato  
TESI_PhD_ET_2025_R1_original.pdf

accesso aperto

Licenza: Tutti i diritti riservati
Dimensione 95.54 MB
Formato Adobe PDF
95.54 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/360591
Il codice NBN di questa tesi è URN:NBN:IT:POLIMI-360591