Il diabete mellito rappresenta una delle patologie più diffuse nel mondo e si stima che la sua incidenza aumenterà del 50 % nell’arco di 15 anni, passando da 250 milioni a quasi 400 milioni di malati nel 2025. La patologia comporta l’insorgenza di devastanti complicanze croniche, tra cui disturbi legati al danneggiamento dei vasi sanguigni sia a livello macro-vascolare – come coronopatia, infarto, insufficienza cardiaca, angina pectoris, ictus – che micro-vascolare, con conseguente danno a carico dei reni (nefropatia) e degli occhi (retinopatia). La patologia diabetica ha un’enorme impatto sia in termini di qualità di vita dei pazienti, sia a livello economico, in quanto si stima che più del 10 % dei costi dell’assistenza sanitaria di tutta l’Europa siano imputabili alla cura del diabete. Per questo motivo, nuovi mezzi che permettano di prevenire l’insorgere e il progredire della malattia e delle sue complicanze sono assolutamente necessari. L’obiettivo del seguente lavoro di tesi è quello di proporre nuovi metodi computazionali per lo studio delle complicanze del diabete in un ambito di modellistica multi-livello. Il diabete mellito è una malattia fortemente multifattoriale, nella quale molteplici fattori di rischio di diversa natura (genetica e ambientale) concorrono a provocarne l’insorgenza e lo sviluppo. I meccanismi fisiologici che sottendono allo scatenarsi e al progredire della patologia sono ancora per la maggior parte sconosciuti. Data la natura multifattoriale del diabete, lo studio delle complicanze si presta ad essere affrontato con un approccio multi-livello. Lo schema generale di una malattia multifattoriale, come il diabete, prevede l’azione combinata di 3 elementi chiave sullo stato patologico (l’outcome) del paziente: i) il fenotipo, ovvero l’insieme di tutte le variabili metaboliche, antropometriche e ambientali caratteristiche del paziente, ii) il genotipo, ovvero la sequenza DNA del paziente, iii) il trattamento, ovvero l’insieme di interventi esterni effettuati sul paziente, come terapie ed utilizzo di farmaci. Queste 3 variabili sono interconnesse tramite interazioni e concorrono tutte insieme a determinare l’outcome del paziente. L’approccio multi-livello consente di scomporre il problema completo in sottoproblemi, focalizzando l’attenzione di volta in volta solo su un sottoinsieme di variabili e di interazioni, a seconda del livello di informazione contenuto nei dati a disposizione. Nel seguente lavoro, vengono considerati 3 principali livelli di studio delle complicanze diabetiche, e, per ognuno dei 3 ambiti, vengono proposti nuovi metodi sviluppati durante il periodo di dottorato. I 3 livelli di studio trattati sono: i) modellizzazione dell’effetto del genotipo sull’outcome, ii) modellizzazione dell’effetto combinato di fenotipo e trattamento sulla progressione dell’outcome, iii) modellizzazione dell’azione del trattamento sul fenotipo. Il primo livello di studio si propone di studiare le complicanze diabetiche da un punto di vista statico, ovvero senza considerare l’evolversi e il progredire di tali complicanze nel tempo, ed ha come obiettivo quello di identificare i principali biomarcatori genetici che consentano di predire lo stato di malattia dei pazienti, e di stratificare i pazienti in base al rischio di sviluppare o meno la malattia. I Genome Wide Association Studies (GWAS), sono studi di associazione volti a identificare gli SNPs che, da soli o in combinazioni con altri SNPs, consentono di spiegare le differenze che si osservano in un determinato outcome (a presenza o meno di una patologia) tra casi (soggetti malati) e controlli (soggetti sani) in una popolazione di studio. Diversi metodi di selezione univariata e multivariata sono presenti in letteratura per l’identificazione di marcatori genetici da studi GWAS. In questo ambito, è stato sviluppato un nuovo metodo per la selezione multivariata di biomarcatori genetici e per la classificazione di soggetti a partire da dati di SNPs di studi GWAS, basato sui classificatori di Bayes e arricchito da 3 principali componenti: i) una predizione ottenuta da un insieme di classificatori di Bayes, utilizzando una strategia basata sul bootstrap, ii) un nuovo metodo per ordinare e selezionare gli attributi selezionati da ogni classificatore, iii) una procedura, bastata sulle permutazioni, per selezionare i biomarcatori significativi, sulla base della loro utilità marginale nel processo di classificazione. Il metodo è stato validato sui dati genome-wide del Wellcome Trust Case-Control Consortium, (WTCCC) relativi a diabetici di tipo 1 e le sue performance confrontate con gli algoritmi rappresentanti lo stato dell’arte in letteratura per studi di associazione genetica, in particolare un classificatore di Bayes e un algoritmo di regressione logistica penalizzata (HyperLASSO). Il secondo livello di studio riguarda l’analisi dinamica delle complicanze, nella quale interviene anche la variabile tempo come fattore chiave. In quest’ottica, si vuole modellizzare l’insorgere e la progressione temporale delle principali complicanze legate al diabete utilizzando l’informazione fenotipica e terapeutica, con l’obiettivo di stimare la probabilità che il paziente diabetico possa o meno sviluppare una certa complicanza, ottimizzando quindi i trial clinici ed evitando esami costosi e invasivi. In letteratura, sono presenti diversi modelli delle complicanze di diabete, ma nessuno è in grado di integrare in maniera flessibile le diverse conoscenze –omiche (proteomica, metabolomica, genomica) ad un livello clinico macroscopico. I principali modelli presenti in letteratura sono infatti basati sui modelli di Markov (detti anche modelli si transizione di stato) e utilizzano l’informazione fenotipica senza la possibilità di integrare facilmente informazioni aggiuntive. In questo ambito di studio, viene proposto un nuovo modello in-silico delle complicanze cardiovascolari e renali del diabete, che propone come aspetto innovativo l’utilizzo delle reti dinamiche bayesiane (Dynamic Bayesian Networks, DBNs) per modellizzare le interazioni tra le variabili. Rispetto ai modelli di Markov, che richiedono tanti nodi quante sono le possibili combinazioni degli stati delle variabili, le DBN hanno il vantaggio di rappresentare ogni variabile tramite un singolo nodo e permettono quindi una maggiore facilità nella gestione della struttura e nell’integrazione di eventuale informazione aggiuntiva. Il modello è stato costruito utilizzando i dati del Diabetes Control and Complications Trial (DCCT), un trial clinico randomizzato condotto con lo scopo di confrontare gli effetti della terapia intensiva rispetto a quelli della terapia convenzionale sullo sviluppo delle complicanze vascolari e neurologiche a lungo termine. Il modello sviluppato, è in grado di predire la progressione delle complicanze diabetiche trattate con un’accuratezza superiore al 95% a livello di popolazione. Il modello si presta quindi ad essere utilizzato come tool di supporto nel processo di decisione terapeutica da parte dei clinici e, in quest’ottica, sta portando alla realizzazione di un’interfaccia web. La struttura flessibile del modello inoltre consentirà di integrare facilmente l’informazione genotipica, con l’obiettivo futuro di migliorare le prestazioni a livello di predizione. Il terzo ed ultimo livello di studio considerato è lo studio dell’azione di uno specifico farmaco su un particolare fenotipo, con l’obiettivo finale di sviluppare metodologie che consentano di personalizzare i farmaci, adattandoli alla specifica risposta dell’individuo. Nell’ambito specifico delle complicanze cardiovascolari del diabete, una delle terapie più diffuse è quella del trattamento con aspirina per la prevenzione di eventi avversi nei pazienti ad alto rischio. L’aspirina deve la sua azione preventiva alla capacità di inibire un enzima chiave (la prostaglandina-endoperossido sintase PTGS-1, conosciuta anche come cicloossigenasi COX-1) nella cascata che porta alla formazione di trombossano B2 (TxB2), il principale responsabile dell’aggregazione piastrinica nel sangue e della conseguente formazioni di trombi. È noto, da letteratura, come i pazienti diabetici rispondano in maniera differente alla terapia con aspirina rispetto ai soggetti sani, evidenziando una risposta ridotta al farmaco, tanto da portare in ambito clinico alla coniazione del termine ‘aspirino-resistenza’. Data la mancanza di una trattazione matematica del fenomeno in letteratura, si è deciso di studiare il problema utilizzando un approccio modellistico di farmacodinamica, con un intento. Utilizzando informazioni biologiche ricavate da letteratura, si è sviluppato un modello, in parte compartimentale e in parte distribuito, che descrive: i) la cinetica dell’enzima COX-1 a partire dalla sua produzione all’interno dei megacariociti del midollo osseo fino a giungere nelle piastrine del sangue, ii) la farmacocinetica e la farmacodinamica dell’aspirina, ovvero la distribuzione del farmaco nel corpo e la sua interazione con l’enzima COX-1. Il modello è stato testato su dati sperimentali relativi al recupero di trombossano B2 sierico dopo la sospensione di aspirina in pazienti sani. Sono stati infine discussi meccanismi potenzialmente candidati a spiegare il fenomeno dell’aspirino-resistenza in pazienti diabetici.
Multi-level modeling and computational approaches to investigate long-term diabetes complications
TRIFOGLIO, EMANUELE
2014
Abstract
Il diabete mellito rappresenta una delle patologie più diffuse nel mondo e si stima che la sua incidenza aumenterà del 50 % nell’arco di 15 anni, passando da 250 milioni a quasi 400 milioni di malati nel 2025. La patologia comporta l’insorgenza di devastanti complicanze croniche, tra cui disturbi legati al danneggiamento dei vasi sanguigni sia a livello macro-vascolare – come coronopatia, infarto, insufficienza cardiaca, angina pectoris, ictus – che micro-vascolare, con conseguente danno a carico dei reni (nefropatia) e degli occhi (retinopatia). La patologia diabetica ha un’enorme impatto sia in termini di qualità di vita dei pazienti, sia a livello economico, in quanto si stima che più del 10 % dei costi dell’assistenza sanitaria di tutta l’Europa siano imputabili alla cura del diabete. Per questo motivo, nuovi mezzi che permettano di prevenire l’insorgere e il progredire della malattia e delle sue complicanze sono assolutamente necessari. L’obiettivo del seguente lavoro di tesi è quello di proporre nuovi metodi computazionali per lo studio delle complicanze del diabete in un ambito di modellistica multi-livello. Il diabete mellito è una malattia fortemente multifattoriale, nella quale molteplici fattori di rischio di diversa natura (genetica e ambientale) concorrono a provocarne l’insorgenza e lo sviluppo. I meccanismi fisiologici che sottendono allo scatenarsi e al progredire della patologia sono ancora per la maggior parte sconosciuti. Data la natura multifattoriale del diabete, lo studio delle complicanze si presta ad essere affrontato con un approccio multi-livello. Lo schema generale di una malattia multifattoriale, come il diabete, prevede l’azione combinata di 3 elementi chiave sullo stato patologico (l’outcome) del paziente: i) il fenotipo, ovvero l’insieme di tutte le variabili metaboliche, antropometriche e ambientali caratteristiche del paziente, ii) il genotipo, ovvero la sequenza DNA del paziente, iii) il trattamento, ovvero l’insieme di interventi esterni effettuati sul paziente, come terapie ed utilizzo di farmaci. Queste 3 variabili sono interconnesse tramite interazioni e concorrono tutte insieme a determinare l’outcome del paziente. L’approccio multi-livello consente di scomporre il problema completo in sottoproblemi, focalizzando l’attenzione di volta in volta solo su un sottoinsieme di variabili e di interazioni, a seconda del livello di informazione contenuto nei dati a disposizione. Nel seguente lavoro, vengono considerati 3 principali livelli di studio delle complicanze diabetiche, e, per ognuno dei 3 ambiti, vengono proposti nuovi metodi sviluppati durante il periodo di dottorato. I 3 livelli di studio trattati sono: i) modellizzazione dell’effetto del genotipo sull’outcome, ii) modellizzazione dell’effetto combinato di fenotipo e trattamento sulla progressione dell’outcome, iii) modellizzazione dell’azione del trattamento sul fenotipo. Il primo livello di studio si propone di studiare le complicanze diabetiche da un punto di vista statico, ovvero senza considerare l’evolversi e il progredire di tali complicanze nel tempo, ed ha come obiettivo quello di identificare i principali biomarcatori genetici che consentano di predire lo stato di malattia dei pazienti, e di stratificare i pazienti in base al rischio di sviluppare o meno la malattia. I Genome Wide Association Studies (GWAS), sono studi di associazione volti a identificare gli SNPs che, da soli o in combinazioni con altri SNPs, consentono di spiegare le differenze che si osservano in un determinato outcome (a presenza o meno di una patologia) tra casi (soggetti malati) e controlli (soggetti sani) in una popolazione di studio. Diversi metodi di selezione univariata e multivariata sono presenti in letteratura per l’identificazione di marcatori genetici da studi GWAS. In questo ambito, è stato sviluppato un nuovo metodo per la selezione multivariata di biomarcatori genetici e per la classificazione di soggetti a partire da dati di SNPs di studi GWAS, basato sui classificatori di Bayes e arricchito da 3 principali componenti: i) una predizione ottenuta da un insieme di classificatori di Bayes, utilizzando una strategia basata sul bootstrap, ii) un nuovo metodo per ordinare e selezionare gli attributi selezionati da ogni classificatore, iii) una procedura, bastata sulle permutazioni, per selezionare i biomarcatori significativi, sulla base della loro utilità marginale nel processo di classificazione. Il metodo è stato validato sui dati genome-wide del Wellcome Trust Case-Control Consortium, (WTCCC) relativi a diabetici di tipo 1 e le sue performance confrontate con gli algoritmi rappresentanti lo stato dell’arte in letteratura per studi di associazione genetica, in particolare un classificatore di Bayes e un algoritmo di regressione logistica penalizzata (HyperLASSO). Il secondo livello di studio riguarda l’analisi dinamica delle complicanze, nella quale interviene anche la variabile tempo come fattore chiave. In quest’ottica, si vuole modellizzare l’insorgere e la progressione temporale delle principali complicanze legate al diabete utilizzando l’informazione fenotipica e terapeutica, con l’obiettivo di stimare la probabilità che il paziente diabetico possa o meno sviluppare una certa complicanza, ottimizzando quindi i trial clinici ed evitando esami costosi e invasivi. In letteratura, sono presenti diversi modelli delle complicanze di diabete, ma nessuno è in grado di integrare in maniera flessibile le diverse conoscenze –omiche (proteomica, metabolomica, genomica) ad un livello clinico macroscopico. I principali modelli presenti in letteratura sono infatti basati sui modelli di Markov (detti anche modelli si transizione di stato) e utilizzano l’informazione fenotipica senza la possibilità di integrare facilmente informazioni aggiuntive. In questo ambito di studio, viene proposto un nuovo modello in-silico delle complicanze cardiovascolari e renali del diabete, che propone come aspetto innovativo l’utilizzo delle reti dinamiche bayesiane (Dynamic Bayesian Networks, DBNs) per modellizzare le interazioni tra le variabili. Rispetto ai modelli di Markov, che richiedono tanti nodi quante sono le possibili combinazioni degli stati delle variabili, le DBN hanno il vantaggio di rappresentare ogni variabile tramite un singolo nodo e permettono quindi una maggiore facilità nella gestione della struttura e nell’integrazione di eventuale informazione aggiuntiva. Il modello è stato costruito utilizzando i dati del Diabetes Control and Complications Trial (DCCT), un trial clinico randomizzato condotto con lo scopo di confrontare gli effetti della terapia intensiva rispetto a quelli della terapia convenzionale sullo sviluppo delle complicanze vascolari e neurologiche a lungo termine. Il modello sviluppato, è in grado di predire la progressione delle complicanze diabetiche trattate con un’accuratezza superiore al 95% a livello di popolazione. Il modello si presta quindi ad essere utilizzato come tool di supporto nel processo di decisione terapeutica da parte dei clinici e, in quest’ottica, sta portando alla realizzazione di un’interfaccia web. La struttura flessibile del modello inoltre consentirà di integrare facilmente l’informazione genotipica, con l’obiettivo futuro di migliorare le prestazioni a livello di predizione. Il terzo ed ultimo livello di studio considerato è lo studio dell’azione di uno specifico farmaco su un particolare fenotipo, con l’obiettivo finale di sviluppare metodologie che consentano di personalizzare i farmaci, adattandoli alla specifica risposta dell’individuo. Nell’ambito specifico delle complicanze cardiovascolari del diabete, una delle terapie più diffuse è quella del trattamento con aspirina per la prevenzione di eventi avversi nei pazienti ad alto rischio. L’aspirina deve la sua azione preventiva alla capacità di inibire un enzima chiave (la prostaglandina-endoperossido sintase PTGS-1, conosciuta anche come cicloossigenasi COX-1) nella cascata che porta alla formazione di trombossano B2 (TxB2), il principale responsabile dell’aggregazione piastrinica nel sangue e della conseguente formazioni di trombi. È noto, da letteratura, come i pazienti diabetici rispondano in maniera differente alla terapia con aspirina rispetto ai soggetti sani, evidenziando una risposta ridotta al farmaco, tanto da portare in ambito clinico alla coniazione del termine ‘aspirino-resistenza’. Data la mancanza di una trattazione matematica del fenomeno in letteratura, si è deciso di studiare il problema utilizzando un approccio modellistico di farmacodinamica, con un intento. Utilizzando informazioni biologiche ricavate da letteratura, si è sviluppato un modello, in parte compartimentale e in parte distribuito, che descrive: i) la cinetica dell’enzima COX-1 a partire dalla sua produzione all’interno dei megacariociti del midollo osseo fino a giungere nelle piastrine del sangue, ii) la farmacocinetica e la farmacodinamica dell’aspirina, ovvero la distribuzione del farmaco nel corpo e la sua interazione con l’enzima COX-1. Il modello è stato testato su dati sperimentali relativi al recupero di trombossano B2 sierico dopo la sospensione di aspirina in pazienti sani. Sono stati infine discussi meccanismi potenzialmente candidati a spiegare il fenomeno dell’aspirino-resistenza in pazienti diabetici.File | Dimensione | Formato | |
---|---|---|---|
trifoglio_emanuele_tesi.pdf
accesso aperto
Dimensione
4.85 MB
Formato
Adobe PDF
|
4.85 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/177603
URN:NBN:IT:UNIPD-177603