Questa tesi di dottorato tratta principalmente di due argomenti tra loro interconnessi: il primo è lo sviluppo di una serie di tool per l’integrazione di dati di espressione genica. Il secondo è lo sviluppo di metodologie per la modellazione matematica di tali dati. Nella prima parte, quindi, viene descritta la metodologia utilizzata per integrare dati di espressione genica disponibili nei principali database pubblici, la creazione di una serie di strumenti software che implementano tali metodologie e l’applicazione di quest’ultimi al fine di realizzare collezioni di dati di espressione (compendia) per diversi procarioti ed una specie eucariote di interesse agrario (Vitis vinifera). Tali compendia sono particolarmente rilevanti applicate alla systems biology in quanto forniscono una ricca fonte di informazione. Essi sono delle matrici di espressione in cui ogni riga rappresenta un gene della specie di interesse, mentre le colonne rappresentano le diverse condizioni in cui l’espressione genica è stata misurata. Oltre ad essere il risultato della prima parte di questo lavoro di dottorato, i compendia di espressione sono anche il punto di partenza per la seconda parte che ha lo scopo di facilitare l’interpretazione biologica dei dati attraverso inferenza su modelli matematici creati a partire da essi. In particolare vengono discussi e sviluppati due modelli tra loro complementari. Il primo utilizza un approccio Bayesiano modellando una distribuzione di probabilità sul vero cambiamento dell’espressione di un particolare gene in risposta ad una particolare condizione. Il secondo modello sfrutta le reti Booleane per modellare l’informazione strutturale dei meccanismi genetici noti di risposta agli stimoli. Le reti Booleane vengono utilizzate per la creazione di una distribuzione di probabilità sui possibili stati stazionari delle cellule presenti nel campione effettivamente misurato. Utilizzando questi modelli è possibile, ad esempio, formulare ipotesi statisticamente valide sugli stimoli/segnali maggiormente responsabili dell’espressione di alcuni geni, sulla innata variabilità di un determinato gene (indipendentemente dalle condizioni in cui esso è misurato) oppure trovare complessi schemi di co-espressione genica.

Integrating gene expression data to infer how biological changes drive transcriptional responses

MORETTO, MARCO
2016

Abstract

Questa tesi di dottorato tratta principalmente di due argomenti tra loro interconnessi: il primo è lo sviluppo di una serie di tool per l’integrazione di dati di espressione genica. Il secondo è lo sviluppo di metodologie per la modellazione matematica di tali dati. Nella prima parte, quindi, viene descritta la metodologia utilizzata per integrare dati di espressione genica disponibili nei principali database pubblici, la creazione di una serie di strumenti software che implementano tali metodologie e l’applicazione di quest’ultimi al fine di realizzare collezioni di dati di espressione (compendia) per diversi procarioti ed una specie eucariote di interesse agrario (Vitis vinifera). Tali compendia sono particolarmente rilevanti applicate alla systems biology in quanto forniscono una ricca fonte di informazione. Essi sono delle matrici di espressione in cui ogni riga rappresenta un gene della specie di interesse, mentre le colonne rappresentano le diverse condizioni in cui l’espressione genica è stata misurata. Oltre ad essere il risultato della prima parte di questo lavoro di dottorato, i compendia di espressione sono anche il punto di partenza per la seconda parte che ha lo scopo di facilitare l’interpretazione biologica dei dati attraverso inferenza su modelli matematici creati a partire da essi. In particolare vengono discussi e sviluppati due modelli tra loro complementari. Il primo utilizza un approccio Bayesiano modellando una distribuzione di probabilità sul vero cambiamento dell’espressione di un particolare gene in risposta ad una particolare condizione. Il secondo modello sfrutta le reti Booleane per modellare l’informazione strutturale dei meccanismi genetici noti di risposta agli stimoli. Le reti Booleane vengono utilizzate per la creazione di una distribuzione di probabilità sui possibili stati stazionari delle cellule presenti nel campione effettivamente misurato. Utilizzando questi modelli è possibile, ad esempio, formulare ipotesi statisticamente valide sugli stimoli/segnali maggiormente responsabili dell’espressione di alcuni geni, sulla innata variabilità di un determinato gene (indipendentemente dalle condizioni in cui esso è misurato) oppure trovare complessi schemi di co-espressione genica.
26-lug-2016
Inglese
gene expression, data integration, data modelling, RNA-Seq, microarray
ROMUALDI, CHIARA
COSTA, RODOLFO
Università degli studi di Padova
94
File in questo prodotto:
File Dimensione Formato  
moretto_marco_thesis.pdf

accesso aperto

Dimensione 2.67 MB
Formato Adobe PDF
2.67 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/89421
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-89421