Integrating gene expression data to infer how biological changes drive transcriptional responses

Moretto, Marco

Questa tesi di dottorato tratta principalmente di due argomenti tra loro interconnessi: il primo è lo sviluppo di una serie di tool per l’integrazione di dati di espressione genica. Il secondo è lo sviluppo di metodologie per la modellazione matematica di tali dati. Nella prima parte, quindi, viene descritta la metodologia utilizzata per integrare dati di espressione genica disponibili nei principali database pubblici, la creazione di una serie di strumenti software che implementano tali metodologie e l’applicazione di quest’ultimi al fine di realizzare collezioni di dati di espressione (compendia) per diversi procarioti ed una specie eucariote di interesse agrario (Vitis vinifera). Tali compendia sono particolarmente rilevanti applicate alla systems biology in quanto forniscono una ricca fonte di informazione. Essi sono delle matrici di espressione in cui ogni riga rappresenta un gene della specie di interesse, mentre le colonne rappresentano le diverse condizioni in cui l’espressione genica è stata misurata. Oltre ad essere il risultato della prima parte di questo lavoro di dottorato, i compendia di espressione sono anche il punto di partenza per la seconda parte che ha lo scopo di facilitare l’interpretazione biologica dei dati attraverso inferenza su modelli matematici creati a partire da essi. In particolare vengono discussi e sviluppati due modelli tra loro complementari. Il primo utilizza un approccio Bayesiano modellando una distribuzione di probabilità sul vero cambiamento dell’espressione di un particolare gene in risposta ad una particolare condizione. Il secondo modello sfrutta le reti Booleane per modellare l’informazione strutturale dei meccanismi genetici noti di risposta agli stimoli. Le reti Booleane vengono utilizzate per la creazione di una distribuzione di probabilità sui possibili stati stazionari delle cellule presenti nel campione effettivamente misurato. Utilizzando questi modelli è possibile, ad esempio, formulare ipotesi statisticamente valide sugli stimoli/segnali maggiormente responsabili dell’espressione di alcuni geni, sulla innata variabilità di un determinato gene (indipendentemente dalle condizioni in cui esso è misurato) oppure trovare complessi schemi di co-espressione genica.

Integrating gene expression data to infer how biological changes drive transcriptional responses

MORETTO, MARCO

2016

Abstract

Questa tesi di dottorato tratta principalmente di due argomenti tra loro interconnessi: il primo è lo sviluppo di una serie di tool per l’integrazione di dati di espressione genica. Il secondo è lo sviluppo di metodologie per la modellazione matematica di tali dati. Nella prima parte, quindi, viene descritta la metodologia utilizzata per integrare dati di espressione genica disponibili nei principali database pubblici, la creazione di una serie di strumenti software che implementano tali metodologie e l’applicazione di quest’ultimi al fine di realizzare collezioni di dati di espressione (compendia) per diversi procarioti ed una specie eucariote di interesse agrario (Vitis vinifera). Tali compendia sono particolarmente rilevanti applicate alla systems biology in quanto forniscono una ricca fonte di informazione. Essi sono delle matrici di espressione in cui ogni riga rappresenta un gene della specie di interesse, mentre le colonne rappresentano le diverse condizioni in cui l’espressione genica è stata misurata. Oltre ad essere il risultato della prima parte di questo lavoro di dottorato, i compendia di espressione sono anche il punto di partenza per la seconda parte che ha lo scopo di facilitare l’interpretazione biologica dei dati attraverso inferenza su modelli matematici creati a partire da essi. In particolare vengono discussi e sviluppati due modelli tra loro complementari. Il primo utilizza un approccio Bayesiano modellando una distribuzione di probabilità sul vero cambiamento dell’espressione di un particolare gene in risposta ad una particolare condizione. Il secondo modello sfrutta le reti Booleane per modellare l’informazione strutturale dei meccanismi genetici noti di risposta agli stimoli. Le reti Booleane vengono utilizzate per la creazione di una distribuzione di probabilità sui possibili stati stazionari delle cellule presenti nel campione effettivamente misurato. Utilizzando questi modelli è possibile, ad esempio, formulare ipotesi statisticamente valide sugli stimoli/segnali maggiormente responsabili dell’espressione di alcuni geni, sulla innata variabilità di un determinato gene (indipendentemente dalle condizioni in cui esso è misurato) oppure trovare complessi schemi di co-espressione genica.

Scheda breve

Scheda completa

Scheda completa (DC)

	Corso di studio
	
				GENETICA E BIOLOGIA MOLECOLARE DELLO SVILUPPO
			
	Data di pubblicazione
	
				26-lug-2016
			
	Lingua
	
				Inglese
			
	Parola chiave
	
				gene expression, data integration, data modelling, RNA-Seq, microarray
			
	Relatore, Supervisor, Advisor o Tutor
	
				ROMUALDI, CHIARA
			
	Correlatore, Controrelatore, Co-Supervisor,  Co-Tutor o Coordinatori
	
				COSTA, RODOLFO
			
	Nome Editore
	
				Università degli studi di Padova
			
	Numero di pagine
	
				94
			
	Collezione di appartenenza
	
				Università degli Studi di Padova

File in questo prodotto:

File	Dimensione	Formato
moretto_marco_thesis.pdf accesso aperto Dimensione 2.67 MB Formato Adobe PDF Visualizza/Apri	2.67 MB	Adobe PDF	Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/89421

Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-89421