Gli studi di genomica hanno l’obiettivo di identificare posizione e funzione dei geni all’interno del genoma di organismi oggetto di interesse. Negli ultimi vent’anni, questo campo di ricerca e` stato oggetto di vivace interesse, motivato dall’introduzione di microarray e tecnologie di sequenziamento, capaci di produrre enormi quantità di dati riguardanti diversi aspetti del genoma. In questo contesto, gli strumenti statistici si sono dimostrati necessari per supportare e in alcuni casi guidare la ricerca biologica, poco pratica o impossibile da condurre sull’intero insieme di dati prodotto dalle tecnologie di cui sopra. In questa Tesi, si introdurranno nuovi strumenti statistici per affrontare problemi noti nell’ambito genomico, come l’identificazione di geni differenzialmente espressi tramite dati di microarray, e l’analisi dei siti di legame nel contesto dei dati di ChIP-Seq. L’interesse specifico sara` l’inferenza sui quantili, motivato dalla loro interpretabilità, anche per distribuzioni dei dati dalle forme irregolari, e dal fatto che permettono di confrontare differenti aspetti della distribuzione dei dati. Si proporranno statistiche Studentizzate e pseudo-Studentizzate, la cui struttura richiama da vicino quella di un t-test classico, e si valuterà il loro comportamento attraverso studi di simulazione e applicazione su dati reali.

Quantile Inference In Genomic Studies

MARAGONI, LORENZO
2014

Abstract

Gli studi di genomica hanno l’obiettivo di identificare posizione e funzione dei geni all’interno del genoma di organismi oggetto di interesse. Negli ultimi vent’anni, questo campo di ricerca e` stato oggetto di vivace interesse, motivato dall’introduzione di microarray e tecnologie di sequenziamento, capaci di produrre enormi quantità di dati riguardanti diversi aspetti del genoma. In questo contesto, gli strumenti statistici si sono dimostrati necessari per supportare e in alcuni casi guidare la ricerca biologica, poco pratica o impossibile da condurre sull’intero insieme di dati prodotto dalle tecnologie di cui sopra. In questa Tesi, si introdurranno nuovi strumenti statistici per affrontare problemi noti nell’ambito genomico, come l’identificazione di geni differenzialmente espressi tramite dati di microarray, e l’analisi dei siti di legame nel contesto dei dati di ChIP-Seq. L’interesse specifico sara` l’inferenza sui quantili, motivato dalla loro interpretabilità, anche per distribuzioni dei dati dalle forme irregolari, e dal fatto che permettono di confrontare differenti aspetti della distribuzione dei dati. Si proporranno statistiche Studentizzate e pseudo-Studentizzate, la cui struttura richiama da vicino quella di un t-test classico, e si valuterà il loro comportamento attraverso studi di simulazione e applicazione su dati reali.
31-lug-2014
Inglese
quantile inference, hypothesis testing, microarray, chip-seq
Chiogna, Monica
Università degli studi di Padova
File in questo prodotto:
File Dimensione Formato  
maragoni_lorenzo_thesis.pdf

accesso aperto

Licenza: Tutti i diritti riservati
Dimensione 3.26 MB
Formato Adobe PDF
3.26 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/110663
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-110663