Gli studi di genomica hanno l’obiettivo di identificare posizione e funzione dei geni all’interno del genoma di organismi oggetto di interesse. Negli ultimi vent’anni, questo campo di ricerca e` stato oggetto di vivace interesse, motivato dall’introduzione di microarray e tecnologie di sequenziamento, capaci di produrre enormi quantità di dati riguardanti diversi aspetti del genoma. In questo contesto, gli strumenti statistici si sono dimostrati necessari per supportare e in alcuni casi guidare la ricerca biologica, poco pratica o impossibile da condurre sull’intero insieme di dati prodotto dalle tecnologie di cui sopra. In questa Tesi, si introdurranno nuovi strumenti statistici per affrontare problemi noti nell’ambito genomico, come l’identificazione di geni differenzialmente espressi tramite dati di microarray, e l’analisi dei siti di legame nel contesto dei dati di ChIP-Seq. L’interesse specifico sara` l’inferenza sui quantili, motivato dalla loro interpretabilità, anche per distribuzioni dei dati dalle forme irregolari, e dal fatto che permettono di confrontare differenti aspetti della distribuzione dei dati. Si proporranno statistiche Studentizzate e pseudo-Studentizzate, la cui struttura richiama da vicino quella di un t-test classico, e si valuterà il loro comportamento attraverso studi di simulazione e applicazione su dati reali.
Quantile Inference In Genomic Studies
MARAGONI, LORENZO
2014
Abstract
Gli studi di genomica hanno l’obiettivo di identificare posizione e funzione dei geni all’interno del genoma di organismi oggetto di interesse. Negli ultimi vent’anni, questo campo di ricerca e` stato oggetto di vivace interesse, motivato dall’introduzione di microarray e tecnologie di sequenziamento, capaci di produrre enormi quantità di dati riguardanti diversi aspetti del genoma. In questo contesto, gli strumenti statistici si sono dimostrati necessari per supportare e in alcuni casi guidare la ricerca biologica, poco pratica o impossibile da condurre sull’intero insieme di dati prodotto dalle tecnologie di cui sopra. In questa Tesi, si introdurranno nuovi strumenti statistici per affrontare problemi noti nell’ambito genomico, come l’identificazione di geni differenzialmente espressi tramite dati di microarray, e l’analisi dei siti di legame nel contesto dei dati di ChIP-Seq. L’interesse specifico sara` l’inferenza sui quantili, motivato dalla loro interpretabilità, anche per distribuzioni dei dati dalle forme irregolari, e dal fatto che permettono di confrontare differenti aspetti della distribuzione dei dati. Si proporranno statistiche Studentizzate e pseudo-Studentizzate, la cui struttura richiama da vicino quella di un t-test classico, e si valuterà il loro comportamento attraverso studi di simulazione e applicazione su dati reali.| File | Dimensione | Formato | |
|---|---|---|---|
|
maragoni_lorenzo_thesis.pdf
accesso aperto
Licenza:
Tutti i diritti riservati
Dimensione
3.26 MB
Formato
Adobe PDF
|
3.26 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/110663
URN:NBN:IT:UNIPD-110663