La doppia elica del DNA è una molecola molto flessibile ed eterogenea, che può adottare una vasta gamma di conformazioni locali alternative. Queste conformazioni vengono collettivamente chiamate non-B DNA. Questi conformeri sembrano svolgere un ruolo importante in diverse condizioni cellulari sia fisiologiche che patologiche, ed influenzano molte proprietà biochimiche del genoma. La formazione di queste strutture dipende da caratteristiche specifiche della sequenza del DNA, e diversi motivi di sequenza possono portare alla formazione di diverse strutture non-B DNA. Durante questi anni, ho concentrato il mio lavoro sullo sviluppo di nuovi strumenti computazionali per la rilevazione di alcuni di questi motivi su scala genomica. Questo investimento di tempo è stato necessario, poiché attualmente mancano strumenti sufficientemente flessibili in grado di eseguire tali analisi. In particolare, mi sono concentrato sul rilevamento di motivi degenerati. A tale scopo, ho sviluppato NeSSie e QPARSE. NeSSie è in grado di rilevare in modo efficiente ed esauriente sequenze con proprietà simmetriche, come motivi speculari e palindromici associati alla formazione di forcine, strutture cruciformi e regioni di DNA a triplo filamento. QPARSE può rilevare ripetizioni consecutive di isole di G esatte o degenerate, che sono coinvolte nella formazione di G-quadruplex (G4) e strutture G-quadruplex appaiate (cioè due strutture quadruplex che si trovano vicine lungo la sequenza e che possono interagire formando una struttura di ordine superiore ed influenzandosi reciprocamente nel ripiegamento). Ho quindi iniziato a utilizzare questi strumenti per eseguire analisi su genomi appartenenti a specie di micobatterio e sul genoma umano. Nei genomi delle specie di micobatteri che sono in grado di sviluppare malattie simili alla tubercolosi, NeSSie ha rivelato l'arricchimento di un motivo con una perfetta simmetria a specchio. Analisi sperimentali hanno quindi confermato che questo motivo può piegarsi in una struttura a forcina precedentemente sconosciuta ma molto stabile. Nel genoma umano, mi sono concentrato sul rilevamento di sistemi G-quadruplex accoppiati. Una analisi su tutto il genoma ha rivelato un sorprendente arricchimento di sequenze potenzialmente coinvolte nella formazione di questi sistemi in corrispondenza del TSS (Sito di inizio della trascrizione) di migliaia di geni umani. Tra i sistemi predetti, uno identificato in corrispondenza del TSS di BCL2 è in corso di validazione sperimentale e i risultati preliminari sono promettenti. Questi risultati contribuiscono all'idea che i non-B DNA possano svolgere importanti ruoli funzionali e potenzialmente strutturali. Suggeriscono anche che il panorama di strutture che possono formarsi nella molecola di DNA sia molto più complesso di quanto ipotizzato, e che abbiamo ancora un'enorme mancanza di conoscenza verso queste strutture alternative. Seguendo queste evidenze, la sequenza del DNA deve essere ampiamente rivalutata non solo dal punto di vista della codifica, ma considerando anche le sue proprietà strutturali e funzionali. È quindi necessario indirizzare gli sforzi verso nuovi campi di indagine, studiando e caratterizzando queste strutture a livello genomico.
Development and Application of Informatics Tools for the Detection and Analysis of Non-Canonical DNA Structures
BERSELLI, MICHELE
2018
Abstract
La doppia elica del DNA è una molecola molto flessibile ed eterogenea, che può adottare una vasta gamma di conformazioni locali alternative. Queste conformazioni vengono collettivamente chiamate non-B DNA. Questi conformeri sembrano svolgere un ruolo importante in diverse condizioni cellulari sia fisiologiche che patologiche, ed influenzano molte proprietà biochimiche del genoma. La formazione di queste strutture dipende da caratteristiche specifiche della sequenza del DNA, e diversi motivi di sequenza possono portare alla formazione di diverse strutture non-B DNA. Durante questi anni, ho concentrato il mio lavoro sullo sviluppo di nuovi strumenti computazionali per la rilevazione di alcuni di questi motivi su scala genomica. Questo investimento di tempo è stato necessario, poiché attualmente mancano strumenti sufficientemente flessibili in grado di eseguire tali analisi. In particolare, mi sono concentrato sul rilevamento di motivi degenerati. A tale scopo, ho sviluppato NeSSie e QPARSE. NeSSie è in grado di rilevare in modo efficiente ed esauriente sequenze con proprietà simmetriche, come motivi speculari e palindromici associati alla formazione di forcine, strutture cruciformi e regioni di DNA a triplo filamento. QPARSE può rilevare ripetizioni consecutive di isole di G esatte o degenerate, che sono coinvolte nella formazione di G-quadruplex (G4) e strutture G-quadruplex appaiate (cioè due strutture quadruplex che si trovano vicine lungo la sequenza e che possono interagire formando una struttura di ordine superiore ed influenzandosi reciprocamente nel ripiegamento). Ho quindi iniziato a utilizzare questi strumenti per eseguire analisi su genomi appartenenti a specie di micobatterio e sul genoma umano. Nei genomi delle specie di micobatteri che sono in grado di sviluppare malattie simili alla tubercolosi, NeSSie ha rivelato l'arricchimento di un motivo con una perfetta simmetria a specchio. Analisi sperimentali hanno quindi confermato che questo motivo può piegarsi in una struttura a forcina precedentemente sconosciuta ma molto stabile. Nel genoma umano, mi sono concentrato sul rilevamento di sistemi G-quadruplex accoppiati. Una analisi su tutto il genoma ha rivelato un sorprendente arricchimento di sequenze potenzialmente coinvolte nella formazione di questi sistemi in corrispondenza del TSS (Sito di inizio della trascrizione) di migliaia di geni umani. Tra i sistemi predetti, uno identificato in corrispondenza del TSS di BCL2 è in corso di validazione sperimentale e i risultati preliminari sono promettenti. Questi risultati contribuiscono all'idea che i non-B DNA possano svolgere importanti ruoli funzionali e potenzialmente strutturali. Suggeriscono anche che il panorama di strutture che possono formarsi nella molecola di DNA sia molto più complesso di quanto ipotizzato, e che abbiamo ancora un'enorme mancanza di conoscenza verso queste strutture alternative. Seguendo queste evidenze, la sequenza del DNA deve essere ampiamente rivalutata non solo dal punto di vista della codifica, ma considerando anche le sue proprietà strutturali e funzionali. È quindi necessario indirizzare gli sforzi verso nuovi campi di indagine, studiando e caratterizzando queste strutture a livello genomico.File | Dimensione | Formato | |
---|---|---|---|
Berselli_Michele_tesi.pdf
accesso aperto
Dimensione
11.48 MB
Formato
Adobe PDF
|
11.48 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/81346
URN:NBN:IT:UNIPD-81346