INTRODUZIONE Per molti anni gli introni sono stati considerati un semplice costo aggiuntivo alla replicazione e alla trascrizione; nei primi studi compiuti sugli introni, questi ultimi sono stati descritti essenzialmente come “Junk DNA” (Wong, 2000). Successive osservazioni hanno rivelato che alcune delle sequenze introniche mostrano un controllo di tipo regolativo nei confronti dei geni in cui sono collocati. Nonostante ciò, l’enorme spazio occupato dagli introni nella cellula non può essere giustificato solo da questi dati. In base alla letteratura, sono state tratte alcune considerazioni riguardo alla presenza degli introni. Roy e Gilbert (2006) mostrano che densità intronica e complessità condividono una relazione di proporzionalità diretta. Gli introni possono inoltre aumentare l’efficienza di trascrizione, come dimostrato da alcuni studi compiuti su topi transgenici (Le Hir et al., 2003). La stabilità degli mRNA è migliorata dalla presenza degli introni che agiscono proteggendo il trascritto dalla degradazione. Inoltre, nonostante gli introni non siano conservati quanto gli esoni a loro associati, molti studi dimostrano un inatteso pattern di conservazione tra introni ortologhi (Mattick, 1994). Questi e altri dati suggeriscono che gli introni abbiano un ruolo cruciale nel network regolatorio della cellula. SCOPO DELLA TESI Nel presente studio, sono state analizzate le sequenze introniche del gene del recettore degli estrogeni forma alfa (ERalfa) in mammiferi e teleostei. Un’indagine preliminare di tipo bioinformatico è stata utile per scegliere una sequenza intronica conservata al fine di testare il possibile binding a fattori proteici. L’esame di queste sequenze ha riguardato la struttura, la posizione di siti importanti per la trascrizione e lo splicing, la ricerca di regioni conservate, l’individuazione di elementi ripetitivi e di siti di binding potenziali per fattori di trascrizione. In seguito a questo, per mezzo di esperimenti di gelshift, è stato testato il legame di sonde a RNA e DNA a elementi di estratto nucleare proteico. MATERIALI E METODI Indagini bioinformatiche sono state condotte sulle sequenze introniche ed esoniche del gene ERalfa disponibili nella banca dati Ensembl (Homo sapiens, Macaca mulatta, Canis familiaris, Mus musculus, Bos taurus, Monodelphis domestica, Oryctolagus cuniculus, Echinops telfairi e Ochotona princeps). Anche un introne del medesimo gene è stato sequenziato ed analizzato (Atherina boyeri, Barbus plebejus, Chondrostoma genei, Rutilus aula, Rutilus rutilus, Phoxinus phoxinus, Rhodeus amarus, Gasterosteus aculeatus, Psetta maxima, Scorpaena porcus, Polyprion americanus and Sparus aurata). Lo stesso introne è stato ricavato dal database Ensembl per le specie Danio rerio, Takifugu rubripes e Oryzia latipes. Allineamento: caratteristiche tipiche delle sequenze introniche sono una lunghezza considerevole e difficilmente comparabile con altre sequenze, basso tasso di conservazione e presenza di inserzioni, delezioni e inversioni. Il software MLAGAN (Brudno et al., 2003) è stato un valido strumento per allineare sequenze che condividono queste caratteristiche. Il programma restituisce anche porzioni di sequenza, definite Conserved Non-Coding Sequences o CSN, che mostrano più del 70% di identità. Dotplot: il software Dotplot è stato sfruttato per ritrovare parole esatte conservate tra due sequenze. Fattori di trascrizione: la presenza di potenziali siti di binding per fattori di trascrizione all’interno e all’esterno delle zone di conservazione è stata individuata tramite in programma TFSEARCH versione 1.3. Ripetizioni: l’analisi sulle ripetizioni tandem all’interno degli introni è stata effettuata col programma mreps (Kolpakov et al., 2003). Dopo ciò, è stato eseguito un confronto tra le ripetizioni conservate e non. microRNA: è stata infine ricercata la presenza di precursori di microRNA con i software RNA22, proMirII (Nam et al., 2006) e mipred (Jiang et al., 2007). Gelshift: esperimenti di binding sono stati effettuati con sonde a DNA e RNA dell’introne I117 di D. rerio ed estratti nucleari proteici da tessuti e-sprimenti ERalfa nelle femmine di D. rerio. RISULTATI E DISCUSSIONE Splicing: è stata ricercata la presenza di sequenze consenso necessarie per il branching degli introni e di splice sites conservati. La sequenza consenso necessaria per la formazione del laccio non è stata riscontrata in tutti gli introni, in altri invece era presente in copie multiple. Gli splice sites al terminale 5’ e 3’ sono risultati altamente conservati. Allineamento: le regioni conservate sono state studiate considerando la lunghezza media e la percentuale di identità media delle regioni conservate, il numero di regioni conservate, il numero di nucleotidi conservati nella sequenza, il rapporto tra il numero di nucleotidi all’interno delle CNS e la lunghezza totale della sequenza. Questi dati mostrano una grande quantità di regioni che condividono più del 70% di identità. Alcuni allineamenti pairwise rivelano che più di metà della lunghezza dell’introne può essere conservata (questo avviene ad esempio tra alcuni introni di C. familiaris e H. sapiens). Fattori di trascrizione: questa analisi ha rivelato un gran numero di potenziali siti di binding per fattori di trascrizione. Si può inoltre precisare che i fattori di trascrizione più rappresentati sono CdxA (caudal type homeobox transcription factor 1) e SRY (sex determining factor). La considerevole presenza di copie del sito di binding per SRY è probabilmente correlabile alla funzione di ERalfa. Tuttavia considerando la percentuale di siti di binding all’interno e all’esterno delle CNS, non si riscontra un pattern comune per tutte le sequenze. Ripetizioni: quasi tutte le sequenze ripetute trovate nelle sequenze introniche sono microsatelliti. Nei teleostei le ripetizioni sono presenti solo in alcuni introni e comunque sempre al di fuori delle zone conservate. Anche nei mammiferi, le ripetizioni sono state riscontrate più frequentemente nelle regioni non conservate. MicroRNA: negli introni dei mammiferi sono state trovate strutture a stem-loop potenziali precursori di microRNA. Sono stati riscontrati negli introni C. familiaris, H. sapiens, M. domestica e M. musculus. Nei teleostei non sono stati ritrovati precursori. Gelshift: considerando i risultati degli studi bioinformatici, per gli esperimenti di binding è stato scelto l’introne I117 di D. rerio. Questo introne è collocato tra il DNA binding domain e la regione cerniera del gene dell’ERalfa. Gli esperimenti di gel retardation hanno rivelato la presenza di binding sia per la sonda a RNA che per la sonda a DNA. Per le sonde a DNA sono stati ottenuti i risultati migliori con l’estratto nucleare proteico di fegato. Per le sonde a RNA è stato individuato il binding ma, probabilmente a causa del legame con più fattori, i risultati sono al momento di complessa interpretazione. Ad ogni modo, questi risultati suggeriscono un potenziale ruolo regolativo per l’introne I117 di D. rerio.

ANALISI DELLA CONSERVAZIONE DELLE SEQUENZE INTRONICHE NEI GENI CODIFICANTI PER IL RECETTORE DEGLI ESTROGENI FORMA ALFA IN TELEOSTEI E MAMMIFERI

DE NADAI, ALESSANDRA
2010

Abstract

INTRODUZIONE Per molti anni gli introni sono stati considerati un semplice costo aggiuntivo alla replicazione e alla trascrizione; nei primi studi compiuti sugli introni, questi ultimi sono stati descritti essenzialmente come “Junk DNA” (Wong, 2000). Successive osservazioni hanno rivelato che alcune delle sequenze introniche mostrano un controllo di tipo regolativo nei confronti dei geni in cui sono collocati. Nonostante ciò, l’enorme spazio occupato dagli introni nella cellula non può essere giustificato solo da questi dati. In base alla letteratura, sono state tratte alcune considerazioni riguardo alla presenza degli introni. Roy e Gilbert (2006) mostrano che densità intronica e complessità condividono una relazione di proporzionalità diretta. Gli introni possono inoltre aumentare l’efficienza di trascrizione, come dimostrato da alcuni studi compiuti su topi transgenici (Le Hir et al., 2003). La stabilità degli mRNA è migliorata dalla presenza degli introni che agiscono proteggendo il trascritto dalla degradazione. Inoltre, nonostante gli introni non siano conservati quanto gli esoni a loro associati, molti studi dimostrano un inatteso pattern di conservazione tra introni ortologhi (Mattick, 1994). Questi e altri dati suggeriscono che gli introni abbiano un ruolo cruciale nel network regolatorio della cellula. SCOPO DELLA TESI Nel presente studio, sono state analizzate le sequenze introniche del gene del recettore degli estrogeni forma alfa (ERalfa) in mammiferi e teleostei. Un’indagine preliminare di tipo bioinformatico è stata utile per scegliere una sequenza intronica conservata al fine di testare il possibile binding a fattori proteici. L’esame di queste sequenze ha riguardato la struttura, la posizione di siti importanti per la trascrizione e lo splicing, la ricerca di regioni conservate, l’individuazione di elementi ripetitivi e di siti di binding potenziali per fattori di trascrizione. In seguito a questo, per mezzo di esperimenti di gelshift, è stato testato il legame di sonde a RNA e DNA a elementi di estratto nucleare proteico. MATERIALI E METODI Indagini bioinformatiche sono state condotte sulle sequenze introniche ed esoniche del gene ERalfa disponibili nella banca dati Ensembl (Homo sapiens, Macaca mulatta, Canis familiaris, Mus musculus, Bos taurus, Monodelphis domestica, Oryctolagus cuniculus, Echinops telfairi e Ochotona princeps). Anche un introne del medesimo gene è stato sequenziato ed analizzato (Atherina boyeri, Barbus plebejus, Chondrostoma genei, Rutilus aula, Rutilus rutilus, Phoxinus phoxinus, Rhodeus amarus, Gasterosteus aculeatus, Psetta maxima, Scorpaena porcus, Polyprion americanus and Sparus aurata). Lo stesso introne è stato ricavato dal database Ensembl per le specie Danio rerio, Takifugu rubripes e Oryzia latipes. Allineamento: caratteristiche tipiche delle sequenze introniche sono una lunghezza considerevole e difficilmente comparabile con altre sequenze, basso tasso di conservazione e presenza di inserzioni, delezioni e inversioni. Il software MLAGAN (Brudno et al., 2003) è stato un valido strumento per allineare sequenze che condividono queste caratteristiche. Il programma restituisce anche porzioni di sequenza, definite Conserved Non-Coding Sequences o CSN, che mostrano più del 70% di identità. Dotplot: il software Dotplot è stato sfruttato per ritrovare parole esatte conservate tra due sequenze. Fattori di trascrizione: la presenza di potenziali siti di binding per fattori di trascrizione all’interno e all’esterno delle zone di conservazione è stata individuata tramite in programma TFSEARCH versione 1.3. Ripetizioni: l’analisi sulle ripetizioni tandem all’interno degli introni è stata effettuata col programma mreps (Kolpakov et al., 2003). Dopo ciò, è stato eseguito un confronto tra le ripetizioni conservate e non. microRNA: è stata infine ricercata la presenza di precursori di microRNA con i software RNA22, proMirII (Nam et al., 2006) e mipred (Jiang et al., 2007). Gelshift: esperimenti di binding sono stati effettuati con sonde a DNA e RNA dell’introne I117 di D. rerio ed estratti nucleari proteici da tessuti e-sprimenti ERalfa nelle femmine di D. rerio. RISULTATI E DISCUSSIONE Splicing: è stata ricercata la presenza di sequenze consenso necessarie per il branching degli introni e di splice sites conservati. La sequenza consenso necessaria per la formazione del laccio non è stata riscontrata in tutti gli introni, in altri invece era presente in copie multiple. Gli splice sites al terminale 5’ e 3’ sono risultati altamente conservati. Allineamento: le regioni conservate sono state studiate considerando la lunghezza media e la percentuale di identità media delle regioni conservate, il numero di regioni conservate, il numero di nucleotidi conservati nella sequenza, il rapporto tra il numero di nucleotidi all’interno delle CNS e la lunghezza totale della sequenza. Questi dati mostrano una grande quantità di regioni che condividono più del 70% di identità. Alcuni allineamenti pairwise rivelano che più di metà della lunghezza dell’introne può essere conservata (questo avviene ad esempio tra alcuni introni di C. familiaris e H. sapiens). Fattori di trascrizione: questa analisi ha rivelato un gran numero di potenziali siti di binding per fattori di trascrizione. Si può inoltre precisare che i fattori di trascrizione più rappresentati sono CdxA (caudal type homeobox transcription factor 1) e SRY (sex determining factor). La considerevole presenza di copie del sito di binding per SRY è probabilmente correlabile alla funzione di ERalfa. Tuttavia considerando la percentuale di siti di binding all’interno e all’esterno delle CNS, non si riscontra un pattern comune per tutte le sequenze. Ripetizioni: quasi tutte le sequenze ripetute trovate nelle sequenze introniche sono microsatelliti. Nei teleostei le ripetizioni sono presenti solo in alcuni introni e comunque sempre al di fuori delle zone conservate. Anche nei mammiferi, le ripetizioni sono state riscontrate più frequentemente nelle regioni non conservate. MicroRNA: negli introni dei mammiferi sono state trovate strutture a stem-loop potenziali precursori di microRNA. Sono stati riscontrati negli introni C. familiaris, H. sapiens, M. domestica e M. musculus. Nei teleostei non sono stati ritrovati precursori. Gelshift: considerando i risultati degli studi bioinformatici, per gli esperimenti di binding è stato scelto l’introne I117 di D. rerio. Questo introne è collocato tra il DNA binding domain e la regione cerniera del gene dell’ERalfa. Gli esperimenti di gel retardation hanno rivelato la presenza di binding sia per la sonda a RNA che per la sonda a DNA. Per le sonde a DNA sono stati ottenuti i risultati migliori con l’estratto nucleare proteico di fegato. Per le sonde a RNA è stato individuato il binding ma, probabilmente a causa del legame con più fattori, i risultati sono al momento di complessa interpretazione. Ad ogni modo, questi risultati suggeriscono un potenziale ruolo regolativo per l’introne I117 di D. rerio.
31-gen-2010
Italiano
INTRONE, RECETTORE DEGLI ESTROGENI, CONSERVAZIONE, DANIO RERIO, GELSHIFT
Università degli studi di Padova
File in questo prodotto:
File Dimensione Formato  
TESI DOTTORATO ALESSANDRA DE NADAI.pdf

accesso aperto

Dimensione 12.01 MB
Formato Adobe PDF
12.01 MB Adobe PDF Visualizza/Apri
ALLEGATO_TESI_DOTTORATO_A__DE_NADAI.pdf

accesso aperto

Dimensione 12.13 MB
Formato Adobe PDF
12.13 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/105341
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-105341