Nonostante le microalghe rivestano una particolare importanza per l’ecologia, la biochimica e le biotecnologie, solo poche specie sono state sequenziate a tutt’oggi e per lo più nell’era del sequenziamento di tipo Sanger. Mentre i sequenziatori di nuova generazione hanno fornito straordinari mezzi al risequenziamento di genomi di singoli individue per cui il genoma della specie di riferimento era già disponibile, il sequenziamento di genomi eucariotici completamente nuovi, utilizzando sequenze corte, presenta ancora grandi difficoltà. Le principali difficoltà si riscontrano in fase di assemblaggio e sono principalmente dovute alle notevoli dimensioni dei genomi eucariotici e alla presenza di regioni ripetute. Le microalghe, nei loro genomi, grandi in genere dalle 30Mb alle 100Mb, contengono poche regioni a bassa complessità e costituiscono pertanto degli interessanti organismi sui quali sperimentare il sequenziamento ex novo utilizzando esclusivamente i sequenziatori di seconda generazione. In questo lavoro, descriviamo il sequenziamento e l’assemblaggio del genoma della microalga Nannochloropsis gaditana, ottenuto utilizzando le sequenze prodotte dal 454 della Roche e dal SOLiD. Il sequenziamento di ‘mate-pairs’ utilizzando il SOLiD ha prodotto una copertura di sequenza di circa 250 volte la grandezza del genoma, mentre il sequenziamento 454 è stato utilizzato per produrre una ulteriore copertura di 7 volte con sequenze di media lunghezza. Le sequenze sono state assemblate in una versione preliminare non del tutto finita di 32Mb, dove 18.7Mb sono state incluse in 167 grandi scaffolds. Il 50% degli scaffolds ottenuti è più grande di 50Kb, mentre un terzo del genoma è stato assemblato in circa 20 contigs. Il nostro lavoro conferma la previsione che le tecniche di nuova generazione sono adatte al sequenziamento del genoma di una microalga e consentono di ottenere risultati utili in un tempo più breve di quelli tradizionali e ad un minor costo. I dati ottenuti potranno esser utilizzati per analisi comparative del genoma e saranno anche un importante prerequisito per l’applicazione di tecniche ricombinati alla microalga di interesse biotecnologico. Inoltre, durante questo progetto, sono state portate avanti anche diverse analisi del trascrittoma tramite sequenziamento, finalizzate alla produzione di una lista di geni utile all’annotazione del genoma e all’identificazione di geni differenzialmente espressi in condizioni di accumulo di lipidi. Vengono presentate, in questo lavoro, anche alcune innovazioni tecniche che hanno permesso di sfruttare al meglio il sequenziamento SOLiD per produrre un’accurata annotazione della struttura del trascrittoma e una più completa analisi dei geni differenzialmente espressi codificati negli organelli. I risultati dimostrano che una sola corsa SOLiD su campioni preparati in modo adeguato, è sufficiente per l’annotazione accurata di un genoma completamente nuovo e per l’individuazione di geni differenzialmente espressi in condizioni di interesse.  

Going ultra deep to unravel the secret recipe of biofuel

CORTEGGIANI CARPINELLI, ELISA
2010

Abstract

Nonostante le microalghe rivestano una particolare importanza per l’ecologia, la biochimica e le biotecnologie, solo poche specie sono state sequenziate a tutt’oggi e per lo più nell’era del sequenziamento di tipo Sanger. Mentre i sequenziatori di nuova generazione hanno fornito straordinari mezzi al risequenziamento di genomi di singoli individue per cui il genoma della specie di riferimento era già disponibile, il sequenziamento di genomi eucariotici completamente nuovi, utilizzando sequenze corte, presenta ancora grandi difficoltà. Le principali difficoltà si riscontrano in fase di assemblaggio e sono principalmente dovute alle notevoli dimensioni dei genomi eucariotici e alla presenza di regioni ripetute. Le microalghe, nei loro genomi, grandi in genere dalle 30Mb alle 100Mb, contengono poche regioni a bassa complessità e costituiscono pertanto degli interessanti organismi sui quali sperimentare il sequenziamento ex novo utilizzando esclusivamente i sequenziatori di seconda generazione. In questo lavoro, descriviamo il sequenziamento e l’assemblaggio del genoma della microalga Nannochloropsis gaditana, ottenuto utilizzando le sequenze prodotte dal 454 della Roche e dal SOLiD. Il sequenziamento di ‘mate-pairs’ utilizzando il SOLiD ha prodotto una copertura di sequenza di circa 250 volte la grandezza del genoma, mentre il sequenziamento 454 è stato utilizzato per produrre una ulteriore copertura di 7 volte con sequenze di media lunghezza. Le sequenze sono state assemblate in una versione preliminare non del tutto finita di 32Mb, dove 18.7Mb sono state incluse in 167 grandi scaffolds. Il 50% degli scaffolds ottenuti è più grande di 50Kb, mentre un terzo del genoma è stato assemblato in circa 20 contigs. Il nostro lavoro conferma la previsione che le tecniche di nuova generazione sono adatte al sequenziamento del genoma di una microalga e consentono di ottenere risultati utili in un tempo più breve di quelli tradizionali e ad un minor costo. I dati ottenuti potranno esser utilizzati per analisi comparative del genoma e saranno anche un importante prerequisito per l’applicazione di tecniche ricombinati alla microalga di interesse biotecnologico. Inoltre, durante questo progetto, sono state portate avanti anche diverse analisi del trascrittoma tramite sequenziamento, finalizzate alla produzione di una lista di geni utile all’annotazione del genoma e all’identificazione di geni differenzialmente espressi in condizioni di accumulo di lipidi. Vengono presentate, in questo lavoro, anche alcune innovazioni tecniche che hanno permesso di sfruttare al meglio il sequenziamento SOLiD per produrre un’accurata annotazione della struttura del trascrittoma e una più completa analisi dei geni differenzialmente espressi codificati negli organelli. I risultati dimostrano che una sola corsa SOLiD su campioni preparati in modo adeguato, è sufficiente per l’annotazione accurata di un genoma completamente nuovo e per l’individuazione di geni differenzialmente espressi in condizioni di interesse.  
2010
Inglese
Nannochloropsis, genomics, transcriptomics, Next generation sequencing, metabolic biochemistry
Università degli studi di Padova
File in questo prodotto:
File Dimensione Formato  
TesiDottoratoCC.pdf

accesso aperto

Dimensione 15.36 MB
Formato Adobe PDF
15.36 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/110416
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-110416