Nella ricerca oncologica sono sempre più utilizzati i profili di espressione genica e un numero crescente di dati di microarray è disponibile in database pubblici come NCBI GEO e ArrayExpress. Diventa quindi possibile il confronto di studi con obiettivi di ricerca simili attraverso approcci di “meta-analisi”. Il cancro colorettale (CRC) rappresenta un fondamentale modello biologico di tumorigenesi, oltre ad essere una patologia molto diffusa. Sono a disposizione nei database pubblici molti esperimenti sul CRC, che confrontano mucosa normale con mucosa tumorale del colon attraverso metodologia microarray. Noi abbiamo utilizzato A-MADMAN, un’applicazione web open source di supporto per la meta-analisi di dati grezzi d’espressione genica ottenuti con microarray, per scaricare dal database dell’NCBI Gene Expression Omnibus (GEO), 27 collezioni di esperimenti per un totale di 1045 campioni ottenuti da mucosa normale, adenoma e CRC con e senza metastasi di colon-retto su cui erano state eseguite analisi di espressione genica con tecnologia gene chip Affymetrix. Dopo aver effettuato un controllo di qualità dei dati scaricati e aver disegnato 3 diversi flussi di lavoro per la ricostruzione del segnale d’espressione, sono state condotte delle analisi preliminari di espressione differenziale. In questo primo progetto ci siamo focalizzati sulle differenze molecolari sito–specifiche. Abbiamo quindi analizzato campioni di mucosa sana, di adenoma e di CRC suddivisi per localizzazione in colon destro e colon sinistro. Prendendo come riferimento il tessuto normale destro e sinistro, abbiamo ipotizzato che è possibile discriminare pattern di espressione genica tumorale sede specifica. Dal disegno dei tre flussi di lavoro abbiamo dedotto che il flusso di lavoro basato sulla generazione di chip virtuali e su una correzione del background chip-specifica è il più affidabile. Abbiamo identificato 647 geni differenzialmente espressi confrontando tessuto tumorale con tessuto normale e 683 geni nel confronto adenoma con tessuto normale, poi abbiamo individuato 72 geni nel confronto adenoma-tessuto normale specifici del colon sinistro e 1183 geni nello stesso confronto, colon destro specifici, mentre per quanto riguarda il confronto CRC e adenoma, 46 geni sono colon sinistro specifici e 69 sono colon destro specifici. Abbiamo inoltre trovato termini funzionali e pathway diversi sovra-rappresentati in colon destro rispetto a colon sinistro e rispetto ai corrispondenti normali. Nel secondo progetto, abbiamo ricostruito una rete regolatoria riguardante il CRC e la metastasi epatica da CRC integrando dati di originali di espressione genica, di splicing alternativo e di espressione di microRNA (miRNA). Lo studio si basa sulla raccolta di biopsie di tumore primario al colon, mucosa adiacente normale e metastasi al fegato di 55 pazienti, che sono state analizzate utilizzando piattaforme Affymetrix per l'analisi di espressione genica/esonica (GeneChip Human Exon 1,0 ST), e di microRNA (GeneChip® miRNA Array ). Analizzando l’ espressione differenziale a livello genico ed esonico mediante il software AltAnalyze identificando 33.740 geni coinvolti in probabili eventi di splicing alternativo. Integrando i dati risultati dalle statistiche di questo programma con i risultati ottenuti con un software basato su un approccio Bayesiano, MMBGX, abbiamo identificato una lista più ristretta ma anche più robusta di candidati eventi di splicing possibilmente rilevanti per la formazione e la progressione del CRC. Confrontando metastasi epatiche con tessuto normale del colon sono stati identificati 182 geni, mentre un numero inferiore di geni sono stati identificati nel confronto contro le metastasi del tumore colorettale e del tumore del colon-retto rispetto al tessuto normale (51 e 10 rispettivamente). A partire da questi risultati, abbiamo scoperto il coinvolgimento di trascritti alternativi di due geni, VCL e CALD1, nella progressione tumorale. In parallelo, sono stati identificati microRNA modulati in seguito allo sviluppo del tumore e della metastasi, trovandone rispettivamente 62, 63 e 11 differenzialmente espressi nel tumore rispetto al normale, nella metastasi rispetto al normale e nella metastasi rispetto al tumore. Abbiamo quindi confermato la robustezza dei risultati validando cinque miRNA presenti nella lista dei differenzialmente espressi (hsa miR-150, hsa miR-10b, has miR-146a, miR-210 and has miR-122) mediante RT-PCR. Per ogni contrasto considerato, sono stati identificati i KEGG pathway modulate e quindi sotto putativamente controllate dai miRNA. Grazie all’analisi integrata di profili di espressione di miRNA e dei loro geni target anti-correlati, sono state definite le principali reti di regolazione post-trascrizionale coinvolte nella cancerogenesi. Particolarmente rilevante è la rete che coinvolge il sottoinsieme dei miRNA differenzialmente espressi nel tumore rispetto al normale. Tra le interazioni inferite, abbiamo convalidato sperimentalmente le relazioni miR-145 - c-Myc e miR-182 - ENTPD5. Quest’ultima rappresenta una relazione nuova, il cui ruolo patogenetico può essere rilevante. Dai nostri risultati possiamo concludere che le vie di regolazione che interessano la progressione tumorale sono complesse e difficili da interpretare, che implicano interazioni che coinvolgono miRNA diversamente modulati che agiscono in diversi modi sull’espressione di più geni appartenenti ad una stessa pathway e da trascritti alternativi di geni che vengono espressi in modo differenziale nei tessuti sani, nei tumori e nelle metastasi.

A bioinformatic approach to the study of gene, microRNA expression and alternative splicing regulation in colorectal cancer progression and liver metastasis

PIZZINI, SILVIA
2012

Abstract

Nella ricerca oncologica sono sempre più utilizzati i profili di espressione genica e un numero crescente di dati di microarray è disponibile in database pubblici come NCBI GEO e ArrayExpress. Diventa quindi possibile il confronto di studi con obiettivi di ricerca simili attraverso approcci di “meta-analisi”. Il cancro colorettale (CRC) rappresenta un fondamentale modello biologico di tumorigenesi, oltre ad essere una patologia molto diffusa. Sono a disposizione nei database pubblici molti esperimenti sul CRC, che confrontano mucosa normale con mucosa tumorale del colon attraverso metodologia microarray. Noi abbiamo utilizzato A-MADMAN, un’applicazione web open source di supporto per la meta-analisi di dati grezzi d’espressione genica ottenuti con microarray, per scaricare dal database dell’NCBI Gene Expression Omnibus (GEO), 27 collezioni di esperimenti per un totale di 1045 campioni ottenuti da mucosa normale, adenoma e CRC con e senza metastasi di colon-retto su cui erano state eseguite analisi di espressione genica con tecnologia gene chip Affymetrix. Dopo aver effettuato un controllo di qualità dei dati scaricati e aver disegnato 3 diversi flussi di lavoro per la ricostruzione del segnale d’espressione, sono state condotte delle analisi preliminari di espressione differenziale. In questo primo progetto ci siamo focalizzati sulle differenze molecolari sito–specifiche. Abbiamo quindi analizzato campioni di mucosa sana, di adenoma e di CRC suddivisi per localizzazione in colon destro e colon sinistro. Prendendo come riferimento il tessuto normale destro e sinistro, abbiamo ipotizzato che è possibile discriminare pattern di espressione genica tumorale sede specifica. Dal disegno dei tre flussi di lavoro abbiamo dedotto che il flusso di lavoro basato sulla generazione di chip virtuali e su una correzione del background chip-specifica è il più affidabile. Abbiamo identificato 647 geni differenzialmente espressi confrontando tessuto tumorale con tessuto normale e 683 geni nel confronto adenoma con tessuto normale, poi abbiamo individuato 72 geni nel confronto adenoma-tessuto normale specifici del colon sinistro e 1183 geni nello stesso confronto, colon destro specifici, mentre per quanto riguarda il confronto CRC e adenoma, 46 geni sono colon sinistro specifici e 69 sono colon destro specifici. Abbiamo inoltre trovato termini funzionali e pathway diversi sovra-rappresentati in colon destro rispetto a colon sinistro e rispetto ai corrispondenti normali. Nel secondo progetto, abbiamo ricostruito una rete regolatoria riguardante il CRC e la metastasi epatica da CRC integrando dati di originali di espressione genica, di splicing alternativo e di espressione di microRNA (miRNA). Lo studio si basa sulla raccolta di biopsie di tumore primario al colon, mucosa adiacente normale e metastasi al fegato di 55 pazienti, che sono state analizzate utilizzando piattaforme Affymetrix per l'analisi di espressione genica/esonica (GeneChip Human Exon 1,0 ST), e di microRNA (GeneChip® miRNA Array ). Analizzando l’ espressione differenziale a livello genico ed esonico mediante il software AltAnalyze identificando 33.740 geni coinvolti in probabili eventi di splicing alternativo. Integrando i dati risultati dalle statistiche di questo programma con i risultati ottenuti con un software basato su un approccio Bayesiano, MMBGX, abbiamo identificato una lista più ristretta ma anche più robusta di candidati eventi di splicing possibilmente rilevanti per la formazione e la progressione del CRC. Confrontando metastasi epatiche con tessuto normale del colon sono stati identificati 182 geni, mentre un numero inferiore di geni sono stati identificati nel confronto contro le metastasi del tumore colorettale e del tumore del colon-retto rispetto al tessuto normale (51 e 10 rispettivamente). A partire da questi risultati, abbiamo scoperto il coinvolgimento di trascritti alternativi di due geni, VCL e CALD1, nella progressione tumorale. In parallelo, sono stati identificati microRNA modulati in seguito allo sviluppo del tumore e della metastasi, trovandone rispettivamente 62, 63 e 11 differenzialmente espressi nel tumore rispetto al normale, nella metastasi rispetto al normale e nella metastasi rispetto al tumore. Abbiamo quindi confermato la robustezza dei risultati validando cinque miRNA presenti nella lista dei differenzialmente espressi (hsa miR-150, hsa miR-10b, has miR-146a, miR-210 and has miR-122) mediante RT-PCR. Per ogni contrasto considerato, sono stati identificati i KEGG pathway modulate e quindi sotto putativamente controllate dai miRNA. Grazie all’analisi integrata di profili di espressione di miRNA e dei loro geni target anti-correlati, sono state definite le principali reti di regolazione post-trascrizionale coinvolte nella cancerogenesi. Particolarmente rilevante è la rete che coinvolge il sottoinsieme dei miRNA differenzialmente espressi nel tumore rispetto al normale. Tra le interazioni inferite, abbiamo convalidato sperimentalmente le relazioni miR-145 - c-Myc e miR-182 - ENTPD5. Quest’ultima rappresenta una relazione nuova, il cui ruolo patogenetico può essere rilevante. Dai nostri risultati possiamo concludere che le vie di regolazione che interessano la progressione tumorale sono complesse e difficili da interpretare, che implicano interazioni che coinvolgono miRNA diversamente modulati che agiscono in diversi modi sull’espressione di più geni appartenenti ad una stessa pathway e da trascritti alternativi di geni che vengono espressi in modo differenziale nei tessuti sani, nei tumori e nelle metastasi.
26-gen-2012
Inglese
cancro colorettale, microarray, geni, trascritti alternativi, microRNA, meta-analisi / colorectal cancer, microarray, genes, alternative transcripts, microRNA, meta-analysis
ZANOVELLO, PAOLA
ZANOVELLO, PAOLA
Università degli studi di Padova
134
File in questo prodotto:
File Dimensione Formato  
Tesi_Dottorato_Pizzini_Silvia.pdf

accesso aperto

Dimensione 3.54 MB
Formato Adobe PDF
3.54 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/176228
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-176228