Il tumore àƒ¨ una malattia caratterizzata da unࢠestrema complessitàƒÂ  molecolare. Gli approcci di tipo ࢠomicࢠ, collezionando dati sullࢠintero genoma, sui trascritti e proteine in dataset pubblici, permettono di superare questa complessitàƒÂ  e di trovare moduli funzionali che eseguono le funzioni coinvolte nei processi tumorali. Ad esempio, i profili di espressione genica da tessuti vengono usati per definire firme di geni e testarne la rilevanza clinica. Ho usato questo tipo di informazione per caratterizzare specifici geni di interesse in modelli di tumore al seno. Uno dei piàƒ¹ recenti progetti di tipo ࢠomicà¢ àƒ¨ il FANTOM5. Questo progetto ha generato una risorsa unica: il primo atlante di espressione in mammifero basato su sequenziamento a singola molecola. Il sistema CAGE (Cap Analysis of Gene Expression) àƒ¨ stato usato per misurare i siti di inizio trascrizione (TSS) e lࢠutilizzo dei promotori in una collezione di campioni umani: in questo modo sono stati misurati i livelli di espressione di gran parte dei trascritti codificanti e non-codificanti nel genoma umano. Ho usato questo tipo di informazione per caratterizzare una linea staminale mesenchimale/stromale (MSC) derivante da tumori sierosi ovarici di alto grado (HG-SOC-MSCs) o da tessuti normali (N-MSCs) inclusi nel dataset FANTOM5. Ho messo in luce programmi funzionali condivisi tra le due linee cellulari e osservato che le differenze principali tra le funzioni attivate nelle due linee sono di tipo quantitativo piàƒ¹ che qualitativo. I risultati suggeriscono inoltre che le HG-SOC-MSCs sono simili alle cellule mesoteliali e alle cellule del tessuto muscolare liscio. Inoltre, ho analizzato lࢠintero dataset usando ScanAll, un nuovo software utile a predire ab initio la presenza di elementi arricchiti nelle regioni geniche che circondano i promotori trovati del progetto FANTOM5. Ho individuato moduli di regolazione, ossia gruppi di motif che si trovano a distanze predefinite sul genoma uno rispetto allࢠaltro. Questi moduli sono arricchiti in regioni del genoma co-espresse rispetto a sequenze generate casualmente. Infine ho creato un compendio di fattori di trascrizione espressi e che partecipano ad interazione proteina-proteina.

Regulatory modules discovery and mesenchymal stem cells characterization from high-throughput cancer genomics data

-
2015

Abstract

Il tumore àƒ¨ una malattia caratterizzata da unࢠestrema complessitàƒÂ  molecolare. Gli approcci di tipo ࢠomicࢠ, collezionando dati sullࢠintero genoma, sui trascritti e proteine in dataset pubblici, permettono di superare questa complessitàƒÂ  e di trovare moduli funzionali che eseguono le funzioni coinvolte nei processi tumorali. Ad esempio, i profili di espressione genica da tessuti vengono usati per definire firme di geni e testarne la rilevanza clinica. Ho usato questo tipo di informazione per caratterizzare specifici geni di interesse in modelli di tumore al seno. Uno dei piàƒ¹ recenti progetti di tipo ࢠomicà¢ àƒ¨ il FANTOM5. Questo progetto ha generato una risorsa unica: il primo atlante di espressione in mammifero basato su sequenziamento a singola molecola. Il sistema CAGE (Cap Analysis of Gene Expression) àƒ¨ stato usato per misurare i siti di inizio trascrizione (TSS) e lࢠutilizzo dei promotori in una collezione di campioni umani: in questo modo sono stati misurati i livelli di espressione di gran parte dei trascritti codificanti e non-codificanti nel genoma umano. Ho usato questo tipo di informazione per caratterizzare una linea staminale mesenchimale/stromale (MSC) derivante da tumori sierosi ovarici di alto grado (HG-SOC-MSCs) o da tessuti normali (N-MSCs) inclusi nel dataset FANTOM5. Ho messo in luce programmi funzionali condivisi tra le due linee cellulari e osservato che le differenze principali tra le funzioni attivate nelle due linee sono di tipo quantitativo piàƒ¹ che qualitativo. I risultati suggeriscono inoltre che le HG-SOC-MSCs sono simili alle cellule mesoteliali e alle cellule del tessuto muscolare liscio. Inoltre, ho analizzato lࢠintero dataset usando ScanAll, un nuovo software utile a predire ab initio la presenza di elementi arricchiti nelle regioni geniche che circondano i promotori trovati del progetto FANTOM5. Ho individuato moduli di regolazione, ossia gruppi di motif che si trovano a distanze predefinite sul genoma uno rispetto allࢠaltro. Questi moduli sono arricchiti in regioni del genoma co-espresse rispetto a sequenze generate casualmente. Infine ho creato un compendio di fattori di trascrizione espressi e che partecipano ad interazione proteina-proteina.
2015
en
bioinformatics
cancer
FANTOM5
gene expression
GTSE1
HMGA1
promoters
SCUOLA DI DOTTORATO DI RICERCA IN BIOMEDICINA MOLECOLARE
stem cells
transcription factor
tumour microenvironment
Università degli Studi di Trieste
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/245684
Il codice NBN di questa tesi è URN:NBN:IT:UNITS-245684