Il tumore àƒ¨ una malattia caratterizzata da unࢠestrema complessitàƒÂ molecolare. Gli approcci di tipo ࢠomicࢠ, collezionando dati sullࢠintero genoma, sui trascritti e proteine in dataset pubblici, permettono di superare questa complessitàƒÂ e di trovare moduli funzionali che eseguono le funzioni coinvolte nei processi tumorali. Ad esempio, i profili di espressione genica da tessuti vengono usati per definire firme di geni e testarne la rilevanza clinica. Ho usato questo tipo di informazione per caratterizzare specifici geni di interesse in modelli di tumore al seno. Uno dei piàƒ¹ recenti progetti di tipo ࢠomicà¢ àƒ¨ il FANTOM5. Questo progetto ha generato una risorsa unica: il primo atlante di espressione in mammifero basato su sequenziamento a singola molecola. Il sistema CAGE (Cap Analysis of Gene Expression) àƒ¨ stato usato per misurare i siti di inizio trascrizione (TSS) e lࢠutilizzo dei promotori in una collezione di campioni umani: in questo modo sono stati misurati i livelli di espressione di gran parte dei trascritti codificanti e non-codificanti nel genoma umano. Ho usato questo tipo di informazione per caratterizzare una linea staminale mesenchimale/stromale (MSC) derivante da tumori sierosi ovarici di alto grado (HG-SOC-MSCs) o da tessuti normali (N-MSCs) inclusi nel dataset FANTOM5. Ho messo in luce programmi funzionali condivisi tra le due linee cellulari e osservato che le differenze principali tra le funzioni attivate nelle due linee sono di tipo quantitativo piàƒ¹ che qualitativo. I risultati suggeriscono inoltre che le HG-SOC-MSCs sono simili alle cellule mesoteliali e alle cellule del tessuto muscolare liscio. Inoltre, ho analizzato lࢠintero dataset usando ScanAll, un nuovo software utile a predire ab initio la presenza di elementi arricchiti nelle regioni geniche che circondano i promotori trovati del progetto FANTOM5. Ho individuato moduli di regolazione, ossia gruppi di motif che si trovano a distanze predefinite sul genoma uno rispetto allࢠaltro. Questi moduli sono arricchiti in regioni del genoma co-espresse rispetto a sequenze generate casualmente. Infine ho creato un compendio di fattori di trascrizione espressi e che partecipano ad interazione proteina-proteina.
Regulatory modules discovery and mesenchymal stem cells characterization from high-throughput cancer genomics data
-
2015
Abstract
Il tumore àƒ¨ una malattia caratterizzata da unࢠestrema complessitàƒÂ molecolare. Gli approcci di tipo ࢠomicࢠ, collezionando dati sullࢠintero genoma, sui trascritti e proteine in dataset pubblici, permettono di superare questa complessitàƒÂ e di trovare moduli funzionali che eseguono le funzioni coinvolte nei processi tumorali. Ad esempio, i profili di espressione genica da tessuti vengono usati per definire firme di geni e testarne la rilevanza clinica. Ho usato questo tipo di informazione per caratterizzare specifici geni di interesse in modelli di tumore al seno. Uno dei piàƒ¹ recenti progetti di tipo ࢠomicà¢ àƒ¨ il FANTOM5. Questo progetto ha generato una risorsa unica: il primo atlante di espressione in mammifero basato su sequenziamento a singola molecola. Il sistema CAGE (Cap Analysis of Gene Expression) àƒ¨ stato usato per misurare i siti di inizio trascrizione (TSS) e lࢠutilizzo dei promotori in una collezione di campioni umani: in questo modo sono stati misurati i livelli di espressione di gran parte dei trascritti codificanti e non-codificanti nel genoma umano. Ho usato questo tipo di informazione per caratterizzare una linea staminale mesenchimale/stromale (MSC) derivante da tumori sierosi ovarici di alto grado (HG-SOC-MSCs) o da tessuti normali (N-MSCs) inclusi nel dataset FANTOM5. Ho messo in luce programmi funzionali condivisi tra le due linee cellulari e osservato che le differenze principali tra le funzioni attivate nelle due linee sono di tipo quantitativo piàƒ¹ che qualitativo. I risultati suggeriscono inoltre che le HG-SOC-MSCs sono simili alle cellule mesoteliali e alle cellule del tessuto muscolare liscio. Inoltre, ho analizzato lࢠintero dataset usando ScanAll, un nuovo software utile a predire ab initio la presenza di elementi arricchiti nelle regioni geniche che circondano i promotori trovati del progetto FANTOM5. Ho individuato moduli di regolazione, ossia gruppi di motif che si trovano a distanze predefinite sul genoma uno rispetto allࢠaltro. Questi moduli sono arricchiti in regioni del genoma co-espresse rispetto a sequenze generate casualmente. Infine ho creato un compendio di fattori di trascrizione espressi e che partecipano ad interazione proteina-proteina.I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/245684
URN:NBN:IT:UNITS-245684