Since the introduction of single cell RNA sequencing (scRNA-seq), numerous computational methods have been developed to infer the progression of single cells along “developmental” paths from changes in their transcriptional programs and to model the differentiation processes of adult cells from their pluripotent ancestors. Most of these methods reconstruct dynamic cellular processes from static transcriptional profiles by ordering cells on continuous trajectories based on their similarity in the gene expression space. This strategy relies on assumptions that may not be a-priori guaranteed in every cellular system and requires some prior knowledge on the topology and direction of the expected genealogy. Since scRNA-seq technology is being increasingly used to study complex and unexplored systems characterized by still unclear developmental patterns, new approaches are required that are able to infer cell lineages directly from the dynamic evolution of the differentiation potency of single cells without the need of prior assumptions. Although several methods have been devised to estimate the potency of single cells by measuring the entropy level of their transcriptomes, a clear mathematical model for the inference of the dynamics of such potency across time is still lacking. To tackle this issue, we developed FIERCE (Framework for InfERence of veloCity of the Entropy), a novel composite computational pipeline that employs the mathematical framework of RNA velocity to predict the temporal evolution of the signalling entropy of single cells during dynamic processes. As such, FIERCE allows inferring cell lineages through a fully unsupervised and cell-centered approach that does not need the prior specification of evolutionary parameters. When tested on scRNA-seq data from two well-known mouse differentiation systems, our method correctly reconstructed the developmental genealogy of the adult specialized cell subpopulations from their respective pluripotent progenitors. We envisage that our tool will be a valuable computational resource for the inference of cell trajectories in the absence of solid prior biological knowledge.

Fin dall’introduzione del sequenziamento dell’RNA a singola cellula (scRNA-seq), numerosi metodi computazionali sono stati sviluppati allo scopo di ricostruire la progressione delle singole cellule lungo percorsi di sviluppo a partire dai cambiamenti nel tempo dei rispettivi programmi trascrizionali, e di definire i processi di differenziamento delle cellule adulte a partire dai rispettivi antenati pluripotenti. La maggior parte di tali metodi sono progettati per ricostruire i processi dinamici cellulari a partire da profili trascrizionali statici tramite l’ordinamento delle cellule in traiettorie continue sulla base della loro similarità sul piano dell’espressione genica. Questa strategia si basa su assunzioni che potrebbero non essere soddisfatte a priori da tutti i sistemi cellulari, e richiede un certo livello di conoscenza pregressa sulla topologia e sulla direzione della genealogia attesa. Poiché la tecnologia del scRNA-seq è sempre più utilizzata per lo studio di sistemi complessi e inesplorati, caratterizzati da schemi di sviluppo ancora poco chiari, è necessaria l’implementazione di nuovi approcci per l’inferenza di genealogie cellulari direttamente sulla base dell’evoluzione dinamica del potenziale di differenziamento delle singole cellule, senza la necessità di assunzioni pregresse. Benché diversi metodi siano già stati sviluppati per la stima del potenziale delle singole cellule tramite la misura del livello di entropia dei rispettivi trascrittomi, non è ancora stato presentato un chiaro modello matematico per l’inferenza delle dinamiche di tale potenziale nel tempo. Per sopperire a tale mancanza, abbiamo sviluppato FIERCE (Framework for InfERence of veloCity of the Entropy), una nuova pipeline computazionale composita che utilizza l’implementazione matematica del metodo RNA velocity per predire l’evoluzione temporale dell’entropia trascrizionale delle singole cellule durante i processi dinamici. In tal modo, FIERCE è in grado di inferire le genealogie cellulari attraverso un approccio non supervisionato e completamente centrato sulle singole cellule, il quale non necessita della specificazione di alcun parametro evolutivo. A seguito dell’applicazione su dati di scRNA-seq provenienti da due sistemi di differenziamento murini ben conosciuti, il nostro metodo è riuscito a ricostruire il corretto percorso di sviluppo delle sottopopolazioni di cellule adulte altamente specializzate a partire dai rispettivi progenitori pluripotenti. Lo scopo del nostro algoritmo è quello di costituire una valida risorsa computazionale per l’inferenza di traiettorie cellulari nell’assenza di una solida conoscenza biologica pregressa.

Ricostruzione di traiettorie dinamiche dal potenziale di differenziamento di singole cellule

CALDERONI, LUCA
2023

Abstract

Since the introduction of single cell RNA sequencing (scRNA-seq), numerous computational methods have been developed to infer the progression of single cells along “developmental” paths from changes in their transcriptional programs and to model the differentiation processes of adult cells from their pluripotent ancestors. Most of these methods reconstruct dynamic cellular processes from static transcriptional profiles by ordering cells on continuous trajectories based on their similarity in the gene expression space. This strategy relies on assumptions that may not be a-priori guaranteed in every cellular system and requires some prior knowledge on the topology and direction of the expected genealogy. Since scRNA-seq technology is being increasingly used to study complex and unexplored systems characterized by still unclear developmental patterns, new approaches are required that are able to infer cell lineages directly from the dynamic evolution of the differentiation potency of single cells without the need of prior assumptions. Although several methods have been devised to estimate the potency of single cells by measuring the entropy level of their transcriptomes, a clear mathematical model for the inference of the dynamics of such potency across time is still lacking. To tackle this issue, we developed FIERCE (Framework for InfERence of veloCity of the Entropy), a novel composite computational pipeline that employs the mathematical framework of RNA velocity to predict the temporal evolution of the signalling entropy of single cells during dynamic processes. As such, FIERCE allows inferring cell lineages through a fully unsupervised and cell-centered approach that does not need the prior specification of evolutionary parameters. When tested on scRNA-seq data from two well-known mouse differentiation systems, our method correctly reconstructed the developmental genealogy of the adult specialized cell subpopulations from their respective pluripotent progenitors. We envisage that our tool will be a valuable computational resource for the inference of cell trajectories in the absence of solid prior biological knowledge.
23-mag-2023
Inglese
Fin dall’introduzione del sequenziamento dell’RNA a singola cellula (scRNA-seq), numerosi metodi computazionali sono stati sviluppati allo scopo di ricostruire la progressione delle singole cellule lungo percorsi di sviluppo a partire dai cambiamenti nel tempo dei rispettivi programmi trascrizionali, e di definire i processi di differenziamento delle cellule adulte a partire dai rispettivi antenati pluripotenti. La maggior parte di tali metodi sono progettati per ricostruire i processi dinamici cellulari a partire da profili trascrizionali statici tramite l’ordinamento delle cellule in traiettorie continue sulla base della loro similarità sul piano dell’espressione genica. Questa strategia si basa su assunzioni che potrebbero non essere soddisfatte a priori da tutti i sistemi cellulari, e richiede un certo livello di conoscenza pregressa sulla topologia e sulla direzione della genealogia attesa. Poiché la tecnologia del scRNA-seq è sempre più utilizzata per lo studio di sistemi complessi e inesplorati, caratterizzati da schemi di sviluppo ancora poco chiari, è necessaria l’implementazione di nuovi approcci per l’inferenza di genealogie cellulari direttamente sulla base dell’evoluzione dinamica del potenziale di differenziamento delle singole cellule, senza la necessità di assunzioni pregresse. Benché diversi metodi siano già stati sviluppati per la stima del potenziale delle singole cellule tramite la misura del livello di entropia dei rispettivi trascrittomi, non è ancora stato presentato un chiaro modello matematico per l’inferenza delle dinamiche di tale potenziale nel tempo. Per sopperire a tale mancanza, abbiamo sviluppato FIERCE (Framework for InfERence of veloCity of the Entropy), una nuova pipeline computazionale composita che utilizza l’implementazione matematica del metodo RNA velocity per predire l’evoluzione temporale dell’entropia trascrizionale delle singole cellule durante i processi dinamici. In tal modo, FIERCE è in grado di inferire le genealogie cellulari attraverso un approccio non supervisionato e completamente centrato sulle singole cellule, il quale non necessita della specificazione di alcun parametro evolutivo. A seguito dell’applicazione su dati di scRNA-seq provenienti da due sistemi di differenziamento murini ben conosciuti, il nostro metodo è riuscito a ricostruire il corretto percorso di sviluppo delle sottopopolazioni di cellule adulte altamente specializzate a partire dai rispettivi progenitori pluripotenti. Lo scopo del nostro algoritmo è quello di costituire una valida risorsa computazionale per l’inferenza di traiettorie cellulari nell’assenza di una solida conoscenza biologica pregressa.
scRNA-seq; bioinformatica; differenziamento; entropia; RNA velocity
FORCATO, Mattia
ROMANO, ORIANA
DE LUCA, Michele
Università degli studi di Modena e Reggio Emilia
File in questo prodotto:
File Dimensione Formato  
Tesi_definitiva_Calderoni_Luca.pdf

embargo fino al 22/05/2026

Dimensione 8.08 MB
Formato Adobe PDF
8.08 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/79691
Il codice NBN di questa tesi è URN:NBN:IT:UNIMORE-79691