This work provides a comprehensive exploration of molecular data related to non-communicable diseases, with a particular focus on Triple Negative Breast Cancer (TNBC) and Sjögren’s Syndrome. The extraction of knowledge from this type of data requires bioinformatics expertise, and such analyses can be quite challenging for non-expert users. For this reason, we aimed to develop pipelines and tools to easily analyze multi-omics data related to non-communicable diseases. Therefore, in this thesis we will introduce the following projects: (i) A multi-omics machine learning approach to predict TNBC patients prognosis integrating data from various omics (Transcriptomics, Genomics and Microbiome); (ii) Geneslator, an R package that allows conversion between various gene identifiers; (iii) a Shiny App with an user-friendly interface that enables researcher to query bulk RNA-Seq data of a disease control cohort (Sjögren/sicca). The methods developed in this study are versatile and can be applied to various types of diseases for which data are available.

Questa tesi fornisce un'esplorazione approfondita dei dati molecolari relativi alle malattie non trasmissibili, con particolare attenzione al carcinoma mammario triplo negativo (TNBC) e alla sindrome di Sjögren. L'estrazione di informazioni da questo tipo di dati richiede competenze in bioinformatica e tali analisi possono essere piuttosto impegnative per gli utenti non esperti. Per questo motivo, ci siamo proposti di sviluppare pipeline e strumenti per analizzare facilmente i dati multi-omici relativi alle malattie non trasmissibili. Pertanto, in questa tesi introdurremo i seguenti progetti:(i) Un approccio di machine learning multi-omico per prevedere la prognosi dei pazienti con TNBC, integrando dati da diverse omiche (trascrittomica, genomica e microbioma);(ii) Geneslator, un pacchetto R che consente la conversione tra vari identificatori genici;(iii) una Shiny App con un'interfaccia user-friendly che permette ai ricercatori di interrogare i dati bulk RNA-Seq di una coorte di controllo della malattia (Sjögren/sicca).I metodi sviluppati in questo studio sono versatili e possono essere applicati a diversi tipi di malattie per cui sono disponibili dati.

Models and tools for multi-omics analysis of non communicable diseases [Modelli e strumenti per l'analisi multi-omica delle malattie non trasmissibili]

CAVALLARO, GIULIA
2025

Abstract

This work provides a comprehensive exploration of molecular data related to non-communicable diseases, with a particular focus on Triple Negative Breast Cancer (TNBC) and Sjögren’s Syndrome. The extraction of knowledge from this type of data requires bioinformatics expertise, and such analyses can be quite challenging for non-expert users. For this reason, we aimed to develop pipelines and tools to easily analyze multi-omics data related to non-communicable diseases. Therefore, in this thesis we will introduce the following projects: (i) A multi-omics machine learning approach to predict TNBC patients prognosis integrating data from various omics (Transcriptomics, Genomics and Microbiome); (ii) Geneslator, an R package that allows conversion between various gene identifiers; (iii) a Shiny App with an user-friendly interface that enables researcher to query bulk RNA-Seq data of a disease control cohort (Sjögren/sicca). The methods developed in this study are versatile and can be applied to various types of diseases for which data are available.
26-feb-2025
Inglese
Questa tesi fornisce un'esplorazione approfondita dei dati molecolari relativi alle malattie non trasmissibili, con particolare attenzione al carcinoma mammario triplo negativo (TNBC) e alla sindrome di Sjögren. L'estrazione di informazioni da questo tipo di dati richiede competenze in bioinformatica e tali analisi possono essere piuttosto impegnative per gli utenti non esperti. Per questo motivo, ci siamo proposti di sviluppare pipeline e strumenti per analizzare facilmente i dati multi-omici relativi alle malattie non trasmissibili. Pertanto, in questa tesi introdurremo i seguenti progetti:(i) Un approccio di machine learning multi-omico per prevedere la prognosi dei pazienti con TNBC, integrando dati da diverse omiche (trascrittomica, genomica e microbioma);(ii) Geneslator, un pacchetto R che consente la conversione tra vari identificatori genici;(iii) una Shiny App con un'interfaccia user-friendly che permette ai ricercatori di interrogare i dati bulk RNA-Seq di una coorte di controllo della malattia (Sjögren/sicca).I metodi sviluppati in questo studio sono versatili e possono essere applicati a diversi tipi di malattie per cui sono disponibili dati.
PULVIRENTI, ALFREDO
RAPISARDA, Andrea
Università degli studi di Catania
Catania
File in questo prodotto:
File Dimensione Formato  
Cavallaro.Giulia.PhThesis.final.logo.pdf

embargo fino al 26/02/2026

Dimensione 3.71 MB
Formato Adobe PDF
3.71 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/295663
Il codice NBN di questa tesi è URN:NBN:IT:UNICT-295663