This PhD thesis addresses the critical challenge of improving outcomes for Non-Small Cell Lung Cancer patients candidate to Immune Checkpoint Inhibitors (ICIs), recently approved as a groundbreaking therapy. While ICIs offer promising results, challenges such as limited clinical benefit and uncertainties in patient selection persist. The thesis underscores the importance of the need for new types of biomarkers to better predict efficacy beyond PD-L1 (the only approved biomarker) emphasizing the need for innovative approaches. The complexity of the immune system necessitates a holistic understanding, and the thesis proposes leveraging Artificial Intelligence (AI) and Machine Learning (ML) to integrate real-world data (RWD), including images and multiomics datasets. In particular, AI/ML with a shared layer representation, could facilitate the integration of diverse data for joint analysis and predictive algorithm development, which can address this unmet need. This approach holds particular promise, supporting the clinicians' intuition. The project's primary goal is to leverage AI/ML on multimodal patient data, integrating clinical, radiological and multiomics data. The application of AI/ML models in a real-life setting, coupled with Trustworthy Explainable AI (XAI) methodology, aims to create responsible and interpretable AI applications. Finally, by integrating AI/ML models into clinical practice, the aim is not only to enhance predictive capabilities but also to advance the field of precision medicine. The integration of Trustworthy XAI methodology ensures that AI's inherent performances are complemented by human input, creating a responsible AI application that clinicians can trust. In this thesis, multimodal data has been collected at the Istituto Nazionale dei Tumori di Milano, in NSCLC patients and different unimodal and/or bimodal algorithms have been developed. In particular, 667 patients for which real-world data was collected, 375 CT-scans, 202 digital pathology and in different use cases using multi-omic data such as microRNA (nr. 200 patients), liquid biopsy on ctDNA (nr. 453 patients), circulating immune profile, transcriptomics and microbiome (nr. 65 patients). Performing survival and classification analysis using different outcomes (DCR, ORR, CBR, OS, PFS and TTF), satisfactory performance has been reached such as an AUC of up to 0.858 with OS (survival analysis) in RWD, 0.87 on OS in radiomics (classification analysis), 0.83 in miRNA. Lower performance has been achieved with the other omics (from 0.66 to 0.75). The results from explainability models confirmed medical research on immunotherapy predictive factors, as published in the last decade, confirming the trustworthiness of these models. Moreover, interesting discoveries were achieved through the application of these methodologies, providing new insights into future research developments. Finally, preliminary results on the RWD cohort of the I3LUNG project have been reported on first-line patients treated with immunotherapy (nr. 1429 patients). Through this innovative approach, the thesis strives to contribute to the acceleration of personalized medicine, ultimately improving outcomes for patients with NSCLC.

Questa tesi di dottorato affronta la sfida critica di migliorare gli esiti per i pazienti affetti da carcinoma polmonare non a piccole cellule (NSCLC) candidati agli Inibitori dei Checkpoint Immunitari (ICIs), recentemente approvati come terapia innovativa. Sebbene gli ICIs offrano risultati promettenti, persistono sfide come il beneficio clinico limitato e le incertezze nella selezione dei pazienti. La tesi sottolinea l'importanza della necessità di nuovi tipi di biomarcatori per prevedere meglio l'efficacia al di là di PD-L1 (l'unico biomarcatore approvato), sottolineando la necessità di approcci innovativi. La complessità del sistema immunitario richiede una comprensione olistica, e la tesi propone di sfruttare l'Intelligenza Artificiale (AI) e il Machine Learning (ML) per integrare dati del mondo reale (RWD), inclusi immagini e set di dati multiomici. In particolare, l'AI/ML con una rappresentazione a strati condivisi potrebbe facilitare l'integrazione di dati diversi per l'analisi congiunta e lo sviluppo di algoritmi predittivi, che possono affrontare questa esigenza non soddisfatta. Questo approccio promette particolarmente bene, supportando l'intuizione dei clinici. L'obiettivo principale del progetto è sfruttare l'AI/ML sui dati multimodali dei pazienti, integrando dati clinici, radiologici e multiomici. L'applicazione dei modelli AI/ML in un contesto di vita reale, abbinata alla metodologia Trustworthy Explainable AI (XAI), mira a creare applicazioni AI responsabili e interpretabili. Infine, integrando i modelli AI/ML nella pratica clinica, l'obiettivo non è solo migliorare le capacità predittive, ma anche far avanzare il campo della medicina di precisione. L'integrazione della metodologia Trustworthy XAI garantisce che le prestazioni intrinseche dell'AI siano integrate dall'input umano, creando un'applicazione AI responsabile di cui i clinici possono fidarsi. In questa tesi, sono stati raccolti dati multimodali presso l'Istituto Nazionale dei Tumori di Milano, in pazienti affetti da NSCLC, e sono stati sviluppati diversi algoritmi unimodali e/o bimodali. In particolare, sono stati raccolti dati del mondo reale su 667 pazienti, 375 scansioni TC, 202 slides per analisi di patomica e in diversi casi d'uso utilizzando dati multi-omici come microRNA (n. 200 pazienti), biopsia liquida sul ctDNA (n. 453 pazienti), profilo immunitario circolante, trascrittomica e microbioma (n. 65 pazienti). Eseguendo analisi di sopravvivenza e di classificazione utilizzando diversi outcome (DCR, ORR, CBR, OS, PFS e TTF), si è raggiunta una performance soddisfacente come un'area sotto la curva (AUC) di 0,858 con OS (sopravvivenza globale) in RWD, 0,87 su OS in radiomica (analisi di classificazione), 0,83 in miRNA. Si è ottenuta una performance inferiore con gli altri dati omici (da 0,66 a 0,75). I risultati dei modelli di spiegazione hanno confermato la ricerca medica sui fattori predittivi dell'immunoterapia, come pubblicato nell'ultimo decennio, confermando l'affidabilità di questi modelli. Inoltre, sono state raggiunte "discoveries" interessanti attraverso l'applicazione di questi metodi, fornendo nuovi spunti per futuri sviluppi della ricerca. Infine, sono stati riportati risultati preliminari sulla coorte di RWD del progetto I3LUNG su pazienti di prima linea trattati con immunoterapia (n. 1429 pazienti). Attraverso questo approccio innovativo, la tesi si sforza di contribuire all'accelerazione della medicina personalizzata, migliorando infine la sopravvivenza e l'outcome dei pazienti affetti da NSCLC.

Multimodal data To predict immunotherapy efficacy in NSCLC patients using Artificial Intelligence

ARSELA, PRELAJ
2024

Abstract

This PhD thesis addresses the critical challenge of improving outcomes for Non-Small Cell Lung Cancer patients candidate to Immune Checkpoint Inhibitors (ICIs), recently approved as a groundbreaking therapy. While ICIs offer promising results, challenges such as limited clinical benefit and uncertainties in patient selection persist. The thesis underscores the importance of the need for new types of biomarkers to better predict efficacy beyond PD-L1 (the only approved biomarker) emphasizing the need for innovative approaches. The complexity of the immune system necessitates a holistic understanding, and the thesis proposes leveraging Artificial Intelligence (AI) and Machine Learning (ML) to integrate real-world data (RWD), including images and multiomics datasets. In particular, AI/ML with a shared layer representation, could facilitate the integration of diverse data for joint analysis and predictive algorithm development, which can address this unmet need. This approach holds particular promise, supporting the clinicians' intuition. The project's primary goal is to leverage AI/ML on multimodal patient data, integrating clinical, radiological and multiomics data. The application of AI/ML models in a real-life setting, coupled with Trustworthy Explainable AI (XAI) methodology, aims to create responsible and interpretable AI applications. Finally, by integrating AI/ML models into clinical practice, the aim is not only to enhance predictive capabilities but also to advance the field of precision medicine. The integration of Trustworthy XAI methodology ensures that AI's inherent performances are complemented by human input, creating a responsible AI application that clinicians can trust. In this thesis, multimodal data has been collected at the Istituto Nazionale dei Tumori di Milano, in NSCLC patients and different unimodal and/or bimodal algorithms have been developed. In particular, 667 patients for which real-world data was collected, 375 CT-scans, 202 digital pathology and in different use cases using multi-omic data such as microRNA (nr. 200 patients), liquid biopsy on ctDNA (nr. 453 patients), circulating immune profile, transcriptomics and microbiome (nr. 65 patients). Performing survival and classification analysis using different outcomes (DCR, ORR, CBR, OS, PFS and TTF), satisfactory performance has been reached such as an AUC of up to 0.858 with OS (survival analysis) in RWD, 0.87 on OS in radiomics (classification analysis), 0.83 in miRNA. Lower performance has been achieved with the other omics (from 0.66 to 0.75). The results from explainability models confirmed medical research on immunotherapy predictive factors, as published in the last decade, confirming the trustworthiness of these models. Moreover, interesting discoveries were achieved through the application of these methodologies, providing new insights into future research developments. Finally, preliminary results on the RWD cohort of the I3LUNG project have been reported on first-line patients treated with immunotherapy (nr. 1429 patients). Through this innovative approach, the thesis strives to contribute to the acceleration of personalized medicine, ultimately improving outcomes for patients with NSCLC.
11-mar-2024
Inglese
Questa tesi di dottorato affronta la sfida critica di migliorare gli esiti per i pazienti affetti da carcinoma polmonare non a piccole cellule (NSCLC) candidati agli Inibitori dei Checkpoint Immunitari (ICIs), recentemente approvati come terapia innovativa. Sebbene gli ICIs offrano risultati promettenti, persistono sfide come il beneficio clinico limitato e le incertezze nella selezione dei pazienti. La tesi sottolinea l'importanza della necessità di nuovi tipi di biomarcatori per prevedere meglio l'efficacia al di là di PD-L1 (l'unico biomarcatore approvato), sottolineando la necessità di approcci innovativi. La complessità del sistema immunitario richiede una comprensione olistica, e la tesi propone di sfruttare l'Intelligenza Artificiale (AI) e il Machine Learning (ML) per integrare dati del mondo reale (RWD), inclusi immagini e set di dati multiomici. In particolare, l'AI/ML con una rappresentazione a strati condivisi potrebbe facilitare l'integrazione di dati diversi per l'analisi congiunta e lo sviluppo di algoritmi predittivi, che possono affrontare questa esigenza non soddisfatta. Questo approccio promette particolarmente bene, supportando l'intuizione dei clinici. L'obiettivo principale del progetto è sfruttare l'AI/ML sui dati multimodali dei pazienti, integrando dati clinici, radiologici e multiomici. L'applicazione dei modelli AI/ML in un contesto di vita reale, abbinata alla metodologia Trustworthy Explainable AI (XAI), mira a creare applicazioni AI responsabili e interpretabili. Infine, integrando i modelli AI/ML nella pratica clinica, l'obiettivo non è solo migliorare le capacità predittive, ma anche far avanzare il campo della medicina di precisione. L'integrazione della metodologia Trustworthy XAI garantisce che le prestazioni intrinseche dell'AI siano integrate dall'input umano, creando un'applicazione AI responsabile di cui i clinici possono fidarsi. In questa tesi, sono stati raccolti dati multimodali presso l'Istituto Nazionale dei Tumori di Milano, in pazienti affetti da NSCLC, e sono stati sviluppati diversi algoritmi unimodali e/o bimodali. In particolare, sono stati raccolti dati del mondo reale su 667 pazienti, 375 scansioni TC, 202 slides per analisi di patomica e in diversi casi d'uso utilizzando dati multi-omici come microRNA (n. 200 pazienti), biopsia liquida sul ctDNA (n. 453 pazienti), profilo immunitario circolante, trascrittomica e microbioma (n. 65 pazienti). Eseguendo analisi di sopravvivenza e di classificazione utilizzando diversi outcome (DCR, ORR, CBR, OS, PFS e TTF), si è raggiunta una performance soddisfacente come un'area sotto la curva (AUC) di 0,858 con OS (sopravvivenza globale) in RWD, 0,87 su OS in radiomica (analisi di classificazione), 0,83 in miRNA. Si è ottenuta una performance inferiore con gli altri dati omici (da 0,66 a 0,75). I risultati dei modelli di spiegazione hanno confermato la ricerca medica sui fattori predittivi dell'immunoterapia, come pubblicato nell'ultimo decennio, confermando l'affidabilità di questi modelli. Inoltre, sono state raggiunte "discoveries" interessanti attraverso l'applicazione di questi metodi, fornendo nuovi spunti per futuri sviluppi della ricerca. Infine, sono stati riportati risultati preliminari sulla coorte di RWD del progetto I3LUNG su pazienti di prima linea trattati con immunoterapia (n. 1429 pazienti). Attraverso questo approccio innovativo, la tesi si sforza di contribuire all'accelerazione della medicina personalizzata, migliorando infine la sopravvivenza e l'outcome dei pazienti affetti da NSCLC.
TROVO', FRANCESCO
File in questo prodotto:
File Dimensione Formato  
Tesi PhD A. Prelaj_ v06.03.pdf

accesso solo da BNCF e BNCR

Licenza: Tutti i diritti riservati
Dimensione 13.31 MB
Formato Adobe PDF
13.31 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/205683
Il codice NBN di questa tesi è URN:NBN:IT:POLIMI-205683