Obiettivi: I progressi nelle tecnologie di imaging e negli algoritmi di intelligenza artificiale (AI) hanno favorito lo sviluppo dell'analisi delle immagini mediche e della radiomica, discipline che sfruttano dati quantitativi per caratterizzare malattie e prevederne la prognosi. Questo progetto di dottorato mira a promuovere l’evoluzione della radiomica, affrontando quesiti clinici cruciali in ambiti oncologici e non, per supportare cure personalizzate. Metodi: Diversi aspetti metodologici sono stati esplorati, includendo parametri di imaging quantitativi (OBIETTIVI 1 e 2), radiomica hand-crafted (HCR) (OBIETTIVI 3 e 4) e deep radiomics (OBIETTIVO 5). Questi approcci sono stati applicati a diversi contesti clinici, tra cui oncologia e infiammazione. Nell’OBIETTIVO 1 è stato analizzato il ruolo preoperatorio dei parametri convenzionali PET [68Ga]Ga-DOTATOC nella previsione della perdita di espressione di DAXX/ATRX in 72 pz con tumori neuroendocrini pancreatici (PanNET). Nell’OBIETTIVO 2 è stato valutato il ruolo del machine learning (ML) e parametri convenzionali PET [18F]FDG per la predizione preoperatoria dell’aggressività tumorale in una coorte di 123 pz con carcinoma endometriale (EC). Il ruolo della HCR è stato esplorato con l’OBIETTIVO 3, focalizzato sul miglioramento del rilevamento linfonodale (LN) in 72 pz PanNET, e l’OBIETTIVO 4, dedicato alla predizione dell’iper-espressione di p53 in 121 pz EC. In tutti questi contesti, l’istologia post-chirurgica è stata usata come standard di riferimento. Nell’OBIETTIVO 5 è stato indagato il ruolo delle reti neurali convoluzionali (CNN) basate su PET [18F]FDG nella previsione delle riacutizzazioni dell’arterite di Takayasu (TAK) entro 12 mesi dalla PET. Risultati: OB 1: Il parametro SRD estratto dalla PET è risultato predittivo della perdita di espressione di DAXX (DAXX LoE): AUC=79,01% (cut-off=46,96), con un aumento di una unità di SRD associato a un aumento di circa 4% della probabilità di DAXX LoE (p=0.002). OB 2: Le accuratezze di predizione ottenute per i singoli parametri PET e i modelli ML sono state: 61% (TLG) e 87% (ML) per l’invasione miometriale; 71% (SUVmax) e 79% (ML) per i gruppi di rischio; 72% (TLG) e 83% (ML) per i LN; 45% (SUVmax; SUVmean) e 73% (ML) per l’espressione di p53. In tutte le analisi, i modelli ML hanno apportato miglioramenti nella predizione degli outcome. OB 3: L’esame qualitativo della PET [68Ga]Ga-DOTATOC per il coinvolgimento dei LN ha fornito una bACC di 60% (SN=24%, SP=95%); il miglior modello radiomico ha raggiunto bACC=70%, aumentando significativamente la sensibilità (SN=77%, SP=61%). OB 4: La predizione dell’iper-espressione di p53 ha ottenuto bACC=0.78 (SN=0.83, SP=0.64) con uno split stratificato train/test, e bACC=0.60 (SN=SP=0.60) utilizzando Monte Carlo Cross Validation. Nessun metodo di oversampling, selezione, o modelli ML ha migliorato ulteriormente i risultati. OB 5: L’approccio di standardizzazione basato sul fegato proposto per l’armonizzazione delle PET è stato l’unico metodo a consentire un confronto completo tra gli scan provenienti da diversi tomografi. Per la previsione delle riacutizzazioni di TAK, il miglior modello CNN ha raggiunto un’accuratezza dell’82%, precisione per la classe 0 dell’85%, per la classe 1 del 62%, recall 38%, specificità del 94% e nMCC del 70%. Conclusioni: Questo progetto ha valutato il potenziale e le sfide dell’analisi quantitativa delle immagini, della radiomica e dell’AI nel supportare la medicina personalizzata. Pur dimostrandone il valore nel migliorare la previsione e la caratterizzazione delle malattie sia in contesti oncologici (PanNET, EC) sia non oncologici (TAK), ha anche evidenziato problematiche critiche, tra cui la necessità di metodologie robuste e la mancanza di standardizzazione.

Background and Purpose: Advances in imaging technologies and artificial intelligence (AI) algorithms have driven progress in AI-based image analysis and radiomics. These emerging fields focus on extracting quantitative data from medical images, offering deeper insights into disease characterization and prognosis prediction. This PhD project aims to advance radiomics, addressing key clinical questions in oncological and non-oncological settings to support tailored patient care. Materials and Methods. To achieve the overall aim, different methodological aspects have been systematically explored, encompassing quantitative imaging parameters (AIM 1 and 2), handcrafted radiomics-HCR (AIM 3 and AIM 4), and deep radiomics (AIM 5). This was applied in different clinical settings, including oncology and inflammation. In AIM 1, the preoperative role of [68Ga]Ga-DOTATOC PET conventional parameters in predicting DAXX/ATRX loss of expression in 72 patients with pancreatic neuroendocrine tumors (PanNET) was investigated. In AIM 2, the role of machine learning (ML)-based classification using conventional [18F]FDG PET parameters was evaluated for the preoperative prediction of tumor aggressiveness in a cohort of 123 endometrial cancer (EC) patients. Subsequently, the role of HCR was explored, with AIM 3 aiming at improving lymph nodes (LN) detection in 72 PanNETs patients, and AIM 4 targeting the prediction of p53 hyperexpression in 121 EC patients. In all these oncological settings, post-surgical histology was used as the reference standard. Finally, in AIM 5, the role of [18F]FDG PET-based convolutional neural networks (CNNs) in predicting Takayasu (TAK) arteritis flare-ups within 12 months from the scan was investigated. Results. AIM 1: PET-derived somatostatin-receptor density (SRD) was predictive for DAXX loss of expression before surgery (AUC=79.01%; cut-off=46.96), with an increase of one unit of SRD associated with approximately a 4% increase in the odds of DAXX LoE (p=0.002). AIM 2: Best accuracies for individual PET parameters and ML were: 61% (TLG) and 87% (ML) for myometrial invasion; 71% (SUVmax) and 79% (ML) for risk groups; 72% (TLG) and 83% (ML) for LN; 45% (SUVmax; SUVmean) and 73% (ML) for p53 expression. Overall, ML models consistently improved all the investigated predictions. AIM 3: [68Ga]Ga-DOTATOC PET qualitative examination of LN involvement provided bACC= 60% (SN= 24%, SP= 95%); the best-performing radiomic model provided a bACC= 70%, allowing to significantly increase detection SN (SN=77%, SP= 61%). AIM 4: Prediction of p53 hyperexpression achieved bACC=0.78 (SN=0.83, SP=0.64) with a stratified train/test split and bACC=0.60 (SN=SP=0.60) using Monte Carlo cross-validation. None of the tested oversampling, selection, or ML approaches improved results further. AIM 5: The proposed liver-based standardization approach for PET harmonization was the only method enabling complete comparison among scans from different tomographs. For the prediction of TAK flare-ups, the best CNN model achieved 82% accuracy, 85% precision of class 0, 62% precision of class 1, 38% recall, 94% specificity and 70% nMCC. Conclusions. This PhD project assessed the potential and challenges of quantitative image analysis, radiomics and AI in advancing personalized medicine. While demonstrating their value in improving disease prediction and characterization in both oncological (PanNETs, EC) and non-oncological (TAK) settings, it also highlighted critical issues, including the need for robust methodologies and the lack of standardization across many methodological approaches.

Radiomics and Artificial Intelligence in medical imaging for precision medicine

BEZZI, CAROLINA
2025

Abstract

Obiettivi: I progressi nelle tecnologie di imaging e negli algoritmi di intelligenza artificiale (AI) hanno favorito lo sviluppo dell'analisi delle immagini mediche e della radiomica, discipline che sfruttano dati quantitativi per caratterizzare malattie e prevederne la prognosi. Questo progetto di dottorato mira a promuovere l’evoluzione della radiomica, affrontando quesiti clinici cruciali in ambiti oncologici e non, per supportare cure personalizzate. Metodi: Diversi aspetti metodologici sono stati esplorati, includendo parametri di imaging quantitativi (OBIETTIVI 1 e 2), radiomica hand-crafted (HCR) (OBIETTIVI 3 e 4) e deep radiomics (OBIETTIVO 5). Questi approcci sono stati applicati a diversi contesti clinici, tra cui oncologia e infiammazione. Nell’OBIETTIVO 1 è stato analizzato il ruolo preoperatorio dei parametri convenzionali PET [68Ga]Ga-DOTATOC nella previsione della perdita di espressione di DAXX/ATRX in 72 pz con tumori neuroendocrini pancreatici (PanNET). Nell’OBIETTIVO 2 è stato valutato il ruolo del machine learning (ML) e parametri convenzionali PET [18F]FDG per la predizione preoperatoria dell’aggressività tumorale in una coorte di 123 pz con carcinoma endometriale (EC). Il ruolo della HCR è stato esplorato con l’OBIETTIVO 3, focalizzato sul miglioramento del rilevamento linfonodale (LN) in 72 pz PanNET, e l’OBIETTIVO 4, dedicato alla predizione dell’iper-espressione di p53 in 121 pz EC. In tutti questi contesti, l’istologia post-chirurgica è stata usata come standard di riferimento. Nell’OBIETTIVO 5 è stato indagato il ruolo delle reti neurali convoluzionali (CNN) basate su PET [18F]FDG nella previsione delle riacutizzazioni dell’arterite di Takayasu (TAK) entro 12 mesi dalla PET. Risultati: OB 1: Il parametro SRD estratto dalla PET è risultato predittivo della perdita di espressione di DAXX (DAXX LoE): AUC=79,01% (cut-off=46,96), con un aumento di una unità di SRD associato a un aumento di circa 4% della probabilità di DAXX LoE (p=0.002). OB 2: Le accuratezze di predizione ottenute per i singoli parametri PET e i modelli ML sono state: 61% (TLG) e 87% (ML) per l’invasione miometriale; 71% (SUVmax) e 79% (ML) per i gruppi di rischio; 72% (TLG) e 83% (ML) per i LN; 45% (SUVmax; SUVmean) e 73% (ML) per l’espressione di p53. In tutte le analisi, i modelli ML hanno apportato miglioramenti nella predizione degli outcome. OB 3: L’esame qualitativo della PET [68Ga]Ga-DOTATOC per il coinvolgimento dei LN ha fornito una bACC di 60% (SN=24%, SP=95%); il miglior modello radiomico ha raggiunto bACC=70%, aumentando significativamente la sensibilità (SN=77%, SP=61%). OB 4: La predizione dell’iper-espressione di p53 ha ottenuto bACC=0.78 (SN=0.83, SP=0.64) con uno split stratificato train/test, e bACC=0.60 (SN=SP=0.60) utilizzando Monte Carlo Cross Validation. Nessun metodo di oversampling, selezione, o modelli ML ha migliorato ulteriormente i risultati. OB 5: L’approccio di standardizzazione basato sul fegato proposto per l’armonizzazione delle PET è stato l’unico metodo a consentire un confronto completo tra gli scan provenienti da diversi tomografi. Per la previsione delle riacutizzazioni di TAK, il miglior modello CNN ha raggiunto un’accuratezza dell’82%, precisione per la classe 0 dell’85%, per la classe 1 del 62%, recall 38%, specificità del 94% e nMCC del 70%. Conclusioni: Questo progetto ha valutato il potenziale e le sfide dell’analisi quantitativa delle immagini, della radiomica e dell’AI nel supportare la medicina personalizzata. Pur dimostrandone il valore nel migliorare la previsione e la caratterizzazione delle malattie sia in contesti oncologici (PanNET, EC) sia non oncologici (TAK), ha anche evidenziato problematiche critiche, tra cui la necessità di metodologie robuste e la mancanza di standardizzazione.
4-mar-2025
Inglese
Background and Purpose: Advances in imaging technologies and artificial intelligence (AI) algorithms have driven progress in AI-based image analysis and radiomics. These emerging fields focus on extracting quantitative data from medical images, offering deeper insights into disease characterization and prognosis prediction. This PhD project aims to advance radiomics, addressing key clinical questions in oncological and non-oncological settings to support tailored patient care. Materials and Methods. To achieve the overall aim, different methodological aspects have been systematically explored, encompassing quantitative imaging parameters (AIM 1 and 2), handcrafted radiomics-HCR (AIM 3 and AIM 4), and deep radiomics (AIM 5). This was applied in different clinical settings, including oncology and inflammation. In AIM 1, the preoperative role of [68Ga]Ga-DOTATOC PET conventional parameters in predicting DAXX/ATRX loss of expression in 72 patients with pancreatic neuroendocrine tumors (PanNET) was investigated. In AIM 2, the role of machine learning (ML)-based classification using conventional [18F]FDG PET parameters was evaluated for the preoperative prediction of tumor aggressiveness in a cohort of 123 endometrial cancer (EC) patients. Subsequently, the role of HCR was explored, with AIM 3 aiming at improving lymph nodes (LN) detection in 72 PanNETs patients, and AIM 4 targeting the prediction of p53 hyperexpression in 121 EC patients. In all these oncological settings, post-surgical histology was used as the reference standard. Finally, in AIM 5, the role of [18F]FDG PET-based convolutional neural networks (CNNs) in predicting Takayasu (TAK) arteritis flare-ups within 12 months from the scan was investigated. Results. AIM 1: PET-derived somatostatin-receptor density (SRD) was predictive for DAXX loss of expression before surgery (AUC=79.01%; cut-off=46.96), with an increase of one unit of SRD associated with approximately a 4% increase in the odds of DAXX LoE (p=0.002). AIM 2: Best accuracies for individual PET parameters and ML were: 61% (TLG) and 87% (ML) for myometrial invasion; 71% (SUVmax) and 79% (ML) for risk groups; 72% (TLG) and 83% (ML) for LN; 45% (SUVmax; SUVmean) and 73% (ML) for p53 expression. Overall, ML models consistently improved all the investigated predictions. AIM 3: [68Ga]Ga-DOTATOC PET qualitative examination of LN involvement provided bACC= 60% (SN= 24%, SP= 95%); the best-performing radiomic model provided a bACC= 70%, allowing to significantly increase detection SN (SN=77%, SP= 61%). AIM 4: Prediction of p53 hyperexpression achieved bACC=0.78 (SN=0.83, SP=0.64) with a stratified train/test split and bACC=0.60 (SN=SP=0.60) using Monte Carlo cross-validation. None of the tested oversampling, selection, or ML approaches improved results further. AIM 5: The proposed liver-based standardization approach for PET harmonization was the only method enabling complete comparison among scans from different tomographs. For the prediction of TAK flare-ups, the best CNN model achieved 82% accuracy, 85% precision of class 0, 62% precision of class 1, 38% recall, 94% specificity and 70% nMCC. Conclusions. This PhD project assessed the potential and challenges of quantitative image analysis, radiomics and AI in advancing personalized medicine. While demonstrating their value in improving disease prediction and characterization in both oncological (PanNETs, EC) and non-oncological (TAK) settings, it also highlighted critical issues, including the need for robust methodologies and the lack of standardization across many methodological approaches.
PICCHIO, MARIA
Università Vita-Salute San Raffaele
File in questo prodotto:
File Dimensione Formato  
Tesi_PhD_CB_15gen25_signed_signed.pdf

embargo fino al 04/03/2026

Dimensione 8.28 MB
Formato Adobe PDF
8.28 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/196363
Il codice NBN di questa tesi è URN:NBN:IT:UNISR-196363