Background: The use of second-generation antipsychotics (SGAs) in children and adolescents has increased significantly, raising concerns about their metabolic safety. Insulin resistance (IR), a key mechanism in glucose dysregulation and cardiometabolic risk, can emerge early in treatment. While the Homeostasis Model Assessment for Insulin Resistance (HOMA-IR) is a validated index for detecting early dysfunction, no clinical tools currently exist to predict individual risk in this population Methods: We analyzed data from 521 SGA-treated children and adolescents, aged 4–19, in the SATIETY cohort. Supervised machine learning (ML) algorithms were trained to predict post-treatment HOMA-IR values using longitudinal data from anthropometric, biochemical, clinical, behavioral, and pharmacological domains. Model development involved nested cross-validation and comparison of six regression algorithms: Linear, Polynomial, Decision Tree, Random Forest, XGBoost, and Support Vector Regression (SVR). Feature importance was assessed using multivariate permutation and univariate SVR-based ranking. A reduced model using the top ten predictors was tested. Results: Support Vector Regression (SVR) with a radial basis function kernel showed the best performance. The full model (59 features) reached an R2 of 0.201 (RMSE = 2.977; MAE = 1.645). A compact model based on the top ten predictors identified by univariate SVR- based ranking achieved improved accuracy (R2 = 0.269, RMSE = 2.863, MAE = 1.545), representing a 34% relative increase in explained variance. Key predictors included fasting insulin, fat mass, BMI percentile, and leptin. Conclusions: This study showed that machine learning could support the prediction of IR in SGA-treated youth. A compact, interpretable model based on routine biomarkers achieved higher predictive accuracy than the full model, while substantially reducing input complexity. These results highlight the potential clinical utility of data-driven metabolic risk models to inform earlier and more personalized monitoring strategies in child psychiatry.

Contesto: L’uso di antipsicotici di seconda generazione (SGA) nei bambini e negli adolescenti è aumentato significativamente, sollevando preoccupazioni riguardo alla loro sicurezza metabolica. L'insulino resistenza(IR), un meccanismo chiave nella disregolazione del glucosio e nel rischio cardiometabolico, può emergere precocemente durante il trattamento. Sebbene l’indice HOMA-IR (Homeostasis Model Assessment for Insulin Resistance) sia un metodo validato per rilevare disfunzioni precoci, non esistono attualmente strumenti clinici in grado di prevedere il rischio individuale in questa popolazione. Metodi: Sono stati analizzati i dati di 521 bambini e adolescenti (di età compresa tra 4 e 19 anni) trattati con SGA, appartenenti alla coorte SATIETY. Algoritmi di apprendimento automatico supervisionato (machine learning, ML) sono stati addestrati per prevedere i valori di HOMA-IR post-trattamento, utilizzando dati longitudinali provenienti da domini antropometrici, biochimici, clinici, comportamentali e farmacologici. Lo sviluppo del modello ha previsto una nested cross-validation e il confronto tra sei algoritmi di regressione: Lineare, Polinomiale, Decision Tree, Random Forest, XGBoost e Support Vector Regression (SVR). L’importanza delle variabili è stata valutata mediante permutazione multivariata e classificazione univariata basata su SVR. È stato inoltre testato un modello ridotto contenente i dieci predittori principali. Risultati: La Support Vector Regression (SVR) con kernel a funzione di base radiale ha mostrato le migliori prestazioni. Il modello completo (59 variabili) ha raggiunto un R² di 0,201 (RMSE = 2,977; MAE = 1,645). Un modello compatto basato sui dieci predittori principali identificati con la classificazione univariata SVR ha ottenuto una precisione migliore (R² = 0,269; RMSE = 2,863; MAE = 1,545), rappresentando un incremento relativo del 34% nella varianza spiegata. I predittori chiave includevano insulina a digiuno, massa grassa, percentile di BMI e leptina. Conclusioni: Questo studio ha dimostrato che l’apprendimento automatico (machine learning) può supportare la previsione dell'insulino resistenza nei giovani trattati con SGA. Un modello compatto e interpretabile, basato su biomarcatori di routine, ha raggiunto una precisione predittiva superiore rispetto al modello completo, riducendo al contempo in modo sostanziale la complessità dei dati di input. Questi risultati evidenziano la potenziale utilità clinica di modelli di rischio metabolico basati sui dati per favorire un monitoraggio più precoce e personalizzato in psichiatria infantile.

Predicting Insulin Resistance in Youth Treated with Second-Generation Antipsychotics Using Machine Learning: A Nested Cross-Validation Study [Predire l'Insulino Resistenza in Giovani Trattati con Antipsicotici di Seconda Generazione attraverso il Machine Learning: Uno studio di Nested Cross Validation]

PETTINATO, FABIO SALVATORE
2026

Abstract

Background: The use of second-generation antipsychotics (SGAs) in children and adolescents has increased significantly, raising concerns about their metabolic safety. Insulin resistance (IR), a key mechanism in glucose dysregulation and cardiometabolic risk, can emerge early in treatment. While the Homeostasis Model Assessment for Insulin Resistance (HOMA-IR) is a validated index for detecting early dysfunction, no clinical tools currently exist to predict individual risk in this population Methods: We analyzed data from 521 SGA-treated children and adolescents, aged 4–19, in the SATIETY cohort. Supervised machine learning (ML) algorithms were trained to predict post-treatment HOMA-IR values using longitudinal data from anthropometric, biochemical, clinical, behavioral, and pharmacological domains. Model development involved nested cross-validation and comparison of six regression algorithms: Linear, Polynomial, Decision Tree, Random Forest, XGBoost, and Support Vector Regression (SVR). Feature importance was assessed using multivariate permutation and univariate SVR-based ranking. A reduced model using the top ten predictors was tested. Results: Support Vector Regression (SVR) with a radial basis function kernel showed the best performance. The full model (59 features) reached an R2 of 0.201 (RMSE = 2.977; MAE = 1.645). A compact model based on the top ten predictors identified by univariate SVR- based ranking achieved improved accuracy (R2 = 0.269, RMSE = 2.863, MAE = 1.545), representing a 34% relative increase in explained variance. Key predictors included fasting insulin, fat mass, BMI percentile, and leptin. Conclusions: This study showed that machine learning could support the prediction of IR in SGA-treated youth. A compact, interpretable model based on routine biomarkers achieved higher predictive accuracy than the full model, while substantially reducing input complexity. These results highlight the potential clinical utility of data-driven metabolic risk models to inform earlier and more personalized monitoring strategies in child psychiatry.
28-gen-2026
Inglese
Contesto: L’uso di antipsicotici di seconda generazione (SGA) nei bambini e negli adolescenti è aumentato significativamente, sollevando preoccupazioni riguardo alla loro sicurezza metabolica. L'insulino resistenza(IR), un meccanismo chiave nella disregolazione del glucosio e nel rischio cardiometabolico, può emergere precocemente durante il trattamento. Sebbene l’indice HOMA-IR (Homeostasis Model Assessment for Insulin Resistance) sia un metodo validato per rilevare disfunzioni precoci, non esistono attualmente strumenti clinici in grado di prevedere il rischio individuale in questa popolazione. Metodi: Sono stati analizzati i dati di 521 bambini e adolescenti (di età compresa tra 4 e 19 anni) trattati con SGA, appartenenti alla coorte SATIETY. Algoritmi di apprendimento automatico supervisionato (machine learning, ML) sono stati addestrati per prevedere i valori di HOMA-IR post-trattamento, utilizzando dati longitudinali provenienti da domini antropometrici, biochimici, clinici, comportamentali e farmacologici. Lo sviluppo del modello ha previsto una nested cross-validation e il confronto tra sei algoritmi di regressione: Lineare, Polinomiale, Decision Tree, Random Forest, XGBoost e Support Vector Regression (SVR). L’importanza delle variabili è stata valutata mediante permutazione multivariata e classificazione univariata basata su SVR. È stato inoltre testato un modello ridotto contenente i dieci predittori principali. Risultati: La Support Vector Regression (SVR) con kernel a funzione di base radiale ha mostrato le migliori prestazioni. Il modello completo (59 variabili) ha raggiunto un R² di 0,201 (RMSE = 2,977; MAE = 1,645). Un modello compatto basato sui dieci predittori principali identificati con la classificazione univariata SVR ha ottenuto una precisione migliore (R² = 0,269; RMSE = 2,863; MAE = 1,545), rappresentando un incremento relativo del 34% nella varianza spiegata. I predittori chiave includevano insulina a digiuno, massa grassa, percentile di BMI e leptina. Conclusioni: Questo studio ha dimostrato che l’apprendimento automatico (machine learning) può supportare la previsione dell'insulino resistenza nei giovani trattati con SGA. Un modello compatto e interpretabile, basato su biomarcatori di routine, ha raggiunto una precisione predittiva superiore rispetto al modello completo, riducendo al contempo in modo sostanziale la complessità dei dati di input. Questi risultati evidenziano la potenziale utilità clinica di modelli di rischio metabolico basati sui dati per favorire un monitoraggio più precoce e personalizzato in psichiatria infantile.
RAPISARDA, Andrea
Università degli studi di Catania
Catania
File in questo prodotto:
File Dimensione Formato  
Doctoral_thesis_FabioPettinato.pdf

embargo fino al 28/01/2027

Licenza: Tutti i diritti riservati
Dimensione 1.72 MB
Formato Adobe PDF
1.72 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/373923
Il codice NBN di questa tesi è URN:NBN:IT:UNICT-373923