È ormai opinione consolidata che lo stile di vita comporta risvolti e conseguenze sullo stato di salute generale di una persona. Tuttavia, meno consolidato e dimostrato è l'assunto che oltre ad uno stile di vita, rappresentato principalmente da alimentazione ed attività fisica, incidono anche variabili che si riferiscono all’ambito socio-economico. L’istruzione, la disoccupazione, il reddito, le disparità, la povertà, la criminalità, la situazione abitativa e l’intesa sociale ad esempio sono tutti elementi che possono influire sulla salute. Da questo punto di vista può risultare significativo esplorare variabili e relazioni statistiche tra lo stile di vita, il benessere e la qualità di vita della persona, fattori economici, sociali e di salute. Lo scopo è, attraverso l’applicazione di algoritmi statistici e di Machine Learning (ML), ricercare pattern, relazioni, correlazioni, causalità tra le differenti variabili socio-economiche. Nello stato dell’arte corrente algoritmi di ML permettono di identificare nuovi segnali predittivi dell’insorgenza di alcune malattie o di individuare correlazioni non ancora note fra i risultati di diversi esami clinici comunemente prescritti, patologie e farmaci somministrati. Una medicina predittiva e preventiva abilita anche ad una personalizzazione terapeutica e comportamentale. Una presa di coscienza del paziente può renderlo partecipe e consapevole nella facoltà di poter modificare la sua condotta di vita in una fase anticipatoria, o nelle fasi iniziali di malattia di condividere il processo di cura con il medico che lo assiste. L’analisi proposta deve essere effettuata, seppur in maniera sperimentale, prototipale e circostanziata, allo stato attuale del contesto sanitario italiano, delle tecnologie, delle organizzazioni e delle normative esistenti sul trattamento dei dati. Il progetto descritto da questa tesi è quello di realizzare un prototipo di sistema che permetta di predirre i fattori di rischio per la salute andando a ricercare causalità e correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale. Il raggiungimento di questo obbiettivo dipende dalla realizzazione di alcuni punti essenziali: • individuazione di una sorgente dati clinico-medica di partenza (Electronic Health Record); • organizzazione e persone; • metodi e strumenti tecnologici per la raccolta dei dati socio-economici; • pre-elaborazione e allineamento dati clinici e socio-economici; • costruzione dataset clinico e socio economico; • analisi statistica ed approcci di ML per ricercare causalità e correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale. Come primo step, la tesi mira a cogliere le difficoltà e problematiche per collezionare un dataset clinico e socio-economico. I risultati preliminari, dell’analisi statistica ed approcci di ML su questo dataset eterogeneo, possono gettare le basi allo sviluppo di un sistema clinico di supporto alle decisioni che ha come obiettivo quello di erogare una medicina preventiva. I contributi di questo lavoro rispetto allo stato dell’arte sono: • Realizzazione di un dataset intersezione di ambiti, in particolare medico-socio economico, su cui effettuare studi longitudinali. Il dataset è stato costruito estrapolando le informazioni degli EHR di medicina generale dei medici di famiglia, unite a variabili sociali, ispirate e riconducibili agli indici per il Benessere Equo e Sostenibile (BES) definiti dall'ISTAT; • Analisi statistica su variabili cliniche e socio economiche (tra lo stile di vita, il benessere e la qualità di vita della persona e fattori economici, sociali e di salute) per individuare correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale; • Stima preliminare di un sub-indice di età biologica con un modello di ML. I pre-dittori vengono ricavati dagli indicatori sullo stile di vita e dalle caratteristichecliniche dei pazienti estratte dall’EHR proposto. L'analisi ed il confronto simultaneo delle correlazioni applicato al dataset di relazione realizzato, evidenzia, per alcune variabili socio-economiche, una significativa correlazione con le variabili di tipo cliniche. I coefficienti risultano particolarmente elevati se calcolati per fasce di età, oltre i 50 anni e soprattutto nel cluster 50-60 anni. La Retta per circolo sportivo e la Soddisfazione economica hanno un’alta correlazione inversa (negativa) con la prescrizione dei farmaci: un alto numero di farmaci prescritti è correlato con l’assenza della retta per il circolo sportivo e una bassa soddisfazione economica. Più esiti di esami diagnostici prescritti corrispondono ad una bassa fiducia generalizzata nelle persone.
Progettazione e analisi di EHR territoriali ed eterogenei per analisi socio-sanitarie
2021
Abstract
È ormai opinione consolidata che lo stile di vita comporta risvolti e conseguenze sullo stato di salute generale di una persona. Tuttavia, meno consolidato e dimostrato è l'assunto che oltre ad uno stile di vita, rappresentato principalmente da alimentazione ed attività fisica, incidono anche variabili che si riferiscono all’ambito socio-economico. L’istruzione, la disoccupazione, il reddito, le disparità, la povertà, la criminalità, la situazione abitativa e l’intesa sociale ad esempio sono tutti elementi che possono influire sulla salute. Da questo punto di vista può risultare significativo esplorare variabili e relazioni statistiche tra lo stile di vita, il benessere e la qualità di vita della persona, fattori economici, sociali e di salute. Lo scopo è, attraverso l’applicazione di algoritmi statistici e di Machine Learning (ML), ricercare pattern, relazioni, correlazioni, causalità tra le differenti variabili socio-economiche. Nello stato dell’arte corrente algoritmi di ML permettono di identificare nuovi segnali predittivi dell’insorgenza di alcune malattie o di individuare correlazioni non ancora note fra i risultati di diversi esami clinici comunemente prescritti, patologie e farmaci somministrati. Una medicina predittiva e preventiva abilita anche ad una personalizzazione terapeutica e comportamentale. Una presa di coscienza del paziente può renderlo partecipe e consapevole nella facoltà di poter modificare la sua condotta di vita in una fase anticipatoria, o nelle fasi iniziali di malattia di condividere il processo di cura con il medico che lo assiste. L’analisi proposta deve essere effettuata, seppur in maniera sperimentale, prototipale e circostanziata, allo stato attuale del contesto sanitario italiano, delle tecnologie, delle organizzazioni e delle normative esistenti sul trattamento dei dati. Il progetto descritto da questa tesi è quello di realizzare un prototipo di sistema che permetta di predirre i fattori di rischio per la salute andando a ricercare causalità e correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale. Il raggiungimento di questo obbiettivo dipende dalla realizzazione di alcuni punti essenziali: • individuazione di una sorgente dati clinico-medica di partenza (Electronic Health Record); • organizzazione e persone; • metodi e strumenti tecnologici per la raccolta dei dati socio-economici; • pre-elaborazione e allineamento dati clinici e socio-economici; • costruzione dataset clinico e socio economico; • analisi statistica ed approcci di ML per ricercare causalità e correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale. Come primo step, la tesi mira a cogliere le difficoltà e problematiche per collezionare un dataset clinico e socio-economico. I risultati preliminari, dell’analisi statistica ed approcci di ML su questo dataset eterogeneo, possono gettare le basi allo sviluppo di un sistema clinico di supporto alle decisioni che ha come obiettivo quello di erogare una medicina preventiva. I contributi di questo lavoro rispetto allo stato dell’arte sono: • Realizzazione di un dataset intersezione di ambiti, in particolare medico-socio economico, su cui effettuare studi longitudinali. Il dataset è stato costruito estrapolando le informazioni degli EHR di medicina generale dei medici di famiglia, unite a variabili sociali, ispirate e riconducibili agli indici per il Benessere Equo e Sostenibile (BES) definiti dall'ISTAT; • Analisi statistica su variabili cliniche e socio economiche (tra lo stile di vita, il benessere e la qualità di vita della persona e fattori economici, sociali e di salute) per individuare correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale; • Stima preliminare di un sub-indice di età biologica con un modello di ML. I pre-dittori vengono ricavati dagli indicatori sullo stile di vita e dalle caratteristichecliniche dei pazienti estratte dall’EHR proposto. L'analisi ed il confronto simultaneo delle correlazioni applicato al dataset di relazione realizzato, evidenzia, per alcune variabili socio-economiche, una significativa correlazione con le variabili di tipo cliniche. I coefficienti risultano particolarmente elevati se calcolati per fasce di età, oltre i 50 anni e soprattutto nel cluster 50-60 anni. La Retta per circolo sportivo e la Soddisfazione economica hanno un’alta correlazione inversa (negativa) con la prescrizione dei farmaci: un alto numero di farmaci prescritti è correlato con l’assenza della retta per il circolo sportivo e una bassa soddisfazione economica. Più esiti di esami diagnostici prescritti corrispondono ad una bassa fiducia generalizzata nelle persone.I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/132898
URN:NBN:IT:UNIVPM-132898