Artificial Intelligence (AI) is rapidly changing several aspects of our society simulating human cognitive functions. It is revolutionizing our lives across several domains including healthcare, public safety, transportation, and energy. The exponential growth of interest in AI is driven by the impressive outcomes achieved through advanced machine learning and deep learning techniques. Among the several applications of these methods, sensor networks have gained increasing attention given their widespread deployment in monitoring and control systems. The generation of massive amounts of data by sensor networks increased the need of novel algorithms able to monitoring and analysis, including pattern detection, anomaly identification, future trend prediction, and forecasting. However, these tasks, specifically the forecasting task, introduce several challenges due to the inherent complexity of the data generated by sensors. Sensors continuously produce spatio-temporal data introducing dependencies that traditional approaches often struggle to capture adequately. The spatial proximity of sensors leads to spatial autocorrelation phenomena, according to which nearby locations are not independent and should not be treated as such by the learning algorithms. Additionally, the temporal dimension introduces temporal autocorrelation due to the cyclicity of days of the year and the seasons. Moreover, in many real-world scenarios, observations exhibit a combination of linear and non-linear characteristics. This complexity poses significant challenges for traditional time series models, which can capture either linear or non-linear patterns but often fail to capture combinations thereof. A further complication comes from possible sensor failures, communication problems, and error measurements that lead to noise and missing values. Finally, it is important to note that real-world data are often interconnected: data from different entities are interrelated, with complex relationships between different entities that can significantly influence the future values of time series. This interconnection leads to another form of autocorrelation, called relational autocorrelation or network autocorrelation, which occurs when the value of an attribute is influenced by the values observed at neighboring nodes of the network. In particular, in time series forecasting, relational autocorrelation refers to the dependency between the values of the same attribute across linked instances over time. Capturing these relationships should generally lead to an increased accuracy of the learned models. This thesis considers all these aspects proposing novel approaches for forecasting time series data generated by sensor networks. Particular focus is dedicated to smart grids and renewable energy plants. The focus on this application domain is motivated by the fact that models able to forecast the energy production or consumption may play a fundamental role in the modern society. In long-term scenarios, they can support planning interventions on the network, aiming not only to decrease production costs but also to contribute to the reduction of greenhouse gas emissions. In short-term scenarios, the forecasting of energy can be useful for performing real-time load balancing actions, including powering on backup plants or drawing energy from customers’ accumulators, as well as determining the final electricity clearing price for the energy market in advance. In this context, the thesis presents four approaches to face the challenges of forecasting future measurements from multiple geolocated sensors.

L'Intelligenza Artificiale sta trasformando la società simulando funzioni cognitive umane in settori come sanità, sicurezza, trasporti ed energia. Il crescente interesse per l'IA è alimentato dai risultati straordinari ottenuti attraverso l'utilizzo di tecniche avanzate di apprendimento automatico e deep learning. In questo contesto, le reti di sensori hanno acquisito grande importanza grazie alla loro diffusa implementazione nei sistemi di monitoraggio e controllo. La grande quantità di dati generata dalle reti di sensori ha portato allo sviluppo di nuovi algoritmi per il monitoraggio e l'analisi. Questi includono il riconoscimento di pattern, l'identificazione di anomalie e la predizione di tendenze future. Tuttavia, questi task, in particolare quello della predizione dei valori futuri, introduce numerose sfide a causa della complessità dei dati generati dai sensori. I sensori producono continuamente dati spazio-temporali introducendo delle dipendenze, difficili da cattuare con approcci tradizionali. La prossimità spaziale dei sensori genera il fenomeno di autocorrelazione spaziale, secondo il quale le posizioni vicine non sono indipendenti e non dovrebbero essere trattate come tali dagli algoritmi di apprendimento. Anche la dimensione temporale introduce l'autocorrelazione temporale dovuta alla ciclicità dei giorni dell'anno e delle stagioni. Inoltre, in molti scenari reali, i dati presentano una combinazione di caratteristiche lineari e non lineari. Tale complessità sfida i modelli tradizionali di serie temporali, efficaci nell'identificare pattern lineari o non lineari separatamente, ma spesso inadeguati nel gestirli simultaneamente. Inoltre, guasti dei sensori, problemi di comunicazione ed errori di misurazione possono generare rumore e dati mancanti nei rilevamenti. Infine, è importante notare che i dati reali sono tipicamente interconnessi, con relazioni complesse tra diverse entità che influenzano l'evoluzione delle serie temporali. Questa caratteristica genera un'ulteriore forma di autocorrelazione - nota come autocorrelazione di rete o relazionale, dove i valori di un attributo sono influenzati dai nodi vicini nella rete. Nella predizione di serie temporali, l'autocorrelazione relazionale è definita come la dipendenza nel tempo tra valori dello stesso attributo tra istanze collegate. L'integrazione di queste relazioni nei modelli migliora generalmente l'accuratezza predittiva. Questa tesi considera tutti questi aspetti proponendo nuovi approcci per la predizione di dati di serie temporali generati da reti di sensori. Un attenzione particolare è dedicata alle smart grid e agli impianti di energia rinnovabile. L'attenzione su questo dominio applicativo è motivata dal contributo fondamentale dei modelli in grado di prevedere la produzione o il consumo di energia nella società moderna. In scenari a lungo termine, possono supportare la pianificazione di interventi sulla rete, mirando non solo a diminuire i costi di produzione ma anche a contribuire alla riduzione delle emissioni di gas serra. In scenari a breve termine, la predizione dell'energia può essere utile per eseguire azioni di bilanciamento del carico in tempo reale, come l'accensione di impianti di backup o il prelievo di energia dagli accumulatori dei clienti, nonché determinare in anticipo il prezzo finale dell'elettricità per il mercato dell'energia. In questo contesto, la tesi presenta quattro approcci per affrontare le sfide della predizione di misurazioni future da sensori geolocalizzati.

Modellazione dell'informazione spaziale, temporale e relazionale per risolvere task di forecasting e nowcasting

D'AVERSA, ANNUNZIATA
2025

Abstract

Artificial Intelligence (AI) is rapidly changing several aspects of our society simulating human cognitive functions. It is revolutionizing our lives across several domains including healthcare, public safety, transportation, and energy. The exponential growth of interest in AI is driven by the impressive outcomes achieved through advanced machine learning and deep learning techniques. Among the several applications of these methods, sensor networks have gained increasing attention given their widespread deployment in monitoring and control systems. The generation of massive amounts of data by sensor networks increased the need of novel algorithms able to monitoring and analysis, including pattern detection, anomaly identification, future trend prediction, and forecasting. However, these tasks, specifically the forecasting task, introduce several challenges due to the inherent complexity of the data generated by sensors. Sensors continuously produce spatio-temporal data introducing dependencies that traditional approaches often struggle to capture adequately. The spatial proximity of sensors leads to spatial autocorrelation phenomena, according to which nearby locations are not independent and should not be treated as such by the learning algorithms. Additionally, the temporal dimension introduces temporal autocorrelation due to the cyclicity of days of the year and the seasons. Moreover, in many real-world scenarios, observations exhibit a combination of linear and non-linear characteristics. This complexity poses significant challenges for traditional time series models, which can capture either linear or non-linear patterns but often fail to capture combinations thereof. A further complication comes from possible sensor failures, communication problems, and error measurements that lead to noise and missing values. Finally, it is important to note that real-world data are often interconnected: data from different entities are interrelated, with complex relationships between different entities that can significantly influence the future values of time series. This interconnection leads to another form of autocorrelation, called relational autocorrelation or network autocorrelation, which occurs when the value of an attribute is influenced by the values observed at neighboring nodes of the network. In particular, in time series forecasting, relational autocorrelation refers to the dependency between the values of the same attribute across linked instances over time. Capturing these relationships should generally lead to an increased accuracy of the learned models. This thesis considers all these aspects proposing novel approaches for forecasting time series data generated by sensor networks. Particular focus is dedicated to smart grids and renewable energy plants. The focus on this application domain is motivated by the fact that models able to forecast the energy production or consumption may play a fundamental role in the modern society. In long-term scenarios, they can support planning interventions on the network, aiming not only to decrease production costs but also to contribute to the reduction of greenhouse gas emissions. In short-term scenarios, the forecasting of energy can be useful for performing real-time load balancing actions, including powering on backup plants or drawing energy from customers’ accumulators, as well as determining the final electricity clearing price for the energy market in advance. In this context, the thesis presents four approaches to face the challenges of forecasting future measurements from multiple geolocated sensors.
1-apr-2025
Inglese
L'Intelligenza Artificiale sta trasformando la società simulando funzioni cognitive umane in settori come sanità, sicurezza, trasporti ed energia. Il crescente interesse per l'IA è alimentato dai risultati straordinari ottenuti attraverso l'utilizzo di tecniche avanzate di apprendimento automatico e deep learning. In questo contesto, le reti di sensori hanno acquisito grande importanza grazie alla loro diffusa implementazione nei sistemi di monitoraggio e controllo. La grande quantità di dati generata dalle reti di sensori ha portato allo sviluppo di nuovi algoritmi per il monitoraggio e l'analisi. Questi includono il riconoscimento di pattern, l'identificazione di anomalie e la predizione di tendenze future. Tuttavia, questi task, in particolare quello della predizione dei valori futuri, introduce numerose sfide a causa della complessità dei dati generati dai sensori. I sensori producono continuamente dati spazio-temporali introducendo delle dipendenze, difficili da cattuare con approcci tradizionali. La prossimità spaziale dei sensori genera il fenomeno di autocorrelazione spaziale, secondo il quale le posizioni vicine non sono indipendenti e non dovrebbero essere trattate come tali dagli algoritmi di apprendimento. Anche la dimensione temporale introduce l'autocorrelazione temporale dovuta alla ciclicità dei giorni dell'anno e delle stagioni. Inoltre, in molti scenari reali, i dati presentano una combinazione di caratteristiche lineari e non lineari. Tale complessità sfida i modelli tradizionali di serie temporali, efficaci nell'identificare pattern lineari o non lineari separatamente, ma spesso inadeguati nel gestirli simultaneamente. Inoltre, guasti dei sensori, problemi di comunicazione ed errori di misurazione possono generare rumore e dati mancanti nei rilevamenti. Infine, è importante notare che i dati reali sono tipicamente interconnessi, con relazioni complesse tra diverse entità che influenzano l'evoluzione delle serie temporali. Questa caratteristica genera un'ulteriore forma di autocorrelazione - nota come autocorrelazione di rete o relazionale, dove i valori di un attributo sono influenzati dai nodi vicini nella rete. Nella predizione di serie temporali, l'autocorrelazione relazionale è definita come la dipendenza nel tempo tra valori dello stesso attributo tra istanze collegate. L'integrazione di queste relazioni nei modelli migliora generalmente l'accuratezza predittiva. Questa tesi considera tutti questi aspetti proponendo nuovi approcci per la predizione di dati di serie temporali generati da reti di sensori. Un attenzione particolare è dedicata alle smart grid e agli impianti di energia rinnovabile. L'attenzione su questo dominio applicativo è motivata dal contributo fondamentale dei modelli in grado di prevedere la produzione o il consumo di energia nella società moderna. In scenari a lungo termine, possono supportare la pianificazione di interventi sulla rete, mirando non solo a diminuire i costi di produzione ma anche a contribuire alla riduzione delle emissioni di gas serra. In scenari a breve termine, la predizione dell'energia può essere utile per eseguire azioni di bilanciamento del carico in tempo reale, come l'accensione di impianti di backup o il prelievo di energia dagli accumulatori dei clienti, nonché determinare in anticipo il prezzo finale dell'elettricità per il mercato dell'energia. In questo contesto, la tesi presenta quattro approcci per affrontare le sfide della predizione di misurazioni future da sensori geolocalizzati.
Machine Learning; Spazio-Temporale; ApproccioRelazionale
CECI, MICHELANGELO
PIO, GIANVITO
MAZZIA, Francesca
Università degli studi di Bari
File in questo prodotto:
File Dimensione Formato  
Annunziata D'Aversa_PhD_Thesis_signed.pdf

embargo fino al 01/04/2026

Dimensione 3.13 MB
Formato Adobe PDF
3.13 MB Adobe PDF
Annunziata D'Aversa_PhD_Thesis_signed_1.pdf

embargo fino al 01/04/2026

Dimensione 3.13 MB
Formato Adobe PDF
3.13 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/210176
Il codice NBN di questa tesi è URN:NBN:IT:UNIBA-210176