This thesis explores the integration of advanced machine learning (ML) methodologies in addressing pivotal challenges in astrophysics, focusing on two main applications: the identification of gravitational strong lensing (SL) phenomena and the analysis of gamma-ray bursts (GRBs). Leveraging state-of-the-art ML and deep learning (DL) frameworks, we address challenges posed by the increasing volume and complexity of modern astronomical datasets. The first part of the work focuses on the detection and classification of strong gravitational lensing events on the galaxy cluster scale. Galaxy clusters are crucial to modern astrophysics and cosmology, serving as natural laboratories for studying galaxy formation, evolution, and the nature of dark matter (DM) through dynamical and gravitational lensing methods. As powerful lenses, clusters act as cosmic telescopes, enabling the detection of faint and distant sources. However, the extremely vast and complex datasets coming from next-generation surveys such as Euclid, the Vera Rubin Observatory, and the James Webb Space Telescope will demand advanced approaches like DL to uncover hidden correlations within multi-dimensional parameter spaces. As a first application, we developed a robust methodology for identifying and segmenting bright gravitational arcs in large-scale surveys, particularly for cluster-scale strong lensing events, using the Mask R-CNN framework, an advanced DL architecture widely utilised in computer vision. High-quality training datasets are generated using realistic SL simulations and spectroscopic data from galaxy clusters with well-constrained SL models. These simulations constitute the knowledge base used for training the Mask R-CNN. The trained networks demonstrated strong performances in detecting and classifying gravitational arcs within both simulated and real Euclid and Kilo-Degree Survey datasets. The results highlight the potential of DL to automate the discovery of SL events, providing valuable tools for studying DM distributions and constraining cosmological parameters. This thesis also presents the discovery, spectroscopic study, and preliminary SL model of a wide-separation candidate cluster-lensed quasar (QSO) system, identified by cross-correlating a bona fide sample of Gaia QSOs with a large galaxy cluster sample. Located in a relatively rich cluster at $z_{CL,spec} = 0.626$, the system exhibits a $17''.8^{''}$ angular separation between two QSO images, spectroscopically confirmed to be indistinguishable at $z_{QSO,spec} = 1.345$. The SL analysis highlights its potential for time-delay cosmography studies, enabling precise measurements of the cosmic expansion rate. Follow-up observations will further characterise this system, solidifying its status as one of the largest-separation lensed QSOs known to date. The second part investigates GRB, among the most energetic phenomena in the Universe. For the first time in GRB literature, we apply ML to optimise a stochastic pulse avalanche model for generating GRB light curves (LCs) (Stern+96). Using genetic algorithms, we optimise the model parameters to produce synthetic LC whose average behaviour closely resembles that of observed long GRBs, and fully replicate the diversity observed in real GRB populations. Our results suggest that GRB engines may operate as stochastic processes near a critical state. This optimised model provides a practical tool for simulating realistic GRB LC, crucial for next-generation experiments, and enhances our understanding of long GRB prompt emissions and their underlying physics. By combining advanced computational methods with astrophysical modelling and data, this thesis demonstrates the transformative potential of ML in addressing key challenges in observational cosmology and high-energy astrophysics, providing innovative solutions for the challenges posed by large-scale datasets and yielding new insights in astrophysics.

Questa tesi esplora l’integrazione di metodologie avanzate di machine learning (ML) per affrontare sfide cruciali in astrofisica, concentrandosi su due applicazioni: l’identificazione di fenomeni di lensing gravitazionale forte (SL) e l’analisi dei gamma-ray bursts (GRB). Sfruttando tecniche di ML e deep learning (DL), si affrontano le sfide poste dall’aumento del volume e della complessità dei moderni dataset astronomici. La prima parte del lavoro è dedicata al rilevamento di eventi di SL su scala di ammassi di galassie. Gli ammassi di galassie rivestono un ruolo fondamentale in astrofisica e cosmologia, fungendo da laboratori naturali per lo studio della formazione ed evoluzione delle galassie e della natura della materia oscura (DM). Tuttavia, l’enorme quantità e complessità dei dati provenienti dalle nuove generazioni di survey, come Euclid, il Vera Rubin Observatory, e il James Webb Space Telescope, richiederanno approcci avanzati come il DL per individuare correlazioni nascoste all’interno di spazi dei parametri multi-dimensionali. Come prima applicazione, abbiamo sviluppato una metodologia per l’identificazione e la segmentazione di archi gravitazionali in survey su larga scala, in particolare per eventi di SL su scala di ammasso, utilizzando il framework Mask R-CNN, un’architettura avanzata di DL. I dataset di training sono stati generati tramite simulazioni di SL e dati spettroscopici di ammassi di galassie, sfruttando modelli di SL ben vincolati. Queste simulazioni costituiscono la knowledge base utilizzata per l’addestramento della Mask R-CNN. Le reti addestrate hanno mostrato ottime prestazioni nel rilevamento di archi gravitazionali all’interno di dataset simulati e reali (Euclid e Kilo-Degree Survey). I risultati evidenziano il potenziale del DL nell’automatizzare la scoperta di eventi di SL, fornendo strumenti preziosi per lo studio della distribuzione di DM e la determinazione dei parametri cosmologici. Questa tesi presenta anche la scoperta, lo studio spettroscopico e il modello preliminare di SL di un candidato quasar (QSO) lensato da un ammasso di galassie, identificato tramite correlazione di un campione di QSOs di Gaia con un campione di ammassi di galassie. Situato in un ammasso relativamente ricco a z_CL = 0.626, il sistema mostra una elevata separazione angolare di 17.8'' tra due immagini del QSO, confermate spettroscopicamente come indistinguibili a z_QSO = 1.345. L’analisi di SL ne evidenzia il potenziale per studi di cosmografia basati sulla misura di ritardi temporali, consentendo misurazioni precise di H_0. Osservazioni future permetteranno di caratterizzare ulteriormente questo sistema, consolidandone lo status come uno dei QSO lensati con la maggiore separazione angolare conosciuti. La seconda parte della tesi è dedicata ai GRB. Per la prima volta in letteratura, si applica il ML per ottimizzare un modello stocastico pulse avalanche per la generazione di curve di luce (LC) dei GRBs, proposto da Stern and Svensson (1996). Utilizzando algoritmi genetici, ottimizziamo i parametri del modello per produrre LC sintetiche il cui comportamento medio riproduce fedelmente quello dei long GRB osservati, replicando la diversità delle popolazioni reali di GRB. I nostri risultati suggeriscono che i motori dei GRBs possano operare come processi stocastici in prossimità di uno stato critico. Questo modello ottimizzato rappresenta uno strumento pratico per la simulazione di LC realistiche di GRBs, un aspetto cruciale per gli esperimenti di prossima generazione, e contribuisce a migliorare la comprensione della fisica alla base dei long GRBs. Combinando metodi computazionali avanzati con modellizzazione astrofisica, questa tesi dimostra il potenziale del ML nell’affrontare sfide chiave in cosmologia osservativa e astrofisica delle alte energie, offrendo soluzioni innovative ai problemi posti dai vasti dataset e aprendo nuove prospettive nello studio dell’Universo.

From Gravitational Lensing to Gamma-Ray Bursts or: How I Learned to Stop Worrying and Rely on Machine Learning

BAZZANINI, LORENZO
2025

Abstract

This thesis explores the integration of advanced machine learning (ML) methodologies in addressing pivotal challenges in astrophysics, focusing on two main applications: the identification of gravitational strong lensing (SL) phenomena and the analysis of gamma-ray bursts (GRBs). Leveraging state-of-the-art ML and deep learning (DL) frameworks, we address challenges posed by the increasing volume and complexity of modern astronomical datasets. The first part of the work focuses on the detection and classification of strong gravitational lensing events on the galaxy cluster scale. Galaxy clusters are crucial to modern astrophysics and cosmology, serving as natural laboratories for studying galaxy formation, evolution, and the nature of dark matter (DM) through dynamical and gravitational lensing methods. As powerful lenses, clusters act as cosmic telescopes, enabling the detection of faint and distant sources. However, the extremely vast and complex datasets coming from next-generation surveys such as Euclid, the Vera Rubin Observatory, and the James Webb Space Telescope will demand advanced approaches like DL to uncover hidden correlations within multi-dimensional parameter spaces. As a first application, we developed a robust methodology for identifying and segmenting bright gravitational arcs in large-scale surveys, particularly for cluster-scale strong lensing events, using the Mask R-CNN framework, an advanced DL architecture widely utilised in computer vision. High-quality training datasets are generated using realistic SL simulations and spectroscopic data from galaxy clusters with well-constrained SL models. These simulations constitute the knowledge base used for training the Mask R-CNN. The trained networks demonstrated strong performances in detecting and classifying gravitational arcs within both simulated and real Euclid and Kilo-Degree Survey datasets. The results highlight the potential of DL to automate the discovery of SL events, providing valuable tools for studying DM distributions and constraining cosmological parameters. This thesis also presents the discovery, spectroscopic study, and preliminary SL model of a wide-separation candidate cluster-lensed quasar (QSO) system, identified by cross-correlating a bona fide sample of Gaia QSOs with a large galaxy cluster sample. Located in a relatively rich cluster at $z_{CL,spec} = 0.626$, the system exhibits a $17''.8^{''}$ angular separation between two QSO images, spectroscopically confirmed to be indistinguishable at $z_{QSO,spec} = 1.345$. The SL analysis highlights its potential for time-delay cosmography studies, enabling precise measurements of the cosmic expansion rate. Follow-up observations will further characterise this system, solidifying its status as one of the largest-separation lensed QSOs known to date. The second part investigates GRB, among the most energetic phenomena in the Universe. For the first time in GRB literature, we apply ML to optimise a stochastic pulse avalanche model for generating GRB light curves (LCs) (Stern+96). Using genetic algorithms, we optimise the model parameters to produce synthetic LC whose average behaviour closely resembles that of observed long GRBs, and fully replicate the diversity observed in real GRB populations. Our results suggest that GRB engines may operate as stochastic processes near a critical state. This optimised model provides a practical tool for simulating realistic GRB LC, crucial for next-generation experiments, and enhances our understanding of long GRB prompt emissions and their underlying physics. By combining advanced computational methods with astrophysical modelling and data, this thesis demonstrates the transformative potential of ML in addressing key challenges in observational cosmology and high-energy astrophysics, providing innovative solutions for the challenges posed by large-scale datasets and yielding new insights in astrophysics.
8-apr-2025
Inglese
Questa tesi esplora l’integrazione di metodologie avanzate di machine learning (ML) per affrontare sfide cruciali in astrofisica, concentrandosi su due applicazioni: l’identificazione di fenomeni di lensing gravitazionale forte (SL) e l’analisi dei gamma-ray bursts (GRB). Sfruttando tecniche di ML e deep learning (DL), si affrontano le sfide poste dall’aumento del volume e della complessità dei moderni dataset astronomici. La prima parte del lavoro è dedicata al rilevamento di eventi di SL su scala di ammassi di galassie. Gli ammassi di galassie rivestono un ruolo fondamentale in astrofisica e cosmologia, fungendo da laboratori naturali per lo studio della formazione ed evoluzione delle galassie e della natura della materia oscura (DM). Tuttavia, l’enorme quantità e complessità dei dati provenienti dalle nuove generazioni di survey, come Euclid, il Vera Rubin Observatory, e il James Webb Space Telescope, richiederanno approcci avanzati come il DL per individuare correlazioni nascoste all’interno di spazi dei parametri multi-dimensionali. Come prima applicazione, abbiamo sviluppato una metodologia per l’identificazione e la segmentazione di archi gravitazionali in survey su larga scala, in particolare per eventi di SL su scala di ammasso, utilizzando il framework Mask R-CNN, un’architettura avanzata di DL. I dataset di training sono stati generati tramite simulazioni di SL e dati spettroscopici di ammassi di galassie, sfruttando modelli di SL ben vincolati. Queste simulazioni costituiscono la knowledge base utilizzata per l’addestramento della Mask R-CNN. Le reti addestrate hanno mostrato ottime prestazioni nel rilevamento di archi gravitazionali all’interno di dataset simulati e reali (Euclid e Kilo-Degree Survey). I risultati evidenziano il potenziale del DL nell’automatizzare la scoperta di eventi di SL, fornendo strumenti preziosi per lo studio della distribuzione di DM e la determinazione dei parametri cosmologici. Questa tesi presenta anche la scoperta, lo studio spettroscopico e il modello preliminare di SL di un candidato quasar (QSO) lensato da un ammasso di galassie, identificato tramite correlazione di un campione di QSOs di Gaia con un campione di ammassi di galassie. Situato in un ammasso relativamente ricco a z_CL = 0.626, il sistema mostra una elevata separazione angolare di 17.8'' tra due immagini del QSO, confermate spettroscopicamente come indistinguibili a z_QSO = 1.345. L’analisi di SL ne evidenzia il potenziale per studi di cosmografia basati sulla misura di ritardi temporali, consentendo misurazioni precise di H_0. Osservazioni future permetteranno di caratterizzare ulteriormente questo sistema, consolidandone lo status come uno dei QSO lensati con la maggiore separazione angolare conosciuti. La seconda parte della tesi è dedicata ai GRB. Per la prima volta in letteratura, si applica il ML per ottimizzare un modello stocastico pulse avalanche per la generazione di curve di luce (LC) dei GRBs, proposto da Stern and Svensson (1996). Utilizzando algoritmi genetici, ottimizziamo i parametri del modello per produrre LC sintetiche il cui comportamento medio riproduce fedelmente quello dei long GRB osservati, replicando la diversità delle popolazioni reali di GRB. I nostri risultati suggeriscono che i motori dei GRBs possano operare come processi stocastici in prossimità di uno stato critico. Questo modello ottimizzato rappresenta uno strumento pratico per la simulazione di LC realistiche di GRBs, un aspetto cruciale per gli esperimenti di prossima generazione, e contribuisce a migliorare la comprensione della fisica alla base dei long GRBs. Combinando metodi computazionali avanzati con modellizzazione astrofisica, questa tesi dimostra il potenziale del ML nell’affrontare sfide chiave in cosmologia osservativa e astrofisica delle alte energie, offrendo soluzioni innovative ai problemi posti dai vasti dataset e aprendo nuove prospettive nello studio dell’Universo.
ROSATI, Piero
GUIDORZI, Cristiano
LENISA, Paolo
Università degli studi di Ferrara
File in questo prodotto:
File Dimensione Formato  
Bazzanini L.pdf

accesso aperto

Dimensione 41.11 MB
Formato Adobe PDF
41.11 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/218631
Il codice NBN di questa tesi è URN:NBN:IT:UNIFE-218631