Nel campo della spettroscopia e della fotometria, la mole di dati prodotta dalle survey sta aumentando molto velocemente, e continuerà a farlo sempre più nei prossimi anni. Un'analisi che estragga informazioni in tempi utili può essere affidata a metodi automatici sviluppati utilizzando tecniche statistiche e della scienza computazionale. Questo lavoro presenta lo sviluppo e l'applicazione di due metodi automatici. La tesi `e divisa in due parti. La prima parte riporta l'utilizzo dell'algoritmo MATISSE, sviluppato all'Observatoire de la Cote d'Azur, e della pipeline AMBRE per la parametrizzazione di ~ 126 000 spettri prodotti dallo spettrografo ESO:HARPS. I parametri estratti da MATISSE sono temperatura effettiva, gravità, metallicità e abbondanza di elementi α, completi di errori. Il sottoinsieme di parametri che ha superato i criteri di qualità definiti per il campione, è stato confrontato con i risultati di lavori indipendenti mostrando un ottimo accordo. Inoltre, i risultati identificano la grande maggioranza delle stelle come di tipo spettrale G e K, in accordo con il tipo di oggetti osservato da HARPS. Questo conferma MATISSE come un ottimo algoritmo di parametrizzazione. La seconda parte è dedicata all'analisi di grandi quantità di dati fotometrici. Qui è descritto lo sviluppo di un classificatore di supernovae e la sua applicazione a curve di luce simulate. Il metodo è sviluppato seguendo un approccio detto "data-driven'', in cui si cerca di estrarre dai dati tutta l'informazione necessaria a risolvere il problema, affidandosi al minor numero possibile di assunzioni. A questo scopo, il metodo fa affidamento a tecniche del "machine learning'', in grado di far apprendere a un computer la regola che trasforma l'input nell'output usando campioni di esempio. Nello specifico vengono utilizzati i processi gaussiani per l'interpolazione delle curve di luce, le "diffusion maps'' per la parametrizzazione e le "random forest'' per costruire il classificatore vero e proprio. Lo scopo è quello di replicare la classificazione spettroscopica nei tre tipi Ia, Ib/c e II usando solo curve di luce. In questo il metodo fallisce, non riuscendo a classificare le Ib/c in maniera soddisfacente. La causa maggiore è da ricercarsi nell'insieme di esempi disponibili, non rappresentativo della popolazione di supernovae osservata. Invece, confrontato con risultati indipendenti, il metodo presentato risulta competitivo nell'identificazione delle supernovae Ia.

MACHINE LEARNING AND ADVANCED STATISTICS IN ASTRONOMY: TWO APPLICATIONS

DE PASCALE, MARCO
2015

Abstract

Nel campo della spettroscopia e della fotometria, la mole di dati prodotta dalle survey sta aumentando molto velocemente, e continuerà a farlo sempre più nei prossimi anni. Un'analisi che estragga informazioni in tempi utili può essere affidata a metodi automatici sviluppati utilizzando tecniche statistiche e della scienza computazionale. Questo lavoro presenta lo sviluppo e l'applicazione di due metodi automatici. La tesi `e divisa in due parti. La prima parte riporta l'utilizzo dell'algoritmo MATISSE, sviluppato all'Observatoire de la Cote d'Azur, e della pipeline AMBRE per la parametrizzazione di ~ 126 000 spettri prodotti dallo spettrografo ESO:HARPS. I parametri estratti da MATISSE sono temperatura effettiva, gravità, metallicità e abbondanza di elementi α, completi di errori. Il sottoinsieme di parametri che ha superato i criteri di qualità definiti per il campione, è stato confrontato con i risultati di lavori indipendenti mostrando un ottimo accordo. Inoltre, i risultati identificano la grande maggioranza delle stelle come di tipo spettrale G e K, in accordo con il tipo di oggetti osservato da HARPS. Questo conferma MATISSE come un ottimo algoritmo di parametrizzazione. La seconda parte è dedicata all'analisi di grandi quantità di dati fotometrici. Qui è descritto lo sviluppo di un classificatore di supernovae e la sua applicazione a curve di luce simulate. Il metodo è sviluppato seguendo un approccio detto "data-driven'', in cui si cerca di estrarre dai dati tutta l'informazione necessaria a risolvere il problema, affidandosi al minor numero possibile di assunzioni. A questo scopo, il metodo fa affidamento a tecniche del "machine learning'', in grado di far apprendere a un computer la regola che trasforma l'input nell'output usando campioni di esempio. Nello specifico vengono utilizzati i processi gaussiani per l'interpolazione delle curve di luce, le "diffusion maps'' per la parametrizzazione e le "random forest'' per costruire il classificatore vero e proprio. Lo scopo è quello di replicare la classificazione spettroscopica nei tre tipi Ia, Ib/c e II usando solo curve di luce. In questo il metodo fallisce, non riuscendo a classificare le Ib/c in maniera soddisfacente. La causa maggiore è da ricercarsi nell'insieme di esempi disponibili, non rappresentativo della popolazione di supernovae osservata. Invece, confrontato con risultati indipendenti, il metodo presentato risulta competitivo nell'identificazione delle supernovae Ia.
30-lug-2015
Inglese
supernova, photometric classification, machine learning, statistics, big data
Università degli studi di Padova
121
File in questo prodotto:
File Dimensione Formato  
depascale_phd_thesis.pdf

accesso aperto

Dimensione 12.33 MB
Formato Adobe PDF
12.33 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/173114
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-173114