I dati che saranno acquisiti dalla missione spaziale Gaia consentiranno di compilare un catalogo contenente circa un miliardo di stelle. Alla luce di questo enorme afflusso di dati, è cruciale poter disporre di un modello di classificazione efficiente. L’obiettivo di questa tesi, in particolare, è sviluppare dei modelli adeguati per la classificazione delle stelle variabili in base ai dati che saranno forniti dalla missione spaziale Gaia. Il primo contributo della tesi è lo sviluppo di un modello di classificazione a due stadi, detto modello Two Stage Dirichlet Mixture (TSDM), basato su delle misture finite di distribuzioni Dirichlet. Abbiamo validato questo modello su un sottogruppo ben studiato di stelle variabili riportate nel catalogo Hipparcos in analogia a quanto fatto da Dubath et al. (2011). Proponiamo, inoltre, due diverse trasformazioni delle caratteristiche utilizzate per la classificazione, che ci consentono di utilizzare per l’appunto la distribuzione di Dirichlet il cui supporto è un simplesso. L’adeguatezza di queste trasformazioni è stata vagliata con i dati selezionati, evidenziando una capacità di corretta classificazione delle stelle variabili considerate del 69.3%. In secondo luogo, abbiamo introdotto un’estensione del modello TSDM, detta modello a sfondo fisso (FB), il cui scopo è identificare nuove classi di stelle variabili. La nostra proposta si basa sul modello per la classificazione semi supervisionata sviluppato da Vatanen et al. (2012) per l’identificazione di anomalie. Il modello FB, in particolare, combina il modello TSDM, usato per rappresentare le classi già note (il cosiddetto sfondo), con una mistura finita di distribuzioni di Dirichlet che rappresenta la nuova classe. Abbiamo vagliato il modello proposto assumendo uno scenario in cui la classe Beta Cephei (BCEP) rappresenta l’anomalia, conseguendo una sensibilità del 77%. il terzo contributo della tesi valuta la fattiblità di una classificazione di stelle Bayesiana supervisionata tramite l’utilizzo di misture di distribuzioni di Dirichlet. In particolare, proponiamo una possibile distribuzione a priori coniugata per il modello.
Finite Dirichlet mixture models for classification and detection of new classes of variable stars
JOHN, PRINCE
2018
Abstract
I dati che saranno acquisiti dalla missione spaziale Gaia consentiranno di compilare un catalogo contenente circa un miliardo di stelle. Alla luce di questo enorme afflusso di dati, è cruciale poter disporre di un modello di classificazione efficiente. L’obiettivo di questa tesi, in particolare, è sviluppare dei modelli adeguati per la classificazione delle stelle variabili in base ai dati che saranno forniti dalla missione spaziale Gaia. Il primo contributo della tesi è lo sviluppo di un modello di classificazione a due stadi, detto modello Two Stage Dirichlet Mixture (TSDM), basato su delle misture finite di distribuzioni Dirichlet. Abbiamo validato questo modello su un sottogruppo ben studiato di stelle variabili riportate nel catalogo Hipparcos in analogia a quanto fatto da Dubath et al. (2011). Proponiamo, inoltre, due diverse trasformazioni delle caratteristiche utilizzate per la classificazione, che ci consentono di utilizzare per l’appunto la distribuzione di Dirichlet il cui supporto è un simplesso. L’adeguatezza di queste trasformazioni è stata vagliata con i dati selezionati, evidenziando una capacità di corretta classificazione delle stelle variabili considerate del 69.3%. In secondo luogo, abbiamo introdotto un’estensione del modello TSDM, detta modello a sfondo fisso (FB), il cui scopo è identificare nuove classi di stelle variabili. La nostra proposta si basa sul modello per la classificazione semi supervisionata sviluppato da Vatanen et al. (2012) per l’identificazione di anomalie. Il modello FB, in particolare, combina il modello TSDM, usato per rappresentare le classi già note (il cosiddetto sfondo), con una mistura finita di distribuzioni di Dirichlet che rappresenta la nuova classe. Abbiamo vagliato il modello proposto assumendo uno scenario in cui la classe Beta Cephei (BCEP) rappresenta l’anomalia, conseguendo una sensibilità del 77%. il terzo contributo della tesi valuta la fattiblità di una classificazione di stelle Bayesiana supervisionata tramite l’utilizzo di misture di distribuzioni di Dirichlet. In particolare, proponiamo una possibile distribuzione a priori coniugata per il modello.| File | Dimensione | Formato | |
|---|---|---|---|
|
ThesisFull_14Jan2018.pdf
accesso aperto
Licenza:
Tutti i diritti riservati
Dimensione
7.29 MB
Formato
Adobe PDF
|
7.29 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/85755
URN:NBN:IT:UNIPD-85755