Large-scale Stage IV galaxy surveys, including Euclid, aim to map the distribution of matter across unprecedented cosmic volumes, enabling high-precision tests of the standard ΛCDM cosmological model and its possible extensions. Meeting the scientific goals of these surveys, which are limited by systematic effects rather than statistical ones, requires large ensembles of accurate mock catalogs, thereby posing significant computational challenges. Full N -body simulations, while highly accurate, become prohibitively expensive when thousands of realizations are needed, motivating the increased interest in fast approximate methods that are both computationally efficient and scientifically reliable. This thesis focuses on the PINOCCHIO code, a Lagrangian Perturbation Theory-based approach for efficiently generating dark matter halo catalogs from an initial density field, and addresses two complementary research directions. First, we modernize and optimize key components of PINOCCHIO for execution on heterogeneous high-performance computing platforms. In particular, we port two of the main computational modules of the code to Graphics Processing Units using primarily OpenMP target directives, achieving portable performance across NVIDIA and AMD architectures. Detailed performance and roofline analyses demonstrate significant speed-ups relative to CPU-only implementations, achieving up to a ×8 speed up depending on the system. Energy-to-solution measurements, performed using a newly developed parallel version of the Power Measurement Toolkit, show reductions of up to a factor of ×8, relative to CPU-only executions, corresponding to an overall efficiency improvement of up to ×64. These results establish GPU offloading as an effective strategy for improving both performance and sustainability of large-scale cosmological simulation campaigns in the exascale era. Second, we present the first comprehensive validation of PINOCCHIO in underdense environments by assessing its ability to reproduce cosmic void statistics. Using matched initial conditions and number-density–matched halo catalogs, we compare PINOCCHIO with the full N -body code OpenGADGET3 across multiple redshifts and resolutions. We analyze several void summary statistics, including the void size function, void ellipticity function, core density function, and radial density profiles. Across all metrics, PINOCCHIO shows good agreement with the N -body results, with differences typically remaining within the ±10% level and below the 2σ significance threshold, and with no evidence of significant systematic biases. The level of agreement is comparable to that previously achieved for halo statistics in overdense regions, confirming the robustness of PINOCCHIO in the quasi-linear regime. Together, these results show that PINOCCHIO provides a computationally efficient and accurate framework for generating large ensembles of cosmological simulations. The code has been used to produce more than 4500 realizations designed to reproduce the Euclid spectroscopic galaxy sample, by populating dark matter halos with galaxies through a halo occupation distribution model calibrated on the Euclid Flagship simulation, supporting the galaxy clustering analyses of the Euclid Data Release 1. In addition, the validation of PINOCCHIO in underdense environments demonstrates its suitability for void-based analyses, extending its applicability beyond traditional halo statistics.
Osservazioni Stage IV della distribuzione di galassie su grande scala, tra cui Euclid, mirano a mappare la distribuzione della materia su volumi cosmici senza precedenti, permettendo test ad altissima precisione del modello cosmologico standard Lambda-CDM e delle sue possibili estensioni. Raggiungere gli obiettivi scientifici di queste survey, oggi limitati principalmente dagli effetti sistematici più che da quelli statistici, richiede grandi insiemi di cataloghi simulati accurati, ponendo quindi sfide computazionali significative. Le simulazioni N-body complete, pur essendo estremamente accurate, diventano proibitive quando sono necessarie migliaia di realizzazioni, motivando un crescente interesse verso metodi approssimati rapidi che siano al tempo stesso efficienti dal punto di vista computazionale e scientificamente affidabili. Questa tesi si concentra sul codice PINOCCHIO, un approccio basato sulla teoria delle perturbazioni lagrangiane per generare in modo efficiente cataloghi di aloni di materia oscura a partire da un campo di densità iniziale, e affronta due linee di ricerca complementari. In primo luogo, modernizziamo e ottimizziamo componenti chiave di PINOCCHIO per l’esecuzione su piattaforme eterogenee di calcolo ad alte prestazioni. In particolare, portiamo due dei principali moduli computazionali del codice su GPU utilizzando principalmente le direttive OpenMP target, ottenendo prestazioni portabili sia su architetture NVIDIA sia AMD. Analisi dettagliate delle prestazioni e di tipo roofline mostrano significativi aumenti di velocità rispetto alle implementazioni solo-CPU, con accelerazioni fino a un fattore 8 a seconda del sistema. Le misure di energia per soluzione, eseguite mediante una nuova versione parallela del Power Measurement Toolkit, mostrano riduzioni fino a un fattore 8 rispetto alle esecuzioni solo-CPU, corrispondenti a un miglioramento complessivo dell’efficienza fino a un fattore 64. Questi risultati stabiliscono l’offloading su GPU come una strategia efficace per migliorare sia le prestazioni sia la sostenibilità delle campagne di simulazione cosmologica su larga scala nell’era exascale. In secondo luogo, presentiamo la prima validazione completa di PINOCCHIO in ambienti sottodensi, valutandone la capacità di riprodurre le statistiche dei vuoti cosmici. Utilizzando condizioni iniziali abbinate e cataloghi di aloni con densità numerica equivalente, confrontiamo PINOCCHIO con un codice N-body completo su diversi redshift e risoluzioni. Analizziamo varie statistiche dei vuoti, tra cui la funzione di dimensione dei vuoti, la funzione di ellitticità, la funzione di densità del nucleo e i profili di densità radiale. Per tutte le metriche, PINOCCHIO mostra un buon accordo con i risultati N-body, con differenze che rimangono tipicamente entro il 10% e al di sotto della soglia di significatività di 2 sigma, senza evidenza di bias sistematici significativi. Il livello di accordo è paragonabile a quello precedentemente ottenuto per le statistiche degli aloni nelle regioni sovradense, confermando la robustezza di PINOCCHIO nel regime quasi-lineare. Nel loro insieme, questi risultati mostrano che PINOCCHIO fornisce un quadro computazionalmente efficiente e accurato per la generazione di grandi insiemi di simulazioni cosmologiche. Il codice è stato utilizzato per produrre oltre 4500 realizzazioni progettate per riprodurre il campione spettroscopico di galassie di Euclid, popolando gli aloni di materia oscura con galassie tramite un modello di halo occupation distribution calibrato sulla simulazione Euclid Flagship, a supporto delle analisi di clustering galattico del primo Data Release di Euclid. Inoltre, la validazione di PINOCCHIO in ambienti sottodensi ne dimostra l’idoneità per analisi basate sui vuoti, estendendone l’applicabilità oltre le statistiche tradizionali sugli aloni.
Simulazioni cosmologiche veloci con PINOCCHIO abilitato alle GPU: dagli aloni di materia oscura ai vuoti cosmici
LEPINZAN, MARIUS DANIEL
2026
Abstract
Large-scale Stage IV galaxy surveys, including Euclid, aim to map the distribution of matter across unprecedented cosmic volumes, enabling high-precision tests of the standard ΛCDM cosmological model and its possible extensions. Meeting the scientific goals of these surveys, which are limited by systematic effects rather than statistical ones, requires large ensembles of accurate mock catalogs, thereby posing significant computational challenges. Full N -body simulations, while highly accurate, become prohibitively expensive when thousands of realizations are needed, motivating the increased interest in fast approximate methods that are both computationally efficient and scientifically reliable. This thesis focuses on the PINOCCHIO code, a Lagrangian Perturbation Theory-based approach for efficiently generating dark matter halo catalogs from an initial density field, and addresses two complementary research directions. First, we modernize and optimize key components of PINOCCHIO for execution on heterogeneous high-performance computing platforms. In particular, we port two of the main computational modules of the code to Graphics Processing Units using primarily OpenMP target directives, achieving portable performance across NVIDIA and AMD architectures. Detailed performance and roofline analyses demonstrate significant speed-ups relative to CPU-only implementations, achieving up to a ×8 speed up depending on the system. Energy-to-solution measurements, performed using a newly developed parallel version of the Power Measurement Toolkit, show reductions of up to a factor of ×8, relative to CPU-only executions, corresponding to an overall efficiency improvement of up to ×64. These results establish GPU offloading as an effective strategy for improving both performance and sustainability of large-scale cosmological simulation campaigns in the exascale era. Second, we present the first comprehensive validation of PINOCCHIO in underdense environments by assessing its ability to reproduce cosmic void statistics. Using matched initial conditions and number-density–matched halo catalogs, we compare PINOCCHIO with the full N -body code OpenGADGET3 across multiple redshifts and resolutions. We analyze several void summary statistics, including the void size function, void ellipticity function, core density function, and radial density profiles. Across all metrics, PINOCCHIO shows good agreement with the N -body results, with differences typically remaining within the ±10% level and below the 2σ significance threshold, and with no evidence of significant systematic biases. The level of agreement is comparable to that previously achieved for halo statistics in overdense regions, confirming the robustness of PINOCCHIO in the quasi-linear regime. Together, these results show that PINOCCHIO provides a computationally efficient and accurate framework for generating large ensembles of cosmological simulations. The code has been used to produce more than 4500 realizations designed to reproduce the Euclid spectroscopic galaxy sample, by populating dark matter halos with galaxies through a halo occupation distribution model calibrated on the Euclid Flagship simulation, supporting the galaxy clustering analyses of the Euclid Data Release 1. In addition, the validation of PINOCCHIO in underdense environments demonstrates its suitability for void-based analyses, extending its applicability beyond traditional halo statistics.| File | Dimensione | Formato | |
|---|---|---|---|
|
PhD_Thesis_Lepinzan_final.pdf
accesso aperto
Licenza:
Tutti i diritti riservati
Dimensione
20.15 MB
Formato
Adobe PDF
|
20.15 MB | Adobe PDF | Visualizza/Apri |
|
PhD_Thesis_Lepinzan_final_1.pdf
accesso aperto
Licenza:
Tutti i diritti riservati
Dimensione
20.15 MB
Formato
Adobe PDF
|
20.15 MB | Adobe PDF | Visualizza/Apri |
|
PhD_Thesis_Lepinzan_final_2.pdf
accesso aperto
Licenza:
Tutti i diritti riservati
Dimensione
20.15 MB
Formato
Adobe PDF
|
20.15 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/363488
URN:NBN:IT:UNITS-363488