Biodiversity data is fundamental for understanding ecosystem dynamics and developing effective conservation strategies. In recent years, the massive mobilization of biodiversity data led to the creation of national and global aggregators, which greatly improved the accessibility and interoperability of these data. In Italy, biodiversity data of lichens and plants are managed by two national aggregators: ITALIC, the information system on Italian lichens and FlorItaly, the portal to the flora of Italy. These platforms aggregate data about taxonomy, ecology, and morpho-functional traits. Yet, they face several limitations: occurrence records are not available, tools for efficient data retrieval are lacking, and interoperability with external resources is limited. This work aims at addressing these limitations and has three main objectives: i) aggregating primary biodiversity data; ii) improving data accessibility and interoperability with external applications; iii) developing new tools to exploit the aggregated data. This effort led to several key results. Multiple datasets from Italian herbaria were mobilized, published as data papers, and aggregated in the Global Biodiversity Information Facility (GBIF) and in national aggregators. Lichen data were integrated into ITALIC, while plant data are being aggregated in FlorItaly. To enhance data accessibility and interoperability, public APIs were developed, coupled with an R package that facilitates data retrieval and manipulation in this programming language. Lastly, to exploit the potential of lichen data aggregated in ITALIC, we developed a novel tool, the KeyMaker, which lets users generate and share identification keys for subset of taxa based on their distribution, morpho-functional traits, and ecological requirements. In the appendix, we included a study that highlights the potential and extensibility of ITALIC code to create sub-portals focused on specific geographic areas (the eastern Alps of Italy and the Dolomites, in this case study). In conclusion, this work has significantly improved the availability and usability of plant and lichen biodiversity data in Italy through the enhancement of national data aggregators. The newly developed tools provide a solid baseline for future research, while the publicly available code ensures the replicability and potential expansion of this work beyond its original scope.
I dati di biodiversità sono fondamentali per comprendere le dinamiche degli ecosistemi e sviluppare strategie di conservazione efficaci. Negli ultimi anni, la mobilitazione di grandi moli di dati di biodiversità e la creazione di aggregatori nazionali e globali, ha migliorato notevolmente l'accessibilità e l'interoperabilità di questi dati. In Italia, i dati di biodiversità di licheni e piante sono gestiti da due aggregatori nazionali: ITALIC, il sistema informativo sui licheni italiani e FlorItaly, il portale della flora d'Italia. Queste piattaforme aggregano dati nomenclaturali, ecologici e dati relativi a tratti morfo-funzionali. Tuttavia, presentano anche diverse limitazioni: non aggregano dati di occorrenza e la loro interoperabilità con risorse esterne è limitata. Questo lavoro mira a risolvere queste limitazioni seguendo tre obiettivi principali: i) aggregare dati primari di biodiversità (occorrenze); ii) migliorare l'accessibilità e l'interoperabilità dei dati con applicazioni esterne; iii) sviluppare nuovi strumenti per sfruttare i dati aggregati. Questo progetto ha portato a diversi risultati. Molteplici dataset di erbari italiani sono stati digitalizzati, pubblicati come data paper, e resi disponibili attraverso il Global Biodiversity Information Facility (GBIF) e gli aggregatori nazionali. I dati di licheni sono stati integrati in ITALIC, mentre i dati di piante vascolari in FlorItaly. Per migliorare l'accessibilità e l'interoperabilità dei dati, sono state sviluppate API pubbliche, abbinate a un pacchetto R che facilita l’utilizzo dei dati in questo linguaggio di programmazione. Infine, per sfruttare il potenziale dei dati di licheni aggregati in ITALIC, abbiamo sviluppato un nuovo strumento, il KeyMaker, che permette agli utenti di generare e condividere chiavi di identificazione scegliendo i taxa da includere. In appendice, abbiamo incluso uno studio che evidenzia la potenziale estensibilità del codice di ITALIC per creare sub-portali focalizzati su aree geografiche specifiche (in questo caso di studio le Dolomiti). In conclusione, questo lavoro ha migliorato significativamente la disponibilità e l'usabilità dei dati di biodiversità di piante e licheni in Italia attraverso il potenziamento degli aggregatori di dati nazionali. I nuovi strumenti sviluppati forniscono una solida base per la gestione di dati di biodiversità e per supportare ricerche future. La maggior parte del codice realizzato è pubblicamente disponibile per permettere la replicabilità degli strumenti sviluppati.
Plant and lichen biodiversity data aggregation in Italy
CONTI, MATTEO
2025
Abstract
Biodiversity data is fundamental for understanding ecosystem dynamics and developing effective conservation strategies. In recent years, the massive mobilization of biodiversity data led to the creation of national and global aggregators, which greatly improved the accessibility and interoperability of these data. In Italy, biodiversity data of lichens and plants are managed by two national aggregators: ITALIC, the information system on Italian lichens and FlorItaly, the portal to the flora of Italy. These platforms aggregate data about taxonomy, ecology, and morpho-functional traits. Yet, they face several limitations: occurrence records are not available, tools for efficient data retrieval are lacking, and interoperability with external resources is limited. This work aims at addressing these limitations and has three main objectives: i) aggregating primary biodiversity data; ii) improving data accessibility and interoperability with external applications; iii) developing new tools to exploit the aggregated data. This effort led to several key results. Multiple datasets from Italian herbaria were mobilized, published as data papers, and aggregated in the Global Biodiversity Information Facility (GBIF) and in national aggregators. Lichen data were integrated into ITALIC, while plant data are being aggregated in FlorItaly. To enhance data accessibility and interoperability, public APIs were developed, coupled with an R package that facilitates data retrieval and manipulation in this programming language. Lastly, to exploit the potential of lichen data aggregated in ITALIC, we developed a novel tool, the KeyMaker, which lets users generate and share identification keys for subset of taxa based on their distribution, morpho-functional traits, and ecological requirements. In the appendix, we included a study that highlights the potential and extensibility of ITALIC code to create sub-portals focused on specific geographic areas (the eastern Alps of Italy and the Dolomites, in this case study). In conclusion, this work has significantly improved the availability and usability of plant and lichen biodiversity data in Italy through the enhancement of national data aggregators. The newly developed tools provide a solid baseline for future research, while the publicly available code ensures the replicability and potential expansion of this work beyond its original scope.File | Dimensione | Formato | |
---|---|---|---|
Matteo_Conti_Thesis.pdf
embargo fino al 16/04/2026
Dimensione
12.22 MB
Formato
Adobe PDF
|
12.22 MB | Adobe PDF | |
Matteo_Conti_Thesis_1.pdf
embargo fino al 16/04/2026
Dimensione
12.22 MB
Formato
Adobe PDF
|
12.22 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/202394
URN:NBN:IT:UNITS-202394