The amount and variety of data available nowadays are constantly increasing due to academic and industrial needs, as well as for building intelligent and sustainable network systems for society. Researchers endeavour to keep pace with this expansion with new hardware and software solutions, but they also struggle to design solutions that are compliant with new regulations, environmentally sustainable, and manageable in the long term. Given the extraordinary quantity of domains in which data are employed, the natural consequence is they come under diverse formats and with different vocabularies. In this context, graph databases are extremely valuable given their unfixed structure, which allows flexibility and permits facilitating time-consuming tasks like data integration. The cause of this flexibility is that graph databases do not hold schema information about instances, which is in contrast with traditional database logical models. The natural downside of this peculiarity is the lack of any control over the available information. In this scenario, problems related to data disambiguation, incompleteness, or inconsistency are frequent. Here we propose the enrichment of graphs with schema information, combining in a single solution the advantages of graphs in terms of performance and interoperability and the aspects of sharing a common vocabulary that, seen as an ontological conceptualization, opens scenarios for reasoning capabilities. The contribution of the thesis is the design of a framework for integrating schemas into graph-based structures. Schemas solve or mitigate the above-mentioned issues in data integration, and help in solving current Artificial Intelligence tasks involving graph structures efficiently. The contribution includes a solution for interconnecting and mapping graph database models and the SW-based graph model. The proposed framework covers a solution for schema evaluation that is purely instance-based and demonstrates the capability of this solution to be integrated into first-order logic frameworks for reasoning tasks. The proposed framework is a general solution and, among its possible uses, we mainly experimented with the framework in the field of digital libraries, cultural heritage, and linguistics.
L'enorme quantità e varietà di dati oggi disponibili è in costante aumento, guidata dalle esigenze accademiche e industriali e dalla necessità di sviluppare sistemi intelligenti e sostenibili per la società. I ricercatori si adoperano per tenere il passo con questa espansione attraverso nuove soluzioni hardware e software, affrontando però anche la sfida di progettare soluzioni conformi alle nuove normative, sostenibili dal punto di vista ambientale e gestibili nel lungo termine. Dato il gran numero di ambiti in cui i dati vengono utilizzati, è naturale che essi si presentino in formati eterogenei e con vocabolari differenti. In questo contesto, i database a grafo si rivelano estremamente utili grazie alla loro struttura non rigida, che permette flessibilità e agevola attività complesse e dispendiose in termini di tempo, come l’integrazione dei dati. La ragione di questa flessibilità risiede nel fatto che i database a grafo non richiedono di memorizzare uno schema per le istanze, a differenza dei modelli logici dei database tradizionali. Tuttavia, questa peculiarità implica la mancanza di controllo sulle informazioni disponibili, il che porta frequentemente a problemi di disambiguazione, incompletezza o incoerenza dei dati. Si propone, pertanto, l’arricchimento dei database a grafo con degli schemi, combinando in un'unica soluzione i vantaggi dei grafi in termini di prestazioni e interoperabilità con gli aspetti di condivisione di un vocabolario comune che, in quanto concettualizzazione ontologica, apre nuove possibilità per il ragionamento. Il contributo della tesi consiste nella progettazione di un framework per l'integrazione degli schemi nelle strutture su grafo. Gli schemi consentono di risolvere o mitigare le problematiche sopra menzionate relative all'integrazione dei dati e propongono soluzioni innovative a problemi di Intelligenza Artificiale che coinvolgono database a grafo, o strutture a grafo in generale. Il contributo include una soluzione per l'interconnessione e la mappatura di dati e schemi sui linguaggi basati sul web semantico. Il framework proposto prevede una soluzione per la valutazione degli schemi basata esclusivamente sulle istanze, e integra il framework in linguaggi logici (prevalentemente su logica del primo ordine) per compiti di ragionamento automatico. Il framework proposto è una soluzione generale che trova molteplici possibili applicazioni; nelle nostre sperimentazioni ci siamo principalmente concentrati sul campo delle biblioteche digitali, del patrimonio culturale e della linguistica.
Ontology-enriched Graph Databases: an Interoperable Framework for Knowledge Integration and Management
DI PIERRO, DAVIDE
2025
Abstract
The amount and variety of data available nowadays are constantly increasing due to academic and industrial needs, as well as for building intelligent and sustainable network systems for society. Researchers endeavour to keep pace with this expansion with new hardware and software solutions, but they also struggle to design solutions that are compliant with new regulations, environmentally sustainable, and manageable in the long term. Given the extraordinary quantity of domains in which data are employed, the natural consequence is they come under diverse formats and with different vocabularies. In this context, graph databases are extremely valuable given their unfixed structure, which allows flexibility and permits facilitating time-consuming tasks like data integration. The cause of this flexibility is that graph databases do not hold schema information about instances, which is in contrast with traditional database logical models. The natural downside of this peculiarity is the lack of any control over the available information. In this scenario, problems related to data disambiguation, incompleteness, or inconsistency are frequent. Here we propose the enrichment of graphs with schema information, combining in a single solution the advantages of graphs in terms of performance and interoperability and the aspects of sharing a common vocabulary that, seen as an ontological conceptualization, opens scenarios for reasoning capabilities. The contribution of the thesis is the design of a framework for integrating schemas into graph-based structures. Schemas solve or mitigate the above-mentioned issues in data integration, and help in solving current Artificial Intelligence tasks involving graph structures efficiently. The contribution includes a solution for interconnecting and mapping graph database models and the SW-based graph model. The proposed framework covers a solution for schema evaluation that is purely instance-based and demonstrates the capability of this solution to be integrated into first-order logic frameworks for reasoning tasks. The proposed framework is a general solution and, among its possible uses, we mainly experimented with the framework in the field of digital libraries, cultural heritage, and linguistics.File | Dimensione | Formato | |
---|---|---|---|
Tesi_pdfa.pdf
accesso aperto
Dimensione
6.02 MB
Formato
Adobe PDF
|
6.02 MB | Adobe PDF | Visualizza/Apri |
Tesi_pdfa_1.pdf
accesso aperto
Dimensione
6.02 MB
Formato
Adobe PDF
|
6.02 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/210188
URN:NBN:IT:UNIBA-210188