La Tesi illustra il lavoro di ricerca e sviluppo svolto sulla MOMIS Dashboard, uno strumento di analisi dei dati interattivo per esplorare e visualizzare il contenuto delle fonti di dati attraverso diversi tipi di viste dinamiche. Il software è molto versatile e supporta la connessione ai principali DBMS relazionali e sorgenti Big Data; per la connessione ai dati MOMIS Dashboard utilizza MOMIS, un sistema di integrazione dei dati Open Source in grado di integrare fonti di dati eterogenee. L’attività di ricerca si è concentrata sullo sviluppo in MOMIS di nuovi strumenti che hanno permesso di potenziare le capacità di generazione di schemi integrati: infatti il framework è stato integrato con NORMS per la normalizzazione delle schema label e con SparkER per la entity resolution. Grazie a NORMS, MOMIS è in grado di trovare quali relazioni semantiche sussistono tra sorgenti le cui schema label (ovvero i nomi di classi o attributi di uno schema) contengono acronimi, abbreviazioni e termini composti. SparkER invece è un tool per l’Entity Resolution realizzato dal laboratorio DBGroup dell’Università di Modena e Reggio Emilia che, tramite tecniche avanzate di Meta-Blocking, garantisce prestazioni migliori di quelle esistenti e basate su Hadhoop MapReduce. In MOMIS l’utilizzo di SparkER consente di realizzare uno schema matching basato sul contenuto delle sorgenti dati e non sulle schema labels, andando così a determinare delle relazioni semantiche che altrimenti sarebbero difficilmente individuabili anche per gli esperti dominio. In questa tesi viene infine descritto come MOMIS sia stato impiegato come motore di integrazione dati per realizzare la MOMIS Dashboard. Quest’ultima è stata sviluppata per creare un tool di data analytics che ha trovato applicazione sia in contesti industriali nell’ambito del piano nazionale industria 4.0 sia in ambito medico scientifico.
Analisi e sviluppo di soluzioni avanzate di data integration per la realizzazione di data analytics tools
2019
Abstract
La Tesi illustra il lavoro di ricerca e sviluppo svolto sulla MOMIS Dashboard, uno strumento di analisi dei dati interattivo per esplorare e visualizzare il contenuto delle fonti di dati attraverso diversi tipi di viste dinamiche. Il software è molto versatile e supporta la connessione ai principali DBMS relazionali e sorgenti Big Data; per la connessione ai dati MOMIS Dashboard utilizza MOMIS, un sistema di integrazione dei dati Open Source in grado di integrare fonti di dati eterogenee. L’attività di ricerca si è concentrata sullo sviluppo in MOMIS di nuovi strumenti che hanno permesso di potenziare le capacità di generazione di schemi integrati: infatti il framework è stato integrato con NORMS per la normalizzazione delle schema label e con SparkER per la entity resolution. Grazie a NORMS, MOMIS è in grado di trovare quali relazioni semantiche sussistono tra sorgenti le cui schema label (ovvero i nomi di classi o attributi di uno schema) contengono acronimi, abbreviazioni e termini composti. SparkER invece è un tool per l’Entity Resolution realizzato dal laboratorio DBGroup dell’Università di Modena e Reggio Emilia che, tramite tecniche avanzate di Meta-Blocking, garantisce prestazioni migliori di quelle esistenti e basate su Hadhoop MapReduce. In MOMIS l’utilizzo di SparkER consente di realizzare uno schema matching basato sul contenuto delle sorgenti dati e non sulle schema labels, andando così a determinare delle relazioni semantiche che altrimenti sarebbero difficilmente individuabili anche per gli esperti dominio. In questa tesi viene infine descritto come MOMIS sia stato impiegato come motore di integrazione dati per realizzare la MOMIS Dashboard. Quest’ultima è stata sviluppata per creare un tool di data analytics che ha trovato applicazione sia in contesti industriali nell’ambito del piano nazionale industria 4.0 sia in ambito medico scientifico.File | Dimensione | Formato | |
---|---|---|---|
PhD_Thesis_luca.magnotta_reviewed.pdf
Open Access dal 07/03/2022
Tipologia:
Altro materiale allegato
Dimensione
6.22 MB
Formato
Adobe PDF
|
6.22 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/140953
URN:NBN:IT:UNIMORE-140953