La Tesi illustra il lavoro di ricerca e sviluppo svolto sulla MOMIS Dashboard, uno strumento di analisi dei dati interattivo per esplorare e visualizzare il contenuto delle fonti di dati attraverso diversi tipi di viste dinamiche. Il software è molto versatile e supporta la connessione ai principali DBMS relazionali e sorgenti Big Data; per la connessione ai dati MOMIS Dashboard utilizza MOMIS, un sistema di integrazione dei dati Open Source in grado di integrare fonti di dati eterogenee. L’attività di ricerca si è concentrata sullo sviluppo in MOMIS di nuovi strumenti che hanno permesso di potenziare le capacità di generazione di schemi integrati: infatti il framework è stato integrato con NORMS per la normalizzazione delle schema label e con SparkER per la entity resolution. Grazie a NORMS, MOMIS è in grado di trovare quali relazioni semantiche sussistono tra sorgenti le cui schema label (ovvero i nomi di classi o attributi di uno schema) contengono acronimi, abbreviazioni e termini composti. SparkER invece è un tool per l’Entity Resolution realizzato dal laboratorio DBGroup dell’Università di Modena e Reggio Emilia che, tramite tecniche avanzate di Meta-Blocking, garantisce prestazioni migliori di quelle esistenti e basate su Hadhoop MapReduce. In MOMIS l’utilizzo di SparkER consente di realizzare uno schema matching basato sul contenuto delle sorgenti dati e non sulle schema labels, andando così a determinare delle relazioni semantiche che altrimenti sarebbero difficilmente individuabili anche per gli esperti dominio. In questa tesi viene infine descritto come MOMIS sia stato impiegato come motore di integrazione dati per realizzare la MOMIS Dashboard. Quest’ultima è stata sviluppata per creare un tool di data analytics che ha trovato applicazione sia in contesti industriali nell’ambito del piano nazionale industria 4.0 sia in ambito medico scientifico.

Analisi e sviluppo di soluzioni avanzate di data integration per la realizzazione di data analytics tools

2019

Abstract

La Tesi illustra il lavoro di ricerca e sviluppo svolto sulla MOMIS Dashboard, uno strumento di analisi dei dati interattivo per esplorare e visualizzare il contenuto delle fonti di dati attraverso diversi tipi di viste dinamiche. Il software è molto versatile e supporta la connessione ai principali DBMS relazionali e sorgenti Big Data; per la connessione ai dati MOMIS Dashboard utilizza MOMIS, un sistema di integrazione dei dati Open Source in grado di integrare fonti di dati eterogenee. L’attività di ricerca si è concentrata sullo sviluppo in MOMIS di nuovi strumenti che hanno permesso di potenziare le capacità di generazione di schemi integrati: infatti il framework è stato integrato con NORMS per la normalizzazione delle schema label e con SparkER per la entity resolution. Grazie a NORMS, MOMIS è in grado di trovare quali relazioni semantiche sussistono tra sorgenti le cui schema label (ovvero i nomi di classi o attributi di uno schema) contengono acronimi, abbreviazioni e termini composti. SparkER invece è un tool per l’Entity Resolution realizzato dal laboratorio DBGroup dell’Università di Modena e Reggio Emilia che, tramite tecniche avanzate di Meta-Blocking, garantisce prestazioni migliori di quelle esistenti e basate su Hadhoop MapReduce. In MOMIS l’utilizzo di SparkER consente di realizzare uno schema matching basato sul contenuto delle sorgenti dati e non sulle schema labels, andando così a determinare delle relazioni semantiche che altrimenti sarebbero difficilmente individuabili anche per gli esperti dominio. In questa tesi viene infine descritto come MOMIS sia stato impiegato come motore di integrazione dati per realizzare la MOMIS Dashboard. Quest’ultima è stata sviluppata per creare un tool di data analytics che ha trovato applicazione sia in contesti industriali nell’ambito del piano nazionale industria 4.0 sia in ambito medico scientifico.
6-mar-2019
Italiano
ING-INF/05
BERGAMASCHI SONIA
Università degli Studi di Modena e Reggio Emilia
File in questo prodotto:
File Dimensione Formato  
PhD_Thesis_luca.magnotta_reviewed.pdf

Open Access dal 07/03/2022

Tipologia: Altro materiale allegato
Dimensione 6.22 MB
Formato Adobe PDF
6.22 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/140953
Il codice NBN di questa tesi è URN:NBN:IT:UNIMORE-140953