Recommender Systems have become fundamental tools in helping users to find what is relevant for them in situations where information overload makes such task hard or even impossible. Recommender Systems are designed to suggest unknown items to the users in a personalized way, recommending those items that are most likely of interest to the users. While new algorithms and approaches have been proposed over the years mainly devoted to maximizing recommendation accuracy, recently it has been recognized that the predictive accuracy is not enough to guarantee satisfying user experience. Attention has been paid to other important quality factors such as diversity and novelty of the recommendations, and to further issues in this area, for instance the user cold start problem. At the same time, the Web has evolved from a global information space of linked documents to a Web of Data. The Linked Data initiative born in order to provide a standardized set of best practices for publishing and connecting structured data on the Web, has played a fundamental role in the development of the Web of Data. Semantic data in the Linked Data sources enable the design of new generation of knowledge-driven applications and services. This thesis investigates a set of research lines in the field of Recommender Systems using Linked Data with a focus on different quality dimensions of recommendations, besides accuracy. Specifically, we propose new methods for personalizing the diversification of list of recommendations over different item dimensions, and a new method for exploiting temporal information in intent-aware diversification. Moreover, we investigate the use of semantic data and cross-domain information for tackling the user cold-start problem. Finally, we compare different semantic similarity metrics and Linked Data sources to assess their performance in feeding content-based recommender systems. Experimental results, showed and discussed in this thesis, support the validity of our contributions and analyses.

I Sistemi di Raccomandazione sono diventanti strumenti fondamentali per aiutare gli utenti nella ricerca di cosa è rilevante per loro in situazioni dove il sovraccarico informativo rende tale task difficile o quasi impossibile. I Sistemi di Raccomandazione sono progettati per suggerire oggetti sconosciuti a utenti in modo personalizzato, raccomandando gli oggetti che sono più probabilmente di interesse per gli utenti. Mentre nuovi algoritmi e approcci sono stati proposti negli anni principalmente con l'obiettivo di migliorare l'accuratezza delle raccomandazioni, recentemente è stato evidenziato che l'accuratezza predittiva non è sufficiente a garantire una user experience soddisfacente. È stata posta l'attenzione su altri importanti fattori di qualità come la diversità e novità delle raccomandazioni, e su altri problemi in questo campo, come il problema degli utenti nella fasi di cold-start. Allo stesso tempo, il Web si è evoluto da uno spazio di informazione globale di documenti collegati a un Web dei Dati. L'iniziativa Linked Data nata al fine di fornire una serie standardizzata di best practices per la pubblicazione e il collegamento strutturato di dati sul Web, ha avuto un ruolo fondamentale nello sviluppo del Web dei Dati. Dati semantici presenti nei Linked Data consentono la progettazione di una nuova generazione di applicazioni e servizi basati sulla conoscenza. Questa tesi indaga su una serie di linee di ricerca nel campo dei Sistemi di Raccomandazione che utilizzano i Linked Data, con un focus sui diversi fattori di qualità delle raccomandazioni, e non solo sulla precisione. In particolare, proponiamo nuovi metodi per personalizzare la diversificazione delle liste di raccomandazioni considerando diverse attributi descrittivi degli oggetti, e un nuovo metodo per sfruttare le informazioni temporali nella diversificazione di tipo intent-aware. Inoltre, indaghiamo l'uso di dati semantici e di informazione cross-domain per affrontare il problema degli utenti in fase cold-start. Infine, mettiamo a confronto diverse metriche di similarità semantica e database Linked Data per valutare le loro prestazioni nei sistemi di raccomandazione content-based. I risultati sperimentali, mostrati e discussi in questa tesi, sostengono la validità dei nostri contributi e delle analisi.

Beyond Accuracy in Recommender Systems under the Linked Data lens

Tomeo, Paolo
2017

Abstract

Recommender Systems have become fundamental tools in helping users to find what is relevant for them in situations where information overload makes such task hard or even impossible. Recommender Systems are designed to suggest unknown items to the users in a personalized way, recommending those items that are most likely of interest to the users. While new algorithms and approaches have been proposed over the years mainly devoted to maximizing recommendation accuracy, recently it has been recognized that the predictive accuracy is not enough to guarantee satisfying user experience. Attention has been paid to other important quality factors such as diversity and novelty of the recommendations, and to further issues in this area, for instance the user cold start problem. At the same time, the Web has evolved from a global information space of linked documents to a Web of Data. The Linked Data initiative born in order to provide a standardized set of best practices for publishing and connecting structured data on the Web, has played a fundamental role in the development of the Web of Data. Semantic data in the Linked Data sources enable the design of new generation of knowledge-driven applications and services. This thesis investigates a set of research lines in the field of Recommender Systems using Linked Data with a focus on different quality dimensions of recommendations, besides accuracy. Specifically, we propose new methods for personalizing the diversification of list of recommendations over different item dimensions, and a new method for exploiting temporal information in intent-aware diversification. Moreover, we investigate the use of semantic data and cross-domain information for tackling the user cold-start problem. Finally, we compare different semantic similarity metrics and Linked Data sources to assess their performance in feeding content-based recommender systems. Experimental results, showed and discussed in this thesis, support the validity of our contributions and analyses.
2017
Inglese
I Sistemi di Raccomandazione sono diventanti strumenti fondamentali per aiutare gli utenti nella ricerca di cosa è rilevante per loro in situazioni dove il sovraccarico informativo rende tale task difficile o quasi impossibile. I Sistemi di Raccomandazione sono progettati per suggerire oggetti sconosciuti a utenti in modo personalizzato, raccomandando gli oggetti che sono più probabilmente di interesse per gli utenti. Mentre nuovi algoritmi e approcci sono stati proposti negli anni principalmente con l'obiettivo di migliorare l'accuratezza delle raccomandazioni, recentemente è stato evidenziato che l'accuratezza predittiva non è sufficiente a garantire una user experience soddisfacente. È stata posta l'attenzione su altri importanti fattori di qualità come la diversità e novità delle raccomandazioni, e su altri problemi in questo campo, come il problema degli utenti nella fasi di cold-start. Allo stesso tempo, il Web si è evoluto da uno spazio di informazione globale di documenti collegati a un Web dei Dati. L'iniziativa Linked Data nata al fine di fornire una serie standardizzata di best practices per la pubblicazione e il collegamento strutturato di dati sul Web, ha avuto un ruolo fondamentale nello sviluppo del Web dei Dati. Dati semantici presenti nei Linked Data consentono la progettazione di una nuova generazione di applicazioni e servizi basati sulla conoscenza. Questa tesi indaga su una serie di linee di ricerca nel campo dei Sistemi di Raccomandazione che utilizzano i Linked Data, con un focus sui diversi fattori di qualità delle raccomandazioni, e non solo sulla precisione. In particolare, proponiamo nuovi metodi per personalizzare la diversificazione delle liste di raccomandazioni considerando diverse attributi descrittivi degli oggetti, e un nuovo metodo per sfruttare le informazioni temporali nella diversificazione di tipo intent-aware. Inoltre, indaghiamo l'uso di dati semantici e di informazione cross-domain per affrontare il problema degli utenti in fase cold-start. Infine, mettiamo a confronto diverse metriche di similarità semantica e database Linked Data per valutare le loro prestazioni nei sistemi di raccomandazione content-based. I risultati sperimentali, mostrati e discussi in questa tesi, sostengono la validità dei nostri contributi e delle analisi.
Di Noia, Tommaso
Passaro, Vittorio
Politecnico di Bari
File in questo prodotto:
File Dimensione Formato  
29 ciclio - TOMEO Paolo.pdf

accesso aperto

Dimensione 12.09 MB
Formato Adobe PDF
12.09 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/63167
Il codice NBN di questa tesi è URN:NBN:IT:POLIBA-63167