Speaking less to say more: A Linguistic Approach Investigating Commonsense Knowledge for the Implementation of Conversational Agents [Parlare di meno per dire di più: Un Approccio Linguistico per Investigare la Conoscenza del Senso Comune nell'Implementazione degli Agenti Conversazionali]

UNITesi

This work focuses on Commonsense Knowledge from a linguistic perspective to develop a theoretical framework supporting the implementation of conversational agents. Commonsense Knowledge is described as a complex and multifaceted structure, encompassing a wide range of knowledge generally acquired through everyday experiences. It is often implicit in communication (written or oral), posing a challenge for Natural Language Processing systems that leverage a data-driven approach to simulate human knowledge acquisition information. Therefore, its multifaceted nature suggests its conceptualisation as a process rather than a static information collection. Through a three-level analysis, the main goal is to investigate information structure starting from linguistic data. Together with computational tools, such as graph databases, an efficient data analysis has been made possible, revealing recurrent linguistic patterns. The advantage of this model in a human-computer interaction application lies in allowing the system to automatically omit redundant information during the communicative interaction.

Questo lavoro si focalizza sullo studio della Conoscenza del Senso Comune da un punto di vista linguistico con il fine ultimo di sviluppare un quadro teorico a supporto dell'implementazione degli agenti conversazionali. La Conoscenza del Senso Comune (Commonsense Knowledge, CSK) viene descritta come una struttura complessa e sfaccettata, in grado di abbracciare un'ampia gamma di conoscenze solitamente acquisite attraverso le esperienze quotidiane. Spesso lasciata implicita nella comunicazione (scritta o orale), questa conoscenza rappresenta una vera sfida per i sistemi di Elaborazione del Linguaggio Naturale (Natural Language Processing, NLP), in quanto sfruttano un approccio basato sui dati per simulare l'acquisizione delle conoscenze umane. Questa sua natura poliedrica suggerisce la sua concettualizzazione come processo piuttosto che come raccolta statica di informazioni. Attraverso un'analisi a tre livelli, l'obiettivo principale è quello di indagare la struttura delle informazioni a partire dai dati linguistici. Insieme a strumenti computazionali, come i database a grafo, è stato possibile effettuare un'analisi efficiente dei dati, rilevando modelli linguistici ricorrenti. Il vantaggio di questo modello in un'applicazione di interazione uomo-macchina risiede nel permettere al sistema di omettere automaticamente le informazioni ridondanti durante l'interazione comunicativa.

Speaking less to say more: A Linguistic Approach Investigating Commonsense Knowledge for the Implementation of Conversational Agents [Parlare di meno per dire di più: Un Approccio Linguistico per Investigare la Conoscenza del Senso Comune nell'Implementazione degli Agenti Conversazionali]

MENNELLA, SABRINA

2025

Abstract

This work focuses on Commonsense Knowledge from a linguistic perspective to develop a theoretical framework supporting the implementation of conversational agents. Commonsense Knowledge is described as a complex and multifaceted structure, encompassing a wide range of knowledge generally acquired through everyday experiences. It is often implicit in communication (written or oral), posing a challenge for Natural Language Processing systems that leverage a data-driven approach to simulate human knowledge acquisition information. Therefore, its multifaceted nature suggests its conceptualisation as a process rather than a static information collection. Through a three-level analysis, the main goal is to investigate information structure starting from linguistic data. Together with computational tools, such as graph databases, an efficient data analysis has been made possible, revealing recurrent linguistic patterns. The advantage of this model in a human-computer interaction application lies in allowing the system to automatically omit redundant information during the communicative interaction.

Scheda breve

Scheda completa

Scheda completa (DC)

	Corso di studio
	
				SCIENZE DELL'INTERPRETAZIONE
			
	Data di pubblicazione
	
				28-lug-2025
			
	Lingua
	
				Inglese
			
	Abstract in italiano
	
				Questo lavoro si focalizza sullo studio della Conoscenza del Senso Comune da un punto di vista linguistico con il fine ultimo di sviluppare un quadro teorico a supporto dell'implementazione degli agenti conversazionali. La Conoscenza del Senso Comune (Commonsense Knowledge, CSK) viene descritta come una struttura complessa e sfaccettata, in grado di abbracciare un'ampia gamma di conoscenze solitamente acquisite attraverso le esperienze quotidiane. Spesso lasciata implicita nella comunicazione (scritta o orale), questa conoscenza rappresenta una vera sfida per i sistemi di Elaborazione del Linguaggio Naturale (Natural Language Processing, NLP), in quanto sfruttano un approccio basato sui dati per simulare l'acquisizione delle conoscenze umane. Questa sua natura poliedrica suggerisce la sua concettualizzazione come processo piuttosto che come raccolta statica di informazioni. Attraverso un'analisi a tre livelli, l'obiettivo principale è quello di indagare la struttura delle informazioni a partire dai dati linguistici. Insieme a strumenti computazionali, come i database a grafo, è stato possibile effettuare un'analisi efficiente dei dati, rilevando modelli linguistici ricorrenti. Il vantaggio di questo modello in un'applicazione di interazione uomo-macchina risiede nel permettere al sistema di omettere automaticamente le informazioni ridondanti durante l'interazione comunicativa.
			
	Relatore, Supervisor, Advisor o Tutor
	
				VENUTI, MARCO
			
	Nome Editore
	
				Università degli studi di Catania
			
	Città Editore
	
				Catania
			
	Collezione di appartenenza
	
				Università degli Studi di Catania

File in questo prodotto:

File	Dimensione	Formato
TesiDottorato_MennellaSabrina_def_.pdf accesso aperto Licenza: Tutti i diritti riservati Dimensione 5.18 MB Formato Adobe PDF Visualizza/Apri	5.18 MB	Adobe PDF	Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/307814

Il codice NBN di questa tesi è URN:NBN:IT:UNICT-307814