This work focuses on Commonsense Knowledge from a linguistic perspective to develop a theoretical framework supporting the implementation of conversational agents. Commonsense Knowledge is described as a complex and multifaceted structure, encompassing a wide range of knowledge generally acquired through everyday experiences. It is often implicit in communication (written or oral), posing a challenge for Natural Language Processing systems that leverage a data-driven approach to simulate human knowledge acquisition information. Therefore, its multifaceted nature suggests its conceptualisation as a process rather than a static information collection. Through a three-level analysis, the main goal is to investigate information structure starting from linguistic data. Together with computational tools, such as graph databases, an efficient data analysis has been made possible, revealing recurrent linguistic patterns. The advantage of this model in a human-computer interaction application lies in allowing the system to automatically omit redundant information during the communicative interaction.
Questo lavoro si focalizza sullo studio della Conoscenza del Senso Comune da un punto di vista linguistico con il fine ultimo di sviluppare un quadro teorico a supporto dell'implementazione degli agenti conversazionali. La Conoscenza del Senso Comune (Commonsense Knowledge, CSK) viene descritta come una struttura complessa e sfaccettata, in grado di abbracciare un'ampia gamma di conoscenze solitamente acquisite attraverso le esperienze quotidiane. Spesso lasciata implicita nella comunicazione (scritta o orale), questa conoscenza rappresenta una vera sfida per i sistemi di Elaborazione del Linguaggio Naturale (Natural Language Processing, NLP), in quanto sfruttano un approccio basato sui dati per simulare l'acquisizione delle conoscenze umane. Questa sua natura poliedrica suggerisce la sua concettualizzazione come processo piuttosto che come raccolta statica di informazioni. Attraverso un'analisi a tre livelli, l'obiettivo principale è quello di indagare la struttura delle informazioni a partire dai dati linguistici. Insieme a strumenti computazionali, come i database a grafo, è stato possibile effettuare un'analisi efficiente dei dati, rilevando modelli linguistici ricorrenti. Il vantaggio di questo modello in un'applicazione di interazione uomo-macchina risiede nel permettere al sistema di omettere automaticamente le informazioni ridondanti durante l'interazione comunicativa.
Speaking less to say more: A Linguistic Approach Investigating Commonsense Knowledge for the Implementation of Conversational Agents [Parlare di meno per dire di più: Un Approccio Linguistico per Investigare la Conoscenza del Senso Comune nell'Implementazione degli Agenti Conversazionali]
MENNELLA, SABRINA
2025
Abstract
This work focuses on Commonsense Knowledge from a linguistic perspective to develop a theoretical framework supporting the implementation of conversational agents. Commonsense Knowledge is described as a complex and multifaceted structure, encompassing a wide range of knowledge generally acquired through everyday experiences. It is often implicit in communication (written or oral), posing a challenge for Natural Language Processing systems that leverage a data-driven approach to simulate human knowledge acquisition information. Therefore, its multifaceted nature suggests its conceptualisation as a process rather than a static information collection. Through a three-level analysis, the main goal is to investigate information structure starting from linguistic data. Together with computational tools, such as graph databases, an efficient data analysis has been made possible, revealing recurrent linguistic patterns. The advantage of this model in a human-computer interaction application lies in allowing the system to automatically omit redundant information during the communicative interaction.| File | Dimensione | Formato | |
|---|---|---|---|
|
TesiDottorato_MennellaSabrina_def_.pdf
accesso aperto
Licenza:
Tutti i diritti riservati
Dimensione
5.18 MB
Formato
Adobe PDF
|
5.18 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/307814
URN:NBN:IT:UNICT-307814