This work focuses on Commonsense Knowledge from a linguistic perspective to develop a theoretical framework supporting the implementation of conversational agents. Commonsense Knowledge is described as a complex and multifaceted structure, encompassing a wide range of knowledge generally acquired through everyday experiences. It is often implicit in communication (written or oral), posing a challenge for Natural Language Processing systems that leverage a data-driven approach to simulate human knowledge acquisition information. Therefore, its multifaceted nature suggests its conceptualisation as a process rather than a static information collection. Through a three-level analysis, the main goal is to investigate information structure starting from linguistic data. Together with computational tools, such as graph databases, an efficient data analysis has been made possible, revealing recurrent linguistic patterns. The advantage of this model in a human-computer interaction application lies in allowing the system to automatically omit redundant information during the communicative interaction.

Questo lavoro si focalizza sullo studio della Conoscenza del Senso Comune da un punto di vista linguistico con il fine ultimo di sviluppare un quadro teorico a supporto dell'implementazione degli agenti conversazionali. La Conoscenza del Senso Comune (Commonsense Knowledge, CSK) viene descritta come una struttura complessa e sfaccettata, in grado di abbracciare un'ampia gamma di conoscenze solitamente acquisite attraverso le esperienze quotidiane. Spesso lasciata implicita nella comunicazione (scritta o orale), questa conoscenza rappresenta una vera sfida per i sistemi di Elaborazione del Linguaggio Naturale (Natural Language Processing, NLP), in quanto sfruttano un approccio basato sui dati per simulare l'acquisizione delle conoscenze umane. Questa sua natura poliedrica suggerisce la sua concettualizzazione come processo piuttosto che come raccolta statica di informazioni. Attraverso un'analisi a tre livelli, l'obiettivo principale è quello di indagare la struttura delle informazioni a partire dai dati linguistici. Insieme a strumenti computazionali, come i database a grafo, è stato possibile effettuare un'analisi efficiente dei dati, rilevando modelli linguistici ricorrenti. Il vantaggio di questo modello in un'applicazione di interazione uomo-macchina risiede nel permettere al sistema di omettere automaticamente le informazioni ridondanti durante l'interazione comunicativa.

Speaking less to say more: A Linguistic Approach Investigating Commonsense Knowledge for the Implementation of Conversational Agents [Parlare di meno per dire di più: Un Approccio Linguistico per Investigare la Conoscenza del Senso Comune nell'Implementazione degli Agenti Conversazionali]

MENNELLA, SABRINA
2025

Abstract

This work focuses on Commonsense Knowledge from a linguistic perspective to develop a theoretical framework supporting the implementation of conversational agents. Commonsense Knowledge is described as a complex and multifaceted structure, encompassing a wide range of knowledge generally acquired through everyday experiences. It is often implicit in communication (written or oral), posing a challenge for Natural Language Processing systems that leverage a data-driven approach to simulate human knowledge acquisition information. Therefore, its multifaceted nature suggests its conceptualisation as a process rather than a static information collection. Through a three-level analysis, the main goal is to investigate information structure starting from linguistic data. Together with computational tools, such as graph databases, an efficient data analysis has been made possible, revealing recurrent linguistic patterns. The advantage of this model in a human-computer interaction application lies in allowing the system to automatically omit redundant information during the communicative interaction.
28-lug-2025
Inglese
Questo lavoro si focalizza sullo studio della Conoscenza del Senso Comune da un punto di vista linguistico con il fine ultimo di sviluppare un quadro teorico a supporto dell'implementazione degli agenti conversazionali. La Conoscenza del Senso Comune (Commonsense Knowledge, CSK) viene descritta come una struttura complessa e sfaccettata, in grado di abbracciare un'ampia gamma di conoscenze solitamente acquisite attraverso le esperienze quotidiane. Spesso lasciata implicita nella comunicazione (scritta o orale), questa conoscenza rappresenta una vera sfida per i sistemi di Elaborazione del Linguaggio Naturale (Natural Language Processing, NLP), in quanto sfruttano un approccio basato sui dati per simulare l'acquisizione delle conoscenze umane. Questa sua natura poliedrica suggerisce la sua concettualizzazione come processo piuttosto che come raccolta statica di informazioni. Attraverso un'analisi a tre livelli, l'obiettivo principale è quello di indagare la struttura delle informazioni a partire dai dati linguistici. Insieme a strumenti computazionali, come i database a grafo, è stato possibile effettuare un'analisi efficiente dei dati, rilevando modelli linguistici ricorrenti. Il vantaggio di questo modello in un'applicazione di interazione uomo-macchina risiede nel permettere al sistema di omettere automaticamente le informazioni ridondanti durante l'interazione comunicativa.
VENUTI, MARCO
Università degli studi di Catania
Catania
File in questo prodotto:
File Dimensione Formato  
TesiDottorato_MennellaSabrina_def_.pdf

accesso aperto

Licenza: Tutti i diritti riservati
Dimensione 5.18 MB
Formato Adobe PDF
5.18 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/307814
Il codice NBN di questa tesi è URN:NBN:IT:UNICT-307814