La tesi intende approfondire come modelli computazionali (modelli di NLP "tradizionale", Language Models, Language Models arricchiti con inferenza bayesiana sullo stile del modello di pragmatica formale RSA) siano in grado di simulare il comportamento umano per quanto riguarda un aspetto importante del modo in cui elaboriamo il significato di espressioni, ossia l'arricchimento del significato letterale con informazione implicita. Verranno prese in considerazione diversi tipi di espressioni che presentano questa caratteristica (metafore, metonimie, implicature): questi datasets saranno utilizzati per indagini di tipo linguistico e per analizzare il comportamento di modelli computazionali (e in particolare dei Language models). La parte finale della tesi è mirata a comprendere come certi limiti che emergono dall'analisi dei Language Models possano essere superati creando agenti che si basano su Language Models e inferenza bayesiana. The thesis aims to explore how computational models ("traditional" natural language processing models, language models, and language models enriched with Bayesian inference in the style of the RSA formal pragmatics model) can simulate human behavior concerning an important aspect of how we process the meaning of expressions, namely, the enrichment of literal meaning with implicit information (enriched compositionality). Various types of expressions that exhibit this feature (metaphors, metonymies, implicatures) will be considered: these datasets will be used for linguistic investigations and to analyze the behavior of computational models (particularly Language Models). The final part of the thesis focuses on understanding how certain limitations that emerge from the analysis of language models can be overcome by creating agents based on Language Models and Bayesian inference.

Computational Models of Enriched Compositionality

PEDINOTTI, PAOLO
2024

Abstract

La tesi intende approfondire come modelli computazionali (modelli di NLP "tradizionale", Language Models, Language Models arricchiti con inferenza bayesiana sullo stile del modello di pragmatica formale RSA) siano in grado di simulare il comportamento umano per quanto riguarda un aspetto importante del modo in cui elaboriamo il significato di espressioni, ossia l'arricchimento del significato letterale con informazione implicita. Verranno prese in considerazione diversi tipi di espressioni che presentano questa caratteristica (metafore, metonimie, implicature): questi datasets saranno utilizzati per indagini di tipo linguistico e per analizzare il comportamento di modelli computazionali (e in particolare dei Language models). La parte finale della tesi è mirata a comprendere come certi limiti che emergono dall'analisi dei Language Models possano essere superati creando agenti che si basano su Language Models e inferenza bayesiana. The thesis aims to explore how computational models ("traditional" natural language processing models, language models, and language models enriched with Bayesian inference in the style of the RSA formal pragmatics model) can simulate human behavior concerning an important aspect of how we process the meaning of expressions, namely, the enrichment of literal meaning with implicit information (enriched compositionality). Various types of expressions that exhibit this feature (metaphors, metonymies, implicatures) will be considered: these datasets will be used for linguistic investigations and to analyze the behavior of computational models (particularly Language Models). The final part of the thesis focuses on understanding how certain limitations that emerge from the analysis of language models can be overcome by creating agents based on Language Models and Bayesian inference.
3-lug-2024
Italiano
Bayesian inference
Computational linguistics
Language Models
Linguistica computazionale
Lenci, Alessandro
File in questo prodotto:
File Dimensione Formato  
PEDINOTTI_Report_delle_attivit_svolte.pdf

non disponibili

Dimensione 84.73 kB
Formato Adobe PDF
84.73 kB Adobe PDF
tesidottoratodatabasepdfa.pdf

embargo fino al 05/07/2064

Dimensione 3.7 MB
Formato Adobe PDF
3.7 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/215755
Il codice NBN di questa tesi è URN:NBN:IT:UNIPI-215755