La tesi intende approfondire come modelli computazionali (modelli di NLP "tradizionale", Language Models, Language Models arricchiti con inferenza bayesiana sullo stile del modello di pragmatica formale RSA) siano in grado di simulare il comportamento umano per quanto riguarda un aspetto importante del modo in cui elaboriamo il significato di espressioni, ossia l'arricchimento del significato letterale con informazione implicita. Verranno prese in considerazione diversi tipi di espressioni che presentano questa caratteristica (metafore, metonimie, implicature): questi datasets saranno utilizzati per indagini di tipo linguistico e per analizzare il comportamento di modelli computazionali (e in particolare dei Language models). La parte finale della tesi è mirata a comprendere come certi limiti che emergono dall'analisi dei Language Models possano essere superati creando agenti che si basano su Language Models e inferenza bayesiana. The thesis aims to explore how computational models ("traditional" natural language processing models, language models, and language models enriched with Bayesian inference in the style of the RSA formal pragmatics model) can simulate human behavior concerning an important aspect of how we process the meaning of expressions, namely, the enrichment of literal meaning with implicit information (enriched compositionality). Various types of expressions that exhibit this feature (metaphors, metonymies, implicatures) will be considered: these datasets will be used for linguistic investigations and to analyze the behavior of computational models (particularly Language Models). The final part of the thesis focuses on understanding how certain limitations that emerge from the analysis of language models can be overcome by creating agents based on Language Models and Bayesian inference.
Computational Models of Enriched Compositionality
PEDINOTTI, PAOLO
2024
Abstract
La tesi intende approfondire come modelli computazionali (modelli di NLP "tradizionale", Language Models, Language Models arricchiti con inferenza bayesiana sullo stile del modello di pragmatica formale RSA) siano in grado di simulare il comportamento umano per quanto riguarda un aspetto importante del modo in cui elaboriamo il significato di espressioni, ossia l'arricchimento del significato letterale con informazione implicita. Verranno prese in considerazione diversi tipi di espressioni che presentano questa caratteristica (metafore, metonimie, implicature): questi datasets saranno utilizzati per indagini di tipo linguistico e per analizzare il comportamento di modelli computazionali (e in particolare dei Language models). La parte finale della tesi è mirata a comprendere come certi limiti che emergono dall'analisi dei Language Models possano essere superati creando agenti che si basano su Language Models e inferenza bayesiana. The thesis aims to explore how computational models ("traditional" natural language processing models, language models, and language models enriched with Bayesian inference in the style of the RSA formal pragmatics model) can simulate human behavior concerning an important aspect of how we process the meaning of expressions, namely, the enrichment of literal meaning with implicit information (enriched compositionality). Various types of expressions that exhibit this feature (metaphors, metonymies, implicatures) will be considered: these datasets will be used for linguistic investigations and to analyze the behavior of computational models (particularly Language Models). The final part of the thesis focuses on understanding how certain limitations that emerge from the analysis of language models can be overcome by creating agents based on Language Models and Bayesian inference.File | Dimensione | Formato | |
---|---|---|---|
PEDINOTTI_Report_delle_attivit_svolte.pdf
non disponibili
Dimensione
84.73 kB
Formato
Adobe PDF
|
84.73 kB | Adobe PDF | |
tesidottoratodatabasepdfa.pdf
embargo fino al 05/07/2064
Dimensione
3.7 MB
Formato
Adobe PDF
|
3.7 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/215755
URN:NBN:IT:UNIPI-215755