La capacità di comporre semplici logiche in ragionamenti complessi gioca un ruolo fondamentale nel processo cognitivo umano. Al contrario, nelle moderne applicazioni di reti neurali, il processo di allenamento mira a massimizzare le performance della rete in un singolo compito. Nell'ambito di questa tesi viene proposto un modello, differenziabile end-to-end, capace di apprendere e memorizzare un set di funzioni primitive utile alla composizione del ragionamento. Il modello presentato viene valutato sul dataset CLEVR, in cui la capacità di comprendere a fondo il contenuto delle immagini ਠindispensabile al fine di rispondere correttamente alle relative domande. Il lavoro preliminare include l'analisi di modelli ispirati alla neural Turing machine, su un dataset sintetico, creato appositamente per esplorare il problema in oggetto della ricerca. Successivamente, viene accuratamente indagata la possibilità di allenare la rete utilizzando una supervisione debole, confrontando diverse strategie di allenamento delle reti neurali, tra cui varie tecniche di reinforcement learning.
Visual Reasoning: learning and composing primitives in an associative memory.
2019
Abstract
La capacità di comporre semplici logiche in ragionamenti complessi gioca un ruolo fondamentale nel processo cognitivo umano. Al contrario, nelle moderne applicazioni di reti neurali, il processo di allenamento mira a massimizzare le performance della rete in un singolo compito. Nell'ambito di questa tesi viene proposto un modello, differenziabile end-to-end, capace di apprendere e memorizzare un set di funzioni primitive utile alla composizione del ragionamento. Il modello presentato viene valutato sul dataset CLEVR, in cui la capacità di comprendere a fondo il contenuto delle immagini ਠindispensabile al fine di rispondere correttamente alle relative domande. Il lavoro preliminare include l'analisi di modelli ispirati alla neural Turing machine, su un dataset sintetico, creato appositamente per esplorare il problema in oggetto della ricerca. Successivamente, viene accuratamente indagata la possibilità di allenare la rete utilizzando una supervisione debole, confrontando diverse strategie di allenamento delle reti neurali, tra cui varie tecniche di reinforcement learning.| File | Dimensione | Formato | |
|---|---|---|---|
|
thesis_revised.pdf
accesso solo da BNCF e BNCR
Tipologia:
Altro materiale allegato
Licenza:
Tutti i diritti riservati
Dimensione
2.41 MB
Formato
Adobe PDF
|
2.41 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/297638
URN:NBN:IT:UNIMORE-297638