Questa dissertazione si concentra sui modelli generativi nel quadro teorico del Predictive Processing. È comunemente accettato che i modelli generativi siano rappresentazioni strutturali, cioè particolari concreti che rappresentano per mezzo di una somiglianza strutturale. Argomento che questa credenza diΛusa è errata: se osservati attentamente, i modelli generativi appaiono essere strutture di controllo non-rappresentazionali che realizzano le abilità sensomotorie di un agente. Apro la dissertazione introducendo (Ch. 1) il modo in cui Predictive Processing rende ragione della percezione e dell’azione, presentandone alcune implementazioni connessioniste così da chiariΞcare il ruolo giocato dai modelli generativi all'interno della teoria. Introduco quindi (Ch. 2) il quadro concettuale che guida la mia ricerca. Elucido in breve la metaΞsica delle rappresentazioni, enfatizzando soprattutto il ruolo funzionale speciΞco che i veicoli rappresentazionali giocano all’interno dei sistemi di cui sono parte. Chiudo la prima metà della dissertazione (Ch. 3) introducendo l’asserzione che i modelli generativi sono rappresentazioni strutturali, difendendola da obiezioni intuitive ma inconclusive. Mi muovo dunque verso la seconda metà della dissertazione, in cui l'esposizione cede il passo alla critica. Anzitutto (Ch. 4) sostengo che l’argomento normalmente usato per stabilire che i modelli generativi siano rappresentazioni strutturali non è valido, e fallisce nello stabilire che i modelli generativi siano strutturalmente simili ai loro bersagli rappresentazionali. Considero quindi vie alternative in cui quella somiglianza strutturale potrebbe essere stabilita, mostrando come esse o falliscono o Ξniscano per violare qualche altra condizione che individua le rappresentazioni strutturali. Argomento in seguito (Ch.5) che l’aΛermazione che i modelli generativi siano rappresentazioni strutturali non sarebbe legittima neppure se la somiglianza strutturale cercata fosse stabilita; anche se i modelli generativi soddisfacessero la deΞnizione rilevante di somiglianza strutturale sarebbe in ogni caso scorretto considerarli delle rappresentazioni. Questo perché, almeno data la deΞnizione corrente, le rappresentazioni strutturali non sono in grado di giocare il ruolo funzionale rilevante, ed è quindi in primo luogo scorretto identiΞcarle come rappresentazioni tout court. Questa conclusione motiva un esame diretto dei modelli generativi, così da determinarne la natura (Ch. 6). Così, analizzo il più semplice modello generativo che conosco: una rete neurale impiegata come “cervello” da diversi robot in grado di interagire Οuidamente ed intelligentemente con il loro ambiente. Chiarisco come reti neurali di quel tipo permettano ai robot di apprendere le abilità sensorimotorie che essi necessitano per risolvere i compiti assegnatigli; ed argomento che nè l’architettura nè alcuna sua parte sono in grado di qualiΞcarsi come veicoli rappresentazionali. Le strutture Ξsiche che implementano i modelli generativi sono così rivelate essere strutture non-rappresentazionali che semplicemente istanziano le abilità sensorimotorie di un agente. Mostro quindi che la mia conclusione generalizza ben oltre il semplice esempio considerato, sostenendo che aggiungere ulteriori ingredienti computazionali all’architettura considerata o considerare direttamente implementazioni alternative dei modelli generativi non mi costringe in alcun modo a rivedere il mio verdetto. Risolvo quindi diverse preoccupazioni che il verdetto qui oΛerto potrebbe generare, e chiudo la dissertazione.
This dissertation focuses on generative models in the Predictive Processing framework. It is commonly accepted that generative models are structural representations; i.e. physical particulars representing via structural similarity. Here, I argue this widespread account is wrong: when closely scrutinized, generative models appear to be non-representational control structures realizing an agent’s sensorimotor skills. The dissertation opens (Ch.1) introducing the Predictive Processing account of perception and action, and presenting some of its connectionist implementations, thereby clarifying the role generative models play in Predictive Processing. Subsequently, I introduce the conceptual framework guiding the research (ch.2). I briefly elucidate the metaphysics of representations, emphasizing the specific functional role played by representational vehicles within the systems of which they are part. I close the first half of the dissertation (Ch.3) introducing the claim that generative models are structural representations, and defending it from intuitive but inconclusive objections. I then move to the second half of the dissertation, switching from exposition to criticism. First (Ch.4), I claim that the argument allegedly establishing that generative models are structural representations is flawed beyond repair, for it fails to establish generative models are structurally similar to their targets. I then consider alternative ways to establish that structural similarity, showing they all either fail or violate some other condition individuating structural representations. I further argue (Ch.5) that the claim that generative models are structural representations would not be warranted even if the desired structural similarity were established. For, even if generative models were to satisfy the relevant definition of structural representation, it would still be wrong to consider them as representations. This is because, as currently defined,structural representations fail to play the relevant functional role of representations, and thus cannot be rightfully identified as representations in the first place. This conclusion prompts a direct examination of generative models, to determine their nature (Ch.6). I thus analyze the simplest generative model I know of: a neural network functioning as a robotic “brain” and allowing different robotic creatures to swiftly and intelligently interact with their environments. I clarify how these networks allow the robots to acquire and exert the relevant sensorimotor abilities needed to solve the various cognitive tasks the robots are faced with, and then argue that neither the entire architecture nor any of its parts can possibly qualify as representational vehicles. In this way, the structures implementing generative models are revealed to be non-representational structures that instantiate an agent’s relevant sensorimotor skills. I show that my conclusion generalizes beyond the simple example I considered, arguing that adding computational ingredients to the architecture, or considering altogether different implementations of generative models, will in no way force a revision of my verdict. I further consider and allay a number of theoretical worries that it might generate, and then briefly conclude the dissertation.
The metaphysics of Predictive Processing A non-representational account
FACCHIN, MARCO
2022
Abstract
Questa dissertazione si concentra sui modelli generativi nel quadro teorico del Predictive Processing. È comunemente accettato che i modelli generativi siano rappresentazioni strutturali, cioè particolari concreti che rappresentano per mezzo di una somiglianza strutturale. Argomento che questa credenza diΛusa è errata: se osservati attentamente, i modelli generativi appaiono essere strutture di controllo non-rappresentazionali che realizzano le abilità sensomotorie di un agente. Apro la dissertazione introducendo (Ch. 1) il modo in cui Predictive Processing rende ragione della percezione e dell’azione, presentandone alcune implementazioni connessioniste così da chiariΞcare il ruolo giocato dai modelli generativi all'interno della teoria. Introduco quindi (Ch. 2) il quadro concettuale che guida la mia ricerca. Elucido in breve la metaΞsica delle rappresentazioni, enfatizzando soprattutto il ruolo funzionale speciΞco che i veicoli rappresentazionali giocano all’interno dei sistemi di cui sono parte. Chiudo la prima metà della dissertazione (Ch. 3) introducendo l’asserzione che i modelli generativi sono rappresentazioni strutturali, difendendola da obiezioni intuitive ma inconclusive. Mi muovo dunque verso la seconda metà della dissertazione, in cui l'esposizione cede il passo alla critica. Anzitutto (Ch. 4) sostengo che l’argomento normalmente usato per stabilire che i modelli generativi siano rappresentazioni strutturali non è valido, e fallisce nello stabilire che i modelli generativi siano strutturalmente simili ai loro bersagli rappresentazionali. Considero quindi vie alternative in cui quella somiglianza strutturale potrebbe essere stabilita, mostrando come esse o falliscono o Ξniscano per violare qualche altra condizione che individua le rappresentazioni strutturali. Argomento in seguito (Ch.5) che l’aΛermazione che i modelli generativi siano rappresentazioni strutturali non sarebbe legittima neppure se la somiglianza strutturale cercata fosse stabilita; anche se i modelli generativi soddisfacessero la deΞnizione rilevante di somiglianza strutturale sarebbe in ogni caso scorretto considerarli delle rappresentazioni. Questo perché, almeno data la deΞnizione corrente, le rappresentazioni strutturali non sono in grado di giocare il ruolo funzionale rilevante, ed è quindi in primo luogo scorretto identiΞcarle come rappresentazioni tout court. Questa conclusione motiva un esame diretto dei modelli generativi, così da determinarne la natura (Ch. 6). Così, analizzo il più semplice modello generativo che conosco: una rete neurale impiegata come “cervello” da diversi robot in grado di interagire Οuidamente ed intelligentemente con il loro ambiente. Chiarisco come reti neurali di quel tipo permettano ai robot di apprendere le abilità sensorimotorie che essi necessitano per risolvere i compiti assegnatigli; ed argomento che nè l’architettura nè alcuna sua parte sono in grado di qualiΞcarsi come veicoli rappresentazionali. Le strutture Ξsiche che implementano i modelli generativi sono così rivelate essere strutture non-rappresentazionali che semplicemente istanziano le abilità sensorimotorie di un agente. Mostro quindi che la mia conclusione generalizza ben oltre il semplice esempio considerato, sostenendo che aggiungere ulteriori ingredienti computazionali all’architettura considerata o considerare direttamente implementazioni alternative dei modelli generativi non mi costringe in alcun modo a rivedere il mio verdetto. Risolvo quindi diverse preoccupazioni che il verdetto qui oΛerto potrebbe generare, e chiudo la dissertazione.File | Dimensione | Formato | |
---|---|---|---|
Tesi Facchin.pdf
accesso aperto
Dimensione
2.43 MB
Formato
Adobe PDF
|
2.43 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/296412
URN:NBN:IT:IUSSPAVIA-296412