Quando intravediamo una persona in mezzo ad una folla, ਠspesso difficile distinguerne l'intera figura. Le occlusioni, dovute alla presenza di altri soggetti, portano ad una mancanza di informazioni visuali che normalmente potrebbero essere utilizzate per riconoscere, re-identificare o semplicemente classificare l'individuo in questione. Grazie alla nostra esperienza pregressa e all'immaginazione, possiamo farci un'idea relativa alle parti del corpo non visibili. Allo stesso modo, soluzioni realizzate attraverso modelli di AI, possono provare ad immaginare le informazioni visuali mancanti. Infatti, le deep neural network, se appositamente addestrate con immagini di persone visibili e di soggetti occlusi, mostrano prestazioni alquanto sorprendenti nella risoluzione di questo problema. L'obiettivo di questo lavoro ਠquello di generare immagini di persone completamente visibili, a partire da una loro versione parzialmente occlusa. In particolare, tali immagini dovranno raffigurare individui con silhouettes plausibili e, congiuntamente, dovranno preservare gli attributi osservabili (es. uomo/donna) delle figure di riferimento. A tale scopo, si ਠproposto un nuovo approccio che sfrutta diverse architetture facenti parte dello stato dell'arte, in particolare: Unet, GAN e reti neurali per la classificazione di attributi. Il modello finale ਠstato addestrato con un'apposita funzione di loss che ha lo scopo di orientare la rete a rimuovere le occlusioni tenendo in considerazione anche gli attributi delle persone. Gli esperimenti volti a valutare la bontà  del modello sono stati effettuati sia su dati sintetici che su dati reali. I risultati ottenuti sono sorprendenti e si allineano con quelli presenti in letteratura. Questo studio non ਠche un inizio di quella che puಠessere una pi๠ampia ricerca sul riconoscimento del comportamento delle persone in ambienti affollati.

Adversarial Learning in Videosorveglianza: Ricostruzione dell'Aspetto di Persone Parzialmente Occluse

2018

Abstract

Quando intravediamo una persona in mezzo ad una folla, ਠspesso difficile distinguerne l'intera figura. Le occlusioni, dovute alla presenza di altri soggetti, portano ad una mancanza di informazioni visuali che normalmente potrebbero essere utilizzate per riconoscere, re-identificare o semplicemente classificare l'individuo in questione. Grazie alla nostra esperienza pregressa e all'immaginazione, possiamo farci un'idea relativa alle parti del corpo non visibili. Allo stesso modo, soluzioni realizzate attraverso modelli di AI, possono provare ad immaginare le informazioni visuali mancanti. Infatti, le deep neural network, se appositamente addestrate con immagini di persone visibili e di soggetti occlusi, mostrano prestazioni alquanto sorprendenti nella risoluzione di questo problema. L'obiettivo di questo lavoro ਠquello di generare immagini di persone completamente visibili, a partire da una loro versione parzialmente occlusa. In particolare, tali immagini dovranno raffigurare individui con silhouettes plausibili e, congiuntamente, dovranno preservare gli attributi osservabili (es. uomo/donna) delle figure di riferimento. A tale scopo, si ਠproposto un nuovo approccio che sfrutta diverse architetture facenti parte dello stato dell'arte, in particolare: Unet, GAN e reti neurali per la classificazione di attributi. Il modello finale ਠstato addestrato con un'apposita funzione di loss che ha lo scopo di orientare la rete a rimuovere le occlusioni tenendo in considerazione anche gli attributi delle persone. Gli esperimenti volti a valutare la bontà  del modello sono stati effettuati sia su dati sintetici che su dati reali. I risultati ottenuti sono sorprendenti e si allineano con quelli presenti in letteratura. Questo studio non ਠche un inizio di quella che puಠessere una pi๠ampia ricerca sul riconoscimento del comportamento delle persone in ambienti affollati.
2018
it
Dipartimento di Ingegneria "Enzo Ferrari"
Università degli Studi di Modena e Reggio Emilia
File in questo prodotto:
File Dimensione Formato  
Tesi_magistrale_fin.pdf

accesso solo da BNCF e BNCR

Tipologia: Altro materiale allegato
Licenza: Tutti i diritti riservati
Dimensione 5.85 MB
Formato Adobe PDF
5.85 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/297542
Il codice NBN di questa tesi è URN:NBN:IT:UNIMORE-297542