Adversarial Learning in Videosorveglianza: Ricostruzione dell'Aspetto di Persone Parzialmente Occluse

Fulgeri, Federico

Quando intravediamo una persona in mezzo ad una folla, à¨ spesso difficile distinguerne l'intera figura. Le occlusioni, dovute alla presenza di altri soggetti, portano ad una mancanza di informazioni visuali che normalmente potrebbero essere utilizzate per riconoscere, re-identificare o semplicemente classificare l'individuo in questione. Grazie alla nostra esperienza pregressa e all'immaginazione, possiamo farci un'idea relativa alle parti del corpo non visibili. Allo stesso modo, soluzioni realizzate attraverso modelli di AI, possono provare ad immaginare le informazioni visuali mancanti. Infatti, le deep neural network, se appositamente addestrate con immagini di persone visibili e di soggetti occlusi, mostrano prestazioni alquanto sorprendenti nella risoluzione di questo problema. L'obiettivo di questo lavoro à¨ quello di generare immagini di persone completamente visibili, a partire da una loro versione parzialmente occlusa. In particolare, tali immagini dovranno raffigurare individui con silhouettes plausibili e, congiuntamente, dovranno preservare gli attributi osservabili (es. uomo/donna) delle figure di riferimento. A tale scopo, si à¨ proposto un nuovo approccio che sfrutta diverse architetture facenti parte dello stato dell'arte, in particolare: Unet, GAN e reti neurali per la classificazione di attributi. Il modello finale à¨ stato addestrato con un'apposita funzione di loss che ha lo scopo di orientare la rete a rimuovere le occlusioni tenendo in considerazione anche gli attributi delle persone. Gli esperimenti volti a valutare la bontà del modello sono stati effettuati sia su dati sintetici che su dati reali. I risultati ottenuti sono sorprendenti e si allineano con quelli presenti in letteratura. Questo studio non à¨ che un inizio di quella che puà² essere una pià¹ ampia ricerca sul riconoscimento del comportamento delle persone in ambienti affollati.

Adversarial Learning in Videosorveglianza: Ricostruzione dell'Aspetto di Persone Parzialmente Occluse

FULGERI, FEDERICO

2018

Abstract

Quando intravediamo una persona in mezzo ad una folla, à¨ spesso difficile distinguerne l'intera figura. Le occlusioni, dovute alla presenza di altri soggetti, portano ad una mancanza di informazioni visuali che normalmente potrebbero essere utilizzate per riconoscere, re-identificare o semplicemente classificare l'individuo in questione. Grazie alla nostra esperienza pregressa e all'immaginazione, possiamo farci un'idea relativa alle parti del corpo non visibili. Allo stesso modo, soluzioni realizzate attraverso modelli di AI, possono provare ad immaginare le informazioni visuali mancanti. Infatti, le deep neural network, se appositamente addestrate con immagini di persone visibili e di soggetti occlusi, mostrano prestazioni alquanto sorprendenti nella risoluzione di questo problema. L'obiettivo di questo lavoro à¨ quello di generare immagini di persone completamente visibili, a partire da una loro versione parzialmente occlusa. In particolare, tali immagini dovranno raffigurare individui con silhouettes plausibili e, congiuntamente, dovranno preservare gli attributi osservabili (es. uomo/donna) delle figure di riferimento. A tale scopo, si à¨ proposto un nuovo approccio che sfrutta diverse architetture facenti parte dello stato dell'arte, in particolare: Unet, GAN e reti neurali per la classificazione di attributi. Il modello finale à¨ stato addestrato con un'apposita funzione di loss che ha lo scopo di orientare la rete a rimuovere le occlusioni tenendo in considerazione anche gli attributi delle persone. Gli esperimenti volti a valutare la bontà del modello sono stati effettuati sia su dati sintetici che su dati reali. I risultati ottenuti sono sorprendenti e si allineano con quelli presenti in letteratura. Questo studio non à¨ che un inizio di quella che puà² essere una pià¹ ampia ricerca sul riconoscimento del comportamento delle persone in ambienti affollati.

Scheda breve

Scheda completa

Scheda completa (DC)

	Data di pubblicazione
	
				2018
			
	Lingua
	
				it
			
	Parola chiave
	
				Dipartimento di Ingegneria "Enzo Ferrari"
			
	Nome Editore
	
				Università degli Studi di Modena e Reggio Emilia
			
	Collezione di appartenenza
	
				Università degli Studi di Modena e Reggio Emilia

File in questo prodotto:

File	Dimensione	Formato
Tesi_magistrale_fin.pdf accesso solo da BNCF e BNCR Tipologia: Altro materiale allegato Licenza: Tutti i diritti riservati Dimensione 5.85 MB Formato Adobe PDF	5.85 MB	Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/297542

Il codice NBN di questa tesi è URN:NBN:IT:UNIMORE-297542