I giochi a campo medio rappresentano modelli limite per giochi dinamici, simmetrici ed a somma non zero, quando il numero N di giocatori tende all’infinito. In questa tesi consideriamo giochi a campo medio e ad N giocatori in cui la posizione di ogni giocatore appartiene ad un insieme degli stati finito. Il tempo è continuo e l’orizzonte temporale è finito. A differenza dei precedenti lavori sull’argomento, utilizziamo una rappresentazione probabilistica delle dinamiche in termini di equazioni differenziali stocastiche rispetto a misure aleatorie di Poisson. Per prima cosa dimostriamo l’esistenza di soluzioni del gioco a campo medio con controlli rilassati, sia open-loop che feedback, in ipotesi piuttosto generali. Basandoci sulla rappresentazione probabilistica e su un argomento di accoppiamento, mostriamo che le soluzioni del gioco a campo medio forniscono εN equilibri di Nash per il gioco ad N giocatori, in strategie sia open-loop che feedback (non rilassate), con εN≤ costante √N. In ipotesi più forti troviamo anche soluzioni del gioco a campo medio con controlli feedback ordinari e dimostriamo l’unicità se l’orizzonte temporale è abbastanza piccolo oppure sotto ipotesi di monotonia. Poi, assumendo che i giocatori controllino solamente il proprio tasso di transizione da stato a stato, mostriamo la convergenza, per N che tende all’infinito, del gioco ad N giocatori alla dinamica limite data dal sistema del gioco a campo medio costituito da due ODE accoppiate, una in avanti e l’altra all’indietro. Sfruttiamo la cosiddetta master equation che nel presente contesto finito dimensionale è una PDE del primo ordine nel simplesso delle misure di probabilità. Se la master equation possiede una soluzione classica, allora tale solutione può essere usata per provare la convergenza delle funzioni valore degli N giocatori e degli equilibri di Nash feedback, ed anche la proprietà di propagazione del chaos per le traiettorie ottimali associate. Una condizione sufficiente per la regolarità richiesta per la master equation è data dalle ipotesi di monotonia. Inoltre impieghiamo il risultato di convergenza per stabilire un Teorema Limite Centrale ed un Principio delle Grandi Deviazioni per l’evoluzione delle misure empiriche ottimali. Infine analizziamo un’esempio in cui lo spazio degli stati è <−1,1> ed il costo è anti-monotono, e mostriamo che il gioco a campo medio possiede esattamente tre soluzioni. L’equilibrio di Nash è sempre unico e proviamo che il gioco ad N giocatori ammette sempre un limite: seleziona una singola soluzione del gioco a campo medio, tranne in un caso critico, pertanto c’è propagazione del chaos. Anche le funzioni valore convergono ed il limite è dato dalla soluzione di entropia della master equation, la quale in questo caso può essere scritta come una legge di conservazione scalare. Inoltre, vedendo il sistema del gioco a campo medio come le condizioni necessarie di ottimalità di un problema di controllo deterministico, mostriamo che il gioco ad N giocatori seleziona esattamente l’ottimo di questo problema quando è unico.

Finite State N-player and Mean Field Games

CECCHIN, ALEKOS
2018

Abstract

I giochi a campo medio rappresentano modelli limite per giochi dinamici, simmetrici ed a somma non zero, quando il numero N di giocatori tende all’infinito. In questa tesi consideriamo giochi a campo medio e ad N giocatori in cui la posizione di ogni giocatore appartiene ad un insieme degli stati finito. Il tempo è continuo e l’orizzonte temporale è finito. A differenza dei precedenti lavori sull’argomento, utilizziamo una rappresentazione probabilistica delle dinamiche in termini di equazioni differenziali stocastiche rispetto a misure aleatorie di Poisson. Per prima cosa dimostriamo l’esistenza di soluzioni del gioco a campo medio con controlli rilassati, sia open-loop che feedback, in ipotesi piuttosto generali. Basandoci sulla rappresentazione probabilistica e su un argomento di accoppiamento, mostriamo che le soluzioni del gioco a campo medio forniscono εN equilibri di Nash per il gioco ad N giocatori, in strategie sia open-loop che feedback (non rilassate), con εN≤ costante √N. In ipotesi più forti troviamo anche soluzioni del gioco a campo medio con controlli feedback ordinari e dimostriamo l’unicità se l’orizzonte temporale è abbastanza piccolo oppure sotto ipotesi di monotonia. Poi, assumendo che i giocatori controllino solamente il proprio tasso di transizione da stato a stato, mostriamo la convergenza, per N che tende all’infinito, del gioco ad N giocatori alla dinamica limite data dal sistema del gioco a campo medio costituito da due ODE accoppiate, una in avanti e l’altra all’indietro. Sfruttiamo la cosiddetta master equation che nel presente contesto finito dimensionale è una PDE del primo ordine nel simplesso delle misure di probabilità. Se la master equation possiede una soluzione classica, allora tale solutione può essere usata per provare la convergenza delle funzioni valore degli N giocatori e degli equilibri di Nash feedback, ed anche la proprietà di propagazione del chaos per le traiettorie ottimali associate. Una condizione sufficiente per la regolarità richiesta per la master equation è data dalle ipotesi di monotonia. Inoltre impieghiamo il risultato di convergenza per stabilire un Teorema Limite Centrale ed un Principio delle Grandi Deviazioni per l’evoluzione delle misure empiriche ottimali. Infine analizziamo un’esempio in cui lo spazio degli stati è <−1,1> ed il costo è anti-monotono, e mostriamo che il gioco a campo medio possiede esattamente tre soluzioni. L’equilibrio di Nash è sempre unico e proviamo che il gioco ad N giocatori ammette sempre un limite: seleziona una singola soluzione del gioco a campo medio, tranne in un caso critico, pertanto c’è propagazione del chaos. Anche le funzioni valore convergono ed il limite è dato dalla soluzione di entropia della master equation, la quale in questo caso può essere scritta come una legge di conservazione scalare. Inoltre, vedendo il sistema del gioco a campo medio come le condizioni necessarie di ottimalità di un problema di controllo deterministico, mostriamo che il gioco ad N giocatori seleziona esattamente l’ottimo di questo problema quando è unico.
28-nov-2018
Inglese
Mean field games, N-person game, Nash equilibrium, Finite State Markov chain, Relaxed controls, Poisson random measures, Master Equation, propagation of Chaos, Central limit theorem, Large deviation principle, Entropy solutions.
Università degli studi di Padova
File in questo prodotto:
File Dimensione Formato  
Thesis_definitiva.pdf

accesso aperto

Dimensione 3.18 MB
Formato Adobe PDF
3.18 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/111079
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-111079