Calcolo di equilibri auto-confermanti nei giochi in forma estesa con due giocatori Fabio Panozzo Politecnico di Milano 3 maggio 2010 Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 1 / 21
Sommario 1 Obiettivo della tesi 2 Stato dell arte Giochi in forma strategica Calcolo di un NE Giochi in forma estesa 3 Equilibrio auto-confermante Unitario ed eterogeneo Razionalizzabile 4 Formulazioni di programmazione matematica USCE HSCE RSCE 5 Valutazione sperimentale 6 Conclusioni e sviluppi futuri Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 2 / 21
Obiettivo della tesi Introduzione Nel campo dell Intelligenza Artificiale (...studio della progettazione di agenti intelligenti. (Poole et al., 1998)) ed in particolare in Teoria dei Giochi (disciplina matematica che studia l interazione di agenti indipendenti e portatori di interessi) Il concetto più importante e famoso nei giochi competitivi è equilibrio di Nash definisce come un agente dovrebbe agire per massimizzare la propria utilità in un ambiente in cui essa dipende da ciò che compiono gli avversari Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 3 / 21
Obiettivo della tesi Introduzione Assunzioni NE struttura del gioco payoffs degli avversari prior bayesiano conoscenza comune Problema queste assunzioni sono raramente verificate in realtà necessità di sviluppare un nuovo concetto di equilibrio stabile L equilibrio che risponde ai precedenti requisiti è equilibrio auto-confermante Obiettivo della tesi Formulare algoritmi efficienti per il calcolo di equilibri auto-confermanti Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 4 / 21
Stato dell arte Giochi in forma strategica Stato dell arte Giochi in forma strategica Forma strategica: la più famosa e comunemente utilizzata forma di rappresentazione di un gioco Giocatore 1 Giocatore 2 C D c 3,3 0,5 d 5,0 1,1 Tabella: Dilemma del prigioniero Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 5 / 21
Stato dell arte Calcolo di un NE Stato dell arte Calcolo di un NE Definizione (Nash equilibrium) Un equilibrio di Nash (NE) è una strategia s = (s 1,...,s n ) tale che {s u i (s i,s i ) u i (s i,s i ) i, s i s i } Giocatore 1 Giocatore 2 C D c 3,3 0,5 d 5,0 1,1 Teorema Il problema di calcolare un NE è PPAD-completo Osservazione P PPAD NP Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 6 / 21
Stato dell arte Calcolo di un NE Stato dell arte Calcolo di un NE Algoritmo (PNS) identificare l insieme dei possibili supporti verificare se esiste una d.d.p. sulle azioni che identifichi un NE problema di programmazione lineare Algoritmo (SGC) introduzione variabili booleane attivazione dei vincoli problema di programmazione matematica misto-intero Algoritmo (LH) ricercare un NE è equivalente ad un problema di complementarità lineare (LCP) di programmazione matematica Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 6 / 21
Stato dell arte Giochi in forma estesa Stato dell arte Giochi in forma estesa Forma estesa: un altra importante forma di rappresentazione dei giochi 1 L M R 8,0 2 l r l r 12,1 3,4 4,2 9,3 Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 7 / 21
Stato dell arte Giochi in forma estesa Stato dell arte Equilibrio sequenziale Equilibrio sequenziale concetto di equilibrio nei giochi ad informazione imperfetta raffinamento dell equilibrio di Nash Algoritmo credenza µ i : d.d.p. sui nodi degli information set valutazione v = (µ,σ) è SE, se, sotto perturbazione µ è consistente con σ σ è sequenzialmente razionale con µ Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 8 / 21
Equilibrio auto-confermante Equilibrio auto-confermante Ipotesi conoscenza comune struttura del gioco azioni giocate sul path d equilibrio NON conoscenza comune payoffs degli avversari prior bayesiano azioni fuori dal path d equilibrio Credenza giocatore i: ˆp i (σ i ) concetto analogo a quello di probabilità definito sulle possibili azioni dell avversario Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 9 / 21
Equilibrio auto-confermante Unitario ed eterogeneo Equilibrio auto-confermante Unitario ed eterogeneo Definizione (Unitary self-confirming equilibrium) Un equilibrio auto-confermante unitario (USCE) è una sequenza σ in cui esiste una credenza ˆp i per ogni s i supp(σ i ): u i (s i ˆp i ) u i (s i ˆp i ) ˆp i (σ i (H(σ))) = 1 s i S i, e Definizione (Heterogeneous self-confirming equilibrium) Un equilibrio auto-confermante eterogeneo (HSCE) è una sequenza σ in cui, per ogni s i supp(σ i ), esiste una credenza ˆp i tale che: u i (s i ˆp i ) u i (s i ˆp i ) ˆp i (σ i (H(s i,σ i ))) = 1 s i S i, e Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 10 / 21
Equilibrio auto-confermante Razionalizzabile Equilibrio auto-confermante Razionalizzabile Definizione (Rationalizable self-confirming equilibrium) Una sequenza σ è un RSCE se e solo se esiste una collezione di insiemi di coppie di strategia-credenza SB 1,...,SB n, tale che per tutti i giocatori i: 1. se (σ i,v i ) SB i, allora σ i è la best-response a v i in ogni information set raggiungibile con probabilità positiva giocando (σ i,σ i: i ); 2. ogni (σ i,v i ) SB i ha le credenze b i indotte da σ; 3. SB 1,...,SB n è credenza-chiusa. Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 11 / 21
Formulazioni di programmazione matematica Formulazioni Strategie pure USCE PNS HSCE PNS Strategie miste USCE PNS e SGC HSCE PNS, SGC e L RSCE L Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 12 / 21
Formulazioni di programmazione matematica USCE Ricercare un USCE in strategie pure Algoritmo PNS Complessità polinomiale nella dimensione dell input Osservazione Ogni HSCE in strategie pure equivale ad un USCE Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 13 / 21
Formulazioni di programmazione matematica Ricercare un USCE USCE Algoritmo PNS e SGC L ricorre a vincoli non lineari aumentando la complessità del problema Variabili del problema probabilità di giocare le strategie p i credenze sulle strategie dell avversario ˆp i Teorema Il problema di calcolare un USCE è PPAD-completo Osservazione La strategia ˆσ = (ˆσ 1, ˆσ 2 ) costituisce un NE Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 14 / 21
Formulazioni di programmazione matematica HSCE Ricercare un HSCE Algoritmo PNS SGC L Variabili del problema probabilità di giocare le strategie p i credenze sulle strategie dell avversario ˆp i,σi Teorema Il problema di calcolare un HSCE è PPAD-completo Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 15 / 21
Formulazioni di programmazione matematica RSCE Ricercare un RSCE Algoritmo L (versione per giochi perturbati) PNS e SGC non sviluppati perché l unico algoritmo esistente per i giochi perturbati si basa su complementarità lineari Variabili del problema probabilità di giocare le strategie p i credenze sulle strategie dell avversario ˆp i Teorema Il problema di calcolare un RSCE è PPAD-completo Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 16 / 21
Formulazioni di programmazione matematica RSCE RUSCE vs RHSCE RUSCE Concetto di razionabilità applicato agli USCE RHSCE Concetto di razionalibilità esteso agli HSCE Teorema Dato un RHSCE (σ,µ), ogni valutazione (σ,µ ) con σ = σ e µ i = µ i,σi, per ogni σ i è un RUSCE. Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 17 / 21
Valutazione sperimentale Valutazione sperimentale Giochi ad informazione perfetta fattore di branching 2 3 4 5 1 0.0056 0.0063 0.0064 0.0057 0.0064 0.0071 0.0051 0.0058 0.0074 0.0044 0.0063 0.0118 2 0.0057 0.0104 0.0107 0.0135 0.0261 0.0575 0.0506 0.1396 0.3962 0.3165 3.5454 7.9777 livelli 3 0.0094 0.0225 0.0238 0.0903 0.7179 2.351 3.438 34.592 54.068 6.745 22.115 166.66 4 0.0176 0.0633 0.0982 0.453 19.212 77.942 5 0.4402 0.6891 0.7544 6 2.2182 3.0445 3.7094 7 14.503 19.857 53.546 Legenda: Equilibrio di Nash; Equilibrio auto-confermante unitario; Equilibrio auto-confermante eterogeneo Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 18 / 21
Valutazione sperimentale Valutazione sperimentale Giochi ad informazione imperfetta fattore di branching 2 3 4 5 1 0.0013 0.0014 0.0016 0.0013 0.0017 0.0018 0.0019 0.0020 0.0023 0.0012 0.0036 0.0039 2 0.0016 0.0024 0.0025 0.0032 0.0053 0.0102 0.0126 0.0334 0.0929 0.1049 0.1666 1.9231 livelli 3 0.0026 0.0054 0.0067 0.0453 0.2452 0.4138 22.934 41.717 94.377 4 0.0072 0.0203 0.0280 0.8348 6.750 44.103 5 0.0185 0.0640 0.1318 6 0.0580 0.7701 0.7864 7 0.0801 1.4389 4.1906 8 1.1518 11.005 30.293 Legenda: Equilibrio di Nash; Equilibrio auto-confermante unitario; Equilibrio auto-confermante eterogeneo Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 18 / 21
Valutazione sperimentale Valutazione sperimentale Giochi ad informazione completamente imperfetta fattore di branching 2 3 4 5 1 0.0054 0.0056 0.0063 0.0043 0.0049 0.0050 0.0044 0.0045 0.0073 0.0031 0.0059 0.0100 2 0.0057 0.0104 0.0107 0.0109 0.0215 0.0256 0.0937 0.2891 0.4747 3.2778 15.459 19.810 livelli 3 0.0094 0.0225 0.0238 0.1085 0.2862 0.8192 44.703 70.098 145.72 4 0.0176 0.0632 0.0982 1.0515 24.107 29.550 5 0.4400 0.6891 0.7544 6 2.2182 3.0447 3.7093 7 14.503 19.857 53.546 Legenda: Equilibrio di Nash; Equilibrio auto-confermante unitario; Equilibrio auto-confermante eterogeneo Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 18 / 21
Conclusioni e sviluppi futuri Conclusioni Contributi originali adattamento dell algoritmo PNS al caso di giochi in forma estesa formulazioni matematiche per la ricerca di NE, USCE non NE, USCE ed HSCE adatte per la soluzione attraverso un adattamento dell algoritmo PNS per la ricerca di un NE in un gioco in forma strategica formulazioni matematiche per la ricerca di NE, USCE non NE, USCE ed HSCE con vincoli misto-interi formulazioni matematiche per la ricerca di USCE non NE, USCE, HSCE ed RSCE con vincoli di complementarità lineari calcolo e dimostrazione della complessità computazionale della ricerca di USCE, HSCE ed RSCE valutazioni sperimentali del tempo di computazione utilizzando l algoritmo misto-intero per il calcolo di NE, USCE e HSCE Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 19 / 21
Conclusioni e sviluppi futuri Conclusioni Sviluppi futuri sviluppare algoritmi per calcolare equilibri auto-confermanti in giochi con più di due giocatori studiare metodi di ricerca di equilibri per giochi in cui c è incertezza sui parametri, come ad esempio, nei giochi Bayesiani formulare la nozione di apprendimento in modo formale nei giochi ripetuti e sviluppare soluzioni computazionalmente efficienti di agenti evolutivi che giocano analizzare soluzioni alternative al concetto di equilibrio auto-confermante e progettare metodi per la ricerca computazionalemente efficiente di tali equilibri Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 20 / 21
Pubblicazioni Conclusioni e sviluppi futuri Parte del presente lavoro è stato Pubblicato Interactive Decision Theory and Game Theory workshop (IDTGT) at AAAI 2010 Sottomesso The 26th Conference on Uncertainty in Artificial Intelligence (UAI2010) Fabio Panozzo (Politecnico di Milano) Calcolo di equilibri auto-confermanti 3 maggio 2010 21 / 21