Strumenti della Teoria dei Giochi per l Informatica A.A. 2009/10 Lecture 2: 11 Marzo, 2010 Concetti di soluzione Docente Prof. Vincenzo Auletta Note redatte da: Vincenzo De Maio Abstract In questa lezione verranno affrontati i principali concetti di soluzione, con particolare riferimento a soluzioni in equilibrio secondo strategie dominanti e di equilibrio Nash. Queste note sono basate sui paragrafi da 2.2 a 2.5 di [1] e su quelli 1.3 e 1.4 di [2]. 1 Principali concetti di soluzione Abbiamo visto nella scorsa lezione che una soluzione del gioco (N, (A i ), (u i )) è un profilo (a 1,..., a n ) di azioni seguito dai giocatori durante lo svolgimento del gioco. Un concetto di soluzione X è un sottoinsieme delle soluzioni del gioco (X S 1 S 2... S n ) che contiene i profili di strategie che soddisfano particolari proprietà. In generale siamo interessati a proprietà di stabilità. 2 Strategie dominanti Una strategia a domina una strategia b se essa garantisce un utilità maggiore di b indipendentemente dalle azioni degli altri. Una strategia a si dice DOMINANTE se garantisce un utilità maggiore rispetto a tutte le altre strategie possibili a prescindere dalla strategia scelta da tutti gli altri giocatori. Parleremo di dominazione FORTE se u i (s i, s i) > u i (s i, s i ) altrimenti parleremo di dominazione DEBOLE. Una soluzione s è in equilibrio per strategie dominanti se ogni strategia s i è dominante per i. Detto più formalmente, s S è una soluzione con strategie dominanti se i e s Su i (s i, s i) u i (S ) Le soluzioni con strategie dominanti sono molto interessanti dal punto di vista computazionale perchè un giocatore può scegliere autonomamente, ignorando i comportamenti di tutti gli altri. Si osservi che una soluzione con strategie dominanti potrebbe non essere ottimale per nessun giocatore. Prendiamo come esempi il Dilemma del progioniero, già visto nella precedente lezione e il cosiddetto Pollution game(3.1). 3 Ottimo Paretiano Il concetto di ottimo paretiano, o ottimalità secondo Pareto, è stato introdotto dall economista italiano Vilfredo Pareto. Una strategia si dice ottima secondo Pareto se non è possibile aumentare 1
2 Lecture 2: Concetti di soluzione l utilità di un agente senza ridurre quella degli altri. Detto più formalmente, diremo che per un profilo di strategie a, a A 1 A 2... A n, a domina secondo Pareto a se i u i (a) u i (a ) ed i : u i (a) > u i (a ) Nel caso del Dilemma del prigioniero, ad esempio, la soluzione ottima secondo Pareto è (2, 2), in quanto l unico modo che ha un giocatore per aumentare la sua utilità è ridurre quella dell altro, nel caso specifico confessando e guadagnando l assoluzione, condannando l altro giocatore al massimo della pena. Ogni gioco ha almeno una soluzione ottima secondo Pareto, sulla quale esiste una relazione d ordine parziale. Esempio 3.1 (Pollution game) In questo gioco abbiamo n stati che devono decidere se varare o meno una normativa anti-inquinamento nel rispetto del protocollo di Kyoto; se una nazione decide di varare una normativa, i suoi costi di produzione aumenteranno di 3 unità, altrimenti restreranno invariati. In ogni caso, ogni nazione pagherà un aumento dei costi di produzione pari al numero di nazioni che non vareranno la suddetta normativa. Cosa conviene a ciascuno stato? Sia k il numero di nazioni che non varano la normativa: al momento di decidere, ogni stato sa che pagherà un costo pari a 3 + k qualora scegliesse di rispettare il protocollo di Kyoto e solo k se non volesse preoccuparsene; ragion per cui ovviamente sceglierà di non farlo. Si noti che in questo caso ogni nazione pagherà n, mentre nella soluzione ottima (ogni nazione vara la normativa) pagherebbero solo 3. In generale un gioco potrebbe non ammettere soluzioni con strategie dominanti, ma se esiste una soluzione dominante forte allora è unica (vedi Dilemma del prigioniero). Sono davvero pochi i giochi che hanno soluzioni con strategie dominanti. Il Mechanism design cerca di creare soluzioni in equilibrio per strategie dominanti inserendo dei pagamenti da parte degli agenti che ne modificano le funzioni utilità. L asta di Vickerey è sicuramente l esempio più famoso di gioco in cui esistono questi pagamenti. 3.1 Asta di Vickrey L asta di Vickrey, detta anche asta di secondo prezzo, fornisce un chiaro esempio del meccanismo dei pagamenti sopra descritto. L asta funziona nel seguente modo: abbiamo un bene in vendita ed n acquirenti con valutazioni positive v 1... v n del bene stesso e dobbiamo decidere a chi assegnarlo. L obiettivo sarebbe di assegnare il bene all acquirente con la valutazione più alta, ma le valutazioni sono private. Ogni acquirente fa la sua offerta per l oggetto: vince colui che fa l offerta maggiore, ma pagherà una cifra pari alla seconda offerta più alta, invece di pagare la cifra da lui offerta. Definiamo l utilita u i in questo gioco nel modo seguente: Dato b = (b 1... b n ) profilo delle offerte dei giocatori i, u i (b) = { 0 se i non vince v i p altrimenti Dove p = max j i {b j }. Vogliamo far vedere che b = (v i... v n ) è una soluzione con strategie dominanti (cioè ad ogni agente conviene dichiarare la sua vera utilità indipendentemente da quello che dichiarano gli altri). Consideriamo l agente i che dichiara b i = v i e distinguiamo due casi:
Lecture 2: Concetti di soluzione 3 i vince i vince = b i = max j b j e u i = v i p = v i max j i b j sappiamo che p = max j i {b j } se il giocatore offre un prezzo b i maggiore, ovvero b i > b i ottiene la stessa utilità. ugualmente, se dichiara un prezzo minore di b i ma maggiore di p, ovvero b i > b i > p, vince l asta e ottiene la stessa utilità. se invece dichiara un prezzo minore o uguale a p, ovvero b i p allora il giocatore perde l asta; di conseguenza, u i = 0. i perde i perde = u i = 0(b i < max j b j ) se offre b i < b i allora u i = 0 se offre b i > b i e perde u i = 0 se offre b i > b i e vince u i = v i p < 0 in quanto p > v i Da questi risultati vediamo come i giocatori non sono incentivati a speculare e gli conviene dichiarare la loro valutazione, indipendentemente da quello che gli altri decidono di fare. 4 Equilibri di Nash puri Il concetto di equilibrio di Nash puro cattura la nozione di stato stabile, in cui ad un agente non conviene unilateralmente di cambiare strategia. Detto più formalmente, s S è un Equilibrio Nash se i e s i S i, u i (s i, s i ) u i (s i, s i ) Questa definizione ha due possibili interpretazioni: 1. Nessun agente cambia unilateralmente la sua strategia 2. Ogni agente sta utilizzando la migliore risposta alle strategie degli altri Banalmente, SD N E. Vediamo ora con degli esempi alcune proprietà relative all esistenza ed al numero di equilibri di Nash di un gioco. Un gioco può avere più Nash equilibria e non è possibile prevedere quale di questi verrà implementato. I Nash equilibria potrebbero non essere ottimali per nessun giocatore. Non tutti i giochi hanno Nash equilibria puri. Esempio 4.1 (Battle of sexes) Alice e Bob devono decidere come passare la serata. Le alternative sono andare a vedere una partita di basket o andare a fare shopping. Alice preferisce lo shopping e Bob preferisce il basket ma entrambi preferiscono stare insieme piuttosto che dividersi. Ognuno deve decidere autonomamente, senza consultare l altro. Il gioco è descritto dalla seguente matrice dei payoff. B S B 5, 6 1, 1 S 2, 2 6, 5
4 Lecture 2: Concetti di soluzione Questo gioco ha due stati stabili, (B, B)e(S, S) in cui gli agenti non sono interessati a cambiare unilateralmente. I due stati hanno valore diverso per gli agenti e non è possibile prevedere come si evolverà il gioco. Nell esempio precedente gli agenti avevano valutazioni divergenti e in ogni equilibrio di Nash c è un agente che massimizza la sua utilità. Il prossimo esempio, invece, mostriamo un gioco in cui di nuovo esistono due soluzioni in equilibrio Nash, ma una di queste è migliore dell altra per tutti gli agenti. Esempio 4.2 (Routing congestion game) Il nodo 0 deve spedire due flussi di dati sulla rete e lo può fare tramite i connection point A e B. Due flussi spediti sullo stesso connection point provocano congestione e quindi la soluzione ideale sarebbe spedire i flussi su route differenti. A B A 5, 5 1, 2 B 2, 1 6, 6 Abbiamo due stati stabili ma entrambi i giocatori preferiscono B. (A non è Pareto-optimal). Nonostante questo non è possibile prevedere lo stato in cui si evolverà il gioco. Il fatto che una soluzione in equilibrio di Nash potrebbe essere estremamente inefficiente per ognuno degli agenti è un fenomeno ben noto agli economisti che lo hanno identificato con il nome di Tragedy of commons, come mostrato nel prossimo esempio. Esempio 4.3 (Tragedy of commons) n Agenti vogliono spedire traffico su un canale condiviso con banda totale pari a 1. Ogni agente può spedire x i traffico, con x i [0, 1]. Gli agenti vogliono spedire più traffico possibile ma u i (x 1... x n ) = 0 se j x j > 1 u i (x 1... x n ) = x i (1 j x j) se j x j 1 Sia t = j i x j allora i vuole massimizzare x i (1 t x i ) quindi x i = 1 t 2. In una soluzione stabile, ovvero in cui nessuno cambia strategia, x i = 1 j i x j 2 Questo significa che ogni agente avrà un utile di i = 1... n x i = 1 n + 1 x i (1 j x j ) = 1 n + 1 (1 n n + 1 ) = 1 (n + 1) 2 Se invede ogni agente spedisse x i = 1 2n x i (1 j avrebbe un utile pari a x j ) = 1 2n (1 n 2n ) = 1 4n Se tutti gli agenti decidessero di non sfruttare al massimo il canale aumenterebbero le loro utilità. A quel punto, però, ognuno cercherebbe di accaparrarsi la frazione di banda libera. Infine osserviamo che non tutti i giochi strategici ammettono soluzioni in equilibrio di Nash puro.
Lecture 2: Concetti di soluzione 5 Esempio 4.4 (Matching pennies) Due giocatori devono mettere sul tavolo una moneta ciascuno: il giocatore 1 vince se le due monete avranno lo stesso lato e il giocatore 2 vince se sono diverse. T C T 1, -1-1, 1 C -1, 1 1, 1 In questo gioco non esistono stati stabili. Questo gioco appartiene alla classe dei giochi a somma 0 (utilità dei giocatori uguali ed opposte) che sono i più semplici dal punto di vista computazionale. Nella prossima lezione faremo vedere che gli unici stati stabili di questo gioco sono randomizzati: ogni giocatore sceglie a caso che lato della moneta mostrare. References [1] Ariel Rubinstein Martin L. Osborne. A course in Game Theory. MIT Press, 1994. [2] Noam Nisan, Tim Roughgarden, Eva Tardos, and Vijay V. Vazirani. Algorithmic Game Theory. Cambridge University Press, 2007.