Lezione 5 - Giochi Ripetuti Simone D Alessandro Università di Pisa Università di Pisa Pisa, 6 marzo 2013
Matching Pennies Matching pennies è famoso perché mostra che in strategie pure anche in un gioco molto semplice può non esistere un equilibrio di Nash H P1 T P2 H T 1 1 1 1 1 1 1 1 P1 è il giocatore che vince se entrambi i giocatori scelgono la stessa faccia P2 è il giocatore che vince se i due giocatori scelgono facce diverse.
Matching Pennies (Figura presa da Wikipedia) - Si possono rappresentare le funzioni di reazione delle strategie miste - x è la probabilità di giocare H per P2, y è la probabilità di giocare H per P1. - Mettendo insieme le due curve di reazione si trova che l unico equilibrio di Nash è costituito dalla coppia di strategie miste (0.5, 0.5).
Gioco dell ultimatum Nel gioco dell ultimatum il primo giocatore, (il proponenete) offre una divisione della torta al secondo giocatore (il ricevitore), che può decidere se accettare o rigettare la proposta. Se rigetta la proposta nessuno dei due giocatori ottiene niente. P1 x 1 x 2 P2 P2 x 3 x 4 x 3 x 4 y 1 5 5 y 2 0 0 y 3 8 2 y 4 0 0 Tre equilibri di Nash: (x 1, (x 3, x 4 )), (x 2, (x 4, x 3 )), (x 2, (x 3, x 3 )) Uno solo per induzione a ritroso: (x 2, (x 3, x 3 ))
Gioco dell ultimatum Un analisi dalla prospettiva della teoria dei giochi di questo tipo di interazioni suggerisce che il proponente dovrebbe offrire la fetta più piccola possibile della torta all altro giocatore, e questo dovrebbe sempre accettare Al contrario, studi sperimentali mostrano che l offerta media è tra il 30% e il 40% della torta, e che il ricevitore rifiuta mediamente proposte sotto il 30% Ci sono stati tantissimi studi per cercare di risolvere questo puzzle NOTARE: gli esperimenti sono fatti con i soldi, che comunque non si traducano direttamente in utilità; l uomo potrebbe avere other-regarding preferences (in opposizione alle self-regarding preferences) ed in particolare un avversione verso l inequità.
Gioco del dittatore Il gioco del Dittatore è una variante (degenerata) del gioco dell ultimatum, in cui il proponente offre una certa divisione della torta che l altro giocatore semplicemente riceve, senza alcuna decisione P1 x 1 x 2 y 1 5 5 y 2 8 2 Anche in questo caso l evidenza sperimentale va contro la divisione fortemente iniqua.
Giochi di coordinamento Un gioco di coordinamento è un gioco in cui i giocatori devono coordinarsi sulla stessa strategia per ottenere un guadagno Ne scaturisce la presenza intrinseca di una molteplicità di equilibri di Nash. L P1 R P2 L R 1 0 1 0 0 1 0 1 Questo è un caso di gioco di coordinamento puro, l importante è coordinarsi sulla stessa azione e ogni azione funziona allo stesso modo Ci sono due equilibri di Nash in strategie pure: (L, L) and (R, R)
Giochi di coordinamento L P1 R P2 L R 2 0 2 0 0 1 0 1 In questo caso invece è meglio coordinarsi sulla strategia L che sulla strategia R, ed entrambi i giocatori hanno interessi coincidenti. Due equilibri di Nash in strategia pure: (L, L) and (R, R)
Gioco di coordinamento Battaglia dei sessi L P1 R P2 L R 2 0 1 0 0 1 0 2 In questo caso per P1 è meglio coordinarsi sulla strategia L, mentre per P2 è meglio coordinarsi sulla strategia R; i giocatori hanno preferenze diverse. Due equilibri di Nash in strategie pure: (L, L) and (R, R)
Gioco della caccia al cervo Il gioco della caccia al cervo descrive una situazione di conflitto tra la sicurezza e l efficienza paretiana (risale a Jean-Jacques Rousseau) Cervo P1 Lepre P2 Cervo Lepre 0 10 10 7 0 7 7 7 Ci sono due equilibri di Nash in strategie pure: (Cervo, Cervo) e (Lepre, Lepre) Lepre è sicura, ma (Cervo, Cervo) è Pareto efficiente mentre (Lepre, Lepre) non lo è.
gioco falco-colomba Il gioco falco-colomba (noto anche come il gioco del coniglio) descrive una situazione di conflitto su una risorsa P2 Hawk Dove P1 Hawk Dove V C 2 V C 2 0 V V V 2 0 V 2 with C > V > 0 Ci sono due equilibri di Nash in strategie pure: (Hawk, Dove) e (Dove, Hawk) (più un equilibrio in strategie miste) questo è un esempio di un gioco di anti-coordinamento.
Hawk-Dove Game (Figura presa da Wikipedia) - x è la probabilità di giocare falco (Hawk) per il giocatore P2; - y è la probabilità di giocare falco (Hawk) per il giocatore P1.
Gioco del millepiedi Il gioco del millepiedi è un gioco in forma estesa dove la perfezione nei sottogiochi produce un risultato paradossale Ci sono molti equilibri di Nash, ma un unico equilibrio di Nash perfetto nei sottogiochi che porta alla coppia di payoff (1,0) Questo è un risultato altamente inefficiente Gli sperimenti in laboratorio solitamente mostrano che i giocatori vanno avanti nel gioco ed escono vicino all ultimo stadio Se questo è un risultato dovuto alla razionalità limitata degli agenti, possiamo concludere che la razionalità limitata è qualche volta socialmente vantaggiosa!
Giochi dei beni pubblici Un gioco dei beni pubblici è un gioco dove un generico giocatore ha un ammontare x di moneta, e deve decidere quella parte di moneta x i da devolvere per la fornitura di beni pubblici La quantità di moneta devoluta viene moltiplicata per un fattore k, e divisa equamente tra il numero n di giocatori, con 1 < k < n Se viene giocato (x 1, x 2,..., x n ), allora il giocatore i riceve x x i + n j=1 k n x j L azione strettamente dominante è contribuire 0 (cioè, x i = 0 per ogni giocatore i) Questo esito predetto dalla teoria è Pareto-inefficiente Anche in questo caso, gli esperimenti in laboratorio mostrano che i giocatori contribuiscono per un ammontare positivo.
Equilibrio di Cournot-Nash ESEMPIO: Duopolio di Cournot 1 3/4 P2 0 0 f (q 2 ) f (q 1 ) P1 3/4 1 2 imprese: P1 e P2 p = 2 q 1 q 2 Costi, C(q i ) = cq i S 1 = [0, 1] S 2 = [0, 1] risposta ottima di P1 = q 1 = 1.5 q 2 2 risposta ottima di P2 = q 2 = 1.5 q 1 2 Equilibrio di Nash (q 1, q 2 ) = (0.5, 0.5) Collusione: (q 1, q 2 ) = (3/8, 3/8) equilibrio di Nash Deviazione: se P2 gioca q 2 = 3/8, la risposta ottima di P1 è q1 = 9/16 e viceversa.
Equilibrio Cournot-Nash C P1 D C 9 32 81 256 27 128 P2 D 9 32 27 128 81 256 1 4 1 4 Dilemma del Prigioniero: è una rappresentazione stilizzata di tante interazioni nella società 81 256 0.31 > 9 32 0.28 > 1 4 > 27 128 0.21 (D, D) è la soluzione per eliminazione delle strategie strettamente dominate (0.25, 0.25) non è Pareto efficiente, poiché (0.28, 0.28) è Pareto superiore.
Dilemma del prigioniero In generale ogni gioco nella forma G1 s C s NC C s C G2 s NC ND C D D NC ND NC dove D > C > NC > ND è un dilemma del prigioniero. Perchè le due imprese non si mettono d accordo?
Dilemma del prigioniero PUZZLE: la cooperazione è spesso osservata nelle interazioni sociali e nei mercati oligopolistici (es. OPEC)... come si spiega? Principale tentativo di risposta: dilemma del prigioniero ripetuto L iterazione potrebbe aiutare a sostenere la cooperazione poiché permette la punizione: se l altro giocatore devia in un certo momento, allora io potrò deviare invece che cooperare nel periodo successivo. Può essere comunque mostrato che se i due giocatori interagiscono per un numero finito n di periodi, allora la defezione in ogni periodo è l unico possibile esito: nell ultimo periodo non c è tempo per la punizione, poiché non c è un tempo futuro, quindi la defezione è l unico esito atteso dell ultimo periodo; quindi anche al periodo n 1 non c è spazio per la punizione, poiché al periodo dopo entrambi i giocatori deviano, allora al periodo n 1 l esito sarà di deviare; si può procedere all indietro in questo modo fino al periodo 1, ottenendo che la defezione sarà giocata in ogni periodo.
Giochi ripetuti Si può mostrare che la cooperazione può essere sostenuta come un comportamento di equilibrio in un dilemma del prigioniero ripetuto un numero infinito (o incerto) di volte, questo gioco viene definito supergioco mentre il gioco sottostante (es. il dilemma del prigioniero) viene definito gioco costituente i payoff in ogni periodo sono scontati di un fattore 0 < δ < 1 Supponiamo che entrambi i giocatori adottino la strategia del grilletto: cominciano cooperando, se l altro devia in un certo istante, allora il giocatore non coopera per tutti gli altri periodi. se il fattore di sconto è sufficientemente alto, allora cooperare (colludere) inizialmente è la strategia migliore con un ragionamento simile, si può dimostrare che esiste una condizione che assicura la cooperazione sempre.
Giochi ripetuti NOTARE: il min-max payoff per un giocatore in un gioco strategico è il minimo dei massimi payoff che tale giocatore può ottenere giocando la risposta ottima a tutti i diversi profili delle strategie degli altri giocatori. Folk theorem 1: Se i giocatori sono sufficientemente pazienti (cioè, δ tende a 1), allora ogni esito del gioco costituente che garantisce ad ogni giocatore un payoff più alto del suo min-max payoff può essere sostenuto come un equilibrio di Nash del supergioco Folk theorem 2: Se i giocatori sono sufficientemente pazienti (cioè, δ tende a 1), allora ogni esito del gioco costituente che garantisce ad ogni giocatore un payoff più alto del payoff ottenuto in un equilibrio di Nash del gioco costituente può essere sostenuto come un equilibrio di Nash perfetto nei sottogiochi nel supergioco.
Trigger Strategy Nei giochi ripetuti, la trigger strategy è importante perché permette di valutare se in un mercato oligopolistico c è la possibilità di mantenere la collusione come un equilibrio di Nash La trigger strategy può essere scritta nel seguente modo { s1 (t) = s C se t = 0 o t > 0 e s 2 (z) = s C z < t, s 1 (t) = s NC in tutti gli altri casi ; È facile verificare che se entrambi i giocatori adottano la trigger strategy, allora i giocatori collaborano sempre Se il giocatore 2 devia al tempo τ non c è alcuna possibilità di riprendere a colludere.
Trigger strategy Per stabilire sotto quali condizioni la trigger strategy è un equilibrio di Nash, assumiamo che il giocatore 1 adotti questa strategia e il giocatore 2 valuti cosa fare, seguendo una qualsiasi strategia y. Gli esiti ottenuti dal giocatore 2 sono rappresentati dalla successione Y 0, Y 1,..., Y t,.... Il valore della strategia y è dato dal valore attuale degli esiti V (y) = t=0 d t Yt dove 0 < d < 1 è il fattore di sconto. Poiché G1 gioca la trigger strategy, se Y t = C, allora Y t = C t < t ; e non esistono t e t (t t ) tali che Y t = Y t = D. i) esiste τ N 0 tale che Y τ = D e, se τ > 0, Y t = C 0 t < τ; ii) Y t = C t.
Trigger strategy Nei caso (i) la strategia y è certamente dominata da altre strategie se Y t = ND per qualche t > τ = Y t = NC t > τ. Vogliamo capire sotto quali condizioni conviene deviare al tempo t = ω o al tempo t = ω + 1. Consideriamo due strategie y e y tali che Y t = Y t tranne che per il tempo ω e ω + 1. In particolare Y ω = C, Y ω+1 = D e Y ω = D, Y ω+1 = NC. La differenza tra i valori attuali degli esiti delle sue strategie sono V (y) V (y ) = Cd ω + Dd ω+1 Dd ω NCd ω+1 = d ω [(C D) + (D NC)d] Se V (y) V (y ) 0 allora sarà conveniente procastinare la deviazione al periodo successivo e viceversa.
Trigger strategy Si ottiene che V (y) V (y ) 0 d D C D NC Poiché il segno di V (y) V (y ) non dipende da ω, sappiamo che se d D C D NC allora conviene procastinare la deviazione all infinito Al contrario se d < D C D NC In altre parole se e solo se d D C caso (ii), è dominante. converrà deviare a t = 0. D NC allora l esito di colludere, il Possiamo concludere che La trigger strategy sostiene un equilibrio di Nash in cui entrambe le imprese colludono se e solo se d D C D NC.
Equilibrio di Cournot-Nash ESEMPIO: 1 3/4 P2 0 0 f (q 2 ) f (q 1 ) P1 3/4 1 Duopolio di Cournot 2 imprese: P1 e P2 p = 2 q 1 q 2 S 1 = [0, 1] S 2 = [0, 1] risposta ottima di P1 = q 1 = 1.5 q 2 2 risposta ottima di P2 = q 2 = 1.5 q 1 2 Equilibrio di Nash (q 1, q 2 ) = (0.5, 0.5) Collusione: (q 1, q 2 ) = (3/8, 3/8) equilibrio di Nash Deviazione: se P2 gioca q 2 = 3/8, la risposta ottima di P1 è q1 = 9/16 e viceversa.
Equilibrio Cournot-Nash C P1 D C 9 32 81 256 27 128 P2 D 9 32 27 128 81 256 1 4 1 4 G1 s C s NC C s C G2 s NC ND C D D NC ND NC dove D > C > NC > ND è un dilemma del prigioniero.
Cournot-Collusione Verifichiamo per quali valori del fattore di sconto la collusione può essere portata avanti nel nostro esempio del modello di Cournot: d D C 81 D NC 256 9 32 81 256 1 4 = 9 17. Si può dimostrare che in generale se si considera una funzione di domanda lineare p(q) = a bq, e costi marginali e medi costanti, e pari a c; il risultato generale è che la collusione può essere sostenuta come un equilibrio di Nash, nel modello di Cournot, se e solo se d 9/17.