Università degli Studidi Bologna Facoltà di Scienze Politiche Corso di Laurea in Scienze Politiche, Sociali e Internazionali Microeconomia(A-E) Matteo Alvisi Parte 6 (b) TEORIA DEI GIOCHI E DECISIONI STRATEGICHE 1 Programma delle Lezioni 1. Introduzione alla Teoria dei Giochi 2. Strategie Dominanti e Nozioni di Equilibrio 3. L Equilibrio di Nash Esistenza e Unicità 4. Strategie Miste 5. GiochiRipetutiFinitie Infiniti 6. Giochi Sequenziali e la Forma Estensiva 7. Equilibri Perfetti e Induzione a Ritroso 8. Impegno(Commitment) e Deterrenza all Entrata 2 Matteo Alvisi - Microeconomia 1
Decisioni Strategiche Nessun uomo è un isola Studio del comportamento razionale in situazioni interattive o interdipendenti. Ogni individuo deve prendere in considerazione come i rivali reagiranno in risposta alle loro azioni. Teoria dei giochi non-cooperativa: ogni individuo agisce con l obiettivo di massimizzare il proprio beneficio/utilità/guadagno individuale (in gergo economico: payoff) 3 Il Contesto Strategico Le IpotesiDi Base La Struttura del Gioco Le Regoledel Gioco Le Nozioni di Equilibrio 4 Matteo Alvisi - Microeconomia 2
Le Ipotesidi Base Razionalità I giocatori hanno una informazione completa del loro interesse e scelgono dunque le strategie che meglio lo realizzano. Esso non compiono mai errori. Conoscenza Comune Tutti i giocatori conoscono le regole del gioco. Tutti i giocatori sanno che tutti gli altri giocatori conoscono le regole del gioco. Tutti i giocatori sanno che tutti gli altri giocatori sanno che tutti conoscono le regole del gioco ecc 5 La Struttura del Gioco Giocatori Gruppo di agenti economici i cui guadagni e benefici individuali dipendono dalle azioni altrui. Strategie Piano completo di azioni. Quando i giocatori scelgono le proprie azioni in sequenza, una strategia specifica una azione per ogni possibile decisione degli altri giocatori. Payoff I guadagni o i livelli di utilità associati ad ogni possibile esito dell interazione. I payoff possono essere in termini attesi se gli esiti ex-ante sono random, ossia definibili solo in termini probabilistici. 6 Matteo Alvisi - Microeconomia 3
Le Regole del Gioco La tempistica delle mosse I giocatori scelgono le loro strategie simultaneamente o piuttosto sequenzialmente? Natura del conflitto e dell interazione I giocatori hanno interessi conflittuali o c è spazio per la cooperazione? I giocatori interagiscono una sola volta o ripetutamente? Stato dell informazione L informazione è completa? I giocatori sono informati in modo simmetrico? C è incertezza? 7 Nozioni di Equilibrio Miglior Risposta: La miglior strategia che si può giocare date le strategie scelte dagli altri giocatori. Se tutti stanno giocando la loro miglior risposta, allora nessuno avrà incentivo a modificare unilateralmente la propria strategia. Equilibrio di Nash: Un insieme di strategie, una per ogni giocatore, tale per cui la strategia di ognuno è la migliore a sua disposizione, posto che tutti gli altri giocatori stanno giocando le loro strategie di equilibrio. Equilibrio con Strategie Dominanti: Una strategia dominante per un giocatore ha una perfomancemigliore di tutte le altre strategie disponibili, a prescindere dalle strategie giocate da tutti gli altri avversari. 8 Matteo Alvisi - Microeconomia 4
1964 1970 Un Caso Pratico: La Pubblicità delle Sigarette nella TV statunitense Tutte le compagnie statunitensi produttrici di tabacco pubblicizzavano i loro prodotti molto pesantemente in TV. Il Responsabile della Salute Pubblica emette un ammonimento ufficiale Fumare sigarette può essere nocivo per la salute La reazione dei produttori di sigarette Timore di potenziali cause per responsabilità civile (e quindi con risarcimento) Le Compagnie cercano una mediazione Obbligo di stampa dell etichetta sui rischi del fumo e cessazione della pubblicità in TV in cambio dell immunità dall essere perseguiti in sede federale. 9 Giochi in Forma Normale Giocatori: {Reynolds and Philip Morris} Strategie:{Fare Pubblicità, Non Fare Pubblicità} Payoff: I Profitti delle due Compagnie Ipotesi: Ogni impresa guadagna mediamente $70 milioni l anno dai propri clienti Il costo della pubblicità ammonta a $30 milioni per impresa all anno. La pubblicità è in grado di conquistare una fetta di profitti del concorrente pari a $45 milioni se quest ultimo n on fa pubblicità. Se entrambi fanno pubblicità, tali guadagni si elidono l un con l altro. Come rappresentare questo gioco? Gioco simultaneo e giocato una volta sola ( one-shot ) Forma Strategica o Normale: giocatori, strategie, payoff. 10 Matteo Alvisi - Microeconomia 5
Forma Normale(Strategica) Giocatori Reynolds Philip Morris No Pubb Pubb No Pubb 70, 70 25, 85 Pubb 85, 25 40, 40 STRATEGIE PAYOFF 11 Miglior Risposta Reynolds No Pubb Philip Morris Pubb No Pubb 70, 70 25, 85 Pubb 85, 25 40, 40 La miglior risposta per Reynolds: Se Philip Morris fa pubblicità: Pubb Se Philip Morris non fa pubblicità : Pubb A prescindere da ciò che si pensi che Philip Morris possa fare, fare pubblicità risulta la miglior risposta. Fare pubblicità è la strategia dominante per Reynolds Lo stesso vale per Philip Morris Fare pubblicità è una strategia dominante. Questo gioco si può risolvere con il criterio della dominanza. 12 Matteo Alvisi - Microeconomia 6
La Pubblicità delle Sigarette Dopo l accordo del 1970, la spesa totale in pubblicità per le sigarette diminuì di $63 milioni. I profitti congiunti aumentarono di $91 milioni. L accordo del 1970 aiuto le due imprese a risolvere la situazione da dilemma del prigioniero che si era creata nel mercato delle sigarette. Il punto cruciale del dilemma del prigioniero, una volta di più, è che un equilibrio di Nash può non essere (Pareto-) efficiente. Il dilemma del prigioniero è comunque facilmente risolvibile con il criterio della dominanza. Ma come procedere se non esistono strategie dominanti? 13 Giochi senza Strategie Dominanti Spesso non ci sono strategie dominanti Ridurre il gioco non è sufficiente Il metodo è quello di trovare un equilibrio di NASH nel seguente modo: Si ispeziona la matrice cella per cella chiedendosi se ogni giocatore stia giocando la sua miglior risposta alla strategia del rivale. In breve: si calcola la funzione di reazione di ogni giocatore Problema: Ci possono essere equilibri multipli 14 Matteo Alvisi - Microeconomia 7
Giochi di Coordinamento: La Battaglia dei Sessi Un ragazzo e una ragazza si vogliono incontrare di sabato sera. Non hanno alcuna possibilità di comunicare tra loro. Lui ama il calcio, lei la discoteca. Se non si incontrano, la loro serata sarà compromessa, a prescindere da dove hanno scelto di andare. Ragazzo Ragazza Disco Stadio Disco 100, 50 0, 0 Stadio 0, 0 50, 100 15 Giochi di Coordinamento: Risultati Esistono due equilibri di NASH. Gli equilibri preferiti dal ragazzo e dalla ragazza sono diversi. Come raggiungere l esito preferito? Mosse strategiche: legarsi le mani, impegnandosi credibilmente a scegliere solo una delle due strategie. Rendere il gioco sequenziale: in questo modo è il leader che sceglie l equilibrio. 16 Matteo Alvisi - Microeconomia 8
(Non-)Esistenza degli Equilibri di Nash: Il Gioco delle Monete A Testa Ogni giocatore sceglie testa o croce. Entrambi rivelano la faccia della moneta scelta nello stesso momento. Se coincidono, il giocatore A vince 1 da B; se non coincidono, B vince 1 da A. L equilibrio di Nash non esiste. 17 B Croce Testa +1, -1-1, +1 Croce -1,+1 +1, -1 Gioco delle Monete e Strategie Miste Finora, abbiamo considerato strategie pure, ossia azioni univoche intraprese da ogni giocatore quando arriva il suo turno. Tuttavia, i giocatori potrebbero anche randomizzare tra le due strategie disponibili e decidere, ad esempio, di lanciare in aria la moneta quando è il loro turno e mostrare la faccia risultante dal lancio. Questo è equivalente a giocare Testa con probabilità 0.5 e Croce con probabilità 0.5. Prima di iniziare a giocare, tale strategia offre il massimo payoff atteso, che è pari a 0. E inoltre possibile mostrare che questa è in effetti una coppia di strategie che forma un equilibrio di Nash (ex post, l esito non sarà random, e ci sarà dunque un vincente e un perdente). In generale, per i giochi che studieremo esiste sempre un equilibrio di Nash, almeno nelle strategie miste. 18 Matteo Alvisi - Microeconomia 9
Interazione Ripetuta Si ipotizzi ora una Interazione ripetuta Si pensi ad una relazione continua nel tempo tra giocatori In altre parole, si pensi allo stesso gioco ripetuto più volte. Le azioni di oggi influenzeranno i comportamenti e le interazioni di domani. In altre parole, le strategie dipenderanno dalla storia del gioco: l azione scelta oggi dipenderà dall interazione passata Definire strategie che dipendono dall evoluzione del gioco può aiutare i giocatori a cooperare, raggiungendo un risultato migliore per entrambi rispetto alla ripetizione dellstrategia dell equilibrio statico. 19 Due tipi di Strategie Grilletto Strategia del Grilletto Puntato (grim trigger) Iniziare cooperando Cooperare fino a che il rivale non devia Se si osserva una deviazione, giocare in modo noncooperativo per il resto del gioco ripetuto. Strategia occhio per occhio (tit-for-tat) Iniziare cooperando Cooperare se il tuo rivale ha cooperato nel periodo più recente. Non cooperare (ad esempio deviare da un accordo collusivo e abbassare il prezzo) se il rivale ha fatto lo stesso nel periodo precedente. 20 Matteo Alvisi - Microeconomia 10
Orizzonte Temporale Infinito L interazione tra i giocatori non ha mai fine Non esiste un ultimo periodo, cosicché il costo opportunità della deviazione (ossia i profitti che poi si perdono dalla mancata cooperazione futura) è sempre positivo. Qui, l uso di strategie dipendenti dalla storia funziona molto bene. Strategia occhio per occhio Iniziare cooperando Cooperare fino a che il rivale fa lo stesso Dopo aver osservato una deviazione dall implicita cooperazione, iniziare un periodo di punizione di una data lunghezza nel quale giocare (entrambi) non cooperativamente. 21 Orizzonte Temporale Finito Si ipotizzi che l interazione sul mercato duri per Tperiodi e poi abbia termine. Come si comporterebbe il nostro rivale? Se iniziasse giocando una strategia grilletto, troverebbe in effetti ottimale giocarla fino alla penultima ripetizione. Tuttavia, nel periodo T, fisserebbe sicuramente un prezzo più basso perché questo aumenterebbe i suoi profitti senza il timore di dover subire una rivalsa, una punizione. Infatti, dopo T il gioco finisce. Noto questo, noi stessi sceglieremmo un prezzo basso (noncooperativo) nel periodo T. Procedendo a ritroso al periodo T-1, dato che la non-cooperazione prevarrà comunque in T, entrambi penseremo che dovremmo fissare un prezzo più basso del rivale, guadagnando a suo discapito. Ciò vale a ritroso per ogni stato. Conclusione: Il solo esito razionale è per entrambi fissare un prezzo basso in ogni periodo. La cooperazione non è dunque sostenibile se l orizzonte temporale è finito. 22 Matteo Alvisi - Microeconomia 11
La Simulazione di Axelrod R. Axelrod, L evoluzione della Cooperazione Il dilemma del prigioniero viene ripetuto 200 volte Economisti, studiosi di informatica e psicologi furono invitati ad inviare la loro strategia ottimale. Axelrod incrociò le strategie le une con le altre per verificare quale portasse in media i payoff più elevati. Vincitore: Occhio per Occhio La ragione attribuita da Axelrod a tale risultato è che un giocatore che la mette in atto è nello stesso tempo gentile," perché non devia mai per primo. tollerante" perché consente di cooperare ancora dopo una defezione (imbroglio) del rivale reattiva," perché a defezione risponde con defezione. "chiara" perché è facile da capire per gli altri giocatori. 23 Giochi Sequenziali: La Forma Estesa Due giocatori :Entrante (Generico) e Impresa Attiva (Monopolista): G muove per primo 0, 12 G 0, 8-2, 5 4, 6 24 Matteo Alvisi - Microeconomia 12
Il Gioco dell Entrata: La Forma Normale G Due Equilibri di Nash (F; Agg) e (D; Acc) Aggressivo Accomodante Solo il secondo equilibrio sopravvive in una contesto sequenziale. La minaccia «aggressivo dopo l entrata» non è credibile D -2, 5 4, 6 F 0, 12 0, 8 25 Si considerino le reazioni future alle mosse dell entrante. L entrante fa la prima mossa.. dovrà considerare come reagirà l impresa attiva In caso di entrata: -2, 5 4, 6 L ex-monopolista non potrà fare altro che essere accomodante nei confronti dell entrante. Se resta fuori, il monopolista produce molto e i profitti dell entrante sono ovviamente zero (vedi pagina successiva) 26 Matteo Alvisi - Microeconomia 13
e siscelga in modoottimale Ora si consideri la mossa dell entrata: 0, 12 G acc 0, 8 (Sfoltisci anche questo!) 4, 6 Solo (D, Acc) è sequenzialmente razionale. Dunque, per trovare gli equilibri sequenzialmente razionali (perfetti): Guardarein avanti(ossiaanticiparele mossefuture dell avversario) E ragionarea ritroso. 27 Risolvere Giochi Dinamici Sequenziali In generale, occorre partire dagli ultimi nodi del gioco, ossia dagli ultimi sottogiochi, e risolverli determinando come si comporterà il giocatore in quei punti. A quel punto si può potare l albero dalle strategie non ottimali Si eliminano in altre parole le strategie dominate. Ciò porta ad un gioco semplificato. Si ripete poi la procedura con il nuovo primo sotto-gioco a partire dalla fine; Tale procedura è chiamata Induzione a Ritroso. Questo metodo è stato da noi già implicitamente utilizzato per risolvere i giochi ripetuti un numero T finito di volte, concludendo che l unico equilibrio di Nash è giocare in modo non-cooperativo in ogni periodo. 28 Matteo Alvisi - Microeconomia 14
Rendere le Minacce Credibili: L Impegno Le promesse o le minacce a intraprendere azioni subottimali non sono credibili. Una azione è subottimale se, date le risposte degli avversari, fa ottenere meno del massimo profitto ottenibile con azioni alternative. Come rendere credibile una minaccia non credibile? 29 Strategiedi ImpegnoI Bruciare i ponti dietro di sé In guerra, è spesso vantaggioso mostrare di NON essere in grado di ritirarsi e piuttosto dare sempre una possibilità di farlo all esercito rivale. Strategia del legarsi le mani Ci si può impegnare ex-ante attraverso il sostenimento di un costo autoimposto che rende l essere coerente con la promessa più conveniente del deviare da essa. McDonald: è caratterizzato da design e da struttura costosa Non può essere spostato come un chiosco di panini Mostra l intenzione di costruire una reputazione sulla propria qualità. 30 Matteo Alvisi - Microeconomia 15
Strategie di Impegno II Auto-imposizione di vincoli alla capacità produttiva Un nuovo entrante può impegnarsi credibilmente a mantenere basso il suo livello di produzione, adottando la strategia dello sguardo del cucciolo ( puppy-dog ploy ) «Puppy-dog ploy»: rimanere debole per evitare una reazione aggressiva. Molti economisti interpretano proprio in questo modo la competizione tra Apple e Microsoft. 31 Un Giocodi ImpegnoEx-Ante con un Investimentoa Fondo Perduto in un Impianto di Ampie Dimensioni Come potrebbe riuscire ad impegnarsi credibilmente ex ante ad essere aggressivo dopo l entrata (ossia a produrre comunque un alto livello di output)? Costruire un grande impianto, sostenendo gli alti costi di installazione. Ora, per decidere di essere accomodante, riducendo il livello di output, è meno efficiente che essere aggressivo (per effetto delle più ampie economie di scala di un grande impianto). In fatti, i suoi payoff sono ora più bassi di prima per ogni possibile esito, ma particolarmente più bassi in caso di basa produzione. La competizione aggressiva diventa una strategia dominante e G considera ora credibile la minaccia, decidendo di rimanere fuori dal mercato. 32 Matteo Alvisi - Microeconomia 16
Esempio: Un gioco di Impegno Ex-Ante 0, 10 G 0, 5-2, 4 4, 3 33 Un gioco di Impegno Ex-Ante _(cont) Senza investmento: G Agg Acc F 0, 12 0, 8 D -2,5 4, 6 G Agg Acc F 0, 10 0, 5 D -2,4 4, 3 Con investmento: 34 Matteo Alvisi - Microeconomia 17
Un gioco di Impegno Ex-Ante: Il Quadro Generale Impianto esistente Impianto grande D F D F 4, 6-2, 5 0,8 0, 12 4, 3-2, 4 0, 5 0, 10 35 Un gioco di Impegno Ex-Ante: Il Quadro Generale_(cont) Risolvere a ritroso: è accomodante se G entra e ha l impianto corrente, guadagnando 6. è aggressivo se G resta fuori e ha l impianto corrente, guadagnando 12. Dunque, G entra. è aggressivo se G entra e ha investito in un grande impianto, guadagnando 4. è aggressivo se G resta fuori e ha investito in un grande impianto, guadagnando 10 Dunque, G resta fuori. guadagna un payoff più elevato se investe in un grande impianto. 36 Matteo Alvisi - Microeconomia 18