Giochi ripetuti. Gianmaria Martini



Documenti analoghi
Concetti di soluzione in giochi dinamici a informazione perfetta in strategie pure (LEZIONE 4)

Teoria dei Giochi. Anna Torre

Imprese e reti d impresa

Giochi e decisioni strategiche

Economia Politica Microeconomia (ECN0006) 10 CFU a.a Eleonora Pierucci

2 RAFFINAMENTI DELL EQUILIBRIO DI NASH

1 Giochi a due, con informazione perfetta e somma zero

Un modello matematico di investimento ottimale

Teoria dei Giochi. Anna Torre

Teoria dei Giochi - Esternalità

Equilibrio bayesiano perfetto. Giochi di segnalazione

ESERCITAZIONE 8: GIOCHI SEQUENZIALI, ASIMMETRIE INFORMATIVE ED ESTERNALITA

Paperone e Rockerduck: a cosa serve l antitrust?

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

2. Leggi finanziarie di capitalizzazione

Esercizi di Ricerca Operativa II

ESERCITAZIONE novembre 2012

Calcolare i Rendimenti di Titoli Obbligazionari a tasso fisso con flusso cedolare costante (tipo BTP)

GIUSTIFICARE LE RISPOSTE. Non scrivere la soluzione di esercizi diversi su uno stesso foglio.

Capitolo 16. Il sistema bancario, la Banca Centrale e la politica monetaria

Funzioni funzione dominio codominio legge argomento variabile indipendente variabile dipendente

Teoria dei Giochi. Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 2

Dipartimento di Economia Aziendale e Studi Giusprivatistici. Università degli Studi di Bari Aldo Moro. Corso di Macroeconomia 2014

Oligopolio. G. Degli Antoni 26/2/2014 (Economia Applicata/Industriale)

Introduzione alla Teoria dei Giochi

Per poter affrontare il problema abbiamo bisogno di parlare di probabilità (almeno in maniera intuitiva). Analizziamo alcune situazioni concrete.

Soluzione dell esercizio del 2 Febbraio 2004

Esercizi di Macroeconomia per il corso di Economia Politica

Come affrontare i monopoli naturali

Testo alla base del Pitgame redatto dal prof. Yvan Lengwiler, Università di Basilea

Facoltà di Scienze Politiche Corso di Economia Politica. Macroeconomia sui capitoli 21, 22 e 23. Dott.ssa Rossella Greco

Teoria dei Giochi. Anna Torre

( x) ( x) 0. Equazioni irrazionali

Calcolo del Valore Attuale Netto (VAN)

La teoria dell utilità attesa

13.4 Risposte alle domande di ripasso

Edited by Foxit PDF Editor Copyright (c) by Foxit Software Company, 2004 For Evaluation Only.

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che:

Teoria dei Giochi non Cooperativi

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

Teoria dei giochi Gioco Interdipendenza strategica

9. Urti e conservazione della quantità di moto.

Dimensione di uno Spazio vettoriale

Esercitazione 23 maggio 2016

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Come visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1)

Interesse, sconto, ratei e risconti

1. PRIME PROPRIETÀ 2

Capitolo 25: Lo scambio nel mercato delle assicurazioni

ESERCITAZIONE MATEMATICA FINANZIARIA OPZIONI. Matematica finanziaria Dott. Andrea Erdas Anno Accademico 2011/2012

Le obbligazioni: misure di rendimento Tassi d interesse, elementi di valutazione e rischio delle attività finanziarie

Fondamenti e didattica di Matematica Finanziaria

Teoria dei Giochi. Teoria dei Giochi

b. Che cosa succede alla frazione di reddito nazionale che viene risparmiata?

Il mercato assicurativo: selezione avversa, fallimenti del mercato, menù di contratti, assicurazione obbligatoria

Traduzione e adattamento a cura di Gylas per Giochi Rari

Il mercato di monopolio

Sequestro di persona a scopo di estorsione: una nuova teoria di gioco

Il sistema monetario

Equivalenza economica

La pubblicità. La pubblicità. La pubblicità. La pubblicità

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE

Esercizi su lineare indipendenza e generatori

Lezione IV: Giochi e Strategie

I ricavi ed i costi di produzione

Capitolo 26. Stabilizzare l economia: il ruolo della banca centrale. Principi di economia (seconda edizione) Robert H. Frank, Ben S.

Imprese multinazionali e outsourcing

Funzioni. Funzioni /2

OPERAZIONI DI PRESTITO

4. Operazioni elementari per righe e colonne

IAS 32 e IAS 39: La rilevazione e la valutazione degli strumenti finanziari. Edgardo Palombini Fondo Interbancario di Tutela dei Depositi

I GRUPPI TRANSFRONTALIERI.

Richiami di teoria della domanda di moneta

Lezione 14. Risparmio e investimento. Leonardo Bargigli

Matematica generale CTF

4. Si consideri un economia chiusa in cui: Y = C + I + G, C = ,8YD, G = 1000, T= 0,5Y, I = r, P=1,

LA LEGGE DEI GRAFICI THE LAW OF CHARTS DI JOE ROSS

Interesse, sconto, ratei e risconti

Macroeconomia, Esercitazione 2. 1 Esercizi. 1.1 Moneta/ Moneta/ Moneta/3. A cura di Giuseppe Gori (giuseppe.gori@unibo.

Ricerca Operativa Esercizi sul metodo del simplesso. Luigi De Giovanni, Laura Brentegani

REGOLAZIONE (E TASSAZIONE OTTIMALE) DI UN MONOPOLIO CON PIÙ LINEE DI PRODUZIONE

Mercati finanziari e valore degli investimenti

LEZIONE 23. Esempio Si consideri la matrice (si veda l Esempio ) A =

La teoria dei giochi non cooperativi

Il modello binomiale ad un periodo

PERCORSI ABILITANTI SPECIALI 2014 DIDATTICA DELL ECONOMIA DEGLI INTERMEDIARI FINANZIARI

LE FUNZIONI A DUE VARIABILI

risulta (x) = 1 se x < 0.

studi e analisi finanziarie La Duration

Epoca k Rata Rk Capitale Ck interessi Ik residuo Dk Ek 0 S 0 1 C1 Ik=i*S Dk=S-C1. n 0 S

PRODUZIONE, TASSO DI INTERESSE E TASSO DI CAMBIO

Osservazioni sulla continuità per le funzioni reali di variabile reale

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

studi e analisi finanziarie LA PUT-CALL PARITY

Lezione 13 Il mercato e il prezzo

Oligopolio non cooperativo

Computational Game Theory

Il principio di induzione e i numeri naturali.

DOMANDE a risposta multipla (ogni risposta esatta riceve una valutazione di due; non sono previste penalizzazioni in caso di risposte non corrette)

Transcript:

Giochi ripetuti Gianmaria Martini INTRODUZIONE In molte situazioni strategiche l elemento temporale ha un ruolo rilevante, nel senso che le scelte vengono ripetute nel tempo. I giochi ripetuti studiano la ripetizione delle scelte strategiche nel tempo. Per distinguere il gioco ripetuto dal gioco statico, si definisce il gioco statico come stage game (o gioco di base). Il gioco ripetuto è costituito dalla ripetizione nel tempo dello stage game. Tale ripetizione può avvenire un numero finito di volte oppure infinite volte. Nel primo caso si determina un gioco ripetuto un numero finito di volte (o gioco ripetuto con orizzonte temporale finito), nel secondo caso un supergioco (o gioco ripetuto con orizzonte temporale infinito). Una variabile fondamentale nei giochi ripetuti è rappresentata dal fattore di sconto δ, definito come variabile che attualizza i valori monetari futuri, ossia permette di calcolare il valore attuale di una somma monetaria percepita in futuro. Ad esempio, supponiamo di essere gli intestatari di una cambiale con valore nominale pari a 1.000,00, incassabile tra un anno esatto. Ipotizziamo di doverla invece incassare oggi, esattamente 12 mesi prima. Presentandoci ad un istituto di credito possiamo effettuare questa operazione, ma non otterremo oggi il valore di 1.000,00: infatti la cambiale vale 1.000,00 solo alla scadenza, cioè tra un anno. Occorre dunque determinare il valore attuale della cambiale. Per determinare il valore si imposta il seguente ragionamento: che somma di denaro dovrei avere a disposizione oggi da investire (ad esempio da depositare in un conto corrente bancario) in modo tale da ottenere tra un anno 1.000,00? Se oggi deposito la somma X tra un anno otterrò X(1+r), dove r rappresenta l interesse applicato sul conto corrente. Quindi X(1+r) = 1.000; pertanto X = 1.000 1+r. Ad esempio, se r = 0.05 (quindi il 5%), allora andando oggi in banca otterrò 1.000 1,05 ossia 952,38. Pertanto δ = 1 (1+r). Nell esempio δ = 0,95238. Un incremento di r (ad esempio r = 0.1) riduce il valore attuale (la banca sconterebbe la cambiale al valore 909,09). Se la cambiale invece avesse avuto scadenza a due anni, allora la somma da depositare in banca oggi avrebbe dovuto soddisfare le seguenti condizioni:

tra un anno essa sarebbe pari a X(1+r) tra due anni X(1+r) + rx(1+r) = X(1+r) 2. Quindi X = 1.000 (1+r) 2 In tal caso, sempre in presenza di r = 0.05 avrei ottenuto, scontando la cambiale oggi, una somma di denaro pari a 907,03. In un gioco ripetuto la presenza del fattore di sconto è fondamentale dato che rende in valore attuale le vincite future: un giocatore razionale tiene infatti conto del valore oggi di una somma monetaria incassata in futuro. Di conseguenza la vincita del giocatore i-esimo nel gioco ripetuto un numero di volte pari a T (quindi con orizzonte temporale finito) è data dalla seguente espressione Σ t=1 T δ t-1 π it (s i,s -i ) Se invece il gioco viene ripetuto infinite volte allora. Σ t=1 δ t-1 π it (s i,s -i ) Un fattore fondamentale nei giochi ripetuti con informazione completa è rappresentato dal fatto che i giocatori osservano l esito di ogni ripetizione e successivamente effettuano l ulteriore ripetizione del gioco. Pertanto al momento di muovere sanno esattamente dove si trovano. Possono quindi sempre legare la mossa da adottare nella prossima ripetizione dello stage game all esito dell ultima ripetizione, o di alcune delle ripetizioni precedenti, oppure di tutte le ripetizioni precedenti. Tecnicamente si afferma che i giocatori conoscono sempre la storia del gioco. Pertanto, la strategia pura adottata in una specifica ripetizione è sempre funzione della storia del gioco (tranne che nel periodo iniziale, in cui non esiste storia). In un gioco ripetuto con orizzonte temporale finito la strategia del giocatore i-esimo è un vettore; ogni elemento del vettore rappresenta la mossa da effettuare in ciascuna ripetizione in funzione della storia del gioco. In un supergioco la strategia del giocatore i-esimo è una successione; ogni elemento della successione rappresenta la mossa da effettuare in ciascuna ripetizione in funzione della storia del gioco. Nei supergiochi la vincita attualizzata del giocatore i-esimo viene moltiplicata per (1 - δ); in tal modo si ottiene la vincita uniperiodale, che può essere confrontata con l esito di equilibrio nello stage game. GIOCHI CON ORIZZONTE TEMPORALE FINITO In caso di ripetizione finita dello stage game occorre evidenziare due risultati: 1. se lo stage game possiede un solo equilibrio di Nash in strategie pure, allora il gioco ripetuto con orizzonte temporale finito non produce alcuna modifica rispetto alle azioni adottate in equilibrio nel gioco base.

2. se lo stage game possiede equilibri di Nash multipli, allora il gioco ripetuto con orizzonte temporale finito può produrre un equilibrio perfetto nei sottogiochi in cui, in alcuni sottogiochi fanno parte del sentiero di equilibrio delle mosse che non sono contemplate negli equilibri di Nash dello stage game. Vediamo in dettaglio il primo risultato. Supponiamo di ripetere due volte il gioco del Dilemma del Prigioniero. Osserviamo la matrice dei payoff del Dilemma del Prigioniero nello stage game Confessare (C) -3, -3 0, -6 Non Confessare (NC) -6, 0-1,-1 L equilibrio di Nash corrisponde a (C,C). Ripetiamo due volte il gioco. Ricordiamo che la scelta è sempre simultanea, quindi i due prigionieri scelgono due volte ma sempre simultaneamente. Rispetto allo stage game possono però osservare l esito della prima volta che giocano il Dilemma del Prigioniero, e poi muovere una seconda volta. Abbiamo dunque quattro sottogiochi, tutti relativi alla seconda ripetizione, così classificati: 1. Sottogioco 1: nella prima ripetizione le mosse sono (C,C); 2. Sottogioco 2: nella prima ripetizione le mosse sono (C,NC); 3. Sottogioco 3: nella prima ripetizione le mosse sono (NC,C); 4. Sottogioco 4: nella prima ripetizione le mosse sono (NC,NC). La matrice delle vincite del sottogioco 1 è la seguente (per risolvere il gioco ripetuto partiamo dal fondo del gioco, identificando l equilibrio di Nash in ciascun sottogioco): Confessare (C) -6, -6-3, -9 Non Confessare (NC) -9, -3-4,-4 L equilibrio di Nash è dunque (C,C). La matrice delle vincite del sottogioco 2 è Confessare (C) -3, -9 0, -12 Non Confessare (NC) -6, -6-1,-7 L equilibrio di Nash è dunque (C,C).

La matrice delle vincite del sottogioco 3 è Confessare (C) -9, -3-3, -9 Non Confessare (NC) -12, 0-7,-1 L equilibrio di Nash è dunque (C,C). La matrice delle vincite del sottogioco 4 è Confessare (C) -4, -4-1, -7 Non Confessare (NC) -7, -1-2,-2 L equilibrio di Nash è dunque (C,C). Quindi in tutti i sottogiochi della seconda ripetizione l esito è sempre lo stesso dello stage game. Risalendo di un periodo, osserviamo come appare il gioco al momento della prima ripetizione. La matrice delle vincite è la seguente: Confessare (C) -6, -6-3, -9 Non Confessare (NC) -9, -3-4,-4 L equilibrio perfetto nei sottogiochi è dunque [(C,C);(C,C)]. Questo risultato è noto in letteratura anche come il Paradosso della catena di supermercati (Chain store Paradox), come denominato da un economista tedesco, Reinhard Selten, cui è stato anche attribuito il premio Nobel per l economia (assieme a John Nash e John Harsanyi) proprio per gli studi effettuati sulla Teoria dei Giochi. La logica del paradosso è la seguente: supponiamo che una catena di supermercati abbia un punto vendita già attivo in 20 mercati (ad esempio 20 città). In ciascun mercato è sottoposta alla minaccia di entrata da parte di un nuovo supermercato, che opererà solo in quel mercato. L entrata, se avviene, è sequenziale; quindi il primo mercato è quello in cui è possibile che avvenga l entrata. Risolto il problema dell entrata nel primo mercato, si affronta il problema dell entrata nel secondo mercato, e così via. Il gioco consiste dunque nella ripetizione 20 volte dello stage game; supponiamo che nello stage game l equilibrio di Nash sia che l entrata avviene. Il problema che vogliamo affrontare è il seguente: la catena di supermercato dovrebbe buttare fuori dal mercato il primo concorrente (anche se non conviene) in modo tale da guadagnare una reputazione per cui anche negli altri mercati l entrata non avviene? Nel rispondere, supponiamo che l entrata non sia mai avvenuta nei primi 19 mercati: rimane solo il 20 esimo. Vediamo il punto di vista dell entrante nel 20 esimo mercato. Egli si rende conto che, non essendoci futuro, sta ingaggiando con la catena lo stesso stage game che presenta come

equilibrio di Nash un entrata di successo. Egli sa che la catena di supermercati non ostacolerà la sua entrata. Oltretutto quest ultima non deve impressionare nessun altro entrante, dato che siamo nel 20 esimo mercato e non esiste più alcun rischio di entrata. Pertanto l entrata avviene. Consideriamo l impatto di questo soluzione nell ultimo sottogioco nel 19 esimo mercato. L entrante, studiando la soluzione nel 20 esimo mercato, si rende conto che la catena di supermercati permetterà l entrata in quel mercato. Pertanto, dato che l unico motivo che l incumbent avrebbe nell impedire l entrata nel 19 esimo mercato consiste nel costruirsi una reputazione così che l entrata non avviene anche nel 20 esimo mercato, venendo a mancare questo incentivo anche nel 19 esimo mercato l entrata sarà permessa. Così l entrata avviene. Questo procedimento continua fino al primo mercato: in tal modo l incentivo a costruire una reputazione per impedire l entrata nei mercati successivi viene distrutta completamente. La seguente matrice dei payoffs è relativa ad uno stage game che consente di illustrare il secondo risultato precedentemente enunciato. Giocatore B Giocatore A L C R T 5,5 3,6 0,0 M 6,3 4,4 0,0 B 0,0 0,0 1,1 Lo stage game presenta due equilibri di Nash: (M,C), (B,R). In realtà le vincite migliori per entrambi i giocatori sarebbero quelle relative alle mosse (T,L), dove entrambi otterrebbero 5. Supponiamo ora di ripetere il gioco due volte. Notiamo innanzitutto che i due equilibri di Nash dello stage game costituiscono anche un equilibrio perfetto nei sottogiochi del gioco ripetuto. Per esempio, (M,C) in entrambi i periodi è un equilibrio perfetto nei sottogiochi. Le strategie che supportano tale equilibrio sono le seguenti: per il Giocatore A scelgo M nel primo periodo e M nel secondo indipendentemente da quello che succede nel primo periodo (similarmente per il Giocatore B). In tal caso i giocatori scelgono delle strategie indipendenti dalla storia del gioco. Consideriamo però anche la seguente strategia per il Giocatore A: scelgo T nel periodo 1. Nel periodo 2 scelgo M se nel primo periodo le azioni osservate sono (T,L), altrimenti scelgo B. Il Giocatore B adotta invece la seguente strategia: scelgo L nel periodo 1. Nel periodo 2 scelgo C se nel primo periodo le azioni osservate sono (T,L), altrimenti scelgo R. Verifichiamo se tali strategie costituiscono un equilibrio perfetto nei sottogiochi. Nel periodo 2 abbiamo 9 sottogiochi. Il sottogioco quando nel primo periodo osservo (T,L) presenta la seguente matrice delle vincite Giocatore B Giocatore A L C R T 9,9 7,10 4,4 M 10,7 8,8 4,4 B 4,4 4,4 5,5

E evidente che (M,C) rappresenta un equilibrio di Nash. Un sottogioco con un esito diverso da (T,L) ad esempio (T,C) porta alla seguente matrice dei payoffs Giocatore B Giocatore A L C R T 6,6 4,7 4,7 M 4,7 4,7 4,7 B 4,7 4,7 4,7 Le mosse (B,R) costituiscono un equilibrio di Nash di questo sottogioco. Tale risultato si ottiene se si considerano tutti gli altri sottogiochi. Quindi sia (B,R) che (M,C) sono mosse credibili nel secondo periodo. Possiamo a questo punto scrivere la matrice delle vincite come appare nel primo periodo. Giocatore B Giocatore A L C R T 9,9 4,7 1,1 M 7,4 5,5 1,1 B 1,1 1,1 2,2 A questo punto anche (T,L) rappresenta un equilibrio; si noti che tali mosse non fanno parte di un equilibrio di Nash dello stage game. Pertanto le strategie prima descritte costituiscono un equilibrio perfetto dei sottogiochi: [(T;M,B,B,B,B,B,B,B,B),(L;C,R,R,R,R,R,R,R,R)]. Il ragionamento economico che sostiene questo equilibrio è il seguente: i giocatori si accordano per massimizzare le vincite nel primo periodo, mentre le azioni da adottare nel secondo periodo sono di due tipi: una punizione se il rivale non mantiene l accordo, un premio (il miglior equilibrio di Nash dello stage game) se è leale. In tal caso le strategie tengono conto della storia del gioco. SUPERGIOCHI Nei giochi con orizzonte temporale infinito il risultato principale è il cosiddetto Folk Theorem (Teorema Popolare): Dato uno stage game che presenta un determinato equilibrio in strategie pure, esiste un fattore di sconto δ tale che, per ogni δ δ, il supergioco ammette un equilibrio perfetto nei sottogiochi con vincite superiori (almeno) per ogni giocatore rispetto a quelle che si ottengono nell equilibrio di Nash dello stage game. In altre parole, nei supergiochi, se i giocatori sono sufficientemente pazienti ossia se considerano rilevanti le vincite future (δ tende a 1) qualsiasi esito che domina (debolmente) quello dell equilibrio di Nash dello stage game può far parte di un equilibrio perfetto nei sottogiochi.

Un tipo di strategie spesso utilizzate nei supergiochi denominate strategie di intervento (trigger strategies) replicano in questo contesto l idea che un comportamento leale viene premiato in futuro, mentre deviazioni da un accordo vengono punite. Vediamo un esempio di applicazione del Folk Theorem, considerando il supergioco del Dilemma del Prigioniero. Supponiamo che entrambi i giocatori adottino la seguente strategia di intervento: nel primo periodo scelgo (NC); in tutti i successivi periodi scelgo ancora (NC) solo se in tutti i periodi precedenti ho osservato (NC,NC). In caso contrario quindi anche se ho osservato una sola volta qualcosa di diverso sceglierà per sempre (C). Vediamo le vincite di ciascun giocatore i (i=a,b). Se nel primo periodo sceglie (NC) ottiene Se invece devia scegliendo C ottiene -1 + δ(-1) + δ 2 (-1) + δ 3 (-1) +.. = 0 + δ(-3) + δ 2 (-3) + δ 3 (-3) +.. = pertanto la strategia proposta è ottimale per il giocatore i quando 1 (1-d) (-1) d (1-d) (-3) d (1-d) (-3) 1 (1-d) (-1) δ 1 3 con δ = 1 3. Lo stesso vale anche per il rivale e pertanto le strategie proposte costituiscono un equilibrio perfetto nei sottogiochi. Si noti che la punizione prevista scegliere C per sempre è sempre un equilibrio di Nash di ciascun possibile sottogioco, in quanto costituisce un equilibrio di Nash dello stage game. La vincita uniperiodale per ciascun giocatore diventa 1. E possibile osservare graficamente l impatto del Folk Theorem

6 1 1 6