INTRODUZIONE ALLA TEORIA DEI GIOCHI

Похожие документы
Cos è la teoria dei giochi

Economia Industriale

Esempio 1 Si consideri il seguente gioco in forma estesa:

Elementi di Teoria dei giochi

Introduzione teoria dei giochi pt. 2. Corso di Scienza Politica 10/11 Luca Pinto

Una prima distinzione nell ambito della teoria dei giochi è quella tra: Giochi cooperativi (si possono fare accordi vincolanti)

Teoria dei giochi e comportamento strategico

Elementi di Economia I

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Economia Politica I. 10. Teoria dei giochi e oligopolio. Giuseppe Vittucci Marzetti 1

a 10,10 3,9 b 9,3 6,6

ESERCITAZIONE MICROECONOMIA (CORSO B) ESEMPI DI ESERCIZI DI TEORIA DEI GIOCHI

Il Gioco dell'evasione Fiscale

1 Esercisi sparsi svolti di Teoria dei Giochi

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Imprese e reti d impresa

Concetti di soluzione in giochi statici a informazione completa in strategie pure (LEZIONE 2)

Capitolo 13 Concorrenza imperfetta: un approccio basato sulla teoria dei giochi

Principi di Economia I

Teoria dei giochi e comportamento strategico

Teoria dei Giochi. Teoria dei Giochi

Domande a scelta multipla 1

Concetti di soluzione in giochi dinamici a informazione perfetta in strategie pure (LEZIONE 4)

Capitolo 10: Giochi dinamici. Ora l impresa 1 sceglie l output per massimizzare i propri profitti 1 8 = 122,5 Q 2 = 61,25

2.6 Calcolo degli equilibri di Nash

Teoria dei Giochi. Anna Torre

1 Giochi in forma strategica

INTRODUZIONE ALLA TEORIA DEI GIOCHI PER PROBLEMI DI DECISIONE

Corso di Politica Economica

Giochi e decisioni strategiche

Analisi Strategica per la Politica Economica

PRICE FIXING E GIOCHI RIPETUTI

13 Capitolo I La natura e lo scopo della microeconomia. 35 Capitolo II L utilità cardinale e la scelta del consumatore

Teoria dei Giochi. Roberto Mavilia. Università Commerciale L. Bocconi di Milano.

Teoria dei Giochi non Cooperativi

Teoria dei giochi Gioco Interdipendenza strategica

Teoria dei Giochi. Vito Fragnelli A.A

Esercitazione 10 maggio 2016 (Viki Nellas)

Calcolo di equilibri auto-confermanti

Lezione 5 - Giochi Ripetuti

Lezione 19: Il duopolio di Cournot ed equilibrio di Nash

Economia Pubblica Giochi con informazione incompleta e Selezione Avversa

Teoria dei Giochi. Anna Torre

Algoritmi e giochi combinatori

Teoria dei Giochi. Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 6

Analisi positiva e normativa

MICROECONOMIA (cod. 6006) Domande da svolgere ad esercitazione

Le quantità domandate ed offerte di un certo bene sono descritte dalle seguenti funzioni:

GIUSTIFICARE LE RISPOSTE. Non scrivere la soluzione di esercizi diversi su uno stesso foglio.

1 Giochi non-cooperativi

Teoria dei Giochi Cooperativi

2.1.1 Giochi di coordiamento Giochi competitivi Giochi di coesistenza 4

Giochi ripetuti. Gianmaria Martini

CORSO DI POLITICA ECONOMICA

Oligopolio. G. Degli Antoni 26/2/2014 (Economia Applicata/Industriale)

Introduzione alla Teoria dei Giochi

SISTEMI LINEARI: APPROFONDIMENTI ED ESEMPI

Teoria dei giochi. Una breve vintesi

Economia della Concorrenza e dei Mercati Lezione 11

Bosi (a cura di), Corso di scienza delle finanze, il Mulino, 2012 Capitolo I, lezione 1 Il problema e alcune premesse

IL METODO DEL SIMPLESSO

Assemblaggio degli Elementi: Soluzione del Problema Strutturale Discreto

Introduzione. L oggetto di studio dell Economia sanitaria. Quadro teorico di riferimento. Le peculiarità del mercato delle prestazioni sanitarie

Esercizi TdG per PoliMI

Teoria dei Giochi. Anna Torre

Транскрипт:

Corso di Identificazione dei Modelli e Controllo Ottimo Prof. Franco Garofalo INTRODUZIONE ALLA TEORIA DEI GIOCHI A cura di Elena Napoletano elena.napoletano@unina.it

Teoria dei Giochi Disciplina che studia problemi di scelta in presenza di decisori multipli. Ottimizzazione in presenza di interazione strategica tra più soggetti. Cifra di merito: funzione di utilità (assiomi di razionalità di Von Neumann e Morgenstern). 2

Cenni storici Cournot: «Duopolio di Cournot» (838); Von Neumann & Morgenstern: «Theory of Games and Economic Behavior», (944); John Nash, Premio Nobel per l Economia (994): «Non-cooperative games», (950). 3

Classificazione dei giochi. Cooperativi: i giocatori perseguono un obiettivo comune, e tendono ad accordarsi per migliorare il proprio profitto. Non cooperativi: i giocatori hanno obiettivi diversi, per cui non stipulano accordi vincolanti tra di loro. 2. Ad informazione completa: le funzioni di utilità dei giocatori sono conoscenza comune. Ad informazione incompleta: almeno un giocatore non conosce la funzione di utilità degli altri giocatori. 3. Statici: i giocatori scelgono le proprie mosse simultaneamente, senza conoscere in anticipo le mosse degli avversari. Dinamici: le mosse sono di tipo sequenziale, per cui la scelta di un giocatore ad un certo istante è condizionata da quelle dei giocatori agli istanti precedenti. > Ad informazione perfetta: ad ogni istante del gioco il giocatore a cui spetta la mossa conosce l intera storia del gioco. > Ad informazione imperfetta: almeno un giocatore può non conoscere l intera storia del gioco. 4

Classificazione dei giochi. Cooperativi: i giocatori perseguono un obiettivo comune, e tendono ad accordarsi per migliorare il proprio profitto. Non cooperativi: i giocatori hanno obiettivi diversi, per cui non stipulano accordi vincolanti tra di loro. 2. Ad informazione completa: le funzioni di utilità dei giocatori sono conoscenza comune. Ad informazione incompleta: almeno un giocatore non conosce la funzione di utilità degli altri giocatori. 3. Statici: i giocatori scelgono le proprie mosse simultaneamente, senza conoscere in anticipo le mosse degli avversari. Dinamici: le mosse sono di tipo sequenziale, per cui la scelta di un giocatore ad un certo istante è condizionata da quelle dei giocatori agli istanti precedenti. > Ad informazione perfetta: ad ogni istante del gioco il giocatore a cui spetta la mossa conosce l intera storia del gioco. > Ad informazione imperfetta: almeno un giocatore può non conoscere l intera storia del gioco. 5

Rappresentazione in forma normale G = S,, S n ; u,, u n. n = numero di giocatori. Il generico giocatore è indicato con i =,, n. 2. S i = spazio delle strategie. La strategia scelta dal giocatore i-esimo è indicata con s i S i. s,, s n = possibile combinazione di strategie (una per ogni giocatore). 3. u i s,, s n = funzione di payoff (utilità) del giocatore i-esimo per quella specifica combinazione di strategie. 6

Esempio n = 2; S = *Su, Giù+; S 2 = *Sinistra, Centro, Destra+. 7

Esempio n = 2; S = *Su, Giù+; S 2 = *Sinistra, Centro, Destra+. P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 Es: u Giù, Sinistra = 0 8

Esempio n = 2; S = *Su, Giù+; S 2 = *Sinistra, Centro, Destra+. P P Su Giù Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 9

Esempio n = 2; S = *Su, Giù+; S 2 = *Sinistra, Centro, Destra+. P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 Matrice dei payoff 0

Analisi di un gioco Analizzare un gioco significa determinare la funzione di miglior risposta di ogni giocatore a tutte le possibili strategie dell altro. Se esiste una interazione comune tra le strategie di miglior risposta dei giocatori, il gioco ha un equilibrio attrattivo e dunque si può determinare in anticipo come si concluderà.

Esempio di analisi di un gioco P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 2

Esempio di analisi di un gioco P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 3

Esempio di analisi di un gioco P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 4

Esempio di analisi di un gioco P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 5

Esempio di analisi di un gioco P P Su Giù Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 6

Esempio di analisi di un gioco P P Su Giù Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 7

Esempio di analisi di un gioco P P Su Giù Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 8

Esempio di analisi di un gioco P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 Nell intersezione delle funzioni di miglior risposta dei giocatori, nessuno dei due giocatori può migliorare la propria utilità spostandosi, ammesso che l altro giocatore non cambi strategia. Questo concetto è catturato dalla definizione di «Equilibrio di Nash». 9

Equilibrio di Nash Nel gioco in forma normale G = S,, S n ; u,, u n, la combinazione di strategie (s,, s n ) è un Equilibrio di Nash se, per ogni giocatore i, s i è la miglior risposta alle strategie specificate degli altri n giocatori s,, s i, s i+,, s n : u i s,, s i,, s n u i s,, s i,, s n, s i S i. 20

Dilemma del prigioniero P C C C C -,- -3, 0 0,-3-2,-2 2

Dilemma del prigioniero P C C C C -,- -3, 0 0,-3-2,-2 22

Dilemma del prigioniero P C C C C -,- -3, 0 0,-3-2,-2 23

Dilemma del prigioniero P P C C C C C C -,- -3, 0 0,-3-2,-2 C C -,- -3, 0 0,-3-2,-2 24

Dilemma del prigioniero P P C C C C C C -,- -3, 0 0,-3-2,-2 C C -,- -3, 0 0,-3-2,-2 25

Dilemma del prigioniero P P C C C C C C -,- -3, 0 0,-3-2,-2 C C -,- -3, 0 0,-3-2,-2 26

Dilemma del prigioniero P C C C C -,- -3, 0 0,-3-2,-2 27

Dilemma del prigioniero P C C C C -,- -3, 0 0,-3-2,-2 NE = (C,C) 28

Efficienza di Pareto L ottimo di Pareto è una situazione di allocazione efficiente delle risorse. In un ottimo paretiano, non è possibile migliorare l utilità di un soggetto senza peggiorare quella degli altri soggetti. L ottimo di Pareto è razionale dal punto di vista collettivo, ma non lo è dal punto di vista individuale: nei giochi non cooperativi, in cui i soggetti agiscono col fine di massimizzare la propria utilità, anche a discapito degli altri, non sempre si raggiungere un ottimo di Pareto. 29

Dilemma del prigioniero P C C C C -,- -3, 0 0,-3-2,-2 In questo caso, l equilibrio di Nash non è un ottimo di Pareto: se entrambi i giocatori scegliessero di non confessare, aumenterebbero entrambi la propria utilità. 30

Nel gioco in forma normale Strategie dominate G = S,, S n ; u,, u n, siano s i e s i S i. La strategia s i è strettamente dominata da s i se u i s,, s i,, s n < u i s,, s i,, s n, s,, s i, s i+,, s n S,, S i, S i+,, S n. La strategia s i è debolmente dominata da s i se. u i s, s i,, s n u i s,, s i,, s n. s,, s i, s i+,, s n S,, S i, S i+,, S n ; 2. esiste un profilo s,, s i, s i+,, s n tale che u i s,, s i,, s n < u i s,, s i,, s n 3

Eliminazione iterata delle strategie strettamente dominate P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 32

Eliminazione iterata delle strategie strettamente dominate P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 33

Eliminazione iterata delle strategie strettamente dominate P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 34

Eliminazione iterata delle strategie strettamente dominate P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 35

Eliminazione iterata delle strategie strettamente dominate P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 36

Eliminazione iterata delle strategie strettamente dominate P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 37

Eliminazione iterata delle strategie strettamente dominate P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 38

Eliminazione iterata delle strategie strettamente dominate P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 39

Eliminazione iterata delle strategie strettamente dominate P Su Giù Sinistra Centro Destra,0,2 0, 0,3 0, 2,0 Se l eliminazione iterata delle strategie strettamente dominate consente la sopravvivenza di un unica combinazione di strategie, essa rappresenta l unico Equilibrio di Nash del gioco. 40

Giochi a somma zero Nella matrice dei payoff, una casella è un equilibrio di Nash se il payoff del primo giocatore è il massimo dei payoff sulla colonna e il payoff del secondo giocatore è il massimo sulla riga. Possiamo facilmente immaginare una situazione nella quale non esiste una cella con queste caratteristiche. Esempio: «pari o dispari» P Pari Dispari Pari Dispari -,,-,- -, NE =? 4

Strategie miste Quando l ipotesi di razionalità non è sufficiente a determinare univocamente la scelta di un giocatore, le strategie diventano aleatorie. Le scelte ottime di un giocatore dipendono dalla probabilità con cui l altro giocatore sceglie le sue mosse. Strategia pura Strategia mista Una «strategia mista» del giocatore i è una distribuzione di probabilità sul set di strategie pure disponibili in S i. In questo scenario, ogni giocatore sceglie la probabilità di giocare le sue strategie pure in modo da massimizzare la propria utilità attesa. 42

Strategie miste Siano: S i = s i,, s ik ; p ik = probabilità che il giocatore i scelga la strategia pura s ik, con k =,, K. Una strategia mista per il giocatore i è la distribuzione di probabilità p i = p i,, p ik K 0 p ik, per k =,, K; k= p ik =. Rappresentazione di un gioco in forma normale con strategie miste: G = S,, S n ; E,u -,, E,u n -. 43

Strategie miste Esempio: «Pari o Dispari» {Pari, Dispari}: strategie pure Pr*Pari+ = p; Pr*Dispari+ = p: (p, p) = strategia mista. Le strategie pure sono casi limite delle strategie miste. p = Pari = strategia pura p = 0 Dispari = strategia pura 44

Strategie miste: equilibrio di Nash Nel gioco in forma normale G = S,, S n ; E,u -,, E,u n -, il profilo di strategie miste (p,, p n ) è un Equilibrio di Nash se, per ogni giocatore i, p i è la miglior risposta alle strategie miste degli altri n giocatori p,, p i, p i+,, p n : E,u i p,, p i,, p n - E,u i p,, p i,, p n -. 45

Strategie miste: esempio P Pari Dispari p p Pari Dispari -,,-,- -, q q pq p( q) p q ( p)( q) 46

Strategie miste: esempio P Pari Dispari p p Pari Dispari -,,-,- -, q q pq p( q) p q ( p)( q) E,u - = pq + p q + p q + + p q = 2 4q p + 2q. E,u 2 - = E u = 4p 2 q + 2p. 47

Funzione di miglior risposta p = se q < \2 p q = arg max, 2 4q p + 2q - p = 0 se q > \2 p p 0, se q = \2 48

Funzione di miglior risposta q = se p > \2 q (p) = arg max, 4p 2 q + 2p - q = 0 se p < \2 q q 0, se p = \2 49

Funzione di miglior risposta NE = (p = \2; q = \2) NE 50

Teorema di Nash «In ogni gioco finito (un gioco in cui sia il numero dei giocatori che gli spazi di strategie sono finiti) esiste almeno un Equilibrio di Nash, eventualmente in strategie miste.» 5

Classificazione dei giochi. Cooperativi: i giocatori perseguono un obiettivo comune, e tendono ad accordarsi per migliorare il proprio profitto. Non cooperativi: i giocatori hanno obiettivi diversi, per cui non stipulano accordi vincolanti tra di loro. 2. Ad informazione completa: le funzioni di utilità dei giocatori sono conoscenza comune. Ad informazione incompleta: almeno un giocatore non conosce la funzione di utilità degli altri giocatori. 3. Statici: i giocatori scelgono le proprie mosse simultaneamente, senza conoscere in anticipo le mosse degli avversari. Dinamici: le mosse sono di tipo sequenziale, per cui la scelta di un giocatore ad un certo istante è condizionata da quelle dei giocatori agli istanti precedenti. > Ad informazione perfetta: ad ogni istante del gioco il giocatore a cui spetta la mossa conosce l intera storia del gioco. > Ad informazione imperfetta: almeno un giocatore può non conoscere l intera storia del gioco. 52

Rappresentazione in forma estesa Bisogna specificare:. il numero di giocatori n; 2. a. quando i giocatori hanno diritto alla mossa; b. le azioni ammissibili di ogni giocatore (a i A i ) ad ogni step del gioco; c. la conoscenza di ogni giocatore al momento della mossa; 3. i payoff di ogni giocatore in corrispondenza di ogni possibile combinazione di mosse degli altri giocatori. 53

Rappresentazione in forma estesa: esempio L R 2 2 L R L R Payoff Payoff 2 3 2 2 0 0 54

Induzione a ritroso È un algoritmo di risoluzione dei giochi dinamici ad informazione completa. In un gioco a 2 stadi: si parte dalla mossa del giocatore 2, che si trova a risolvere il seguente problema: R 2 a = arg max u 2 (a, a 2 ); a 2 A 2 il giocatore sa che 2 risponderà in maniera ottimale ad ogni sua mossa, quindi sceglie a = arg max a A u (a, R 2 (a )); la soluzione del gioco è (a, R 2 (a )). 55

Induzione a ritroso: esempio L R 2 2 L R L R Payoff Payoff 2 3 2 2 0 0 56

Induzione a ritroso: esempio L R 2 2 L R L R Payoff Payoff 2 3 2 2 0 0 57

Induzione a ritroso: esempio L R 2 2 L R L R Payoff Payoff 2 3 2 2 0 0 58

Induzione a ritroso: esempio L L R 2 2 R L BI = (R, L ) R Payoff Payoff 2 3 2 2 0 0 59

Classificazione dei giochi. Cooperativi: i giocatori perseguono un obiettivo comune, e tendono ad accordarsi per migliorare il proprio profitto. Non cooperativi: i giocatori hanno obiettivi diversi, per cui non stipulano accordi vincolanti tra di loro. 2. Ad informazione completa: le funzioni di utilità dei giocatori sono conoscenza comune. Ad informazione incompleta: almeno un giocatore non conosce la funzione di utilità degli altri giocatori. 3. Statici: i giocatori scelgono le proprie mosse simultaneamente, senza conoscere in anticipo le mosse degli avversari. Dinamici: le mosse sono di tipo sequenziale, per cui la scelta di un giocatore ad un certo istante è condizionata da quelle dei giocatori agli istanti precedenti. > Ad informazione perfetta: ad ogni istante del gioco il giocatore a cui spetta la mossa conosce l intera storia del gioco. > Ad informazione imperfetta: almeno un giocatore può non conoscere l intera storia del gioco. 60

Definizioni Una strategia è un piano completo d'azione: un piano che specifica un'azione ammissibile del giocatore per ciascuna circostanza in cui il giocatore può essere chiamato ad agire. Un insieme informativo è un insieme di nodi decisionali che soddisfano le seguenti condizioni: in corrispondenza di ogni nodo dell'insieme informativo un giocatore ha diritto alla mossa; Il giocatore a cui spetta la mossa non sa quale nodo dell insieme informativo è stato raggiunto. 6

Esempio di gioco ad informazione imperfetta L L R 2 2 R L R 3 3 3 L R L R L R L R 62

Definizioni In un gioco ad informazione perfetta, ogni insieme informativo contiene un solo nodo; in un gioco ad informazione imperfetta, invece, esiste almeno un insieme informativo di un giocatore che contiene più di un nodo. 63

Definizioni Un sottogioco di un gioco in forma estesa: ha un unico nodo iniziale, che rappresenta l unico elemento dell insieme informativo a cui appartiene. comprende tutti i nodi decisionali e terminali successivi al nodo iniziale nell'albero del gioco, ma nessun nodo precedente; non spezza alcun insieme informativo (se un nodo di un insieme informativo appartiene al sottogioco, allora tutti i nodi di quell'insieme informativo appartengono al sottogioco). 64

Esempio di sottogioco L L R 2 2 R L R 3 3 3 L R L R L R L R 65

Esempio di sottogioco L L R 2 2 R L R 3 3 3 L R L R L R L R 66

Equilibrio di Nash perfetto nei sottogiochi Un equilibrio di Nash perfetto nei sottogiochi è un equilibrio le cui strategie dei giocatori costituiscono un equilibrio di Nash in ogni sottogioco. Ogni gioco dinamico finito ad informazione completa ha un equilibrio di Nash perfetto nei sottogiochi, eventualmente in strategie miste. 67

Equilibrio di Nash perfetto nei sottogiochi Procedimento:. Considerare i più piccoli sottogiochi che contengono i nodi terminali, trovare gli equilibri di Nash di ogni sottogioco e sostituire ogni sottogioco con i payoff appena calcolati. 2. Considerare i nodi iniziali dei sottogiochi appena risolti come nodi terminali di un gioco «ridotto» e ritornare al punto. fino ad arrivare al nodo iniziale. 68

Equilibrio di Nash perfetto nei sottogiochi: esempio L R 2 2 L R L R Payoff Payoff 2 3 2 2 0 0 69

Equilibrio di Nash perfetto nei sottogiochi: esempio L R 2 2 L R L R Payoff Payoff 2 3 2 2 0 0 70

Equilibrio di Nash perfetto nei sottogiochi: esempio L R 2 2 L R L R Payoff Payoff 2 3 2 2 0 0 7

Equilibrio di Nash perfetto nei sottogiochi: esempio L R 2 2 2 2 72

Equilibrio di Nash perfetto nei sottogiochi: esempio L R 2 2 2 2 73

Equilibrio di Nash perfetto nei sottogiochi: esempio L R 2 2 L R L R Payoff Payoff 2 3 2 2 0 0 74

Equilibrio di Nash perfetto nei sottogiochi: esempio L L R 2 2 R L PRE = (R, (R L, L R)) R Payoff Payoff 2 3 2 2 0 0 75

Induzione a ritroso: esempio L R 2 2 BI = (R, L ) L R L R Payoff Payoff 2 3 2 2 0 0 76

Equilibrio di Nash vs induzione a ritroso L equilibrio di Nash perfetto nei sottogiochi è strettamente connesso con la soluzione trovata attraverso l induzione a ritroso, ma c è una differenza sostanziale: l equilibrio di Nash è costituito da un profilo di strategie (piani completi d azione), mentre l esito dell induzione a ritroso riguarda solo le azioni intraprese dal nodo iniziale a quello finale, è legato cioè alle particolari contingenze che si verificano: PRE = a, R 2 a ; BI = (a, R 2 (a )). 77