Giochi non cooperativi

Documenti analoghi
Teoria dei Giochi non Cooperativi

Teoria dei Giochi. Anna Torre

Equilibrio bayesiano perfetto. Giochi di segnalazione

Giochi e decisioni strategiche

Capitolo 25: Lo scambio nel mercato delle assicurazioni

Un modello matematico di investimento ottimale

La teoria dell utilità attesa

Teoria dei giochi. 1. Introduzione ed esempi. Slides di Teoria dei Giochi, Vincenzo Cutello 1

Concetti di soluzione in giochi dinamici a informazione perfetta in strategie pure (LEZIONE 4)

1 Giochi a due, con informazione perfetta e somma zero

Teoria dei Giochi. Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 2

Teoria dei Giochi. Anna Torre

Fondamenti e didattica di Matematica Finanziaria

Capitolo Terzo Valore attuale e costo opportunità del capitale

1. PRIME PROPRIETÀ 2

Esercizi di Ricerca Operativa II

GIUSTIFICARE LE RISPOSTE. Non scrivere la soluzione di esercizi diversi su uno stesso foglio.

Dimensione di uno Spazio vettoriale

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Traduzione e adattamento a cura di Gylas per Giochi Rari

LE FUNZIONI A DUE VARIABILI

Sequestro di persona a scopo di estorsione: una nuova teoria di gioco

risulta (x) = 1 se x < 0.

Dipartimento di Economia Aziendale e Studi Giusprivatistici. Università degli Studi di Bari Aldo Moro. Corso di Macroeconomia 2014

Capitolo 13: L offerta dell impresa e il surplus del produttore

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

Un modello matematico di investimento ottimale

1 Estensione in strategia mista di un gioco

Scelte in condizioni di rischio e incertezza

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Corrispondenze e funzioni

Ottimizzazione Multi Obiettivo

Economia Politica Microeconomia (ECN0006) 10 CFU a.a Eleonora Pierucci

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

( x) ( x) 0. Equazioni irrazionali

Teoria dei Giochi. Anna Torre

Teoria dei Giochi. Teoria dei Giochi

ELASTICITÀ. Sarebbe conveniente per il produttore aumentare ulteriormente il prezzo nella stessa misura del caso

Richiami di teoria della domanda di moneta

LEZIONE 23. Esempio Si consideri la matrice (si veda l Esempio ) A =

Il sistema monetario

1. Limite finito di una funzione in un punto

Scelte in condizione di incertezza

Edited by Foxit PDF Editor Copyright (c) by Foxit Software Company, 2004 For Evaluation Only.

Il mercato assicurativo: selezione avversa, fallimenti del mercato, menù di contratti, assicurazione obbligatoria

Lezioni di Matematica 1 - I modulo

CAPITOLO 10 I SINDACATI

Capitolo 2. Operazione di limite

ESERCIZI DI MATEMATICA FINANZIARIA DIPARTIMENTO DI ECONOMIA E MANAGEMENT UNIFE A.A. 2015/ Esercizi: lezione 24/11/2015

Calcolo del Valore Attuale Netto (VAN)

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Tasso di interesse e capitalizzazione

5 Risparmio e investimento nel lungo periodo

Il mercato di monopolio

Calcolo delle probabilità

1 Applicazioni Lineari tra Spazi Vettoriali

Giochi ripetuti. Gianmaria Martini

Esercitazione 23 maggio 2016

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che:

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Lezione 9: Cambio di base

Esercizi su lineare indipendenza e generatori

MICROECONOMIA La teoria del consumo: Alcuni Arricchimenti. Enrico Saltari Università di Roma La Sapienza

Capitolo 25: Lo scambio nel mercato delle assicurazioni

MATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010

INTRODUZIONE I CICLI DI BORSA

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

IL RISCHIO D IMPRESA ED IL RISCHIO FINANZIARIO. LA RELAZIONE RISCHIO-RENDIMENTO ED IL COSTO DEL CAPITALE.

10. Insiemi non misurabili secondo Lebesgue.

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria).

Epoca k Rata Rk Capitale Ck interessi Ik residuo Dk Ek 0 S 0 1 C1 Ik=i*S Dk=S-C1. n 0 S

Capitolo 20: Scelta Intertemporale

Parte 2. Determinante e matrice inversa

Aspettative, consumo e investimento

ESERCITAZIONE novembre 2012

Probabilità discreta

Le Scelte Finanziarie. S. Corsaro Matematica Finanziaria a.a. 2007/08

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA

CALCOLO COMBINATORIO

1 Serie di Taylor di una funzione

Sono casi particolari di MCF : SPT (cammini minimi) non vi sono vincoli di capacità superiore (solo x ij > 0) (i, j) A : c ij, costo di percorrenza

Teoria dei Giochi. Anna Torre

Per poter affrontare il problema abbiamo bisogno di parlare di probabilità (almeno in maniera intuitiva). Analizziamo alcune situazioni concrete.

da 2 a 5 giocatori, dai 10 anni in su, durata 30 minuti

2. Leggi finanziarie di capitalizzazione

Per lo svolgimento del corso risulta particolarmente utile considerare l insieme

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora:

Primi esercizi per gli studenti del corso di Statistica ed Elementi di Probabilita

4. Operazioni elementari per righe e colonne

La Minimizzazione dei costi

Corso di Scienza Economica (Economia Politica) prof. G. Di Bartolomeo

ESERCIZI DI MATEMATICA FINANZIARIA DIPARTIMENTO DI ECONOMIA E MANAGEMENT UNIFE A.A. 2015/ Esercizi 4

Parte 3. Rango e teorema di Rouché-Capelli

Appunti sulla Macchina di Turing. Macchina di Turing

APPLICAZIONI LINEARI

VINCERE AL BLACKJACK

Matematica 1 - Corso di Laurea in Ingegneria Meccanica

Transcript:

Indice 1 Giochi non cooperativi 5 11 Teoria delle decisioni 5 12 Decisioni sotto stretta incertezza 8 13 Decisioni intertemporali 14 14 Preferenze e funzioni di utilità 20 15 Equilibri di Nash 23 16 Giochi in forma estesa I 34 17 Giochi in forma estesa II 45 18 Raffinamenti degli equilibri di Nash 55 19 Esempi di giochi con strategie dominate 61 110 Evasione fiscale (Li-Calzi) 65 111 Giochi con potenziale 68 112 Giochi di contrattazione 71 113 Corsa agli sportelli (gioco a due stadi) 77 114 Dilemma del prigioniero ripetuto n volte 81 115 Giochi ripetuti e automi finiti 87 2 Evolutionary Game Theory da Weibul 97 21 Elementi della Teoria dei Giochi non cooperativi 97 22 Criteri di stabilità evolutiva 102 23 Dinamica del replicatore 115 3

Capitolo 1 Giochi non cooperativi 11 Teoria delle decisioni Esempio 11 Roulette russa Due persone della stessa età e della stessa salute hanno ciascuna una rivoltella Il primo tizio ha 3 proiettili nel tamburo della pistola a 6 colpi Il secondo tizio ha 1 proiettile nel tamburo della pistola a 6 colpi Ciascuno sta per ruotare il tamburo, puntare la pistola alla propria testa e premere il grilletto Questo è tutto ciò che sai Puoi togliere 1 solo proiettile da una delle pistole prima che essi premano il grilletto Da quale pistola toglieresti il proiettile? Cerchiamo di schematizzare il problema: ci sono 2 azioni: AZIONE 1: prendere 1 proiettile da quella che ne ha 3 AZIONE 2: prendere 1 proiettile da quella che ne ha 1 5

Vediamo di schematizzare con le probabilità dei possibili esiti: 0 MORTI 1 MORTO 2 MORTI AZIONE 1 20/36 14/36 2/36 AZIONE 2 1/2 1/2 0 Consideriamo una funzione perdita o misura di utilità negativa v(0) = 0 v(1) = l 0 < l < 1 v(2) = 1 Se non amo il rischio: la perdita attesa dal azione 1 (lotteria L 1 ) sarà minore della perdita attesa dall azione 2 (lotteria L 2 ) L 1 : 0 1 2 MORTI 20/36 14/36 2/36 PROBABILITÀ L 2 : 0 1 2 MORTI 1/2 1/2 0 PROBABILITÀ 6

Se non amo il rischio: εv(l 2 ) < εv(l 1 ) cioè v(0) 1 2 + v(1) 1 20 14 + v(2) 0 < v(0) + v(1) 2 36 36 + v(2) 2 36 v(1) 1 2 l 1 2 < v(1) 14 36 + v(2) 2 36 < l 14 36 2 36 2 l > 1 l > 1 2 quale interpretazione possiamo dare? Naturalmente preferiamo l azione che limita il possibile numero di morti Rischiare 2 morti è più di due volte brutto che rischiarne uno 2l > 1, 2l < 1, v(2) > 2v(1) e questo è in accordo con ciò che la gente pensa usualmente In generale un singolo incidente che comporta più morti è considerato peggiore di più incidenti separati che conducono allo stesso numero di morti Questo problema si può confrontare con un altro reale a cui si trovano di fronte i medici: le risorse mediche sono limitate e non è possibile trattare tutti i pazienti che hanno bisogno di cure Consideriamo ad esempio un cardiologo che può curare solo 1 di 2 pazienti: 7

senza trattamento il I ha 1 2 probabilità di morire subito 1 2 probabilità di diventare vecchio con il trattamento il I ha 1 3 probabilità di morire per il II paziente: senza trattamento il II ha 1 6 probabilità di morire con il trattamento il II guararà cosa sceglierà il medico? Il problema è esattamente quelo di prima 12 Decisioni sotto stretta incertezza Possiamo dividere i problemi decisionali in 3 classi: 1 DECISIONI CON CERTEZZA 2 DECISIONI CON RISCHIO 3 DECISIONI CON STRETTA INCERTEZZA Raccontiamo un esempio dovuto a Savage (1972): Tua moglie ha appena rotto 5 uova buone in un tegame quando tu arrivi per fare l omelette Esiste un sesto uovo non rotto davanti al tegame, può essere usato per l omelette o per qualche cos altro Devi decidere cosa fare con questo, cioè hai 3 possibili azioni: 8

1 ROMPERLO NEL TEGAME CHE CONTIENE GLI ALTRI 5 2 ROMPERLO IN UN PIATTO PER ISPEZIONARLO 3 BUTTARLO VIA SENZA ISPEZIONARLO Dipendendo dallo stato delle uova, queste 3 azioni avranno delle conseguenze STATI BUONO: ϑ 1 CATTIVO: ϑ 2 ROMPERE OMELETTE DI NESSUNA OMELETTE NEL TEGAME 6 UOVA E 6 UOVA BUONE α 1 x 11 DISTRUTTE x 12 ROMPERE OMELETTE DI OMELETTE DI NEL PIATTO 6 UOVA + 5 UOVA α 2 1 PIATTO DA E 1 PIATTO DA LAVARE LAVARE x 21 x 22 BUTTARE OMELETTE DI OMELETTE DI VIA 5 UOVA E 1 5 UOVA α 3 BUON UOVO x 32 DISTRUTTO x 31 Le conseguenze x ij non sono numeri ma si può sempre associare un valore che misura x ij cioè intendiamo per misura del valore > preferenza del decisore v(x ij ) > v(x kl ) x ij > x kl I problemi decisionali sono stati classificati in accordo alle conoscenze del 9

decisore sugli stati della natura Le decisioni sotto stretta incertezza sono quelle per cui il decisore non può dire nulla circa il vero stato della natura Non solo egli è ignorante del vero stato, ma non può quantificare la sua incertezza in alcun modo Egli può solo dire che ciascun ϑ j descrive un possibile stato del mondo e ϑ 1, ϑ 2,, ϑ n è una lista esaustiva delle possibilità Come sceglie un decisore sotto stretta incertezza? Vediamo alcuni criteri: 1 WALD S MAX-MIN RETURN (1950) Con l azione a i la peggior conseguenza possibile per il decisore è: s i = min v ij j = 1,, n È chiamato livello di sicurezza di a i Se interpretiamo v ij come un valore finanziario, s i può essere interpretato notando che a i garantisce al decisore un ritorno di almeno s i Il criterio del max-min ritorno suggerito suggerito da WALD è: scegliere l azione a k : è un criterio molto pessimista s k = max {min (v ij )} i j 2 HURCHIWICZ-INDICE DI OTTIMISMO/PESSIMISMO Definiamo il livello di ottimismo di a i come σ i = max v ij j = 1,, n cioè il valore della miglior conseguenza che a i può dare Il criterio del max-min ritorno è m m n σ k = max {σ i } = max {max (v ij )} i = 1 i = 1 j = 1 10

Questo è una critica al criterio pessimista di WALD: perché è più razionale essere pessimisti che ottimisti? Un vecchio proverbio dice: IT IS BETTER TO BE SAFE THAN SORRY Il criterio di WALD è più prudente ma NOTHING VENTURED, NO- THING GAINED HURCHIWICZ (1951) suggerì che poche persone sono così pessimiste o così ottimiste come questi estremi possono portare, suggerì così una strada di mezzo: sostenne che un decisore dovrebbe scegliere le azioni in accordo ad una media pesata dei livelli di sicurezza e di ottimismo αs i + (1 α)σ i con 0 α 1 α è l indice di ottimismo/pessimismo HURCHIWICZ raccomanda per la regola di decisione di scegliere n a k : αs k + (1 α)σ k = max {αs i + (1 α)σ i } i = 1 3 SAVAGE MIN-MAX REGRET Savage (1951) osservò che nell usare i valori v ij per guidare una scelta, il decisore confronta il valore della conseguenza di un azione sotto uno stato di natura con i valori di tutte le altre conseguenze qualunque sia lo stato di natura Savage definisce il RIMPIANTO di una conseguenza come: m r ij = max {v ij } v ij i = 1 cioè è la differenza tra il valore che risulta dalla miglior azione dato ϑ j e il valore che risulta da a i sempre in ϑ j (stato del mondo) Ad ogni azione si deve assegnare l indice n ρ i = max {r ij } = massimo rimpianto che deriva dall azione a i j = 1 11

Allora si deve scegliere un azione che minimizza ρ i cioè scegliere a k : m m n ρ k = min {ρ i } = min {max (r ij )} i = 1 i = 1 j = 1 4 LAPLACE (1825) osservò che non sapere nulla circa gli stati della natura è lo stesso che tutti gli stati hanno uguale probabilità Se è scelta l azione a i e tutti gli stati hanno uguale probabilità, allora il decisore ha valore atteso da queste conseguenze incerte: ( ) n 1 v ij n j=1 e dovrebbe cercare di massimizzare il suo valore atteso di questa scelta cioè scegliere a k : n m { n 1 v n kj = max 1 v n ij j = 1 i = 1 j = 1 } 12

T ABLE 1 : ESEMP IO DI MILNOR ϑ 1 ϑ 2 ϑ 3 ϑ 4 s i σ i j ( 1 n )v ij a 1 2 2 0 1 0 2 5/4 a 2 1 1 1 1 1 1 1 a 3 0 4 0 0 0 4 1 a 4 1 3 0 0 0 3 1 T ABLE 2 : RIMP IANT I P ER L ESEMP IO DI MILNOR ϑ 1 ϑ 2 ϑ 3 ϑ 4 ρ i a 1 0 2 1 0 2 a 2 1 3 0 0 3 a 3 2 0 1 1 2 a 4 1 1 1 1 1 Esempio per il calcolo: r 22 = max{2, 1, 4, 3} 1 = 4 1 = 3 13

- CRITERIO DI LAPLACE: a 1 - CRITERIO DI WALD: a 2 - CRITERIO DI HURCHIWICZ: assegna gli indici 2(1 α), 1, 4(1 α), 3(1 α) rispettivamente ad a 1, a 2, a 3, a 4 In quanto αs k + (1 α)σ k = max{αs i + (1 α)σ i } 0 α < 1 4(1 α) > 2(1 α) 4(1 α) > 3(1 α) se α < 3/4 4(1 α) > 1 così il criterio di Hurchiwicz sceglie a 3 per α < 3/4 - CRITERIO DI SAVAGE: a 4 Ogni criterio sceglie un azione differente SONO TUTTI BUONI CRITERI? 13 Decisioni intertemporali Molti problemi decisionali hanno a che vedere con progetti in cui i costi e i benefici crescono con un certo numero di anni Consideriamo solo casi in cui i costi e i benefici sono interamente monetari Vediamo ad esempio il flusso di cassa (CASH-FLOW) dato nei 6 progetti della tavola seguente: 14

ANNI A B C D E F 0-10 M -10 M -10 M -1 M -16 M -16 M 1 +5 M +5 M +2 M +05 M +16 M +32 M 2 +5 M +5 M +8 M +05 M +5 M +192 M 3 0 +5 M +5 M +05 M 0 0 4 0 +5 M +5 M +05 M 0 0 Consideriamo solo 2 tipi di decisione: 1) ACCETTARE O RIFIUTARE 2) CLASSIFICARE Nel caso 1) ciascun progetto è considerato indipendente da tutti gli altri Nel caso 2) tutti i progetti sono confrontati e classificati con l intenzione di adottare un singolo progetto: il più favorevole È importante includere un progetto nullo che rappresenta lo status quo In questo contesto studieremo solo le decisioni di tipo 2) ( classificare ) Discutiamo qui 4 regole decisionali, regole che aiutano il decisore a classificare i progetti che coinvolgono costi e benefici temporali La regola più semplice è confrontare progetti tenuto conto del tempo in cui chiudono in pareggio cioè tenendo conto del periodo di rimborso Questo viene chiamato PAYBACK-METHOD (o METODO DI RIMBOR- SO) Lo indicheremo con PM Il progetto A ha un periodo di rimborso di 2 anni, così anche B, C, D 15

Il progetto E ha un periodo di rimborso di 1 anno Il progetto F ha un periodo di rimborso di 2 anni Questo metodo considera il progetto E il più favorevole, ma non distingue tra i progetti A, B, C, D e F Questo metodo contiene un certo numero di errori, vediamone alcuni: i) In nessun conto è tenuto il profitto totale dopo il rimborso (confronta A e B) ii) In nessun conto è tenuta la misura dell investimento (confronta B e D) iii) In nessun conto è tenuta la distribuzione di entrata e uscita (reddito e spesa) confronta B e C iv) Il periodo di rimborso non è chiaramente definito se il progetto coinvolge investimenti di più anni ESEMPIO: INVESTIMENTI -10 M + 10 M +4 M -4 M +4 M ANNI 0 1 2 3 4 Qual è il periodo di rimborso? 1 anno oppure 3 anni? Due parole in favore del metodo di rimborso (PM): 1 È molto semplice da capire e usare 2 Minimizzando il periodo di rimborso si minimizza il rischio, infatti, essendo il futuro incerto, un decisore dovrebbe minimizzare il tempo in cui un investimento è in sospeso Un altro metodo più opportuno di valutare lo scorrere del tempo è suggerito dal metodo ARR (=ACCOUNTING RATE OF RETURN = STIMA DELLA VELOCITÀ DEL GUADAGNO) ARR = PROFITTO MEDIO ANNO DI 1 PROGETTO SPESA DEL CAPITALE 100% 16

Allora indicando ARR(A) per calcolare ARR del progetto A, si ottiene: ARR(A) = (5 + 5 10)/2 10 100% = 0% (5 + 5 + 5 + 5 10)/4 ARR(B) = 100% = 25% 10 (2 + 8 + 5 + 5 10)/4 ARR(C) = 100% = 25% 10 (05 + 05 + 05 + 05 1)/4 ARR(D) = 100% = 25% 1 (16 + 5 16)/2 ARR(E) = 100% = 156% 16 (32 + 192 16)/2 ARR(F) = 100% = 20% 16 Con questo metodo l ordine di preferenza dei progetti è il seguente: B, C, D sono i migliori poi F, E, A Diversamente dal metodo di rimborso PM il criterio ARR tiene conto del profitto necessario dopo che un progetto chiude in pareggio (esempio B è meglio di A) Inoltre è sempre ben definito Tuttavia: i) non è presa in considerazione la misura dell investimento (confronta B e D); ii) non è presa in considerazione la distribuzione dei beni in entrata e in uscita (confronta B e C) Né il metodo PM né il metodo ARR coinvolgono fattori di sconto La maggior parte di noi preferirebbe avere 100 euro ora piuttosto che 100 euro tra un anno cioè in termini economici manifestiamo preferenze temporali sui consumi in periodi differenti Supponiamo che 1 euro ora sia equivalente a (1+r) euro r>0 in un anno allora 1 euro ricevuta in n anni è peggio di (1/(1 + r)) n euro ricevute ora 17

Usiamo questa idea per valutare la bontà di un progetto mediante il metodo: NPV=NET PRESENT VALUE=VALORE ATTUALE NETTO Allora calcoliamo NPV(A), NPV(B), ecc NPV(A) = 10M + 5 1 + r M + 5 (1 + r) 2 M + 0 + 0 NPV(B) = 10M + 5 1 + r M + 5 (1 + r) 2 M + 5 (1 + r) 3 M + 5 (1 + r) 4 M NPV(C) = 10M + 2 1 + r M + 8 (1 + r) 2 M + 5 (1 + r) 3 M + 5 (1 + r) 4 M NPV(D) = 1M + 05 1 + r M + 05 (1 + r) 2 M + 05 (1 + r) 3 M + 05 (1 + r) 4 M NPV(E) = 16M + 16 1 + r M + 5 (1 + r) 2 M + 0 + 0 NPV(F) = 16M + 32 1 + r M + 192 (1 + r) 2 M + 0 + 0 In generale r è noto come TASSO DI SCONTO (=DISCOUNT RATE) Ci sono varie controvesie circa il valore numerico da assegnare ad r ma qui non ne parleremo, per il nostro problema assumeremo Quindi: r = 01 NPV(A) = 1322M NPV(B) = 5850M NPV(C) = 5601M NPV(D) = 0585M NPV(E) = 2678M NPV(F) = 2777M Con questo metodo i progetti sono così ordinati come ordine di preferenze: 18

1 B 2 C 3 F 4 E 5 D 6 A Questo criterio non è soggetto a nessuna delle quattro critiche che erano state fatte per PM Tuttavia ci chiediamo: il metodo NPV tiene conto del fattore r di sconto in maniera corretta? r è lo stesso ogni anno? Stabilire un valore appropriato al fattore di sconto per un particolare problema è sempre una questione controversa Un metodo che supera, almeno in parte, questo problema è il criterio decisionale IRR=INTERNAL RATE OF RETURN = TASSO DI PROFITTO INTERNO IRR è definito essere il valore di r tale che NPV di un progetto è zero Per trovare IRR(A) dobbiamo risolvere 10M + 5M (1 + r) + 5M (1 + r) = 0 2 Pongo x = 1/(1 + r) e dividendo per 5M si ha: ed essendo x = 1/(1 + r) > 0 si ha 2 + x + x 2 = 0 x = 1 o x = 2 1 1 + r = 1 r = 0 19

Allora IRR(A) = 0% In modo analogo si calcola IRR degli altri 5 progetti: IRR(A) = 0% IRR(B) = 35% IRR(C) = 32% IRR(D) = 35% IRR(E) = 25% IRR(F) = 20% Allora i progetti migliori sono B e D e i rimanenti nell ordine: C, E, F, A Osserviamo che IRR diversamente da NPV tiene conto della misura dell investimento (confronta B e D) NPV classifica F sopra E IRR classifica E sopra F Si potrebbe discutere ancora a lungo su questa diversa classificazione (per approfondimenti cfr S French) ma fermiamoci qui: nessun metodo è completamente soddisfacente NPV sembra essere quello con meno inconvenienti ma potremmo discutere a lungo sulla sua applicabilità 14 Preferenze e funzioni di utilità Il modo più primitivo per descrivere delle preferenze è una relazione definita su un insieme Ω di esiti Affinché la relazione sia un PREORDINE TOTALE è necessario che: a b oppure b a a b e b c = a c a, b, c Ω (TOTALITÀ) (TRANSITIVITÀ) (segue la RIFLESSIVITÀ considerando b = a nella formula della totalità) 20

La transitività è una richiesta razionale La totalità ci assicura che un individuo può sempre esprimere una preferenza tra due esiti Perché una persona razionale deve avere preferenze transitive? (ved es money-pump ) La relazione di indifferenza è definita da: La relazione di stretta preferenza da: a b e b a a b a b e non a b a < b Il problema della decisione consiste nel trovare l esito ω (ω S Ω) che il decisore preferisce (Notiamo che tale ω potrebbe non esistere, ad esempio se S è infinito Esiste il numero più grande nell intervallo (0,1)? Nel nostro contesto evitiamo simili casi) In molte situazioni può essere difficile esprimere le preferenze allora le funzioni di utilità sono l espediente matematico per semplificare la situazione Una funzione u : Ω R è una funzione di utilità che rappresenta la relazione di preferenza se e solo se u(a) u(b) a b allora il problema di trovare il miglior ω S si riduce al più facile problema di trovare un valore di ω S per cui u(ω) = max u(s) s S 21

PARADOSSO DI S PIETROBURGO Consideriamo la lotteria illustrata in figura PREMIO $2 $4 $8 $16 $2 k SUCCESSIONE DI H TH TTH TTTH T TH MONETE ( PROBABILITÀ 1 2 1 4 1 8 1 16 k 1 2) T = toss H = head (croce) (testa) Si può realizzare lanciando una moneta ripetutamente finché non mostra testa (H) La tabella va interpretata così: leggendo la 1 a colonna: leggendo la 2 a colonna: ecc vinco $2 se viene testa (H) al 1 o lancio e ciò può avvenire con probabilità 1 2 vinco $4 se viene testa (H) al 2 o lancio e ciò può avvenire con probabilità 1 4 Se la moneta mostra testa (H) al k-simo lancio vinco $2 k Quanto sareste disposti a pagare per partecipare a questa lotteria? Supponiamo che ciascun lancio della moneta sia indipendente, le probabilità sono calcolate come indicato in tabella Vediamo come esempio il caso k = 4 cioè la probabilità che esca testa al 4 lancio: 22

prob(ttth) = prob(t) prob(t) prob(t) prob(t) = Il valore atteso in dollari nella lotteria di S Pietroburgo è allora: ε(l) = 2 prob(h) + 4 prob(th) + 8 prob(tth) + = ( ) 4 1 = 1 2 16 2 1 2 + 4 1 4 + 8 1 8 + = 1 + 1 + 1 + = + il che significa che il valore atteso in dollari della lotteria è infinito Sareste quindi disposti a spendere il vostro intero patrimonio per comprare un biglietto per partecipare alla lotteria? Poca gente farebbe così soprattutto dopo aver notato che la probabilità di concludere con più di 8$ è solo 1 8 Non è sufficiente scegliere una lotteria che mi dà il più alto valore atteso in dollari per dire di aver fatto una scelta razionale, una teoria che dicesse ciò è insufficiente Quindi: per valutare un investimento richiesto, il guadagno atteso non è il criterio che la gente adotta, il criterio è L UTILITÀ ATTESA 15 Equilibri di Nash Definizione 12 GIOCO NON COOPERATIVO Un gioco non cooperativo a 2 giocatori è una quaterna Γ = (X, Y, f, g) dove X, Y sono gli insiemi delle strategie dei due giocatori, f, g sono le funzioni di utilità dei due giocatori f, g : X Y R Definizione 13 EQUILIBRIO DI NASH Diremo che una coppia di strategie (x, y) X Y è un equilibrio di Nash se f(x, y) f(x, y) x X g(x, y) g(x, y) y Y Riprendiamo alcuni esempi già noti in lezioni precedenti: 23

Esempio 14 MORRA CINESE II I S C F S 0 0-1 1 1-1 C 1-1 0 0-1 1 F -1 1 1-1 0 0 S = sasso C = carta F = forbice non esistono equilibri di Nash Esempio 15 DILEMMA DEL PRIGIONIERO II I C NC C -8-8 0-10 NC -10 0-1 -1 Due persone sono accusate di aver commesso un grave crimine 24

se ambedue confessano subiscono la pena di 8 anni di galera se non confessano non ci sono prove sufficienti a stabilire chi ha commesso il crimine, ma il giudice li condanna per un reato minore: 1 anno di galera se uno confessa la partecipazione di entrambi, per una legge speciale, è libero e l altro è condannato a 10 anni di galera La matrice associata è quella in figura C è un solo equilibrio di Nash (NE):(CC) (cioè entrambi confessano), ma il risultato è insoddisfacente per entrambi perché così faranno 8 anni di galera Se entrambi si mettessero d accordo di non confessare, farebbero meno anni di galera, ma l accordo è instabile perché se uno sa che l altro non confessa allora gli conviene confessare così sarà libero: è un dilemma L equilibrio di Nash è l unica soluzione accettabile però è poco soddisfacente Esempio 16 BATTAGLIA DEI SESSI II I L R T 3 1 0 0 B 0 0 1 3 esistono due equilibri di Nash: (T,L) e (BR) Esempio 17 GIOCO A 3 GIOCATORI Questo gioco coinvolge 3 giocatori: ciascun giocatore può prendere 1 oppure 2 monete nella sua mano 25

Se ogni giocatore ha un numero differente di monete dagli altri giocatori allora egli ottiene un payoff uguale al numero delle monete che ha in mano e gli altri non ottengono niente Chiamiamo I, II III i tre giocatori Spazio delle strategie del giocatore I: X = {1, 2} dove 1 indica una moneta e 2 indica due monete Y = {1, 2} (spazio delle strategie del giocatore II) Z = {1, 2} (spazio delle strategie del giocatore III) II I j=1 j=2 i=1 0 0 0 0 2 0 i=2 2 0 0 0 0 1 k = 1 II I j=1 j=2 i=1 0 0 2 1 0 0 i=2 0 1 0 0 0 0 gli equilibri di Nash sono: k = 2 (2, 1, 1), (1, 2, 1), (2, 2, 1) (1, 1, 2), (1, 2, 2), (2, 1, 2) 26

ESERCIZI PROPOSTI 1) Stabilire se esistono equilibri di Nash in strategie pure nel seguente gioco a 2 giocatori II I C D A 1 1 1 1 B 2 2 0 3 2) stessa domanda nel seguente gioco a 3 giocatori dove X = {U, D}, Y = {L, R}, Z = {A, B, C} A II I L R U 0 1 3 0 0 0 D 1 1 1 1 0 0 B II I L R U 2 2 2 0 0 0 D 0 0 0 2 2 2 27

C II I L R U 0 1 0 0 0 0 D 1 1 0 1 0 3 ESTENSIONE MISTA DI UN GIOCO Sia dato un gioco (che per semplicità di notazione supporremo a 2 giocatori e per evitare difficoltà tecniche supporremo A I e A II, spazi delle strategie dei due giocatori, finiti) G = ({I, II}, A I, A II, u I, u II ) dicesi ESTENSIONE MISTA DI G il gioco G così definito G = ({I, II}, (A I ), (A II ), u I, u II) dove (A i ) è lo spazio delle distribuzioni di probabilità su A i Cioè se ad esempio A I = {x 1,, x m } A II = {y 1,, y n } allora (A I ) = {p R m, p h 0 h e m h=1 p h = 1} e (A II ) = {q R n, q k 0 k e n k=1 q k = 1} Risulta u i cioè: l estensione di u i da A I A II a (A I ) ( A II ) per bilinearità u i (p, q) = m h=1 k=1 n p h q k u i (x h, y k ) è importante il fatto che: L ESTENSIONE MISTA DI UN GIOCO FINITO HA SEMPRE UN EQUILIBRIO DI NASH (TEOREMA DI NASH 1950) (a volte si dice: ogni gioco finito ha equilibrio in strategie miste) 28

ESEMPIO Vediamo nell esempio della BATTAGLIA DEI SESSI di calcolare gli equilibri in strategie miste: q 1-q p 3 1 0 0 1-p 0 0 1 3 p, q [0, 1] Calcoliamo l utilità attesa del giocatore I u I (p, q) = 3pq + 0 p(1 q) + 0 (1 p)q + 1 (1 p)(1 q) = fissata q, consideriamo 3pq + 1 q p + pq = 4pq + 1 p q u I (p, q) = 4pq + 1 p q = p(4q 1) + 1 q u I (p,q) p = 4q 1 > 0 q > 1 4 argmax u I = 1 p = 0 q = 1 4 argmax u I = [0, 1] p < 0 q < 1 4 argmax u I = 0 p si ottiene così il seguente grafico 29

q q= 1 4 1 0 1 p questo è il grafico della miglior risposta del giocatore I fissata la strategia del II; la indico con R I (q) Calcoliamo ora l utilità attesa del giocatore II u II (p, q) = 1 pq+0 p(1 q)+0 (1 p)q+3(1 p)(1 q) = pq+3(1 p)(1 q) = = pq + 3(1 q p + pq) = pq + 3 3q 3p + 3pq = 4pq 3p 3q + 3 u II (p, q) = (4p 3)q + 3(1 p) cerco q che rende massima u II (p, ) u II (p,q) q = 4p 3 > 0 p > 3 4 argmax u II(p, ) = 1 q = 0 p = 3 4 argmax u II(p, ) = [0, 1] q < 0 p < 3 4 argmax u II(p, ) = 0 q si ottiene così il grafico di R II (p) (cioè la miglior risposta del giocatore II fissata la strategia del giocatore I) 30

q 1 0 p= 3 1 4 p da cui sovrapponendo i due grafici ridotti otteniamo i due equilibri di Nash in strategie miste e cioè (p, q) = (0, 0) (1, 1) ( ) 3 4, 1 4 (u I (0, 0), u II (0, 0)) = (1, 3) equilibrio in strategie pure (u I (1, 1), u II (1, 1)) = (3, 1) equilibrio in strategie pure ( ( )) ( ) 3 (u I ), 4, 1 3 u II 4 4, 1 3 = 4 4, 3 4 e questo è un nuovo equilibrio che trovo in strategie miste ESERCIZIO PROPOSTO: Provate a calcolare gli equilibri in strategie miste per il dilemma del prigioniero Definizione 18 Un gioco G a due giocatori dicesi a somma zero se u I (x, y) + u II (x, y) = 0 x X, y Y 31

ESERCIZIO: Si determinino gli equilibri di Nash in strategie miste del gioco a somma zero rappresentato dalla matrice: S D A 1 3 B 4 2 SOLUZIONE ESERCIZIO: X = {S, D} spazio delle strategie del I giocatore Y = {A, B} spazio delle strategie del II giocatore Questo gioco non ha equilibri in strategie pure ma per il Teorema di Nash sappiamo che ha almeno un equilibrio in strategie miste Calcoliamo l utilità attesa da I: u I (p, q) = pq 1 + p(1 q)3 + (1 p)q 4 + (1 p)(1 q) 2 = = p(1 4q) + 2(q + 1) u I (p, q) = p(1 4q) + 2(q + 1) u I (p,q) p = 1 4q > 0 q < 1 4 argmax u I = 1 p = 0 q = 1 4 argmax u I = [0, 1] p < 0 q > 1 4 argmax u I = 0 p 32

q q= 1 4 1 0 1 p u II (p, q) = pq( 1) + p(1 q)( 3) + (1 p)q( 4) + (1 p)(1 q)( 2) = = 4pq p 2q 2 u II (p, q) = 2q(2p 1) (p + 2) u II (p,q) q = 2(2p 1) > 0 p > 1 2 argmax u II = 1 q = 0 p = 1 2 argmax u II = [0, 1] q < 0 p < 1 2 argmax u II = 0 q 33

q 1 0 p= 1 1 2 p Si ottiene così un equilibrio in strategie miste dato da (p, q) = ( 1 2, 1 4 ) ( ( )) ( ) 1 (u I ), 2, 1 1 u II 4 2, 1 5 = 4 2, 5 2 16 Giochi in forma estesa I Un qualunque gioco può essere rappresentato sia in forma normale che in forma estesa? Le due forme sono equivalenti? Per rispondere a queste domande classifichiamo i giochi che abbiamo incontrato in 4 classi: GIOCO STATICO è un gioco in cui i giocatori scelgono contemporaneamente le azioni GIOCO A INFORMAZIONE COMPLETA è un gioco in cui la funzione dei payoff di ogni giocatore è nota ad ogni giocatore (cioè è conoscenza comune) GIOCO DINAMICO è un gioco in cui i giocatori scelgono le azioni in modo sequenziale (il 2 osserva cosa fa il 1 e poi decide ) GIOCO A INFORMAZIONE PERFETTA è un gioco in cui in corrispondenza ad ogni mossa, il giocatore cui spetta muovere è a conoscenza dell intera 34

storia fino a quel momento o anche se ogni insieme di informazione contiene un solo nodo Osservazione 19 Un gioco statico può essere pensato come un gioco dinamico ad informazione imperfetta La rappresentazione in forma estesa di un gioco specifica: 1 i giocatori che prendono parte al gioco 2 quando i giocatori hanno diritto alla mossa 3 cosa possono fare i giocatori in ogni circostanza in cui hanno diritto a una mossa 4 cosa conosce ogni giocatore quando gli spetta muovere 5 i payoff ricevuti da ciascun giocatore in corrispondenza ad ogni combinazione di mosse che può essere scelta dai giocatori Esempio 110 Gioco a informazione completa e perfetta: I L R II II L R L R (3,1) (1,2) (2,1) (0,0) F ig1 35

1 il giocatore I sceglie un azione a 1 dall insieme ammissibile A 1 = {L, R} 2 il giocatore II osserva a 1 e poi sceglie un azione a 2 dall insieme A 2 = {L, R } 3 i payoff sono u 1 (a 1, a 2 ), u 2 (a 1, a 2 ) e sono indicati nell albero del gioco Questo albero del gioco comincia da un NODO DECISIONALE in cui I decide tra L oppure R, se il giocatore I sceglie L, viene raggiunto un nodo decisionale dal giocatore II che può scegliere tra L e R Analogamente se I sceglie R In seguito ad ogni scelta del giocatore II si giunge ad un nodo terminale (cioè il gioco finisce) e i payoff indicati sono ricevuti dai giocatori Vogliamo ora rappresentare il gioco in forma normale (o strategica) Nel gioco della Fig 1, il giocatore II ha due azioni e 4 strategie perché ci sono 2 diverse circostanze (cioè aver osservato il giocatore I e scegliere L oppure aver osservato il giocatore I e scegliere R) in cui II può trovarsi: ricordo che la STRATEGIA per un giocatore è un piano completo di azione cioè specifica un azione ammissibile del giocatore per ciascuna circostanza in cui il giocatore può essere chiamato ad agire Ritornando alla Fig 1, cerchiamo di stabilire le strategie del giocatore II: Strategia 1: se il giocatore I gioca L allora II gioca L, se il giocatore I gioca R allora II gioca L ; questa strategia è indicata con (L L ) Strategia 2: se il giocatore I gioca L allora II gioca L, se il giocatore I gioca R allora II gioca R (L R ) Strategia 3: se il giocatore I gioca L allora II gioca R, se il giocatore I gioca R allora II gioca L (R L ) Strategia 4: se il giocatore I gioca L allora II gioca R, se il giocatore I gioca R allora II gioca R (R R ) Anche il giocatore I ha 2 azioni ma solo due strategie: giocare L oppure 36

R (perché ha la prima mossa del gioco) quindi A 1 = {L, R} Il gioco in forma estesa della Fig 1 ha la seguente rappresentazione strategica: II I L L L R R L R R L 3 1 3 1 1 2 1 2 R 2 1 0 0 2 1 0 0 Fig2 Definizione 111 Un insieme d informazione (o insieme informativo) di un giocatore è un insieme di nodi decisionali che soddisfano le seguenti condizioni: i) in corrispondenza di ogni nodo dell insieme di informazione, il giocatore ha diritto alla mossa ii) quando lo svolgimento del gioco raggiunge un nodo dell insieme di informazione, il giocatore a cui spetta la mossa non sa quale nodo dell insieme di informazione è stato (oppure non è stato) raggiunto 37

ESEMPIO 1 I S D II II l r L R vince I pari vince I vince II Se tutti gli insiemi di informazione sono singleton abbiamo un gioco a INFORMAZIONE PERFETTA II I l L rl lr rr S 1 0 1 1 1 0 1 1 D 1 0 1 0 0 1 0 1 38

ESEMPIO 2 I S D II II l r L R 0 4 2 0 1 2 1 2 1 3 2 3 1 2 5 4 1 2 1 1 Le strategie di I sono: S, D, le strategie di II sono: ll,lr, rl, rr, dove ll indica che: II gioca l se I gioca S II gioca L se I gioca D lr indica che: II gioca l se I gioca S II gioca R se I gioca D 39

II I l L lr rl rr S 3 2 3 2 3 2 3 2 13 3 1 13 3 1 D 0 2 4 0 0 2 4 0 Infatti se I gioca S e II gioca ll l utilità attesa dal giocatore I è: e l utilità attesa di II è: Se I gioca S e II gioca rl eccetera εu I = 1 1 2 + 2 1 2 = 3 2 εu II = 1 1 2 + 2 1 2 = 3 2 εu I = 1 3 5 + 2 3 4 = 13 3 εu II = 1 3 1 + 2 3 1 = 1 40

ESERCIZIO Come si rappresenta il dilemma del prigioniero con un gioco in forma estesa? Risoluzione: I NC C II II NC C NC C ( 1, 1) ( 10,0) (0, 10) ( 8, 8) (confronta Esempio 15) Ricordo che un gioco statico può essere pensato come un gioco dinamico a informazione imperfetta 41

QUIZ È una buona rappresentazione di un gioco in forma estesa? I S D A B II (1,2) (2,1) (1,3) (0,1) (4,5) E la seguente? II L R I S D S D (1, 1) ( 1,1) (1, 1) ( 1,1) 42

TEST Che interpretazione puoi dare al seguente albero? I D A (1,2) II B (2,1) (1,0) (0,1) 43

QUIZ (QUIZ-MASTER) In un popolare quiz televisivo ai concorrenti è data l opportunità di scegliere una fra tre porte Una porta nasconde un premio, le altre non hanno niente La concorrente non ha motivo di pensare che una particolare porta sia privilegiata rispetto ad un altra Il conduttore del gioco (=quiz-master) sa quale porta nasconde il premio Dopo che la concorrente ha scelto provvisoriamente una porta, egli (il quizmaster) deve aprire una delle altre porte La concorrente ha allora l opportunità di cambiare idea circa la porta da scegliere Supponiamo che la concorrente desideri rendere massima la probabilità di ottenere il premio e che il quiz-master desideri renderla minima a) Descrivi una strategia ottimale del quiz-master e supponi che d ora in poi egli giochi in accordo con questa strategia b) Disegna l albero del gioco DOMANDE DI P ROBABILIT À c) Se la concorrente non cambia mai la sua scelta iniziale spiega perché la sua probabilità di vincere prima che il quiz-master apra la porta è 1 3 Perché la sua probabilità di vincere rimane 1 anche dopo che il quizmaster ha aperto la porta? 3 Perché una persona ingenua pensa che quest ultima sia 1? 2 d) Se la concorrente cambia sempre la sua scelta dopo che il quiz-master ha aperto una porta spiega perché la sua probabilità di vincere è 2 3 Supponi che il quiz-master e la concorrente giocano al meglio Perché una persona ingenua pensa che la probabilità sia 1 2? 44