Strategie miste, minimax ed equilibri

Documenti analoghi
Una prima distinzione nell ambito della teoria dei giochi è quella tra: Giochi cooperativi (si possono fare accordi vincolanti)

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Giochi e dilemmi Parte III Giochi a somma zero

Esempio 1 Si consideri il seguente gioco in forma estesa:

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

INTRODUZIONE ALLA TEORIA DEI GIOCHI

Teoria dei Giochi. Anna Torre

Teoria dei Giochi. Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 5

In questo esempio, come in tutti gli altri, chiamiamo l individuo 1 giocatore di riga, perché deve scegliere di collocarsi in una delle due righe

GIOCHI, STRATEGIE DOMINATE e CONOSCENZA COMUNE

Teoria dei Giochi. Anna Torre

MATEMATICA FINANZIARIA RISCHI: RAPPRESENTAZIONE E GESTIONE (CENNI)

1 Equilibri Correlati

Metodi e modelli per le decisioni

IL CALCOLO DELLE PROBABILITA

Teoria dei Giochi Prova del 30 Novembre 2012

Giochi e dilemmi Parte II Giochi ad informazione incompleta

1 Giochi a somma costante, a somma zero e antagonistici

di Gunter Burkhardt Un gioco di carte per 2-4 giocatori dai 10 anni in su Tempo di gioco: 30 minuti

ESERCIZI SULLE MATRICI

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

4 0 = 4 2 = 4 4 = 4 6 = 0.

( ) le colonne della matrice dei coefficienti, con. , risulta A 3 = A 1 + 4A 2 + 4A 5, A 4 = A 1 + A 2,

MATERIALI DI GIOCO IDEA DI GIOCO PREPARAZIONE DEL GIOCO

Prof.ssa Laura Pagnozzi Prof. Ivano Coccorullo. Calcolo Combinatorio

Prof. Ing. Michele Marra Appunti delle Lezioni di Ricerca Operativa Teoria dei Giochi

Possibile applicazione

DIE SIEBEN WEISEN (I sette Sapienti)

Laboratorio di dinamiche socio-economiche

ESERCIZIO MIN-MAX Si consideri il seguente albero di gioco dove i punteggi sono tutti dal punto di vista del primo giocatore.

Il Gioco dell'evasione Fiscale

Teoria dei Giochi Prova del 9 Settembre se tutti i giocatori scelgono lo stesso numero, il payoff è zero per ciascun giocatore;

SOLUZIONI DEL 1 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA

Lunghezza media. Teorema Codice D-ario prefisso per v.c. X soddisfa. L H D (X). Uguaglianza vale sse D l i. = p i. . p.1/27

Analisi. Calcolo Combinatorio. Ing. Ivano Coccorullo

Prof.ssa Laura Pagnozzi Prof. Ivano Coccorullo. Calcolo Combinatorio

Calcolo della probabilità

Capitolo 30: Teoria dei Giochi

Esercizi sui sistemi di equazioni lineari.

È l insieme di tutti i possibili esiti di un esperimento aleatorio; si indica generalmente con il simbolo.

Codice Gray. (versione Marzo 2007)

Capitolo 10: Giochi dinamici. Ora l impresa 1 sceglie l output per massimizzare i propri profitti 1 8 = 122,5 Q 2 = 61,25

Regole del Sette e mezzo

Teoria dei giochi e comportamento strategico

Interpretazione economica della dualità

UNITÀ DIDATTICA 5 LA RETTA

2. ALGORITMO DEL SIMPLESSO

Probabilità esempi. Aiutiamoci con una rappresentazione grafica:

ESERCITAZIONE N.8. Il calcolatore ad orologio di Gauss. L aritmetica dell orologio di Gauss. Operazioni e calcoli in Z n

Appunti di Algebra Lineare. Distanze

Prof. Pagani Corrado ALGORITMI ESERCITAZIONI CICLI

PROGRAMMAZIONE STRUTTURATA

prima urna seconda urna

Matlab. Istruzioni condizionali, cicli for e cicli while.

Le Derivate. Appunti delle lezioni di matematica di A. Pisani Liceo Classico Dante Alighieri

Stefan Kloß TL Un avvincente gioco di coraggio per 2-5 temerari a partire dagli 8 anni

Array in Fortran 90. Ing. Luca De Santis. Anno accademico 2006/2007. DIS - Dipartimento di informatica e sistemistica

Lato anteriore e retro delle carte limite

Teoria dei giochi e comportamento strategico

Corso di preparazione ai Giochi di Archimede Calcolo combinatorio & Probabilità

ESERCITAZIONE MICROECONOMIA (CORSO B) ESEMPI DI ESERCIZI DI TEORIA DEI GIOCHI

Metodi per la risoluzione di sistemi lineari

Congruenze. Alberto Abbondandolo Forte dei Marmi, 17 Novembre 2006

Lanciando un dado, il tuo compagno esclama: uscirà 1, 2, 3, 4, 5 o 6 oppure: uscirà il numero 4. uscirà il numero 9

Rischi di mercato. Francesco Menoncin

Calcolo delle Probabilità 2013/14 Foglio di esercizi 2

LA VARIANTE PER I PRINCIPIANTI Cocotaki è un gioco pazzo. Quando si gioca per la prima volta, in particolare con bambini piccoli, è bene iniziare con

Misura e Valutazione del

PHASE 10 GIOCO DA TAVOLO In più la plancia! più tensione! più PHASE 10! da 2-6 giocatori dai 10 anni in su Tutte le fasi (combinazioni di determinare

Introduzione alla programmazione Esercizi risolti

BIGLIETTI, PREGO! Ambientazione: Preparazione: Fasi di gioco: di Emiliano il Wentu Venturini. Gioco di carte per 5-12 giocatori da 8 anni in su

insieme c n ce c r e t r ez e z z a a par a t r ien e e e o no distinguere l uno dall altro insieme degli animali a quattro zampe

Laboratorio di Programmazione: Linguaggio C Lezione 9 del 27 novembre 2013

Modulo 10. Teoria dei giochi

1 Esercisi sparsi svolti di Teoria dei Giochi

Traduzione e adattamento a cura di Gylas per Giochi Rari. Versione 1.1 Novembre

1 Definizione di sistema lineare omogeneo.

= < < < < < Matematica 1

Economia Industriale

Zeri di funzioni e teorema di Sturm

2.6 Calcolo degli equilibri di Nash

La teoria dell offerta

1 Modello di contrattazione di Nash

INFINITI ED INFINITESIMI. 1. Definizione di infinitesimo Per prima cosa, occorrono alcune definizioni dei concetti di infinito e di infinitesimo.

Algoritmi e dintorni: La radice quadrata Prof. Ettore Limoli. Formule iterative

La Teoria dei Giochi. (Game Theory)

Dall algoritmo al programma

Equazioni di 2 grado

Anno 4 Matrice inversa

Analisi Strategica per la Politica Economica

MINIMANUALE VBA PER CREARE MACRO NEI FOGLI EXCEL

La Talpa del Perú. G. Mezzetti 27 novembre 2004

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

SISTEMI LINEARI: APPROFONDIMENTI ED ESEMPI

Breve introduzione alla teoria dei giochi

Esercizi di Calcolo delle Probabilità

Distribuzione Gaussiana - Facciamo un riassunto -

1 Equazioni parametriche e cartesiane di sottospazi affini di R n

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE. Dispense :

Analisi Matematica I per Ingegneria Gestionale, a.a Scritto del secondo appello, 1 febbraio 2017 Testi 1

Transcript:

handout per la conferenza Strategie miste, minimax ed equilibri Sala degli Specchi - Comune di Sanremo 28 febbraio 2003 Fioravante PTRONE Dipartimento di Matematica Via Dodecaneso 35 16146 GENOV patronedima.unige.it http://www.dima.unige.it/~patrone http://tdg.dima.unige.it http://www.citg.unige.it/citg.htm http://www.scallywag.it homepage web teaching web server CITG web page del gruppo Scaλλywag

2 Fioravante Patrone - - - Strategie miste, minimax ed equilibri Nota preliminare: numeri che compaiono nelle varie tabelle etc. rappresentano soldi (euro, ad esempio). Il che è scorretto, ma è una approssimazione ragionevole per non parlaredifunzionidiutilità. Decisore singolo: No problem, il decisore sceglie C. Ci può essere indecisione/indifferenza: 10 B 7 C 11 11 B 7 C 11 Per non fare la fine dell asino di Buridano, possiamo usare le strategie miste per risolvere l indecisione.maillororuoloè non essenziale. Non solo, quale sia la probabilità con la quale si sceglie tra e C è irrilevante. Per ragioni varie è ragionevole assegnare la stessa probabilità ad o a C, ma potremmo anche scegliere con probabilità 1/6 e C con probabilità 5/6. Decisioni strutturate temporalmente: L s 7 D s R s 11 s U s 10 U 10 DL 7 DR 11

Sala degli Specchi - Comune di Sanremo - - - 28 febbraio 2003 3 L s 7 D s R s 11 s U s 11 U 11 DL 7 DR 11 Non cambia nulla... Un problema di investimento (nota: l alberello andrebbe disegnato un po diversamente, ma ci si può accontentare, purchè sia chiaro che neve e sole si riferiscono al tempo atmosferico nello stesso tempo e luogo): cappotti s neve sole s s 10 0 s gelati s neve s 0 sole s 10 Problema di scelta di portafoglio (Markowitz). Tutto dipende da che tempo farà. C è probabilità 1/2 che ci sia sole e 1/2 che ci sia neve... Se una azienda fabbrica cappotti, per ogni 3 euro investiti guadagna 10 euro se viene la

4 Fioravante Patrone - - - Strategie miste, minimax ed equilibri neve (e quindi con probabilità 1/2) e guadagna 0 se ci sarà il sole (quindi, con probabilità 1/2). rovescio se fabbrica gelati. Il decisore ha 6 lire da investire, e può investirle su mercato azionario, in azioni di fabbrica che produce gelati o in fabbrica che produce cappotti. Problema di scelta di portafoglio, e di minimizzazione del rischio a parità di guadagno atteso. Se investe 3 nel settore cappotti e 3 nel settore gelati, guadagna 5 con certezza! E questa una strategia mista? NO, è una strategia pura in un continuo di strategie (sceglie α [0, 1], cioè la composizione del portafoglio). Si tratta di sfruttare la correlazione (soprattutto se negativa, come nel nostro esempio) esistente nell andamento di titoli, per minimizzare il rischio. Passiamo ai giochi. Consideriamo il pari/dispari : I \ \ II P D P ( 1, 1) (1, 1) D (1, 1) ( 1, 1) Ragionamento del giocatore I: se II gioca P, a me conviene giocare D se io gioco D, a II conviene giocare D se II gioca D, a me conviene giocare P se io gioco P,aII conviene giocare P se II gioca P, a me conviene giocare D... Siamo finiti dentro a un ciclo che si ripete. Si ha un regresso infinito, senza riuscire a trovare un equilibrio. Stessa identica situazione se èilgiocatoreii a fare i ragionamenti. ltro gioco:

Sala degli Specchi - Comune di Sanremo - - - 28 febbraio 2003 5 I \ \ II L R T (2, 1) (1, 0) B (1, 2) (2, 1) Ragionamento di I: se II gioca R, a me conviene giocare B se io gioco B, aii conviene giocare L se II gioca L, ameconvienegiocaret se io gioco T,aII conviene giocare L se II gioca L, ameconvienegiocaret... Stavolta abbiamo trovato un equilibrio: (T,L), almeno se seguiamo i pensamenti di I. naloga situazione per i ragionamenti di II (T,L)è un equilibrio di Nash (vedi note del 15/1 per le definizioni). Ultimo esempio di gioco: I \ \ II L R T (4, 4) (1, 1) B (3, 3) (2, 2) Si vede che, rifacendo gli stessi discorsi, (B, R) è equilibrio. Osserviamo il fatto seguente (guardiamo il problema dal punto di vista di I):

6 Fioravante Patrone - - - Strategie miste, minimax ed equilibri min delle I \ \ II L R righe T 4 1 1 B 3 2 2 max delle colonne 4 2 min dei max sulle colonne max dei min sulle righe bbiamo che il min dei max sulle colonne è uguale al max dei min sulle righe! E un caso? No, se abbiamo un equilibrio, le strategie componenti sono di maxmin per I. Per quanto riguarda II, ovviamente vale lo stesso identico discorso; essendo il gioco a somma zero, le strategie di maxmin di II possono essere viste come strategie di minmax per I. E risultato generale sui giochi a somma zero. Per giochi a somma qualsiasi, equilibrio (di Nash) può dare risultati diversi dall uso di strategie di maxmin. Vedasi l esempio e l esperimento Resta un problema aperto: se abbiamo gioco senza equilibrio, come il pari o dispari? Usiamo le strategie miste! Teorema di von Neumann (1928) per i giochi a somma zero. Teorema di Nash (1950) per i giochi non necessariamente a somma zero. Interpretazioni interessanti delle strategie miste: bluff nel poker (vedi dopo...) calcidirigore(http://www.econ.brown.edu/~iph/pdf/minimaxiph.pdf)

Sala degli Specchi - Comune di Sanremo - - - 28 febbraio 2003 7 Ecco le strategie miste in azione (in gioco a somma zero): I \ \ II L R U ( 2, +2) (+3, 3) D (+3, 3) ( 4, +4) Guadagno (ovvero: payoff ) atteso per I se I gioca (p, 1 p) eii gioca (q,1 q): 2pq +3p(1 q)+3(1 p)q 4(1 p)(1 q) = = p[ 2q +3 3q 3q +4 4q]+[3q 4+4q] = = p[7 12q]+[7q 4] 7 12q =0 q =7/12 nalogamente, si trova p = 7/12 q =7/12 1 q =5/12 I \ \ II L R p =7/12 U ( 2, +2) (+3, 3) 1 p =5/12 D (+3, 3) ( 4, +4) In equilibrio, abbiamo un guadagno atteso per I pari a: (p[7 12q]+[7q 4]) p=7/12,q=7/12 = 7 12 [7 12 7 12 ]+[7 7 49 48 4] = = 1 12 12 12

8 Fioravante Patrone - - - Strategie miste, minimax ed equilibri Un programma in BSIC, che fissa per I la strategia mista ottimale e lascia al giocatore II la scelta di cosa giocare. RNDOMIZE TIMER inizializzazione n e una variabile usata per limitare il numero massimo di giocate possibili n = 0 g e la variabile usata per indicare il guadagno del primo giocatore g = 0 si fissa la strategia mista ottimale per il giocatore I p = 7 / 12 inizio: se si vuole che il giocatore II decida lui quante volte giocare, "scommentare" le righe seguenti INPUT "se vuoi finire, digita 0 (maiuscolo)"; k IF k = 0 THEN END INPUT "metti la tua strategia: per L digita 1, per R digita 2"; s2 r = RND IF r < p THEN s1 = 1 ELSE s1 = 2 PRINT " r = "; r PRINT "s1 = "; s1 PRINT " g = "; g IF (s1 = 1 ND s2 = 1) THEN g = g + 2 PRINT " dopo primo passo, g = "; g IF (s1 = 1 ND s2 = 2) THEN g = g - 3 PRINT " dopo secondo passo, g = "; g IF (s1 = 2 ND s2 = 1) THEN g = g - 3 PRINT " dopo terzo passo, g = "; g IF (s1 = 2 ND s2 = 2) THEN g = g + 4 PRINT " dopo quarto passo, g = "; g PRINT " mio guadagno = "; g n = n + 1 se si vuole che il giocatore II decida lui quante volte giocare, "commentare" la riga seguente IF n > 120 THEN END GOTO inizio

Sala degli Specchi - Comune di Sanremo - - - 28 febbraio 2003 9 Vediamo, come detto, il bluff nel poker. Si tratta di un gioco di poker un po semplificato... L esempio l ho copiato pari pari da vecchie dispense (in inglese) di Stef Tijs. Ma lo si trova anche in un bel libro introduttivo alla TdG (in inglese) di Straffin. C è un mazzo con sole due carte: e K. è la carta alta (cioè quella che vince) e K è la carta bassa. Il mazzo viene accuratamente mescolato :-) IlgiocoiniziaconI che estrae una carta dal mazzo coperto e la guarda. Può faredue cose: passare ( P ), nel qual caso lui deve dare 1 euro a II rilanciare ( B ) Se I ha passato, il gioco è finito. Se ha rilanciato, tocca a II,ilqualepuò: passare ( P ), nel qual caso lui deve dare 1 euro a I rilanciare e vedere ( S ), nel qual caso il giocatore I deve mostrare la sua carta. se I ha la carta alta, cioè, II deve dare 2 euro a I se I ha la carta bassa, cioè K, I deve dare 2 euro a II Il gioco può essere rappresentato col seguente albero: 0 s H H H H H K 1/2 1/2 H H H I s H H P B B K s s II s ( 1, 1) S P S P s s s s (2, 2) (1, 1) ( 2, 2) (1, 1) Is P K s ( 1, 1) Il tratteggio serve a mettere in rilievo che II, quando fa la sua scelta, non sa la carta che ha in mano I.

10 Fioravante Patrone - - - Strategie miste, minimax ed equilibri Le strategie (cioè, i piani d azione concepibili a priori) a disposizione di I sono quattro: P P K, P B K, B P K, B B K. Sinoticheè stata fatta distinzione tra P quando il giocatore I ha in mano (indicata come P )e P quando il giocatore I ha in mano K (indicata come P K ). Data una strategia per I ed una strategia per II, possiamo determinare il payoff atteso dei due giocatori. d esempio, data B P K per I e S per II, - con probablità 1/2 I guadagna 2 e II guadagna 2 - con probablità 1/2 I guadagna 1 eii guadagna 1 Quindi,ilguadagnoattesoè: -peri, (1/2) 2+(1/2) ( 1) = 1/2 -perii,(1/2) ( 2) + (1/2) 1= 1/2 Numeri che andiamo a mettere nella tabella seguente, nella cella che troviamo all incrocio tralariga B P K e la colonna S. q =1/3 1 q =2/3 I \ \ II P S p 1 =0 P P K ( 1, 1) ( 1, 1) p 2 =0 P B K (0, 0) ( 3/2, 3/2) p 3 =2/3 B P K (0, 0) (1/2, 1/2) p 4 =1/3 B B K (1, 1) (0, 0) NB: la strategia B B K prevede (per via di B K ) che il giocatore I bluffi. Sinotichela strategia ottimale per I prevede con probabilità positiva(1/3) che I adotti la strategia B B K e quindi che, quando lui ha la carte bassa (cioè K) bluffi mediamente 1/3 delle volte. Si noti che èottimaleperi bluffare con questa frequenza, né più spesso nè meno spesso! Ma le strategie miste possono servire anche in caso di decisore singolo. Gioco di Isbell (o absent-minded ( drunk?) driver ). Deve uscire al secondo svincolo. Ma quando arriva allo svincolo, non ricorda se ne ha già passato uno oppure no.

Sala degli Specchi - Comune di Sanremo - - - 28 febbraio 2003 11 proseguo s 0 s proseguo s esco s 1 Può usaresolo2strategie: - arrivato a uno svincolo, esco - arrivato a uno svincolo, proseguo esco s 0 Ma in ogni caso guadagna 0. L uso di strategie miste non aiuta. Ma le strategie comportamentali sì! Ogni volta che arrivo ad uno svincolo, lancio moneta: se esce testa, esco, sennò proseguo. Guadagno atteso: 1/4.