Introduzione alla Teoria dei Giochi



Documenti analoghi
Teoria dei Giochi. Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 2

Imprese e reti d impresa

Concetti di soluzione in giochi dinamici a informazione perfetta in strategie pure (LEZIONE 4)

Teoria dei Giochi. Anna Torre

Giochi ripetuti. Gianmaria Martini

Teoria dei Giochi. Teoria dei Giochi

Un modello matematico di investimento ottimale

Equilibrio bayesiano perfetto. Giochi di segnalazione

Teoria dei Giochi. In generale è possibile distinguere i giochi in due classi principali:

Teoria dei giochi Gioco Interdipendenza strategica

Corso di Politica Economica

1 Giochi a due, con informazione perfetta e somma zero

Teoria dei giochi. Teoria che analizza in modo formale l interazione strategica di soggetti razionali che agiscono in modo strategico

Giochi e decisioni strategiche

GIUSTIFICARE LE RISPOSTE. Non scrivere la soluzione di esercizi diversi su uno stesso foglio.

Teoria dei Giochi. Anna Torre

La teoria dei giochi non cooperativi

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che:

Teoria dei Giochi non Cooperativi

Lezione IV: Giochi e Strategie

Teoria dei Giochi. Anna Torre

Teoria dei giochi. 1. Introduzione ed esempi. Slides di Teoria dei Giochi, Vincenzo Cutello 1

Economia Politica Microeconomia (ECN0006) 10 CFU a.a Eleonora Pierucci

CONCETTO DI ANNIDAMENTO

Esercizi di teoria dei giochi. Luca Correani

da 2 a 5 giocatori, dai 10 anni in su, durata 30 minuti

Guida all uso di Java Diagrammi ER

Capitolo 3. L applicazione Java Diagrammi ER. 3.1 La finestra iniziale, il menu e la barra pulsanti

Osservatorio SosTariffe.it Telefonia Mobile

Che cos è la politica?

LE FUNZIONI A DUE VARIABILI

Incentivi alla cooperazione Introduzione

REGOLE PER L ESAME (agg.te settembre 2015)

In Action with Math. Competizione e Strategia: Teoria dei Giochi. Giulia Bernardi, Roberto Lucchetti. 5 novembre 2014

2 RAFFINAMENTI DELL EQUILIBRIO DI NASH

Università degli Studi di Padova Corso di Laurea in Informatica

Seconda Università di Napoli AA. 2012/2013 Facoltà di Economia. ECONOMIA INDUSTRIALE Prof. Roberto Basile

Trasmissione di dati al di fuori di un area locale avviene tramite la commutazione

Teoria dei Giochi - Esternalità

Computational Game Theory

Teoria dei Giochi. Anna Torre

Workflow grafico. Daniele Fortarel La stampa digitale Materiale tratto da: brochure tecniche (Xerox Docucolor 7002/8002) TAGA doc 12 - Stampa digitale

Analisi dei Dati 12/13 Esercizi proposti 3 soluzioni

Slide Cerbara parte1 5. Le distribuzioni teoriche

H1 Hrms Gestione eventi/scadenze automatiche

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

La pubblicità. La pubblicità. La pubblicità. La pubblicità

PROBABILITA CONDIZIONALE

Energia potenziale elettrica e potenziale. In queste pagine R indicherà una regione in cui è presente un campo elettrostatico.

Parliamo un po di più di bridge. La filosofia del gioco. Nico Andriola

Industrial organization e teoria dei giochi (II modulo) [Contratti, incentivi, impresa]

Università degli Studi di Perugia A.A. 2014/2015 Dipartimento di Economia. ECONOMIA INDUSTRIALE Prof. Davide Castellani

Esercizi su. Funzioni

Problema del trasporto

Percorsi, strategie e geometrie in gioco Complementi e spunti di lavoro Primaria e Secondaria Inferiore

Componenti. Concetto di gioco. di Michael Schacht Un gioco di carte imperiale per agguerrite dinastie giapponesi! 110 carte Personaggio

CRITERI DI CONVERGENZA PER LE SERIE. lim a n = 0. (1) s n+1 = s n + a n+1. (2) CRITERI PER LE SERIE A TERMINI NON NEGATIVI

4 3 4 = 4 x x x 10 0 aaa

Gli input sono detti anche fattori di produzione: terra, capitale, lavoro, materie prime.

UNIT 5 Attacco. Introduzione

Regolamento nazionale

Esercitazione 23 maggio 2016

Introduzione. Coordinazione Distribuita. Ordinamento degli eventi. Realizzazione di. Mutua Esclusione Distribuita (DME)

ESERCITAZIONE novembre 2012

TELECOMUNICAZIONI II: LE RETI DI COMUNICAZIONE. INTRODUZIONE... pag.2

1. LE REGOLE EDUCAZIONE ALLA LEGALITA OBIETTIVI

Come modificare la propria Home Page e gli elementi correlati

Introduzione. Preparazione. 4) Ordina i titoli azionari di ogni Compagnia in una pila separata vicino alla plancia di gioco.

1. Limite finito di una funzione in un punto

REGOLAMENTO TENNIS STAR

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

2.1.1 Giochi di coordiamento Giochi competitivi Giochi di coesistenza 4

Consideriamo due polinomi

MANUALE PER IL CARICAMENTO DEI DATI DELLE FATTURE SANITARIE redatto dall ORDINE DEI MEDICI DI FIRENZE aggiornato al 11/01/2016

I casi d uso corrispondono ai compiti che l attore (che può essere una persona fisica e non) può svolgere.

mese richiesta

Scelte in condizione di incertezza

LA MOLTIPLICAZIONE IN CLASSE SECONDA

Traduzione e adattamento a cura di Gylas per Giochi Rari

SISTEMI OPERATIVI. Prof. Enrico Terrone A. S: 2008/09

REGOLAMENTO FAENTINO L INIZIO. Il tavolo sarà composto da 4 giocatori dove ognuno gioca per sé stesso.

IL CODICE UNICO DI PROGETTO (CUP) FAQ PER L AREA RICERCA

I CIRCUITI ELETTRICI. Prima di tutto occorre mettersi d accordo anche sui nomi di alcune parti dei circuiti stessi.

Ricorsione. (da lucidi di Marco Benedetti)

Verifica della correttezza formale del numero di partita IVA

TEORIA DEI GIOCHI Marco Alderighi

LANCIAMO UN DADO PER DECIDERE CHI DEVE INIZIARE IL GIOCO. PARTIRA IL NUMERO PIU ALTO

FONDAMENTI DI INTELLIGENZA ARTIFICIALE (8 CFU)

Identificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete Neuronale

Information summary: La Gestione dei Reclami

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

CMS MUSEO&WEB. Mappe grafiche. Andrea Tempera (OTEBAC) 12 aprile 2010

Economia Applicata ai sistemi produttivi Lezione II Maria Luisa Venuta 1

L uso della Balanced Scorecard nel processo di Business Planning

Algoritmi e strutture dati. Codici di Huffman

NETWORKING & BUSINESS: LA CREAZIONE DI UN ALLEANZA DI VALORE IL VALORE DEL NETWORKING PER IL CLIENTE: COME CREARLO E COME COMUNICARLO

LA TERAPIA DELLA RICONCILIAZIONE

Le scelte del consumatore in condizione di incertezza (cap.5)

Capitolo 3: Cenni di strategia

Teoria dei Giochi. Anna Torre

Transcript:

Introduzione alla Teoria dei Giochi Giochi dinamici a informazione completa Lorenzo Rocco Scuola Galileiana - Università di Padova 01 aprile 2010 Rocco (Padova) Giochi 01 aprile 2010 1 / 24

Giochi in forma estesa Una rappresentazione alternativa alla forma normale è la forma estesa. Nella forma estesa viene esplicitato: chi sono i giocatori quando è il turno di gioco di ogni giocatore cosa sa ciascun giocatore quando tocca a lui muovere cosa può fare quando deve muovere i payo s Rocco (Padova) Giochi 01 aprile 2010 2 / 24

Alberi decisionali radice : nodo iniziale, indica chi è il primo giocatore a muovere nodi : in generale idicano chi deve giocare rami : indicano le azioni disponibili in prossimità di ogni nodo nodi terminali : indicano gli esiti del gioco foglie : indicano i payo associati ad ogni esito del gioco Rocco (Padova) Giochi 01 aprile 2010 3 / 24

Esempi di forma estesa forma estesa del gioco di entrata forma estesa dell ultima mano a briscola forma estesa del dilemma del prigioniero Rocco (Padova) Giochi 01 aprile 2010 4 / 24

Set informativi Gli information set sono insiemi di nodi (in cui un giocatore può essere chiamato a muovere in un dato turno). Rappresentano l informazione che ogni giocatore possiede riguardo lo svolgimento precedente del gioco al momento in cui deve muovere. Tutti i nodi di un information set sono indistinguibili dal punto di vista di un giocatore L insieme di azioni disponibili in ogni nodo di un information set è lo stesso. Rocco (Padova) Giochi 01 aprile 2010 5 / 24

Strategie Una strategia s è una funzione che associa ad ogni insieme informativo una mossa disponibile in ciascun nodo di quel sistema informativo s i : H i! A i Una strategia è un piano d azione che indica al giocatore cosa fare in ogni possibile circostanza (contingenza) lui si trovi a giocare Una strategia è un manuale. L insieme delle strategie è una biblioteca. Esempio: de nire l insieme delle strategie nel dilemma del prigioniero sequenziale Esempio: de nire l insieme delle strategie nel dilemma del prigioniero simultaneo Rocco (Padova) Giochi 01 aprile 2010 6 / 24

Strategie, esiti e payo Ogni pro lo di strategie determina il sentiero che sarà seguito dal gioco lungo l albero decisionale no a un nodo terminale (esito). Poiché ad ogni esito del gioco è associato un payo, ad ogni pro lo di strategie è associato un payo Nota: la funzione di payo è de nita sopra spazi di funzioni! Rocco (Padova) Giochi 01 aprile 2010 7 / 24

Forma estesa e forma normale Ogni gioco in forma estesa può essere trasformato in forma normale: si determinano le strategie di ogni giocatore si associano i payo s alle strategie Ma data una forma normale, senza ulteriori informazioni, non si può risalire alla forma estesa (a ogni forma normale sono associabili in nite forme estese). Nota: nella forma normale è come se i giocatori scegliessero simultaneamente che "manuale" usare, oppure se lo "o rissero in busta chiusa" Rocco (Padova) Giochi 01 aprile 2010 8 / 24

Equilibri di Nash non "credibili" Sulla forma normale si può applicare il concetto di equilibrio di Nash. Quindi l equilibrio di Nash si può applicare anche a giochi molto complessi, dinamici, con strutture informative molto elaborate. In alcuni casi gli equilibri di Nash contengono minacce "non credibili", ovvero troppo costose da attuare. Esempio: entry game Rocco (Padova) Giochi 01 aprile 2010 9 / 24

Esercizio. Exercise: There are 2 rms i = 1, 2. Let q i denote the quantity produced by rm i = 1, 2 at cost 4q i.each rm cannot produce more than 3. The total demand is P(Q) = 6 Q where Q = q 1 + q 2. Firm 1 moves rst choosing the quantity it wants to produce; rm 2 moves having observed the quantity produced by rm 1. Let describe the set of pure strategy of each player. Find a NE in which rm 2 produced the monopoly outcome and rm 1 produces zero. Find the SPNE of the game. Rocco (Padova) Giochi 01 aprile 2010 10 / 24

Sequential rationality Per elimiare gli equilibri di Nash basati su minacce non credibili aggiungiamo il criterio della sequential rationality: De nition tutti i giocatori adottano la loro migliore strategia ad ogni set informativo Rocco (Padova) Giochi 01 aprile 2010 11 / 24

Backward induction Se i giocatori sono sequentially rational, allora la strategia ottima può essere determinata a ritroso, partendo dalla ne del gioco: backward induction. Questa procedura consente "di per sè" di selezionare equilibri di Nash credibili in due classi di giochi (anche se ha applicazione più generale): 1) giochi con informazione perfetta 2) multi-stage games Rocco (Padova) Giochi 01 aprile 2010 12 / 24

Classe 1: giochi con informazione perfetta Se tutti gli information set del gioco sono singleton, allora un gioco è con informazione perfetta. Tutti i giocatori hanno osservato e sanno precisamente la storia precedente del gioco. Theorem Esempio: gioco di Stakelberg (produci tanto, produci poco) (Zermelo s Theorem) Ogni gioco nito con informazione perfetta ha almeno un equilibrio di Nash in strategie pure che può essere ottenuto tramite backward induction (quindi un equilibrio di Nash che soddisfa la sequential rationality) Rocco (Padova) Giochi 01 aprile 2010 13 / 24

Classe 2: multi-stage games De nitions I multi-stage games sono formati da molteplici stadi di gioco, eventualmente in niti, dove: 1 tutte le azioni giocate precedentemente sono state osservate da tutti i giocatori 2 tutti i giocatori giocano simultaneamente in ogni stadio (e quindi non osservano cosa gli altri giocatori stanno giocando in quello stadio) Esempio: dilemma del prigioniero ripetuto due volte Esempio: dilemma del prigioniero nel primo stadio, Bach vs Stravinsky nel secondo stadio Rocco (Padova) Giochi 01 aprile 2010 14 / 24

Equilibrio di Nash perfetto nei sottogiochi Un equilibrio di Nash che soddisfa la sequential rationality è un Equilibrio di Nash perfetto nei sottogiochi: De nition Un equilibrio di Nash (s 1,...s I ) è perfetto nei sottogiochi se e solo se le strategie di continuazione formano equilibri di Nash in OGNI sottogioco. Nota: l esito di backward induction nei giochi con informazione perfetta è un SPNE. Rocco (Padova) Giochi 01 aprile 2010 15 / 24

Sottogiochi e strategie di continuazione De nition Un sottogioco è una porzione dell albero decisionale, che inizia da un nodo appartenente a un insieme informativo singleton, contiene tutti i nodi successivi, e contiene tutti gli insiemi informativi successivi. De nition La porzione di strategia che fa riferimento agli information set appartenenti a un sottogioco si chiama strategia di continuazione Nota: i multi-stage games hanno sempre sottogiochi e quindi il SPNE è "e cace". Rocco (Padova) Giochi 01 aprile 2010 16 / 24

Note su SPNE Il SPNE è un NE perché l intero gioco è un sottogioco SPNE richiede che i giocatori giochino strategie di continuazione che formano equilibri di Nash in ogni sottogioco, anche in quei sottogiochi che possono essere raggiunti solo in seguito a un errore commesso da un giocatore. Rocco (Padova) Giochi 01 aprile 2010 17 / 24

SPNE in un multi-stage game Theorem Giocare un NE dello stage game in ogni stage è un SPNE. Quindi un SPNE esiste sempre in un multi-stage game. Esempio: Bach vs Stravinsky giocato due volte. Quali sono le strategie formalmente? R. (B,SSSS), (B,SSSS) Rocco (Padova) Giochi 01 aprile 2010 18 / 24

Strategie dipendenti dalla storia del gioco Come in tutti i giochi dinamici, nei multi-stage games, le strategie adottare in ogni stage possono dipendere dalla storia passata del gioco Esempio: considerate il seguente stage-game ripetuto due volte, dove il payo totale è dato dalla somma dei payo di ogni stadio (cioè fattore di sconto δ = 1) L M R U 0,0 1,1 6,0 M 4,3 0,0 0,0 D 0,6 0,0 5,5 Ci sono due equilibri di Nash in strategie pure: (M,L), (U,M) with payo s (4,3), (1,1) Nel gioco a due stadi il seguente pro lo di strategie è SPNE: "Gioca (D,R) nel primo stadio. Se l esito del primo stadio è (D,R), allora gioca (M,L) nel secondo stadio. altrimenti gioca (U,M)" Rocco (Padova) Giochi 01 aprile 2010 19 / 24

(cont.) In ogni sottogioco del secondo stadio, la strategia prescrive di giocare un NE Nel sottogioco che inizia nel primo stadio, cioè nell intero gioco, la matrice dei payo diventa L M R U +1,+1 1+1,1+1 6+1, + 1 M 4+1,3+1 +1, + 1 +1, + 1 D 1,6+1 +1,+1 5+4,5+3 Ora (D,R) è un equilibrio di Nash del sottogioco Nota: (D,R) non è un equilibrio dello stage stage-game Nota: in un multi-stage nito, le strategie che formano un SPNE devono prescrivere di giocare un NE dello stage-game nell ultimo stadio Rocco (Padova) Giochi 01 aprile 2010 20 / 24

Dilemma del prigioniero ripetuto un numero nito di volte Strategie dipendenti dalla storia possono esistere solo quando lo stage game ha molti equilibri. Se ogni stage-game ha un solo equilibrio le strategie SPNE devono prescrivere di giocare l equilibrio di stage game ad ogni stage. Es. dilemma del prigioniero ripetuto 10 volte con fattore di sconto δ. Nell ultimo stage si deve giocare (c., c.). Nel penultimo stage ogni payo è aumentato di (-3,-3) > quindi la strategia è ancora (c., c.) Rocco (Padova) Giochi 01 aprile 2010 21 / 24

Dilemma del prigioniero ripetuto in nitamente fattore di sconto δ. altri esiti del gioco possono essere supportati come SPNE in aggiunta a (c. c.) che rimane SPNE n.c. c. n.c. -1,-1-4,0 c. 0,-4-3,-3 Esempio: trigger strategy: "gioca n.c. nel primo stadio. Continua in questo modo nché un giocatore devia. Dopo ogni deviazione, gioca c. per il resto del gioco" Nota: la trigger strategy induce un equilibrio di Nash induces in tutti i sottogiochi, anche quelli che iniziano dopo una deviazione, dove (c., c.) è un NE dello stage game. Rocco (Padova) Giochi 01 aprile 2010 22 / 24

(cont.) Nota: La pazienza (cioè alto fattore di sconto) è la chiave per supportare la cooperazione: in giochi in nitamente ripetuti anche piccole punizioni future possono disincentivare la deviazione In giochi ini nitamente ripetuti l insieme dei SPNE può essere molto diverso e tipicamente molto più ampio che nei giochi ripetuti un numero nito di volte Rocco (Padova) Giochi 01 aprile 2010 23 / 24

Folk theorem Theorem (Friedman, 1971) Dato il gioco ripetuto in nitamente Γ(δ), sia α uno equilibrio dello stage-game equilibrium con payo s e. Allora per ogni payo v raggiungibile nel nel gioco con v i > e i per ciascun giocatore i, esiste un δ tale che per tutti δ > δ esite un SPNE di Γ(δ) con payo v. Nota: la prova si basa sull uso di trigger strategies dove la punizione consiste nel giocare α dopo ogni deviazione. Se i giocatori sono abbastanza pazienti, tale punizione è e cace. Ovviamente in ogni sottogioco la trigger stragety induce un equilibrio di Nash Nota: ma quanti SPNE esitono? Nota: strategia tit-for-tat: inizia giocando n.c.; poi nel periodo n gioca quello che ha giocato l avversario nel periodo n-1. Supponete che un giocatore giochi c. nel periodo n (deviazione). Allora in n+1 l avversario gioca c, ma contemporaneamente il primo deviante giocherà n.c., la strategia del periodo n dell altro, "so rendo molto" Rocco (Padova) Giochi 01 aprile 2010 24 / 24