Strong Nash Equilibria in Bimatrix Games

Похожие документы

15 febbraio Soluzione esame di geometria - 12 crediti Ingegneria gestionale - a.a COGNOME... NOME... N. MATRICOLA...

Massimi e minimi vincolati

Matematica generale CTF

Chiusura lineare. N.B. A può essere indifferentemente un insieme, finito o no, o un sistema. Es.1. Es.2

EQUAZIONI DIFFERENZIALI. 1. Trovare tutte le soluzioni delle equazioni differenziali: (a) x = x 2 log t (d) x = e t x log x (e) y = y2 5y+6

l insieme Y è detto codominio (è l insieme di tutti i valori che la funzione può assumere)

Applicazioni lineari

Teoria in sintesi 10. Attività di sportello 1, 24 - Attività di sportello 2, 24 - Verifica conclusiva, 25. Teoria in sintesi 26

1 Estensione in strategia mista di un gioco

Strumenti della Teoria dei Giochi per l Informatica A.A. 2009/10. Lecture 22: 1 Giugno Meccanismi Randomizzati

Algebra Lineare e Geometria

Equilibrio bayesiano perfetto. Giochi di segnalazione

Università degli Studi di Roma Tor Vergata. Corso di Laurea in Ingegneria Meccanica

1. Sia dato un poliedro. Dire quali delle seguenti affermazioni sono corrette.

VC-dimension: Esempio

CORSO DI LAUREA IN INGEGNERIA.

Richiami sulle derivate parziali e definizione di gradiente di una funzione, sulle derivate direzionali. Regola della catena per funzioni composte.

SUCCESSIONI NUMERICHE

Un modello matematico di investimento ottimale

Fondamenti di Automatica

Capitolo 4: Ottimizzazione non lineare non vincolata parte II. E. Amaldi DEIB, Politecnico di Milano

I appello - 26 Gennaio 2007

Massimi e minimi vincolati di funzioni in due variabili

Corso di Matematica per la Chimica

Matematica 1 - Corso di Laurea in Ingegneria Meccanica

INTRODUZIONE AL CONTROLLO OTTIMO

Funzione Una relazione fra due insiemi A e B è una funzione se a ogni elemento di A si associa uno e un solo elemento

09 - Funzioni reali di due variabili reali

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA

ELEMENTI DI ALGEBRA LINEARE E GEOMETRIA Corso di Laurea Ingegneria Edile-Architettura

2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione

min 4x 1 +x 2 +x 3 2x 1 +x 2 +2x 3 = 4 3x 1 +3x 2 +x 3 = 3 x 1 +x 2 3x 3 = 5 Innanzitutto scriviamo il problema in forma standard: x 1 x 2 +3x 3 = 5

Parte 6. Applicazioni lineari

Esempio. Approssimazione con il criterio dei minimi quadrati. Esempio. Esempio. Risultati sperimentali. Interpolazione con spline cubica.

MATEMATICA. { 2 x =12 y 3 y +8 x =0, si pone il problema di trovare, se esistono, un numero x ed un numero y che risolvano entrambe le equazioni.

Autovalori e Autovettori

La Programmazione Lineare

Teoria dei Giochi non Cooperativi

Corso di Analisi Numerica

Corso di Calcolo Numerico

Funzioni periodiche. Una funzione si dice periodica di periodo T se T > 0 è il più piccolo numero reale positivo tale che

ANALISI DEL CONDIZIONAMENTO DI UN SISTEMA LINEARE

f(x, y, z) = (x + ky + z, x y + 2z, x + y z) f(x, y, z) = (x + 2y z, x + y z, x + 2y) F (f(x)) = (f(0), f(1), f(2))

Appunti sul corso di Complementi di Matematica - prof. B.Bacchelli Equazioni differenziali lineari omogenee a coefficienti costanti.

3 GRAFICI DI FUNZIONI

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

Lezione del Teoria dei vettori ordinari

Funzioni con dominio in R 2

Lezioni di Ricerca Operativa. Corso di Laurea in Informatica Università di Salerno. Lezione n 4

Matematica e Statistica

3 CENNI DI TEORIA DELLA COMPLESSITA COMPUTAZIONALE. E. Amaldi Fondamenti di R.O. Politecnico di Milano 1

Richiami di algebra lineare e geometria di R n

2 Formulazione dello shortest path come problema di flusso

Rette e curve, piani e superfici

CONCETTO DI ANNIDAMENTO

1 Convessità olomorfa

Analisi Matematica 2 per Matematica Esempi di compiti, primo semestre 2011/2012

Teoria dei Giochi. Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 2

Ricerca Operativa 2. Introduzione al metodo del Simplesso

analisi di sistemi retroazionati (2)

Macroeconomia, Esercitazione 6. 1 Esercizi. 1.1 Taylor rule e Domanda Aggregata Dinamica/ Taylor rule e Domanda Aggregata Dinamica/2

IGiochidiArchimede-SoluzioniBiennio 22 novembre 2006

I tre concetti si possono descrivere in modo unitario dicendo che f e iniettiva, suriettiva, biiettiva se e solo se per ogni b B l equazione

Lezione 9: Cambio di base

Limiti e continuità delle funzioni reali a variabile reale

Prova di recupero del debito formativo di matematica 02/11/09 A

1 Massimi e minimi liberi 1. 2 Massimi e minimi vincolati 7. 3 Soluzioni degli esercizi 12

Dimensione di uno Spazio vettoriale

Ottimizzazione nella gestione dei progetti Capitolo 4: la gestione dei costi (Programmazione multimodale): formulazioni

Le equazioni. Diapositive riassemblate e rielaborate da prof. Antonio Manca da materiali offerti dalla rete.

EQUAZIONI DIFFERENZIALI Esercizi svolti. y = xy. y(2) = 1.

FUNZIONE REALE DI UNA VARIABILE

1 Serie di Taylor di una funzione

Macroeconomia, Esercitazione 2.

Esempi di funzione. Scheda Tre

Soluzione di equazioni quadratiche

LEZIONE 23. Esempio Si consideri la matrice (si veda l Esempio ) A =

CORSO DI LAUREA INF TWM ANNO DI IMMATRICOLAZIONE MATRICOLA

Parte 3. Rango e teorema di Rouché-Capelli

Definizione DEFINIZIONE

Esercizi su lineare indipendenza e generatori

Condizionamento del problema

Informatica 3. Informatica 3. LEZIONE 10: Introduzione agli algoritmi e alle strutture dati. Lezione 10 - Modulo 1. Importanza delle strutture dati

Approssimazione polinomiale di funzioni e dati

Economia Applicata ai sistemi produttivi Lezione II Maria Luisa Venuta 1

Metodi Computazionali

x 2 + y2 4 = 1 x = cos(t), y = 2 sin(t), t [0, 2π] Al crescere di t l ellisse viene percorsa in senso antiorario.

Soluzioni del giornalino n. 16

1 Giochi a due, con informazione perfetta e somma zero

Scelte in condizione di incertezza

4. Operazioni elementari per righe e colonne

Prerequisiti didattici

Diagonalizzazione di matrici e applicazioni lineari

Tecniche di analisi multivariata

Corso di Politica Economica

Richiami su norma di un vettore e distanza, intorni sferici in R n, insiemi aperti, chiusi, limitati e illimitati.

Транскрипт:

Strong Nash Equilibria in Bimatrix Games Eleonora Braggion Relatori: Prof. Roberto Lucchetti Prof. Nicola Gatti CORSO DI LAUREA MAGISTRALE IN INGEGNERIA MATEMATICA Politecnico di Milano Milano, 29 Aprile 2014

Gioco in forma strategica Tripla (N, A, U): N = {1,..., n} è l insieme dei giocatori, A = {A 1,..., A n } è l insieme delle azioni dei giocatori, A i = m i U = {U 1,..., U n } è l insieme delle multi-matrici di utilità dei giocatori. Profilo di strategie: x = {x 1,..., x n }. x i = (x i1,..., x imi ) Utilità del giocatore i esimo: v i (x) = i 1,...,i n U i (i 1,..., i n ) x 1i1 x nin = x i U i j i x j

Equilibrio di Nash Definizione Il profilo di strategie x si dice equilibrio di Nash se, per ogni i N, v i (x) v i (x i, x i ) x i. Principio d Indifferenza (PI): all equilibrio ogni azione giocata con probabilità positiva da un giocatore deve garantire la stessa utilità (non inferiore all utilità garantita dalle altre azioni). Ũ i j i U i j i x j = v i 1 i N x j v i 1 i N

Pareto efficienza Sia data f : K R k R m Definizione x K si dice Pareto efficiente se non esiste x K: f j (x) f j (x) j = 1,..., m f j (x) > f j (x) per almeno un j {1,..., k} Condizioni (vettoriali) di Karush-Kuhn-Tucker (KKT) λ 1 U 1 x 2 λ 2 U 2 x 2 + µ 1 1 = 0 λ 1 U1 x 1 λ 2 U2 x 1 + µ 2 1 = 0 λ 0 λ 0

Strong Nash Equilibrium Definizione Strong Nash Equilibrium: un profilo di strategie x stabile rispetto ad ogni possibile deviazione di qualsiasi sottocoalizione di giocatori. È contemporaneamente un NE e Pareto efficiente per ogni sottocoalizione di giocatori. Tutti i giochi possiedono almeno un NE (teorema di esistenza di Nash) e outcome Pareto efficienti. Non tutti i giochi possiedono SNE.

Obiettivo della tesi Sia G lo spazio dei giochi in forma strategica con numero di giocatori e numero di azioni per ogni giocatore fissati. Obiettivo della tesi: studiare quanti problemi in G possiedono uno SNE. Useremo IP e KKT (per ogni sottocoalizione) come condizioni che individuano potenziali SNE.

Giochi a 2 giocatori

Genericità degli SNE Problema: Nello spazio dei giochi l insieme di quelli che possiedono almeno uno SNE è piccolo? prisoner 1 confess not confess prisoner 2 confess not confess (6,6) (7,0) (0,7) (1,1) E[p 2 ] (0,7) (1,1) (6,6) (7,0) E[p 1 ]

Strategie miste Nell esempio precedente lo SNE è in strategie pure. Che succede nel caso di strategie miste? Primo risultato: L insieme dei giochi che ammettono SNE in miste ha misura nulla.

SNE fully mixed: misura nulla KKT: λ 1 U 1 x 2 λ 2 U 2 x 2 + µ 1 1 = 0 λ 1 U 1 x 1 λ 2 U 2 x 1 + µ 2 1 = 0 IP: U 1 x 2 = v 1 1 U 2 x 1 = v 2 1 Almeno uno tra λ 1 e λ 2 è 0. Supponiamo λ 1 0 e otteniamo: U 2 x 2 = v 2 1 (1) IP + condizione aggiuntiva Sistema lineare sovravincolato MISURA NULLA Il ragionamento vale, riadattato, anche per SNE non fully mixed.

Allineamento con coefficiente non positivo Nel caso λ 1 0 otteniamo le seguenti condizioni: Da queste ricaviamo: U 1 x 2 = v 1 1 (2) U 2 x 1 = v 2 1 (3) U 2 x 2 = v 2 1 (4) allineamento degli outcomes su una stessa riga, allineamento degli outcomes su una stessa colonna, allineamento di tutti gli outcomes su una retta di coefficiente non positivo.

Interpretazione Esistenza di SNE a supporto pieno Tutti gli outcomes sono allineati Gioco strettamente competitivo in cui ogni outcome è Pareto efficiente

Allineamento: condizione necessaria ma non sufficiente player 2 a 21 a 22 a 23 a 24 E[U 2 ] player 1 a 11 a 12 a 13 (2,0) (0,2) (-5,-5) (-5,-5) (0,2) (2,0) (-5,-5) (-5,-5) (-5,-5) (-5,-5) (5,0) (0,0) (1,1) (1.25,1.25) a 14 (-5,-5) (-5,-5) (0,0) (0,5) E[U1 ] Figura : Matrice di utilità e valori x e y sul piano delle utilità attese Il NE x = ([0.5, 0.5, 0, 0], [0.5, 0.5, 0, 0]) soddisfa le KKT e la condizione di allineamento ma è dominato dal vettore y = ([0, 0, 0.5, 0.5], [0, 0, 0.5, 0.5]). => NON È UNO SNE

Allineamento: condizione necessaria ma non sufficiente player 2 a 21 a 22 a 23 a 24 E[U 2 ] player 1 a 11 a 12 a 13 (2,0) (0,2) (-5,-5) (-5,-5) (0,2) (2,0) (-5,-5) (-5,-5) (-5,-5) (-5,-5) (5,0) (0,0) (1,1) (1.25,1.25) a 14 (-5,-5) (-5,-5) (0,0) (0,5) E[U1 ] Figura : Matrice di utilità e valori x e y sul piano delle utilità attese Il NE x = ([0.5, 0.5, 0, 0], [0.5, 0.5, 0, 0]) soddisfa le KKT e la condizione di allineamento ma è dominato dal vettore y = ([0, 0, 0.5, 0.5], [0, 0, 0.5, 0.5]). => NON È UNO SNE

Cosa succede per n 3?

Appartenenza ad iperpiano non necessaria player 1 a 11 a 12 player 2 a 21 a 22 2,0,0 0,2,0 0,0,2 0,0,0 a 11 a 12 a 21 a 22 0,0,0 0,0,2 0,2,0 2,0,0 a 31 player 3 a 32 Figura : Matrici di utilità di un gioco 2 2 2 E[U 2 ] x = ([0.5, 0.5], [0.5, 0.5], [0.5, 0.5]) è uno SNE ma gli outcomes non giacciono sullo stesso piano E[U 3 ] (0.5,0.5,0.5) E[U 1 ]

Appartenenza ad iperpiano non necessaria Cerchiamo un profilo di strategie che domini quello dato: 2x 11 x 21 x 31 + 2x 12 x 22 x 32 > 0.5 2x 11 x 22 x 31 + 2x 12 x 21 x 32 > 0.5 2x 11 x 22 x 32 + 2x 12 x 21 x 31 > 0.5 Sostituendo ad ogni x i2 il valore 1 x i1, otteniamo il seguente sistema: 2 2x 21 2x 31 2x 11 + 2x 21 x 31 + 2x 11 x 21 + 2x 11 x 31 > 0.5 2x 21 + 2x 11 x 31 2x 11 x 21 2x 21 x 31 > 0.5 2x 11 2x 11 x 21 2x 11 x 31 + 2x 21 x 31 > 0.5 che è inammissibile!

SNE in miste ha misura nulla? Applicando IP e KKT otteniamo un maxisistema di equazioni che non è lineare. Supponendo m 3 m 1 e m 3 m 2 consideriamo il sottosistema: U 1 x 1 x 2 = v 1 1 U 2 x 1 x 2 = v 2 1 U 3 x 1 x 2 = v 3 1 Dimostriamo che l insieme di matrici U 1, U 2, U 3 tali per cui il sistema può essere soddisfatto da due vettori x 1, x 2 ha misura nulla.

Insiemi algebrici e semialgebrici Definizione A R k si dice algebrico se si può descrivere tramite un numero finito di equazioni polinomiali. Definizione A R k si dice semialgebrico se si può descrivere tramite un numero finito di equazioni e disequazioni polinomiali.

Mappe algebriche e semialgebriche Sia F : K R n R m una mappa a valori insiemi. Definizione F si dice algebrica (semialgebrica) se il suo grafico è algebrico (semialgebrico). Due risultati fondamentali: 1 La proiezione di un insieme algebrico è semialgebrica. 2 Se F è semialgebrica e dim F (x) l x allora dim F (K) l + n.

Consideriamo il sottosistema: U 1 x 1 x 2 = v 1 1 U 2 x 1 x 2 = v 2 1 U 3 x 1 x 2 = v 3 1 A = [U 1, U 2, U 3 ], b = [v 1 1, v 2 1, v 3 1]. Consideriamo F : m1 m2 (M m1 m2 ) 3m3, definita da F (x 1, x 2 ) = {(A 1, A 2,..., A 3m3 ) : x 1 A i x 2 = b i i F è semialgebrica e la dimensione di F (x 1, x 2 ) è 3m 3 (m 1 m 2 1). Confrontando le dimensioni di F ( m1 m2 ) e dello spazio di arrivo: 3m 3 (m 1 m 2 1) + (m 1 + m 2 2) < 3m 1 m 2 m 3 MISURA NULLA!

Risultati 2 giocatori 1.1 (Esistenza) SNE in strategie pure esiste per misura non nulla, 1.2 (Esistenza) SNE in strategie miste esiste per misura nulla, 1.3 (Caratterizzazione) Allineamento outcomes su retta a coefficiente non positivo: gioco strettamente competitivo. n giocatori 2.1 (Esistenza) SNE in strategie miste esiste per misura nulla, 2.2 Non vale l estensione naturale del risultato ottenuto in 1.3.

Implicazioni Nella pratica i giochi ammettono equilibri SNE solo in strategie pure Quindi è possibile trovare SNEs in tempo polinomiale rispetto alla dimensione del gioco, ma esponenziale rispetto al numero di giocatori Trovare un SNE è quindi computazionalmente più facile rispetto a trovare un NE

Sviluppi futuri Caratterizzare i giochi che ammettono SNE puri, Creare un algoritmo di ricerca per gli SNE misti che ricerca se esiste un allineamento, Caratterizzare geometricamente l esistenza di uno SNE in miste in un gioco con più di 2 giocatori.

Bibliografia R. J Aumann et al. Acceptable points in games of perfect information. Pacific Journal of Mathematics, 1960. C. Daskalakis, P.W. Goldberg, C.H. Papadimitriu. The complexity of computing a nash equilibrium. SIAM Journal on Computing, 2006. N. Gatti, T. Sandholm. Finding the Pareto curve in bimatrix games is easy. In International joint conference on autonomous agents and multi-agent system (AAMAS), 2014. M. Hoefer, A. Skopalik. On the complexity of Pareto-optimal Nash and Strong equilibria. In Algorithmic Game Theory, 2010. M. Maschler, E. Solan, S. Zamir. Game Theory. Cambridge University Press, 2013. K. Miettinen. Nonlinear multiobjective optimization. Springer, 1999. R. Nessah, G. Tian. On the existence of Strong Nash equilibria. Journal of Mathematical Analysis and Applications, 2014. N. Nisan. Algorithmic game theory. Cambridge University Press, 2007.

Grazie per l attenzione!