Giochi su grafi. Marco Faella. Università di Napoli Federico II

Documenti analoghi
Giochi su grafi Marco Faella

INTRODUZIONE ALLA TEORIA DEI GIOCHI

1 Definizione formale di gioco in forma estesa.

Teoria dei Giochi. Anna Torre

Automi a stati finiti

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Massimiliano Ferrara

In Action with Math. Competizione e Strategia: Teoria dei Giochi. Giulia Bernardi, Roberto Lucchetti. 15 ottobre / 20

2 OTTIMIZZAZIONE SU GRAFI. E. Amaldi Fondamenti di R.O. Politecnico di Milano 1

Algoritmi e Complessità

Informatica e Laboratorio di Programmazione Automi Alberto Ferrari. Alberto Ferrari Informatica e Laboratorio di Programmazione

29 maggio Distinzione importante: giochi simultanei giochi sequenziali: uno dei giocatori ha la prima mossa; l altro deve rispondere.

Teoria dei Giochi. Anna Torre

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

INTRODUZIONE ALLA TEORIA DEI GIOCHI NELLE SCIENZE ECONOMICHE E SOCIALI

DATI DELLO STUDENTE: NomeeCognome:... NumerodiMatricola:... PROCESSI STOCASTICI 09/09/2015, ESAME SCRITTO

In Action with Math. Competizione e Strategia: Teoria dei Giochi. Giulia Bernardi, Roberto Lucchetti. 3 dicembre Giochi in forma strategica

Partizioni intere. =! i# P. Es: Dato {38, 17, 52, 61, 21, 88, 25} possiamo rispondere positivamente al quesito poiché

Teoria dei Giochi. Anna Torre

In Action With Math. Competizione e Strategia - Teoria dei Giochi. Roberto Lucchetti - Giulia Bernardi. Politecnico di Milano

Sommario Codifica dei dati Macchina Astratta Definizioni Esempi

In Action With Math. Competizione e Strategia - Teoria dei Giochi. Roberto Lucchetti - Giulia Bernardi. Politecnico di Milano

Giochi e dilemmi Parte I Giochi ad informazione completa

Teoria della complessità

Modulo 10. Teoria dei giochi

Teoria dei Giochi M.S. Bernabei

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Algoritmi di ricerca locale

In Action With Math. Competizione e Strategia - Teoria dei Giochi. Roberto Lucchetti - Giulia Bernardi. Politecnico di Milano

1 Giochi di Ehrenfeucht-Fraissé e Logica del Prim ordine

Teoria della Complessità Computazionale Parte I: Introduzione

Formali. Corso di Automi e Linguaggi. Gennaio- Marzo Docente: Francesca Rossi,

La Teoria dei Giochi. (Game Theory)

Una prima distinzione nell ambito della teoria dei giochi è quella tra: Giochi cooperativi (si possono fare accordi vincolanti)

2 OTTIMIZZAZIONE SU GRAFI. E. Amaldi Fondamenti di R.O. Politecnico di Milano 1

Intelligenza Artificiale. Lezione 6bis. Sommario. Problemi di soddisfacimento di vincoli: CSP. Vincoli CSP RN 3.8, 4.3, 4.5.

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Problemi e algoritmi. Il che cosa e il come. F. Damiani - Alg. & Lab. 04/05 (da U. de' Liguoro - Alg. & Spe. 03/04)

SISTEMI CASUALI DINAMICI (PROCESSI) ESEMPIO: I GUASTI (Ipotesi Markoviana) Frequenza dei guasti: N Guasti = N/T X X X X X X X

Elementi di Teoria dei giochi

La nozione di algoritmo

Problemi e algoritmi. Il che cosa ed il come. Il che cosa ed il come. Il che cosa e il come

Automi e Linguaggi Formali

Soddisfacibilità e Semantic Tableau [1]

GRAFI. Cosa sono Grafi non orientati Grafi orientati Grafi pesati Alberi Automi!

Appunti del corso di Informatica 1 (IN110 Fondamenti) 7 Grafi e alberi: introduzione

g( x, ȳ) g( x, y) per ogni y X (2) Ma allora: g(ȳ, x) = f( x, ȳ) f(x, ȳ) = g(ȳ, x) per ogni x X (3) Ma: g(ȳ, x) g(ȳ, y) per ogni y X (5)

Teoria della Complessità Computazionale

Corso di Politica Economica

MATRICE TUNING competenze versus unità didattiche, Corso di Laurea in Informatica (classe L-31), Università degli Studi di Cagliari

PSPACE completezza. Un linguaggio A è PSPACE completo se. 1. A è in PSPACE, cioè esiste una TM T che accetta A con complessità di spazio polinomiale.

Piero Calamandrei: discorso ai giovani tenuto alla Società Umanitaria, Milano, 26 gennaio 1955.

TEORIA DEI GIOCHI SU RETI

Sintesi Sequenziale Sincrona Sintesi Comportamentale di reti Sequenziali Sincrone

3 CENNI DI TEORIA DELLA COMPLESSITA COMPUTAZIONALE. E. Amaldi Fondamenti di R.O. Politecnico di Milano 1

Le parole dell informatica: algoritmo e decidibilità

Problemi intrattabili

Appunti del corso di Informatica 1 (IN110 Fondamenti) 3 Modelli di calcolo

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Teoria dei Giochi. Anna Torre

Soddisfacibilità e Semantic Tableau [1]

Esempi di alcuni giochi

Teoria dei giochi e giochi evolutivi. Chiara Mocenni

Teoria della computazione

Cos è la teoria dei giochi e come può esservi utile

Teoria dei Giochi. Anna Torre

PN in sintesi. PN ASM: Corrispondenze. ASM in sintesi. ASM Analisi di Alcune Properietà. PN Ideate per rappresentare sistemi complessi

Indice generale. Prefazione

Insiemi e sottoinsiemi

Teoria dei Giochi. Anna Torre

Progetto e analisi di algoritmi

F(<M>, <w>) = 1, se quando M opera su w esistono due configurazioni di M. 0 altrimenti. Parte b

Elementi di Complessità Computazionale

Teoria dei Giochi. Anna Torre

Rappresentazione dei numeri interi in un calcolatore

Teoria dei Giochi. Anna Torre

Rappresentazione dei numeri interi in un calcolatore

Rappresentazione dei numeri interi in un calcolatore. Rappresentazione dei numeri

Giochi e dilemmi Parte III Giochi a somma zero

In questo esempio, come in tutti gli altri, chiamiamo l individuo 1 giocatore di riga, perché deve scegliere di collocarsi in una delle due righe

Caso, intelligenza e decisioni razionali

Teoria dei Giochi Prova del 28 Settembre 2012

Fondamenti dell Informatica

Caso, intelligenza e decisioni razionali:spunti didattici

Laboratorio di Algoritmi

Catene di Markov. Richiami teorici

Teoria dei Giochi. Anna Torre

Università di Roma Tor Vergata Corso di Teoria dei Fenomeni Aleatori, AA 2012/13. Catene di Markov

Teoria dei Giochi e delle Decisioni Prova del 24 Settembre Giocatore 2 a b Giocatore 1 a 8-12 b minz. ε ε 2 1 = 1.

Decisori (razionali) interagenti

UNIVERSITÀ di ROMA TOR VERGATA

Giochi a somma zero. In Action with Math. Competizione e Strategia: Teoria dei Giochi. Giulia Bernardi, Roberto Lucchetti. 19 novembre / 18

Università Roma Tre - PAS Classe A048 "Matematica Applicata" - Corso di Informatica a.a. 2013/2014

Rappresentazione binaria

Intelligenza Artificiale. Logica proposizionale: calcolo automatico

Teoria dei Giochi. Anna Torre

Algoritmi e Principi dell'informatica Seconda Prova in Itinere - 14 Febbraio 2014

Algoritmi e Complessità

Cos è la teoria dei giochi

Transcript:

Giochi su grafi Marco Faella Università di Napoli Federico II

Teoria dei giochi Teoria matematica del comportamento di agenti razionali in competizione tra loro Nata per applicazioni economiche von Neumann, Morgenstern, anni '40 Shapley, Nash, anni '50+

Il dilemma del prigioniero Due complici sono tenuti separati e devono decidere se confessare o meno In base alla loro scelta, verranno condannati secondo la seguente tabella: confessa non confessa confessa (6, 6) (0, 7) non confessa (7, 0) (1,1) Qual è il comportamento razionale da adottare?

Giochi su grafi 2 1 4 5 3 player 1 (P-1) player 2 (P-2) Grafo bipartito I giocatori si alternano nello spostare una pedina immaginaria Marco Faella n. 4

Giochi su grafi: reachability 2 1 4 5 3 player 1 (P-1) player 2 (P-2) Può il player 1 raggiungere 5 con certezza? Ha bisogno di ricordare il cammino fatto? Marco Faella n. 5

Giochi su grafi: reachability 2 1 4 5 3 Caratteristiche: 2 giocatori a turni player 1 (P-1) player 2 (P-2) obiettivo qualitativo: raggiungibilità completa informazione strategie deterministiche Marco Faella n. 6

Giochi su grafi: safety 2 1 4 5 3 player 1 (P-1) player 2 (P-2) Può il player 1 evitare 5 con certezza? Ha bisogno di ricordare il cammino fatto? Marco Faella n. 7

Giochi su grafi: notazione insieme di stati: transizioni: obiettivo (per P-1): S=S 1 S 2 E S S goal S è un insieme di sequenze di stati Marco Faella n. 8

Strategie deterministiche Sia Paths l'insieme dei percorsi finiti nel gioco Una strategia per P-1 è: f : Paths S Dato un percorso nel gioco, sceglie lo stato successivo solo se il percorso finisce in S1 può solo scegliere uno stato adiacente Similmente per P-2 Marco Faella n. 9

Strategie e stati vincenti f: strategia di P-1 g: strategia di P-2 Una strategia f è detta vincente (per P-1) dallo stato s se, per tutte le g, il percorso risultante soddisfa l'obiettivo Uno stato s è detto vincente (per P-1) se esiste una strategia vincente da s Marco Faella n. 10

Proprietà di interesse complessità determinare l'insieme di stati vincenti memoria è necessario ricordare il percorso? determinatezza (determinacy) se non vince P-1, vince P-2? Marco Faella n. 11

Reachability games Si usa l'operatore CPre (Controllable Predecessors) CPre:2 S 2 S CPre(X) = stati da cui P-1 può andare in X in un solo passo, con certezza 0 1 2 4 Ad esempio: 1 appartiene a CPre( {4} ) perché P-1 ha una mossa che va in 4 3 appartiene a CPre( {4} ) perché tutte le mosse di P-2 portano a 4 0 e 2 non appartengono a CPre( {4} ) 3 Marco Faella n. 12

Reachability games Algoritmo: ricerca all'indietro (backward search) usando l'operatore Controllable Predecessors obiettivo: raggiungere l'insieme di stati R X 0 =R X 1 =X 0 CPre X 0... X n 1 =X n sequenza crescente di sottoinsiemi di un insieme finito ovviamente, converge in numero finito di passi Marco Faella n. 13

Reachability games 4 2 1 4 5 3 3 2 1 Può il player 1 raggiungere 5 con certezza? Marco Faella n. 14

Implementazione enumerativa Codifica del gioco: un grafo rappresentato con liste di adiacenza Complessità di CPre(X): tempo lineare Complessità dell'intero algoritmo: tempo quadratico X 0 =R X 1 =X 0 CPre X 0... X n 1 =X n X. R CPre X Marco Faella n. 15

Implementazione simbolica Un insieme di stati è rappresentato da un BDD sull'insieme di variabili V {turn} Le transizioni E sono rappresentate da un BDD sull'insieme di variabili V V ' {turn,turn' } L'operatore CPre è facilmente ottenibile con operazioni di base su BDD Se X e' un BDD su V ' {turn' } CPre X = turn V ',turn '. E X turn V ',turn '. E X Marco Faella n. 16

Safety games Obiettivo: safety, cioè restare in un certo insieme di stati R Usiamo di nuovo CPre! X 0 =R X 1 =X 0 CPre X 0... X n 1 =X n X. R CPre X Complessità dell'intero algoritmo: tempo quadratico Marco Faella n. 17

Applicazioni Evitare i deadlock processi 1 e 2 mutex a e b P-1: implementazione di lock P-2: il caso, lo scheduler, etc. 1 ottiene a 3 1.lock(b) 5... 2 ottiene b 7 DEADLOCK! 1.lock(a) 1 2.lock(b) 6 0 1 non ottiene a 4... 2 non ottiene b 8 2.lock(b) 2... Marco Faella n. 18

Proprietà: memoria E' necessario ricordare il percorso seguito? No: strategie senza memoria (memoryless) Si, ma solo la lunghezza: counting strategies Si, ma solo quanto un automa finito può ricordare: strategie a memoria finita Si: strategie a memoria illimitata (calcolabile?) Reachability e safety: nessuna memoria Marco Faella n. 19

Proprietà: memoria Un gioco che richiede memoria obiettivo: visitare sia 2 che 3 infinite volte 2 1 3 Basta 1 bit di memoria, ovvero un automa con due stati Marco Faella n. 20

Proprietà: memoria Un gioco che richiede memoria illimitata ma calcolabile obiettivo: ottenere la codifica binaria di pi greco 0 1 Marco Faella n. 21

Proprietà: memoria Un gioco che richiede memoria illimitata e non calcolabile obiettivo: se l'avversario codifica una macchina di Turing che si arresta sulla parola vuota, raggiungere 2, altrimenti raggiungere 3 0 2 1 3 Marco Faella n. 22

Proprietà: determinatezza Se uno stato non è vincente per P-1, è vincente per P- 2? Reachability e safety: si Thm: tutti i giochi con obiettivo di tipo Borel sono determinati [Martin75] Marco Faella n. 23

Perché queste proprietà? complessità e memoria per: verificare modelli di sistemi sintetizzare controllori teoria del controllo determinatezza per: automi e logica complementazione di automi completezza di logiche Marco Faella n. 24

Distribuzioni Dato un insieme finito A, una distribuzione (di probabilità) è una funzione tale che f : A [0,1] a A f a =1 Marco Faella n. 25

Strategie deterministiche non-deterministiche randomizzate f : Paths S f : Paths 2 S f : Paths Distr S cambia la definizione di strategia vincente Marco Faella n. 26

Strategie due strategie f e g di categoria X determinano: X=det: un percorso X=non-det: un insieme di percorsi X=rand: una distribuzione sui percorsi nuova def. di vittoria esiste una strategia f tale che per tutte le g: X=det: il percorso soddisfa l'obiettivo X=non-det: tutti i percorsi soddisfano l'obiettivo X=rand:?? Marco Faella n. 27

Strategie randomizzate f : Paths Distr S una strategia f è vincente se, per tutte le g: tutti i percorsi soddisfano l'obiettivo (sure win) la probabilità di soddisfare l'obiettivo è 1 (almost sure win) oppure, uno stato è vincente se esiste una sequenza di strategie f1, f2,... che si avvicinano sempre più alla probabilità di vittoria 1 (limit win) Marco Faella n. 28

Strategie randomizzate f : Paths Distr S Thm: per tutti i giochi a turni, le strategie randomizzate non servono Marco Faella n. 29

Da 2 a 1.5 giocatori 2 1 4 5 3 player 1 (P-1) player 2 (P-2) 2 player random 1 ½ 1 4 5 3 ½ Marco Faella n. 30

Altri tipi di giochi: Numero di giocatori 0.5 catena di Markov 1 grafo 1.5 Markov Decision Process 2 gioco 2.5 gioco stocastico 3... Marco Faella n. 31

Altri tipi di giochi: A turni VS concorrenti Nei giochi concorrenti, i giocatori muovono contemporaneamente esempio: morra cinese Strategie randomizzate possono essere utili, anche per la semplice reachability Marco Faella n. 32

Un gioco concorrente ciascun giocatore sceglie 0 o 1 la destinazione dipende dalla coppia di mosse scelte P-1 vince se sceglie lo stesso numero di P-2 1, 1 0, 0 2 1 0, 1 1, 0 3 Marco Faella n. 33

Un altro gioco concorrente ciascun giocatore sceglie 0 o 1 la destinazione dipende dalla coppia di mosse scelte P-1 vince se sceglie lo stesso numero di P-2 0, 1 1, 0 1, 1 0, 0 1 2 Marco Faella n. 34

Dominazione Date due strategie deterministiche f e g, sia val(f, g) = 1 se f vince contro g val(f, g) = 0 altrimenti Marco Faella n. 35

Dominazione Date due strategie di P-1: f1 ed f2, si dice che f1 domina f2 se per tutte le strategie g di P-2: val(f1, g) >= val(f2, g) ed esiste una strategia g di P-2 tale che: val(f1, g) > val(f2, g) Marco Faella n. 36

Dominazione: esempio 2 1 4 5 3 P-1 non può vincere dallo stato 1 Però, la mossa verso 3 domina quella verso 2 (almeno, se P-2 gioca senza memoria) Marco Faella n. 37

Dominazione In un gioco che non si può vincere, una strategia non dominata rappresenta la miglior scelta per un giocatore Qual è la complessità di calcolare una strategia non dominata? Come si caratterizza una strategia non dominata? Marco Faella n. 38

Bibliografia D. Gale and F. Stewart, Infinite games with perfect information. Annals of mathematical studies 28 (1953) W. Thomas, On the synthesis of strategies in infinite games. STACS1995 W. Zielonka, Infinite games on finitely coloured graphs with applications to automata on infinite trees. TCS (1998) L. de Alfaro and T.A. Henzinger. Concurrent Omega- Regular Games. LICS2000 Marco Faella n. 39

selfish networks metodi formali teoria della decisione memoria teoria del controllo equilibri algoritmi economia teoria dei giochi informatica determinatezza Teoria dei giochi mappa concettuale teoria degli automi logica Marco Faella n. 40