I giochi con avversario. I giochi con avversario. Introduzione. Giochi come problemi di ricerca. Il gioco del NIM.

Documenti analoghi
I giochi con avversario. I giochi con avversario. Introduzione. Il gioco del NIM. Il gioco del NIM. Giochi come problemi di ricerca

I giochi con avversario. I giochi con avversario. Sommario. Il gioco del NIM. Il gioco del NIM. Giochi come problemi di ricerca

I giochi con avversario. Maria Simi a.a. 2016/2017 Credits: Alessio Micheli Russell-Norvig

Ricerca con avversari

3 Ricerca per Giochi e CSP

Algoritmi e giochi combinatori

Teoria dei giochi. 2. Forma estesa (struttura ad albero e matrice dei pagamenti) Slides di Teoria dei Giochi, Vincenzo Cutello 1

Intelligenza Artificiale Compito - 12 Marzo 2007

Intelligenza Artificiale. Lezione 6bis. Sommario. Problemi di soddisfacimento di vincoli: CSP. Vincoli CSP RN 3.8, 4.3, 4.5.

I giochi con avversario

Intelligenza Artificiale Compito - 12 Marzo 2007

ESERCIZIO MIN-MAX Si consideri il seguente albero di gioco dove i punteggi sono tutti dal punto di vista del primo giocatore.

La strategia MiniMax e le sue varianti

3 Ricerca per Giochi e CSP

Intelligenza Artificiale. Lezione 15. Intelligenza Artificiale Daniele Nardi, 2003 Lezione 15 0

Ricerca con avversari: GIOCHI

Algoritmi di Ricerca

max e tagli alfa-beta Una funzione euristica h(n) è detta ammissibile se non sbaglia mai per eccesso la stima del costo per arrivare all obbiettivo

Intelligenza Artificiale

GIOCHI. Ambiente multi-agente presenza di un avversario. avversario economia anche se esiste una competizione di calcio fra robot

IZIPLAY SKILL-GAMES REGOLE DEL GIOCO BACKGAMMON

Corso di Intelligenza Artificiale

Giochi a due giocatori

GIOCHI. L'intelligenza artificiale considera giochi con le seguenti proprietà: 1) Sono giochi a due giocatori in cui le mosse sono alternate;

Intelligenza Artificiale. Tecniche di ricerca basate sullo spazio degli stati

Esercizi d'esame su strategie di ricerca, CSP e Giochi. Compiti d'esame 2017 e 2018

Constraint Satisfaction Problems

... Max. Max. ... Min ... Albero di gioco

Introduzione al Teorema di Bayes - Regola delle probabilitá totali

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

FONDAMENTI DI INTELLIGENZA ARTIFICIALE (8 CFU) 13 Gennaio 2015 Tempo a disposizione: 2 h Risultato: 32/32 punti

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Intelligenza Artificiale. Lezione 5. Sommario. Ricerca Best-first. Ricerca golosa. Russell & Norvig Capitolo 4, Paragrafi 1 2. Ricerca Best-first

Esempi di alcuni giochi

AccumulatoreSomma AccumulatoreSommaProdotto AccumulatoreSomma AccumulatoreSommaProdottoDivisione

Cammini minimi per grafi molto grandi

Le Regole del Gioco Elementi del Gioco

In Action With Math. Competizione e Strategia - Teoria dei Giochi. Roberto Lucchetti - Giulia Bernardi. Politecnico di Milano

TECNOLOGIE INFORMATICHE MULTIMEDIALI

MATEMATICA. a.a. 2014/15

INTRODUZIONE ALLA TEORIA DEI GIOCHI

GIOCHI. Ambiente multi-agente presenza di un avversario. avversario economia anche se esiste una competizione di calcio fra robot

ThreeChess. Ovvero, come giocare a scacchi in tre

ThreeChess. Ovvero, come giocare a scacchi in tre.

Giochi e dilemmi Parte I Giochi ad informazione completa

Intelligenza Artificiale. Cosa vedremo. Game Playing. Gennaio Aprile marco ernandes.

TAVOLA DI FAUST E STRATEGIE NON SIMMETRICHE

ESERCITAZIONE novembre domanda facoltativa per ottenere la lode (solo se si è risposto alle altre parti)

FONDAMENTI DI INTELLIGENZA ARTIFICIALE 12 Febbraio 2016 Tempo a disposizione: 2 h Risultato: 32/32 punti

Roberto Messa e Maria Teresa Mearini. Il Gioco degli Scacchi

Espansione: si parte da uno stato e applicando gli operatori (o la funzione successore) si generano nuovi stati.

L'intelligenza artificiale considera giochi con le seguenti proprietà: 1) Sono giochi a due giocatori in cui le mosse sono alternate;

2 Problemi di Ricerca

Intelligenza Artificiale. Lezione 6bis. Intelligenza Artificiale Daniele Nardi, 2004 Lezione 6bis 0

Paolo Ferrario, Dispensa didattica n. 5: LA MAPPA / RETE DEL SISTEMA DEI SERVIZI ALLA PERSONA E ALLA COMUNITA, 29 Marzo 2011

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Il Branch & Bound. Definizione 1. Sia S R n. La famiglia S = {S 1, S 2,..., S k S} tale che S 1 S 2 S k = S viene detta suddivisione di S.

Alfa. Il GO tra gioco, matematica ed economia. Alla ricerca della strategia ottimale

Esercitazione gennaio 2015

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Tecniche di ottimizzazione per l analisi della diffusione delle innovazioni nei social networks

Esercitazione gennaio 2018

EVENTI FUTURI EQUIPROBABILI Lezione n. 3

REGOLE DI BASE. Quando orientiamo la scacchiera la casa posta nell'angolo a destra di ogni giocatore deve essere di colore chiaro.

decisioni multiattributo il caso DF Center lezione 11

Intelligenza Artificiale. Risoluzione dei Problemi

FONDAMENTI DI INTELLIGENZA ARTIFICIALE 13 Luglio 2017 Tempo a disposizione: 2 h Risultato: 32/32 punti

Corso di scacchi. La partita a scacchi Finale

29 maggio Distinzione importante: giochi simultanei giochi sequenziali: uno dei giocatori ha la prima mossa; l altro deve rispondere.

Roberto Messa e Maria Teresa Mearini. il gioco degli MESSAGGERIE SCACCHISTICHE

Cenni sui metodi iterativi per sistemi lineari. Analisi Numerica Prof. M. Lucia Sampoli a.a. 2014/2015

Giochi in forma estesa Esempi. In Action with Math. Competizione e Strategia: Teoria dei Giochi. Giulia Bernardi, Roberto Lucchetti.

Manuale di Kiriki. Albert Astals Cid Eugene Trounev Traduzione dell interfaccia: Marcello Anni Traduzione della documentazione: Federico Zenith

2.6 Calcolo degli equilibri di Nash

. Max. Max. Min. Min Albero di gioco

Analisi Strategica per la Politica Economica

FONDAMENTI DI INTELLIGENZA ARTIFICIALE 9 Febbraio 2018 Tempo a disposizione: 2 h Risultato: 32/32 punti

FONDAMENTI DI INTELLIGENZA ARTIFICIALE 12 Gennaio 2017 Tempo a disposizione: 2 h Risultato: 32/32 punti

MATEMATICA FINANZIARIA RISCHI: RAPPRESENTAZIONE E GESTIONE (CENNI)

Ricerca euristica. Funzioni di valutazione euristica. Esempi di euristica. Strategia best-first: esempio. Algoritmo di ricerca Best-First 3/17/11

Agenti che risolvono problemi attraverso la ricerca in uno spazio di stati

Esercizi di Calcolo delle Probabilità

Intelligenza artificiale

Modelli probabilistici variabili casuali

Introduzione ai Problemi di Flusso su Reti

Esercizi su Python. 14 maggio Scrivere una procedura che generi una stringa di 100 interi casuali tra 1 e 1000 e che:

IL GIOCO DELLE SCACCHIERE LINEARI

Calcolo del fattore di convergenza

In questo esempio, come in tutti gli altri, chiamiamo l individuo 1 giocatore di riga, perché deve scegliere di collocarsi in una delle due righe

Cercare il percorso minimo Ant Colony Optimization

Transcript:

I giochi con avversario I giochi con avversario Maria Simi a.a. 26/27 Regole semplici e formalizzabili eterministici, due giocatori, turni alterni, zero-sum, informazione perfetta (ambiente accessibile) ambiente multi-agente: la presenza dell avversario rende il problema contingente più difficile rispetto ai problemi di ricerca visti fin ora complessità e vincoli di tempo reale: si può solo cercare di fare la mossa migliore nel tempo disponibile i giochi sono un po più simili ai problemi reali Introduzione. La soluzione teorica: come si sceglie la mossa migliore in un gioco con uno spazio di ricerca limitato 2. Estensione a giochi più complessi, in cui non è possibile una esplorazione esaustiva 3. Tecniche di ottimizzazione della ricerca Giochi come problemi di ricerca Stati: configurazioni del gioco Stato iniziale: configurazione iniziale unzione successore: le mosse legali e stati risultanti Terminal-test: funzione che determina la fine del gioco unzione di utilità (pay-off): valore numerico che pesa gli stati terminali del gioco Es. -, conteggio punti, Il gioco del NIM Regole: Un certo numero di fiammiferi, 7, allineati sul tavolo Una mossa consiste nel separare una fila in due file aventi un numero diverso di fiammiferi. Perde il giocatore che non può più muovere Stati: 6- Mosse: 6- -- -2- = 2-- Il gioco del NIM Il computer si chiama, è l avversario. Quale mossa conviene fare a nello stato iniziale? 7 6- -2-3 -- -2-3-2-2 3-3- --- 3-2-- 2-2-2-3---- 2-2--- 2-----

Min-max, per giochi a decisione perfetta Min-max con decisione imperfetta In casi più complessi occorre una funzione di valutazione dello stato f. Strategia: guardare avanti k mosse Si espande l albero di ricerca un certo numero di livelli k (compatibile col tempo e lo spazio disponibili) si valutano gli stati ottenuti e si propaga indietro il risultato con la regola del e : f(n) se n è uno stato sul livello k Valore-Minimax(n) = max s succ(n) ValoreMinimax(s) se n min s succ(n) ValoreMinimax(s) se n Min-max: un esempio dettagliato A v= 3 L algoritmo - con cut-off B v= + 3 v= + E C v= 23 v= v= G v=6 6 Il filetto - 6-= 6-= -=- -= -= f(n)=x(n) O(n) X(n) righe aperte per X O(n) righe aperte per O 6-= -2 X O X -= -6=- -6=- -6=-2 6-=2 -= 6-6= La funzione di valutazione La funzione di valutazione f è una stima della utilità attesa a partire da una certa posizione nel gioco. es. il vantaggio in materiale negli scacchi: pedoni, cavallo o alfiere 3, torre, regina 9 eterminante la qualità della f: deve essere consistente con l utilità se applicata a stati terminali (indurre lo stesso ordinamento). deve essere efficiente da calcolare; deve riflettere le probabilità effettive di vittoria (maggiore valore ad A piuttosto che a B se da A ci sono più probabilità di vittoria che da B) 2

Problemi con -: stati non quiescienti Problemi con -: effetto orizzonte Stati non quiescienti: l esplorazione fino ad un livello può mostrare una situazione molto vantaggiosa: alla mossa successiva la regina nera viene mangiata. Soluzione: applicare la valutazione a stati quiescenti stati in cui la funzione di valutazione non è soggetta a mutamenti repentini. Effetto orizzonte: può succedere che vengano privilegiate mosse diversive che hanno il solo effetto di spingere il problema oltre l orizzonte Qui si potrebbe mettere il re bianco sotto scacco per evitare che il pedone diventi regina Potatura alfa-beta: l idea Tecnica di potatura per ridurre l esplorazione dello spazio di ricerca in algoritmi -. Potatura alfa-beta: l implementazione Si va avanti in profondità fino al livello desiderato e propagando indietro i valori si decide se si può abbandonare l esplorazione nel sotto-albero. MaxValue e MinValue vengono invocate con due valori di riferimento: α (inizialmente ) e β (inizialmente + ): rapprentano rispettivamente la migliore alternativa per e per fino a quel momento. I tagli avvengono quando nel propagare indietro: v β per i nodi (taglio α) v α per i nodi (taglio β) L algoritmo alfa-beta: max-value L algoritmo alfa-beta: min-value taglio α taglio β 3

Min-max: un esempio dettagliato A v= 3 Potatura alfa-beta: un esempio dettagliato 3 A [ 3, + ] taglio β B v= + 3 v= + E 3 B [, + 3 ] taglio α E [3, + ] C v= 23 v= v= G v=6 23 C [ 32, + ] [, 3] [3, + ] 6 Miglioramento Si può fare meglio se ordiniamo i successori di un nodo α in modo che la mossa migliore per sia generata prima, e quelli dei nodi β in modo che la mossa peggiore per sia generata prima Con approfondimento iterativo si possono scoprire ad una iterazione informazioni utili per l ordinamento da usare in una successiva Giochi con causalità Sono ad esempio i giochi in cui è previsto un lancio di dadi Ancora più reale: la realtà è spesso imprevedibile non solo complessa. Backgammon: ad ogni turno il giocatore deve tirare due dadi per decidere quali mosse sono lecite. Backgammon Lancio dadi 6-, mosse legali per il bianco: (-, -) (-,9-2) (-, -6) (-, -6) Bianco Min-max con nodi possibilità (chance ) Non si sa quali saranno le mosse legali dell avversario: accanto ai nodi di scelta dobbiamo introdurre i nodi possibilità Nel calcolare il valore dei nodi e adesso dobbiamo tenere conto delle probabilità dell esperimento casuale Si devono calcolare il valore massimo e minimo attesi

Min-max con nodi chance (esempio) 2 lanci diversi: i lanci doppi con p=/36, glialtricon p= /8 Min-max con nodi chance (cont.) con probabilità.9 farà 2 e con probabilità. farà 3.9 x 2 +. x 3 = 2..9 x +. x =.3 La mossa migliore è la prima. Expectiminmax: la regola Min-max con nodi chance : nota f(n) se n è uno stato sul livello di taglio Expectiminmax(n)= max s succ(n) Expectiminmax(s) se n min s succ(n) Expectiminmax(s) se n Σ s succ(n) P(s) Expectiminmax(s) se n è un nodo possibilità Non è sufficiente l ordinamento relativo dei successori; nel secondo caso la mossa scelta è diversa. ls funzione di valutazione deve essere una trasformazione lineare positiva della probabilità di vincere a partire da una certa posizione