Barriere assorbenti nelle catene di Markov e una loro applicazione al web



Documenti analoghi
Metodi e Modelli Matematici di Probabilità per la Gestione

Algoritmi e Strutture Dati

Algoritmi e strutture dati. Codici di Huffman

Ottimizzazione Multi Obiettivo

Metodi Computazionali

Algoritmo proposto. Maria Silvia Pini, Francesca Rossi, K. Brent Venable. Dipartimento di Matematica Pura e Applicata Università di Padova

Sono casi particolari di MCF : SPT (cammini minimi) non vi sono vincoli di capacità superiore (solo x ij > 0) (i, j) A : c ij, costo di percorrenza

Metodi statistici per le ricerche di mercato

Laboratorio di Algoritmi e Strutture Dati

Dimensione di uno Spazio vettoriale

Ogni azienda ha la necessità di conoscere il proprio sistema dei costi sia per controllare la situazione esistente che per verificare il

Problemi di localizzazione impianti

Automazione Industriale (scheduling+mms) scheduling+mms.

matematica probabilmente

Il sistema monetario

Management Sanitario. Modulo di Ricerca Operativa

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

I motori di ricerca. Che cosa sono. Stefania Marrara Corso di Sistemi Informativi

2) Codici univocamente decifrabili e codici a prefisso.

Statistica. Lezione 6

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Elementi di Psicometria con Laboratorio di SPSS 1

LEZIONE n. 5 (a cura di Antonio Di Marco)

TSP con eliminazione di sottocicli

Ricerca Operativa e Logistica

ALBO PRETORIO WEB MANUALE DELLA PROCEDURA SOMMARIO. Uso del manuale. Informazioni generali. Interfaccia grafica. Guida di riferimento

3 CENNI DI TEORIA DELLA COMPLESSITA COMPUTAZIONALE. E. Amaldi Fondamenti di R.O. Politecnico di Milano 1

La teoria dell utilità attesa

Esercizi di Probabilità e Statistica

STRATEGIA DI TRADING. Turning Points

La distribuzione Normale. La distribuzione Normale

2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione

Soluzione dell esercizio del 12 Febbraio 2004

Obiettivi dell Analisi Numerica. Avviso. Risoluzione numerica di un modello. Analisi Numerica e Calcolo Scientifico

Veneto Lavoro via Ca' Marcello 67/b, Venezia-Mestre tel.: 041/

2 Formulazione dello shortest path come problema di flusso

Funzioni in C. Violetta Lonati

1 Applicazioni Lineari tra Spazi Vettoriali

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Amplificatori Audio di Potenza

Esercizio data base "Biblioteca"

DEPLOY YOUR BUSINESS

Che Cosa È GlobalAdShare (GAS)

Protocollo di tracciamento e valutazione degli studenti dei corsi di italiano ICoNLingua A.A

TSP con eliminazione di sottocicli

PROVA FINALE V. AULETTA G. PERSIANO ALGORITMI II - -MAGIS INFO

Sequenziamento a minimo costo di commutazione in macchine o celle con costo lineare e posizione home (In generale il metodo di ottimizzazione

IL DIRETTORE GENERALE. Vista la legge 26 marzo 1990, n.62; Visto il Decreto Legislativo 30 marzo 2001, n.165;

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RIFERIMENTI ATTORI GLOSSARIO. ERRORI COMUNI REV. REQUISITI INGEGNERIA DEL SOFTWARE Università degli Studi di Padova

Parte 4. Progettazione di una simulazione

Economia del Lavoro 2010

Un modello matematico di investimento ottimale

Introduzione alla teoria dei database relazionali. Come progettare un database

Soluzione dell esercizio del 2 Febbraio 2004

e-dva - eni-depth Velocity Analysis

Che differenza c è tra una richiesta XML ed una domanda XML? (pag. 4)

Corso di Matematica per la Chimica

OSSERVAZIONI TEORICHE Lezione n. 4

Informatica 3. Informatica 3. LEZIONE 10: Introduzione agli algoritmi e alle strutture dati. Lezione 10 - Modulo 1. Importanza delle strutture dati

Ricerca Operativa A.A. 2007/2008

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Sistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate

Introduzione agli Algoritmi Genetici Prof. Beatrice Lazzerini

Circolare N. 155 del 26 Novembre 2014

Esercizi di dimensionamento dei sistemi di commutazione telefonica

IN COLLABORAZIONE CON OPTA SRL

Valore equo di un derivato. Contingent claim

Un applicazione della programmazione lineare ai problemi di trasporto

Valore attuale, obiettivi dell impresa e corporate governance. dott. Matteo Rossi

Il mercato di monopolio

Plate Locator Riconoscimento Automatico di Targhe

Politecnico di Milano Facoltà di Ingegneria dell Informazione AGENTI AUTONOMI E SISTEMI MULTIAGENTE Appello COGNOME E NOME

1 Breve introduzione ad AMPL

Computazione per l interazione naturale: Modelli dinamici

Analisi Statistica Spaziale

REGOLE PER L ESAME (agg.te settembre 2015)

Appunti sulla Macchina di Turing. Macchina di Turing

Appunti del corso di Informatica 1 (IN110 Fondamenti) 2 Algoritmi e diagrammi di flusso

Rappresentazione dei numeri in un calcolatore

Sommario. Sommario 1. Introduzione 2. Funzionamento dell'applicazione 3. Scelta del punto di partenza 4. Filtro delle mete 5. La mappa delle mete 6

INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI

Progetto di Reti di Telecomunicazione Modelli in Programmazione Lineare Problemi di flusso

Metodi e Modelli Matematici di Probabilità per la Gestione

Equilibrio bayesiano perfetto. Giochi di segnalazione

Sistemi Operativi mod. B. Sistemi Operativi mod. B A B C A B C P P P P P P < P 1, >

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Docente: Anna Valeria Germinario. Università di Bari. A.V.Germinario (Università di Bari) Analisi Matematica ITPS 1 / 22

Disposizione tecnica di funzionamento n. 03 Rev1 P-GO

Computational Game Theory

Guida Joomla. di: Alessandro Rossi, Flavio Copes

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Università di L Aquila Facoltà di Biotecnologie Agro-alimentari

INTRODUZIONE I CICLI DI BORSA

La Programmazione Lineare

G E-

Intelligenza Artificiale

LA COOKIE POLICY DI QUESTO SITO

Algoritmi e Strutture Dati II: Parte B Anno Accademico Lezione 11

Transcript:

Università Roma Tre Facoltà di Scienze M.F.N Corso di Laurea in Matematica a.a. 2001/2002 Barriere assorbenti nelle catene di Markov e una loro applicazione al web Giulio Simeone 1 Sommario Descrizione e formalizzazione del problema di ottimizzazione Utilizzo delle catene di Markov per la soluzione del problema Applicazione di un algoritmo efficiente per la ricerca della soluzione 2 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 1

Descrizione del problema Web: è una rete di pagine collegate fra loro da link ipertestuali È possibile vendere la collocazione di banner pubblicitari sulle pagine del sito, pagati in proporzione al numero di accessi compiuti dagli utenti Vogliamo individuare la collocazione ottimale dei banner in modo da massimizzare il profitto 3 Dati del problema L attività degli utenti nella lettura delle pagine di un sito web viene tracciato mediante appositi file di log: Access log: ci informa sul numero di utenti che ha letto una determinata pagina Referer log: ci informa sui link seguiti dagli utenti all interno del sito (ci dice da quale pagina proviene l utente) I due file ci permettono di costruire un grafo pesato (o una rete di flusso) che rappresenta l attività sul sito web 4 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 2

Rappresentazione del problema Pagina A (100 accessi) 25 30 45 10 15 Pagina C 10 (200 accessi) 5 10 Pagina B (50 accessi) Pagina D (60 accessi) 15 20 5 Rappresentazione del problema Pagina A (100 accessi) 30 10 25 Sorgente 90 5 30 Pagina D (60 accessi) 45 10 15 Pagina C 10 (200 accessi) 10 5 15 20 30 45 140 Pagina B (50 accessi) 10 Pozzo 6 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 3

Il problema di ottimizzazione Inserire un banner in una pagina del sito corrisponde a: Aggiungere una pagina (esterna), ossia aggiungere un vertice al grafo Aggiungere un link dalla pagina in cui è presente il banner a quella pubblicizzata dal banner, ossia aggiungere uno spigolo al grafo Dobbiamo trovare la collocazione dei banner tale da rendere massimo il profitto, funzione della probabilità che il visitatore termini la visita del sito su una delle pagine pubblicizzate e dei coefficienti di redditività dei singoli banner 7 Il problema di ottimizzazione Per ciascuna disposizione dei banner nelle pagine del sito il grafo verrà ampliato aggiungendo un certo numero di spigoli e di vertici Il processo di calcolo della disposizione ottima del banner, viene reso più arduo dal fatto che i banner da collocare sono numerosi e l inserimento di un banner influenza la collocazione di tutti gli altri Se la quantità dei banner e delle pagine del sito sono elevate, allora le possibili disposizioni sono molto numerose Dunque il processo di ricerca esaustiva della soluzione ottima, su un grafo di grandi dimensioni, non è attuabile 8 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 4

La funzione obiettivo L obiettivo è la massimizzazione di una funzione profitto: Il profitto per una determinata disposizione di banner è dato dalla somma dei guadagni stimati per ciascun banner Tale guadagno è funzione della probabilità con cui un visitatore del sito selezionerà il banner e del coefficiente di redditività dello stesso banner 9 Probabilità di transizione È necessario quindi trasformare i valori assoluti del numero di utenti che percorrono determinati spigoli del grafo, in probabilità di transizione da un vertice ad un altro Inizialmente le probabilità associate ad ogni spigolo del grafo sono calcolate normalizzando i valori assoluti estratti dal referer log Successivamente, dopo aver ampliato il grafo con l aggiunta dei banner, per ogni disposizione, vengono ricalcolate le probabilità assegnate ad ogni spigolo, tenendo anche conto dell indice di attrattività assegnato ad ogni banner 10 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 5

Rappresentazione del problema 3/10 Pagina A 3/20 1/2 9/40 1/10 9/20 Pagina C 1/6 1/20 1/40 7/10 Pagina B 1/5 Pagina D 2/6 3/10 1/2 Pozzo 11 Rappresentazione del Pagina X problema 3/10 Pagina A 1/20 3/20 1/2 9/40 1/10 9/20 Pagina C 1/6 1/20 1/40 7/10 Pagina Y 1/10 Pagina B 1/5 Pagina D 2/6 3/10 1/2 Pozzo 12 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 6

Catene di Markov Il problema si presta ad essere interpretato come una catena di Markov Infatti il grafo con le probabilità associate agli spigoli può essere letto come un processo stocastico con uno spazio degli stati finito. Le probabilità con cui il sistema si sposta da uno stato all altro sono indipendenti dal tempo (e quindi dalla storia delle transizioni precedenti) 13 Matrice di transizione La matrice di transizione P di una catena di Markov descrive le probabilità con cui il sistema passo da uno stato i al tempo t ad uno stato j al tempo t+1 Si definisce la matrice potenziale G =! " G n#0 n P L elemento g i,j è il numero (finito o infinito) atteso di visite in j se la catena parte da i. 14 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 7

Barriere assorbenti Sono stati del processo stocastico da cui non è possibile uscire I vertici aggiunti al grafo (pozzo di disconnessione, pagine pubblicitarie) sono barriere assorbenti del processo stocastico da noi rappresentato Dalla teoria delle catene di Markov sappiamo che il sistema prima o poi deve finire su una barriera assorbente Grazie ad alcuni teoremi è possibile calcolare la probabilità con cui il sistema termina su una determinata barriera assorbente 15 Probabilità di assorbimento Teorema: Sia P la matrice di transizione di una catena di Markov e G la sua matrice potenziale: & I P = $ % B 0 #! Q" & E G = $ % F Allora la probabilità che il sistema sia assorbito dallo stato j partendo dallo stato i è data da ( UB ) i, j 0 U #! " 16 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 8

Algoritmo di ottimizzazione Assegnati i banner e gli indici di attrattività, l algoritmo deve calcolare le probabilità di assorbimento dei banner per ognuna delle disposizioni possibili Tale calcolo sarebbe eccessivamente oneroso su grafi di grandi dimensioni Dunque adottiamo un approccio approssimante noto come Algoritmo Old Bachelor (migliore di Simulated Annealing e Threshold Acceptance) 17 Algoritmi di ricerca della soluzione ottima Sia S l insieme delle soluzioni: vogliamo trovare la soluzione ottima, che minimizza la funzione f ( si ) si! S L algoritmo genera una soluzione di partenza s 0 e fissa una soglia T: le altre soluzioni s 1,,s n vengono generate una dopo l altra a partire dalla precedente tramite una procedura prefissata, che accetta la nuova soluzione se è migliore della precedente o se rientra nella soglia T Ad esempio, ogni disposizione s i+1 di link nelle pagine del sito viene generata a partire da quella precedente s i scegliendola a caso in modo tale che le due soluzioni differiscano solo per la collocazione di una pagina 18 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 9

Simulated annealing e Threshold acceptance Algoritmo SA 1) For i=1,, M 2) sceglie casualmente una soluzione s vicina a s i 3) se f(s )<f(s i ) allora s i+1 =s 4) altrimenti s i+1 =s con probabilità exp((f(s i )-f(s )/T i ) 5) T i = next(t i ) 6) End 7) Restituisce la soluzione s i per la quale f(s i ) è minima Algoritmo TA 1) For i=1,, M 2) sceglie casualmente una soluzione s vicina a s i 3) se f(s )<f(s i )+T i allora s i+1 =s 4) altrimenti s i+1 =s i 5) T i = next(t i ) 6) End 7) Restituisce la soluzione s i per la quale f(s i ) è minima 19 Algoritmo Old Bachelor 1) Sceglie una soluzione iniziale s 0 2) Sceglie la soglia iniziale T 0 3) For i=0,,m 4) sceglie casualmente una soluzione s vicina a s i 5) se f(s )<f(s i )+T i allora s i+1 =s e T i+1 =T i -decr(t i ) 6) altrimenti s i+1 = s i e T i+1 = T i +incr(t i ) 7) End 8) Restituisce la soluzione s i per la quale f(s i ) è minima 20 Università degli Studi Roma Tre - Facoltà di Scienze M.F.N. - Corso di Laurea in Matematica 10