Metodi Computazionali



Documenti analoghi
Le catene di Markov come metodologia utilizzata dai motori di ricerca per classificare le pagine web su internet.

Metodi basati sugli autovettori per il Web Information Retrieval

Sono casi particolari di MCF : SPT (cammini minimi) non vi sono vincoli di capacità superiore (solo x ij > 0) (i, j) A : c ij, costo di percorrenza

Appunti sulla Macchina di Turing. Macchina di Turing

Luigi Piroddi

MATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010

Corso di Calcolo Numerico

Corso di Matematica per la Chimica

Problema del trasporto

Macchine a stati finiti G. MARSELLA UNIVERSITÀ DEL SALENTO

METODO DEL POTENZIALE AI NODI

Barriere assorbenti nelle catene di Markov e una loro applicazione al web

Macchine sequenziali

Introduzione al MATLAB c Parte 2

1. Sia dato un poliedro. Dire quali delle seguenti affermazioni sono corrette.

SVM. Veronica Piccialli. Roma 11 gennaio Università degli Studi di Roma Tor Vergata 1 / 14

Metodi Frequenziali per il Progetto di Controllori MIMO: Controllori Decentralizzati

Chiusura lineare. N.B. A può essere indifferentemente un insieme, finito o no, o un sistema. Es.1. Es.2

b i 1,1,1 1,1,1 0,1,2 0,3,4

Macroeconomia, Esercitazione 6. 1 Esercizi. 1.1 Taylor rule e Domanda Aggregata Dinamica/ Taylor rule e Domanda Aggregata Dinamica/2

1 Applicazioni Lineari tra Spazi Vettoriali

Capitolo 4: Ottimizzazione non lineare non vincolata parte II. E. Amaldi DEIB, Politecnico di Milano

15 febbraio Soluzione esame di geometria - 12 crediti Ingegneria gestionale - a.a COGNOME... NOME... N. MATRICOLA...

APPUNTI DI MATEMATICA ALGEBRA \ INSIEMISTICA \ TEORIA DEGLI INSIEMI (1)

Ottimizazione vincolata

LEZIONE 23. Esempio Si consideri la matrice (si veda l Esempio ) A =

Processi stocastici. variabile casuale: funzione da uno spazio campione S a valori nello spazio E R X(t) : S E. spazio degli stati del processo

La Social Network Analysis applicata alla ricerca semantica

Ottimizzazione Multi Obiettivo

3 CENNI DI TEORIA DELLA COMPLESSITA COMPUTAZIONALE. E. Amaldi Fondamenti di R.O. Politecnico di Milano 1

Automazione Industriale (scheduling+mms) scheduling+mms.

Sistemi Operativi mod. B. Sistemi Operativi mod. B A B C A B C P P P P P P < P 1, >

A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.

Dimensione di uno Spazio vettoriale

Macchine a stati finiti. Sommario. Sommario. M. Favalli. 5th June 2007

Politecnico di Milano Facoltà di Ingegneria dell Informazione AGENTI AUTONOMI E SISTEMI MULTIAGENTE Appello COGNOME E NOME

Macchine a stati finiti. Sommario. Sommario. M. Favalli. Le macchine a stati si utilizzano per modellare di sistemi fisici caratterizzabili mediante:

Esercizi su lineare indipendenza e generatori

Informatica 3. Informatica 3. LEZIONE 10: Introduzione agli algoritmi e alle strutture dati. Lezione 10 - Modulo 1. Importanza delle strutture dati

CPM - PERT CPM - PERT. Rappresentazione di un progetto. Gestione di un progetto. Critical Path Method Project Evaluation and Review Technique

Lezione 9: Cambio di base

Matematica generale CTF

e-dva - eni-depth Velocity Analysis

VC-dimension: Esempio

Approssimazione polinomiale di funzioni e dati

Finanza matematica - Lezione 01

Il nuovo browser italiano dedicato alla navigazione e comunicazione sicura in internet per bambini

Esercitazioni di Calcolo Numerico 23-30/03/2009, Laboratorio 2

Equilibrio bayesiano perfetto. Giochi di segnalazione

TEORIA DEI GIOCHI. Parte 3

Controlli Automatici T. Trasformata di Laplace e Funzione di trasferimento. Parte 3 Aggiornamento: Settembre Prof. L.

Applicazioni lineari

Massimi e minimi vincolati

Università degli Studi di Roma Tor Vergata. Corso di Laurea in Ingegneria Meccanica

Prodotto elemento per elemento, NON righe per colonne Unione: M R S

Sia data la rete di fig. 1 costituita da tre resistori,,, e da due generatori indipendenti ideali di corrente ed. Fig. 1

da 2 a 5 giocatori, dai 10 anni in su, durata 30 minuti

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo

min 4x 1 +x 2 +x 3 2x 1 +x 2 +2x 3 = 4 3x 1 +3x 2 +x 3 = 3 x 1 +x 2 3x 3 = 5 Innanzitutto scriviamo il problema in forma standard: x 1 x 2 +3x 3 = 5

Metodi e Modelli Matematici di Probabilità per la Gestione

IGiochidiArchimede-SoluzioniBiennio 22 novembre 2006

Parte 2. Determinante e matrice inversa

Tecniche di analisi multivariata

Università degli studi di Cagliari FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI

Esercizio su MT. Svolgimento

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.

RICHIAMI SULLE MATRICI. Una matrice di m righe e n colonne è rappresentata come

PROGETTO REGIONALE MISURAZIONE E VALUTAZIONE DELLE BIBLIOTECHE VENETE

Autovalori e Autovettori

(a cura di Francesca Godioli)

PROVA FINALE V. AULETTA G. PERSIANO ALGORITMI II - -MAGIS INFO

I motori di ricerca. Che cosa sono. Stefania Marrara Corso di Sistemi Informativi

Sequenziamento a minimo costo di commutazione in macchine o celle con costo lineare e posizione home (In generale il metodo di ottimizzazione

TSP con eliminazione di sottocicli

Procedura per la registrazione e lo svolgimento dei corsi sulla Piattaforma Fad di Oasi Formazione per dipendenti Ancora.

( x) ( x) 0. Equazioni irrazionali

MATEMATICA. { 2 x =12 y 3 y +8 x =0, si pone il problema di trovare, se esistono, un numero x ed un numero y che risolvano entrambe le equazioni.

TECNICHE DI SIMULAZIONE

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora:

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)

Capitolo 5. Cercare informazioni sul Web

Obiettivi dell esercitazione. Requisiti (cont.) Requisiti. Università di Roma La Sapienza A.A Facoltà di Ingegneria Sede di Latina

Fondamenti di Automatica

Modello Relazionale. Modello Relazionale. Relazioni - Prodotto Cartesiano. Relazione: tre accezioni. Es. Dati gli insiemi

Progetto di Reti di Telecomunicazione Modelli in Programmazione Lineare Problemi di Network design

Esercizi Capitolo 6 - Alberi binari di ricerca

Ricerca di outlier. Ricerca di Anomalie/Outlier

Slide Cerbara parte1 5. Le distribuzioni teoriche

Corso di Reti Logiche. Macchine Sequenziali. Dipartimento di Informatica e Sistemistica Università degli Studi di Napoli Federico II

Esponenziali elogaritmi

Calcolatori: Algebra Booleana e Reti Logiche

Parte 3. Rango e teorema di Rouché-Capelli

Matematica nel Web: l esempio di Google

Guida Introduttiva Picasa 3

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI

Prof. Silvio Reato Valcavasia Ricerche. Il piano cartesiano

Le Macchine di Turing

4 Dispense di Matematica per il biennio dell Istituto I.S.I.S. Gaetano Filangieri di Frattamaggiore EQUAZIONI FRATTE E SISTEMI DI EQUAZIONI


Le equazioni. Diapositive riassemblate e rielaborate da prof. Antonio Manca da materiali offerti dalla rete.

Transcript:

Metodi Computazionali Elisabetta Fersini fersini@disco.unimib.it A.A. 2009/2010

Catene di Markov Applicazioni: Fisica dinamica dei sistemi Web simulazione del comportamento utente Biologia evoluzione delle cellule Musica definizione di sw per la composizione musicale Finanza credit risk 2

Web Mining Il web è una collezione di documenti eterogenei in continua evoluzione caratterizzato da: Vastità dell informazione disponibile Difficoltà di reperire facilmente conoscenza interessante Nasce così una fertile area di ricerca con lo scopo di applicare metodi in grado organizzare, per quanto possibile, il contenuto del web. 3

Web Structure Mining Obiettivo: Analizzare la struttura topoligica di una rete di informazioni al fine di identificare comunità, relazioni nascoste, etc Link Analysis Area del Web Structure Mining orientata alla Social Newtork Analysis Markov Chains: la gallina dalle uova d ora di Google! 4

Google le assunzioni Assunzioni: 1. Un Hyperlink è un riferimento di una pagine web i contenuto in una pagina web j un link da una pagina j verso una pagina i corrisponde ad una raccomandazione della pagina i da parte dell autore della pagina j. se le pagine j e i sono connesse tramite un link, allora la probabilità che esse trattino dello stesso argomento è più alta in confronto al caso in cui esse non siano connesse. j i 5

Google le assunzioni Assunzioni: 2. La visibilità di un sito si misura mediante il numero di siti che puntano ad esso 3. La luminosità di un sito rappresenta il numero di siti che esso punta 4. In generale la Link Analysis basa i suoi assunti sulla teoria dei grafi, in particolare: Un LINK GRAPH contiene un nodo per ogni pagina j ed assumono esista un arco diretto (j,i), se e solo se la pagina j contiene un hyperlink verso la pagina i. 6

PageRank - definizioni intuitive (1) Introdotto da Page e Brin nel 1998 L importanza di una pagina i è influenzata dall importanza delle pagine che puntano ad essa, in particolare: un link dalla pagina j alla pagina i viene interpretato come un voto di j per i e se a sua volta anche i ha un link verso j entrambe ricevono un voto ancora più alto (Feedback-Link). Se la pagina i ha un PageRank più alto, il valore di un suo link è ancora più elevato; se ha un valore più basso non esiste alcuna penalità. 7

PageRank - definizioni intuitive (2) L'importanza di una pagina è data dal voto che questa riceve "dalla Rete" nella sua globalità PageRank rappresenta l intero web come un grafo diretto G = (V,E) contenente n pagine; il valore di PageRank associato ad una pagina i, denotato da P(i) è definito da: (1) O j è il numero di out-link di j 8

Notazione Matriciale Sistema di n equazioni con n incognite Sia P il vettore colonna dei PageRank score, cioè P = (P(1), P(2),, P(n)) T. Sia A la matrice di adiacenza del grafo del web, dove (2) Possiamo scrivere le n equazioni come (3) 9

Risolvere il sistema di equazioni PageRank può essere calcolato da un semplice algoritmo iterativo La soluzione al sistema corrisponderà agli autovettori della matrice normalizzata rappresentante i link del web Problema: per ottenere la convergenza devono essere soddisfatte due condizioni 1 è il più grande autovalore P è il principale autovettore 10

un passo indietro verso le Markov chain Per introdurre le due condizioni la stessa equazione (3) dalla modellazione mediante catene di Markov: Ogni pagina web rappresenta uno stato. Ogni hyperlink è una transizione, che permette di passare da una pagina all altra con una determinata probabilità. Tale framework permette di simulare la navigazione di un utente web. 11

Random surfing O i denota il numero di out-links della pagina i. Ogni probabilità di transizione è 1/O i se assumiamo che l utente sceglierà di passare da una pagina all altra in maniera random. 12

Matrice delle probabilità di transizione Sia A la matrice di probabilità di transizione A ij rappresenta la probabilità che un utente nello stato i (pagina i) passi allo stato j (pagina j). A ij è definita dall equazione(2). 13

Let us start Data la distribuzione di probabilità iniziale che l utente si trovi in un particolare stato o pagina p 0 = (p 0 (1), p 0 (2),, p 0 (n)) T (vettore colonna) A : n n matrice delle probabilità di transizione, Avremo: (4) (5) Se la matrice A soddisfa l equazione (5), allora diremo che A è la matrice stocastica della catena di Markov. 14

Distribuzione di probabilità stazionaria Dal teorema delle Markov chain: Una catena di markov definita da una matrice stocastica A ha un unica distribuzione di probabilità stazionaria se A è irriducible e aperiodica. Una distribuzione di probabilità stazionaria garantisce che dopo una serie di transizioni p k convergerà ad un vettore di probabilità π 15

torniamo al grafo del web Per verificare la convergenza dell algoritmo verifichiamo le due condizioni A è una matrice stocastica A è irriducibile e aperiodica Nessuna di queste condizioni è verificata!!! 16

A non è una matrice stocastica A è la matrice di transizione del grafo del web Non soddisfa l equazione (5) Perchè? Molte pagine web non hanno out-links, per cui in A potrebbero esserci delle righe uguali a 0. 17

Esempio 18

A non è una matrice stocastica: soluzione 1. Rimuovere tutte le pagine che hanno non hanno out-links 2. Aggiungere un set di out-links dalle pagine che non rispettano l equazione (5) verso tutte le altre pagine del grafo. 19

A non è irriducibile Irriducibile significa che il grafo del web è fortemente connesso. Definizione: G = (V, E) è fortemente connesso se e solo se, per ogni coppia di nodi i,j V, esiste un percorso da i to j. Perchè il grafo del web rappresentato da A non è irriducibile? per alcune coppie di nodi i,j non è detto che esista un percorso 20

A non è aperiodica Uno stato i in una catena di Markov è periodico se esiste un ciclo che la catena deve attraversare. Se uno stato non è periodico si dice aperiodico. Una catena di Markov è definita aperiodica se tutti gli stati sono aperiodici. 21

Esempio di stato periodico Esempio: Catena di Markov di periodo 3. 22

Irriducibilità e aperiodicità: soluzione Aggiungere un link da ogni pagina verso tutte le altre e dare ad ogni link una probabilità di transizione molto bassa, controllata da un parametro d. 23

PageRank Il coefficiente di ranking della pagina pi si ottiene risolvendo il seguente sistema di eq. lineari: con il seguente vincolo: Vettore delle probabilità stazionarie a cui la catena di markov converge!!! 24