MODELLI MATEMATICI PER I SISTEMI DI INFORMAZIONE ALL UTENZA: introduzione ai modelli dell ingegneria dei trasporti

Corso di TRASPORTI E TERRITORIO e TEORIA E TECNICA DELLA CIRCOLAZIONE MODELLI MATEMATICI PER I SISTEMI DI INFORMAZIONE ALL UTENZA: introduzione ai modelli dell ingegneria dei trasporti DOCENTI Agostino Nuzzolo (nuzzolo@ing.uniroma2.it) Antonio Comi (comi@ing.uniroma2.it) Pierluigi Coppola (coppola@ing.uniroma2.it) Umberto Crisalli (crisalli@ing.uniroma2.it) 1

Problematiche dell ingegneria dei trasporti Tra l altro, gli ingegneri trasportisti affrontano problemi di progettazione di nuove infrastrutture o di esercizio di quelle esistenti. Esempio 1. Data una rete di trasporto con tre percorsi (A, B e C) tra una origine (O) ed una destinazione (D), se occorre chiudere B (ad esempio per 2 giorni per manutenzione del manto stradale), quali saranno i nuovi flussi su A e B (F A e F B ), e, quindi, il livello di funzionamento di A e B? 2. Data una rete di trasporto con due percorsi (A e B) tra una origine (O) ed una destinazione (D) e realizzando un nuovo percorso C, quale sarà il flusso su C (F C ) e, quindi, il livello di funzionamento di C e di A e B? 2

Esempio Percorso A Origine (O) Percorso B Percorso C d OD = domanda tra O e D = 100 veicoli/ora Caso Esercizio rete esistente Destinazione (D) Prima F A = 38 veicoli/ora F B = 49 veicoli/ora F C = 13 veicoli/ora Dopo F A = 75 veicoli/ora F B = 0 veicoli/ora F C = 25 veicoli/ora Prima F A = 43 veicoli/ora F B = 57 veicoli/ora Caso Progetto rete futura Dopo F A = 38 veicoli/ora F B = 49 veicoli/ora F C = 13 veicoli/ora 3

Modelli matematici Relazioni matematiche che consentono di simulare un fenomeno reale, descrivendo il fenomeno sulla base di dati iniziali noti all analista (variabili di input) e restituendo dei dati finali (variabili di output). y = (x; ) dove: y è il vettore delle variabili di output; x sono le variabili di input; ( ) è la relazione matematica (funzione); è il vettore dei parametri del modello. 4

Modelli matematici Esempio (1/2) Per affrontare le problematiche del tipo dell esempio precedente, siamo interessati a conoscere la relazione tra gli F k ed i tempi di viaggio T k, così da poter determinare gli F k per i diversi scenari di tempo di viaggio di esercizio o di progetto. Sia F k il flusso sul generico percorso k, se d OD è la domanda di utenti sulla relazione OD p[k] è la frazione di utenti che scelgono il percorso k sarà F k = d OD p [k] con k=a, B, C Dunque possiamo anche utilizzare la relazione tra p[k] e gli F k. 5

Modelli matematici Esempio (2/2) Se T k è il tempo di percorrenza del generico percorso k, cerchiamo la relazione tra p[k] e T k : p [k] = (T; ) con p [k] è il vettore delle frazioni di utenti che scelgono il generico percorso k (variabile di output); ( ) è il modello matematico (di scelta discreta); T è il vettore degli attributi (variabili di input) che caratterizzano le alternative (ad esempio, i tempi di viaggio tra O e D lungo ciascun percorso); è il vettore dei parametri del modello. 6

Generalizzazione di un modello Una volta che il modello è stato definito, può essere applicato a scenari futuri (descritti mediante opportuni valori delle variabili di input) per prevedere i valori futuri delle variabili di output. Tale processo è chiamato generalizzazione del modello Un buon modello è di solito il risultato di un processo di trial and error in cui la sua definizione (ciclo di specificazionestima dei parametri-verifica) viene ripetuta più volte fino al raggiungimento di un modello soddisfacente. Queste operazioni, indicate come costruzione del modello, possono essere effettuate a partire da informazioni sul fenomeno reale da ricavarsi con opportuni strumenti (monitoraggio, indagini, etc.). 7

Specificazione (1/5) Specificare un modello significa identificare la struttura matematica (funzione ), ovvero definire la forma funzionale e le variabili dipendenti (variabili di output; y) e indipendenti (variabili di input o esplicative; x) che in esso compaiono. La forma funzionale della funzione matematica è scelta dall analista in base alla trattabilità analitica, ai modelli utilizzati in casi simili e all analisi dei dati che descrivono il fenomeno reale (osservazioni del fenomeno). Per la specificazione del modello si possono seguire 3 approcci: White box Black box Grey Box 8

Specificazione White box. La funzione è derivata da assunzioni teoriche sui fattori che governano il fenomeno. Pertanto, questo approccio è anche conosciuto come approccio deduttivo. Un esempio è dato dai modelli di expected utility, descritti più avanti oppure dai modelli della dinamica: con : s= v. t s= spazio percorso (km), v= velocità media ( km/ora) t= tempo di viaggio (ore). (2/5) Per fenomeni che includono processi di scelta da parte di persone, in genere non si riescono a costruire modelli White Box 9

Specificazione (3/5) Black-box. Questo approccio è anche conosciuto come approccio induttivo, in cui sono registrati dati di input e di output che vengono poi utilizzati per calibrare un generico modello parametrizzato; in questo caso nessuna legge o ipotesi teorica è introdotta per interpretare il passaggio da uno stato all altro. La funzione è derivata pertanto da considerazioni prettamente empiriche sul fenomeno ed parametri spesso non hanno alcun significato fisico. Un esempio sono i modelli di reti neurali. 10

Specificazione (4/5) Grey box. Approccio intermedio che integra le conoscenze provenienti dall esperienza con l evidenza empirica fornita dalle osservazioni sperimentali con assunzioni teoriche di partenza. È l approccio generalmente utilizzato per la simulazione del comportamento di scelta degli utenti, ad esempio i modelli di scelta econometrici quali i Modelli di Utilità Aleatoria, introdotti più avanti. 11

Specificazione (5/5) Dato un numero finito di osservazioni di valori di y e x è possibile definire infinite funzioni che li descrivono. Questa condizione è nota come over fitting. L over-fitting andrebbe evitato perché, sebbene porti ad una ottima riproducibilità delle osservazioni, causa presumibilmente problemi nella generalizzazione del modello, legati alla necessità di prevedere i valori di tutte le variabili di input necessarie. Il modello è tarato perfettamente sul campione. Si è ottenuto un modello molto complesso, fin troppo. Ha bassa capacità di generalizzare. Buone performance sul campione di partenza, ma non su altri campioni. 12

Stima dei parametri (1/2) Una volta che il modello è stato specificato, vanno determinati i parametri della funzione tali che siano riprodotte, nel miglior modo possibile, le osservazioni. Queste appartengono di solito ad un campione casuale rappresentativo e dunque i valori ottenuti sono estimatori statistici dei parametri reali. Siano: m, il numero delle osservazioni disponibili di un campione; x j, la j-esima variabile di input osservata; y j, la j-esima variabile di output osservata; S= (x j, y j ), j=1,.,m il campione delle osservazioni osservabili (data-set). Di solito, si definisce come indicatore della bontà del modello, una funzione di calibrazione scalare ( ;S) che sintetizza come, dato un set di parametri, il modello riproduce le osservazioni del campione S. Più in generale, si può utilizzare una generica funzione che rappresenta la distanza tra le variabili di output e quelle osservate, (*): ( ;S) = j (y j, (x j, ) 13

Stima dei parametri (2/2) I valori dei parametri, corrispondenti al valore di ottimo assunto dalla funzione di calibrazione, sono considerati i valori dei parametri del modello.. Un esempio è l estimatore dei minimi quadrati che definisce i parametri ottimi in corrispondenza del minimo valore assunto dalla somma dei quadrati delle differenze tra i valori delle variabili di output e quelle osservate. Altro esempio di questo approccio è dato dal metodo della Massima Verosimiglianza, che sarà analizzato più avanti 14

Validazione (1/3) Una volta specificato e calibrato, un modello, prima di poter essere generalizzato, va validato. In questa fase si verifica la capacità del modello di riprodurre il fenomeno reale (qualità dell approssimazione) e la stabilità del modello rispetto a piccole variazioni dei dati di calibrazione o delle variabili di input (robustezza). Queste verifiche possono essere condotte attraverso una serie di indicatori, o più propriamente statistiche, utilizzando degli appropriati test di ipotesi effettuati a partire da informazioni relative ad un campione di utenti. 15

Validazione (2/3) Inoltre, nella fase di validazione, è buona pratica utilizzare un altro campione di osservazioni in modo da testare la capacità di generalizzazione del modello ottenuto nel rappresentare questo nuovo campione. Una volta che il modello è stato validato, questo può essere comparato con altri modelli, utilizzando gli stessi indicatori usati nella fase di validazione. La selezione finale, tra tutti i modelli specificati e calibrati, è fatta considerando anche la loro efficienza, la velocità computazionale e le esigenze di memoria. 16

Validazione (3/3) Modello da scegliere Errore nel riprodurre campioni test Errore nel riprodurre il campione usato per la stima Complessità del modello 17