Introduzione Metodo POT



Documenti analoghi
11) convenzioni sulla rappresentazione grafica delle soluzioni

x ( 3) + Inoltre (essendo il grado del numeratore maggiore del grado del denominatore, d ancora dallo studio del segno),


DI IDROLOGIA TECNICA PARTE III

Politecnico di Torino. Esercitazioni di Protezione idraulica del territorio

Gas perfetti e sue variabili

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Esercitazione 5 Soluzioni

Anno 4 Grafico di funzione

Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in

Anno 3. Funzioni: dominio, codominio e campo di esistenza

La Funzione Caratteristica di una Variabile Aleatoria

Perché il logaritmo è così importante?

Affidabilità nel tempo tasso di guasto. h( t) =! dt N dt N ( ) ( ) = =! N N

Reliability Demonstration Tests Distribuzione di Weibull

3 GRAFICI DI FUNZIONI

Funzione reale di variabile reale

Regressione Mario Guarracino Data Mining a.a. 2010/2011

STUDIO DEL SEGNO DI UNA FUNZIONE

G3. Asintoti e continuità

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

V= R*I. LEGGE DI OHM Dopo aver illustrato le principali grandezze elettriche è necessario analizzare i legami che vi sono tra di loro.

Regressione Logistica: un Modello per Variabili Risposta Categoriali

La distribuzione Normale. La distribuzione Normale

La distribuzione Gaussiana

Corso di Automazione Industriale 1. Capitolo 4

Basi di matematica per il corso di micro

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

~ Copyright Ripetizionando - All rights reserved ~ STUDIO DI FUNZIONE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

0 < a < 1 a > 1. In entrambi i casi la funzione y = log a (x) si può studiare per punti e constatare che essa presenta i seguenti andamenti y

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

1. PRIME PROPRIETÀ 2

1. Distribuzioni campionarie

Analisi di scenario File Nr. 10

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Metodi statistici per le ricerche di mercato

La funzione è continua nel suo dominio perchè y = f(x) è composizione di funzioni continue. Il punto x = 0 è un punto isolato per D f.

Indici di dispersione

11. Analisi statistica degli eventi idrologici estremi

Slide Cerbara parte1 5. Le distribuzioni teoriche

Richiami: funzione di trasferimento e risposta al gradino

Misurare il rischio finanziario con l Extreme Value Theory

Anno 5 4 Funzioni reali. elementari

Il valore assoluto. F. Battelli Università Politecnica delle Marche, Ancona. Pesaro, Precorso di Analisi 1, Settembre 2005 p.

Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto

f(x) = x3 2x 2x 2 4x x 2 x 3 2x 2x 2 4x =, lim lim 2x 2 4x = +. lim Per ricavare gli asintoti obliqui, essendo lim

FUNZIONI REALI DI VARIABILE REALE e CONTINUITA Roberto Argiolas

Lezione n. 2 (a cura di Chiara Rossi)

C) DIAGRAMMA A SETTORI

Statistica inferenziale

Le misure dell accrescimento demografico

Funzioni e loro grafici

Esercizi riassuntivi di probabilità

Massimi e minimi vincolati

Statistical Process Control

Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

FREQUENZA TEORICA E FREQUENZA PERCENTUALE Lezione n. 13

La metodologia di determinazione dei Margini Futures Straddle

SOLUZIONE DEL PROBLEMA 1 TEMA DI MATEMATICA ESAME DI STATO 2015

CONTINUITÀ E DERIVABILITÀ Esercizi risolti

Introduzione. Coesis Research Analisi discriminante

Approssimazione polinomiale di funzioni e dati

2. Leggi finanziarie di capitalizzazione

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Prova di autovalutazione Prof. Roberta Siciliano

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

Consideriamo due polinomi

Esercizi sugli integrali impropri

Statistical Process Control

Probabilità discreta

CONTINUITÀ E DERIVABILITÀ Esercizi proposti. 1. Determinare lim M(sinx) (M(t) denota la mantissa di t)

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA Paolo Brunori

Studio di una funzione. Schema esemplificativo

Certificati di investimento e strategie di yield enchancement

Matematica e Statistica

La Distribuzione Normale (Curva di Gauss)

Appunti e generalità sulle funzioni reali di variabili reali.

ELABORAZIONE DI DATI TRIDIMENSIONALI - RELAZIONE HOMEWORK 2

Vademecum studio funzione

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Corso di. Dott.ssa Donatella Cocca

Matematica generale CTF

IL CONCETTO DI FUNZIONE

Serie numeriche e serie di potenze

Determinare il dominio e la derivata delle seguenti funzioni e studiarne la monotonia ed eventuali massimi/minimi. ( ) x + 2.

Nel seguito sono riportati due esercizi che si possono risolvere con la formula di Erlang e le relative risoluzioni.

Analisi Mat. 1 - Ing. Inform. - Soluzioni del compito del

REGOLAMENTO (UE) N. 1235/2011 DELLA COMMISSIONE

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Sviluppi di Taylor Esercizi risolti

Plate Locator Riconoscimento Automatico di Targhe

In base alla definizione di limite, la definizione di continuità può essere data come segue:

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile

Ricerca Operativa Esercizi sul metodo del simplesso. Luigi De Giovanni, Laura Brentegani

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.

Transcript:

Introduzione Metodo POT 1 Un recente metodo di analisi dei valori estremi è un metodo detto POT ( Peak over thresholds ), inizialmente sviluppato per l analisi dei dati idrogeologici a partire dalla seconda metà degli anni 70, ha trovato in anni recenti una sempre maggiore applicazione. L idea fondamentale alla base di questo metodo è l analisi degli estremi di una grandezza X sulla base delle eccedenze. Dato un insieme di dati x 1, x 2..x n, si definiscono come eccedenze y j quei valori xi maggiori di un valore di soglia u. Le quantità (y j -u) sono detti gli eccessi sopra u.

Introduzione metodo POT 2 raccogliere solo le eccedenze risulta vantaggioso (es. stazioni metereologiche) L accadimento di una eccedenza è condizionato dall evento che l osservazione sia maggiore di u. Tale probabilità condizionata, detta F la probabilità cumulata della variabile X, risulta: [ ] F( x) F( u) F u ( x) = 1 F( u)

Distribuzione Pareto generalizzata 3 Le distribuzioni generalizzate dei valori estremi sono correlate ad una distribuzione detta distribuzione di Pareto generalizzata avente probabilità cumulata: W ( x) 1" (1 + = # x) " 1/ definita per x>0 se γ>0 e per 0<x< 1/ se γ<0 Per γ 0 la distribuzione tende all espressione: W 0 ( x) = 1 e x Il legame tra la distribuzione di Pareto e la distribuzione generalizzata dei massimi è la seguente: W ( x) = 1+ logg( x)

Distribuzione Pareto generalizzata 4 Come già visto per la G, possiamo introdurre due parametri µ e σ : W $ $ x # µ %%,, ( x) = 1# ' 1+ & ' ( " ( ) ) ** µ " # 1/ Una interessante proprietà della distribuzione di Pareto è la seguente: [ u] W, µ," ( x) = W, u, " + $ u # ( µ ) ovvero la distribuzione delle eccedenze è ancora una Pareto con il parametro γ, con µ=u e con una parametro di scala espresso da: ( u ) + " # $ µ

Distribuzione Pareto generalizzata 5 La distribuzione delle eccedenze ha proprietà asintotiche simili a quelle delle distribuzioni dei valori estremi. In particolare considerando ipotesi sulla F(x) simili a quelle dei valori estremi: F [ u] (, x) " W$, u # ( x) 0 per u ω(x), dove con ω(x) si indica l estremo superiore della grandezza x. Sulla base della relazione soprascritta è possibile cercare di analizzare le eccedenze di dati provenienti da una qualsiasi distribuzione mediante la Pareto generalizzata. Dati quindi : x 1, x 2, x 3..x n y 1,y 2, y 3 y k dati originali raccolti in un tempo Γ eccedenze sopra una soglia u si analizzano le eccedenze mediante una distribuzione W γ,u,σ, ricavando i parametri γ e σ mediante metodo ML.

Fittaggio parametri distribuzione Pareto 6 I parametri della distribuzione di Pareto si cercano mediante metodo ML. In particolare la log-verosimiglianza: per γ 0 diventa: ed in particolare la stima di σ risulta:

Applicazione POT - a 7 Cosa ce ne facciamo della W γ,u,σ per stimare degli eventi estremi? 1 possibilità Conoscendo k ed n, possiamo stimare che: F( x) # F( u) F x W 1 # F( u) [ u ] ( ) = $, u, ( ) 1" k F u " n ( ) ( ) ( ) ( 1 ) y, u, F x " F u + # F u $ W per x u A questo punto disponiamo di una stima della F(x) con cui ad esempio stimare il valore massimo di x su un intervallo 10 Γ massimo caratteristico su 10 n (evento con T=10 n) F max,10 ( ) 10 = " $ F x # % n

Applicazione POT - b 8 La strada vista prima presuppone di sapere che il numero di estrazioni in Γ è pari ad n. Possiamo anche sapere solo di avere k eccedenze. 2 possibilità Disponiamo della stima della distribuzione tronca: [ u ] ( )#, u, F x W " l evento massimo rilevato su Γ è il massimo di k eccedenze; l evento massimo ha quindi T u = k; y cl # 1 $ 1 % = W, u, " & 1# ' ( k ) Fmax,10 W, u, " # = $ & % ' 10k

Applicazione POT - c 9 3 possibilità Cerchiamo una distribuzione: W, µ, " Tale che: [ u] # $ W, µ," = W, u, " % $& W, µ," ( u) = FX ( u)

10 Applicazione POT - c Per l esponenziale negativa (γ =0): ln k u n µ = " # $ % & = + ' ( ) # * +, Per γ 0 : " # $ % % & ' ( ( ) * % & ' ( ) * +, + = % & ' ( ) *, = -. µ.. - - / 1 n k u n k

Diagnostica - mean excess plot 11 in linea teorica y' = y u " # 1 # esempio inclusioni praticamente non si ha mai un adamento così semplice e si identificano delle zone (prima della zona finale) in cui identificare l andamento

Legame tra POT e LEVD - a 12 Supponiamo di aver analizzato k eccedenze su un periodo di acquisizione Γ # W 0,u, = 1" exp " y " u & $ % ' ( Se cerchiamo il valore massimo caratteristico su Γ ha periodo di ritorno T=k e risulta: y( T = k) = u + " log( k) Se cerchiamo il valore massimo caratteristico su 10Γ ha periodo di ritorno T=10k e risulta: y( T = 10k) = u + " log( 10 " k) che diventa: y( T = 10k) = y T = k + " log(10) Dobbiamo ricordarci che il massimo caratteristico ha una probabilità di superamento del 63.2%

Legame tra POT e LEVD -b 13 Se avessimo dato la descrizione dell evento massimo su 10Γ attraverso la LEVD, avremmo potuto stimarlo dal massimo caratteristico su Γ (ovvero il λ Γ dei massimi su Γ) come: 10"# = # + $ " log(10) E evidente l analogia tra le due formulazioni. Ne segue che i massimi su Γ appartengono ad una LEVD con parametri: ( ) & " = u + # $ log k ' (% = #