Il valore atteso di una v.a. (discreta)

Documenti analoghi
Statistica descrittiva I. La frequenza

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

Alcune v.a. discrete notevoli

Estrazioni senza restituzione da un urna di composizione incognita. P(E i)=

Statistica ARGOMENTI. Calcolo combinatorio

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

Indici di posizione e dispersione per distribuzioni di variabili aleatorie

Capitolo 5. Variabili casuali discrete

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

Modelli probabilistici variabili casuali

VARIABILI ALEATORIE CONTINUE

P ( X n X > ɛ) = 0. ovvero (se come distanza consideriamo quella euclidea)

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

Variabili casuali multidimensionali

Compiti tematici capp. 5,6

Dispensa di Statistica

1 Alcuni risultati sulle variabili Gaussiane multivariate

X Vincita (in euro) Tabella 1: Vincite

Variabili aleatorie. Variabili aleatorie e variabili statistiche

Modelli descrittivi, statistica e simulazione

Le variabili casuali o aleatorie

DISTRIBUZIONI DI CAMPIONAMENTO

II Appello di Calcolo delle Probabilità Laurea Triennale in Matematica 2016/17

1 Eventi. Operazioni tra eventi. Insiemi ed eventi. Insieme dei casi elementari. Definizione di probabilità.

Indici di Dispersione

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

UNIVERSITÀ di ROMA TOR VERGATA

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

MATEMATICA FINANZIARIA RISCHI: RAPPRESENTAZIONE E GESTIONE (CENNI)

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia

Calcolo delle Probabilità 2

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Statistica. Capitolo 6. Variabili Aleatorie Continue e Distribuzioni di Probabilità. Cap. 6-1

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

L indagine campionaria Lezione 3

Statistica Inferenziale

Indirizzo Giuridico Economico Aziendale

Principi di Statistica a.a

Esercizi su variabili aleatorie discrete

TEST n La funzione di ripartizione di una variabile aleatoria:

Esame di AM2 & EAP (270/04) a.a. 2009/10

ESERCIZI PROBABILITA I

Esercitazione: La distribuzione NORMALE

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

Metodi Matematici Probabilità e Statistica. Correzione Compitino del

4.1 Variabili casuali discrete e continue, e loro distribuzioni

Modelli matematici di fenomeni aleatori Variabilità e casualità

STATISTICHE DESCRITTIVE Parte II

5. Distribuzioni. Corso di Simulazione. Anno accademico 2009/10

ESERCIZI HLAFO ALFIE MIMUN

Statistica Un Esempio

Tipi di variabili. Indici di tendenza centrale e di dispersione

Variabili casuali. - di Massimo Cristallo -

3. Distribuzioni. Corso di Simulazione. Anno accademico 2006/07

Il Corso di Fisica per Scienze Biologiche

Calcolo delle Probabilità

) la sua densità discreta sarà della forma. p X (0) = 1 2, p X(1) = 1 2,

Esercizi su leggi condizionali e aspettazione condizionale

Lezioni da Matematica I Calcolo differenziale, Algebra lineare, Probabilità e statistica G. Aletti & G. Naldi & L. Pareschi

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Distribuzioni di due variabili aleatorie

LEZIONE 3. a + b + 2c + e = 1 b + d + g = 0 3b + f + 3g = 2. a b c d e f g

Matematica Applicata L-A Definizioni e teoremi

Riassumiamo le proprietà dei numeri reali da noi utilizzate nel corso di Geometria.

Elementi di Statistica

Distribuzioni campionarie. Antonello Maruotti

Un monomio è in forma normale se è il prodotto di un solo fattore numerico e di fattori letterali con basi diverse. Tutto quanto sarà detto di

misura. Adesso, ad un arbitrario punto P dello spazio associamo una terna di numeri reali x

SCHEDA DIDATTICA N 7

Elementi di base su modello binomiale e modello normale

distribuzione normale

ELEMENTI DI STATISTICA

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Monomi L insieme dei monomi

Lezione n. 1 (a cura di Irene Tibidò)

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

Teoria dei Giochi. Anna Torre

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Algebra Lineare e Geometria. Il teorema fondamentale dell algebra. 1 Non c è un ordine totale sull insieme dei complessi

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

FENOMENI CASUALI. fenomeni casuali

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

DISTRIBUZIONI DI PROBABILITA

Il metodo delle osservazioni indirette

Esercizi svolti di statistica. Gianpaolo Gabutti

UNIVERSITÀ di ROMA TOR VERGATA

4. Si supponga che il tempo impiegato da una lettera spedita dall Italia per arrivare a destinazione segua una distribuzione normale con media

SESSIONE SUPPLETIVA QUESTIONARIO QUESITO 1

CAPITOLO QUINTO DISTRIBUZIONE NORMALE

Probabilità e Statistica per l Informatica Esercitazione 4

04 - Numeri Complessi

Esercizi Teoria della Probabilità

Teorema del limite centrale TCL

IL TEOREMA DEGLI ZERI Una dimostrazione di Ezio Fornero

Statistica descrittiva in due variabili

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Probabilità. Lezioni : 11, 12. Docente: Alessandra Durio

Transcript:

di una v.a. (discreta) Introduciamo un nuovo concetto. DEFINIZIONE DI VALORE ATTESO DI UNA V.A. DISCRETA Sia X : Ω R una v.a. discreta avente come immagine in R l insieme V. di X è il numero reale E(X) = v V v f X (v). è anche chiamato media, ma cercheremo di evitare questo termine per non confonderlo con la media campionaria della statistica inferenziale, semmai lo chiameremo media teorica. La E sta per expectation.

Valore atteso con V finito Scrivo V = {x 1, x 2,..., x n } (qui V ha n elementi): E(X) = n x i P(X = x i ). i=1 sommo su tutti i valori possibili: il valore moltiplicato per la sua probabilità. Si tratta di una media pesata dei valori, dove il peso di un valore è la sua probabilità. Valori più probabili hanno peso maggiore, valori meno probabili peso inferiore.

Valore atteso con V numerabile Se V numerabile Scrivo V = {x i } i=1 e la sostanza della formula non cambia: X E(X) = x i P(X = x i ). i=1 Unico problema tecnico: questa è una serie, non è detto in generale che converga. Se non converge si dice che X non ha valore atteso. I modelli che vedremo non hanno questo problema.

della vincita Torniamo alla roulette e calcoliamo 9 E(X) = 0 37 + 20 9 10 + 30 37 37 + 50 8 37 + 200 1 37 = 1080 37 29.19 Quindi la vincita attesa è di 29.19e. Peccato che la giocata costi 30e!!! Ecco perché non conviene darsi al gioco (a meno che non siate il casinò!). Il costo della giocata è mediamente maggiore della vincita.

del valore atteso TEOREMA se a, b sono numeri reali, E(aX + b) = ae(x) + b; se X e Y sono due v.a. allora E(X + Y) = E(X) + E(Y). NOTA BENE In generale E(X) non è il valore più probabile!

Un esempio Supponiamo di avere un piccolo paese in cui le case sono disposte su un unica strada e X sia la variabile distanza fra la residenza di un abitante e il cartello di inizio paese. X è aleatoria nel senso che preso un abitante a caso (nello spazio Ω = abitanti) la distanza è funzione dell abitante scelto. Rappresentiamo sull asse delle x le distanze in metri e i 40 abitanti siano pallini sopra la posizione della loro casa. Grafici di frequenza Di fatto se ai pallini sostituissimo delle barre verticali avremmo di un grafico di frequenza assoluta (frequenza assoluta di un valore = numero di volte che tale valore è presente).

Il grafico 14 10 8 5 3 2 1 100 200 300 400 500 600 700 800 900 1000 V = {100, 200, 400, 500, 600, 700, 900, 1000}

La frequenza relativa Rappresentiamo la frequenza relativa (= frequenza assoluta diviso numero totale) di ogni distanza. In pratica riscaliamo solo l asse delle y. 8/40 5/40 2/40 1/40 100 200 300 400 500 600 700 800 900 1000 In questo caso la frequenza relativa coincide con la densità: f X (100) = 1, f 40 X(200) = 2, f 40 X(400) = 2, f 40 X(500) = 6, f 40 X(600) = 7, 40 f X (700) = 8, f 40 X(800) = 9, f 40 X(900) = 1, f 40 X(1000) = 4. 40

Valore atteso = centro Nota In questo caso la densità non è approssimata, bensì esatta: stiamo infatti considerando tutta la popolazione. Il centro geografico (pensando che il cartello di uscita paese sia a 1100m da quello di ingresso) è a 550m dall ingresso paese, ma E(X) = 655m rappresenta il centro democratico, nel senso che è la media delle distanze pesando maggiormente le distanze più rappresentate (= con più persone).

Un altro paese 14 10 8 5 3 2 1 100 200 300 400 500 600 700 800 900 1000 Qui E(X) = 645m ma il paese sembra meno disperso. Confrontiamo i due paesi.

Confronto 100 200 300 400 500 600 700 800 900 1000 100 200 300 400 500 600 700 800 900 1000 Differenze Anche se i valori più estremi sono gli stessi (100 e 1000), il secondo è meno disperso. Inoltre sembrerebbe che se scegliamo un abitante a caso nel secondo paese c è minor incertezza sull esito (è assai probabile che pescheremo un abitante alla distanza 600 o 700). Vogliamo definire un numero che misuri la dispersione (o incertezza) di una v.a.

La di una v.a. DEFINIZIONE DI VARIANZA DI UNA V.A. Data una variabile aleatoria X la sua è il numero reale: Var(X) = E ( (X E(X)) 2). La radice Var(X) è detta deviazione standard o anche scarto quadratico medio. Var(X) sarà grande per le X più sparse sui valori possibili e piccola per X meno sparse.

Significato della formula Ricordiamo che E davanti a una v.a. indica il valore atteso o media pesata dei valori possibili di tale v.a. Var(X) = E ( (X E(X)) 2). considero la variabile distanza fra X e E(X), il quadrato di tale distanza e infine della variabile quadrato di X E(X) prendo il valore atteso

La dei due paesi 100 200 300 400 500 600 700 800 900 1000 100 200 300 400 500 600 700 800 900 1000 Il primo paese ha Var(X) = 43975m 2, il secondo Var(X) = 21975m 2.

Calcoliamo per il primo paese: V = {100, 200, 400, 500, 600, 700, 900, 1000} Il calcolo f X (100) = 1, f 40 X(200) = 2, f 40 X(400) = 2, f 40 X(500) = 6, f 40 X(600) = 7, 40 f X (700) = 8, f 40 X(800) = 9, f 40 X(900) = 1, f 40 X(1000) = 4. 40 E(X) = 100 1 + 200 2 + + 1000 4 = 655. 40 40 40 La variabile (X E(X)) 2 assume valori in {(100 655) 2,(200 655) 2,(400 655) 2, (500 655) 2,(600 655) 2,(700 655) 2,(900 655) 2,(1000 655) 2 }, rispettivamente con probabilità 1 40, 2 40, etc. Quindi Var(X) = E`(X E(X)) 2 = (100 655) 2 1 40 + (200 655)2 2 40 + + (1000 655)2 4 40 = 43975.

TEOREMA 1 Var(X) è sempre un numero 0; 2 Var(X) = 0 se e solo se X è una v.a. costante ; 3 Var(X) = E(X 2 ) (E(X)) 2 ; 4 se a, b sono numeri reali, Var(aX + b) = a 2 Var(X); 5 se X e Y sono due v.a. allora Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y). cioè una variabile che può assumere un solo valore. con Cov(X, Y) indichiamo la co di X e Y e cioè il numero Cov(X, Y) = E(XY) E(X)E(Y). Si dice che E(X) è un indice di posizione, Var(X) è un indice di dispersione.

L uguaglianza Usiamo la (3) Var(X) = E(X 2 ) (E(X)) 2 è utile per il calcolo: vediamo l esempio del primo paese. Sappiamo che E(X) = 655m. Calcoliamo il valore atteso della v.a. X 2 : assume i valori {100 2, 200 2, 400 2, 500 2, 600 2, 700 2, 900 2, 1000 2 }, rispettivamente con probabilità 1 40, 2 40, etc. Allora E(X 2 ) = 100 2 1 40 + 2002 2 40 + + 10002 4 40 m2. Per ottenere la a questo numero sottrarremo 655 2 m 2.

La formula (3) Per ricordare Var(X) = E(X 2 ) (E(X)) 2 Ci sono due operazioni: il quadrato e il valore atteso. Nel primo pezzo si fa prima il quadrato di X e poi il valore atteso, nel secondo prima il valore atteso e poi il quadrato. Perché è comoda Si evitano le sottrazioni (valore possibile - E(X)) (che sono tante quante i valori possibili) e se ne fa una sola. Nell esempio Si evitano le sottrazioni 100 655, 200 655, etc.

Dimostrazione Dimostrazione delle proprietà 1 Segue dal fatto che Var(X) è il valore atteso di una v.a. che assume solo valori 0. 2 Se X = c con probabilità 1, E(X) = c e Var(X) = E((c c) 2 ) = 0. Viceversa se Var(X) = 0 deve essere X = E(X) ma allora X è costante. 3 E (X E(X)) 2 = = E X 2 2X E(X) + (E(X)) 2 = E(X 2 ) E(2X E(X)) + E (E(X)) 2 = E(X 2 ) 2E(X) E(X) + (E(X)) 2 = E(X 2 ) (E(X)) 2. 4 Var(aX + b) = E((aX + b) 2 ) (E(aX + b)) 2 = E(a 2 X 2 + b 2 + 2abX) (ae(x) + b) 2 = a 2 E(X 2 ) + 2abE(X) + b 2 a 2 (E(X)) 2 b 2 2abE(X) = a 2 Var(X).

Dimostrazione delle proprietà Dimostrazione 5 Var(X + Y) = E((X + Y) 2 ) (E(X + Y)) 2 = E(X 2 + Y 2 + 2XY) (E(X) + E(Y)) 2 = E(X 2 ) + E(Y 2 ) + 2E(XY) (E(X)) 2 2E(X)E(Y) (E(Y)) 2 = Var(X) + Var(Y) + 2Cov(X, Y).

Un commento su (4) Var(aX + b) = a 2 Var(X) non deve stupire: se V è l insieme dei valori possibili di X, l insieme dei valori possibili della v.a. Y dove Y = ax + b non è altro che il risultato di una dilatazione (per a) di V, seguita da una traslazione di b. Vediamo un esempio: sia V = { 2, 0, 1, 3} con f X ( 2) = 0.2, f X (0) = 0.3, f X (1) = 0.1, f X (3) = 0.4, e Y = 3X + 2.

Le densità: Y = 3X + 2 X 4 3 2 0 1 2 3 5 11 3X+2 4 3 2 0 1 2 3 5 11 La traslazione di 2 non ha effetto sulla mentre la dilatazione (per 3) sì.

Multipli negativi NOTA BENE Se a è negativo, comunque la non sarà MAI negativa!!! Ad esempio: Var( X) = Var(X) Var( 3X) = 9Var(X) Var( 2X + 12) = 4Var(X).