Ifereza Statistica L ifereza statistica cerca di risalire al modello del feomeo sulla base delle osservazioi No coosciamo il modello del feomeo cioè la vc X A volte la coosceza può essere parziale (coosciamo la forma ma o i parametri) Sulla base di osservazioi x 1, x,, x vogliamo risalire al modello, cioè alla coosceza di X Ipotesi fodametale: le osservazioi x 1, x,, x soo le realizzazioi di vc X 1, X,, X idipedeti e ideticamete distribuite come X (iid) Esempio: suppoiamo che la resisteza alla compressioe di tipo di calcestruzzo sia ua vc X gaussiaa co media icogita µ e variaza σ = 4 Scriveremo X N(µ, σ ) Suppoiamo di osservare la resisteza alla compressioe su campioi di quel tipo di calcestruzzo Idichiamo co x 1, x,, x i valori osservati Sulla base di questi valori vogliamo risalire al valore icogito di µ Abbiamo varie possibilità: 1
1 Stima putuale Stima per itervalli 3 Verifiche di ipotesi Stima Putuale I parametri che ci iteressa stimare (soo icogiti) soo media e variaza Presetiamo gli stimatori della media icogita e della variaza icogita otteuti come mometi campioari Lo stimatore è ua fuzioe che ci forisce il valore da stimare i fuzioe del campioe osservato Nella parte di statistica ifereziale avremo a che fare co vc otteute come fuzioi di vc ote Per gli stimatori della media e della variaza icogiti calcoleremo i valori di sitesi più importati: media e variaza!
Variabile casuale media campioaria Abbiamo u modello X di cui o coosciamo la media E(X) = µ µ è l icogita da stimare Siao x 1, x,, x le osservazioi di X Deotiamo co X 1, X,, X u campioe iid di cui x 1, x,, x soo la realizzazioe La media campioaria è defiita come X = 1 X i Stimeremo quidi il valore icogito µ co ˆµ = 1 x i Proprietà della media campioaria Se E(X i ) = µ e Var(X i ) = σ allora Ifatti E( X ) = 1 E Var( X )= 1 Var E( X ) = µ e Var( X ) = σ X i X i = 1 E(X i ) = 1 µ = µ = 1 Var(X i )= σ = σ 3
Esempio: cosideriamo la variabile casuale X avete distribuzioe x i 1 3 p i 1/3 1/3 1/3 Abbiamo: E(X) = µ = e Var(X) = σ = /3 Estraiamo u campioe di umerosità co riposizioe I campioi possibili soo (1, 1); (1, ); (1, 3); (, 1); (, ); (, 3); (3, 1); (3, ); (3, 3) Cosideriamo la vc X La sua distribuzioe è x i 1 15 5 3 p i 1/9 /9 3/9 /9 1/9 E( X ) = = µ, e Var( X ) = 1/3 = σ / Esempio: u laboratorio produce molle per orologi co due macchie diverse deotate co A e B La seguete tabella riporta i dati delle resisteze delle molle prodotte dalle due macchie A 5 4 5 5 7 6 6 6 3 5 B 3 4 3 6 4 5 4 4 Stimare la media icogita delle resisteza delle molle prodotte dalle due macchie 4
Deotiamo co X A e X B rispettivamete i modelli per la resisteza delle molle prodotte rispettivamete dalla macchia A e dalla macchia B La media E(X A ) = µ A e E(X B ) = µ B soo icogite Le stimiamo rispettivamete co la media campioaria calcolata per i due gruppi: µ ˆ A = 1 1 µ ˆ B = 1 x A i = 96 1 = 467 9 x B i = 389 Queste soo le stime putuali per la media icogita delle popolazioi cosiderate Si faccia attezioe tra: 1 la media icogita µ la media campioaria stimatore 1 Xi 3 la media stimata 1 xi 4 la media dello stimatore E( 1 Xi ) 5
Variabile casuale variaza campioaria Suppoiamo ora che del modello X sia icogita la variaza σ Se, come prima, X 1, X,, X è u campioe iid allora la variaza campioaria è defiita come S = 1 1 (X i X ) Stimeremo il valore icogito σ co ˆσ = s = 1 1 (x i x ) Si verifica che E(S ) = σ, Var(S) = 1 ( µ 4 3 ) 1 σ4 Riprediamo l esempio e calcoliamo la distribuzioe di S campioe x i s i 1 1 1 0 1 15 05 1 3 1 15 05 0 3 5 05 3 1 3 5 05 3 3 3 0 6
La distribuzioe è Da cui E(S ) = /3 = σ s i 0 05 p i 3/9 4/9 /9 Esempio: (cotiua) stimare la variaza icogita per la variaza della resisteza delle molle prodotte dalle due macchie A e B σˆ A = 1 1 ( x Ai ( x A) ) = 1 11 (7330 1(467) ) = 61 σˆ B = 1 1 ( x Bi ( x B) ) = 1 8 (5147 9(389) ) = 136 Si oti che le due stime otteute soo diverse dalla variaza che era stata calcolata precedetemete σa = 1 x i i ( x A ) = 1 1 7330 (467) = 39 Facedo i coti aaloghi per il gruppo B si trova σb = 11 Le stime otteute si chiamao o distorte i quato il valore atteso degli stimatori è uguale al parametro da stimare 7
Casi particolari importati Fio ad ora o abbiamo fatto essua ipotesi sulla distribuzioe del modello X Abbiamo solo supposto che la media e la variaza fossero icogite Suppoiamo ora che X sia u modello gaussiao Se X N(µ, σ ) si ha che ache la media campioaria è gaussiaa X N ( µ, σ Suppoiamo ora che X sia u modello beroulliao ) Se X Ber(p) si ha che p(1 p) E( X ) = E(ˆp ) = p e Var(ˆp ) = La distribuzioe di ˆp è la seguete ( P ˆp = k ) = ( ) p k (1 p) k, k = 0, 1,, k Lo stimatore ˆp è detto proporzioe campioaria ed è otteuto come media di variabili che possoo solo assumere valore 0 o 1 8
Osservazioe Quado diciamo che la media stimata è u certo valore è meglio dare ache l errore stadard, i modo da avere u idea della variabilità di tale stima Esempio: sulla base di u campioe, la percetuale di prefereze al partito A è ˆp = 505% Possiamo cocludere che A ha vito le elezioi? Quello che ci maca è la precisioe del dato 505% Sappiamo che Var(ˆp ) = p(1 p)/ Possiamo otteere ua stima della variaza di ˆp sostituedo al valore icogito p il valore ˆp Vediamo cosa accade per pari a 100 o a 1000 ˆp (1 ˆp ) 0505 0495 = = 005 = 5% 100 ˆp (1 ˆp ) 0505 0495 = = 00158 = 16% 1000 Cosideriamo l itervallo ˆp ± e ˆp (1 ˆp ) (505% 5%, 505% + 5%) = (455%, 555%) (505% + 16%, 505% 16%) = (489%, 51%) 9
Gli itervalli di cofideza Gli itervalli di cofideza per la media foriscoo u campo di variazioe (cetrato sulla media campioaria) all itero del quale ci si aspetta di trovare il parametro icogito µ Ad ogi itervallo di cofideza viee associato u livello di cofideza (1 ) che rappreseta il grado di attedibilità del ostro itervallo Il ostro scopo è quello di determiare u itervallo di valori (a, b) che cotega il valore icogito µ Vorremmo poter scrivere P (a < µ < b) = 1 Ma questa scrittura è priva di seso!!!!! Ifatti µ è u umero Chiariamo come uscire dall ighippo co u esempio fodametale 10
Se X 1, X,, X è u campioe iid di variabili casuali Gaussiae di media icogita µ e variaza σ, sappiamo che la media campioaria X è ua variabile aleatoria Gaussiaa di media µ e variaza σ / Possiamo quidi scrivere la relazioe sopra come P a < X µ σ che corrispode a scrivere co Z N(0, 1) < b = 1 P (a < Z < b) = 1 Possiamo scegliere a e b come P z < X µ σ < z 1 Basta ifatti osservare il disego = 1 11
1 z 0 z 1 Ricordado che z l espressioe P = z 1, possiamo riscrivere z 1 < X µ σ < z 1 = 1 Svolgiamo ora i calcoli ecessari per arrivare ad u itervallo i termii della media icogita µ 1
Abbiamo P z 1 < X µ σ < z 1 = P = P = P = P ( ( ( ( z 1 z 1 z 1 ) σ σ < X µ < z 1 ) σ σ X < µ < z 1 X σ + X > µ > z 1 X z 1 σ < µ < X + z 1 ) σ + X ) σ Osservazioe: la probabilità o è riferita a µ, che è ua costate, ma a X che è ua vc I sostaza potremmo scrivere che ( ) σ µ X ± z 1 e siamo fiduciosi che questo accada ell (1 )% dei casi, cioè ell (1 )% dei campioi estratti L itervallo di cofideza è u itervallo i cui estremi soo aleatori 13
1 X 3 X X µ 4 X X 5 Il livello di cofideza può essere visto come la frequeza di questi itervalli aleatori che cotegoo il valore icogito µ Alcui itervalli (cerchi) o cotegoo il valore µ (gli itervalli 1, e 5) altri ivece lo cotegoo (gli itervalli 3 e 4) Si può iterpretare il livello di cofideza 1 come la frequeza degli itervalli che cotegoo il valore icogito µ Ecco perché è scorretto parlare del livello di cofideza come della probabilità che il ostro parametro sia coteuto ell itervallo 14
Esempio: cosideriamo u campioe di ampiezza = 7 proveiete da ua popolazioe Normale co media µ icogita e variaza ota σ = 44 Determiare l itervallo di cofideza a livello 1 = 095 Sappiamo che Z = X µ σ = X µ 44/7 Ioltre dalle tavole della Z ricaviamo = N(0, 1) P (Z < 196) = P (Z > 196) = = 005 Abbiamo P z 1 < X µ σ < z 1 = P = P 196 < X µ 44 7 < 196 44 44 X 196 7 < µ < X + 196 7 = P ( X 5 < µ < X + 5) = 095 15
Possiamo dire che co u grado di fiducia pari a 095 (95%) riteiamo che l itervallo ( X 5, X + 5) cotega la suo itero il valore icogito µ A questo puto etrao i gioco le osservazioi!! Se abbiamo rilevato x = 1745, l itervallo di cofideza risulta (17, 177) È ragioevole pesare che la media icogita µ sia compresa ell itervallo (17, 177) el 95% dei casi È sbagliato affermare che la probabilità che µ sia ell itervallo (17, 177) è 095, perché µ o è ua variabile casuale Riassumedo: Itervallo di cofideza per la media (σ ota) el caso di popolazioe Gaussiaa Sia X ua vc Gaussiaa di media µ e variaza σ Se X 1, X,, X è u campioe iid estratto da X allora l itervallo di cofideza per µ di livello 1 si scrive ella seguete forma ( ) σ µ X ± z 1 Lo stesso risultato vale se X è qualuque purché l ampiezza del campioe sia sufficietemete elevata 16