Inferenza Statistica. L inferenza statistica cerca di risalire al modello del fenomeno sulla base delle osservazioni.

Documenti analoghi
Stime puntuali. Statistica e biometria. D. Bertacchi. Stime puntuali. Intervalli di confidenza. Approfondiamo

Argomenti. Stima Puntuale e per Intervallo. Inferenza. Stima. Leonardo Grilli. Università di Firenze Corso di Laurea in Statistica Statistica

Matematica con elementi di Informatica

Campionamento casuale da popolazione finita (caso senza reinserimento )

Popolazione e Campione

Intervalli di confidenza

Popolazione e Campione

Stima della media di una variabile X definita su una popolazione finita

Argomenti trattati: Stima puntuale e stimatore Proprietà degli stimatori Stima puntuale della media della

Appunti di STATISTICA

Metodi statistici per lo studio dei fenomeni biologici

STATISTICA INFERENZIALE

Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!)

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD e 4038) 15 gennaio 2003

Statistica Inferenziale Soluzioni 1. Stima puntuale

Distribuzione normale

Sommario. Facoltà di Economia. Campionamento e inferenza statistica

II Esonero - Testo A

STATISTICA A K (63 ore) Marco Riani

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

Statistica. Lezione 5

Probabilità e Statistica Laurea Triennale in Matematica 17/06/2014 Soluzioni traccia B

L INTERVALLO DI CONFIDENZA

Intervalli di Fiducia

Esercitazioni del Corso di Probabilitá e Statistica Lezione 6: Stime di parametri puntuali e per intervalli

L INTERVALLO DI CONFIDENZA

Una funzione delle osservazioni campionarie è una statistica che, nel contesto della stima di un parametro, viene definita stimatore.

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Senza reimmissione. Le n v.a. non sono più indipendenti e identicamante distribuite. Campionamento da universo

Stimatori, stima puntuale e intervalli di confidenza Statistica L-33 prof. Pellegrini

Corso di Statistica Facoltà di Economia

Esercitazioni di Statistica

ESERCITAZIONE N. 6 corso di statistica

Titolo della lezione. Dal campione alla popolazione: stima puntuale e per intervalli

Lezione 15. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 15. A. Iodice

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità D

Campionamento e distribuzioni campionarie

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità B - Soluzione

Esercizi di econometria: serie 2

La stima per intervalli

Lezione 14. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 14. A. Iodice. disuguaglianza di Markov

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a

Titolo della lezione. Campionamento e Distribuzioni Campionarie

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA

n=400 X= Km; s cor =9000 Km Livello di confidenza (1-α)=0,95 z(0,05)=1,96

Quesito 1. I seguenti dati si riferiscono ai tempi di reazione motori a uno stimolo luminoso, espressi in decimi di secondo, di un gruppo di piloti:

Inferenza statistica. Popolazione. Camp. Statistiche campionarie basate sulle osservazioni del campione. Estrazione casuale. Parametro e statistica

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità C

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità A - Soluzioni

Statistica I - A.A

Corso di Statistica Canale E Bini, Cutillo A.A. 2017/2018. Esercitazione di riepilogo n.8 Test di ipotesi Soluzioni

Stimatori corretti, stimatori efficaci e disuguaglianza di Cramer Rao

Probabilità e Statistica

Tecnica delle misurazioni applicate LM - Esame del 26 febbraio 2013

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Esperimentazioni di Fisica 1. Prova scritta del 1 febbraio 2016 SOLUZIONI

Qualunque processo che generi risultati eventi che non sono generalizzabili con certezza

Soluzioni quarta esercitazione

Metodi di valutazione delle prestazioni di rete

Distribuzione normale o gaussiana

1 Famiglia delle densità gamma

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 6

1 Esercizi tutorato 27/5

Prova d esame di Calcolo delle Probabilità 02/07/2011

Campionamento e Statistiche Campionarie. Inferenza. Pietro Coretto Università degli Studi di Salerno

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità B - soluzione

IL CAMPIONAMENTO. POPOLAZIONE un insieme finito o infinito di unità statistiche

STATISTICA INFERENZIALE - SCHEDA N. 1 CAMPIONAMENTO E STIMA

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità A - soluzione

APPROSSIMAZIONE NORMALE. 1. Si tirano 300 dadi non truccati. Sia X la somma dei punteggi. Calcolare approssimativamente le probabilità seguenti.

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2009/10

Formulario (versione del 3/10/2015)

6. Intervalli di confidenza

7. Test d ipotesi. 2. L ipotesi è vera ma in base ai dati la rifiuto in questo caso si dice che si commette errore di prima specie

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2013

Esercizi settimana 10

Scrivere su ogni foglio NOME e COGNOME. Le risposte devono essere giustificate sui fogli protocollo e riportate nel foglio RISPOSTE.

Prendere decisioni per un campione singolo

Legge Gamma e Legge Chi quadro

Seconda Prova Intermedia 28 Maggio 2019 Elementi di Probabilità e Statistica, Laurea Triennale in Matematica, M. Romito, M.

Argomenti trattati: Capitolo 12 libro di testo. Statistica - Metodologie per le scienze economiche e sociali A. Di Ciaccio, S.

Probabilità II. Concetto di variabile casuale. Variabile casuale: definizione. Concetto di variabile casuale. Cos'è una variabile casuale?

STATISTICA 1- parte 1/2

Proprietà asintotiche stimatori OLS e statistiche collegate

di solito vengono effettuate molte misure indipendenti della stessa grandezza, fino a collezionare un numeroso campione di misure

Università degli Studi di Napoli Parthenope. STATISTICA per il Turismo

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1

4. Proprietà degli stimatori

Università degli Studi di Salerno Pietro Coretto. Corso di Statistica FORMULARIO

Lezioni del Corso di Fondamenti di Metrologia Meccanica

INFERENZA o STATISTICA INFERENTE

Corso di Statistica. Stima. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.

Inferenza statistica. Come descrivo una generica popolazione? Che tipo di di informazioni posso ottenere?

Corso di Laurea Triennale in Matematica Calcolo delle Probabilità I (docenti G. Nappo, F. Spizzichino)

Transcript:

Ifereza Statistica L ifereza statistica cerca di risalire al modello del feomeo sulla base delle osservazioi No coosciamo il modello del feomeo cioè la vc X A volte la coosceza può essere parziale (coosciamo la forma ma o i parametri) Sulla base di osservazioi x 1, x,, x vogliamo risalire al modello, cioè alla coosceza di X Ipotesi fodametale: le osservazioi x 1, x,, x soo le realizzazioi di vc X 1, X,, X idipedeti e ideticamete distribuite come X (iid) Esempio: suppoiamo che la resisteza alla compressioe di tipo di calcestruzzo sia ua vc X gaussiaa co media icogita µ e variaza σ = 4 Scriveremo X N(µ, σ ) Suppoiamo di osservare la resisteza alla compressioe su campioi di quel tipo di calcestruzzo Idichiamo co x 1, x,, x i valori osservati Sulla base di questi valori vogliamo risalire al valore icogito di µ Abbiamo varie possibilità: 1

1 Stima putuale Stima per itervalli 3 Verifiche di ipotesi Stima Putuale I parametri che ci iteressa stimare (soo icogiti) soo media e variaza Presetiamo gli stimatori della media icogita e della variaza icogita otteuti come mometi campioari Lo stimatore è ua fuzioe che ci forisce il valore da stimare i fuzioe del campioe osservato Nella parte di statistica ifereziale avremo a che fare co vc otteute come fuzioi di vc ote Per gli stimatori della media e della variaza icogiti calcoleremo i valori di sitesi più importati: media e variaza!

Variabile casuale media campioaria Abbiamo u modello X di cui o coosciamo la media E(X) = µ µ è l icogita da stimare Siao x 1, x,, x le osservazioi di X Deotiamo co X 1, X,, X u campioe iid di cui x 1, x,, x soo la realizzazioe La media campioaria è defiita come X = 1 X i Stimeremo quidi il valore icogito µ co ˆµ = 1 x i Proprietà della media campioaria Se E(X i ) = µ e Var(X i ) = σ allora Ifatti E( X ) = 1 E Var( X )= 1 Var E( X ) = µ e Var( X ) = σ X i X i = 1 E(X i ) = 1 µ = µ = 1 Var(X i )= σ = σ 3

Esempio: cosideriamo la variabile casuale X avete distribuzioe x i 1 3 p i 1/3 1/3 1/3 Abbiamo: E(X) = µ = e Var(X) = σ = /3 Estraiamo u campioe di umerosità co riposizioe I campioi possibili soo (1, 1); (1, ); (1, 3); (, 1); (, ); (, 3); (3, 1); (3, ); (3, 3) Cosideriamo la vc X La sua distribuzioe è x i 1 15 5 3 p i 1/9 /9 3/9 /9 1/9 E( X ) = = µ, e Var( X ) = 1/3 = σ / Esempio: u laboratorio produce molle per orologi co due macchie diverse deotate co A e B La seguete tabella riporta i dati delle resisteze delle molle prodotte dalle due macchie A 5 4 5 5 7 6 6 6 3 5 B 3 4 3 6 4 5 4 4 Stimare la media icogita delle resisteza delle molle prodotte dalle due macchie 4

Deotiamo co X A e X B rispettivamete i modelli per la resisteza delle molle prodotte rispettivamete dalla macchia A e dalla macchia B La media E(X A ) = µ A e E(X B ) = µ B soo icogite Le stimiamo rispettivamete co la media campioaria calcolata per i due gruppi: µ ˆ A = 1 1 µ ˆ B = 1 x A i = 96 1 = 467 9 x B i = 389 Queste soo le stime putuali per la media icogita delle popolazioi cosiderate Si faccia attezioe tra: 1 la media icogita µ la media campioaria stimatore 1 Xi 3 la media stimata 1 xi 4 la media dello stimatore E( 1 Xi ) 5

Variabile casuale variaza campioaria Suppoiamo ora che del modello X sia icogita la variaza σ Se, come prima, X 1, X,, X è u campioe iid allora la variaza campioaria è defiita come S = 1 1 (X i X ) Stimeremo il valore icogito σ co ˆσ = s = 1 1 (x i x ) Si verifica che E(S ) = σ, Var(S) = 1 ( µ 4 3 ) 1 σ4 Riprediamo l esempio e calcoliamo la distribuzioe di S campioe x i s i 1 1 1 0 1 15 05 1 3 1 15 05 0 3 5 05 3 1 3 5 05 3 3 3 0 6

La distribuzioe è Da cui E(S ) = /3 = σ s i 0 05 p i 3/9 4/9 /9 Esempio: (cotiua) stimare la variaza icogita per la variaza della resisteza delle molle prodotte dalle due macchie A e B σˆ A = 1 1 ( x Ai ( x A) ) = 1 11 (7330 1(467) ) = 61 σˆ B = 1 1 ( x Bi ( x B) ) = 1 8 (5147 9(389) ) = 136 Si oti che le due stime otteute soo diverse dalla variaza che era stata calcolata precedetemete σa = 1 x i i ( x A ) = 1 1 7330 (467) = 39 Facedo i coti aaloghi per il gruppo B si trova σb = 11 Le stime otteute si chiamao o distorte i quato il valore atteso degli stimatori è uguale al parametro da stimare 7

Casi particolari importati Fio ad ora o abbiamo fatto essua ipotesi sulla distribuzioe del modello X Abbiamo solo supposto che la media e la variaza fossero icogite Suppoiamo ora che X sia u modello gaussiao Se X N(µ, σ ) si ha che ache la media campioaria è gaussiaa X N ( µ, σ Suppoiamo ora che X sia u modello beroulliao ) Se X Ber(p) si ha che p(1 p) E( X ) = E(ˆp ) = p e Var(ˆp ) = La distribuzioe di ˆp è la seguete ( P ˆp = k ) = ( ) p k (1 p) k, k = 0, 1,, k Lo stimatore ˆp è detto proporzioe campioaria ed è otteuto come media di variabili che possoo solo assumere valore 0 o 1 8

Osservazioe Quado diciamo che la media stimata è u certo valore è meglio dare ache l errore stadard, i modo da avere u idea della variabilità di tale stima Esempio: sulla base di u campioe, la percetuale di prefereze al partito A è ˆp = 505% Possiamo cocludere che A ha vito le elezioi? Quello che ci maca è la precisioe del dato 505% Sappiamo che Var(ˆp ) = p(1 p)/ Possiamo otteere ua stima della variaza di ˆp sostituedo al valore icogito p il valore ˆp Vediamo cosa accade per pari a 100 o a 1000 ˆp (1 ˆp ) 0505 0495 = = 005 = 5% 100 ˆp (1 ˆp ) 0505 0495 = = 00158 = 16% 1000 Cosideriamo l itervallo ˆp ± e ˆp (1 ˆp ) (505% 5%, 505% + 5%) = (455%, 555%) (505% + 16%, 505% 16%) = (489%, 51%) 9

Gli itervalli di cofideza Gli itervalli di cofideza per la media foriscoo u campo di variazioe (cetrato sulla media campioaria) all itero del quale ci si aspetta di trovare il parametro icogito µ Ad ogi itervallo di cofideza viee associato u livello di cofideza (1 ) che rappreseta il grado di attedibilità del ostro itervallo Il ostro scopo è quello di determiare u itervallo di valori (a, b) che cotega il valore icogito µ Vorremmo poter scrivere P (a < µ < b) = 1 Ma questa scrittura è priva di seso!!!!! Ifatti µ è u umero Chiariamo come uscire dall ighippo co u esempio fodametale 10

Se X 1, X,, X è u campioe iid di variabili casuali Gaussiae di media icogita µ e variaza σ, sappiamo che la media campioaria X è ua variabile aleatoria Gaussiaa di media µ e variaza σ / Possiamo quidi scrivere la relazioe sopra come P a < X µ σ che corrispode a scrivere co Z N(0, 1) < b = 1 P (a < Z < b) = 1 Possiamo scegliere a e b come P z < X µ σ < z 1 Basta ifatti osservare il disego = 1 11

1 z 0 z 1 Ricordado che z l espressioe P = z 1, possiamo riscrivere z 1 < X µ σ < z 1 = 1 Svolgiamo ora i calcoli ecessari per arrivare ad u itervallo i termii della media icogita µ 1

Abbiamo P z 1 < X µ σ < z 1 = P = P = P = P ( ( ( ( z 1 z 1 z 1 ) σ σ < X µ < z 1 ) σ σ X < µ < z 1 X σ + X > µ > z 1 X z 1 σ < µ < X + z 1 ) σ + X ) σ Osservazioe: la probabilità o è riferita a µ, che è ua costate, ma a X che è ua vc I sostaza potremmo scrivere che ( ) σ µ X ± z 1 e siamo fiduciosi che questo accada ell (1 )% dei casi, cioè ell (1 )% dei campioi estratti L itervallo di cofideza è u itervallo i cui estremi soo aleatori 13

1 X 3 X X µ 4 X X 5 Il livello di cofideza può essere visto come la frequeza di questi itervalli aleatori che cotegoo il valore icogito µ Alcui itervalli (cerchi) o cotegoo il valore µ (gli itervalli 1, e 5) altri ivece lo cotegoo (gli itervalli 3 e 4) Si può iterpretare il livello di cofideza 1 come la frequeza degli itervalli che cotegoo il valore icogito µ Ecco perché è scorretto parlare del livello di cofideza come della probabilità che il ostro parametro sia coteuto ell itervallo 14

Esempio: cosideriamo u campioe di ampiezza = 7 proveiete da ua popolazioe Normale co media µ icogita e variaza ota σ = 44 Determiare l itervallo di cofideza a livello 1 = 095 Sappiamo che Z = X µ σ = X µ 44/7 Ioltre dalle tavole della Z ricaviamo = N(0, 1) P (Z < 196) = P (Z > 196) = = 005 Abbiamo P z 1 < X µ σ < z 1 = P = P 196 < X µ 44 7 < 196 44 44 X 196 7 < µ < X + 196 7 = P ( X 5 < µ < X + 5) = 095 15

Possiamo dire che co u grado di fiducia pari a 095 (95%) riteiamo che l itervallo ( X 5, X + 5) cotega la suo itero il valore icogito µ A questo puto etrao i gioco le osservazioi!! Se abbiamo rilevato x = 1745, l itervallo di cofideza risulta (17, 177) È ragioevole pesare che la media icogita µ sia compresa ell itervallo (17, 177) el 95% dei casi È sbagliato affermare che la probabilità che µ sia ell itervallo (17, 177) è 095, perché µ o è ua variabile casuale Riassumedo: Itervallo di cofideza per la media (σ ota) el caso di popolazioe Gaussiaa Sia X ua vc Gaussiaa di media µ e variaza σ Se X 1, X,, X è u campioe iid estratto da X allora l itervallo di cofideza per µ di livello 1 si scrive ella seguete forma ( ) σ µ X ± z 1 Lo stesso risultato vale se X è qualuque purché l ampiezza del campioe sia sufficietemete elevata 16