Slide Set #5 Tests delle Ipotesi

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Slide Set #5 Tests delle Ipotesi"

Transcript

1 Slide Set #5 Tests delle Ipotesi Pietro Coretto Università degli Studi di Salerno Corso di Statistica ( ) CDL in Economia e Management Curriculum in Management e Informatica a.a. 2018/2019 Versione: 19 novembre 2018 (h16:38) P. Coretto // Statistica Tests delle Ipotesi 1 / 68 Esempio: scritture contabili La GGK è un colosso della distribuzione. Ogni giorno si effettuano numerose scritture contabili soggette ad arrotondamenti. Le procedure contabili prevedono che il volume medio giornaliero degli arrotondamenti non può superare 0.5e. Allo scopo di tenere sotto controllo l effetto cumulato giornaliero, ogni trimestre si estraggono 15 giorni a caso sui quali si rileva l arrotondamento complessivo. La media campionaria nell ultimo trimestre è 0.49e. Il sistema contabile funziona se la media degli arrotondamenti giornalieri µ 0.5. Purtroppo µ non è noto. x = 0.49 non può essere l elemento decisivo. Perché? Per prendere decisioni è necessario: una regola di decisione che tenga conto dell incertezza circa (X µ) una valutazione oggettiva del rischio di commettere errori P. Coretto // Statistica Tests delle Ipotesi 2 / 68

2 Test delle ipotesi (parametrici) Abbiamo un fenomeno X f (θ), θ è un parametro (non noto) di f. θ Θ, e consideriamo la partizione Θ = Θ 0 Θ 1, con Θ 0 Θ 1 = Ipotesi nulla H 0 : θ Θ 0 Ipotesi alternativa H 1 : θ Θ 1 Esempio: scritture contabili X =arrotondamento giornaliero f, e E[X ] = µ Ipotesi nulla H 0 : µ 0.5 Ipotesi alternativa H 1 : µ > 0.5 θ = µ, Θ = R, Θ 0 = (, 0.5], Θ 1 = (0.5, + ) Perché l ipotesi nulla è µ 0.5?... dopo. P. Coretto // Statistica Tests delle Ipotesi 3 / 68 Regione critica e regola di decisione Sia C l insieme di tutti i possibili campioni di dimensione n. Consideriamo la partizione C = C 1 C 0, con C 0 C 1 =. C 0 = insieme di tutti i campioni coerenti con H 0. Sono i campioni generati da f quando θ Θ 0 C 1 = insieme di tutti i campioni coerenti con H 1. Sono i campioni generati da f quando θ Θ 1 P. Coretto // Statistica Tests delle Ipotesi 4 / 68

3 Il test consiste nell applicare una regola di decisione che stabilisce la provenienza del campione osservato campione osservato assegnato a C 1 = RIFIUTO H 0 Per questo motivo C 1 =regione critica di rifiuto. campione osservato assegnato a C 0 = NON RIFIUTO H 0 Vogliamo regole di decisione ottimali. Per definire l ottimo dobbiamo fissare i riferimenti: definizione del ruolo di H 0 vs H 1 definizione del rischio di decisioni sbagliate P. Coretto // Statistica Tests delle Ipotesi 5 / 68 Tests Neyman-Pearson ottimali Jerzy Neyman ( ) Egon S. Pearson ( ) P. Coretto // Statistica Tests delle Ipotesi 6 / 68

4 Ruolo di H 0 vs H 1 nel test á la Neyman-Pearson H 0 è l ipotesi che non vogliamo assolutamente rifiutare a favore di H 1 fino a quando è empiricamente sostenibile. H 0 è lo status quo, ovvero, l ipotesi considerata vera fino a prova contraria (asimmetria) H 1 concettualizza la violazione di H 0 che l osservatore si aspetta nei dati Esempio: scritture contabili H 0 : arrotondamenti corretti H 1 : arrotondamenti superiori al massimo consentito Processo penale H 0 : l imputato non è colpevole H 1 : l imputato è colpevole Test diagnostico medico H 0 : funzioni biologiche normali (esito negativo) H 1 : alterazioni delle funzioni biologiche (esito positivo) P. Coretto // Statistica Tests delle Ipotesi 7 / 68 Rischio di decisioni sbagliate NATURA TU H 0 è vera H 1 è vera Rifiuto H 0 E 1 OK Non rifiuto H 0 OK E 2 E 1 : errore del primo tipo (falso positivo) PrE 1 } = PrRifiuto H 0 H 0 è vera} = PrCampione assegnato a C 1 θ Θ 0 } = α E 2 : errore del secondo tipo (falso negativo) PrE 2 } = PrNon rifiuto H 0 H 1 è vera} = PrCampione assegnato a C 0 θ Θ 1 } = β P. Coretto // Statistica Tests delle Ipotesi 8 / 68

5 H 0 : l imputato non è colpevole H 1 : l imputato è colpevole E 1 E 2 Giudice: Andy Dufresne è un marito assassino Giudice: Aaron Stampler è assolto perché affetto da disturbo dissociativo dell identità P. Coretto // Statistica Tests delle Ipotesi 9 / 68 Relazione tra α e β, e regione critica ottimale Il sogno: α = β = 0 Brutte notizie (1): non è possibile azzerare il rischio di commettere errori Brutte notizie (2): α aumenta = β diminuisce, e viceversa. Al limite: α 0 = β 1, e viceversa. Soluzione ottimale di Neyman-Pearson: 1 in considerazione del ruolo svolto da H 0 vs H 1, fisso α al livello massimo sopportabile. PrE 1 } = α è detto livello di significatività del test. Solitamente α = 10%, 5%, 2%, %1}. 2 tra tutte le regioni critiche che danno α = PrE 1 }, prendo quella che comporta il minimo β = PrE 2 } P. Coretto // Statistica Tests delle Ipotesi 10 / 68

6 Potenza del test NATURA TU H 0 è vera H 1 è vera Rifiuto H 0 α π = (1 β) Non rifiuto H 0 (1 α) β PrCorretto rifiuto} = PrRifiuto H 0 H 1 è vera} α si controlla direttamente (viene fissato) = (1 β) = π = potenza del test π, in generale, non è direttamente controllabile. Per i test Neyman-Pearson ottimali sappiamo solo che π è massimo (β è minimo) per il fissato livello α TUTTI i test che vedremo in questo corso sono Neyman-Pearson ottimali P. Coretto // Statistica Tests delle Ipotesi 11 / 68 ATTENZIONE: Spesso si è ossessivi nel proteggersi rispetto ai falsi positivi (α piccolo), ma questo crea il rischio di falsi negativi (β grande). Se aumento α = β diminuisce = π aumenta. Quale è un valore ragionevole per α? La pratica standard di considerare α = 1%, 5% in alcuni casi potrebbe essere devastante. α dovrebbe essere fissato dopo un attenta valutazione delle implicazioni (pratiche) dei due errori. Si, ma quali sono le implicazioni pratiche? nella maggior parte dei casi, estraggo un campione ed effettuo la mia decisione. α, β, π sono probabilità come per gli intervalli di confidenza, è bene pensare a queste quantità nell ottica del campionamento ripetuto P. Coretto // Statistica Tests delle Ipotesi 12 / 68

7 Interpretazione pratica di α Supponiamo di poter estrarre K campioni indipendenti di dimensione n dalla popolazione X f (θ). K è sufficientemente grande Campione 1 decisione 1 Campione 2 decisione 2... Campione K decisione K Ogni volta che θ Θ 0 e quindi θ / Θ 1 (H 0 vera, H 1 falsa): (1 α)% decisioni saranno corrette α% decisioni saranno sbagliate P. Coretto // Statistica Tests delle Ipotesi 13 / 68 Cercare di interpretare β (e quindi π) dal punto di vista pratico non ha molto senso. Infatti, tranne che in casi didattici, non li possiamo quantificare. Sappiamo solo che β è al minimo possibile. Per un singolo campione? Quale è l interpretazione di α per la decisione presa sul nostro singolo campione osservato? α è una misura di rischio. Possiamo interpretare α come il livello di inaffidabilità del test che siamo disposti a sopportare nel caso in cui H 0 fosse vera P. Coretto // Statistica Tests delle Ipotesi 14 / 68

8 Costruzione di un test Esempio: media di una popolazione normale a varianza nota Supponiamo X Normale(µ, 64), consideriamo il test: H 0 : µ = 100 H 1 : µ > 100 In un campione di n = 16 osservazioni risulta x = 103. Trovare una regola di decisione al livello α = 5% Potrei rifiutare H 0 perché x > 100. Tuttavia, se H 0 è vera, allora ( X H 0 Normale 100, 64 ) n Quindi X varia casualmente intorno a 100. Consideriamo U = n X H0 Normale(0, 1) P. Coretto // Statistica Tests delle Ipotesi 15 / 68 Valori osservati di U positivi ci fanno pensare che H 0 è falsa. Si, ma quanto dovrebbe essere più grande di zero? PrE 1 } = α (è fissato) = PrRifiuto H 0 H 0 è vera} = PrU > u µ = 100} Quando H 0 è vera U ha distribuzione Normale Standard, quindi u = z α, ovvero z 0.05 = 1.64 Ho trovato una regione critica ed una regola di decisione con il livello di significatività fissato: Regione critica C 1 : sono i campioni tali che U > z α = 1.64 : rifiuto H 0 se n( x 100)/8 > 1.64 Il valore osservato di U è 16( )/8 = 1.5 < 1.64 = non rifiuto H 0 al livello del 5%. P. Coretto // Statistica Tests delle Ipotesi 16 / 68

9 Quanto vale π = 1 β? Il calcolo di β richiede H 1 vera. H 1 è vera per un numero infinito di possibili valori di µ Questa regola è Neyman-Pearson ottimale: per qualunque valore di µ, ceteris paribus, ottengo il miglior π possibile. Questo basterebbe, ma voglio capire in quale ordine di grandezza ci muoviamo. Supponiamo che H 1 è vera perché µ = 104. β = PrNon rifiuto H 0 H 1 è vera} = PrU < 1.64 µ = 104} U = n X 100 = 100 n n X E[U H 1 vera] = 100 n n n = 2 Var[U H 1 vera] = 1 P. Coretto // Statistica Tests delle Ipotesi 17 / 68 Quindi U = n X β = PrU < 1.64 µ = 104} = Pr ( ) H1 n Normale 2, 1 Z < 1.64 } 16 = PrZ < 0.36} = Φ( 0.36) = 1 Φ(0.36) = Da cui π = 1 β = 0.64 Interpretazione: se potessi ripetere il test un gran numero di volte, π = 64% = 64/100 decisioni corrette quando µ = 104. Vediamo cosa succede alla distribuzione di U sotto le due ipotesi P. Coretto // Statistica Tests delle Ipotesi 18 / 68

10 Distribuzione di U sotto le due ipotesi H 0 α=0.05 P. Coretto // Statistica Tests delle Ipotesi 19 / 68 Distribuzione di U sotto le due ipotesi H 0 H 1 α=0.05 P. Coretto // Statistica Tests delle Ipotesi 20 / 68

11 Distribuzione di U sotto le due ipotesi H 0 H 1 β α=0.05 P. Coretto // Statistica Tests delle Ipotesi 21 / 68 Distribuzione di U sotto le due ipotesi H 0 H 1 π β α=0.05 P. Coretto // Statistica Tests delle Ipotesi 22 / 68

12 al variare di µ > 100 avrò diversi valori di β e π se cambio α, n, σ avrò diversi valori di β e π Sebbene β e π non sono direttamente controllabili, spesso sarebbe utile fare un analisi di sensitività rispetto alle quantità controllabili. Uno statistico può controllare: α, a livello di procedura di test n, a livello di disegno di campionamento (non sempre) Nell Esempio: media di normale vediamo come variano β e π in funzione di µ sotto H 1 P. Coretto // Statistica Tests delle Ipotesi 23 / 68 π = (1 β) Potenza del test con α = 5% n = 16 n = 50 n = 250 π = (1 β) Potenza del test con α = 0.5% n = 16 n = 50 n = µ µ P. Coretto // Statistica Tests delle Ipotesi 24 / 68

13 β Errore del II tipo con α = 5% n = 16 n = 50 n = 250 β Errore del II tipo con α = 0.5% n = 16 n = 50 n = µ µ P. Coretto // Statistica Tests delle Ipotesi 25 / 68 Procedura di testing: routine Definizione: (Funzione test/statistica test) Sia X 1, X 2,..., X n } un campione. Una funzione test, anche detta statistica test, è una funzione T (X 1, X 2,..., X n, θ 0 ) che misura contemporaneamente la coerenza del campione all ipotesi nulla, e la non coerenza rispetto all ipotesi alternativa. La statistica test non dipende da altri parametri incogniti. Si noti che T dipende da H 0, ma non da H 1 T è una variabile casuale: popolazione + effetto del campionamento Esempi Esempio: media di normale : U è una statistica test Esempio: errori contabili : T 1 = (X 0.5) potrebbe essere una funzione test. Tuttavia, non sarebbe molto utile. Esempio: errori contabili : T 2 = (X 0.5) 2 non è una buona funzione test, perché? P. Coretto // Statistica Tests delle Ipotesi 26 / 68

14 Steps : 1 Parto dalla distribuzione della funzione test sotto H 0 Esempio: media di normale : U = n X H0 Normale(0, 1) 2 dato α, calcolo qualche valore di coda della distribuzione della funzione test sotto H 0 Esempio: media di normale : α = 5%, zα = determino la regione di rifiuto Esempio: media di normale : tutti i campioni per cui U > zα = calcolo il valore osservato della funzione test Esempio: media di normale : 16( )/8 = decisione: rifiuto H 0 se il valore osservato delle funzione test è assegnato alla regione critica di rifiuto Esempio: media di normale : 1.5 < z0.05 = 1.64 = non rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 27 / 68 Media di una popolazione Normale con varianza nota Assumo: X 1, X 2,..., X n } è un CCS da una popolazione X Normale(µ, σ 2 ), dove σ 2 è noto Ipotesi nulla: H 0 : µ = µ 0 Funzione test Z = n X µ 0 σ H0 Normale(0, 1) Valore osservato della funzione test z = n x µ 0 σ Coda z α : PrZ z α } = α P. Coretto // Statistica Tests delle Ipotesi 28 / 68

15 Ipotesi alternativa unilaterale a destra H 0 : µ = µ 0 H 1 : µ > µ 0 H 0 : µ µ 0 H 1 : µ > µ 0 campioni : Z > z α } rifiuto H 0 se z > z α z α Non rifiuto H 0 Rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 29 / 68 Ipotesi alternativa unilaterale a sinistra H 0 : µ = µ 0 H 1 : µ < µ 0 H 0 : µ µ 0 H 1 : µ < µ 0 campioni : Z < z α } rifiuto H 0 se z < z α z α Rifiuto H 0 Non rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 30 / 68

16 Ipotesi alternativa bilaterale H 0 : µ = µ 0 H 1 : µ µ 0 Regione critica di rifiuto } campioni: Z < z α oppure Z > z α 2 2 rifiuto H 0 se z < z α oppure z > z α 2 2 z α 2 z α 2 Rifiuto H0 Non rifiuto H0 Rifiuto H0 P. Coretto // Statistica Tests delle Ipotesi 31 / 68 Media di una popolazione Normale con varianza non nota Assumo: X 1, X 2,..., X n } è un CCS da una popolazione X Normale(µ, σ 2 ), dove σ 2 non è noto Ipotesi nulla: H 0 : µ = µ 0 Funzione test T = n X µ 0 S H0 t n 1 Valore osservato della funzione test t = n x µ 0 s Coda t n 1, α : PrT t n 1, α } = α P. Coretto // Statistica Tests delle Ipotesi 32 / 68

17 Ipotesi alternativa unilaterale a destra H 0 : µ = µ 0 H 1 : µ > µ 0 H 0 : µ µ 0 H 1 : µ > µ 0 campioni : T > t n 1, α } rifiuto H 0 se t > t n 1, α t n 1, α Non rifiuto H 0 Rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 33 / 68 Ipotesi alternativa unilaterale a sinistra H 0 : µ = µ 0 H 1 : µ < µ 0 H 0 : µ µ 0 H 1 : µ < µ 0 campioni : T < t n 1, α } rifiuto H 0 se t < t n 1, α t n 1, α Rifiuto H 0 Non rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 34 / 68

18 Ipotesi alternativa bilaterale H 0 : µ = µ 0 H 1 : µ µ 0 } campioni: T < t n 1, α oppure T > t n 1, α 2 2 rifiuto H 0 se t < t n 1, α 2 oppure t > t n 1, α 2 tn 1, α 2 tn 1, α 2 Rifiuto H0 Non rifiuto H0 Rifiuto H0 P. Coretto // Statistica Tests delle Ipotesi 35 / 68 Esercizio: P. Coretto // Statistica Tests delle Ipotesi 36 / 68

19 Proporzione di una popolazione (grandi campioni) Assumo: X 1, X 2,..., X n } è un CCS da una popolazione X Bernoulli(p), inoltre n è sufficientemente grande e np(1 p) > 9 Ipotesi nulla: H 0 : p = p 0 Funzione test Z = ˆP p 0 p 0 (1 p 0 ) n H0 Normale(0, 1) Valore osservato della funzione test z = ˆp p 0 p 0 (1 p 0 ) n Coda z α : PrZ z α } = α P. Coretto // Statistica Tests delle Ipotesi 37 / 68 Ipotesi alternativa unilaterale a destra H 0 : p = p 0 H 1 : p > p 0 H 0 : p p 0 H 1 : p > p 0 campioni : Z > z α } rifiuto H 0 se z > z α z α Non rifiuto H 0 Rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 38 / 68

20 Ipotesi alternativa unilaterale a sinistra H 0 : p = p 0 H 1 : p < p 0 H 0 : p p 0 H 1 : p < p 0 campioni : Z < z α } rifiuto H 0 se z < z α z α Rifiuto H 0 Non rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 39 / 68 Ipotesi alternativa bilaterale H 0 : p = p 0 H 1 : p p 0 Regione critica di rifiuto } campioni: Z < z α oppure Z > z α 2 2 rifiuto H 0 se z < z α oppure z > z α 2 2 z α 2 z α 2 Rifiuto H0 Non rifiuto H0 Rifiuto H0 P. Coretto // Statistica Tests delle Ipotesi 40 / 68

21 Esercizio: P. Coretto // Statistica Tests delle Ipotesi 41 / 68 Differenza tra medie di popolazioni normali dipendenti Assumo: (X 1, Y 1 ), (X 2, Y 2 ),..., (X n, Y n )} è un CCS da una popolazione congiuntamente normale dove X e Y sono dipendenti (correlate) Sia d i = x i y i, siano D e S 2 d media e varianza campionaria di d Ipotesi nulla: H 0 : µ X µ Y = d 0 Funzione test T = n (X Y ) d 0 S d H0 t n 1 Valore osservato della funzione test Coda t n 1, α : t = n d d 0 s d PrT t n 1, α } = α P. Coretto // Statistica Tests delle Ipotesi 42 / 68

22 Ipotesi alternativa unilaterale a destra H 0 : µ X µ Y = d 0 H 1 : µ X µ Y > d 0 H 0 : µ X µ Y d 0 H 1 : µ X µ Y > d 0 campioni : T > t n 1, α } rifiuto H 0 se t > t n 1, α t n 1, α Non rifiuto H 0 Rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 43 / 68 Ipotesi alternativa unilaterale a sinistra H 0 : µ X µ Y = d 0 H 1 : µ X µ Y < d 0 H 0 : µ X µ Y d 0 H 1 : µ X µ Y < d 0 campioni : T < t n 1, α } rifiuto H 0 se t < t n 1, α t n 1, α Rifiuto H 0 Non rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 44 / 68

23 Ipotesi alternativa bilaterale H 0 : µ X µ Y = d 0 H 1 : µ X µ Y d 0 } campioni: T < t n 1, α oppure T > t n 1, α 2 2 rifiuto H 0 se t < t n 1, α 2 oppure t > t n 1, α 2 tn 1, α 2 tn 1, α 2 Rifiuto H0 Non rifiuto H0 Rifiuto H0 P. Coretto // Statistica Tests delle Ipotesi 45 / 68 Esercizio: 11.3 P. Coretto // Statistica Tests delle Ipotesi 46 / 68

24 Pooling della devianza Siano X f e Y g due popolazioni. Siano X 1, X 2,..., X nx } e Y 1, Y 2,..., Y ny } due CCS indipendenti. Omoschedasticità: assumiamo Var[X ] = Var[Y ] = σ 2 X e Y hanno la stessa varianza, ma non necessariamente la stessa media. Quale statistica di varianza userebbe tutta l informazione campionaria? Varianza campionaria pooled nx Sp 2 = i=1 (X i X ) 2 + n Y i=1 (Y i Y ) 2 n X + n Y 2 = (n X 1)S 2 X + (n Y 1)S 2 Y n X + n Y 2 P. Coretto // Statistica Tests delle Ipotesi 47 / 68 Differenza tra medie di popolazioni normali indipendenti Assumo: X 1, X 2,..., X nx } e Y 1, Y 2,..., Y ny } sono due CCS indipendenti da popolazioni normali omoschedastiche, ovvero X Normale(µ X, σ 2 ) e Y Normale(µ Y, σ 2 ), dove σ 2 non è noto. Ipotesi nulla: H 0 : µ X µ Y = d 0 Funzione test S 2 p T = (X Y ) d 0 n X + S 2 p n Y H0 t nx +n Y 2 Valore osservato della funzione test Coda t nx +n Y 2, α: s 2 p n X t = (x y) d 0 + s2 p n Y PrT t nx +n Y 2, α} = α P. Coretto // Statistica Tests delle Ipotesi 48 / 68

25 Ipotesi alternativa unilaterale a destra H 0 : µ X µ Y = d 0 H 1 : µ X µ Y > d 0 H 0 : µ X µ Y d 0 H 1 : µ X µ Y > d 0 campioni : T > t nx +n Y 2, α} rifiuto H 0 se t > t nx +n Y 2, α t nx+ny 2, α Non rifiuto H 0 Rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 49 / 68 Ipotesi alternativa unilaterale a sinistra H 0 : µ X µ Y = d 0 H 1 : µ X µ Y < d 0 H 0 : µ X µ Y d 0 H 1 : µ X µ Y < d 0 campioni : T < t nx +n Y 2, α} rifiuto H 0 se t < t nx +n Y 2, α t nx+ny 2, α Rifiuto H 0 Non rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 50 / 68

26 Ipotesi alternativa bilaterale H 0 : µ X µ Y = d 0 H 1 : µ X µ Y d 0 } campioni: T < t nx +ny 2, α oppure T > t 2 nx +ny 2, α 2 rifiuto H 0 se t < t nx +ny 2, α 2 oppure t > t nx +ny 2, α 2 tnx+ny 2, α 2 tnx+ny 2, α 2 Rifiuto H0 Non rifiuto H0 Rifiuto H0 P. Coretto // Statistica Tests delle Ipotesi 51 / 68 Esercizio: 11.5 P. Coretto // Statistica Tests delle Ipotesi 52 / 68

27 Pooling di popolazioni Bernoulliane indipendenti Siano X Bernoulli(p X ) e Y Bernoulli(p Y ) due popolazioni Bernoulliane. Siano X 1, X 2,..., X nx }, e Y 1, Y 2,..., Y ny } due campioni indipendenti. Le proporzioni campionarie saranno ˆP X = 1 n X n X i=1 X i e ˆP Y = 1 n Y n Y Y i i=1 Assumiamo H 0 : p X = p Y. Quale statistica userebbe tutta l informazione campionaria? Proporzione campionaria pooled nx ˆP 0 = i=1 X i + n Y i=1 Y i n X + n Y = n X ˆP X + n Y ˆP Y n X + n Y P. Coretto // Statistica Tests delle Ipotesi 53 / 68 Differenza tra proporzioni (grandi campioni) Assumo: X 1, X 2,..., X nx } e Y 1, Y 2,..., Y ny } sono due CCS indipendenti da X Bernoulli(p X ), e Y Bernoulli(p Y ). n è sufficientemente grande. Ipotesi nulla: H 0 : p X p Y = 0 Funzione test Z = ˆP X ˆP Y ˆP 0 (1 ˆP 0 ) n X + ˆP 0 (1 ˆP 0 ) n Y H0 Normale(0, 1) Valore osservato della funzione test ˆp X ˆp Y z = ˆp0 (1 ˆp 0 ) n X + ˆp 0(1 ˆp 0 ) n Y Coda z α : PrZ z α } = α P. Coretto // Statistica Tests delle Ipotesi 54 / 68

28 Ipotesi alternativa unilaterale a destra H 0 : p X p Y = 0 H 1 : p X p Y > 0 H 0 : p X p Y 0 H 1 : p X p Y > 0 campioni : Z > z α } rifiuto H 0 se z > z α z α Non rifiuto H 0 Rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 55 / 68 Ipotesi alternativa unilaterale a sinistra H 0 : p X p Y = 0 H 1 : p X p Y < 0 H 0 : p X p Y 0 H 1 : p X p Y < 0 campioni : Z < z α } rifiuto H 0 se z < z α z α Rifiuto H 0 Non rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 56 / 68

29 Ipotesi alternativa bilaterale H 0 : p X p Y = 0 H 1 : p X p Y 0 Regione critica di rifiuto } campioni: Z < z α oppure Z > z α 2 2 rifiuto H 0 se z < z α oppure z > z α 2 2 z α 2 z α 2 Rifiuto H0 Non rifiuto H0 Rifiuto H0 P. Coretto // Statistica Tests delle Ipotesi 57 / 68 Esercizio: P. Coretto // Statistica Tests delle Ipotesi 58 / 68

30 Varianza di una popolazione normale Assumo: X 1, X 2,..., X n } è un CCS da una popolazione X Normale(µ, σ 2 ) Ipotesi nulla: H 0 : σ 2 = σ 2 0 Funzione test χ = (n 1)S 2 σ 2 0 H0 χ 2 n 1 Valore osservato della funzione test c = (n 1)s2 σ 2 0 Coda χ 2 n 1, α : Pr χ χ 2 n 1, α} = α P. Coretto // Statistica Tests delle Ipotesi 59 / 68 Ipotesi alternativa unilaterale a destra H 0 : σ 2 = σ 2 0 H 1 : σ 2 > σ 2 0 H 0 : σ 2 σ 2 0 H 1 : σ 2 > σ 2 0 campioni : χ > χ 2 n 1, α } rifiuto H 0 se c > χ 2 n 1, α χ 2 n 1, α Non rifiuto H 0 Rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 60 / 68

31 Ipotesi alternativa unilaterale a sinistra H 0 : σ 2 = σ 2 0 H 1 : σ 2 < σ 2 0 H 0 : σ 2 σ 2 0 H 1 : σ 2 < σ 2 0 campioni : χ < χ 2 n 1, 1 α } rifiuto H 0 se c < χ 2 n 1, 1 α χ 2 n 1, 1 α Rifiuto H 0 Non rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 61 / 68 Ipotesi alternativa bilaterale H 0 : σ 2 = σ 2 0 H 1 : σ 2 σ 2 0 } campioni: χ < χ 2 n 1, 1 α oppure χ > χ 2 n 1, α 2 2 rifiuto H 0 se c < χ 2 n 1, 1 α 2 oppure c > χ 2 n 1, α 2 χ 2 n 1, 1 α 2 χ 2 n 1, α 2 Rifiuto H0 Non rifiuto H0 Rifiuto H0 P. Coretto // Statistica Tests delle Ipotesi 62 / 68

32 Esercizio: P. Coretto // Statistica Tests delle Ipotesi 63 / 68 p-value Sia U la funzione test, e u il suo valore osservato. Il p-value si calcola: p-value = PrU è uguale o più estrema di u H 0 è vera} Si noti che il p-value [0, 1]. Questo è il calcolo. La sua interpretazione? Il p-value è una misura della plausibilità di H 0 per il campione osservato: p-value grande: il campione osservato mostra forte evidenza empirica a favore di H 0. p-value piccolo: il campione osservato mostra debole/nessuna evidenza empirica a favore di H 0. in questo senso il p-value è anche definito come livello di significatività osservato. P. Coretto // Statistica Tests delle Ipotesi 64 / 68

33 L interpretazione non può prescindere da α e H 1. Nell ottica Neyman-Pearson l uso del p-value deve dipendere dalla nozione di ottimalità sottostante. Definizione: (p-value nei tests Neyman-Pearson) Il p-value calcolato coincide il livello minimo di α al quale si rifiuta H 0 sulla base del campione osservato. Da questo punto di vista il p-value è uno strumento operativo per definire la regione critica senza usare alla funzione test: Rifiuto H 0 se p-value < α P. Coretto // Statistica Tests delle Ipotesi 65 / 68 Rifiuto H 0 Non rifiuto H 0 0 α 1 in termini di p-value P. Coretto // Statistica Tests delle Ipotesi 66 / 68

34 Uso del p-value Esempio: (Spray per insetti) Si usano sei diversi sprays (A, B, C, D, E, F ) in 12 diverse posizioni, e si rileva il numero di insetti presenti nel raggio di azione in ogni posizione. Le prove sono indipendenti. Ecco i dati campionari Numero di Insetti A B C D E F Spray P. Coretto // Statistica Tests delle Ipotesi 67 / 68 Con riferimento ai dati dell Esempio 67 vogliamo testare H 0 : i sei gruppi sono omoschedastici H 1 : almeno un gruppo differisce per varianza Si tratta di effettuare un test di confronto delle varianze. Una possibilità è il test di confronto delle varianze per popolazioni Normali. Tuttavia, sostenere la normalità è assai dubbio. Una scelta appropriata in questo caso è il test di Bartlett. Fissiamo α = 5% p-value = = < α = Rifiuto H 0 P. Coretto // Statistica Tests delle Ipotesi 68 / 68

Stima Puntuale e per Intervallo. Stimatore e stima. Pietro Coretto Università degli Studi di Salerno

Stima Puntuale e per Intervallo. Stimatore e stima. Pietro Coretto Università degli Studi di Salerno Stima Puntuale e per Intervallo Pietro Coretto pcoretto@unisa.it Università degli Studi di Salerno Corso di Statistica (01700010) CDL in Economia e Management Curriculum in Management e Informatica a.a.

Dettagli

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU) STATISTICA a.a. 2001-2002 (3 CFU) Federico M. Stefanini Dipartimento di Statistica G.Parenti viale Morgagni 59, 50134 Firenze, tel. 055-4237211 PARTE 5-3.12.2001 e.mail: stefanin@ds.unifi.it http://www.ds.unifi.it/ricerca/pagperson/docenti/stefanini.htm

Dettagli

Fondamenti statistici : Test d Ipotesi (1)

Fondamenti statistici : Test d Ipotesi (1) Fondamenti statistici : Test d Ipotesi (1) Ipotesi statistica: È una assunzione formulata su un particolare aspetto della popolazione considerazioni teoriche Informazioni relative a popolazioni analoghe

Dettagli

Test per una media - varianza nota

Test per una media - varianza nota Situazione Test per una media - varianza nota Popolazione N(µ,σ 2 ); varianza σ 2 nota. µ 0 numero reale fissato. Test di livello α per µ Statistica: Z n = X n µ 0 σ/ n. H 0 H 1 Rifiutiamo H 0 se p-value

Dettagli

Corso di Statistica Esercitazione 1.8

Corso di Statistica Esercitazione 1.8 Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Ipotesi statistica parametrica non parametrica una qualunque affermazione che specifica completamente o parzialmente la distribuzione di probabilità di una v.c. X. semplice: se la

Dettagli

Statistica Applicata all edilizia: Stime e stimatori

Statistica Applicata all edilizia: Stime e stimatori Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica

Dettagli

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una

Dettagli

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica Strumenti quantitativi per la gestione Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli

Dettagli

Test d ipotesi Introduzione. Alessandra Nardi

Test d ipotesi Introduzione. Alessandra Nardi Test d ipotesi Introduzione Alessandra Nardi alenardi@mat.uniroma2.it 1 Consideriamo il caso in cui la nostra variabile risposta sia continua Immaginiamo che obiettivo del nostro studio sia valutare il

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017 Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005 Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005 Test di significatività Nei lavori di statistica medica si citano sempre i livelli di significatività (ovvero la probabilità)

Dettagli

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003 Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore

Dettagli

II Esonero - Testo B

II Esonero - Testo B Dip. di Ingegneria, Univ. Roma Tre Prof. E. Scoppola, Dott.M. Quattropani Probabilità e Statistica, 2017-18, I semestre 29 Gennaio 2018 II Esonero - Testo B Cognome Nome Matricola Esercizio 1. (20%) Si

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere

Dettagli

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Matematica II: Calcolo delle Probabilità e Statistica Matematica Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 014/015 II Esonero - 15 Gennaio 015 1 3 4 5 6 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Il Test di Ipotesi Lezione 5

Il Test di Ipotesi Lezione 5 Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!

Dettagli

Esercitazione 8 del corso di Statistica 2

Esercitazione 8 del corso di Statistica 2 Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento di Economia

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 6 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Intervallo di confidenza per la media Verifica d ipotesi sulla media

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Occorre trovare la distribuzione di DM

Occorre trovare la distribuzione di DM Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel primo campione la media è 185,3Kg, nel secondo campione la media è 175,2Kg.

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.12 - Test statistico Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona IPOTESI SCIENTIFICA Affermazione che si può sottoporre a verifica

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

Capitolo 10 Test delle ipotesi

Capitolo 10 Test delle ipotesi Capitolo 10 Test delle ipotesi 1 Stima e verifica di ipotesi Modello di popolazione e campionamento: La popolazione viene descritta da una variabile aleatoria dipendente da un parametro incognito. Si ipotizza

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2009/2010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Intervalli di confidenza Ines Campa Probabilità e Statistica - Esercitazioni

Dettagli

Confronto tra due popolazioni Lezione 6

Confronto tra due popolazioni Lezione 6 Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Verifica di ipotesi. Parte VI. Verifica di ipotesi

Verifica di ipotesi. Parte VI. Verifica di ipotesi Parte VI Verifica di ipotesi Definizione (Sistema di ipotesi) Nell ambito di un modello statistico parametrico, un sistema di ipotesi statistiche è costituito da due congetture, incompatibili, sul parametro

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2017/2018 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Intervalli di confidenza Marco Pietro Longhi Probabilità e Statistica

Dettagli

Teoria della stima dei parametri:

Teoria della stima dei parametri: INFERENZA STATISTICA Teoria della verifica dell ipotesi : si verifica, in termini probabilistici, se una certa affermazione relativa alla popolazione è da ritenersi vera sulla base dei dati campionari

Dettagli

Gli errori nella verifica delle ipotesi

Gli errori nella verifica delle ipotesi Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 3 Argomenti della lezione: La verifica delle ipotesi: principi generali Ipotesi statistiche Ipotesi sulla media Indicatore campionario: X Il campione è stato estratto da una popolazione con parametro

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli

Statistica. Lauree Triennali in Biologia e Biologia Molecolare Nome: 13 luglio 2010 Matricola: Cognome: Tema C

Statistica. Lauree Triennali in Biologia e Biologia Molecolare Nome: 13 luglio 2010 Matricola: Cognome: Tema C Statistica Cognome: Lauree Triennali in Biologia e Biologia Molecolare Nome: 13 luglio 2010 Matricola: Tema C 1. Parte A 1.1. Indichiamo con Q 1 e Q 3 il primo e terzo quartile, con m la mediana e con

Dettagli

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30 INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30 Intervallo di confidenza: media 2 / 30 Supponiamo di considerare la media campionaria X e assumiamo che Intervallo di confidenza: media 2 / 30 Supponiamo

Dettagli

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate Introduzione Notazione Modello additivo Verifica d ipotesi Sia X una variabile q-dimensionale, a valori reali, non degenere, osservata in k tempi diversi (τ 1, τ 2,..., τ k ), sulle stesse n unità statistiche

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = + ESERCIZIO 6.1 Si considerino i 0 campioni di ampiezza n = estratti da una popolazione X di N = 5 elementi distribuiti normalmente, con media µ = 13,6 e σ = 8,33. A partire dalle 0 determinazioni della

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Test per l omogeneità delle varianze

Test per l omogeneità delle varianze Test per l omogeneità delle varianze Le carte di controllo hanno lo scopo di verificare se i campioni estratti provengono da un processo produttivo caratterizzato da un unico valore dello s.q.m. σ. Una

Dettagli

Cenni di statistica statistica

Cenni di statistica statistica Cenni di statistica La statistica è una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare fenomeno in condizioni di incertezza o non determinismo, ovvero di non completa

Dettagli

Teorema del Limite Centrale

Teorema del Limite Centrale Teorema del Limite Centrale Teorema. Sia data una popolazione numerica infinita di media µ e deviazione standard σ da cui vengono estratti dei campioni casuali formati ciascuno da n individui, con n abbastanza

Dettagli

I appello di calcolo delle probabilità e statistica

I appello di calcolo delle probabilità e statistica I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo

Dettagli

Z-test, T-test, χ 2 -test

Z-test, T-test, χ 2 -test Z-test, T-test, χ 2 -test Francesco Corrias Chiara Todaro DIMA 13 febbraio 2012 Francesco Corrias Chiara Todaro (DIMA) Z-test, T-test, χ 2 -test 13 febbraio 2012 1 / 19 Verifica d ipotesi Definizione (Test

Dettagli

Test di ipotesi (a due code, σ nota)

Test di ipotesi (a due code, σ nota) Test di ipotesi (a due code, σ nota) Assumiamo nota la deviazione standard σ = 43.3 mesi vogliamo sapere se esiste un intervallo I di confidenza al 95% tale che µ 0 I? Ovvero esiste ε tale che P ( X µ

Dettagli

Introduzione alla verifica d ipotesi

Introduzione alla verifica d ipotesi Introduzione alla verifica d ipotesi Dipartimento di Matematica Università di Roma Tor Vergata 17 dicembre 2017 Consideriamo il caso in cui la nostra variabile risposta sia continua Immaginiamo che obiettivo

Dettagli

Esercizi di statistica inferenziale

Esercizi di statistica inferenziale Dipartimento di Fisica SMID a.a. 004/005 Esercizi di statistica inferenziale Prof. Maria Antonietta Penco tel. 0103536404 penco@fisica.unige.it 6/1/005 Esercizio1 E noto che un grande numero di pazienti

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

Statistica Metodologica

Statistica Metodologica Statistica Metodologica Esercizi di Probabilita e Inferenza Silvia Figini e-mail: silvia.figini@unipv.it Problema 1 Sia X una variabile aleatoria Bernoulliana con parametro p = 0.7. 1. Determinare la media

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

PROVE (TEST) DI IPOTESI VERIFICA DI IPOTESI (TEST DI IPOTESI)

PROVE (TEST) DI IPOTESI VERIFICA DI IPOTESI (TEST DI IPOTESI) 1 25 N. monodose 20 VERIFICA DI IPOTESI (TEST DI IPOTESI) Distribuzione dei volumi di collirio in contenitori monodose 40 Media 0.5 07ml Dev. St. 0.1 ml 35 N 100 34 Minimo 0.2934 ml Massimo 0.7031ml 30

Dettagli

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre R - Esercitazione 5 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 16 Dicembre 2016 Intervalli di confidenza (1) Sia X 1,..., X n un campione casuale estratto da un densità f (x, θ) nota

Dettagli

Statistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1

Statistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1 Statistica Capitolo 13 Test sulla Bontà di Adattamento e Tabelle di Contingenza Cap. 16-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Usare il test sulla bontà di adattamento

Dettagli

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 1-20/01/2010: A. Matricola: Corso:

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 1-20/01/2010: A. Matricola: Corso: Facoltà di Economia Statistica Esame 1-20/01/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Su 10 imprese è stato rilevato l utile netto dell ultimo triennio espresso in milioni di euro. Il risultato

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie Le distribuzioni campionarie sono quelle che derivano dalla presenza di campioni i.i.d. a distribuzione normale. Definizione. Se X è una v.a. avente distribuzione N(0, ), allora Y = X ha distribuzione

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

Il test statistico e le ipotesi Regione di accettazione e rifiuto Test con ipotesi nulla semplice Il p-value Errori di I e II tipo Funzione di potenza

Il test statistico e le ipotesi Regione di accettazione e rifiuto Test con ipotesi nulla semplice Il p-value Errori di I e II tipo Funzione di potenza 1 La verifica di ipotesi Il test statistico e le ipotesi Regione di accettazione e rifiuto Test con ipotesi nulla semplice Il p-value Errori di I e II tipo Funzione di potenza Contenuti: Capitolo 13 libro

Dettagli

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa L ipotesi che si vuole testare: H 0 (ipotesi nulla)

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe

Dettagli

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana Statistica Lez. 1 Gli intervalli di confidenza Intervallo di confidenza per la media (σ nota) nel caso di popolazione Gaussiana Sia X una v.c Gaussiana di media µ e varianza σ. Se X 1, X,..., X n è un

Dettagli

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1 Confronto tra medie Si considerino due popolazioni di individui sottoposti a due diversi trattamenti farmacologici. Si vuole valutare se tali trattamenti producono uguali effetti (ipotesi nulla) o diversi

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari"

Dettagli

Analisi della varianza: I contrasti e il metodo di Bonferroni

Analisi della varianza: I contrasti e il metodo di Bonferroni Analisi della varianza: I contrasti e il metodo di Bonferroni 1 Contrasti In molti problemi risulta importante stabilire, nel caso venga rifiutata l ipotesi nulla, di uguaglianza delle medie µ j delle

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Intervalli di confidenza Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Gli intervalli di Confidenza. Lezione 9- Inervalli di Confidenza 1

Gli intervalli di Confidenza. Lezione 9- Inervalli di Confidenza 1 Lezione 9 Gli intervalli di Confidenza Confidenza 1 Intervalli di Confidenza Sia X 1, X n un campione di ampiezza n estratto dalla popolazione X~(µ,σ 2 ) Per quanto accurato possa essere lo stimatore T

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori. Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri

Dettagli

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it I risultati di un esperimento

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015 1 2 3 4 5 6 7 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Quanti soggetti devono essere selezionati?

Quanti soggetti devono essere selezionati? Quanti soggetti devono essere selezionati? Determinare una appropriata numerosità campionaria già in fase di disegno dello studio molto importante è molto Studi basati su campioni troppo piccoli non hanno

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

Statistica (parte II) Esercitazione 4

Statistica (parte II) Esercitazione 4 Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti

Dettagli

I modelli probabilistici

I modelli probabilistici e I modelli probabilistici Finora abbiamo visto che esistono modelli probabilistici che possiamo utilizzare per prevedere gli esiti di esperimenti aleatori. Naturalmente la previsione è di tipo probabilistico:

Dettagli

Statistica. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Statistica. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Elementi di Inferenza Statistica La verifica di ipotesi V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Soriano nel Cimino (VT), 6 Ottobre 2009

Dettagli