5. Test per proporzioni: confronto tra campioni e associazione

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "5. Test per proporzioni: confronto tra campioni e associazione"

Transcript

1 BIOSTATISTICA 5. Test per proporzioni: confronto tra campioni e associazione Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO TEST PER PROPORZION - 6.1

2 1. Un solo campione: metodo esatto e approssimazione alla Normale 2. Confronto tra due o più proporzioni la variabile casuale chi quadro 3. Test per la bontà di adattamento di una distribuzione di probabilità ad una distribuzione empirica: il caso di probabilità stimata 4. Test per la bontà di adattamento di una distribuzione di probabilità ad una distribuzione empirica: il caso di probabilità teorica MARTA BLANGIARDO TEST PER PROPORZION - 6.2

3 1. Un solo campione: metodo esatto e approssimazione alla Normale Dalla teoria mendeliana dell ereditarietà ci si aspetta che certi incroci di varietà di baccelli producano baccelli gialli o verdi in rapporto di 3:1. In un particolare esperimento si ottengono 17 baccelli gialli e 5 verdi. Possiamo concludere che l esperimento supporta la teoria? MARTA BLANGIARDO TEST PER PROPORZION - 6.3

4 L esperimento produce solo due possibili risultati: giallo o verde Estraiamo un campione di n=22 incroci. Siamo interessati a valutare se la proporzione di baccelli verdi e gialli riscontrata nel campione riflette la teoria mendeliana H 0 : p verde = ¼ = 0.25 MARTA BLANGIARDO TEST PER PROPORZION - 6.4

5 Dati campionari: x (numero baccelli verdi) = 5 n = 22 Che valori può assumere X? La variabile di interesse (numero di baccelli verdi) è quantitativa discreta X = 0,1,2,3,,n i = baccello verde i =baccello giallo SUCCESSO INSUCCESSO Il nostro interesse è sulla proporzione di SUCCESSI MARTA BLANGIARDO TEST PER PROPORZION - 6.5

6 Variabile casuale binomiale X: numero di successi in un dato numero di prove n indipendenti Il risultato di ogni prova è S o I La probabilità di S (p) è la stessa in tutte le prove Contiamo il numero di successi in n prove 35 X ~ Binom(n,p) successi MARTA BLANGIARDO TEST PER PROPORZION - 6.6

7 X ~ Binom(n,p) P(X=x) = n x p x (1-p) n-x x = 0,1,2,.,n Media e Varianza µ x = np σ x2 = np(1-p) n=12, p=0.3 n=12, p=0.8 MARTA BLANGIARDO TEST PER PROPORZION - 6.7

8 Numerosità campionaria P(X=x) = n x p x (1-p) n-x Coefficiente binomiale Probabilità di successo n! n*n-1*n-2* 2*1 x! (n-x)! = (x*x-1* *2*1) [(n-x)*(n-x-1)* *2*1] 5 Fattoriale 5! 5*4*3*2*1 2 = 2! (5-2)! = (2*1) ((5-2)(5-3)(5-4)) Proprietà del fattoriale n 0 = 1 n n = 1 MARTA BLANGIARDO TEST PER PROPORZION - 6.8

9 L ipotesi è che p verde =0.25 Successo P(X=x) = 22 x 0.25 x (1-0.25) 22-x MARTA BLANGIARDO TEST PER PROPORZION - 6.9

10 P(X=5) = TEST PER PROPORZIONI Distribuzione esatta: dal campione ho n=22 e x= (1-0.25) 22-5 = Quanto è estremo il valore osservato nella distribuzione X ~ Binom(22,0.25) P(X 5) = P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4) +P(X=5)= Pvalue=2*0.4956= Evidenza a supporto dell ipotesi nulla H 0 : p verde = ¼ = 0.25 MARTA BLANGIARDO TEST PER PROPORZION

11 Se nel campione avessi osservato P(X=20)= x= (1-0.25) =1.18e -10 Quanto è estremo il valore osservato nella distribuzione X ~ Binom(22,0.25) P(X 20) = P(X=21)+P(X=22) = e-10 Pvalue=2* e-10 = e-10 Non sufficiente evidenza a supporto dell ipotesi nulla RIFIUTO H 0 : p verde = ¼ = 0.25 MARTA BLANGIARDO TEST PER PROPORZION

12 Quando n è abbastanza grande (>40) possiamo approssimare la distribuzione binomiale a quella normale X ~ Binom(200,0.2) In questo caso si possono utilizzare I valori tabulati per 1) intervalli di confidenza 2) test d ipotesi MARTA BLANGIARDO TEST PER PROPORZION

13 Dal campione ottengo p = n.successi n.prove Posso calcolare lo standard error campionario se( p) = p(1-p) n Non conosco p ma posso stimarla usando p se( p) = p(1-p) n E ottenere l intervallo di confidenza 95% Pr { p se(p) p p se( p) } = % Pr { p 2.57 se(p) p p se( p) } = 0.99 MARTA BLANGIARDO TEST PER PROPORZION

14 Un gruppo di medici ha studiato l effetto dell utilizzo di cravatte strette sul flusso di sangue che arriva alla testa. Il loro interesse è valutare come questo fatto influenzi la capacità del cervello di rispondere a stimoli visivi. Su un campione di 250 uomini d affari si è ottenuto che in 167 casi la cravatta troppo stretta influenza l abilità del cervello. Dal campione: n=250 x=167 p=? p=167/250 = se( p) = Per calcolare l intervallo di confidenza mi serve l errore standard che stimo: p(1-p) n =0.03 n>40 approssimo alla Normale Pr { * 0.03 p * 0.03 } = 0.95 IC = { } MARTA BLANGIARDO TEST PER PROPORZION

15 Dal campione: n=250 x=167 p=? p=167/250 = IC = { } p Possiamo concludere che ripetendo l esperimento 100 volte in 95 casi il p della popolazione è compreso nell intervallo { }. In 5 casi su 100 sbaglio stimando p con p. MARTA BLANGIARDO TEST PER PROPORZION

16 Dal campione ottengo p = n.successi n.prove se( p) = p(1-p) n Ipotesi nulla: H 0 : p=p 0 z p = p p 0 se(p) ~ N(0,1) P-value (1 coda) = Pr ( z >z p sotto H 0 ) P-value (2 code)= 2*Pr ( z >z p sotto H 0 ) MARTA BLANGIARDO TEST PER PROPORZION

17 Dal campione: n=250 x=167 p=167/250 = H 0 : p = TEST PER PROPORZIONI Dalla stessa popolazione di uomini d affari voglio valutare se l ipotesi che la proporzione di uomini con cravatta troppo stretta è 0.5 p p 0 z p = = 5.6 se(p) Per standardizzare p devo stimare l errore standard p(1-p) se( p) = n =0.03 Pr ( z >z p sotto H 0 ) = Pr(z>5.6 sotto H 0 ) Il test è a due code quindi P-value (2 code)= 2*Pr ( z >5.6 sotto H 0 ) MARTA BLANGIARDO TEST PER PROPORZION

18 Distribuzione normale standardizzata Tavole Pr(z >z p ) = 1-Pr(z<z p ) = 0 Excel =1-DISTRIB.NORM.ST(5.6)=0 P-value 2 code2*0=0 Concludiamo che c è evidenza contro H 0 P-value 2 code2*0=0 MARTA BLANGIARDO TEST PER PROPORZION

19 2. Confronto tra due o più proporzioni: la variabile casuale chi quadro In una sperimentazione clinica tesa a valutare l effetto di un nuovo farmaco nel trattamento dell infarto miocardico acuto, 80 pazienti sono stati assegnati casualmente al gruppo trattato con il farmaco in studio o al placebo Dopo 28 giorni dall episodio di infarto (e dall inizio dello specifico trattamento) 10 dei 40 pazienti trattati con il farmaco sono deceduti, contro 15 decessi verificatisi nei 40 pazienti trattati con placebo Questa sperimentazione offre sufficienti evidenze che il nuovo farmaco sia efficace nel trattamento dell infarto acuto? MARTA BLANGIARDO TEST PER PROPORZION

20 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI E1. In una sperimentazione clinica tesa a valutare l effetto di un nuovo farmaco nel trattamento dell infarto miocardico acuto, 80 pazienti sono stati assegnati casualmente al gruppo trattato con il farmaco in studio o al placebo Dopo 28 giorni dall episodio di infarto (e dall inizio dello specifico trattamento) 10 dei 40 pazienti trattati con il farmaco sono deceduti, contro 15 decessi verificatisi nei 40 pazienti trattati con placebo deceduti Tabella di contingenza 2 X 2 Pazienti trattati con il farmaco Pazienti di controllo vivi p 1 = 10 / 40 = = p 2 = 15 / 40 = = Questa sperimentazione offre sufficienti evidenze che il nuovo farmaco sia efficace nel trattamento dell infarto acuto? MARTA BLANGIARDO TEST PER PROPORZION

21 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Tabella di contingenza 2 X 2 Pazienti trattati con il farmaco Pazienti di controllo deceduti vivi p 1 = 10 / 40 = = p 2 = 15 / 40 = = p = 25 / 80 = = Ci si aspetta che la mortalità nei due gruppi differisca per effetto del caso (errore di campionamento) in assenza del quale: p 1 = p 2 = p = MARTA BLANGIARDO TEST PER PROPORZION

22 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Tabella di contingenza 2 X 2 Pazienti trattati con il farmaco Pazienti di controllo deceduti vivi p 1 = 10 / 40 = = p 2 = 15 / 40 = = p = 25 / 80 = = sotto: H 0 π 1 = π 2 = π MARTA BLANGIARDO TEST PER PROPORZION

23 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Tabella di contingenza 2 X 2 Pazienti trattati con il farmaco Pazienti di controllo deceduti vivi p 1 = 10 / 40 = = p 2 = 15 / 40 = = p = 25 / 80 = = Quanti pazienti trattati con il farmaco sarebbero morti se fossero sottoposti alla stessa mortalità dell intero gruppo sperimentale? = Pazienti trattati con il farmaco Pazienti di controllo deceduti vivi MARTA BLANGIARDO TEST PER PROPORZION

24 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Tabella di contingenza 2 X 2 Pazienti trattati con il farmaco Pazienti di controllo deceduti vivi p 1 = 10 / 40 = = p 2 = 15 / 40 = = p = 25 / 80 = = Quanti pazienti trattati con placebo sarebbero morti se fossero sottoposti alla stessa mortalità dell intero gruppo sperimentale? = Pazienti trattati con il farmaco Pazienti di controllo deceduti vivi MARTA BLANGIARDO TEST PER PROPORZION

25 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Tabella di contingenza 2 X 2 Pazienti trattati con il farmaco Pazienti di controllo Dati osservati deceduti vivi Tabella di contingenza 2 X 2 Pazienti trattati con il farmaco Pazienti di controllo Dati attesi deceduti vivi Test del chi-quadrato χ 2 = Σ i (O i - E i ) 2 g E i MARTA BLANGIARDO TEST PER PROPORZION

26 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Dati osservati Pazienti trattati con il farmaco Pazienti di controllo deceduti vivi Dati attesi Pazienti trattati con il farmaco Pazienti di controllo deceduti vivi χ 2 = Σ i (O i - E i ) 2 g E i ( ) 2 = ( ) ( ) 2 ( ) = MARTA BLANGIARDO TEST PER PROPORZION

27 Distribuzione chi-quadrato Chi quadro gdl MARTA BLANGIARDO TEST PER PROPORZION

28 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Perché 1 grado di libertà? Valore empirico: χ 2 = P-value = 0.2 < Pr(χ 2 2>1.45 sotto H0) < 0.25 > 0.05 Dovremmo accettare l ipotesi nulla (p > 0.05): le due proporzioni non differiscono significativamente Questa sperimentazione non offre sufficienti evidenze che il nuovo farmaco sia efficace nel trattamento dell infarto acuto MARTA BLANGIARDO TEST PER PROPORZION

29 Dati osservati Pazienti trattati con il farmaco Pazienti di controllo deceduti vivi Se si fissano i totali di riga e di colonna (marginali) mi basta inserire il valore di una cella e le altre le trovo per differenza Pazienti trattati con il farmaco Pazienti di controllo deceduti =15 25 vivi 40-10= = Quindi ho solo 1 grado di libertà MARTA BLANGIARDO TEST PER PROPORZION

30 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI In una sperimentazione clinica tesa a valutare l effetto di due nuovi farmaci (A e B) nel trattamento dell infarto miocardico acuto, 90 pazienti furono assegnati casualmente al gruppo trattato con il farmaco A, al gruppo trattato con il farmaco B o al placebo Dopo 28 giorni dall episodio di infarto (e dall inizio dello specifico trattamento) 10 dei 30 pazienti trattati con il farmaco A, 5 dei 30 pazienti trattati con il farmaco B e 15 dei 30 pazienti trattati con placebo sono deceduti Tabella di contingenza 2 X 3 deceduti vivi Farmaco Farmaco Placebo A B p A = 10 / 30 = = p B = 5 / 30 = = p P = 15 / 30 = = 0.5 Questa sperimentazione offre sufficienti evidenze che i diversi trattamenti determinino diversi effetti sulla sopravvivenza? MARTA BLANGIARDO TEST PER PROPORZION

31 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Tabella di contingenza 2 X 3 deceduti vivi Farmaco Farmaco Placebo A B p A = 10 / 30 = = p B = 5 / 30 = = p P = 15 / 30 = = sotto: H 0 π A = π B = π p = π 30/90=0.333 MARTA BLANGIARDO TEST PER PROPORZION

32 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Dati osservati Farmaco A Farmaco B Placebo deceduti vivi p A = 10 / 30 = p B = 5 / 30 = p P = 15 / 30 = p = 30 / 90 = Dati attesi sotto H = = = Farmaco A Farmaco B Placebo deceduti vivi MARTA BLANGIARDO TEST PER PROPORZION

33 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Dati osservati Farmaco A Farmaco B Placebo deceduti vivi Dati attesi deceduti Farmaco Farmaco Placebo A B vivi χ 2 = g Σ i (O i - E i ) 2 E i = MARTA BLANGIARDO TEST PER PROPORZION

34 6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI INDIPENDENTI Perché 2 gradi di libertà? Valore empirico: χ 2 = P-value = 0.025< Pr(χ 2 2 >6.11 sotto H 0 ) < 0.05 < 0.05 Dovremmo rigettare l ipotesi nulla (p < 0.05): le tre proporzioni differiscono significativamente Questa sperimentazione offre sufficienti evidenze che il diverso trattamento determina diverse mortalità nei pazienti con infarto acuto MARTA BLANGIARDO TEST PER PROPORZION

35 Dati osservati Farmaco A Farmaco B Placebo deceduti vivi In questo caso una cella non è sufficiente per ottenere tutte le altre per differenza. Ne servono 2 Dati osservati Farmaco A Farmaco B Placebo deceduti vivi = = = = Quindi ho 2 gradi di libertà 90 In generale i gdl si ottengono come (n.righe-1)*(n.colonne-1) MARTA BLANGIARDO TEST PER PROPORZION

36 ESERCIZIO di RIEPILOGO 1 In una popolazione di bambini in età prescolare si vuole verificare se la percentuale di bambini affetti da dislessia è pari al 10%. Per questo motivo si estrae un campione di 200 bambini e si ottiene che quelli dislessici sono 40. Saggiare l ipotesi nulla ESERCIZIO di RIEPILOGO 2 Si vuole verificare se l effetto di tre diete è equivalente nel ridurre il peso in una popolazione di bambini. A tal fine si estraggono 3 campioni di 20, 30 e 40 bambini e si assegna loro rispettivamente la dieta A, B e C. Definiamo che la dieta ha effetto se riduce il peso di almeno 5 Kg. Il numero di riduzioni di peso nei tre campioni è rispettivamente 10, 12 e 18 MARTA BLANGIARDO TEST PER PROPORZION

37 MARTA BLANGIARDO TEST PER PROPORZION

38 ESERCIZIO di RIEPILOGO 2 Si vuole verificare se l effetto di tre diete è equivalente nel ridurre il peso in una popolazione di bambini. A tal fine si estraggono 3 campioni di 20, 30 e 40 bambini e si assegna loro rispettivamente la dieta A, B e C. Definiamo che la dieta ha effetto se riduce il peso di almeno 5 Kg. Il numero di riduzioni di peso nei tre campioni è rispettivamente 10, 12 e 18 MARTA BLANGIARDO TEST PER PROPORZION

39 3. Test per la bontà di adattamento di una distribuzione di probabilità ad una distribuzione empirica: il caso di probabilità teorica Dalla teoria mendeliana: Baccelli verdi e lisci Rugosi e verdi (RV) Lisci e verdi (LV) Rugosi e gialli (RG) Lisci e gialli (LG) 1/16 3/16 3/16 9/16 Baccelli gialli e rugosi MARTA BLANGIARDO TEST PER PROPORZION

40 Distribuzione teorica Rugosi e verdi (RV) Lisci e verdi (LV) Rugosi e gialli (RG) Lisci e gialli (LG) 1/16 3/16 3/16 9/16 Da un campione di 160 incroci si ottengono i seguenti risultati: Rugosi e verdi (RV) Lisci e verdi (LV) Rugosi e gialli (RG) Lisci e gialli (LG) N=160 I dati supportano la teoria mendeliana? MARTA BLANGIARDO TEST PER PROPORZION

41 Vogliamo testare la seguente ipotesi H 0 : p 1 =1/16, p 2 =3/16, p 3 =3/16, p 4 =9/16 Se H 0 è vera: RV LV RG LG = = = =90 16 Utilizziamo nuovamentre la statistica chi quadrato Test del chi-quadrato χ 2 = Σ i (O i - E i ) 2 g E i MARTA BLANGIARDO TEST PER PROPORZION

42 Rugosi e verdi (RV) 8 6. TEST PER PROPORZIONI Valori osservati Lisci e verdi (LV) 32 Rugosi e gialli (RG) 27 Valori attesi sotto H0 Lisci e gialli (LG) 93 RV LV RG LG χ 3 2 (8-10) 2 = (32-30) 2 30 (27-30) 2 (93-90) = I gradi di libertà sono ncat-1 (nel nostro caso 4-1=3) MARTA BLANGIARDO TEST PER PROPORZION

43 Distribuzione chi-quadrato gdl Il Pvalue è compreso tra questi due valori P-value = Pr(χ 2 3 >0.93 sotto H 0 ) 0.85 > 0.05 Non abbiamo abbastanza evidenza per rifiutare H 0 MARTA BLANGIARDO TEST PER PROPORZION

44 4. Test per la bontà di adattamento di una distribuzione di probabilità ad una distribuzione empirica: il caso di probabilità stimata Stima dei parametri della popolazione partendo dai dati campionari Assunzioni sulla forma della distribuzione dei parametri E utile verificare tali assunzioni valutando quanto i valori osservati si discostano dalla distribuzione teorica Confronto tramite chi quadrato delle frequenze osservate e attese sotto la distribuzione teorica MARTA BLANGIARDO TEST PER PROPORZION

45 Strategia: 1) Scelta della distribuzione di probabilità adatta a descrivere il fenomeno in studio 2) Calcolo delle probabilità associate ai valori che la variabile in studio assume nel campione 3) Calcolo delle frequenze attese π i. O 4) Valutazione tramite chi quadrato delle discrepanze tra frequenze osservate (O i ) ed attese π i.o χ 2 = Σ (O i π i O) 2 g π i O MARTA BLANGIARDO TEST PER PROPORZION

46 Verifica dell adattamento ad una distribuzione Binomiale Sono stati raccolti i dati relativi al numero di figlie femmine in 103 famiglie di 4 figli. Il rapporto tra maschi e femmine è atteso di ½:½. 1) Scelta della distribuzione di probabilità adatta a descrivere il fenomeno in studio Variabile casuale dicotomica Successo: figlia femmina Variabile casuale teorica: Binomiale X~Binom(n,p) X~Binom(4,0.5) MARTA BLANGIARDO TEST PER PROPORZION

47 2) Sappiamo che π i =0.5 sotto H 0 Valori osservati nel campione X O i Osservati MARTA BLANGIARDO TEST PER PROPORZION

48 3) Calcolo delle probabilità associate ai valori che la variabile in studio assume nel campione P(X=x) = 4 x 0.5 x (1-0.5) 4-x X O i π i (1/2) 4 = (1/2) 1. (1/2) 3 = (1/2) 2. (1/2) 2 = (1/2) 3. (1/2) 1 = 0.25 (1/2) 4. (1/2) 0 = MARTA BLANGIARDO TEST PER PROPORZION

49 4) Calcolo delle frequenze attese π i. O X O i π i π i.o 0 5 (1/2) 4 = = (1/2) 1. (1/2) 3 = = (1/2) 2. (1/2) 2 = = (1/2) 3. (1/2) 1 = = (1/2) 4. (1/2) 0 = = Osservati Attesi MARTA BLANGIARDO TEST PER PROPORZION

50 5) Valutazione tramite chi quadrato delle discrepanze tra frequenze osservate (O i ) ed attese π i.o χ 2 = Σ (O i π i O) 2 g π i O (5-6.44) 2 = 6.44 ( ) ( ) 2 ( ) ( ) + 2 = Il numero di gdl è ncat-1 = 5-1 = 4 Da excel: =DISTRIB.CHI(6.191,4) P-value = Pr(χ 2 4 >6.191 sotto H 0 ) 0.18 > 0.05 MARTA BLANGIARDO TEST PER PROPORZION

51 Possiamo concludere che la differenza tra la distribuzione osservata e quella teorica (Binomiale di parametro 0.5 in 4 prove) non è significativa MARTA BLANGIARDO TEST PER PROPORZION

52 Verifica dell adattamento ad una distribuzione Poisson Si desidera conoscere la distribuzione di una variante rara di una certa pianta in una determinata regione. Per fare cio la regione viene suddivisa in aree di uguale grandezza e si conta il numero di elementi della variante in studio. 1) Scelta della distribuzione di probabilità adatta a descrivere il fenomeno in studio Variabile casuale discreta, ma NON dicotomica Evento RARO Variabile casuale teorica: Poisson X~Poisson(λ) MARTA BLANGIARDO TEST PER PROPORZION

53 Distribuzione Poisson Caratterizzata da un parametro Distribuzone usata per gli eventi rari X~Poisson(λ) E(X) = λ Var(X) = λ X~Poisson(5) X~Poisson(3) E(X)=5 Var(X)=5 E(X)=3 Var(X)=3 MARTA BLANGIARDO TEST PER PROPORZION

54 2) Non conosciamo i valori di π i nella popolazione: dobbiamo stimarli Valori osservati nel campione X >3 O i Osservati MARTA BLANGIARDO TEST PER PROPORZION

55 2) Non conosciamo i valori di π i nella popolazione: dobbiamo stimarli Una stima di λ è x (media campionaria): x = Σx i O i ΣO i x = = X~Poisson(0.7241) MARTA BLANGIARDO TEST PER PROPORZION

56 3) Calcolo delle probabilità associate ai valori che la variabile in studio assume nel campione X~Poisson(0.7241) P(X=x) = λx e -λ x! X O i π i e = e (0.7241) 1 = e ! = e (0.7241) 2 /2= e (0.7241) 3 /6= > = MARTA BLANGIARDO TEST PER PROPORZION

57 4) Calcolo delle frequenze attese π i. O X O i π i π i.o 0 39 e = = e (0.7241) 1 = = e (0.7241) 2 /2= = e (0.7241) 3 /6= =2.66 > = = Osservati Attesi >3 MARTA BLANGIARDO TEST PER PROPORZION

58 5) Valutazione tramite chi quadrato delle discrepanze tra frequenze osservate (O i ) ed attese π i.n (o p i.n se i parametri sono ignoti nella popolazione) χ 2 = Σ (O i π i O) 2 g π i O + = ( ) (1-2.66) ( ) 2 ( ) (0-0.54) + 2 = Il numero di gdl è n.cat-2 = 5-2 = 3 Da excel: =DISTRIB.CHI(2.5094,3) P-value = Pr(χ 2 3 > sotto H 0 ) 0.47 > 0.05 MARTA BLANGIARDO TEST PER PROPORZION

59 Possiamo concludere che la differenza tra la distribuzione osservata e quella teorica (Poisson di parametro ) non è significativa PROBLEMA: come mai abiamo usato un chi quadro con 3 gradi di libertà? Il numero di gdl è n.cat-2 = 5-2 = 3??? MARTA BLANGIARDO TEST PER PROPORZION

60 Abbiamo visto precedentemente che i gradi di libertà erano calcolati come N.obs-1 (nel caso della T di Student) N.cat-1 (n.righe-1)(n.col-1) Nel caso del chi quadro In questo caso abbiamo un ulteriore vincolo dato dal fatto che DOBBIAMO stimare λ tramite i dati campionari (y). Quindi: 1. ΣO i =O 2. Σx i O i = y gdl = n.cat - 2 ΣO i Una regola universale: il numero di gradi di libertà è sempre uguale al numero di osservazioni MENO il numero di relazioni tra le osservazioni che abbiamo la necessità di ottenere MARTA BLANGIARDO TEST PER PROPORZION

61 Verifica dell adattamento ad una distribuzione Normale In un campione di piante da fiore viene misurata la lunghezza della corolla (in mm); si desidera conoscere la sua distribuzione. 1) Scelta della distribuzione di probabilità adatta a descrivere il fenomeno in studio Variabile casuale continua Ci si aspetta simmetria nella distribuzione Variabile casuale teorica: Normale X~N(µ,σ 2 ) f ( x µ ) 1 2 2σ ( x) = e 2 2πσ 2 MARTA BLANGIARDO TEST PER PROPORZION

62 X~N(µ,σ 2 ) f ( x µ ) 1 2 2σ ( x) = e 2 2πσ 2 Z~N(0,1) Standardizzazione f ( z) = 1 2π e 2 z 2 Per standardizzare devo stimare µ e σ 2 dal campione: µ x = Σx i O i ΣO i = σ 2 s 2 = Σ(x i -x) 2 O i (ΣO i )-1 = MARTA BLANGIARDO TEST PER PROPORZION

63 Verifica dell adattamento ad una Distribuzione normale standardizzata distribuzione Normale Suddividere l intero campo di variazione in intervalli. E conveniente che il valore centrale sia un numero intero. 2. Calcolare la frequenza osservata in ogni classe z x a - x b (x a +x b )/ O i MARTA BLANGIARDO TEST PER PROPORZION

64 3. Standardizzare usando l estremo superiore di ogni classe f ( z) = 1 2π e 2 z x a - x b (x a +x b )/2 O i z oo MARTA BLANGIARDO TEST PER PROPORZION

65 4. Determinare la funzione cumulata I corrispondenza dei limiti superiori di ogni classe (per l ultima classe porre=1) x a - x b (x a +x b )/2 61 O i 5 z F i oo Usando le tavole MARTA BLANGIARDO TEST PER PROPORZION

66 5. Per differenze determinare le frequenze attese relative π i F i F i-1 x a - x b (x a +x b )/2 O i z F i π i oo MARTA BLANGIARDO TEST PER PROPORZION

67 6. Calcolare le frequenze attese π i O x a - x b20 (x a +x b )/2 O i z F i π i π i O oo MARTA BLANGIARDO TEST PER PROPORZION

68 6. Confrontare le frequenze osservate e attese tramite il chi quadro χ 2 = Σ (O i π i O) 2 g π i O (5-4.55) 2 = 4.55 ( ) ( ) 2 ( ) (8-8.38) + 2 = Il numero di gdl è n.cat-3 = 5-3 = 2 Da excel: =DISTRIB.CHI(2.5094,2) P-value = Pr(χ 2 2 >0.777 sotto H 0 ) 0.67 > 0.05 MARTA BLANGIARDO TEST PER PROPORZION

69 Possiamo concludere che la differenza tra la distribuzione osservata e quella teorica (Normale di parametri µ=67.45 e σ=2.93) non è significativa MARTA BLANGIARDO TEST PER PROPORZION

Il test (o i test) del Chi-quadrato ( 2 )

Il test (o i test) del Chi-quadrato ( 2 ) Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero

Dettagli

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI IL PROBLEMA Si vuole verificare se un nuovo trattamento per la cura dell otite è più efficace

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Note sulla probabilità

Note sulla probabilità Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI. Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

DISTRIBUZIONI DI PROBABILITA

DISTRIBUZIONI DI PROBABILITA DISTRIBUZIONI DI PROBABILITA Nell associare ai risultati di un esperimento un valore numerico si costruisce una variabile casuale (o aleatoria, o stocastica). Ogni variabile casuale ha una corrispondente

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 27 Outline 1 () Statistica 2 / 27 Outline 1 2 () Statistica 2 / 27 Outline 1 2 3 () Statistica 2 /

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE 1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata; di : dado : normale Finora abbiamo visto test d ipotesi per testare ipotesi differenti, ma tutte concernenti il valore atteso di una o due popolazioni. In questo capitolo vediamo come testare 1 l ipotesi

Dettagli

Vedi: Probabilità e cenni di statistica

Vedi:  Probabilità e cenni di statistica Vedi: http://www.df.unipi.it/~andreozz/labcia.html Probabilità e cenni di statistica Funzione di distribuzione discreta Istogrammi e normalizzazione Distribuzioni continue Nel caso continuo la probabilità

Dettagli

C.I. di Metodologia clinica

C.I. di Metodologia clinica C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni

Dettagli

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA AZIENDALE Modulo Controllo di Qualità STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Esercitazione 8 del corso di Statistica 2

Esercitazione 8 del corso di Statistica 2 Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,

Dettagli

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità. Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale Corso di laurea in biotecnologie

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Analisi degli Errori di Misura. 08/04/2009 G.Sirri Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

DISTRIBUZIONI DI PROBABILITA

DISTRIBUZIONI DI PROBABILITA DISTRIBUZIONI DI PROBABILITA La distribuzione di probabilità e un modello matematico, uno schema di riferimento, che ha caratteristiche note e che può essere utilizzato per rispondere a delle domande derivate

Dettagli

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1 . Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

Chi-quadro. sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria

Chi-quadro. sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria Chi-quadro In generale, se sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria si distribuisce secondo una distribuzione Chi-quadro con k gradi di libertà Chi-quadro Dunque

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) STATISTICA (2) ESERCITAZIONE 5 26.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un azienda che

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

Test d Ipotesi Introduzione

Test d Ipotesi Introduzione Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto

Dettagli

Distribuzioni di probabilità

Distribuzioni di probabilità Distribuzioni di probabilità Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

FENOMENI CASUALI. fenomeni casuali

FENOMENI CASUALI. fenomeni casuali PROBABILITÀ 94 FENOMENI CASUALI La probabilità si occupa di fenomeni casuali fenomeni di cui, a priori, non si sa quale esito si verificherà. Esempio Lancio di una moneta Testa o Croce? 95 DEFINIZIONI

Dettagli

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

1. Introduzione ai disegni sperimentali. 5. Analisi della regressione lineare. 6. Confronto tra proporzioni di due o più campioni indipendenti

1. Introduzione ai disegni sperimentali. 5. Analisi della regressione lineare. 6. Confronto tra proporzioni di due o più campioni indipendenti BIOSTATISTICA 1. Introduzione ai disegni sperimentali 2. Un carattere quantitativo misurato in un campione: elementi di statistica descrittiva e inferenziale 3. Confronto tra medie di due campioni indipendenti

Dettagli

UNIVERSITÀ DEGLI STUDI DI PERUGIA

UNIVERSITÀ DEGLI STUDI DI PERUGIA SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n

Dettagli

Elementi di base su modello binomiale e modello normale

Elementi di base su modello binomiale e modello normale Elementi di base su modello binomiale e modello normale (alcune note) Parte 1: il modello binomiale Di fondamentale importanza nell analisi della qualità sono i modelli. I due principali modelli statistico-probablistici

Dettagli

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003 Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore

Dettagli

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Matematica II: Calcolo delle Probabilità e Statistica Matematica Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie

Dettagli

Esercizi riassuntivi di Inferenza

Esercizi riassuntivi di Inferenza Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del

Dettagli

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016 Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione

Dettagli

distribuzione della popolazione campionata distribuzione di quantità che dipendono dal campione (distribuzioni campionarie)

distribuzione della popolazione campionata distribuzione di quantità che dipendono dal campione (distribuzioni campionarie) Obiettivi lezione 4 CAPIRE: distribuzione della popolazione campionata distribuzione di quantità che dipendono dal campione (distribuzioni campionarie) CONOSCERE: Le distribuzioni della media campionaria,

Dettagli

Concetti principale della lezione precedente

Concetti principale della lezione precedente Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale

Dettagli

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta): ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva

Dettagli

Gli errori nella verifica delle ipotesi

Gli errori nella verifica delle ipotesi Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E

Dettagli

Statistica. Lezione 8

Statistica. Lezione 8 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di

Dettagli

Teoria e tecniche dei test

Teoria e tecniche dei test Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario

Dettagli

standardizzazione dei punteggi di un test

standardizzazione dei punteggi di un test DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la

Dettagli

Variabili aleatorie gaussiane

Variabili aleatorie gaussiane Variabili aleatorie gaussiane La distribuzione normale (riconoscibile dalla curva a forma di campana) è la più usata tra tutte le distribuzioni, perché molte distribuzioni che ricorrono naturalmente sono

Dettagli

Esercitazione

Esercitazione Esercitazione 2 22.5.2014 (AVVISI) RIEPILOGO STATISTICHE (NOTA) TEST DEL CHI2 Accedere alle macchine con LOGIN: esame PASSWORD: didattica AVVISO Valutazione prova intercorso Vincolo di accesso alla seconda

Dettagli

Test di ipotesi su due campioni

Test di ipotesi su due campioni 2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,

Dettagli

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

STATISTICA: esercizi svolti sulle VARIABILI CASUALI STATISTICA: esercizi svolti sulle VARIABILI CASUALI VARIABILI CASUALI 2 VARIABILI CASUALI. Variabili casuali generiche. Si supponga che un dado truccato, formato da sei facce contrassegnate dai numeri

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 52 Adattamento di una distribuzione

Dettagli

METODO DEI MINIMI QUADRATI

METODO DEI MINIMI QUADRATI METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità

Dettagli

Proprietà della varianza

Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,

Dettagli

Analisi congiunta di più fenomeni

Analisi congiunta di più fenomeni Analisi congiunta di più fenomeni Dati relativi al disastro del Titanic: Morti Sopravvissuti Classe Sesso Età 1 a Uomini Bambini 0 5 Adulti 118 57 Donne Bambini 0 1 Adulti 4 140 2 a Uomini Bambini 0 11

Dettagli

Matematica Applicata L-A Definizioni e teoremi

Matematica Applicata L-A Definizioni e teoremi Definizioni e teoremi Settembre - Dicembre 2008 Definizioni e teoremi di statistica tratte dalle lezioni del corso di Matematica Applicata L- A alla facoltà di Ingegneria Elettronica e delle Telecomunicazioni

Dettagli

Esercitazione 4 del corso di Statistica (parte 2)

Esercitazione 4 del corso di Statistica (parte 2) Esercitazione 4 del corso di Statistica (parte ) Dott.ssa Paola Costantini Febbraio Esercizio n. Il tempo di percorrenza del treno che collega la stazione di Roma Termini con l aeroporto di Fiumicino è

Dettagli

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, ) Università degli Studi di Milano Bicocca Scuola di Economia e Statistica Corso di Laurea in Economia e Amministrazione delle Imprese (ECOAMM) Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE

Dettagli

normopeso <=25 sovrappeso 25-29.9 obesità I 30-34.9 obesità II 35-39.9 obesità III >=40

normopeso <=25 sovrappeso 25-29.9 obesità I 30-34.9 obesità II 35-39.9 obesità III >=40 E stato condotto uno studio relativo all effetto di una dieta sul BMI Body mass index in relazione al grado di obesità in un campione di adulti maschi avente le seguenti classi normopeso

Dettagli

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densità), si può far ricorso nell analisi statistica alla

Dettagli

Statistica. Lezione 4

Statistica. Lezione 4 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 4 a.a 2011-2012 Dott.ssa Daniela

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Capitolo 5 Confidenza, significatività, test di Student e del χ 2

Capitolo 5 Confidenza, significatività, test di Student e del χ 2 Capitolo 5 Confidenza, significatività, test di Student e del χ 5.1 L inferenza Se conosciamo la legge di probabilità di un evento (a priori o a posteriori) possiamo fare delle previsioni su come l evento

Dettagli

Test delle ipotesi sulla media.

Test delle ipotesi sulla media. . Caso di un singolo campione. Varianza nota.. Ipotesi alternativa bilaterale Test delle ipotesi sulla media. Valore medio η e deviazione standard σ della popolazione note. η è il valore stimato dal nostro

Dettagli

Variabile Casuale Normale

Variabile Casuale Normale Variabile Casuale Normale Variabile Casuale Normale o Gaussiana E una variabile casuale continua che assume tutti i numeri reali, è definita dalla seguente funzione di densità: 1 f( x) = e σ 2 π ( x µ

Dettagli

Capitolo 6. La distribuzione normale

Capitolo 6. La distribuzione normale Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

La SCALA di Probabilità varia tra 0.00 e 1.00.

La SCALA di Probabilità varia tra 0.00 e 1.00. CHE COS E LA PROBABILITA La probabilità è la MISURA dell incertezza di un evento, cioè come noi classifichiamo gli eventi rispetto alla loro incertezza. La SCALA di Probabilità varia tra 0.00 e 1.00. 0.00

Dettagli