Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi :

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi :"

Transcript

1 Università del Piemonte Orientale Corsi di laurea di area tecnica Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 1 Consideriamo diverse situazioni, tutte riconducibili all analisi di una variabile quantitativa con il confronto tra diversi gruppi di soggetti: A. Confronto tra una media campionaria ed una popolazione i cui parametri sono noti B. Confronto tra una media campionaria ed una popolazione di cui è nota la media ma non la deviazione standard C. Confronto tra campioni appaiati D. Confronto tra due campioni indipendenti E. Confronto tra n campioni indipendenti F. Confronto tra misure ripetute sugli stessi soggetti Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie

2 I casi A e B sono già stati esaminati nella lezione sulle statistiche campionarie Il caso E corrisponde all'analisi della varianza Il caso F non sarà considerato in questo corso. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 3 Riepilogo del caso A: Confronto tra una media campionaria ed una popolazione i cui parametri sono noti Siamo interessati al confronto tra la media campionaria e la media della popolazione. I parametri della distribuzione di probabilità della variabile nella popolazione (µ e σ) sono noti. Il processo di verifica dell ipotesi si svolge secondo quanto visto in precedenza: L ipotesi di lavoro: il campione non è parte dalla popolazione considerata ma di un altra popolazione, con media differente. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 4

3 L ipotesi nulla: il campione estratto ha media uguale a quella della popolazione (corrisponde cioè ad un campione tratto da tale popolazione). L' errore di primo tipo è fissato al 5% (α=0,05) L' errore di secondo tipo e la dimensione del campione vengono definiti in modo appropriato, ad esempio l'errore di secondo tipo viene fissato al 0% e la dimensione del campione è definita di conseguenza usando apposite tavole (l'argomento non è ancora stato trattato). L esperimento consiste nell estrazione di un campione e nel calcolo della media campionaria. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 5 Il test statistico consiste nel calcolo della deviata normale standardizzata: Z = ( X Dove - µ)/ (σ/ n). X : media campionaria µ: media della popolazione (σ/ n): errore standard della media (cioè deviazione standard della media campionaria) σ: deviazione standard della popolazione n: numerosità del campione Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 6

4 Il test è di tipo parametrico, cioè è valido a condizione che siano validi i presupposti relativi alla distribuzione di probabilità (gaussiana) della distribuzione delle medie campionarie. L assunzione è generalmente vera dato il teorema del limite centrale (sempre che n sia sufficientemente grande e la forma della distribuzione della popolazione non sia troppo asimmetrica). Nel calcolo della dimensione del campione occorre quindi anche considerare che la distribuzione di frequenza di campioni piccoli si differenzia dalla distribuzione gaussiana maggiormente rispetto alla distribuzione di frequenza di campioni grandi. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 7 Il valore di probabilità corrispondente al valore Z (valore assoluto di Z) così ottenuto si legge dalla tabella della distribuzione normale standard. Se Z>0 viene letto il valore di probabilità compreso tra Z e. Se Z<0 viene letto il valore di probabilità compreso tra Z e -. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 8

5 Esempio 1 Confronto della pressione sistolica di un gruppo di pazienti affetti da una forma di arteriopatia con la popolazione generale. H lavoro= i soggetti considerati, affetti da una rara malattia delle arterie hanno pressione arteriosa (sistolica) diversa dalla popolazione generale. L ipotesi è nata osservando che i primi casi avevano valori pressori molto elevati. H 0 = i pazienti appartengono ad una popolazione con media della pressione sistolica 145 mmhg La deviazione standard della misura della pressione della popolazione è nota da precedenti studi ed è pari a,53 mmhg; Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 9 test bilaterale ('a due code'; sebbene l ipotesi di lavoro sia indirizzata maggiormente verso un rialzo pressorio, non ho informazioni sufficientemente forti da scegliere un test ad una coda). errore 1 tipo =0,05 numerosità campionaria non modificabile poichè sono inclusi tutti i pazienti disponibili. Non è stata calcolata la potenza statistica Test statistico: test Z (confronto tra una media campionaria e la media della popolazione). Il valore del test si legge sulle tabelle della distribuzione di probabilità normale standard. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 10

6 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 11 Requisiti del test scelto: La deviazione standard della misura della pressione della popolazione è nota da precedenti studi ed è pari a,53 mmhg; La distribuzione della variabile nella popolazione è gaussiana, pertanto anche piccoli campioni saranno distribuiti secondo tale distribuzione. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 1

7 I dati: Obs pressure (mmhg) Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 13 Le statistiche campionarie necessarie per il test N (dimensione campionaria) 15 Media campionaria 149,14 mmhg (calcolo omesso) I parametri necessari per il test µ = 145 mmhg σ =,53 mmhg Memo: Il valore della statistica Z corrispondente al limite per il rifiuto dell ipotesi nulla (dati errore 1 tipo <= 0,05 e test a due code) è 1,960. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 14

8 Il calcolo del test Z = ( X - µ) / (σ/ n). Z = (149,14-145) / (,53/ 15) = 6,34 Conclusione =? Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 15 Il calcolo del test Z = ( X - µ)/ (σ/ n). Z = (149,14-145) / (,53/ 15) = 6,34 Conclusione = rifiuto l ipotesi nulla, i soggetti hanno valori pressori diversi da quelli della popolazione generale. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 16

9 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 17 Esempio Una compagnia di assicurazioni intende controllare quali agenzie sono troppo severe oppure troppo disponibili nella valutazione dei danni. Viene effettuato un campione delle pratiche seguite da ciascuna agenzia. Per rendere omogenea la popolazione di provenienza vengono esclusi gli incidenti con feriti e quelli in autostrada. Il costo medio nella popolazione (tutte le pratiche della compagnia di assicurazione) (in migliaia di euro) = 1,6. Deviazione standard della popolazione (in migliaia di euro) = 3,4 H lavoro: L'agenzia xxyy si discosta dai parametri definiti sulla base della popolazione di tutti gli incidenti dell'anno in corso. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 18

10 H 0 : l'agenzia non si discosta. test a due code (interessano entrambi gli scostamenti) errore 1 tipo = 0,10 (dato il piano di lavoro di controllo) numerosità campionaria pratiche. Test statistico: test Z (confronto tra una media campionaria e la media della popolazione) Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 19 Requisiti del test scelto: La deviazione standard del costo medio è nota, poichè il centro di calcolo della compagnia ha tutte le pratiche. La distribuzione della variabile nella popolazione è asimmetrica con coda a destra (valori elevati), come indicato dal centro di calcolo. Viene effettuata una trasformazione logaritmica per renderla simile alla gaussiana: dopo la trasformazione anche la distribuzione di probabilità di piccoli campioni risulta gaussiana. Il centro di calcolo fornisce µ e σ della popolazione Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 0

11 I dati Obs costo 1 1,6 1,3 3 0, 4 3,0 5,0 6 0,3 7 1,3 8 0,6 9,7 10 0,9 11 5,0 Obs costo 1 1,8 13 1,3 14 1, 15 0,8 16,5 17,0 18 1, 19 7,4 0 0,3 1 0,5 1,1 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 1 Variable: costo Stem Leaf # Boxplot * *--+--* Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie

12 Dati trasformati su scala logaritmica Obs costo log(costo) Obs costo log(costo) 1 1,6 0, ,3 0, , -1, ,0 1, ,0 0, ,3-1, ,3 0, ,6-0, ,7 0, ,9-0, ,0 1, ,8 0, ,3 0, , 0, ,8-0,314 16,5 0, ,0 0, , 0, ,4, ,3-1, ,5-0, ,1 0,09531 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 3 Variable: lcosto Stem Leaf # Boxplot *--+--* Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 4

13 Variable: log(costo) (log e del costo) Moments N Mean 0,16379 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 5 Il calcolo del test Media e deviazione standard della popolazione calcolati dai logaritmi dei dati originali. µ = 0,6364 σ = 0, X = 0,16 Z = ( X - µ )/ (σ / n) Z = (0,16-0,6364) / (0,875469/ ) = - 0,484 p=0,401 Conclusione = non rifiuto l ipotesi nulla, quindi l agenzia non si discosta dai parametri definiti. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 6

14 Riepilogo del caso B: Confronto tra una media campionaria ed una popolazione di cui non si conosce la deviazione standard. Se non abbiamo informazioni sul parametro (il valore nella popolazione), usiamo la statistica campionaria, che è stata calcolata proprio per avere informazioni relative al valore (ignoto) del parametro nella popolazione. Si ricorda che l atteso della varianza campionaria calcolata con (n-1) al denominatore è una stima non distorta della varianza della popolazione. La varianza del campione però è affetta da variabilità casuale rispetto alla varianza della popolazione, a causa del campionamento. Pertanto non potremo usare statistiche basate sulla distribuzione normale standardizzata, che risulterebbe troppo poco conservativa ma dovremo usare la distribuzione t di Student. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 7 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 8

15 La probabilità corrispondente all intervallo tra un dato t e si legge su apposite tabelle (es. Appendice del testo consigliato). Si noti che i valori di probabilità cumulativa esterni ad un dato valore di t sono maggiori man mano che si riduce il numero di gradi di libertà. La distribuzione t per 30 gradi di libertà è praticamente una distribuzione normale standardizzata. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 9 Confronto tra un campione e la media della popolazione La formula del test è simile a quella già vista per il calcolo del test Z, con l'errore standard calcolato dalla deviazione standard del campione: t gl = ( - µ)/ (s/ n). X X : media campionaria µ: media della popolazione s: deviazione standard del campione (s/ n): errore standard della media (cioè dev. standard della media campionaria) n: numerosità del campione il numero di gradi di libertà è gl= n-1 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 30

16 Il test è di tipo parametrico, cioè è valido a condizione che: la distribuzione delle medie campionarie sia gaussiana; il campione stimi la varianza della popolazione. La prima assunzione è generalmente vera dato il teorema del limite centrale (sempre che n sia sufficientemente grande e la forma della distribuzione della popolazione non sia troppo asimmetrica). La seconda assunzione è vera se vale H 0 (il campione appartiene alla popolazione), mentre non è valutabile altrimenti. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 31 Esempio Confronto della pressione sistolica tra un gruppo di pazienti affetti da una forma di arteriopatia con la popolazione generale (è l esempio precedente, sviluppato senza fare uso dell informazione sulla deviazione standard della popolazione). Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 3

17 H lavoro= i soggetti considerati, affetti da una rara malattia delle arterie hanno pressione arteriosa (sistolica) diversa dalla popolazione generale. L ipotesi è nata osservando che i primi casi diagnosticati avevano valori pressori molto elevati H 0 = media della popolazione: pressione sistolica 145 mmhg test a due code (sebbene l ipotesi di lavoro sia indirizzata maggiormente verso un rialzo pressorio, non ho informazioni sufficientemente forti da scegliere un test ad una coda) errore 1 tipo = 0,05 numerosità campionaria non modificabile poiché sono inclusi tutti i pazienti disponibili. Non è stata calcolata la potenza statistica Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 33 Test statistico: test t (confronto tra una media campionaria e la media della popolazione, senza dati sulla deviazione standard della popolazione). Verifica dei requisiti del test scelto: La deviazione standard della misura della pressione della popolazione non è nota. La distribuzione della variabile nella popolazione è gaussiana, pertanto anche piccoli campioni saranno distribuiti secondo tale distribuzione. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 34

18 I dati individuali: Obs pressure (mmhg) Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 35 Le statistiche campionarie N 15 Mean 149,13 Std Deviation 10,7 Variance 114,98 (nota: si tratta di un campione 'sfortunato' poichè la varianza del campione è attesa simile a quella della popolazione). Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 36

19 I dati necessari per il test µ = 145 mmhg media campione = 149,13 s = Std Deviation = 10,7 dimensione del campione = 15 numero di gradi di libertà = 14 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 37 Il calcolo del test t 14 = (X - µ)/ (s/ n). t 14 = (149,13-145) / (10,7/ 15) = = 1,496 Conclusione = non rifiuto l ipotesi nulla. NB: Il valore della statistica t corrispondente al limite per il rifiuto dell ipotesi nulla (errore 1 tipo <= 0,05 e test a due code, 14 g.l.) =,145 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 38

20 1,496 t Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 39 Ricalcolate il test sul seguente campione Obs pressure (mmhg) Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 40

21 C. Confronto tra due campioni appaiati Parliamo di campioni appaiati quando ad ogni osservazione del primo gruppo corrisponde un'osservazione del secondo gruppo. E' una tecnica per ridurre l'influenza sui risultati da parte di variabili estranee Due possibilità: misure ripetute nello stesso soggetto soggetti diversi ma appaiati perché simili per caratteristiche importanti (es della stessa età, sesso, luogo di nascita e professione) Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 41 L'ipotesi alternativa (di lavoro) è di solito: H 1 : µ 1 µ e la corrispondente ipotesi nulla è: H 0 : µ 1 = µ quindi H 0 : µ 1 - µ =0 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 4

22 In questo caso conviene costruire il test sulle differenze dei valori tra le coppie di misure appaiate. Indichiamo la media delle differenze nella popolazione con δ L'ipotesi alternativa (di lavoro) è: H 1 : δ 0 e l'ipotesi nulla è: H 0 : δ = 0 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 43 Calcolo le differenze per le coppie di misure d i = x i1 -x i calcolo quindi media e deviazione standard di d nel campione, usando le formule consuete. Media d n i= 1 = = n d i Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 44

23 Deviazione_ st. = s = n i= 1 ( d d) i ( n 1) Calcolo infine l'errore standard E. S. = e la statistica t con g.l.= n.osservazioni 1. t = d s s 0 n n Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 45 Esempio: in uno studio viene valutato l'accrescimento in peso in coppie di topi nati dalla stessa nidiata e sottoposti a due diverse diete. H 1 : tra i topi alimentati con le due diete si osserva una differenza di crescita in peso H 0 : le due diete sono equivalenti e quindi tra i topi alimentati con le due diete non si osserva una differenza di crescita in peso. errore di 1 tipo = 0,05 viene condotto un esperimento con coppie di topi. La distribuzione della variazione del peso è gaussiana. Userò il test t di student. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 46

24 Dieta A Dieta B Differenza d i1 d i d (d i d ) ,9 0, ,9 15, ,9 0, ,1 1, ,1 4, ,9 0, ,1 16, ,1 37, ,9 4, ,9 3,61 Σ = 0,0 Σ =104,9 d =3,1 s = Σ(d i ) / (n-1) =104,9 / 9 = 11,66 d s= 11,66 = 3,41 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 47 ES(d) = s/ n = 3,41 / 10 = 1,08 t 9 = 3,1 / 1,08 =,87 il valore di t con 9 gl corrisponde ad una probabilità < 0,0 (nelle due code della distribuzione t) Dato che stiamo conducendo un test bilaterale dobbiamo sommare l'area della coda superiore e della coda inferiore della distribuzione di probabilità t. Se utilizzassimo una tavola che riporta solo la coda superiore ma fossimo interessati all'area nelle due code: * area nella coda superiore. Ad es. la probabilità corrispondente al valore di t(9 g.l.) =,81 è 0,01 sulla coda superiore. Quindi la probabilità corrispondente al valore di t(9 g.l.) =,81 è * 0,01 = 0,0 sulle due code. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 48

25 Conclusione? Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 49 Possiamo anche calcolare un intervallo di confidenza della differenza media. Calcoliamo l'intervallo di confidenza al 95%: Limite fiduciale superiore = d + t 9gl;0,05 *(s/ n) = 3,1 +,6 * 1,08 = 5,54 Limite fiduciale inferiore = d - t 9gl; 0,05 *(s/ n) = 3,1 -,6 * 1,08 = 0,66 t α/ deve essere scelto tenendo conto del numero di gradi di libertà (in questo caso 9) Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 50

26 Confronto tra la media di due campioni indipendenti Nel caso del confronto tra due campioni indipendenti il test è costruito per valutare la probabilità (data H 0 ) della differenza osservata tra le medie dei due campioni, correggendo per l errore standard. L'ipotesi alternativa (di lavoro) è di solito: H 1 : µ 1 µ e la corrispondente ipotesi nulla è: H 0 : µ 1 = µ quindi H 0 : µ 1 - µ =0 Non ho informazioni sulla popolazione ma solo sui campioni pertanto dovrò usare il test t e la distribuzione t Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 51 La differenza tra le due medie: x = ( X 1 X ); Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 5

27 Il calcolo dell errore standard richiede l individuazione di una stima comune della varianza. Il caso di due campioni con varianze diverse si può affrontare con i test non parametrici, considerati nelle prossime lezioni. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 53 Nel caso di due campioni con varianza comune, lo stimatore migliore della varianza comune (indicata come s ( pool) ) è la media delle due varianze campionarie, pesata per il numero di gradi di libertà di ciascun campione. s pool = ( n1 1) s1 + ( n 1) ( n 1) + ( n 1) 1 s = Σ ( x x ) + Σ( x x ) 1 1 ( n + n ) = somma delle devianze / gradi di libertà 1 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 54

28 Per il calcolo dell errore standard si consideri che l errore standard della differenza tra due medie campionarie è la somma dei due errori standard: ES x 1 x = σ 1 + σ n1 n Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 55 ES( X 1 X ) = ( s( pool ) / n1 + s( pool) / n = s pool * ( 1/ n + 1 n ) [ ] ( ) 1 / = s( pool ) * (1/ n1 + 1/ n ) t gl = ( X X ) ES( X ) 1 / 1 X t gl = s pool x1 x n n 1 Il numero di gradi di libertà è n 1 + n - Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 56

29 La verifica dei requisiti di normalità sarà considerata in una delle prossime lezioni. In modo approssimato si può: 1. Tenere conto che la distribuzione di campionamento è sempre normale quando i campioni sono grandi. n > 30 garantisce la normalità della distribuzione dei campioni anche se la distribuzione di base è asimmetrica. Disegnare un istogramma, che deve essere simmetrico 3. Utilizzare una procedura (grafici QQ o PP in SPSS) che effettua il test di normalità Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 57 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 58

30 Esempio: In un laboratorio si intende confrontare l effetto di due differenti diete sulla crescita di ratti. La tabella indica l incremento di peso conseguito tra 7 e 60 giorni dalla nascita. H lavoro: Le due diete sono diverse (in particolare ritengo che la dieta 1 consenta una più veloce aumento di peso ma non ho evidenze per rifiutare a priori altre possibilità). H 0 : le due diete sono uguali per quanto riguarda l aumento di peso. Test a code Errore di primo tipo = 0,05 Lo studio riguarda animali già trattati, pertanto la numerosità campionaria è definita in base al numero di animali già trattati con le due diete Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 59 Test t-student (confronto tra medie di campioni indipendenti). Valutazione dei requisiti per il test: La distribuzione del peso degli animali è gaussiana. Gli animali sono dello stesso ceppo, si suppone quindi che la varianza del peso sia la stessa e che le due diete non modifichino la varianza comune. Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 60

31 I dati: incremento tra peso a 7 gg e peso a 60 gg Dieta 1 Dieta X =10,0 1 X =101, 0 n 1 = 1 n = 7 x = ( X X ) = , 0 1 = Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 61 La stima della varianza nei due gruppi viene effettuata con una media pesata delle due varianze (nel primo e nel secondo gruppo). Viene indicata come varianza pooled. S { ( xi 1 X 1 ) + ( xi X ) }/ ( n1 + ) = [ n ] ( X ) 503, 00 x i 1 1 = ( X ) 55, 00 x i = S = { } /17 = 446, 1 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 6

32 L'errore standard viene quindi calcolato usando la deviazione standard pooled. ( X X ) = [ s * ( 1/ n 1 n )] ES + ES 1 1 / ( X X ) = 446,1 * ( 1/1 1/ 7) [ ] 1 + = 100,90 = 10,04 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 63 t 17 = (10,0 101,0) / 10,04 = 1,89 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 64

33 Il valore di t con 17 gl corrispondente alla probabilità del 5% sulle due code è,110 Conclusione? Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 65 Calcoliamo l'intervallo di confidenza della differenza osservata tra i due gruppi. Calcoliamo l'intervallo di confidenza al 95%: [ s * ( 1/ n + 1 )]= x1 x + t gl;0,05 * 1 / n (10,0-101,0) +,110 * 10,04 = 40,18 [ ] Limite fiduciale inferiore = x1 x + t gl ;0,05 * s * ( 1/ n1 + 1/ n ) (10,0-101,0) -,110 * 10,04= -,18 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 66

34 Esercizi consigliati da: Fowler et al, ed Edises. Cap 11 (p 9) es 4 Cap 11 (p 9) es 9 Cap 11 (p 9) es 1 Cap 11 (p 9) es 13 Cap 11 (p 9) es 14 Cap 15 (p 38) es 1 Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Confronto tra due medie 67

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione. Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z, riferito

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,

Dettagli

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie Università del Piemonte Orientale Corso di dottorato in medicina molecolare aa 2002 2003 Corso di Statistica Medica Inferenza sulle medie Statistica U Test z Test t campioni indipendenti con uguale varianza

Dettagli

Confronto tra due popolazioni Lezione 6

Confronto tra due popolazioni Lezione 6 Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Test d ipotesi: confronto fra medie

Test d ipotesi: confronto fra medie Test d ipotesi: confronto fra medie Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona CONFRONTO FRA MEDIE 1) confronto fra una media campionaria e una media di popolazione

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 4.1 I principali test statistici per la verifica di ipotesi: Il test t Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico

Dettagli

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica Medica Campionamento e distribuzione campionaria della media CdL Infermieristica

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Test per una media - varianza nota

Test per una media - varianza nota Situazione Test per una media - varianza nota Popolazione N(µ,σ 2 ); varianza σ 2 nota. µ 0 numero reale fissato. Test di livello α per µ Statistica: Z n = X n µ 0 σ/ n. H 0 H 1 Rifiutiamo H 0 se p-value

Dettagli

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno a.a. 2007-2008 Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno Dott.ssa Daniela Alessi daniela.alessi@med.unipmn.it 1 Argomenti:

Dettagli

Statistica. Lezione 4

Statistica. Lezione 4 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 4 a.a 2011-2012 Dott.ssa Daniela

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

Lezione VII: t-test. Prof. Enzo Ballone

Lezione VII: t-test. Prof. Enzo Ballone Lezione VII: t-test Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone Un terzo problema: si considerino 2 campioni

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A Università degli Studi di Padova Corso di Laurea in Medicina e Chirurgia - A.A. 015-16 Corso Integrato: Statistica e Metodologia Epidemiologica Disciplina: Statistica e Metodologia Epidemiologica Docenti:

Dettagli

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017 Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Proprietà della varianza

Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

tabelle grafici misure di

tabelle grafici misure di Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Il Test di Ipotesi Lezione 5

Il Test di Ipotesi Lezione 5 Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di

Dettagli

DISTRIBUZIONI DI CAMPIONAMENTO

DISTRIBUZIONI DI CAMPIONAMENTO DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,

Dettagli

UNIVERSITÀ DEGLI STUDI DI PERUGIA

UNIVERSITÀ DEGLI STUDI DI PERUGIA SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati.

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati. Una volta selezionato il campione, la variabile di interesse viene misurata sugli elementi che lo costituiscono. I valori che la variabile assume vengono poi sintetizzati utilizzando le statistiche opportune

Dettagli

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016 Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano

Dettagli

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta): ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica e Biometria. Test di ipotesi

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica e Biometria. Test di ipotesi Università del Piemonte Orientale Corsi di laurea triennale di area tecnica Corso di Statistica e Biometria Test di ipotesi Corsi di laurea triennale di area tecnica - Corso di Statistica Medica - Test

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE 1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono

Dettagli

Test delle ipotesi sulla media.

Test delle ipotesi sulla media. . Caso di un singolo campione. Varianza nota.. Ipotesi alternativa bilaterale Test delle ipotesi sulla media. Valore medio η e deviazione standard σ della popolazione note. η è il valore stimato dal nostro

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria): ESERCIZIO SU TEST STATISTICO (Z, T e χ ) Da una ditta di assemblaggio di PC ci viene chiesto di controllare la potenza media dissipata da un nuovo processore, che causa a volte problemi di sovraccarico

Dettagli

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate

Dettagli

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI. Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

Test di ipotesi. Test

Test di ipotesi. Test Test di ipotesi Test E una metodologia statistica che consente di prendere una decisione. Esempio: Un supermercato riceve dal proprio fornitore l assicurazione che non più del 5% delle mele di tipo A dell

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica parte 1 Massimo Guerriero Ettore Benedetti Indice Esercizi Presentazione dei dati Misure di sintesi numerica Probabilità Distribuzioni teoriche di probabilità Distribuzione

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 16/06/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Cinque lettere

Dettagli

C.I. di Metodologia clinica

C.I. di Metodologia clinica C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati

Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si

Dettagli

Gli errori nella verifica delle ipotesi

Gli errori nella verifica delle ipotesi Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E

Dettagli

Variabili Casuali Continue

Variabili Casuali Continue Distribuzione Normale Concentrazione di cloro nel sudore Variabili Casuali Continue 9 8 7 6 5 4 3 media = 98.8 meq/l mediana =. meq/l moda =. meq/l < 3 6 5 me/l La distribuzione empirica (diagramma a barre)

Dettagli

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) STATISTICA (2) ESERCITAZIONE 5 26.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un azienda che

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria Università del Piemonte Orientale Corsi di Laurea Triennale di Area Tecnica Corso di Statistica e Biometria Statistica descrittiva: Dati numerici: statistiche di tendenza centrale e di variabilità Corsi

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, ) Università degli Studi di Milano Bicocca Scuola di Economia e Statistica Corso di Laurea in Economia e Amministrazione delle Imprese (ECOAMM) Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE

Dettagli

TEST NON PARAMETRICO DI MANN-WHITNEY

TEST NON PARAMETRICO DI MANN-WHITNEY TEST NON PARAMETRICO DI MANN-WHITNEY Questo test viene può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza

Dettagli

Test per la correlazione lineare

Test per la correlazione lineare 10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari"

Dettagli

standardizzazione dei punteggi di un test

standardizzazione dei punteggi di un test DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la

Dettagli

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità CORSO DI LAUREA IN INFERMIERISTICA LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità Lezioni di Statistica VARIABILITA Si definisce variabilità la proprietà di alcuni fenomeni di assumere

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento

Dettagli

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD. PROVA SCRITTA DI STATISTICA cod. 4038 CLEA-CLAPI-CLEFIN-CLELI cod. 5047 CLEA-CLAPI-CLEFIN-CLEMIT 5 Novembre 003 SOLUZIONI MOD. A In 8 facoltà di un ateneo italiano vengono rilevati i seguenti dati campionari

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe

Dettagli

Introduzione ai test statistici

Introduzione ai test statistici UNIVERSITÀ DI BOLOGNA FACOLTÀ DI MEDICINA VETERINARIA LAUREA IN SANITA E QUALITA DEI PRODOTTI DI ORIGINE ANIMALE Introduzione ai test statistici Un esempio introduttivo Controllo della rispondenza del

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

LA DISTRIBUZIONE NORMALE. La distribuzione Gaussiana. Dott.ssa Marta Di Nicola

LA DISTRIBUZIONE NORMALE. La distribuzione Gaussiana. Dott.ssa Marta Di Nicola LA DISTRIBUZIONE NORMALE http://www.biostatistica.unich.itit «È lo stesso delle cose molto piccole e molto grandi. Credi forse che sia tanto facile trovare un uomo o un cane o un altro essere qualunque

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Test di ipotesi

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Test di ipotesi Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Test di ipotesi Corso di laurea in biotecnologia Lezioni di statistica medica Test di ipotesi Corso di laurea

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Approssimazione normale della Poisson (TLC) In un determinato tratto di strada il numero di incidenti

Dettagli

Esercizi di Ricapitolazione

Esercizi di Ricapitolazione Esercizio 1. Sono dati 150g di una soluzione S 1 concentrata al 12%. (a) Determinare quanti grammi di soluto occorre aggiungere a S 1 per ottenere una nuova soluzione S 2 concentrata al 20%. (b) Determinare

Dettagli

Statistica. Lezione 8

Statistica. Lezione 8 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela

Dettagli

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una

Dettagli

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012 Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012 Bruno Federico b.federico@unicas.it Cattedra di Igiene - Università degli Studi di Cassino Indici di sintesi

Dettagli

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Statistica Descrittiva Variabili numeriche Misure di tendenza centrale Media (aritmetica) Mediana Media

Dettagli

TEST DI AUTOVALUTAZIONE APPROSSIMAZIONE NORMALE

TEST DI AUTOVALUTAZIONE APPROSSIMAZIONE NORMALE TEST DI AUTOVALUTAZIONE APPROSSIMAZIONE NORMALE I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. Sia X, X,...

Dettagli