Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :"

Transcript

1 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 1 Consideriamo diverse situazioni, tutte riconducibili all analisi di una variabile quantitativa con il confronto tra diversi gruppi di soggetti: A. Confronto tra una media campionaria ed una popolazione i cui parametri sono noti B. Confronto tra una media campionaria ed una popolazione di cui è nota la media ma non la deviazione standard C. Confronto tra campioni appaiati D. Confronto tra due campioni indipendenti E. Confronto tra n campioni indipendenti F. Confronto tra misure ripetute sugli stessi soggetti I casi A e B sono già stati esaminati nella lezione sulle statistiche campionarie Il caso E corrisponde all'analisi della varianza Il caso F non sarà considerato in questo corso. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie

2 Riepilogo del caso A: Confronto tra una media campionaria ed una popolazione i cui parametri sono noti Siamo interessati al confronto tra la media campionaria e la media della popolazione. I parametri della distribuzione di probabilità della variabile nella popolazione (µ e σ) sono noti. Il processo di verifica dell ipotesi si svolge secondo quanto visto in precedenza: L ipotesi di lavoro: il campione non è parte dalla popolazione considerata ma di un altra popolazione, con media differente. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 3 L ipotesi nulla: il campione estratto ha media uguale a quella della popolazione (corrisponde cioè ad un campione tratto da tale popolazione). L' errore di primo tipo è fissato al 5% (α=0,05) L' errore di secondo tipo viene fissato al 0% e la dimensione del campione è definita di conseguenza usando apposite tavole (l'argomento non è ancora stato trattato). L esperimento consiste nell estrazione di un campione e nel calcolo della media campionaria. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 4

3 Il test statistico consiste nel calcolo della deviata normale standardizzata: Z = ( X - µ)/ (σ/ n). Dove X : media campionaria µ: media della popolazione (σ/ n): errore standard della media (cioè deviazione standard della media campionaria) σ: deviazione standard della popolazione n: numerosità del campione Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 5 Il test è di tipo parametrico, cioè è valido a condizione che siano validi i presupposti relativi alla distribuzione di probabilità (gaussiana). L assunzione è generalmente vera dato il teorema del limite centrale (sempre che n sia sufficientemente grande e la forma della distribuzione della popolazione non sia troppo asimmetrica). Nel calcolo della dimensione del campione occorre quindi anche considerare che la distribuzione di frequenza di campioni piccoli si differenzia dalla distribuzione gaussiana maggiormente che la distribuzione di frequenza di campioni grandi. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 6

4 Il valore di probabilità corrispondente al valore Z (valore assoluto di Z) così ottenuto si legge dalla tabella della distribuzione normale standard. Se Z>0 viene letto il valore di probabilità compreso tra Z e. Se Z<0 viene letto il valore di probabilità compreso tra Z e -. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 7 Esempio 1 Confronto della pressione sistolica di un gruppo di pazienti affetti da una forma di arteriopatia di Burger con la popolazione generale. H lavoro= i soggetti considerati, affetti da una rara malattia delle arterie hanno pressione arteriosa (sistolica) diversa dalla popolazione generale. L ipotesi è nata osservando che i primi casi avevano valori pressori molto elevati. H 0 = i pazienti appartengono ad una popolazione con media della pressione sistolica 145 mmhg La deviazione standard della misura della pressione della popolazione è nota da precedenti studi ed è pari a,53 mmhg; Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 8

5 test bilaterale ('a due code'; sebbene l ipotesi di lavoro sia indirizzata maggiormente verso un rialzo pressorio, non ho informazioni sufficientemente forti da scegliere un test ad una coda). errore 1 tipo =0.05 numerosità campionaria non modificabile poichè sono inclusi tutti i pazienti disponibili. Non è stata calcolata la potenza statistica Test statistico: test Z (confronto tra una media campionaria e la media della popolazione). Il valore del test si legge sulle tabelle della distribuzione di probabilità normale standard (es. Tabella A3 del testo consigliato). Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 9 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 10

6 Requisiti del test scelto: La deviazione standard della misura della pressione della popolazione è nota da precedenti studi ed è pari a,53 mmhg; La distribuzione della variabile nella popolazione è gaussiana, pertanto anche piccoli campioni saranno distribuiti secondo tale distribuzione. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 11 I dati: Obs pressure (mmhg) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 1

7 Le statistiche campionarie necessarie per il test N (dimensione campionaria) 15 Media campionaria mmhg (calcolo omesso) I parametri necessari per il test µ=145 mmhg σ=,53 mmhg Memo: Il valore della statistica Z corrispondente al limite per il rifiuto dell ipotesi nulla (dati errore 1 tipo <= 0,05 e test a due code) è 1,960. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 13 Il calcolo del test Z = ( X - µ)/ (σ/ n). Z = ( ) / (,53/ 15) = = 6,34 Conclusione =? Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 14

8 Il calcolo del test Z = ( X - µ)/ (σ/ n). Z = ( ) / (,53/ 15) = = 6,34 Conclusione = rifiuto l ipotesi nulla. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 15 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 16

9 Esempio Una compagnia di assicurazioni intende controllare quali agenzie sono troppo severe oppure troppo disponibili nella valutazione dei danni. Viene effettuato un campione delle pratiche seguite da ciascuna agenzia. Per rendere omogenea la popolazione di provenienza vengono esclusi gli incidenti con feriti e quelli in autostrada. Il costo medio nella popolazione (tutte le pratiche della compagnia di assicurazione) (in migliaia di euro) = 1,6. Deviazione standard della popolazione (in migliaia di euro) = 3,4 H lavoro: L'agenzia xxyy si discosta dai parametri definiti sulla base della popolazione di tutti gli incidenti dell'anno in corso. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 17 H0: l'agenzia non si discosta. test a due code (interessano entrambi gli scostamenti) errore 1 tipo =0.10 (dato il piano di lavoro di controllo) numerosità campionaria pratiche. Test statistico: test Z (confronto tra una media campionaria e la media della popolazione) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 18

10 Requisiti del test scelto: La deviazione standard del costo medio è nota, poichè il centro di calcolo della compagnia ha tutte le pratiche. La distribuzione della variabile nella popolazione è asimmetrica con coda a destra (valori elevati), come indicato dal centro di calcolo. Viene effettuata una trasformazione logaritmica per renderla simile alla gaussiana: dopo la trasformazione anche piccoli campioni si distribuiscono secondo la distribuzione gaussiana. Il centro di calcolo fornisce µ e σ della popolazione Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 19 I dati Obs costo Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 0

11 Variable: costo Stem Leaf # Boxplot * *--+--* Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 1 Dati trasformati su scala logaritmica. Obs costo lcosto Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie

12 Variable: lcosto Stem Leaf # Boxplot *--+--* Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 3 Variable: lcosto (log e del costo) Moments N Mean Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 4

13 Il calcolo del test Media e deviazione standard della popolazione calcolati dai logaritmi dei dati originali. µ = 0,6364 σ = 0, X = 0,16 Z = ( X - µ )/ (σ / n). Z = (0,16-0,6364) / (0,875469/ ) = = - 0,484 p=0,401 Conclusione = non rifiuto l ipotesi nulla. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 5 Riepilogo del caso B: Confronto tra una media campionaria ed una popolazione di cui non si conosce la deviazione standard. Se non abbiamo informazioni sul parametro (il valore nella popolazione), usiamo la statistica campionaria, che è stata calcolata proprio per avere informazioni relative al valore (ignoto) del parametro nella popolazione. Si ricorda che l Atteso della varianza campionaria calcolata con il denominatore è (n-1) è una stima non distorta della varianza della popolazione. La varianza del campione però è affetta da variabilità casuale rispetto alla varianza della popolazione, a causa del campionamento. Pertanto non potremo usare statistiche basate sulla distribuzione normale standardizzata, che risulterebbe troppo poco conservativa ma dovremo usare la distribuzione t di Student. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 6

14 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 7 La probabilità corrispondente all intervallo tra un dato t e si legge su apposite tabelle (es. tabella A4 del testo consigliato). Si noti che i valori di probabilità cumulativa esterni ad un dato valore di t sono maggiori man mano che si riduce il numero di gradi di libertà. La distribuzione t per 30 gradi di libertà è praticamente una distribuzione normale standardizzata. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 8

15 Confronto tra un campione e la media della popolazione La formula del test è simile a quella già vista per il calcolo del test Z, con l'errore standard calcolato dalla deviazione standard del campione: t gl = ( X - µ)/ (s/ n). X : media campionaria µ: media della popolazione s: deviazione standard del campione (s/ n): errore standard della media (cioè dev. standard della media campionaria) n: numerosità del campione il numero di gradi di libertà è gl= n-1 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 9 Il test è di tipo parametrico, cioè è valido a condizione che: - nella popolazione la variabile sia distribuita secondo la distribuzione di probabilità gaussiana; - il campione abbia la stessa varianza della popolazione. La prima assunzione è generalmente vera dato il teorema del limite centrale (sempre che n sia sufficientemente grande e la forma della distribuzione della popolazione non sia troppo asimmetrica). La seconda è vera se vale H 0 (il campione appartiene alla popolazione), mentre non è valutabile altrimenti. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 30

16 Esempio Confronto della pressione sistolica tra un gruppo di pazienti affetti da una forma di arteriopatia con la popolazione generale (è l esempio precedente, sviluppato senza fare uso della informazione sulla deviazione standard della popolazione). Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 31 H lavoro= i soggetti considerati, affetti da una rara malattia delle arterie hanno pressione arteriosa (sistolica) diversa dalla popolazione generale. L ipotesi è nata osservando che i primi casi diagnosticati avevano valori pressori molto elevati H 0 = media della popolazione: pressione sistolica 145 mmhg test a due code (sebbene l ipotesi di lavoro sia indirizzata maggiormente verso un rialzo pressorio, non ho informazioni sufficientemente forti da scegliere un test ad una coda) errore 1 tipo =0.05 errore tipo =0.0 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 3

17 Test statistico: test t (confronto tra una media campionaria e la media della popolazione, senza dati sulla deviazione standard della popolazione). Verifica dei Requisiti del test scelto: La deviazione standard della misura della pressione della popolazione non è nota. La distribuzione della variabile nella popolazione è gaussiana, pertanto anche piccoli campioni saranno distribuiti secondo tale distribuzione. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 33 I dati individuali: Obs pressure (mmhg) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 34

18 Le statistiche campionarie N 15 Mean Std Deviation 5,8538 Variance 34,667 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 35 I dati necessari per il test µ=145 mmhg media campione= Std Deviation 5,8538 dimensione del campione = 15 numero di gradi di libertà= 14 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 36

19 Il calcolo del test t 14 = (X - µ)/ (s/ n). t 14 = (149,13-145) / (5,8538/ 15) = =,735 Conclusione = rifiuto l ipotesi nulla. Memo: Il valore della statistica t corrispondente al limite per il rifiuto dell ipotesi nulla (errore 1 tipo <= 0,05 e test a due code, 14 g.l.) =,145 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 37 t Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 38

20 Confronto tra due campioni appaiati Parliamo di campioni appaiati quando ad ogni osservazione del primo gruppo corrisponde un'osservazione del secondo gruppo. E' una tecnica per ridurre l'influenza sui risultati da parte di variabili estranee Due possibilità: - misure ripetute nello stesso soggetto - soggetti diversi ma appaiati perchè simili per caratteristiche importanti (es della stessa età, sesso, luogo di nascita e professione) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 39 L'ipotesi alternativa (di lavoro) è di solito: H1: µ 1 # µ e la corrispondente ipotesi nulla è: Ho: µ 1 = µ quindi Ho: µ 1 - µ =0 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 40

21 In questo caso conviene costruire il test sulle differenze dei valori tra le coppie di misure appaiate. Conviene quindi riformulare H1 ed H0 indichiamo la media delle differenze nella popolazione con δ - L'ipotesi alternativa (di lavoro) è: H1: δ # 0 e l'ipotesi nulla è: Ho: δ = 0 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 41 Calcolo le differenze per le coppie di misure d i = x i1 - x i calcolo quindi media e deviazione standard di d nel campione, usando le formule consuete. Media d n i= 1 = = n d i Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 4

22 Deviazione _ st. = s = n i= 1 ( d d) i ( n 1) Calcolo infine l'errore standard s E. S. = n e la statistica t con g.l.= n.osservazioni 1. t = d s 0 n Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 43 Esempio: in uno studio viene valutato l'accrescimento in peso in coppie di topi nati dalla stessa nidiata e sottoposti a due diverse diete. H1: tra i topi alimentati con le due diete si osserva una differenza di crescita in peso H0: le due diete sono equivalenti e quindi tra i ratti alimentati con le due diete non si osserva una differenza di crescita in peso. errore di 1 tipo = 0,05 viene condotto un esperimento con coppie di topi. La distribuzione della variazione del peso è gaussiana. Userò il test t di student. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 44

23 dieta A dieta B differenza d i1 d i d (d i d ) ,9 0, ,9 15, ,9 0, ,1 1, ,1 4, ,9 0, ,1 16, ,1 37, ,9 4, ,9 3,61 Σ = 0,0 Σ =104,9 d =3,1 s = Σ(d i d ) / (n-1) = = 104,9 / 9 = 11,66 s= 11,66 = 3,41 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 45 ES(d) = s/ n = 3,41 / 10 = 1,08 t 9 = 3,1 / 1,08 =,87 il valore di t con 9 gl corrisponde ad una probabilità < 0,0 (nelle due code della distribuzione t) Dato che stiamo conducendo un test bilaterale dobbiamo sommare l'area della coda superiore e della coda inferiore della distribuzione di probabilità t. Se usiamo la tavola A4, si tenga conto la tavola riporta solo la coda superiore ma l'area nelle due code è = * area nella coda superiore. Ad es. la probabilità corrispondente al valore di t(9 g.l.) =,81 è 0,01 sulla coda superiore. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 46

24 quindi la probabilità corrispondente al valore di t(9 g.l.) =,81 è * 0,01 = 0,0 sulle due code. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 47 Conclusione? Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 48

25 Possiamo anche calcolare un intervallo di confidenza della differenza media. Calcoliamo l'intervallo di confidenza al 95%: Limite fiduciale superiore = d + t 9gl;0,05 *(s/ n) = 3,1 +,6 * 1,08 =5,54 Limite fiduciale inferiore = d - t 9gl; 0,05 *(s/ n) = 3,1 -,6 * 1,08 = 0,66 t α/ deve essere scelto tenendo conto del numero di gradi di libertà ( in questo caso 9) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 49 Confronto tra la media di due campioni indipendenti Nel caso del confronto tra due campioni indipendenti il test è costruito per valutare la probabilità (data H 0 ) della differenza osservata tra le medie dei due campioni, correggendo per l errore standard. - L'ipotesi alternativa (di lavoro) è di solito: H1: µ 1 # µ e la corrispondente ipotesi nulla è: Ho: µ 1 = µ quindi Ho: µ 1 - µ =0 Non ho informazioni sulla popolazione ma solo sui campioni pertanto dovrò usare il test t e la distribuzione t Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 50

26 La differenza tra le due medie: x = ( X 1 X ); Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 51 Il calcolo dell errore standard richiede l individuazione di un valore comune della varianza. Questo valore può essere stimato sia se i due campioni appartengono alla stessa popolazione (H 0 ) sia se appartengono a due popolazioni diverse (H_lavoro), purchè abbiano la stessa varianza (omoscedasticità). Si potrà quindi calcolare uno stimatore comune dell errore standard. Il caso di due campioni con varianze diverse si può affrontare con i test non parametrici, considerati nelle prossime lezioni. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 5

27 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 53 Nel caso di due campioni con varianza comune, lo stimatore migliore della varianza comune (indicata come s (pool) ) è la media delle due varianze campionarie, pesata per il numero di gradi di libertà di ciascun campione. ( ) ( ) ( ) ( ) ( ) ( ) ( ) Σ Σ = + + = n n x x x x n n s n s n s pool = somma delle devianze / gradi di libertà Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 54 Per il calcolo dell Errore Standard pooled si consideri che: n n x x var σ = σ +

28 ES( X 1 X ) = (s (pool) /n 1 + s pool /n ) = [s (pool) * (1/n 1 + 1/n )] = s (pool) * (1/n 1 + 1/n ) t gl = s ( x1 x) () 0 pool n 1 n Il numero di gradi di libertà è n 1 + n - Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 55 La verifica dei requisiti di normalità sarà considerata in una delle prossime lezioni. In modo approssimato si può: 1. tenere conto che la distribuzione di campionamento è sempre normale quando i campioni sono grandi. n> 30 garantisce la normalità della distribuzione dei campioni anche se la distribuzione di base è asimmetrica.. Disegnare un istogramma, che deve essere simmetrico 3. Utilizzare una procedura (grafici QQ o PP in SPSS) che effettua il test di normalità. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 56

29 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 57 Esempio: In un laboratorio si intende confrontare l effetto di due differenti diete sulla crescita di ratti. La tabella indica l incremento di peso conseguito tra 7 e 60 giorni dalla nascita. H lavoro: Le due diete sono diverse (in particolare ritengo che la dieta 1 consenta una più veloce aumento di peso ma non ho evidenze per rifiutare a priori altre possibilità). H 0 : le due diete sono uguali per quanto riguarda l aumento di peso. Test a code Errore di primo tipo= 0,05 Lo studio riguarda animali già trattati, pertanto la numerosità campionaria è definita in base al numero di animali già trattati con le due diete Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 58

30 Test t-student (confronto tra medie di campioni indipendenti). Valutazione dei requisiti per il test: La distribuzione del peso degli animali è gaussiana. Gli animali sono dello stesso ceppo, si suppone quindi che la varianza del peso sia la stessa e che le due diete non modifichino la varianza comune. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 59 I dati: incremento tra peso a 7 gg e peso a 60 gg Dieta 1 Dieta X 1 = 10,0 X = 101,0 n 1 = 1 n = 7 x = ( X 1 X ) = = 19,0 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 60

31 La stima della varianza nei due gruppi viene effettuata con una media pesate delle due varianze (nel primo e nel secondo gruppo). Viene indicata come varianza pooled. S = {Σ(x i1 X 1 ) + Σ(x i X ) } / [(n 1 + n -)] Σ(x i1 X 1 ) = 503,00 Σ(x i X ) = 55,00 S = { } / 17 = 446,1 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 61 L'errore standard viene quindi calcolato usando la deviazione standard pooled. ES( X 1 X ) = [s * (1/n 1 + 1/n )] ES( X 1 X ) = [446.1 * (1/1 + 1/7) ] = 100,90 = 10,04 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 6

32 t 17 = (10,0 101,0) / 10,04 = 1,89 Le due aree verdi corrispondono a p=0.05, su due code Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 63 Il valore di t con 17 gl corrispondente alla probabilità del 5% sulle due code è,110 Conclusione? Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 64

33 Calcoliamo l'intervallo di confidenza della differenza osservata tra i due gruppi. Calcoliamo l'intervallo di confidenza al 95%: Limite fiduciale superiore = (19,0) +,110 * 10,04= 40,18 Limite fiduciale inferiore = (19,0) -,110 * 10,04= -,18 x 1 x + t gl;0,05 * [s * (1/n 1 + 1/n )] = x x 1 + t gl;0,05 * [s * (1/n 1 + 1/n )]= Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 65 Esercizi dal testo p 1 n 1 p 1 n p 1 n 4 p 1 n 5 + intervallo di confidenza al 95% della differenza p 13 n 8 + intervallo di confidenza al 95% della differenza p 13 n 9 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Confronto tra due medie 66

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie Università del Piemonte Orientale Corso di dottorato in medicina molecolare aa 2002 2003 Corso di Statistica Medica Inferenza sulle medie Statistica U Test z Test t campioni indipendenti con uguale varianza

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato. Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi

Dettagli

La distribuzione Gaussiana

La distribuzione Gaussiana Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Analisi statistica di dati biomedici Analysis of biologicalsignals II Parte Verifica delle ipotesi (a) Agostino Accardo (accardo@units.it) Master in Ingegneria Clinica LM in Neuroscienze 2013-2014 e segg.

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Introduzione Livelli di significatività Verifica di ipotesi sulla media di una popolazione normale Verifica di ipotesi sulla varianza di una popolazione normale Verifica di ipotesi

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -

Dettagli

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per categoriali. Alessandro Valbonesi

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per categoriali. Alessandro Valbonesi LEZIONI DI STATISTCA APPLICATA Parte 2 Statistica inferenziale Variabili continue per categoriali Alessandro Valbonesi SARRF di Scienze ambientali Anno accademico 2010-11 CAPITOLO 4 - TEST STATISTICI CHE

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione in base ad informazioni ricavate da un campione. Inferenza statistica: indurre

Dettagli

La statistica nella ricerca scientifica

La statistica nella ricerca scientifica La statistica nella ricerca scientifica Pubblicazione dei risultati Presentazione dei dati e la loro elaborazione devono seguire criteri universalmente validi Impossibile verifica dei risultati da parte

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corsi di Specialità Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea in biotecnologie

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Nome N. Matricola Ancona, 14 luglio 2015 1. Tre macchine producono gli stessi pezzi

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Esercizio 1 Si consideri il seguente modello ad effetti fissi con variabili binarie: + 1 2 a) supponete che N=3. Si mostri che i regressori

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Politecnico di Milano - Anno Accademico 200-20 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Esercitazione 9 2 Giugno 20 Esercizio. In un laboratorio per il test dei materiali,

Dettagli

Concetto di potenza statistica

Concetto di potenza statistica Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1 Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Matlab per applicazioni statistiche

Matlab per applicazioni statistiche Matlab per applicazioni statistiche Marco J. Lombardi 19 aprile 2005 1 Introduzione Il sistema Matlab è ormai uno standard per quanto riguarda le applicazioni ingegneristiche e scientifiche, ma non ha

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

4. Confronto tra medie di tre o più campioni indipendenti

4. Confronto tra medie di tre o più campioni indipendenti BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Inferenza statistica I Alcuni esercizi. Stefano Tonellato Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,

Dettagli

Statistica Medica. Verranno presi in esame:

Statistica Medica. Verranno presi in esame: Statistica Medica Premessa: il seguente testo cerca di riassumere e rendere in forma comprensibile ai non esperti in matematica e statistica le nozioni e le procedure necessarie a svolgere gli esercizi

Dettagli

Regressione Lineare con un Singolo Regressore

Regressione Lineare con un Singolo Regressore Regressione Lineare con un Singolo Regressore Quali sono gli effetti dell introduzione di pene severe per gli automobilisti ubriachi? Quali sono gli effetti della riduzione della dimensione delle classi

Dettagli

Esercitazioni-aula-parte-III

Esercitazioni-aula-parte-III Esercitazioni-aula-parte-III Esempio par.7.2) Ross Sia (X 1,..., X n ) un campione aleatorio estratto da una popolazione esponenziale di parametro θ incognito. Determinare l espressione dello stimatore

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Inferenza statistica. Inferenza statistica

Inferenza statistica. Inferenza statistica Spesso l informazione a disposizione deriva da un osservazione parziale del fenomeno studiato. In questo caso lo studio di un fenomeno mira solitamente a trarre, sulla base di ciò che si è osservato, considerazioni

Dettagli

TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST

TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Statistica 1 Parte A 1.1 La formula µ = x ± s n

Dettagli

Teoria della Stima. Stima della Media e di una Porzione di Popolazione. Introduzione. Corso di Laurea in Scienze Motorie AA2002/03 - Analisi dei Dati

Teoria della Stima. Stima della Media e di una Porzione di Popolazione. Introduzione. Corso di Laurea in Scienze Motorie AA2002/03 - Analisi dei Dati Teoria della Stima. Stima della Media e di una Porzione di Popolazione Introduzione La proceduta in base alla quale ad uno o più parametri di popolazione si assegna il valore numerico calcolato dalle informazioni

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stima puntuale per la proporzione Da un lotto di arance se ne estraggono 400, e di queste 180

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

Cenni di Statistica Inferenziale

Cenni di Statistica Inferenziale Cenni di Statistica Inferenziale Teorema del limite centrale Data una variabile, qualsiasi sia la sua distribuzione, la media di tutti i suoi campioni di ampiezza n ha una distribuzione normale: dove:

Dettagli

Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. I valori stimati sono variabili aleatorie. Teorema del limite centrale

Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. I valori stimati sono variabili aleatorie. Teorema del limite centrale I risultati di un esperimento sono variabili aleatorie. Un esperimento non consente di esaminare ogni elemento di una popolazione o di effettuare tutte le misure possibili. campione , sx Stime Popolazion

Dettagli

l insieme delle misure effettuate costituisce il campione statistico

l insieme delle misure effettuate costituisce il campione statistico Statistica negli esperimenti reali si effettuano sempre un numero finito di misure, ( spesso molto limitato ) l insieme delle misure effettuate costituisce il campione statistico Statistica descrittiva

Dettagli

Temi di Esame a.a. 2012-2013. Statistica - CLEF

Temi di Esame a.a. 2012-2013. Statistica - CLEF Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano

Dettagli

decidiamo, sulla base di un campione, se l ipotesi formulata è plausibile oppure no.

decidiamo, sulla base di un campione, se l ipotesi formulata è plausibile oppure no. LA VERIFICA D IPOTESI Alla base dell inferenza statistica vi è l assunzione che i fenomeni collettivi possano essere descritti efficacemente mediante delle distribuzioni di probabilità. Abbiamo già considerato

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p

Dettagli

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza Università del Piemonte Orientale Corsi di laurea triennale di area tecnica Corso di Statistica Medica Analisi dei dati in tabelle di contingenza Corsi di laurea triennale di area tecnica - Corso di Statistica

Dettagli

Appunti: Teoria Dei Test

Appunti: Teoria Dei Test Appunti: Teoria Dei Test Fulvio De Santis, Luca Tardella e Isabella Verdinelli Corsi di Laurea A + E + D + G + R 1. Introduzione. Il test d ipotesi è un area dell inferenza statistica in cui si valuta

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

Grafici delle distribuzioni di frequenza

Grafici delle distribuzioni di frequenza Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma

Dettagli

Continua sul retro 42.1 39.7 38.0 38.7 41.4 37.5 38.6 40.5 39.8 38.0 36.9 40.3 42.0 41.3 40.4 39.1 38.4 42.0

Continua sul retro 42.1 39.7 38.0 38.7 41.4 37.5 38.6 40.5 39.8 38.0 36.9 40.3 42.0 41.3 40.4 39.1 38.4 42.0 Statistica per l azienda Esame del 19.06.12 COGNOME NOME Matr. Firma Modulo: singolo con Informatica con StatII & PDRM con Mat. & PDRM altro (specificare) Attenzione: Il presente foglio deve essere compilato

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

La logica statistica della verifica (test) delle ipotesi

La logica statistica della verifica (test) delle ipotesi La logica statistica della verifica (test) delle ipotesi Come posso confrontare diverse ipotesi? Nella statistica inferenziale classica vengono sempre confrontate due ipotesi: l ipotesi nulla e l ipotesi

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto

Dettagli

ESERCIZI DI STATISTICA DESCRITTIVA

ESERCIZI DI STATISTICA DESCRITTIVA ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,

Dettagli

Esercitazione di riepilogo 23 Aprile 2013

Esercitazione di riepilogo 23 Aprile 2013 Esercitazione di riepilogo 23 Aprile 2013 Grafici Grafico a barre Servono principalmente per rappresentare variabili (caratteri) qualitative, quantitative e discrete. Grafico a settori circolari (torta)

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Dai dati al modello teorico

Dai dati al modello teorico Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere

Dettagli

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x

Dettagli

ANALISI DI CORRELAZIONE

ANALISI DI CORRELAZIONE ANALISI DI CORRELAZIONE Esempio: Dati raccolti da n = 129 studenti di Pavia (A.A. 21/2) Altezza (cm) Peso (Kg) Voto Algebra e Geometria Voto Fisica I Valutare la correlazione delle seguenti coppie: Peso

Dettagli

Relazioni tra variabili

Relazioni tra variabili Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina

Dettagli

In questa dispensa cercheremo di approfondire le più comuni tecniche statistiche per l analisi dei dati raccolti nell ambito di ricerca clinica e di

In questa dispensa cercheremo di approfondire le più comuni tecniche statistiche per l analisi dei dati raccolti nell ambito di ricerca clinica e di In questa dispensa cercheremo di approfondire le più comuni tecniche statistiche per l analisi dei dati raccolti nell ambito di ricerca clinica e di base. Verranno inoltre forniti i concetti fondamentali

Dettagli

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Corso di Statistica Medica 2004-2005 Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Sono previste 30 ore di lezione di statistica e 12 di

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 L4, Corso Integrato di Psicometria - Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Rev. 18/04/2011 Inferenza statistica Formulazione

Dettagli

Politecnico di Milano Temi d esame di STATISTICA dell AA 2004/2005 per allievi ING INF [2L]. Proff. A. Barchielli, I. Epifani

Politecnico di Milano Temi d esame di STATISTICA dell AA 2004/2005 per allievi ING INF [2L]. Proff. A. Barchielli, I. Epifani Politecnico di Milano Temi d esame di STATISTICA dell AA 004/005 per allievi ING INF [L]. Proff. A. Barchielli, I. Epifani 1 1 STATISTICA per ING INF [L] Proff. A. Barchielli, I. Epifani 0.06.05 I diritti

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Analisi statistica degli errori

Analisi statistica degli errori Analisi statistica degli errori I valori numerici di misure ripetute risultano ogni volta diversi l operazione di misura può essere considerata un evento casuale a cui è associata una variabile casuale

Dettagli

3) ANALISI DEI RESIDUI

3) ANALISI DEI RESIDUI 3) ANALISI DEI RESIDUI Dopo l analisi di regressione si eseguono alcuni test sui residui per avere una ulteriore conferma della validità del modello e delle assunzioni (distribuzione normale degli errori,

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA Seconda Lezione DISTRIBUZIONE DI FREQUENZA Frequenza assoluta: è il numero puro di casi per quella modalità Frequenze relative: sono il rapporto tra la frequenza assoluta con cui si manifesta una modalità

Dettagli

3 Confronto fra due popolazioni attraverso il test t e test analoghi

3 Confronto fra due popolazioni attraverso il test t e test analoghi 3 Confronto fra due popolazioni attraverso il test t e test analoghi Consideriamo in questo capitolo gli esperimenti comprendenti un solo fattore fisso, e nel loro ambito quelli in cui questo criterio

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA)

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) 4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) L analisi della varianza è un metodo sviluppato da Fisher, che è fondamentale per l interpretazione statistica di molti dati biologici ed è alla

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Il controllo delle prestazioni del provider. IL CONTROLLO DELLE PRESTAZIONI DEL PROVIDER (riferimenti)

Il controllo delle prestazioni del provider. IL CONTROLLO DELLE PRESTAZIONI DEL PROVIDER (riferimenti) del provider IL CONTROLLO DELLE PRESTAZIONI DEL PROVIDER (riferimenti) 1 del provider - premessa (1) in merito alla fase di gestione ordinaria dell outsourcing sono state richiamate le prassi di miglioramento

Dettagli

Esplorazione dei dati

Esplorazione dei dati Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione

Dettagli

R - Esercitazione 5. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. Lunedì 2 Dicembre 2013. Università Roma Tre

R - Esercitazione 5. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. Lunedì 2 Dicembre 2013. Università Roma Tre R - Esercitazione 5 Lorenzo Di Biagio dibiagio@mat.uniroma3.it Università Roma Tre Lunedì 2 Dicembre 2013 Intervalli di confidenza (1) Sia X 1,..., X n un campione casuale estratto da un densità f (x,

Dettagli

Problema pratico: Test statistico = regola di decisione

Problema pratico: Test statistico = regola di decisione La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario

Dettagli

Test di Ipotesi Intervallo di confidenza Rossella Baldini

Test di Ipotesi Intervallo di confidenza Rossella Baldini Inferenza Statistica Test di Ipotesi Intervallo di confidenza Rossella Baldini 1 Statistiche o Statistica? Le statistiche mediche sono affermazioni numeriche di contenuto medico: Quante persone ogni anno

Dettagli