Università del Piemonte Orientale Corso di laurea in medicina e chirurgia a.a Corso di Statistica Medica Inferenza sulle medie 1

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Università del Piemonte Orientale Corso di laurea in medicina e chirurgia a.a Corso di Statistica Medica Inferenza sulle medie 1"

Transcript

1 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 1

2 Popolazione: - insieme di tutti i valori realizzati o possibili di una variabile - insieme che raccoglie tutte le osservazioni possibili, relativamente ad una data variabile o ad un dato fenomeno - può essere finita (comunque molto grande) o infinita Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 2

3 Campione: - Raccolta finita di elementi estratti da una popolazione - Scopo dell estrazione è quello di ottenere informazioni sulla popolazione - Pertanto il campione deve essere rappresentativo della popolazione da cui viene estratto ( non viziato, cioè non affetto da errore sistematico) - Per corrispondere a queste esigenze il campione viene individuato con un campionamento casuale - In un campionamento casuale semplice tutti gli individui nella popolazione hanno uguale probabilità di essere inclusi nel campione Data una popolazione con N individui (dove N è molto grande rispetto alla dimensione del campione) la probabilità per l i-esimo individuo è 1/N Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 3

4 Il campione corrisponde alla popolazione? Consideriamo una popolazione di individui (unità statistiche); per ciascuno sia noto il valore di una data variabile numerica La distribuzione della variabile è normale (Gaussiana) con media µ e deviazione standard δ Si estraggano ripetuti campioni di dimensione n da tale popolazione Definiamo media campionaria la media calcolata per le osservazioni che compongono il campione osserviamo che: la distribuzione delle medie campionarie sarà normale (Gaussiana), con media µ e deviazione standard δ/ n Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 4

5 - Il valore atteso della media campionaria è la media della popolazione, in altre parole la media campionaria è una stima non distorta della media della popolazione - Il valore atteso della varianza campionaria (calcolata con n-1) è la varianza della popolazione, in altre parole la varianza campionaria (calcolata con n-1) è una stima non distorta della varianza della popolazione - La variabilità della distribuzione delle medie campionarie è inferiore alla variabilità nella popolazione Campioni più grandi avranno variabilità inferiore La deviazione standard delle medie campionarie viene indicata anche come Errore Standard della Media (spesso abbreviato in Errore standard) Errore standard = deviazione standard della popolazione / (numerosità campionaria) =δ/ n Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 5

6 - La forma della distribuzione di frequenza delle medie campionarie è normale Questo accade anche se la distribuzione nella popolazione non è normale (Teorema del limite centrale ) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 6

7 Verifichiamo queste assunzioni su un esempio: L istogramma presenta la distribuzione di frequenza di osservazioni distribuite in modo uniforme La variabile considerata (indicata come I) assume i soli valori interi tra 0 e 9 L esempio è analogo a quello presentato nel testo di PArmitage e GBerry Statistical Methods in Medical Researchs (editaliana McGraw-Hill) Alcune statistiche descrittive della Variabile I N Mean 45 Std Deviation Variance Skewness 0 Kurtosis Distribuzione Uniforme Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 7

8 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 8 FREQUENCY popolazione

9 Estraiamo da questa distribuzione campioni ripetuti di diversa numerosità (n=5, n=10, n=20, ciascuno ripetuto 5000 volte) Esaminiamo le caratteristiche delle distribuzioni di frequenza delle medie campionarie Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 9

10 Distribuzione e variabilità dei Campioni con n=5 Variable: md (media campionaria) N 5000 Mean 45 Std Deviation Variance Skewness Kurtosis Coeff Variation Median Mode Range Interquartile Range Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 10

11 Distribuzione e variabilità dei Campioni con n=10 Variable: md (media campionaria) N 5000 Mean 45 Std Deviation Variance Skewness Kurtosis Coeff Variation Median Mode Range Interquartile Range Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 11

12 Distribuzione e variabilità dei Campioni con n=20 Variable: md (media campionaria) N 5000 Mean 45 Std Deviation Variance Skewness Kurtosis Coeff Variation Median Mode Range Interquartile Range Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 12

13 da distribuzione uniforme (interi da 0 a 9) µ=4,5 δ=2, n=5 /10 / Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 13

14 La distribuzione di probabilità rilevante per condurre inferenze sulle medie è la distribuzione gaussiana perché: - la distribuzione gaussiana è la forma limite delle distribuzioni di frequenza campionarie, quale che sia la distribuzione originale delle osservazioni, purché i campioni siano di numerosità sufficiente - la distribuzione di frequenza di molte variabili biologiche è descritta da tale distribuzione; - la distribuzione degli errori casuali è una distribuzione Gaussiana; - se la distribuzione di frequenza della popolazione è gaussiana, la distribuzione delle medie campionarie è gaussiana anche per n piccoli Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 14

15 Rivediamo le caratteristiche principali della distribuzione gaussiana Formula: f(x) = (1/σ 2π)*exp[-1/2(x-µ) 2 /σ 2 ] µ (media) e σ (deviazione standard) sono i parametri che definiscono la distribuzione - il dominio della funzione è - <= x <= - L area compresa tra - e ha valore unitario, - f(x) è un valore di probabilità e viene anche indicato con la lettera p - La distribuzione è simmetrica, media = mediana = moda La distribuzione gaussiana con µ=0 e δ = 1 viene definita Deviazione Normale Standard La funzione gaussiana viene utilizzata per l inferenza sulle medie, essendo la forma limite della distribuzione di frequenza delle medie campionarie Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 15

16 Il grafico seguente mostra due curve normali con DS=1 (curva nera) e DS=2 (curva rossa) Entrambe hanno media=0 y Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie x0

17 In questo grafico si mostra la relazione tra funzione di densità di probabilità gaussiana (curva a campana, corrisponde ad una distribuzione normale standard) e la corrispondente funzione cumulativa (curva sigmoide) GS Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 17 X

18 Il processo di verifica dell ipotesi si svolge secondo quanto visto in precedenza: L ipotesi di lavoro: il campione non fà parte dalla popolazione considerata ma di un altra popolazione, con media differente Siamo interessati al confronto tra la media campionaria e la media della popolazione I parametri della distribuzione di probabilità della variabile nella popolazione (µ e σ) sono noti L ipotesi nulla: il campione estratto ha media uguale a quella della popolazione (corrisponde cioè ad un campione tratto dalla popolazione) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 18

19 Gli errori di primo e di secondo tipo e la dimensione del campione vengono definiti Nel calcolo della dimensione del campione occorre anche considerare che la distribuzione di frequenza di campioni piccoli si differenzia dalla distribuzione gaussiana maggiormente che la distribuzione di frequenza di campioni grandi L esperimento consiste nell estrazione di un campione e nel calcolo della media campionaria Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 19

20 Il test statistico consiste nel calcolo della deviata normale standardizzata: Z = (X - µ)/ (σ/ n) Dove X: media campionaria µ: media della popolazione (σ/ n): errore standard della media (cioè deviazione standard della media campionaria) σ: deviazione standard della popolazione n: numerosità del campione Il test è di tipo parametrico, cioè è valido a condizione che siano validi i presupposti relativi alla distribuzione di probabilità (gaussiana) L assunzione è generalmente vera dato il teorema del limite centrale (sempre che n sia sufficientemente grande e la forma della distribuzione della popolazione non sia troppo asimmetrica) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 20

21 Il valore di probabilità corrispondente al valore Z (valore assoluto di Z) così ottenuto si legge dalla tabella della distribuzione normale standard Se Z>0 viene letto il valore di probabilità compreso tra Z e Se Z<0 viene letto il valore di probabilità compreso tra Z e - Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 21

22 Esempio 1 Confronto della pressione sistolica tra un gruppo di pazienti affetti da una nuova forma di arteriopatia con la popolazione generale H lavoro= i soggetti considerati, affetti da una rara malattia delle arterie hanno pressione arteriosa (sistolica) diversa dalla popolazione generale L ipotesi è nata osservando che i primi casi avevano valori pressori molto elevati H0= media della popolazione: pressione sistolica 145 mmhg test a due code (sebbene l ipotesi di lavoro sia indirizzata maggiormente verso un rialzo pressorio, non ho informazioni sufficientemente forti da scegliere un test ad una coda) errore 1 tipo =005 numerosità campionaria non modificabile poichè sono inclusi tutti i pazienti disponibili Non è stata calcolata la potenza statistica Test statistico: test Z (confronto tra una media campionaria e la media della popolazione) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 22

23 Requisiti del test scelto: La deviazione standard della misura della pressione della popolazione è nota da precedenti studi ed è pari a 2,53 mmhg; La distribuzione della variabile nella popolazione è gaussiana, pertanto anche piccoli campioni saranno distribuiti secondo tale distribuzione Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 23

24 I dati: Obs pressure (mmhg) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 24

25 Le statistiche campionarie necessarie per il test N 15 Media mmhg (calcolo omesso) I parametri necessari per il test µ=145 mmhg δ=2,53 mmhg Il valore della statistica Z (errore 1 tipo <= 0,05 e test a due code) = 1,960 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 25

26 Il calcolo del test Z = (X - µ)/ (σ/ n) Z = ( ) / (2,53/ 15) = = 6, Conclusione = rifiuto l ipotesi nulla Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 26

27 Esempio 2 Una compagnia di assicurazioni intende controllare quali agenzie sono troppo severe oppure troppo disponibili nella valutazione dei danni Viene effettuato un campione delle pratiche seguite da ciascuna agenzia Per rendere omogenea la popolazione di provenienza vengono esclusi gli incidenti con feriti e quelli in autostrada Il costo medio nella popolazione (tutte le pratiche della compagnia di assicurazione) (in migliaia di euro) = 1,6 Deviazione standard della popolazione (in migliaia di euro) = 3,4 H lavoro: L'agenzia xxyy si discosta dai parametri definiti sulla base della popolazione di tutti gli incidenti dell'anno in corso H0: l'agenzia non si discosta Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 27

28 test a due code (interessano entrambi gli scostamenti) errore 1 tipo =010 (dato il piano di lavoro di controllo) numerosità campionaria 20 pratiche Non è stata calcolata la potenza statistica Test statistico: test Z (confronto tra una media campionaria e la media della popolazione) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 28

29 Requisiti del test scelto: La deviazione standard del costo medio è nota, poichè il centro di calcolo della compagnia ha tutte le pratiche La distribuzione della variabile nella popolazione è asimmetrica con coda a destra (valori elevati), come indicato dal centro di calcolo Viene effettuata una trasformazione logaritmica per renderla simile alla gaussiana: dopo la trasformazione anche piccoli campioni si distribuiscono secondo la distribuzione gaussiana Il centro di calcolo fornisce µ e σ della popolazione, con i dati trasformati su scala logaritmica Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 29

30 I dati Obs costo lcosto Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica medie 30 Inferenza sulle

31 The UNIVARIATE Procedure Variable: costo Stem Leaf # Boxplot * *--+--* Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 31

32 The UNIVARIATE Procedure Variable: lcosto Stem Leaf # Boxplot *--+--* Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 32

33 Variable: lcosto (log e del costo) Moments N 22 Mean Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 33

34 Il calcolo del test Indico media e Ds della popolazione calcolati dai logaritmi dei dati originali µ = 0, σ = 0, x = 0,216 Z = (X - µ )/ (σ / n) Z = (0,216-0,262364) / (0,875469/ 22) = = - 0,2484 Conclusione = non rifiuto l ipotesi nulla Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 34

35 Intervalli di confidenza Abbiamo visto che la media campionaria costituisce la stima migliore della media della popolazione ma questo non significa che la media campionaria sia priva di errore campionario: si osserva facilmente che campioni ripetuti danno medie campionarie diverse L intervallo di confidenza fornisce una indicazione della precisione della stima L intervallo di confidenza fornisce un espressione formale dell incertezza che deve essere aggiunta alla media campionaria a causa del semplice errore di campionamento (Armitage) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 35

36 L intervallo di confidenza della media campionaria è un intervallo di valori intorno alla media campionaria; tale intervallo ha una probabilità definita di includere il parametro (valore della statistica nella popolazione) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 36

37 Estrazione di 50 campioni di numerosità 20 da distribuzione gaussiana con µ=0 e δ=1 Le barre rappresentano l intervallo di confidenza al 95% M D ID Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 37

38 L intervallo di confidenza è definito in modo tale da soddisfare la seguente equazione: [X - Z α/2 *(σ/ n)] < µ < [X + Z α/2 *(σ/ n)] Dove: X: media campionaria µ: media della popolazione (σ/ n): errore standard della media (cioè deviazione standard della media campionaria) Z α/2 = valore della deviata normale standardizzata corrispondente all errore di 1 tipo scelto Limite fiduciale superiore = X + Z α/2 *(σ/ n) Limite fiduciale inferiore = X - Z α/2 *(σ/ n) Di solito l intervallo di confidenza intorno alla media viene indicato come: X ± Z α/2 *(σ/ n) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 38

39 Un altra definizione dell intervallo di confidenza è l intervallo di valori della media campionaria che non avrebbe portato al rifiuto dell ipotesi nulla Ripetendo un campionamento dalla stessa popolazione ci aspettiamo che, se vale l ipotesi nulla, la proporzione di campioni il cui intervallo di confidenza non comprende il valore della media corrispondente all ipotesi nulla sia pari al valore dell errore di 1 tipo Dati i 50 campioni dell esercizio precedente, osserviamo che in tre casi l intervallo di confidenza non comprende la media Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 39

40 Esempio: calcolo dell intervallo di confidenza nel caso del primo esempio: N 15 Media campionaria mmhg (calcolo omesso) µ=145 mmhg δ=2,53 mmhg Limite superiore = *(2,53/ 15) = 147,85 Limite inferiore = *(2,53/ 15) = 150,41 147,85 <= µ <=150,41 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 40

41 Spesso non abbiamo informazioni sul parametro e la statistica campionaria è calcolata proprio per avere informazioni relative al valore (ignoto) del parametro In questo caso la soluzione adottata è quella di stimare la varianza della popolazione in base alla varianza del campione Si dimostra infatti che l Atteso della varianza campionaria è la varianza della popolazione, se il denominatore è (n-1) La varianza del campione però è affetta da variabilità casuale rispetto alla varianza della popolazione, a causa del campionamento Pertanto non potremo usare statistiche basate sulla distribuzione normale standardizzata, che risulterebbe troppo poco conservativa Gosset (che pubblicava con lo pseudonimo di Student) propose di utilizzare una famiglia di distribuzioni, con forma simmetrica e con ampiezza dipendente dal numero di osservazioni del campione: le funzioni di distribuzione t (o t di Student) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 41

42 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 42

43 La distribuzione t per 30 gradi di libertà è praticamente una distribuzione normale standardizzata Si noti che i valori di probabilità cumulativa esterni ad un dato valore di X sono maggiori man mano che si riduce il numero di gradi di libertà La probabilità corrispondente all intervallo tra un dato X e si legge su apposite tabelle Xxx tabella distribuzione t Nell inferenza sulle medie basata sull uso della distribuzione t dobbiamo distinguere tre diversi casi: - Confronto tra un campione e la media della popolazione - Confronto tra due campioni indipendenti - Confronto tra due campioni appaiati Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 43

44 Confronto tra un campione e la media della popolazione La logica del test è analoga a quanto già visto per il calcolo del test Z ma il test tiene conto del fatto che la varianza è stimata dal campione: t gl = (X - µ)/ (s/ n) X: media campionaria µ: media della popolazione s: deviazione standard del campione (s/ n): errore standard della media (cioè deviazione standard della media campionaria) n: numerosità del campione il numero di gradi di libertà è gl= n-1 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 44

45 Il test è di tipo parametrico, cioè è valido a condizione che: - nella popolazione la variabile sia distribuita secondo la distribuzione di probabilità gaussiana; - il campione abbia la stessa varianza della popolazione La prima assunzione è generalmente vera dato il teorema del limite centrale (sempre che n sia sufficientemente grande e la forma della distribuzione della popolazione non sia troppo asimmetrica) La seconda è vera se vale H0 (il campione appartiene alla popolazione), mentre non è valutabile altrimenti Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 45

46 Esempio Confronto della pressione sistolica tra un gruppo di pazienti affetti da una nuova forma di arteriopatia con la popolazione generale (è l esempio precedente, sviluppato senza fare uso della informazione sulla deviazione standard della popolazione) H lavoro= i soggetti considerati, affetti da una rara malattia delle arterie hanno pressione arteriosa (sistolica) diversa dalla popolazione generale L ipotesi è nata osservando che i primi casi diagnosticati avevano valori pressori molto elevati H0= media della popolazione: pressione sistolica 145 mmhg test a due code (sebbene l ipotesi di lavoro sia indirizzata maggiormente verso un rialzo pressorio, non ho informazioni sufficientemente forti da scegliere un test ad una coda) errore 1 tipo =005 numerosità campionaria non modificabile poichè sono inclusi tutti i pazienti disponibili Non è stata calcolata la potenza statistica Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 46

47 Test statistico: test t(confronto tra una media campionaria e la media della popolazione, senza dati sulla deviazione standard della popolazione) Requisiti del test scelto: La deviazione standard della misura della pressione della popolazione non è nota La distribuzione della variabile nella popolazione è gaussiana, pertanto anche piccoli campioni saranno distribuiti secondo tale distribuzione Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 47

48 I dati individuali: Obs pressure (mmhg) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 48

49 Le statistiche campionarie N 15 Mean Std Deviation Variance I parametri necessari per il test µ=145 mmhg s= Std Deviation Il valore della statistica t (errore 1 tipo <= 0,05 e test a due code, 14 gl) = 2,145 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 49

50 Il calcolo del test t 14 = (X - µ)/ (s/ n) t 14 = ( ) / (107/ 15) = = 1,496 Conclusione = non rifiuto l ipotesi nulla Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 50

51 Possiamo anche definire un intervallo di confidenza della media campionaria basandoci sul test e sulla distribuzione t L intervallo di confidenza è definito in modo tale da soddisfare la seguente equazione: [X - t gl,α/2 *(s/ n)] < µ < [X + t gl,α/2 *(s/ n)] Dove: t gl,α/2 = valore della funzione t con il numero dato di gradi di libertà corrispondente all errore di 1 tipo scelto Limite fiduciale superiore = X + t gl,α/2 *(s/ n) Limite fiduciale inferiore = X - t gl,α/2 *(s/ n) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 51

52 Esempio: calcolo dell intervallo di confidenza Risultati: N 15 Media campionaria 1491 mmhg (calcolo omesso) µ=145 mmhg s= 1072 mmhg Il valore della statistica t (errore 1 tipo <= 0,05 e test a due code, 14 gl) = 2,145 Limite superiore = ,145 *( 1072/ 15) = 154,56 mmhg Limite inferiore = ,145 *( 1072/ 15) = 143,71 mmhg Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 52

53 Estrazione di 50 campioni di numerosità 20 da una distribuzione gaussiana con µ=0 e δ ignota L errore standard è stato calcolato in base alla distribuzione t Le barre rappresentano l intervallo di confidenza al 95% Si noti che le barre sono di ampiezza diversa tra loro µ ID Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 53

54 Confronto tra due campioni indipendenti Nel caso del confronto tra due campioni indipendenti il test è costruito per valutare la probabilità (data H0) della differenza osservata tra le medie dei due campioni, correggendo per l errore standard Il calcolo dela differenza tra le due medie non pone difficoltà x = (X 1 X 2 ); Il calcolo dell errore standard richiede l individuazione di un valore comune della varianza Questo valore può essere stimato se i due campioni appartengono alla stessa popolazione (H0) oppure a due popolazioni diverse (H1) ma con varianza uguale In tal caso si potrà calcolare uno stimatore comune dell errore standard Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 54

55 Il caso di due campioni con varianze diverse esula da questo programma (si può comunque affrontare con i test non parametrici, considerati nelle prossime lezioni Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 55

56 Nel caso di due campioni con varianza comune, lo stimatore migliore della varianza comune è la media delle due varianze campionarie, pesata per il numero di gradi di libertà di ciascun campione S 2 = [(n 1-1)s (n 2-1)s 2 2 =] / [(n 1-1) + (n 2-1)] = {(n 1-1)Σ[(x 1 X 1 ) 2 /(n 1-1)] + (n 2-1)Σ[(x 2 X 2 ) 2 /(n 2-1)]} / [(n 1-1) + (n 2-1)] = {Σ(x 1 X 1 ) 2 + Σ(x 2 X 2 ) 2 } / [(n 1 + n 2-2)] = somma delle devianze / gradi di libertà s = s 2 ES(X 1 X 2 ) = (s 2 /n 1 + s 2 /n 2 ) = s 2 * (1/n 1 + 1/n 2 ) t gl = (X 1 X 2 ) / ES(X 1 X 2 ) = (X 1 X 2 ) / [ s 2 * (1/n 1 + 1/n 2 )] Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 56

57 Esempio: In un laboratorio si intende confrontare l effetto di due differenti diete sulla crescita di ratti La tabella indica l incremento di peso conseguito in 60 giorni H lavoro: la dieta 1 consente una più veloce aumento di peso H0: le due diete sono uguali per quanto riguarda l aumento di peso Test a 2 code Errore di primo tipo= 005 Numerosità campionaria definita in base al numero di animali già trattati con le due diete Errore di 2 tipo non misurato Test t-student (confronto tra medie di 2 campioni indipendenti) requisiti La distribuzione del peso degli animali è gaussiana Gli animali sono dello stesso ceppo, si suppone quindi che la varianza del peso sia la stessa e che le due diete non modifichino la varianza comune Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 57

58 I dati: Dieta 1 Dieta X 1 = 1200 X 2 = 1010 n 1 = 12 n 2 = 7 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 58

59 S 2 = {Σ(x 1 X 1 ) 2 + Σ(x 2 X 2 ) 2 } / [(n 1 + n 2-2)] Σ(x 1 X 1 ) 2 = 5032,00 Σ(x 2 X 2 ) 2 = 2552,00 S 2 = { } / 17 = ES(X 1 X 2 ) = s 2 * (1/n 1 + 1/n 2 ) ES(X 1 X 2 ) = * (1/12 + 1/7) = = 1004 t 17 = ( ) / 1004 = 189 p=0076 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 59

60 Calcolo dell intervallo di confidenza sulla differenza tra le medie L intervallo di confidenza viene calcolato rispetto alla differenza delle medie campionarie Indichiamo tale differenza come X [ X - t gl,α/2 *(s/ n)] < (x 1 x 2 ) < [ X + t gl,α/2 *(s/ n)] Dove: t gl,α/2 = valore della funzione t (con il numero dato di gradi di libertà) corrispondente all errore di 1 tipo scelto S: deviazione standard comune N: (1/n 1 + 1/n 2 ) Limite fiduciale superiore = X + t gl,α/2 *(s/ n) Limite fiduciale inferiore = X - t gl,α/2 *(s/ n) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 60

61 Calcolo dell intervallo di confidenza (continua dall esempio precedente) [ X - t gl,α/2 *(s/ n)] < (x 1 x 2 ) < [ X + t gl,α/2 *(s/ n)] X = (x 1 x 2 ) = 190 t 17,005/2 = 2110 ES(X 1 X 2 ) = ES( X) = 1004 Limiti di confidenza= 190 ± 2110 *1004 = -22; 402 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 61

62 Confronto tra due campioni appaiati (finire) E (X 1 X 2 ) = µ 1 - µ 2 Ma s s 2 2 < δ δ 2 2 Calcolo differenze d tra le osservazioni appaiate d 1 = x 1 - x 2 calcolo quindi media e varianza di d, usando le formule consuete Calcolo quindi la statistica t con gl=nosservazioni 1 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 62

63 I dati trattamento placebo diff Differenza media = - 1,30 n = 10 S 2 = Σ(d 1 D) 2 / (n) = 186,1 / 9 = 20,68 ES(d) = s 2 / 1/n Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 63

64 = 20,68 / 10 = 2,068 = 1,438 t 9 = -1,30 / 1,438 = - 0,90 p=039 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 64

65 Calcolo dell intervallo di confidenza sulla differenza tra le medie L intervallo di confidenza viene calcolato rispetto alla differenza media [D - t gl,α/2 *(s/ n)] < (x 1 x 2 ) < [D + t gl,α/2 *(s/ n)] Dove: t gl,α/2 = valore della funzione t (con il numero dato di gradi di libertà) corrispondente all errore di 1 tipo scelto S: deviazione standard della differenza Limite fiduciale superiore = D + t gl,α/2 *(s/ n) Limite fiduciale inferiore = D - t gl,α/2 *(s/ n) Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 65

66 Calcolo dell intervallo di confidenza (continua dall esempio precedente) D = - 1,30 T 9,005/2 = 2262 ES(D) = 1,438 Limiti di confidenza= -1,30 ± 2262*1,438 = -4,55; 1,95 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Inferenza sulle medie 66

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea

Dettagli

Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corsi di laurea di area tecnica Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Corsi di laurea triennale di area tecnica - Corso di

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Lezione 2

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Lezione 2 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Lezione Campionamento ed inferenza Popolazione: insieme di tutti i valori realizzati o possibili

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,

Dettagli

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione. Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z, riferito

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso

Dettagli

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corsi di laurea triennale di area tecnica Corso di Statistica Medica Intervalli di confidenza Corsi di laurea triennale di area tecnica - Corso di Statistica Medica -

Dettagli

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie Università del Piemonte Orientale Corso di dottorato in medicina molecolare aa 2002 2003 Corso di Statistica Medica Inferenza sulle medie Statistica U Test z Test t campioni indipendenti con uguale varianza

Dettagli

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica Medica Le distribuzioni teoriche di probabilità La distribuzione Normale (o di

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica Medica Campionamento e distribuzione campionaria della media CdL Infermieristica

Dettagli

Intervallo di confidenza.

Intervallo di confidenza. Intervallo di confidenza annarita.vestri@uniroma1.it campione inferenza popolazione Media Riportare sempre anche la deviazione standard Stima puntuale di Media, dev.standard, numerosità Qualche semplice

Dettagli

Test d ipotesi: confronto fra medie

Test d ipotesi: confronto fra medie Test d ipotesi: confronto fra medie Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona CONFRONTO FRA MEDIE 1) confronto fra una media campionaria e una media di popolazione

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss) Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in medicina e chirurgia - Corso di Statistica

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Statistica. Lezione 4

Statistica. Lezione 4 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 4 a.a 2011-2012 Dott.ssa Daniela

Dettagli

STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA

STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA 6--008 Tempo disponibile 45 minuti. Usate solo questo foglio per le risposte. Nome Cognome Numero di matricola Corso e sede Esercizio. A

Dettagli

Cenni di statistica statistica

Cenni di statistica statistica Cenni di statistica La statistica è una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare fenomeno in condizioni di incertezza o non determinismo, ovvero di non completa

Dettagli

Contenuto del capitolo

Contenuto del capitolo Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come

Dettagli

Esercizi di statistica inferenziale

Esercizi di statistica inferenziale Dipartimento di Fisica SMID a.a. 004/005 Esercizi di statistica inferenziale Prof. Maria Antonietta Penco tel. 0103536404 penco@fisica.unige.it 6/1/005 Esercizio1 E noto che un grande numero di pazienti

Dettagli

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Campionamento 21/1/2005

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Campionamento 21/1/2005 SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Campionamento 21/1/2005 Importanza del campionamento Permette di trarre conclusioni o fare previsioni limitando l'osservazione solo a un gruppo

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Confronto tra due popolazioni Lezione 6

Confronto tra due popolazioni Lezione 6 Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell ' Lezione 2 Argomenti della lezione: La statistica inferenziale: concetti di base Campionamento Stima Distribuzione campionaria Popolazione (o universo) Insieme di tutti gli elementi cui si rivolge il ricercatore

Dettagli

Campionamento e distribuzione campionaria della media

Campionamento e distribuzione campionaria della media Università del Piemonte Orientale Corso di Laurea in Biotecnologia Corso di Statistica Medica Campionamento e distribuzione campionaria della media 1 Argomenti della lezione - Perché estrarre un campione

Dettagli

tabelle grafici misure di

tabelle grafici misure di Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine

Dettagli

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

Inferenza su una popolazione

Inferenza su una popolazione Inferenza su una popolazione La distribuzione di x(m) ha media pari a μ, quindi x(m) è uno stimatore non distorto della media della popolazione μ. Per fare inferenza sulla media dobbiamo avere un CCS,

Dettagli

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof.

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof. Lezione VII: Z-test Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone Statistica inferenziale per variabili quantitative

Dettagli

Metodi statistici per lo studio dei fenomeni biologici

Metodi statistici per lo studio dei fenomeni biologici Metodi statistici per lo studio dei fenomeni biologici Alla fine di questa lezione dovreste essere in grado di: descrivere la distribuzione di campionamento della differenza di due medie costruire gli

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Introduzione all'inferenza Lezione 4

Introduzione all'inferenza Lezione 4 Last updated April 16, 2016 Introduzione all'inferenza Lezione 4 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Introduzione all inferenza Popolazione Campione

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità Università del Piemonte Orientale Corsi di Laurea Triennale di Area Tecnica Corso di Statistica Medica Le distribuzioni teoriche di probabilità La distribuzione Normale (o di Gauss) CdL Area Tecnica -

Dettagli

Parametri statistici

Parametri statistici SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice

Dettagli

Modulo III. Definizione ed elementi di calcolo delle probabilità Le variabili casuali La distribuzione normale e la normale standardizzata

Modulo III. Definizione ed elementi di calcolo delle probabilità Le variabili casuali La distribuzione normale e la normale standardizzata Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea triennale Tecniche della Prevenzione PERCORSO SRTAORDINARIO 2007/08 Insegnamento di STATISTICA MEDICA Docente:Dott.ssa Egle

Dettagli

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati.

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati. Una volta selezionato il campione, la variabile di interesse viene misurata sugli elementi che lo costituiscono. I valori che la variabile assume vengono poi sintetizzati utilizzando le statistiche opportune

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Statistica Descrittiva Variabili numeriche Misure di tendenza centrale Media (aritmetica) Mediana Media

Dettagli

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri Statistica Inferenziale La verifica di ipotesi Davide Barbieri Inferenza statistica Inferenza: procedimento di induzione, dal particolare al generale. Stima di un parametro della popolazione partendo da

Dettagli

Tempo disponibile: 60 minuti

Tempo disponibile: 60 minuti Corso di Specialistica in Biotecnologie Statistica medica. A.A. 005-006 6 Marzo 006 Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per misurare l'effetto

Dettagli

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1 Confronto tra medie Si considerino due popolazioni di individui sottoposti a due diversi trattamenti farmacologici. Si vuole valutare se tali trattamenti producono uguali effetti (ipotesi nulla) o diversi

Dettagli

Cognome e nome Tempo disponibile: 75 minuti

Cognome e nome Tempo disponibile: 75 minuti Corso di Laurea in Biotecnologia Statistica medica. A.A. 2010-2011 21 giugno 2011 Cognome e nome Tempo disponibile: 75 minuti 1. Immaginate di condurre uno studio sperimentale in cui si confronta l effetto

Dettagli

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica Medica Le distribuzioni teoriche di probabilità La distribuzione Normale (o di

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA IRCBG 19027 Modulo Dal campione alla popolazione: l'inferenza e l'intervallo di confidenza IRCCS Burlo Garofolo Formazione, Aula A via dell Istria

Dettagli

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori. Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri

Dettagli

Distribuzione normale

Distribuzione normale Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

Cognome e nome Tempo disponibile: 60 minuti

Cognome e nome Tempo disponibile: 60 minuti Corso di Laurea in Medicina e Chirurgia Statistica medica. A.A. 005-006 6 Marzo 006 Cognome e nome Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per

Dettagli

Cognome e nome. 2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 129; 134; 142; 128; 146

Cognome e nome. 2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 129; 134; 142; 128; 146 Statistica medica. Biotecnologie mediche A.a. 2004-2005 1 Febbraio 2005 Tempo previsto 60 minuti Cognome e nome 1 Indicate a quale categoria appartengono le seguenti variabili: Nominale Ordinale Numerica

Dettagli

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it I risultati di un esperimento

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Statistica inferenziale per variabili quantitative

Statistica inferenziale per variabili quantitative Lezione 7: - Z - test e intervalli di Confidenza - t-test per campioni indipendenti e dipendenti Cattedra di Biostatistica Dipartimento di Scienze scperimentali e cliniche, Università degli Studi G. d

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 4.1 I principali test statistici per la verifica di ipotesi: Il test t Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico

Dettagli

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica Costruzione di macchine Modulo di: Progettazione probabilistica e affidabilità Marco Beghini Lezione 7: Basi di statistica Campione e Popolazione Estrazione da una popolazione (virtualmente infinita) di

Dettagli

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto

Dettagli

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Tecniche di sondaggio

Tecniche di sondaggio SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con

Dettagli

Variabili Casuali Continue

Variabili Casuali Continue Distribuzione Normale Concentrazione di cloro nel sudore Variabili Casuali Continue 9 8 7 6 5 4 3 media = 98.8 meq/l mediana =. meq/l moda =. meq/l < 3 6 5 me/l La distribuzione empirica (diagramma a barre)

Dettagli

Laboratorio di Chimica Fisica. Analisi Statistica

Laboratorio di Chimica Fisica. Analisi Statistica Università degli Studi di Bari Dipartimento di Chimica 9 giugno F.Mavelli- Laboratorio Chimica Fisica - a.a. 3-4 F.Mavelli Laboratorio di Chimica Fisica a.a. 3-4 Analisi Statistica dei Dati Analisi Statistica

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima puntuale di µ la deviazione standard Media,

Dettagli

Campione: Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

Campione: Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1 Campione: - raccolta finita di elementi estratti da una popolazione - scopo dell estrazione è quello di ottenere informazioni sulla popolazione - il campione deve essere rappresentativo della popolazione

Dettagli

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione

Dettagli

Cognome e nome. Distribuzione Gaussiana; Media = 122,4 mmhg; Deviazione standard= 14,28 mmhg

Cognome e nome. Distribuzione Gaussiana; Media = 122,4 mmhg; Deviazione standard= 14,28 mmhg Statistica medica. A.a. 2004-2005 15 Febbraio 2005 Tempo previsto 60 minuti Cognome e nome Avete consegnato l'esercitazione di Abilità Informatiche? _SI_ _NO_ LE SOLUZIONI SONO SCRITTE NELLE ULTIME PAGINE

Dettagli

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75 00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure relative a una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

Campionamento e stima di parametri

Campionamento e stima di parametri Sia X una variabile aleatoria associata a un dato esperimento. Ripetiamo l esperimento n volte, ottenendo una famiglia di valori sperimentali della v.a. X : X = (X 1, X 2,..., X n ) ogni X i é una v.a.

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:

Dettagli

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali A.A 2009-2010 Esercitazione E Scopo dell esercitazione Applicazioni del teorema del limite centrale. Rappresentazione delle incertezze

Dettagli

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno a.a. 2007-2008 Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno Dott.ssa Daniela Alessi daniela.alessi@med.unipmn.it 1 Argomenti:

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea

Dettagli

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi: DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme

Dettagli

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A Università degli Studi di Padova Corso di Laurea in Medicina e Chirurgia - A.A. 015-16 Corso Integrato: Statistica e Metodologia Epidemiologica Disciplina: Statistica e Metodologia Epidemiologica Docenti:

Dettagli

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana Statistica Lez. 1 Gli intervalli di confidenza Intervallo di confidenza per la media (σ nota) nel caso di popolazione Gaussiana Sia X una v.c Gaussiana di media µ e varianza σ. Se X 1, X,..., X n è un

Dettagli

Variabili aleatorie gaussiane

Variabili aleatorie gaussiane Variabili aleatorie gaussiane La distribuzione normale (riconoscibile dalla curva a forma di campana) è la più usata tra tutte le distribuzioni, perché molte distribuzioni che ricorrono naturalmente sono

Dettagli

La distribuzione t. Federico Plazzi. 7 Novembre 2015

La distribuzione t. Federico Plazzi. 7 Novembre 2015 La distribuzione t Federico Plazzi 7 Novembre 2015 Popolazione e campioni Popolazione e campioni Definizioni ed assunzioni di partenza Campione: l insieme di individui che abbiamo potuto osservare. Popolazione

Dettagli

DISTRIBUZIONI DI CAMPIONAMENTO

DISTRIBUZIONI DI CAMPIONAMENTO DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,

Dettagli

SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Campionamento 17/1/2006

SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Campionamento 17/1/2006 SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Campionamento 17/1/2006 Probabilità e frequenza Nella pratica quotidiana ( media ) questi concetti vengono utilizzati in modo diffuso

Dettagli