3. Confronto tra medie di due campioni indipendenti o appaiati

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "3. Confronto tra medie di due campioni indipendenti o appaiati"

Transcript

1 BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.1

2 O APPAIATI SPECULARE UNIVERSO PARAMETRI PROGRAMMARE INFERIRE CAMPIONE STIMATORI DESCRIVERE MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.2

3 O APPAIATI Siamo interessati a valutare se due diete (A e B) determinano diversi incrementi del peso delle cavie con esse nutrite UNIVERSO PARAMETRI CAMPIONE STIMATORI MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.3

4 Siamo interessati a valutare se due diete (A e B) determinano diversi incrementi del peso delle cavie con esse nutrite UNIVERSO PARAMETRI PROGRAMMARE CAMPIONE STIMATORI Vengono scelti casualmente due campioni di 12 e 13 cavie ciascuno, ad ognuno di essi viene somministrata una delle due diete in studio dalla nascita fino all età di 3 mesi e ne vengono registrati gli incrementi di peso. I campioni sono indipendenti MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.4

5 CAMPIONE 1 CAMPIONE 2 STATISTICHE DESCRIVERE STATISTICHE STATISTICHE STATISTICHE n 1 = y i1 : generica i-esima osservazione del campione 1 (j =1) n 2 = 13 y i2 : generica i-esima osservazione del campione 2 (j =2) MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.5

6 4 CAMPIONE s 1 = 4.24 y 1 = CAMPIONE 2 s 2 = y 2 = MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.6

7 IPOTESI: I due campioni provengono dalla stessa popolazione di cavie e se potessimo misurare l intera popolazione sarebbe X ~ N(µ,σ 2 ) µ Media campionaria Noi non conosciamo nè la media µ nè la varianza σ 2, ma conosciamo i parametri campionari: y 1 y 2 medie s 1 s 2 Dev. standard n 1 n 2 numerosità MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.7

8 POPOLAZIONE campione 1 campione 2 Dieta A Dieta B n 1 = 12 y 1 = 60 s 1 = 4.24 n 2 = 13 y 2 = s 2 = 4.21 Ai due campioni assegniamo diete diverse. Le osservazioni ottenute sono ancora compatibili con l ipotesi che i due campioni provengono dalla stessa popolazione? MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.8

9 SPECULARE UNIVERSO PARAMETRI PROGRAMMARE INFERIRE CAMPIONE STIMATORI DESCRIVERE MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.9

10 POPOLAZIONE BERSAGLIO Tutti i possibili campioni y 1 y 2 µ Media Medie campionaria campionarie δ = µ 2 - µ 1 = µ - µ =0 d = y 2 y 1 H 0 : δ=0 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.10

11 POPOLAZIONE 1 (dieta A) (tutte le medie campionarie y 1 ) POPOLAZIONE 2 (dieta B) (tutte le medie campionarie y 2 ) Tutti i possibili campioni Tutti i possibili campioni y 1 y 2 µ 1 Le due distribuzioni hanno la stessa varianza δ = µ 2 - µ 1 µ 2 d = y 2 y 1 H 1 : δ = 0 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.11

12 IN GENERALE δ = µ 1 - µ 2 µ 1 µ 2 POPOLAZIONE 1 POPOLAZIONE 2 n 1 = 12 y 1 = 60 s 1 = 4.24 n 2 = 13 y 2 = s 2 = 4.21 d = y 2 - y 1 = 3.77 La variabile di interesse non è più la media campionaria bensì la differenza tra medie campionarie MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.12

13 POPOLAZIONE BERSAGLIO (tutte le possibili differenze tra medie campionarie) Tutti i possibili campioni ignota d Differenze tra medie campionarie δ MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.13

14 Ipotesi nulla: H 0 : µ 1 = µ 2 δ = 0 Cosa succede sotto l ipotesi nulla? MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.14

15 POPOLAZIONE BERSAGLIO (tutte le possibili differenze tra medie campionarie) Tutti i possibili campioni Questa situazione è compatibile con l ipotesi nulla? d δ = 0 Differenze tra medie campionarie MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.15

16 Situazione possibile d δ = 0 Situazione meno probabile d δ = 0 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.16

17 Ipotesi nulla: H 0 : µ 1 = µ 2 δ = 0 L ipotesi nulla non può essere mai rigettata con assoluta certezza! Dobbiamo agganciare alla stima d un livello di confidenza. P-Value: quanto estremo è il risultato che abbiamo ottenuto? d d δ = 0 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.17

18 P-Value: probabilità di ottenere un risultato campionario altrettanto o più estremo di quello osservato, se H 0 è vera P-value = Pr ( D >d sotto H 0 ) Più piccolo è il valore del p-value, 1) più estremo è il valore d osservato 2) Più bassa l evidenza che i dati siano coerenti con la distribuzione sotto l ipotesi nulla P-value=0.25 P-value=0.03 d d δ = 0 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.18

19 PROBLEMA: l ipotesi è bidirezionale H 0 : δ = 0 vs H 1 : δ = 0 Unidirezionale P-value = Pr ( D >d sotto H 0 ) Bidirezionale 2*P-value P-value=0.06 P-value=0.03 P-value=0.03 -d d δ = 0 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.19

20 Tre procedure per saggiare l ipotesi nulla A. Stima intervallare B. Test basato sulla t di Student C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.20

21 Ricordando la stima intervallare nel caso di una media campionaria: y ± t. es la si adatti al confronto tra due medie campionarie MARTA BLANGIARDO A. CONFRONTO Stima intervallare TRA MEDIE DI 2 CAMPIONI- 3.21

22 y ± t. es La variabile misurata di interesse non è più la media campionaria y, bensì la differenza tra medie campionarie d: d ± t. es A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.22

23 n 1 = 12 y 1 = 60 s 11 = 4.24 n 2 = y 2 y= 2 = s 22 = 4.21 d ± t. es d = y 2 y 1 = 3.77 A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.23

24 d ± t. es L errore standard non è più s / n visto che, essendo implicati due campioni, si dispone di due deviazioni standard (s 1 e s 2 ) e due numerosità campionarie (n 1 e n 2 ) s* = Pooled (n 1-1). s 12 + (n 2-1). s 2 2 (n 1-1) + (n 2-1) A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.24

25 d ± t. es L errore standard non è più s / n visto che, essendo implicati due campioni, si dispone di due deviazioni standard (s 1 e s 2 ) e due numerosità campionarie (n 1 e n 2 ) 1 n* = 1 n n 2 = n 1 + n 2 n 1. n 2 A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.25

26 n 1 = 12 y 1 = 60 s 1 = 4.24 n 2 = y 2 y 2 = = s 2 = ± t. es es d = s* 1 n* = (n 1-1). s 12 + (n 2-1). s 2 2 (n 1-1) + (n 2-1) n 1 + n 2 n 1. n 2 es d = (12-1) (13-1) (12-1) + (13-1) = 1.69 A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.26

27 d ± t. es Valore critico della variabile casuale t di Student, caratterizzata da un certo numero di gradi di libertà g e da una probabilità (1-α). Quindi d ± t g ; (1-α). es A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.27

28 d ± t g ; (1-α). es I gradi di libertà non sono più n - 1 visto che, essendo implicati due campioni, si dispone di due numerosità campionarie (n 1 e n 2 ): g = ( n 1 + n 2 ) - 2 A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.28

29 d ± t g ; (1-α). es Dove 1 - α è il livello di confidenza dell intervallo (di solito definiamo 0.9, 0.95 o 0.99) A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.29

30 n 1 = 12 y 1 = 60 s 1 = 4.23 n 2 = 13 y 2 = s 2 = ± t g;(1-α) Fissando (1-α) = 0.9 e avendo due code abbiamo /2 = ± t 23; Dalla tavola della distribuzione t: 3.77 ± A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.30

31 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI Distribuzione t gdl

32 n 1 = 12 y 1 = 60 s 1 = 4.23 n 2 = 13 y 2 = 64 s 2 = ± , valore atteso sotto l ipotesi nulla δ = 0 Ripetendo l esperimento 100 volte nelle stesse condizioni, ci si aspetta che in 90 casi le due diete differiscano A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.32

33 H 0 : µ 1 = µ 2 δ = 0 Visto che l intervallo non contiene il valore atteso sotto l ipotesi nulla con: α = 0.1 allora concludiamo che non c è abbastanza evidenza che supporti che i dati siano coerenti con l ipotesi nulla e quindi H 1 : µ 1 µ 2 δ 0 Le E se due avessimo medie differiscono prefissato un errore di primo significativamente tipo più cautelativo (es. α = 0.01)? A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.33

34 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI Distribuzione t gdl

35 Se seguiamo un approcico più cautelativo e fissiamo 1-α = 0.99 n 1 = 12 y 1 = 60 s 1 = 4.23 n 2 = 13 y 2 = s 2 = ± , valore atteso sotto l ipotesi nulla δ = 0 Non c è più evidenza che le due diete differiscano A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.35

36 Tre procedure per saggiare l ipotesi nulla A. Stima intervallare B. Test del t di Student C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.36

37 Ricordando la variabile casuale t nel caso di una media campionaria è: t = y - µ s n la si adatti al confronto tra due medie campionarie B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.37

38 t = y - µ s n È la differenza tra il valore osservato e quello atteso sotto l ipotesi nulla Nel caso della differenza tra due medie quindi: (y 2 - y 1 ) - 0 d B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.38

39 t = y - µ s n È l errore standard di una media campionaria Nel caso della differenza tra due medie quindi: 1 es d = s* n* = (n 1-1). s 12 + (n 2-1). s 2 2 (n 1-1) + (n 2-1) n 1 + n 2 n 1. n 2 B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.39

40 t = y - µ s n Il valore della variabile casuale t è caratterizzato dai gradi di libertà (g): Quindi dovrebbe essere scritta come: t g = (y 2 - y 1 ) - 0 es d che rappresenta il valore empirico (osservato) di t. La valutazione dell accettazione/rifiuto viene ottenuta tramite il P-value B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.40

41 0.025 DISTRIBUZIONE 3. CONFRONTO TRA MEDIE DI DUE CAMPIONI t g -t g δ = 0 t g P-value< <P-value< <P-value<0.1 P-value>=0.1 Fortissima evidenza contro H 0 Forte evidenza contro H 0 Evidenza contro H 0 Non sufficiente evidenza contro H 0 B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.41

42 n 1 = 12 y 1 = 60 s 1 = 4.23 n 2 = 13 y 2 = 64 s 2 = 4.21 t g = (y 2 - y 1 ) - 0 es d 3.77 t 23 = = è il valore empirico della statistica t. Il P-value corrispondente è P-value < Ipotesi bidirezionale 2*P-value < 0.05 <0.05: Forte evidenza contro H 0 B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.42

43 Tre procedure per saggiare l ipotesi nulla A. Stima intervallare B. Test del t di Student C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.43

44 CAMPIONE 1 CAMPIONE Media generale: y = 62 Devianza totale = Σ Σ (y ij - y) 2 j i = (56-62) 2 + (59-62) 2 + (63-62) (67-62) 2 + (64-62) 2 + (60-62) 2 = = 499 Da quali fonti dipende la variabilità (devianza) totale del fenomeno? C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.44

45 CAMPIONE 1 CAMPIONE Media generale: y = 62 y 1 = 60 y 2 = 63.8 Devianza tra i livelli del fattore sperimentale Σ n j (y j - y) 2 j = 12. ( ) ( ) 2 = Una prima fonte di variabilità è dovuta al fatto che i due campioni sono stati sottoposti a diverse diete (fattore sperimentale) C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.45

46 CAMPIONE 1 CAMPIONE y 1 = 60 y 2 = 63.8 Devianza entro i livelli del fattore sperimentale Σ Σ (y ij - y j ) 2 i j Una seconda fonte di variabilità è dovuta al fatto che ogni unità sperimentale tende a rispondere in modo diverso dalle altre allo stesso stimolo (livello del fattore sperimentale) = (56-60) 2 + (59-60) 2 + (63-60) ( ) 2 + ( ) 2 + ( ) 2 = = C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.46

47 SISTEMATICA Fonti di variabilità devianza Tra gruppi Entro gruppi * = Totale CASUALE * Variabilità residua C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.47

48 Fonti di variabilità devianza gradi di libertà Tra gruppi (N.gruppi-1) + Entro gruppi Totale = = 23 (N N.gruppi) = 24 (N-1) C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.48

49 Fonti di variabilità devianza gradi di libertà varianza Tra gruppi Entro gruppi = = = + = 17.8 Totale = 24 F 1, 23 = Varianza tra gruppi Varianza entro gruppi = = C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.49

50 DISTRIBUZIONE F g1;g2 Area = 1 1 Valore atteso sotto l ipotesi nulla In questo caso le tavole disponibili non permettono di calcolare il P-value. E possibile calcolare il P-value tramite software (excel, R, Matlab). =DISTRIB.F(4.97,1,23) = P-value<0.05 Funzione di Excel C. Analisi della varianza e test F Forte evidenza contro H 0 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.50

51 Ci sono tavole tabulate che permettono di calcolare una soglia di accettazione/rifiuto per alcune prespecificate soglie 1-α (0.9,0.95) F (1-α),g1,g2 F g1,g2 F g1,g2 Non sufficiente evidenza contro H 0 Sufficiente evidenza contro H 0 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.51

52 Distribuzione F g1;g2;0.95 F Gradi di libertà del denominatore Gradi di libertà del numeratore MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.52

53 Distribuzione F 1,23 Area di accettazione Area di rifiuto Valore tabulato 4.28 Valore empirico 4.97 allora dovremmo rifiutare l ipotesi nulla: p < 0.05 C. Analisi della varianza e test F MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.53

54 Due vie equivalenti per saggiare l ipotesi nulla Test del t di Student t 23 = 2.23 Analisi della varianza F 1,23 = 4.97 t 2 = F 23 1,23 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.54

55 APPAIATI Siamo interessati a valutare se il ph di un terreno acido sulla superficie è diversa da quella del sottosuolo UNIVERSO PARAMETRI PROGRAMMARE CAMPIONE STIMATORI Si estrae un campione di 13 zolle di terreno e su ognuna di esse si misura il ph in superficie e nel sottosuolo. Abbiamo due misurazioni per ogni zolla. I campioni sono appaiati MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.55

56 APPAIATI CAMPIONE 1 CAMPIONE 2 Superficie STATISTICHE Sottosuolo STATISTICHE n = 13 E lo stesso campione con due diverse misurazioni Per ogni zolla le due misurazioni non sono indipendenti MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.56

57 APPAIATI Calcoliamo la variabile differenza tra le due misurazioni Superficie Sottosuolo Differenza La nuova variabile Differenza è quella su cui vogliamo fare inferenza MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.57

58 APPAIATI IPOTESI: La differenza tra il ph in superficie e nel sottosuolo si distribuisce come una variabile casuale Normale D ~ N(µ d,σ 2 d ) µ Media campionaria Noi non conosciamo nè la media µ d nè la varianza σ 2 d, ma conosciamo i parametri campionari: d media s d Dev. standard n numerosità INFERENZA SU UN CAMPIONE MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.58

59 APPAIATI POPOLAZIONE BERSAGLIO Tutti i possibili campioni di differenze d µ d H 0 : µ d = 0 Media Medie campionaria campionarie Cosa succede sotto l ipotesi nulla? MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.59

60 APPAIATI POPOLAZIONE BERSAGLIO (tutte le possibili differenze) Tutti i possibili campioni È questa situazione compatibile con l ipotesi nulla? d Differenze tra medie campionarie MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.60

61 APPAIATI Situazione possibile d Situazione meno probabile d MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.61

62 APPAIATI Ipotesi nulla: H 0 : µ d =0 L ipotesi nulla non può essere mai rigettata con assoluta certezza! Dobbiamo agganciare alla stima d un livello di confidenza. P-Value: quanto estremo è il risultato che abbiamo ottenuto? d µ d = 0 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI d 1

63 APPAIATI Tre procedure per saggiare l ipotesi nulla A. Stima intervallare B. Test basato sulla t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.63

64 APPAIATI Avendo un solo campione, in questo caso la stima intervallare da utilizzare è proprio quella introdotta precedentemente nel caso di una media campionaria: y ± t. es Che nel caso di campioni appaiati è d ± t. es n = 13 d = se = 1.15 sd/radq(n) MARTA BLANGIARDO A. CONFRONTO Stima intervallare TRA MEDIE DI 2 CAMPIONI- 3.64

65 APPAIATI Noi non conosciamo la varianza σ 2 T di Student t g ; (1-α) Valore critico della variabile casuale t di Student, caratterizzata da un certo numero di gradi di libertà g e da una probabilità (1-α). Quindi l intervallo di confidenza sarà d ± t g ; (1-α). es n-1 A. Stima intervallare livello di confidenza dell intervallo (di solito definiamo 0.9, 0.95 o 0.99) MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.65

66 APPAIATI n = 13 d = es = ± t g;(1-α) Fissando (1-α) = 0.95 e avendo due code abbiamo /2 = ± t 12; Dalla tavola della distribuzione t: ± A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.66

67 MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI Distribuzione t gdl CONFRONTO TRA MEDIE DI DUE CAMPIONI APPAIATI

68 APPAIATI n = 13 d = es = ± , valore atteso sotto l ipotesi nulla µ d = Ripetendo l esperimento 100 volte nelle stesse condizioni, ci si aspetta che in 95 casi i due ph non siano diversi significativamente A. Stima intervallare MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.68

69 APPAIATI Tre procedure per saggiare l ipotesi nulla A. Stima intervallare B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.69

70 APPAIATI Ricordando la variabile casuale t nel caso di una media campionaria è: t = d - µ s n È la differenza tra il valore osservato e quello atteso sotto l ipotesi nulla Nel caso di campioni appaiati abbiamo: d - 0 ph 1 ph d B. Test del t di Student d MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.70

71 APPAIATI t = y i - µ s n È l errore standard (es) di una media campionaria s = n Σ(y i - y) 2 i =1 n - 1 = 1.15 n n B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.71

72 APPAIATI t = y i - µ s n Il valore della variabile casuale t è caratterizzato dai gradi di libertà (g): Quindi dovrebbe essere scritta come: t g = d - 0 es d che rappresenta il valore empirico (osservato) di t. La valutazione dell accettazione/rifiuto viene ottenuta tramite il P-value I gradi di libertà sono n-1 B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.72

73 APPAIATI n = 13 d = es d = 1.15 t g = d - 0 se d t 12 = = è il valore empirico della statistica t. Il P-value corrispondente è B. Test del t di Student MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.73

74 APPAIATI Il valore è negativo Le tavole restituiscono la coda di destra solo per valori positivi, ma Pr(D<-0.37 sotto H 0 ) = Pr(D>0.37 sotto H 0 ) Dalle tavole otteniamo 0.3<P-value < < 2*P-value < Non c è evidenza di una differenza significativa dei ph MARTA BLANGIARDO CONFRONTO TRA MEDIE DI 2 CAMPIONI- 3.74

4. Confronto tra medie di tre o più campioni indipendenti

4. Confronto tra medie di tre o più campioni indipendenti BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

6. Modelli statistici: analisi della regressione lineare

6. Modelli statistici: analisi della regressione lineare BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Problema pratico: Test statistico = regola di decisione

Problema pratico: Test statistico = regola di decisione La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 L4, Corso Integrato di Psicometria - Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Rev. 18/04/2011 Inferenza statistica Formulazione

Dettagli

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato. Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi

Dettagli

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Politecnico di Milano - Anno Accademico 200-20 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Esercitazione 9 2 Giugno 20 Esercizio. In un laboratorio per il test dei materiali,

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione in base ad informazioni ricavate da un campione. Inferenza statistica: indurre

Dettagli

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per categoriali. Alessandro Valbonesi

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per categoriali. Alessandro Valbonesi LEZIONI DI STATISTCA APPLICATA Parte 2 Statistica inferenziale Variabili continue per categoriali Alessandro Valbonesi SARRF di Scienze ambientali Anno accademico 2010-11 CAPITOLO 4 - TEST STATISTICI CHE

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Analisi statistica di dati biomedici Analysis of biologicalsignals II Parte Verifica delle ipotesi (a) Agostino Accardo (accardo@units.it) Master in Ingegneria Clinica LM in Neuroscienze 2013-2014 e segg.

Dettagli

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie Università del Piemonte Orientale Corso di dottorato in medicina molecolare aa 2002 2003 Corso di Statistica Medica Inferenza sulle medie Statistica U Test z Test t campioni indipendenti con uguale varianza

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corsi di Specialità Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea in biotecnologie

Dettagli

decidiamo, sulla base di un campione, se l ipotesi formulata è plausibile oppure no.

decidiamo, sulla base di un campione, se l ipotesi formulata è plausibile oppure no. LA VERIFICA D IPOTESI Alla base dell inferenza statistica vi è l assunzione che i fenomeni collettivi possano essere descritti efficacemente mediante delle distribuzioni di probabilità. Abbiamo già considerato

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

Il controllo delle prestazioni del provider. IL CONTROLLO DELLE PRESTAZIONI DEL PROVIDER (riferimenti)

Il controllo delle prestazioni del provider. IL CONTROLLO DELLE PRESTAZIONI DEL PROVIDER (riferimenti) del provider IL CONTROLLO DELLE PRESTAZIONI DEL PROVIDER (riferimenti) 1 del provider - premessa (1) in merito alla fase di gestione ordinaria dell outsourcing sono state richiamate le prassi di miglioramento

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA) Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Analisi della varianza (ANOVA) Analisi della varianza Analisi della varianza (ANOVA) ANOVA ad

Dettagli

INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1)

INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1) INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1) 151 Introduzione Un esperimento è una prova o una serie di prove. Gli esperimenti sono largamente utilizzati nel campo dell ingegneria. Tra le varie applicazioni;

Dettagli

La statistica nella ricerca scientifica

La statistica nella ricerca scientifica La statistica nella ricerca scientifica Pubblicazione dei risultati Presentazione dei dati e la loro elaborazione devono seguire criteri universalmente validi Impossibile verifica dei risultati da parte

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

Statistica Medica. Verranno presi in esame:

Statistica Medica. Verranno presi in esame: Statistica Medica Premessa: il seguente testo cerca di riassumere e rendere in forma comprensibile ai non esperti in matematica e statistica le nozioni e le procedure necessarie a svolgere gli esercizi

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107 t-test test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie Calcola medie e altre statistiche

Dettagli

R - Esercitazione 5. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. Lunedì 2 Dicembre 2013. Università Roma Tre

R - Esercitazione 5. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. Lunedì 2 Dicembre 2013. Università Roma Tre R - Esercitazione 5 Lorenzo Di Biagio dibiagio@mat.uniroma3.it Università Roma Tre Lunedì 2 Dicembre 2013 Intervalli di confidenza (1) Sia X 1,..., X n un campione casuale estratto da un densità f (x,

Dettagli

Test statistici non-parametrici

Test statistici non-parametrici Test statistici non-parametrici Il test t di Student e l ANOVA sono basati su alcune assunzioni. Variabili continue o almeno misurate in un intervallo (es. non conosco il valore assoluto, ma posso quantificare

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 3 A. Sia una variabile casuale che si distribuisce secondo

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Confronto tra gruppi (campioni indipendenti)

Confronto tra gruppi (campioni indipendenti) Confronto tra gruppi (campioni indipendenti) Campioni provenienti da una popolazione Normale con medie che possono essere diverse ma varianze uguali campioni: Test z or t sulla differenza tra medie 3,

Dettagli

Diaz - Appunti di Statistica - AA 2001/2002 - edizione 29/11/01 Cap. 3 - Pag. 1 = 1

Diaz - Appunti di Statistica - AA 2001/2002 - edizione 29/11/01 Cap. 3 - Pag. 1 = 1 Diaz - Appunti di Statistica - AA 2001/2002 - edizione 29/11/01 Cap. 3 - Pag. 1 Capitolo 3. L'analisi della varianza. Il problema dei confronti multipli. La soluzione drastica di Bonferroni ed il test

Dettagli

Analisi statistica degli errori

Analisi statistica degli errori Analisi statistica degli errori I valori numerici di misure ripetute risultano ogni volta diversi l operazione di misura può essere considerata un evento casuale a cui è associata una variabile casuale

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Introduzione Livelli di significatività Verifica di ipotesi sulla media di una popolazione normale Verifica di ipotesi sulla varianza di una popolazione normale Verifica di ipotesi

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città

Dettagli

Esercitazioni-aula-parte-III

Esercitazioni-aula-parte-III Esercitazioni-aula-parte-III Esempio par.7.2) Ross Sia (X 1,..., X n ) un campione aleatorio estratto da una popolazione esponenziale di parametro θ incognito. Determinare l espressione dello stimatore

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Laurea in Ingegneria Meccatronica A.A. 2010 2011 n-dimensionali Riepilogo. Gli esiti di un esperimento aleatorio

Dettagli

Verità ed esperienza: come la natura genera le osservazioni sperimentali

Verità ed esperienza: come la natura genera le osservazioni sperimentali Verità ed esperienza: come la natura genera le osservazioni sperimentali Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 10 gennaio 2012 Indice 1 Presupposti

Dettagli

1. Richiami di Statistica. Stefano Di Colli

1. Richiami di Statistica. Stefano Di Colli 1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Esercizio 1 Si consideri il seguente modello ad effetti fissi con variabili binarie: + 1 2 a) supponete che N=3. Si mostri che i regressori

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 28/05/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Nel gico del

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova

Dettagli

Esercizi riassuntivi di probabilità

Esercizi riassuntivi di probabilità Esercizi riassuntivi di probabilità Esercizio 1 Una ditta produttrice di fotocopiatrici sa che la durata di una macchina (in migliaia di copie) si distribuisce come una normale con µ = 1600 e 2 = 3600.

Dettagli

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA)

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) 4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) L analisi della varianza è un metodo sviluppato da Fisher, che è fondamentale per l interpretazione statistica di molti dati biologici ed è alla

Dettagli

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni Statistica Economica Materiale didattico a cura del docente Analisi dei residui Test Esatto di Fisher Differenza fra proporzioni 1 Analisi dei residui Il test statistico ed il suo p-valore riassumono la

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

LE BASI DELLA STATISTICA E LA RACCOLTA DEI DATI

LE BASI DELLA STATISTICA E LA RACCOLTA DEI DATI LE BASI DELLA STATISTICA E LA RACCOLTA DEI DATI Tre punti importanti o Dati e ipotesi In tutte le discipline scientifiche che studiano gli organismi viventi, molto raramente i dati ottenuti attraverso

Dettagli

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia STATISTICA GIUSEPPE DE NICOLAO Dipartimento di Informatica e Sistemistica Università di Pavia SOMMARIO V.C. vettoriali Media e varianza campionarie Proprietà degli stimatori Intervalli di confidenza Statistica

Dettagli

Capitolo 7 TEST DELLE IPOTESI

Capitolo 7 TEST DELLE IPOTESI B. Chiandotto F. Cipollini Versione 3 Cap. 7 Capitolo 7 TEST DELLE IPOTESI In questo capitolo si affronta il problema della verifica d ipotesi statistiche limitando la trattazione alla cosiddetta teoria

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo

Dettagli

Elaborazione dati in Analisi Sensoriale

Elaborazione dati in Analisi Sensoriale Elaborazione dati in Analisi Sensoriale Si è parlato di interpretazione corretta dei risultati ottenuti; a questo concorrono due fattori: affidabilità e validità. Se i test fossero stati ripetuti con lo

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

Concetto di potenza statistica

Concetto di potenza statistica Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1 Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Corso di Statistica Medica Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Sono previste 40 ore complessive, di cui almeno 16 di lezione frontale e le restanti

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Calcolo delle probabilità Il Sig. Rossi abita nella città X e lavora nella città Y, poco distante.

Dettagli

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per continue. Alessandro Valbonesi. SARRF di Scienze ambientali

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per continue. Alessandro Valbonesi. SARRF di Scienze ambientali LEZIONI DI STATISTCA APPLICATA Parte 2 Statistica inferenziale Variabili continue per continue Alessandro Valbonesi SARRF di Scienze ambientali Anno accademico 2010-11 CAPITOLO 7 - RELAZIONI TRA DUE O

Dettagli

Questionario N.A.V.I. a.s. 2013/2014

Questionario N.A.V.I. a.s. 2013/2014 ISTITUTO MAGISTRALE STATALE MARIA IMMACOLATA San Giovanni Rotondo Questionario N.A.V.I. L indagine NAVI per il corrente anno scolastico, come negli anni precedenti, è stata svolta su quattro aree (docenti,

Dettagli

Accuratezza di uno strumento

Accuratezza di uno strumento Accuratezza di uno strumento Come abbiamo già accennato la volta scora, il risultato della misurazione di una grandezza fisica, qualsiasi sia lo strumento utilizzato, non è mai un valore numerico X univocamente

Dettagli

Strategie alternative ai metodi sperimentali

Strategie alternative ai metodi sperimentali Strategie alternative ai metodi sperimentali 1. 2. I quasi-esperimenti (non sperimentali) prevedono la descrizione del fenomeno in esame. Il metodo descrive le variabili in esame, non prevede alcuna manipolazione

Dettagli

SIMULAZIONE I. 1. Abbiamo un campione di 400 aziende classificate secondo il capitale sociale e il fatturato. I dati sono: Fatturato

SIMULAZIONE I. 1. Abbiamo un campione di 400 aziende classificate secondo il capitale sociale e il fatturato. I dati sono: Fatturato SIMULAZIONE I Cognome e nome.. N. di matricola. 1. Abbiamo un campione di 400 aziende classificate secondo il capitale sociale e il fatturato. I dati sono: Capitale Fatturato sociale < 5000 5000 250 80

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Corso di Statistica Medica 2004-2005 Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Sono previste 30 ore di lezione di statistica e 12 di

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

Statistica descrittiva

Statistica descrittiva Corso di Laurea in Ingegneria per l Ambiente ed il Territorio Corso di Costruzioni Idrauliche A.A. 2004-05 www.dica.unict.it/users/costruzioni Statistica descrittiva Ing. Antonino Cancelliere Dipartimento

Dettagli

SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale I sondaggi 23/1/2006

SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale I sondaggi 23/1/2006 SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale I sondaggi 23/1/2006 Scopo della ricerca Riuscire a determinare le caratteristiche di un fenomeno attraverso un campionamento di alcuni

Dettagli

i=1 Y i, dove Y i, i = 1,, n sono indipendenti e somiglianti e con la stessa distribuzione di Y.

i=1 Y i, dove Y i, i = 1,, n sono indipendenti e somiglianti e con la stessa distribuzione di Y. Lezione n. 5 5.1 Grafici e distribuzioni Esempio 5.1 Legame tra Weibull ed esponenziale; TLC per v.a. esponenziali Supponiamo che X Weibull(α, β). (i) Si consideri la distribuzione di Y = X β. (ii) Fissato

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di

Dettagli

Prefazione all edizione originale. Prefazione all edizione italiana

Prefazione all edizione originale. Prefazione all edizione italiana Indice Prefazione all edizione originale Prefazione all edizione italiana xiii xv 1 Il miglioramento della qualità nel moderno ambiente produttivo 1 1.1 Significato dei termini qualità e miglioramento

Dettagli

Politecnico di Milano Temi d esame di STATISTICA dell AA 2004/2005 per allievi ING INF [2L]. Proff. A. Barchielli, I. Epifani

Politecnico di Milano Temi d esame di STATISTICA dell AA 2004/2005 per allievi ING INF [2L]. Proff. A. Barchielli, I. Epifani Politecnico di Milano Temi d esame di STATISTICA dell AA 004/005 per allievi ING INF [L]. Proff. A. Barchielli, I. Epifani 1 1 STATISTICA per ING INF [L] Proff. A. Barchielli, I. Epifani 0.06.05 I diritti

Dettagli

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se

Dettagli

A.A. 2014-2015. Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE

A.A. 2014-2015. Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE A.A. 2014-2015 Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE Utilizzare gli strumenti epidemiologici e statistici appropriati per ridurre l'area dell'incertezza nella rilevazione

Dettagli

Appunti del corso. Qualità

Appunti del corso. Qualità Appunti del corso Qualità ii INDICE CAPITOLO 1. Termini per la qualità 1.1 Aspetti generali 1.2 Variabilità CAPITOLO 2. Richiami di probabilità 2.1 La distribuzione binomiale 2.2 La distribuzione di Poisson

Dettagli

TECNICHE DI SIMULAZIONE

TECNICHE DI SIMULAZIONE TECNICHE DI SIMULAZIONE MODELLI STATISTICI NELLA SIMULAZIONE Francesca Mazzia Dipartimento di Matematica Università di Bari a.a. 2004/2005 TECNICHE DI SIMULAZIONE p. 1 Modelli statistici nella simulazione

Dettagli

STIMARE valori ed eseguire ANALISI DI REGRESSIONE

STIMARE valori ed eseguire ANALISI DI REGRESSIONE STIMARE valori ed eseguire ANALISI DI REGRESSIONE È possibile impostare una serie di valori che seguono una tendenza lineare semplice oppure una tendenza con crescita esponenziale. I valori stimati vengono

Dettagli

La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali

La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali Elementi di Analisi Multivariata V SCUOLA ESTIVA AISV 5 -- 9 ottobre 009 - Soriano nel Cimino (VT) Sabrina Giordano Dipartimento

Dettagli

Capitolo 9: PROPAGAZIONE DEGLI ERRORI

Capitolo 9: PROPAGAZIONE DEGLI ERRORI Capitolo 9: PROPAGAZIOE DEGLI ERRORI 9.1 Propagazione degli errori massimi ella maggior parte dei casi le grandezze fisiche vengono misurate per via indiretta. Il valore della grandezza viene cioè dedotto

Dettagli

(accuratezza) ovvero (esattezza)

(accuratezza) ovvero (esattezza) Capitolo n 2 2.1 - Misure ed errori In un analisi chimica si misurano dei valori chimico-fisici di svariate grandezze; tuttavia ogni misura comporta sempre una incertezza, dovuta alla presenza non eliminabile

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto

Dettagli

Corso di Automazione Industriale 1. Capitolo 4

Corso di Automazione Industriale 1. Capitolo 4 Simona Sacone - DIST Corso di Automazione Corso Industriale di 1 Automazione Industriale 1 Capitolo 4 Analisi delle prestazioni tramite l approccio simulativo Aspetti statistici della simulazione: generazione

Dettagli

9. La distribuzione 2 e i test per dati su scala nominale

9. La distribuzione 2 e i test per dati su scala nominale 9. La distribuzione e i test per dati su scala nominale 9.1. La distribuzione 9. 1. 1. La statistica e la sua distribuzione In una popolazione distribuita normalmente con parametri e estraiamo un campione

Dettagli

Il campionamento statistico

Il campionamento statistico Lezione 13 Gli strumenti per il miglioramento della Qualità Il campionamento statistico Aggiornamento: 19 novembre 2003 Il materiale didattico potrebbe contenere errori: la segnalazione e di questi errori

Dettagli

UNIVERSITÀ DEGLI STUDI DI BERGAMO. Corso di Risk Management

UNIVERSITÀ DEGLI STUDI DI BERGAMO. Corso di Risk Management UNIVERSITÀ DEGLI STUDI DI BERGAMO Corso di Prof. Filippo Stefanini A.A. Corso 60012 Corso di Laurea Specialistica in Ingegneria Edile Il casinò di Monte-Carlo Il casinò di Monte-Carlo, Principato di Monaco,

Dettagli