Generalizzare i risultati ottenuti da un insieme campione alla popolazione dal quale esso è stato estratto

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Generalizzare i risultati ottenuti da un insieme campione alla popolazione dal quale esso è stato estratto"

Transcript

1 Statistica Inferenziale Generalizzare i risultati ottenuti da un insieme campione alla popolazione dal quale esso è stato estratto

2 Modello Struttura idealizzata che si adatta alla realtà e serve per descriverla, interpretarla, comprenderla Non è VERO o FALSO ma può essere UTILE o INUTILE È una semplificazione: il più semplice possibile, ma non di più

3 Distribuzione Normale o Gaussiana f(x) 1 = exp σ 2π 1 2 x µ σ 2 Sembra complicato, ma µ è la media σ è Var, ovvero la deviazione standard forma simmetrica a campana area sotto la curva pari a 1 Conoscendo solo due parametri, media e varianza, possiamo sapere come è fatta la variabile di interesse

4 Caratteristiche della distribuzione gaussiana X~N(µ,σ) µ determina la posizione della curva sull asse delle ascisse. σ determina la maggiore o minore concentrazione della curva attorno a µ

5 Caratteristiche della distribuzione gaussiana Per qualsiasi distribuzione gaussiana lo scarto σ contrassegna intervalli tipici: il 68.27% delle oss. è compreso nell intervallo [µ-σ; µ+σ] il 95% nell intervallo [µ-1.96σ; µ+1.96σ] il 95.45% nell intervallo [µ-2σ; µ+2σ] il 99.73% nell intervallo [µ-3σ; µ+3σ]

6 Distribuzione Normale standard (µ=0, =0,σ=1) =1) I valori di probabilità della Normale con µ=0 e σ=1 sono già stati calcolati e riportati in una tavola: Z~N(0,1)

7 Come si usano le tavole? ad es. P(Z<1.25)=

8 Come si usano le tavole? f(z) p z* 2 3 f(z) f(z) p deviata gaussiana standard z 1-2p -3-2-z* z* 2 3 deviata gaussiana standard z 1-p -p p1 p z-1 0 z deviata gaussiana standard z 2 2 p p Detto p (0<p<1) il valore dell'area a destra di +z*, l'area a sinistra di +z* vale (1-p). L'area a sinistra di -z* è uguale all'area a destra di +z*. Detto p (0<p<1) il valore di tale area, l'area esterna a ±z* vale 2p, e l'area interna vale (1-2p). L'area compresa tra due valori z1* < z2* si ricava per differenza (1 - p 1 - p 2 ), dove p 1 è il valore dell'area a sinistra di z 1 *, e p 2 quello dell'area a destra di z 2 *.

9 Distribuzione Normale (µ 0, 0,σ 1) 1) E possibile trasformare una qualsiasi funzione gaussiana f(x) con media µ e varianza σ 2 in una funzione gaussiana standard, f(z) con media 0 varianza 1, se si pone: Z µ = X σ Z è una trasformata di X, centrata rispetto a µ e scalata rispetto a σ. Il modello si semplifica 1 f(x) = exp σ 2π 1 2 x 2 µ σ E diventa f(x) 1 exp 2π ( z) = 2 2

10 Spostare il valore medio: x-µ 0 µ x

11 Modificare la larghezza σ σ x z

12 Gaussiana (µ σ²) Gaussiana standardizzata (0 1)

13 Utilizzo gaussiana standard I caso: I parametri µ e σ sono noti, si vuole conoscere la probabilità che la variabile x assuma valori compresi all interno dell intervallo a,b con a<b. II caso: I parametri µ e σ sono noti, si vogliono conoscere gli estremi a,b dell intervallo, centrato su µ, il quale comprende un livello di probabilita fissato p.

14 Esercizio 1 Data la distribuzione normale standardizzata, si trovi: 1. L area sottesa alla curva fra z=0 e z=1.43 P(z<1.43)-P(z<0)= = P(z 0.55) 1-P(z<0.55)= = P(z -0.55) P(z<0.55)= = P(z<2.33) = P(z<-2.33) P(z>2.33)=1-P(z<2.33)= = P(-1.96<z<1.96) 1-2*P(z>1.96)=1-2*(1-P(z<1.96))=1-2*( )=1-2*0.025 = P(-2.58<z<2.58) 1-2*P(z>2.58)=1-2*(1-P(z<2.58))=1-2*( )= = P(-1.65<z<1.65) 1-2*P(z>1.65)=1-2*(1-P(z<1.65))=1-2*( )= = P(0.49<z<1.74) P(z<1.74)-P(z<0.49)= = =

15 Esercizio 2 Date le seguenti relazioni, si trovi z 1 : 10. P(z z 1 )= z 1 = P(z z 1 )= z 1 = P(z z 1 )= z 1 = P(z z 1 )= z 1 = 0.86

16 Esercizio 3 Qual è la probabilità per un soggetto sano di avere un valore di albumina (x) 42.0 g/l? P(x 42.0) =? Se si dispone della distribuzione dei valori della concentrazione sierica di albumina in soggetti sani

17 Albumina (g/l) Freq. % % cum Totale Concentrazione sierica di albumina in soggetti sani P(x 42.0 g/l) =? 16/211=7.58% =7.58%

18 Esercizio 3 Se si conosce solo media (=34.21 g/l) e deviazione standard (=5.39 g/l) se la distribuzione dei valori è approssimativamente gaussiana posso trasformare la variabile un una gaussiana standard ~N(0,1) (x µ ) z = ( ) z = = σ 5.39 P(X 42)=P(Z 1.45)=1-P(Z<1.45) = =0.0735=7.35%

19 X Z Freq. % % cum Tot CON LA TRASFORMAZIONE z = (x σ m = 0 s = 1 µ) Valori standardizzati

20 Gli Z-score indicano esattamente quanto un singolo dato è lontano dalla media descrivendo la sua posizione in unità di deviazione standard. Quando trasformiamo un valore grezzo in questa maniera, chiameremo il risultato della trasformazione valore della distribuzione gaussiana standardizzata o punteggio standard o z-score Un punteggio standard, abbreviato con z è un modo per esprimere ogni valore grezzo in termini di unita di d.s.

21 Esercizio 4 Dalla letteratura scientifica risulta che in una popolazione apparentemente sana il valore dell HDL (high density lipoprotein) colesterolo ha µ = 57 mg/100ml e σ = 10 mg/100ml Sapendo che i valori dell HDL si distribuiscono in modo approssimativamente gaussiano, si vuole stimare la probabilità che un soggetto sano abbia valori di HDL < 45 mg/100ml z = (45-57)/10 = -1.2 P(x 45) = P(Z -1.2) = 1-P(Z 1.2)= = (11.51%)

22 z P(Z -1.2) = P(Z 1.2) = 1-P(Z 1.2) z 0 1.2

23 Si vuole stimare ora la probabilità che un soggetto abbia valori di HDL compresi tra 45 mg/100 ml e 60 mg/100ml. z 1 = (45-57)/10 = -1.2 z 2 = (60-57)/10 = 0.3 P(45 X 60) = P(-1.2 Z 0.3) = P (0.3)- P(z -1.2)= = = 50.28% media %

24 Esercizio 5 Dopo diversi sondaggi un fabbricante di calze da donna arriva alla conclusione che la lunghezza del piede di una donna adulta segue una legge normale con parametri µ=24 e σ=3 cm. Decide di utilizzare tale distribuzione per determinare le taglie e le quantità corrispondenti da mettere in produzione. Si chiede: In quale percentuale di casi si osserva una lunghezza di piedi: Superiore rispettivamente a 25, 30, 36 cm. Inferiore rispettivamente a 15, 20, 21 cm.

25 Esercizio 5 µ = 24 σ = 3 P(X>25)=P(Z>(25-24)/3)=P(Z>0.33)=1-P(Z<0.33)= = P(X>30)=P(Z>(30-24)/3)=P(Z>2)=1-P(Z<2)= = P(X>36)=P(Z>(36-24)/3)=P(Z>4)=1-P(Z<4)= = P(X<15)=P(Z<(15-24)/3)=P(Z<-3)=1-P(Z<3)= = P(X<20)=P(Z<(20-24)/3)=P(Z<-1.33)=1-P(Z<1.33)= = P(X<21)=P(Z<(21-24)/3)=P(Z<-1)=1-P(Z<1)= =0.1587

26 Esercizio 6 Il signor W.P. è tenuto sotto controllo e la sua pressione sanguigna media in molte occasioni è 85 mmhg. Si supponga che la sua vera deviazione standard per misure singole sia 6 mmhg. Quante volte vi aspettereste una lettura di 95 mmhg o superiore? µ= 85 σ=6 Supponendo ragionevolmente che la pressione sanguigna sia normalmente distribuita: P(X 95)=P(Z (95-85)/6)=P(Z 1.67)=1-P(Z<1.67)= = cioè, circa il 5% delle volte.

27 Statistica Inferenziale Generalizzare i risultati ottenuti da un insieme campione alla popolazione dal quale esso è stato estratto Stima dei parametri stima puntuale stima intervallare Verifica d ipotesi (test)

28 Stima puntuale: la media campionaria Dato un campione che si ritiene rappresentativo della popolazione, possiamo ritenere che la media calcolata su questo campione fornisca una buona stima della media ignota della popolazione da cui il campione è stato tratto?

29 Stima puntuale: la media campionaria Si supponga di aver individuato una popolazione I di interesse composta da N unità. Da questa popolazione estraiamo tutti i possibili campioni di una determinata ampiezza n I N=4 ={1, 3, 5, 7} N=4 n=2 x f i (x-µ) (x-µ) µ = σ 2 = 20 4 = 16 = 4 5 = Quali sono tutti i possibili campioni di ampiezza n=2 che possono venire estratti da tale popolazione? (4 2 =16) 1 1; 1 3; 1 5; 1 7; 3 1; 3 3; 3 5; 3 7; 5 1; 5 3; 5 5; 5 7; 7 1; 7 3; 7 5; 7 7.

30 Stima puntuale: la media campionaria Si calcoli poi la media per tutti i campioni ottenuti di dimensione n=2. Possibili campioni ; ; 3 3; ; 3 5; 5 3; ; 5 5; ; f i x i Medie campionarie Distribuzione delle medie campionarie Cosa osserviamo?

31 Stima puntuale: la media campionaria Solo 4 dei possibili 16 campioni hanno una media campionaria che coincide con la vera media della popolazione. I restanti campioni hanno una media che si discosta da 4 per più o meno 3 unità (da 1 a 7). Le medie dei diversi campioni variano perché estraiamo dei singoli componenti da una popolazione che è a sua volta distribuita in un campo più o meno vasto di valori.

32 Stima puntuale: la media campionaria Dalla distribuzione di campionamento relativa alle medie campionarie, si possono ora calcolare le due misure di posizione e dispersione principali, e cioè la media e la varianza. x i f i x i f ( ) 2 i x i x f i E(x)=x=64/16=4 E( x)=µ Var x = 40 /16 = 2. Var( x)=σ 2 /n ( ) 5 n=2 in questo esempio

33 Stima puntuale: la media campionaria ATTENZIONE! Per evitare confusione di terminologia σ della media campionaria viene chiamato errore standard E una misura che indica la dispersione delle medie calcolate nei singoli campioni, rispetto alla media delle medie.

34 Per inciso Errore standard Si calcola in modo diverso a seconda della stima campionaria che stiamo considerando Media campionaria ES(m) = σ n Differenza tra due medie oppure: ES(m) = s n ES(m 1 m 2 ) = σ n σ n oppure: ES(m 1 m 2 ) = 1 s p + n 1 1 n 2 Proporzione p ( 1 p) ES(p) = n s p = s 2 1 ( n 1 1) n n 2 2 s 2 ( n 2 2 1)

35 Stima puntuale Finora abbiamo considerato cosa succede in una situazione ipotetica in cui estraiamo n campioni da una popolazione nota Nella realtà, in genere, disponiamo di un solo campione e Nella realtà, in genere, disponiamo di un solo campione e la popolazione da cui è stato estratto non è nota

36 Stima puntuale Il principio che ha consentito di ottenere la distribuzione della media campionaria può essere applicato a qualsiasi altra statistica calcolata sul campione: ad es. varianza campionaria, mediana campionaria, prevalenza, proporzione, ecc...

37 La precisione di una stima dipende: - dalla numerosità (n) del campione - dalla variabilità (d.s.) del fenomeno Se il fenomeno è poco variabile è sufficiente un campione di ridotte dimensioni per ottenere una stima attendibile dei parametri della popolazione. Se invece la variabilità è elevata, per ottenere una stima attendibile occorre un campione di elevata numerosità.

38 La precisione di una stima Se il fenomeno è poco variabile è sufficiente un campione di ridotte dimensioni per ottenere una stima attendibile dei parametri della popolazione; Media della popolazione Ho una probabilità elevata di estrarre valori vicino alla media µ indipendentemente da n, ho stime piuttosto precise

39 La precisione di una stima Se la variabilità è elevata, per ottenere una stima attendibile occorre un campione di elevata numerosità. Media della popolazione Se n è piccolo ho una probabilità bassa di estrarre valori vicino alla media µ Se n è grande ho una probabilità elevata di estrarre valori vicino alla media µ Per ottenere stime precise devo avere un campione molto numeroso

40 Stima puntuale e stima intervallare Con la stima puntuale non si è certi di individuare in modo esatto il vero valore del parametro che si vuole stimare Da diversi campioni si otteranno stime diverse Per tener conto di questa incertezza è opportuno presentare, accanto alla stima puntuale, un intervallo di valori plausibili: Intervallo di Confidenza

41 Intervallo di confidenza al (1-α)% IC (1-α) (µ) = m ± z α/2 e.s.(m) Livello di confidenza Stima puntuale Valore soglia Errore standard del parametro Determinato in base al modello (z) che interpola i dati e al livello di confidenza (1-α)

42 L'intervallo di confidenza varia casualmente attorno al parametro µ, ed ha probabilità pari a (1-α) di includere il parametro µ della variabile x _ f(x) (1 α) α/2 α/ l µ z σ/ n INTERVALLO DI PROBABILITA' µ µ+ zσ/ n x-z σ/ n x _ x+z σ/ n UN INTERVALLO DI CONFIDENZA l Ciò significa che, benché sia impossibile risalire da una stima campionaria al vero valore del parametro µ di un universo, è però possibile determinare attorno a tale stima un intervallo che ha una prefissata probabilità (1-α) di includere il parametro µ di quell'universo.

43 Esercizio 1 Se la media della pressione sistolica in un campione di uomini tra 45 e 65 anni è mmhg (stima campionaria), allora si può ritenere che la media della pressione sistolica di tutti gli uomini della popolazione di riferimento sia anch essa «più o meno» mmhg? «Più o meno»? Sapendo che l errore standard è pari a 7.4 e avendo scelto un livello di confidenza del 95% α=0.05 z α/2 = z =1.96 IC 95% (µ) = ± = ( ) INTERPRETAZIONE: non conosco il vero valore della pressione sistolica media nella popolazione, ma, data la stima campionaria che ho osservato (126.4 mmhg), sono confidente al 95% che l intervallo e contenga la vera media

44 Esercizio 2 In una popolazione di soggetti sani il livello medio di protrombina è distribuito in modo approssimativamente gaussiano, con media µ=20 mg/dl e deviazione standard σ=4 mg/dl. In un campione di 40 pazienti con deficit di vitamina K si è riscontrato un livello medio di protrombina di 18.8 mg/dl. Nonostante la differenza osservata (18.8 vs 20.0) si può ritenere che il vero valore medio (µ) di protrombina dei pazienti con deficit di vitamina K sia pari a quello della popolazione dei sani? IC 95% (µ) = 18.8 ± / 40 = 18.8 ± = ( ) E. S. ( x) = σ n

45 Esercizio 2 INTERPRETAZIONE IC 95% (µ) = 18.8 ± / 40 = 18.8 ± = ( ) In base ai risultati ottenuti posso affermare che il valore medio di protrombina dei pazienti con deficit di vitamina K è un valore compreso tra e Ho la quasi certezza (con la confidenza del 95%) che la protrombina media dei pazienti con deficit di vitamina K sia uguale a quella della popolazione sana. Questa affermazione potrebbe anche essere falsa, perché c è una probabilità del 5% che l intervallo di confidenza non contenga il vero valore di µ.

46 Esercizio 2 E se volessi una maggiore certezza? Calcolo l intervallo di confidenza al 99% IC 99% (µ) = 18.8 ± / 40 = 18.8 ± = ( ) IC(95%): ( ) IC(99%): ( ) confidenza maggiore intervallo più ampio

47 Esercizio 3 Si vuole stimare il vero valore medio dell'uricemia in una popolazione maschile: è noto che in tale popolazione la dispersione dell'uricemia è = 1.1 mg/dl. Si richiede che la confidenza sia del 95%.

48 Esercizio 3 Si supponga ora di estrarre un campione casuale di 40 soggetti dalla popolazione, di determinare il valore di uricemia di ognuno dei 40 soggetti, e di calcolare la media di tali valori (x =5.55 mg/dl). Si ricava che l'intervallo di confidenza della media al 95% vale: 1.1 I.C.95% = 5.55 ± 1.96 = 5.55 ± 0.34 = (5.21, 5.89) 40 E. S. ( x) = σ n Posso affermare con una confidenza del 95% che l ignoto parametro µ è compreso tra 5.21 e 5.89 mg/dl

49 Come si decide con l intervallo di confidenza? L intervallo di confidenza può essere utilizzato come test per determinare se una stima sia significativamente diversa da un valore fissato, oppure se le stime osservate in due gruppi siano diverse tra loro Se l intervallo di confidenza della media contiene il valore fissato allora ritengo che le medie non siano significativamente diverse. Se l intervallo di confidenza della differenza tra le medie contiene 0 allora ritengo che le medie non siano significativamente diverse. Se l intervallo di confidenza di un odds ratio o rischio relativo o contiene 1 allora ritengo che non vi sia associazione tra fattore di rischio e malattia.

50 Esempio

51 Verifica d ipotesi Oltre all intervallo di confidenza, per valutare la significatività di una stima (media, differenza tra medie, proporzioni ) posso costruire un sistema di ipotesi ed effettuare un test Prima si definisce una ipotesi nulla H 0 : non c è differenza/associazione Poi una ipotesi alternativa H 1 : c è differenza/associazione

52 Verifica d ipotesi Ad es. se si vogliono confrontare le medie di due campioni Ipotesi nulla H 0 : µ 1 = µ 2 Ipotesi alternativa H 1 : µ 1 µ 2 oppure H 1 : µ 1 < µ 2 oppure H 1 : µ 1 > µ 2 ipotesi bilaterale: α/2 ipotesi unilaterale: α

53 Verifica d ipotesi: come si decide? Se la differenza (o associazione) osservata tra i gruppi è abbastanza forte in confronto alla variabilità delle misure presente all interno dei gruppi allora è ragionevole concludere che esiste il segnale. (si rifiuta H0) Se la differenza non è abbastanza forte rispetto alla variabilità allora è ragionevole concludere che, in base a quanto esaminato, non si ha evidenza che esista una differenza. (si accetta H0)

54 Verifica d ipotesi: criterio di decisione Si costruisce una statistica test, in base all ipotesi nulla H 0 che stiamo testando e che dipende dalla distribuzione della variabile di interesse. Si identifica una soglia di rifiuto e si calcola la probabilità ad essa associata: se la probabilità p è piccola si rifiuta H 0 se p è grande non si rifiuta H 0 Nella letteratura medica generalmente si usano due valori di probabilità (o livelli di significatività) quali soglie per costruire una regola di decisione relativa al rifiuto di H 0 altamente significativo: p<0.01 significativo: 0.01<p<0.05 non significativo: p>0.05 il risultato osservato potrebbe essere frutto del caso

55 Verifica d ipotesi: criterio di decisione Stabilire il criterio di decisione significa stabilire, per i valori * della media campionaria, una soglia x oltre la quale il risultato sperimentale viene ritenuto incompatibile con l'ipotesi H 0 : µ = ϑ _ 0.5 f(x) 0.4 H 0 H σ/ n α/2 α/2 (1 α) µ=ϑ β σ/ n x* µ=ϑ+δ (1 β) _ x

56 Verifica d ipotesi: possibili risultati... e in base al campione decido che è vera H0... e in base al campione decido che è vera H1 SE È VERA H0 decisione giusta protezione: (1-α) decisione sbagliata errore di 1 tipo: α SE È VERA H1 decisione sbagliata errore di 2 tipo: β decisione giusta potenza: (1-β)

57 Analogia con i test di screening Specificità Sani=H 0 Malati=H 1 Sensibilità 0.3 % FN 0.2 σ (2/n) σ (2/n) % FP (1-α) 0 β d* δ α Valore soglia (1-β)

58 Verifica d ipotesi: possibili risultati 1. Abbiamo creduto di osservare un effetto che non c era (errore di 1 tipo). 2. Abbiamo osservato un effetto che c era veramente (potenza). 3. Abbiamo ritenuto che non ci fosse alcun effetto quando invece c era (errore di 2 tipo). 4. Non abbiamo osservato alcun effetto ed effettivamente non c era (protezione).

59 Intervalli di confidenza e test d ipotesi Gli intervalli di confidenza e la verifica di ipotesi svolgono una funzione simile. Se l intervallo di confidenza al 95% include il valore sottoposto ad ipotesi nulla (0 o 1), allora il valore di p sarà maggiore di Se l intervallo di confidenza al 95% non include il valore sottoposto ad ipotesi nulla (0 o 1), allora il valore di p sarà minore di Gli intervalli di confidenza sono generalmente da preferire perché forniscono anche un range di valori plausibili rispetto al valore del parametro cercato, mentre il test di ipotesi dice solo se rifiutare o non rifiutare l ipotesi nulla H 0.

60 Esempio 1 Il valor medio di un parametro fisiologico (distribuito in modo gaussiano) misurato nel corso di una vasta indagine sulla popolazione italiana è risutato µ=50 con σ=26.3. In un campione di 25 individui residenti in una zona sospetta di inquinamento da prodotti tossici si è osservato un valore medio pari a 60. Esiste una differenza significativa tra la media campionaria e quella della popolazione?

61 Esempio 1 µ=50 σ=26.3 n=25 x = 60 ( 60 50) H H 0 1 : : µ µ = z = = 1.90 P(Z>1.90)= α=0.05 Il valore di z calcolato è inferiore di zα 2 = o, equivalentemente, ( z 1.90) P > =0.028 > P( z > 1.96) 2 α = Pertanto non si rifiuta l'ipotesi nulla. Non esistono ragioni sufficienti per asserire che esiste una differenza significativa tra la media campionaria e quella della popolazione.

62 Esempio 2 In un campione di 24 pazienti affetti da malattia parodontale, la media del fosforo inorganico titolato nel plasma è stata x = 3.62 mg%. Il valore normale fornito in bibiografia per il fosforo inorganico plasmatico è µ=3.36 mg% con una deviazione standard di 0.40 mg%. Si può affermare che la patologia da cui sono affetti i pazienti altera il valore del fosforo inorganico plasmatico? µ=3.36 σ=0.40 n=24 x = α=0.01

63 Esempio 2 H H 0 1 : µ : µ = ( ) 0.26 z = = = Con α=0.01, zα 2 = Il valore di z calcolato è maggiore di z α 2, si rifiuta l ipotesi nulla. La patologia da cui sono affetti i pazienti altera il valore del fosforo inorganico plasmatico.

64 Esempio 3

65 Esempio 3 INTERPRETAZIONE Nel campione la densità minerale ossea a livello lombare differisce in media di 0.08 g/cm 2 (1.07 meno 1.00 con arrotondamento). Cioè, nel campione la densità minerale ossea media a livello lombare è di 0.08 g/cm 2 maggiore nelle donne normali rispetto alle donne depresse. L intervallo di confidenza al 95% relativo alla differenza tra le medie (da 0.02 a 0.14) fornisce un range plausibile per la differenza vera. L intervallo di confidenza non contiene lo 0, la differenza è statisticamente significativa.

66 Potenza del test (1-β) Probabilità che un particolare studio sia in grado di individuare una prefissata differenza dall ipotesi nulla nel caso in cui tale differenza esista. La potenza deve essere calcolata dopo aver stabilito una definita differenza (δ) di interesse clinico (µ 1 = µ 0 + δ)

67 Potenza del test Visto che gli esperimenti generalmente si fanno per dimostrare l esistenza di differenze, correndo spesso il rischio di non trovarle, la probabilità di trovare una differenza quando esiste è una cosa che interessa molto lo sperimentatore. La potenza è la probabilità di concludere che c è una differenza quando di fatto la differenza c è davvero.

68 Potenza del test Per vedere bene una formica è sufficiente una lente di ingrandimento i batteri ci vuole un microscopio i virus è necessario un microscopio elettronico...

69 Potenza del test Quanto più piccolo è l oggetto (la differenza) che voglio vedere, tanto maggiore deve essere la capacità di ingrandire della lente (la potenza del test)

70 1-β Potenza (1-β) vs differenza minima osservabile (δ) n = 40 σ = 4 mg/dl α = 5% δ

71 Numerosità campionaria (n) vs potenza (1-β) δ = 2 mg/dl σ = 4 mg/dl n α = 5% 1-β

72 Dimensione del campione Tutto parte da un indicazione dei clinici su: Minima differenza che si ritiene rilevante da un punto di vista clinico Probabilità di commettere un errore di 1 tipo che si ritiene accettabile Probabilità di commettere un errore di 2 tipo che si ritiene accettabile Variabilità del fenomeno oggetto di studio

73 Prossima lezione Merc 25 novembre 9:30-12:30

tabelle grafici misure di

tabelle grafici misure di Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine

Dettagli

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA IRCBG 19027 Modulo Dal campione alla popolazione: l'inferenza e l'intervallo di confidenza IRCCS Burlo Garofolo Formazione, Aula A via dell Istria

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.12 - Test statistico Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona IPOTESI SCIENTIFICA Affermazione che si può sottoporre a verifica

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli

Intervallo di confidenza.

Intervallo di confidenza. Intervallo di confidenza annarita.vestri@uniroma1.it campione inferenza popolazione Media Riportare sempre anche la deviazione standard Stima puntuale di Media, dev.standard, numerosità Qualche semplice

Dettagli

La Distribuzione Normale (Curva di Gauss)

La Distribuzione Normale (Curva di Gauss) 1 DISTRIBUZIONE DI GAUSS o DISTRIBUZIONE NORMALE 1. E la più importante distribuzione statistica continua e trova numerose applicazioni nello studio dei fenomeni biologici. 2. Fu proposta da Gauss (1809)

Dettagli

Metodi statistici per lo studio dei fenomeni biologici

Metodi statistici per lo studio dei fenomeni biologici Metodi statistici per lo studio dei fenomeni biologici Alla fine di questa lezione dovreste essere in grado di: descrivere la distribuzione di campionamento della differenza di due medie costruire gli

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corsi di laurea triennale di area tecnica Corso di Statistica Medica Intervalli di confidenza Corsi di laurea triennale di area tecnica - Corso di Statistica Medica -

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso

Dettagli

Quanti soggetti devono essere selezionati?

Quanti soggetti devono essere selezionati? Quanti soggetti devono essere selezionati? Determinare una appropriata numerosità campionaria già in fase di disegno dello studio molto importante è molto Studi basati su campioni troppo piccoli non hanno

Dettagli

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati.

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati. Una volta selezionato il campione, la variabile di interesse viene misurata sugli elementi che lo costituiscono. I valori che la variabile assume vengono poi sintetizzati utilizzando le statistiche opportune

Dettagli

Lezione VI: Distribuzione normale. La distribuzione normale (curva di Gauss). Prof. Enzo Ballone. Lezione 6a- Ia distribuzione normale

Lezione VI: Distribuzione normale. La distribuzione normale (curva di Gauss). Prof. Enzo Ballone. Lezione 6a- Ia distribuzione normale Lezione VI: Distribuzione normale Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone Lezione 6a- Ia distribuzione normale

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

Brevi cenni all intervallo di confidenza

Brevi cenni all intervallo di confidenza Brevi cenni all intervallo di confidenza INFERENZA STATISTICA L INFERENZA STATISTICA è un insieme di metodi con cui si cerca di «raggiungere una conclusione» sulla popolazione, sulla base delle informazioni

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica Strumenti quantitativi per la gestione Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli

Dettagli

Distribuzione degli Errori di Misura. La distribuzione normale

Distribuzione degli Errori di Misura. La distribuzione normale Distribuzione degli Errori di Misura La distribuzione normale Errori casuali e sistematici Gli errori vengono generalmente suddivisi in due categorie: errori casuali ed errori sistematici. Gli errori casuali

Dettagli

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Intervalli di confidenza Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Esercitazione: La distribuzione NORMALE

Esercitazione: La distribuzione NORMALE Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle

Dettagli

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = + ESERCIZIO 6.1 Si considerino i 0 campioni di ampiezza n = estratti da una popolazione X di N = 5 elementi distribuiti normalmente, con media µ = 13,6 e σ = 8,33. A partire dalle 0 determinazioni della

Dettagli

Distribuzione normale

Distribuzione normale Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima puntuale di µ la deviazione standard Media,

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Statistica 1- parte II

Statistica 1- parte II Statistica 1- parte II Esercitazione 3 Dott.ssa Antonella Costanzo 25/02/2016 Esercizio 1. Verifica di ipotesi sulla media (varianza nota) Il preside della scuola elementare XYZ sospetta che i suoi studenti

Dettagli

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1 Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa

Dettagli

Parametri statistici

Parametri statistici SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice

Dettagli

Test d ipotesi: confronto fra medie

Test d ipotesi: confronto fra medie Test d ipotesi: confronto fra medie Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona CONFRONTO FRA MEDIE 1) confronto fra una media campionaria e una media di popolazione

Dettagli

Significato probabilistico di σ: su 100 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo

Significato probabilistico di σ: su 100 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo Significato probabilistico di σ: su 1 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo x σ, x + σ e 99.7 nell intervallo x 3 σ, x + 3 Se si considerano campioni

Dettagli

Esercizi di statistica inferenziale

Esercizi di statistica inferenziale Dipartimento di Fisica SMID a.a. 004/005 Esercizi di statistica inferenziale Prof. Maria Antonietta Penco tel. 0103536404 penco@fisica.unige.it 6/1/005 Esercizio1 E noto che un grande numero di pazienti

Dettagli

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre R - Esercitazione 5 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 16 Dicembre 2016 Intervalli di confidenza (1) Sia X 1,..., X n un campione casuale estratto da un densità f (x, θ) nota

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel primo campione

Dettagli

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica Medica Le distribuzioni teoriche di probabilità La distribuzione Normale (o di

Dettagli

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it I risultati di un esperimento

Dettagli

Variabili Casuali Continue

Variabili Casuali Continue Distribuzione Normale Concentrazione di cloro nel sudore Variabili Casuali Continue 9 8 7 6 5 4 3 media = 98.8 meq/l mediana =. meq/l moda =. meq/l < 3 6 5 me/l La distribuzione empirica (diagramma a barre)

Dettagli

Statistica inferenziale per variabili quantitative

Statistica inferenziale per variabili quantitative Lezione 7: - Z - test e intervalli di Confidenza - t-test per campioni indipendenti e dipendenti Cattedra di Biostatistica Dipartimento di Scienze scperimentali e cliniche, Università degli Studi G. d

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati 1 CONCETTI DI BASE DI STATISTICA ELEMENTARE 2 Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Per la presenza di errori casuali,

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Tecniche di sondaggio

Tecniche di sondaggio SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Distribuzione Normale Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Elementi di Psicometria (con laboratorio software 1)

Elementi di Psicometria (con laboratorio software 1) Elementi di Psicometria (con laboratorio software 1) 05-La verifica delle ipotesi con le medie dei campioni (v. 1.0, 15 aprile 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Introduzione alla statistica per la ricerca in sanità

Introduzione alla statistica per la ricerca in sanità Introduzione alla statistica per la ricerca in sanità Modulo La verifica delle ipotesi: il test statistico dott. Eugenio Traini eugenio.traini@burlo.trieste.it Verifica d Ipotesi - 1 Che cos è un ipotesi

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

SCHEDA DIDATTICA N 7

SCHEDA DIDATTICA N 7 FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA CIVILE CORSO DI IDROLOGIA PROF. PASQUALE VERSACE SCHEDA DIDATTICA N 7 LA DISTRIBUZIONE NORMALE A.A. 01-13 La distribuzione NORMALE Uno dei più importanti

Dettagli

La distribuzione normale

La distribuzione normale La distribuzione normale DISTRIBUZIONE NORMALE La distribuzione normale (distribuzione gaussiana, distribuzione degli errori accidentali) occupa un ruolo centrale nell ambito della statistica medica. 1

Dettagli

Occorre trovare la distribuzione di DM

Occorre trovare la distribuzione di DM Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel primo campione la media è 185,3Kg, nel secondo campione la media è 175,2Kg.

Dettagli

Distribuzioni di probabilità nel continuo

Distribuzioni di probabilità nel continuo Distribuzioni di probabilità nel continuo Prof.ssa Fabbri Francesca Classe 5C Variabili casuali continue Introduzione: Una Variabile Casuale o Aleatoria è una grandezza che, nel corso di un esperimento

Dettagli

Teoria della stima dei parametri:

Teoria della stima dei parametri: INFERENZA STATISTICA Teoria della verifica dell ipotesi : si verifica, in termini probabilistici, se una certa affermazione relativa alla popolazione è da ritenersi vera sulla base dei dati campionari

Dettagli

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof.

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof. Lezione VII: Z-test Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone Statistica inferenziale per variabili quantitative

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica inferenziale Cernusco S.N., giovedì 25 febbraio 2016 (9.00/13.00)

Dettagli

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 018-019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la

Dettagli

07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni

07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni LA VERIFICA DELLE IPOTESI Popolazioni, campioni, parametri ed indicatori 1 2 3 Popolazioni e campioni Viene definita popolazione o universo l insieme completo di tutti gli elementi che hanno in comune

Dettagli

Test di significatività

Test di significatività Test di significatività I test di significatività hanno come scopo quello di comprendere se la rilevazione da noi fatta sul campione può essere considerata un evento straordinario o la norma. Quantificare

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche la

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 6 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Intervallo di confidenza per la media Verifica d ipotesi sulla media

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss) Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in medicina e chirurgia - Corso di Statistica

Dettagli

Intervallo di confidenza.

Intervallo di confidenza. Intervallo di confidenza annarita.vestri@uniroma1.it campione inferenza popolazione Media Riportare sempre anche la deviazione standard Stima puntuale di Media, dev.standard, numerosità Qualche semplice

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche la

Dettagli

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori. Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri

Dettagli

Teorema del Limite Centrale

Teorema del Limite Centrale Teorema del Limite Centrale Problema. Determinare come la media campionaria x e la deviazione standard campionaria s misurano la media µ e la deviazione standard σ della popolazione. È data una popolazione

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Approssimazione normale della Poisson (TLC) In un determinato tratto di strada il numero di incidenti

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

DISTRIBUZIONI DI CAMPIONAMENTO

DISTRIBUZIONI DI CAMPIONAMENTO DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,

Dettagli

STATISTICA A K (63 ore) Marco Riani

STATISTICA A K (63 ore) Marco Riani STATISTICA A K (63 ore) Marco Riani mriani@unipr.it http://www.riani.it Verifica d ipotesi Esempio di logica di un test statistico Prova d esame con 10 quesiti a quiz 4 possibili risposte per ogni quesito

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 9-Introduzione alla statistica inferenziale (vers. 1.2, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli

Teorema del Limite Centrale

Teorema del Limite Centrale Teorema del Limite Centrale Teorema. Sia data una popolazione numerica infinita di media µ e deviazione standard σ da cui vengono estratti dei campioni casuali formati ciascuno da n individui, con n abbastanza

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Problema Nello studio delle distribuzioni teoriche di probabilità si suppone di conoscere i principali parametri della popolazione che esaminiamo (ad esempio la media, varianza).

Dettagli

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali A.A 2009-2010 Esercitazione E Scopo dell esercitazione Applicazioni del teorema del limite centrale. Rappresentazione delle incertezze

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005 Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005 Test di significatività Nei lavori di statistica medica si citano sempre i livelli di significatività (ovvero la probabilità)

Dettagli

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure relative a una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017 Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2017/2018 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Intervalli di confidenza Marco Pietro Longhi Probabilità e Statistica

Dettagli

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti

Dettagli

ISTOGRAMMI E DISTRIBUZIONI:

ISTOGRAMMI E DISTRIBUZIONI: ISTOGRAMMI E DISTRIBUZIONI: i 3 4 5 6 7 8 9 0 i 0. 8.5 3 0 9.5 7 9.8 8.6 8. bin (=.) 5-7. 7.-9.4 n k 3 n k 6 5 n=0 =. 9.4-.6 5 4.6-3.8 3 Numero di misure nell intervallo 0 0 4 6 8 0 4 6 8 30 ISTOGRAMMI

Dettagli