Inferenza statistica

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Inferenza statistica"

Transcript

1 Inferenza statistica

2 Si tratta di un complesso di tecniche, basate sulla teoria della probabilità, che consentono di verificare se sia o no possibile trasferire i risultati ottenuti per un campione ad una popolazione più estesa. E un processo induttivo che, pur non potendo contare su tutti i dati necessari per descrivere un collettivo statistico, cerca di stimare con una certa probabilità di errore, se essi siano o meno attendibili. L induzione, dunque, contrariamente alla deduzione, si fonda su basi incerte ma tenta di colmare le lacune di informazione che si hanno ogni qualvolta non si può osservare tutta la popolazione, ma solo una parte di essa. Distinguiamo il termine parametro dal termine statistica: il parametro è un valore caratteristico della popolazione, mentre la statistica è funzione delle osservazioni di un campione. Quindi la media può essere sia parametro che statistica.

3 Se consideriamo un carattere X, a cui sia associata una distribuzione di probabilità e dunque si possa considerare come una variabile aleatoria, si definisce funzione di ripartizione di X la relazione F(x)=Prob {X x} con x R Tale funzione è non decrescente, cioè per x<x 1, F(x) F(x 1 ) è continua a destra, cioè F(x)=F(x 1 ) se x e x 1 sono infinitamente vicini è tale che lim x F(x) = 0 e lim x + F(x) = 1 Consideriamo ora la media artimetica. Distinguiamo la media aritmetica della popolazione μ, che abbiamo detto possiamo chiamare parametro, da quella calcolata nel campione x, che è la nostra statistica a cui è associata una distribuzione di probabilità. Questa statistica a sua volta ha una media ed una varianza Media: E x = μ e varianza: Var x = σ2 n oppure Var x = σ2 n N n N 1

4 Esempio: Torniamo all esempio già visto per verificare che se potessimo calcolare la media di ogni possibile campione estraibile da un universo, otterremmo una serie di medie campionarie, che a loro volta hanno media pari al parametro della popolazione. Supponiamo di avere un universo di 4 unità su cui si è rilevata la seguente misura in cm: a=10, b=12, c=15, d=16. Avevamo calcolato che la media è pari a ( )/4=53/4=13,25. I campioni di una unità hanno medie pari a 10, 12, 15, 16 I campioni di due unità hanno medie pari a : 11, 12.5, 13, 13.5, 14, 15.5 I campioni di tre unità hanno medie pari a: 12.3, 12.7, 13.7, 14.3, E facile verificare che la media delle medie nei tre casi (campioni di 1 o 2 o 3 unità), è sempre pari a 13.25, che è la media dell universo. Questo fatto ci dice anche che la media aritmetica è uno stimatore non distorto (vedremo meglio più avanti questo concetto)

5 Esempio: Per l esempio della pagina precedente, calcoliamo la varianza della stima della media campionaria. Consideriamo tutte le medie calcolate ed effettuiamo il calcolo della varianza, cominciando per comodità dalla varianza della popolazione e poi calcolando quella per campioni di 2 e di 3 unità: σ 2 = [( ) 2 +( ) 2 +( ) 2 +( ) 2 ]/4=5.7 Var 2 (x ) = [( ) 2 +( ) 2 +( ) 2 +( ) 2 +( ) 2 +( ) 2 ]/6=1.9 Var 3 (x ) = [( ) 2 +( ) 2 +( ) 2 +( ) 2 ]/4=0.6 Un altro modo per calcolare questa varianza è la formula Var x = σ2 N n n N 1 Dal momento che σ 2 è noto ed è pari a 5.7, la stessa varianza calcolata per i campioni di 1 unità, otteniamo: Var 2 (x)= 5,7 (4 2) = 5,7 = 1,9 Var 2 (4 1) 4 3(x )= 5,7 (4 3) = 5,7 = 1,6 3 (4 1) 9 Si comprende che quando N è grande e n piccolo l ultima parte nella formula può essere trascurata

6 Il teorema del limite centrale La variabile aleatoria della media campionaria può essere associata ad una distribuzione di probabilità nota, grazie ad un teorema molto importante, che però vale solo per n grande (si intende almeno pari a 30) e se i campioni sono indipendenti. Il teorema dice che: la media campionaria al crescere di n tende a distribuirsi come una normale di media μ e varianza σ 2 /n Ne deriva che, se passiamo alla variabile standardizzata della media campionaria essa si distribuisce come una normale standardizzata z = x μ σ n ~N(0,1) Dunque la media è normale se il carattere su cui è calcolata è normale, e anche quando non lo è, per n sufficientemente grande.

7 Esempio: Facciamo ancora una volta riferimento agli alunni nel Lazio nel 1999 secondo i dati INRAN. Avevamo calcolato per il peso, sia la media che la varianza μ=33.1 kg e σ 2 =52.42, da cui σ=7.24 Supponiamo di estrarre dal collettivo dei 6080 ragazzi 100 campioni di 30 unità. Vogliamo calcolare quanti di questi campioni possiamo attenderci abbiano una media compresa nell intervallo di peso kg. Per prima cosa passiamo ai valori standardizzati, per cui calcoliamo lo scarto quadratico medio della media campionaria che è pari a σ x = Allora ho z 1 = (32 33,1) 1,32 σ2 n N n N 1 σ2 = σ n n = 1,1 = 1,83 e z 1,32 2= (34 33,1) = 0,9 =0,68 1,32 1,32 Cioè σ x =7.24/5.47=1.32 Per il teorema del limite centrale p(32 x 34)=p(z 2 )-p(z 1 )=p(0.68)-p(-0.83)= =0.55 Per 100 campioni, ciascuno con probabilità 0.55 di centrare l intervallo, mi aspetto 55 campioni la cui media sia interna all intervallo scelto. NOTA: p(z) è stato calcolato con il foglio di calcolo con la funzione DISTRIB.NORM.ST(Z)

8 I principali problemi dell inferenza statistica consistono nella stima dei parametri di una popolazione e nella verifica delle ipotesi statistiche. Per stimare un parametro θ della popolazione si deve trovare una funzione dei dati osservati il cui valore possa essere ritenuto una stima attendibile del parametro della popolazione θ = t(x 1, x 2,, x n ) La funzione t si cerca per analogia con l espressione matematica della forma caratteristica del parametro. Ad esempio la media, come abbiamo visto, può essere stimata con la media calcolata nel campione, la varianza, con la varianza calcolata nel campione (anche se bisogna dividerla per la radice di n)

9 Proprietà degli stimatori Gli stimatori possono avere delle proprietà molto importanti. CORRETTEZZA: Uno stimatore si dice corretto o non distorto, se il suo valore medio nello spazio campionario è uguale al valore del parametro nella popolazione EFFICIENZA: Uno stimatore si dice efficiente se la sua varianza, a parità di altre condizioni, è minore della varianza ottenibile con altri stimatori CONSISTENZA: Uno stimatore si dice consistente se al crescere di n i valori stimati tendono, con probabilità tendente ad 1, al valore del parametro della popolazione SUFFICIENZA: Uno stimatore si dice sufficiente se contiene tutte le informazioni sul parametro.

10 Proprietà degli stimatori Le prime due proprietà sono più intuitive, le altre due lo sono meno, anche se entrambe consentono di identificare gli stimatori migliori. Tuttavia possiamo affermare che se uno stimatore gode della proprietà della consistenza allora la sua varianza diminuirà fino ad annullarsi al crescere di n. Infine la proprietà di sufficienza di uno stimatore è molto importante perché da un lato si considerano stimatori che non trascurano nessuna informazione campionaria rilevante dall altro non includono informazioni ridondanti per la stima del parametro. Per la media aritmetica, il miglior stimatore è proprio la media aritmetica delle osservazioni, perché è uno stimatore che gode delle proprietà suddette.

11 Proprietà degli stimatori Abbiamo già verificato la correttezza della media in quanto abbiamo visto che facendo la media delle medie campionarie, si ottiene proprio il valore del parametro media della popolazione. Se però usiamo un altro tipo di centro per stimare la media, ad esempio il valore centrale tra il minimo e il massimo, otteniamo uno stimatore peggiore. Esempio: riprendiamo un esempio precedente per verificare quest ultima affermazione. Per le unità a=10, b=12, c=15, d=16, consideriamo i campioni di tre unità e stimiamo la media della popolazione, che era di 13.25, con la semisomma degli estremi nei campioni che indichiamo con s. a b c s=12.5 a b d s=13 a c d s=13 b c d s=14 La media di questi valori è ( )/4= leggermente inferiore alla media della popolazione quindi fornisce più di frequente una sottostima della media, anziché una stima esatta.

12 Proprietà degli stimatori Mentre la media artimetica è uno stimatore corretto, la varianza non lo è perché risulta E s 2 = σ 2 n 1 n Cioè la media delle varianze campionarie, indicate con S 2, è uguale alla varianza della popolazione a meno di un fattore di correzione che dipende dalla numerosità campionaria. Quindi la varianza campionaria è uno stimatore distorto della varianza della popolazione, a meno che non si parli di grandi campioni per cui il fattore di correzione diventa trascurabile. Pertanto, per stimare la varianza nella popolazione si usa uno stimatore corretto: s 2 = n i=1 (x i x ) 2 n 1 dove E s 2 = σ 2

13 Intervallo di confidenza Abbiamo già visto in un esempio che, conoscendo la distribuzione di probabilità di un parametro, possiamo calcolare la probabilità dei campioni che hanno una stima del parametro che cade in un certo intervallo. Questo fatto può essere enunciato in un modo inverso: possiamo trovare un intervallo intorno al vero valore del parametro tale che la sua ampiezza è in grado di contenere una gran parte delle stime campionarie con una certa probabilità P. In altri termini, accettando un certo rischio di errore, possiamo determinare un intervallo entro cui dovrebbe trovarsi il valore vero del parametro da stimare. La quantità α=1-p è questo rischio di errore. Il valore 1-α viene detto livello di confidenza: Pr{θ - δ < θ < θ + δ } =1-α

14 Intervallo di confidenza Ciò vuol dire che 1-α è la probabilità che l intervallo ({θ - δ, θ + δ) contenga il valore incognito θ della popolazione e tale intervallo varia col variare del campione. Questo esprime la fiducia che possiamo avere nella stima di θ Di conseguenza, possiamo dire che il valore θ può essere, con una certa probabilità 1-α uno dei valori compresi nell intervallo di confidenza. Al crescere di n e al diminuire della varianza del fenomeno oggetto dello studio, tale intervallo si riduce, aumentando la precisione delle stime ottenute, a parità del livello di fiducia. La probabilità dell intervallo di confidenza può essere nota solo per parametri a cui è associabile una distribuzione di probabilità nota. Il teorema del limite centrale ci dice che per la media possiamo sempre usare la distribuzione normale.

15 Intervallo di confidenza per la media Per la media μ, dunque, potendo usare la normale come distribuzione di probabilità, l intervallo di confidenza è: x z α σn μ x + z σ α oppure, standardizzando, z α x μ σ n z α dove z α è il valore della curva normale che racchiude a destra α/2 % dei casi, σ è lo scostamento quadratico medio della popolazione n è la numerosità campionaria. Esempio: determiniamo l intervallo di confidenza per μ sapendo che lo scarto quadratico medio della popolazione è σ =6, che la numerosità campionaria è n=100 e che nel campione si è calcolata una media di x =170 cm. Dalla formula, per un livello di fiducia del 95% (z α =1.96), otteniamo 0.95 =P{170-1,96*6/10 μ 170+1,96*6/10} = P{170-1,176 μ 170+1,176}=P{168,8 μ 171,2} n

16 Intervallo di confidenza per la media Abbiamo però detto che spesso lo scarto quadratico medio della popolazione non è noto e allora si può utilizzare una stima di esso calcolata con i dati del campione. Si sceglie però lo stimatore corretto, in quanto, come abbiamo detto, lo scarto quadratico medio semplice non gode della proprietà della correttezza. In questo caso la distribuzione di probabilità che dobbiamo considerare non è più la normale, bensì la t di Student con n-1 gradi di libertà x μ t = ~t s (n 1) n Anche la t di Student è una distribuzione di probabilità continua e definita su tutto l asse reale. La sua forma varia in base al parametro gradi di libertà, ma per n grande (circa > 100) può essere approssimata con la normale.

17 Intervallo di confidenza per la media L intervallo di confidenza per la media quando la varianza non è nota diventa: x t α n 1, 2 sn μ x + t s (n 1, α2 ) n Anche per t esistono delle tavole di riferimento che aiutano ad effettuare i calcoli. Esempio: determiniamo lo stesso intervallo di confidenza precedente, sapendo però che s =6,9, la numerosità campionaria è sempre 100 e la media campionaria è 170 cm. Dalla formula, per un livello di fiducia del 95% (t 99,0.05 =1,98), otteniamo 0.95 =P{ *6,9/10 μ *6,9/10} =P{168,6 μ 171,4} Anche in questo caso esistono funzioni automatiche sui fogli di calcolo (INV.T)

18 Verifica delle ipotesi La teoria della verifica delle ipotesi consente di stabilire se una certa assunzione, basata su un risultato campionario, può essere accettata o no. E questo si fa attraverso l uso di test che sono vere e proprie regole che consentono di accettare o rifiutare una certa ipotesi perché poco probabile. Esempio: supponiamo di aver acquistato delle pile che ci vengono garantite per durare più di 2000 ore ciascuna. Per decidere se ciò è vero, facciamo un campione di pile e le mettiamo in funzione per 2000 ore. Dai risultati che rileviamo su questo campione decidiamo se tutte le pile sono veramente durevoli quanto ci hanno garantito o no attraverso un test di ipotesi. L ipotesi formulata e che si vuole sottoporre al test, si chiama ipotesi nulla e si indica con H 0, l ipotesi alternativa ad essa si indica con H 1. Quindi, se si considera lo spazio dei parametri Ω e lo si divide in 2 sottoinsiemi disgiunti ω 1 e ω 2, si avrà che il parametro incognito θ può appartenere o a ω 1 o a ω 2

19 Verifica delle ipotesi In termini simbolici, abbiamo due ipotesi H 0 : θ ω 1 e H 1 : θ ω 2 dove con il simbolo si intende l appartenenza di θ ad uno dei due sottoinsiemi Occorre stabilire quale statistica si vuole prendere per stimare θ per poi decidere se è più probabile che valga l ipotesi nulla o l ipotesi alternativa. Nello spazio Ω in cui è definito θ individuiamo una regione R che chiamiamo regione di rifiuto e una regione A, di accettazione ad essa complementare. Se la statistica cadrà in essa rifiuteremo l ipotesi nulla, se cadrà fuori, la accetteremo. Così si possono commettere due tipi di errore: a) errore di I tipo o di prima specie: rifiuto l ipotesi nulla quando è vera b) errore di II tipo o di seconda specie: accetto l ipotesi nulla quando è falsa

20 Verifica delle ipotesi L inferenza nella statistica

21 Verifica delle ipotesi A questi errori sono sempre associate delle probabilità a) Probabilità di commettere un errore di prima specie: α = P{s R θ=θ 0 } cioè è la probabilità che la statistica test cada nella regione di rifiuto quando l ipotesi nulla è vera e quindi è l errore di prima specie. b) Probabilità di commettere un errore di seconda specie: β = P{s A θ=θ 1 } cioè è la probabilità che la statistica test cada nella regione di accettazione quando l ipotesi nulla è falsa e quindi è l errore di seconda specie α è detto livello di significatività e corrisponde alla dimensione della regione di rifiuto R. Il valore 1-β=P{s R θ=θ 1 } è detto potenza del test e dobbiamo scegliere R in modo che sia massimo.

22 Verifica delle ipotesi La potenza del test indica la probabilità di rifiutare l ipotesi nulla quando è vera l ipotesi alternativa. Più è alta questa probabilità, più il test ha la capacità di farci fare la scelta giusta. Ho le seguenti possibilità Realtà H 0 è vera H 0 è falsa x regione di accettazione Accetto H 0 Decisione giusta P=1-α Errore di seconda specie P=β Campione x regione di accettazione Rifiuto H 0 Errore di prima specie P=α Decisione giusta P=1-β

23 Test normale Se ho un carattere normale o un campione sufficientemente grande su cui, ad esempio, stimo una media che per grandi campioni è normale, e se la varianza della popolazione è nota, posso usare la statistica test z = x n μ 0 σ n che mi consente di dire che, la mia ipotesi sul valore della media della popolazione è validata o no dal campione. Ipotesi nulla H 0 : μ=μ 0 Ipotesi alternativa H 1 : μ μ 0 (ma si poteva scegliere μ μ 0 o μ μ 0 ) Si calcola z nel campione e si sceglie α. Per α=0.05 accetto H 0 se z<1.64

24 Test normale Esempio: Consideriamo una popolazione normale con σ=2 ed estraiamo un campione di ampiezza 10. Supponiamo di voler testare l ipotesi che la media della popolazione sia μ=20. Dunque l ipotesi nulla è H 0 : μ=20 l ipotesi alternativa è H 1 : μ 20 a) calcolare la regione di rifiuto all 1%, al 5%, al 10%; b) supponendo che la media campionaria sia x=18,58 prendere una decisione ai tre livelli di significatività di cui sopra Accetterò l ipotesi nulla se P(z)<α e, come sappiamo, per α=0.01 z=2.58, α=0.05 z=1.96, α=0.1 z=1.64. Calcolo dunque z nel campione: z = 18, / 10 = 1,42 2/3,16 = 1,42 0,63 = 2,25 Quindi, per una regione di rifiuto all 1% (la prob. che H 0 sia vera deve essere del 99%) accetto l ipotesi nulla, per ampiezze della regione di rifiuto maggiori la rifiuto (la prob. che H 0 sia vera deve essere del 95% o del 90%).

25 Test t di student Se non conosco la varianza della popolazione posso fare ricorso alla sua stima corretta. In questo caso la statistica test si distribuisce come una t di Student. Per grandi campioni posso sempre fare ricorso alla normale. t = x μ 0 s n Ipotesi nulla H 0 : μ=μ 0 Ipotesi alternativa H 1 : μ μ 0 Si calcola t nel campione e si sceglie α. t dipende anche dai gradi di libertà (n-1) Nella tavola la riga con n= è proprio uguale al valore della normale

26 Test t di student Esempio: Il contenuto nominale delle lattine di bibite è 330ml. Scegliamo un campione di 20 lattine in cui riscontriamo un contenuto medio di 328ml con deviazione standard 3.2ml. Assumiamo che la distribuzione del contenuto sia normale. Stabilire al livello di significatività del 5% se si tratta di frode. Dunque l ipotesi nulla è H 0 : μ=330 l ipotesi alternativa è H 1 : μ 330 Non conoscendo la varianza della popolazione, abbiamo una statistica test di tipo t di Student. t n-1,5% =t 19,0.05 =2.093 t = ,2/4,47 = 2 0,72 = 2,8 Quindi, poiché t>t 19,0.05 in quanto 2.8>2.093 concludo che devo rifiutare l ipotesi nulla e quindi si tratta di frode.

27 Test t di student per il confronto fra due medie Si può pensare anche di testare se due campioni indipendenti stimano la stessa media. In questo caso, se non conosco la varianza della popolazione, faccio ancora ricorso alla t di Student e stimo la varianza come s=(dev(x 1 ) + Dev(x 2 ))/(n 1 +n 1-2) ipotizzando che le due popolazioni abbiano la stessa varianza In questo caso la statistica test è t = x 1 x 2 H 0 : μ=0 Ipotesi Nulla H 1 : μ 0 Ipotesi alternativa s 1 n1 + 1 n2 ~t n1 +n 2 2,α con n 1 +n 1-2 gdl Cioè si testa se la differenza è nulla o no con una t con n 1 +n 1-2 gradi di libertà ad un livello α di significatività.

28 Test t di student per il confronto fra due medie Esempio: In un esperimento, su due gruppi, ciascuno di 10 animali dello stesso tipo, è stato misurato il peso, ma ad un gruppo è stato somministrato un ormone per la crescita. Valutiamo al livello di significatività α pari al 5% se il trattamento determina un incremento di peso. La differenza tra i due pesi medi è risultata di X 1 -X 2 =0.54 kg. Lo scarto quadratico medio complessivo è stato calcolato ed è risultato pari a 0.48 Dunque l ipotesi nulla è H 0 : D=0 Cioè la differenza dei pesi è nulla l ipotesi alternativa è H 1 : D 0 Calcolo la statistica test: t = 0,54 0,48 0,45 = 0,54 0,216 = 2,5 t 18,0.05 =2.101 quindi rifiuto l ipotesi nulla che la differenza di peso è nulla e che l ormone della crescita somministrato non ha avuto effetto significativo.

29 Test t di student In R abbiamo la funzione t.test effettua il test t di Student ad un campione, a due campioni e per dati appaiati. La sintassi completa di questa funzione è: t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95,...) dove: x e y sono vettori numerici di dati; alternative specifica l ipotesi alternativa, a seconda che si tratti di una verifica di ipotesi bilaterale o unilaterale; mu un numero che indica il valore reale della media (o la differenza tra le medie se si sta effettuando un test a due campioni); paired una variabile logica che indica se si vuole effettuare un test t per dati appaiati; var.equal una variabile logica che indica se porre le varianze dei due campioni uguali fra loro; conf.level livello di confidenza.

30 Test t di student Esempio. Un gruppo di 22 volontari presso un centro di ricerca medica viene esposto a vari tipi di virus influenzali e tenuto sotto controllo medico. Ad un campione casuale di 10 volontari viene somministrato un grammo di vitamina C quattro volte al giorno. Agli altri 12 volontari viene somministrato un placebo non distinguibile dal farmaco. I volontari vengono poi visitati spesso da un medico che non conosce la divisione in gruppi e non appena uno di essi viene trovato guarito si registra la durata della malattia. Alla fine dell esperimento si possiedono i seguenti dati: Placebo: 6.5, 6.0, 8.5, 7.0, 6.5, 8.0, 7.5, 6.5, 7.5, 6.0, 8.5, 7.0 Vitamina C 5.5, 6.0, 7.0, 6.0, 7.5, 6.0, 7.5, 5.5, 7.0, 6.5 Si inseriscono i vettori in R: vitamina_c <- c(5.5, 6.0, 7.0, 6.0, 7.5, 6.0, 7.5, 5.5,7.0, 6.5) placebo <- c(6.5, 6.0, 8.5, 7.0, 6.5, 8.0, 7.5, 6.5, 7.5, 6.0, 8.5, 7.0) Si può concludere che l assunzione di 4 grammi di vitamina C al giorno abbia accorciato il decorso medio della malattia? A che livello di significatività? H 0 : μ vitamina C μ placebo Eseguiamo il test: supponendo che le varianze della durata della malattia nei due H 1 : μ vitamina C < μ placebo casi siano uguali.

31 Test t di student L ipotesi nulla viene accettata solo per livelli di significatività α< = p-value; l ipotesi nulla viene dunque rifiutata ad un livello di significatività del 5% quindi, a questo livello di significatività, i dati raccolti evidenziano un accorciamento del decorso dell influenza somministrando vitamina C.

32 Test χ 2 - test non parametrici Conosciamo già la forma di questo indice, perché lo abbiamo studiato come indice di connessione fra due caratteri in una distribuzione doppia. Ora vogliamo usarlo per verificare l ipotesi di indipendenza tra due distribuzioni χ 2 = n n 2 hi h i χ 2 (h 1)(i 1) n h. n.i 1~ I gradi di libertà sono dunque (h-1)(i-1) Questo test può essere eseguito su qualunque distribuzione doppia, anche quando i caratteri non sono quantitativi (da qui la definizione di non parametrico). In questo caso l ipotesi nulla rappresenta la dipendenza tra le distribuzioni.

33 Test χ 2 - test non parametrici Esempio: Si supponga di aver rilevato, su un campione di 36 giovani, la pressione arteriosa e la pratica sportiva. Calcoliamo la statistica test χ 2 = n = 36 0,15 + 0,34 + 0,47 + 0,12 1 = 2, Dalla tavola del χ 2 per 1=(2-1)(2-1) gdl e un livello di significatività del 5% otteniamo il valore 3,84 Dunque accettiamo l ipotesi nulla: nel campione considerato, tra ipertensione e pratica dello sport c è dipendenza Ipertensione si Ipertensione no Totale Sport si Sport no Totale

Concetti principale della lezione precedente

Concetti principale della lezione precedente Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli

Distribuzione normale

Distribuzione normale Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1 . Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

Test di ipotesi. Test

Test di ipotesi. Test Test di ipotesi Test E una metodologia statistica che consente di prendere una decisione. Esempio: Un supermercato riceve dal proprio fornitore l assicurazione che non più del 5% delle mele di tipo A dell

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016 Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1 Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Il Test di Ipotesi Lezione 5

Il Test di Ipotesi Lezione 5 Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!

Dettagli

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi Esercitazione 14 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Approssimazione normale della Poisson (TLC) In un determinato tratto di strada il numero di incidenti

Dettagli

APPUNTI DI STATISTICA INFERENZIALE. Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO

APPUNTI DI STATISTICA INFERENZIALE. Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO APPUNTI DI STATISTICA INFERENZIALE Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO PREREQUISITI VARIABILE ALEATORIA (QUANTITATIVA): è una funzione che associa un numero reale ad ogni

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II [email protected] 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Dettagli

[email protected] http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi [email protected] http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice con Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 29 Outline con 1 2 3 con 4 5 campioni appaiati 6 Indipendenza tra variabili () Statistica 2 /

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 II Esonero - 10 Gennaio 2014 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

STIMA DELLA VARIANZA CAMPIONARIA

STIMA DELLA VARIANZA CAMPIONARIA STIMA DELLA VARIANZA CAMPIONARIA Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X i è x n = (x 1 +.. + x n )/n. Una stima puntuale della varianza σ 2 delle

Dettagli

Test d Ipotesi Introduzione

Test d Ipotesi Introduzione Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto

Dettagli

Teorema del Limite Centrale

Teorema del Limite Centrale Teorema del Limite Centrale Problema. Determinare come la media campionaria x e la deviazione standard campionaria s misurano la media µ e la deviazione standard σ della popolazione. È data una popolazione

Dettagli

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Matematica II: Calcolo delle Probabilità e Statistica Matematica Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie

Dettagli

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003 Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore

Dettagli

Corso di Statistica Esercitazione 1.8

Corso di Statistica Esercitazione 1.8 Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

RICHIAMI DI CALCOLO DELLE PROBABILITÀ UNIVERSITA DEL SALENTO INGEGNERIA CIVILE RICHIAMI DI CALCOLO DELLE PROBABILITÀ ing. Marianovella LEONE INTRODUZIONE Per misurare la sicurezza di una struttura, ovvero la sua affidabilità, esistono due

Dettagli

Capitolo 8. Probabilità: concetti di base

Capitolo 8. Probabilità: concetti di base 1 Capitolo 8 Probabilità: concetti di base Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl 2 Concetti primitivi di

Dettagli

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa. Statistica Matematica A Esercitazione # 6 DUE MEDIE CON VARIANZE NOTE: Esercizio # Le ditte A e B producono sfere luminose. Una volta attivata la reazione chimica che rende luminosa una di queste sfere,

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:

Dettagli

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione La verifica delle ipotesi In molte circostanze il ricercatore si trova a dover decidere quale, tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento di Economia

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. Esercizio 1 Un chimico che lavora per una fabbrica di batterie, sta cercando una batteria

Dettagli