Inferenza statistica

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Inferenza statistica"

Transcript

1 Inferenza statistica

2 Si tratta di un complesso di tecniche, basate sulla teoria della probabilità, che consentono di verificare se sia o no possibile trasferire i risultati ottenuti per un campione ad una popolazione più estesa. E un processo induttivo che, pur non potendo contare su tutti i dati necessari per descrivere un collettivo statistico, cerca di stimare con una certa probabilità di errore, se essi siano o meno attendibili. L induzione, dunque, contrariamente alla deduzione, si fonda su basi incerte ma tenta di colmare le lacune di informazione che si hanno ogni qualvolta non si può osservare tutta la popolazione, ma solo una parte di essa. Distinguiamo il termine parametro dal termine statistica: il parametro è un valore caratteristico della popolazione, mentre la statistica è funzione delle osservazioni di un campione. Quindi la media può essere sia parametro che statistica.

3 Se consideriamo un carattere X, a cui sia associata una distribuzione di probabilità e dunque si possa considerare come una variabile aleatoria, si definisce funzione di ripartizione di X la relazione F(x)=Prob {X x} con x R Tale funzione è non decrescente, cioè per x<x 1, F(x) F(x 1 ) è continua a destra, cioè F(x)=F(x 1 ) se x e x 1 sono infinitamente vicini è tale che lim x F(x) = 0 e lim x + F(x) = 1 Consideriamo ora la media artimetica. Distinguiamo la media aritmetica della popolazione μ, che abbiamo detto possiamo chiamare parametro, da quella calcolata nel campione x, che è la nostra statistica a cui è associata una distribuzione di probabilità. Questa statistica a sua volta ha una media ed una varianza Media: E x = μ e varianza: Var x = σ2 n oppure Var x = σ2 n N n N 1

4 Esempio: Torniamo all esempio già visto per verificare che se potessimo calcolare la media di ogni possibile campione estraibile da un universo, otterremmo una serie di medie campionarie, che a loro volta hanno media pari al parametro della popolazione. Supponiamo di avere un universo di 4 unità su cui si è rilevata la seguente misura in cm: a=10, b=12, c=15, d=16. Avevamo calcolato che la media è pari a ( )/4=53/4=13,25. I campioni di una unità hanno medie pari a 10, 12, 15, 16 I campioni di due unità hanno medie pari a : 11, 12.5, 13, 13.5, 14, 15.5 I campioni di tre unità hanno medie pari a: 12.3, 12.7, 13.7, 14.3, E facile verificare che la media delle medie nei tre casi (campioni di 1 o 2 o 3 unità), è sempre pari a 13.25, che è la media dell universo. Questo fatto ci dice anche che la media aritmetica è uno stimatore non distorto (vedremo meglio più avanti questo concetto)

5 Esempio: Per l esempio della pagina precedente, calcoliamo la varianza della stima della media campionaria. Consideriamo tutte le medie calcolate ed effettuiamo il calcolo della varianza, cominciando per comodità dalla varianza della popolazione e poi calcolando quella per campioni di 2 e di 3 unità: σ 2 = [( ) 2 +( ) 2 +( ) 2 +( ) 2 ]/4=5.7 Var 2 (x ) = [( ) 2 +( ) 2 +( ) 2 +( ) 2 +( ) 2 +( ) 2 ]/6=1.9 Var 3 (x ) = [( ) 2 +( ) 2 +( ) 2 +( ) 2 ]/4=0.6 Un altro modo per calcolare questa varianza è la formula Var x = σ2 N n n N 1 Dal momento che σ 2 è noto ed è pari a 5.7, la stessa varianza calcolata per i campioni di 1 unità, otteniamo: Var 2 (x)= 5,7 (4 2) = 5,7 = 1,9 Var 2 (4 1) 4 3(x )= 5,7 (4 3) = 5,7 = 1,6 3 (4 1) 9 Si comprende che quando N è grande e n piccolo l ultima parte nella formula può essere trascurata

6 Il teorema del limite centrale La variabile aleatoria della media campionaria può essere associata ad una distribuzione di probabilità nota, grazie ad un teorema molto importante, che però vale solo per n grande (si intende almeno pari a 30) e se i campioni sono indipendenti. Il teorema dice che: la media campionaria al crescere di n tende a distribuirsi come una normale di media μ e varianza σ 2 /n Ne deriva che, se passiamo alla variabile standardizzata della media campionaria essa si distribuisce come una normale standardizzata z = x μ σ n ~N(0,1) Dunque la media è normale se il carattere su cui è calcolata è normale, e anche quando non lo è, per n sufficientemente grande.

7 Esempio: Facciamo ancora una volta riferimento agli alunni nel Lazio nel 1999 secondo i dati INRAN. Avevamo calcolato per il peso, sia la media che la varianza μ=33.1 kg e σ 2 =52.42, da cui σ=7.24 Supponiamo di estrarre dal collettivo dei 6080 ragazzi 100 campioni di 30 unità. Vogliamo calcolare quanti di questi campioni possiamo attenderci abbiano una media compresa nell intervallo di peso kg. Per prima cosa passiamo ai valori standardizzati, per cui calcoliamo lo scarto quadratico medio della media campionaria che è pari a σ x = Allora ho z 1 = (32 33,1) 1,32 σ2 n N n N 1 σ2 = σ n n = 1,1 = 1,83 e z 1,32 2= (34 33,1) = 0,9 =0,68 1,32 1,32 Cioè σ x =7.24/5.47=1.32 Per il teorema del limite centrale p(32 x 34)=p(z 2 )-p(z 1 )=p(0.68)-p(-0.83)= =0.55 Per 100 campioni, ciascuno con probabilità 0.55 di centrare l intervallo, mi aspetto 55 campioni la cui media sia interna all intervallo scelto. NOTA: p(z) è stato calcolato con il foglio di calcolo con la funzione DISTRIB.NORM.ST(Z)

8 I principali problemi dell inferenza statistica consistono nella stima dei parametri di una popolazione e nella verifica delle ipotesi statistiche. Per stimare un parametro θ della popolazione si deve trovare una funzione dei dati osservati il cui valore possa essere ritenuto una stima attendibile del parametro della popolazione θ = t(x 1, x 2,, x n ) La funzione t si cerca per analogia con l espressione matematica della forma caratteristica del parametro. Ad esempio la media, come abbiamo visto, può essere stimata con la media calcolata nel campione, la varianza, con la varianza calcolata nel campione (anche se bisogna dividerla per la radice di n)

9 Proprietà degli stimatori Gli stimatori possono avere delle proprietà molto importanti. CORRETTEZZA: Uno stimatore si dice corretto o non distorto, se il suo valore medio nello spazio campionario è uguale al valore del parametro nella popolazione EFFICIENZA: Uno stimatore si dice efficiente se la sua varianza, a parità di altre condizioni, è minore della varianza ottenibile con altri stimatori CONSISTENZA: Uno stimatore si dice consistente se al crescere di n i valori stimati tendono, con probabilità tendente ad 1, al valore del parametro della popolazione SUFFICIENZA: Uno stimatore si dice sufficiente se contiene tutte le informazioni sul parametro.

10 Proprietà degli stimatori Le prime due proprietà sono più intuitive, le altre due lo sono meno, anche se entrambe consentono di identificare gli stimatori migliori. Tuttavia possiamo affermare che se uno stimatore gode della proprietà della consistenza allora la sua varianza diminuirà fino ad annullarsi al crescere di n. Infine la proprietà di sufficienza di uno stimatore è molto importante perché da un lato si considerano stimatori che non trascurano nessuna informazione campionaria rilevante dall altro non includono informazioni ridondanti per la stima del parametro. Per la media aritmetica, il miglior stimatore è proprio la media aritmetica delle osservazioni, perché è uno stimatore che gode delle proprietà suddette.

11 Proprietà degli stimatori Abbiamo già verificato la correttezza della media in quanto abbiamo visto che facendo la media delle medie campionarie, si ottiene proprio il valore del parametro media della popolazione. Se però usiamo un altro tipo di centro per stimare la media, ad esempio il valore centrale tra il minimo e il massimo, otteniamo uno stimatore peggiore. Esempio: riprendiamo un esempio precedente per verificare quest ultima affermazione. Per le unità a=10, b=12, c=15, d=16, consideriamo i campioni di tre unità e stimiamo la media della popolazione, che era di 13.25, con la semisomma degli estremi nei campioni che indichiamo con s. a b c s=12.5 a b d s=13 a c d s=13 b c d s=14 La media di questi valori è ( )/4= leggermente inferiore alla media della popolazione quindi fornisce più di frequente una sottostima della media, anziché una stima esatta.

12 Proprietà degli stimatori Mentre la media artimetica è uno stimatore corretto, la varianza non lo è perché risulta E s 2 = σ 2 n 1 n Cioè la media delle varianze campionarie, indicate con S 2, è uguale alla varianza della popolazione a meno di un fattore di correzione che dipende dalla numerosità campionaria. Quindi la varianza campionaria è uno stimatore distorto della varianza della popolazione, a meno che non si parli di grandi campioni per cui il fattore di correzione diventa trascurabile. Pertanto, per stimare la varianza nella popolazione si usa uno stimatore corretto: s 2 = n i=1 (x i x ) 2 n 1 dove E s 2 = σ 2

13 Intervallo di confidenza Abbiamo già visto in un esempio che, conoscendo la distribuzione di probabilità di un parametro, possiamo calcolare la probabilità dei campioni che hanno una stima del parametro che cade in un certo intervallo. Questo fatto può essere enunciato in un modo inverso: possiamo trovare un intervallo intorno al vero valore del parametro tale che la sua ampiezza è in grado di contenere una gran parte delle stime campionarie con una certa probabilità P. In altri termini, accettando un certo rischio di errore, possiamo determinare un intervallo entro cui dovrebbe trovarsi il valore vero del parametro da stimare. La quantità α=1-p è questo rischio di errore. Il valore 1-α viene detto livello di confidenza: Pr{θ - δ < θ < θ + δ } =1-α

14 Intervallo di confidenza Ciò vuol dire che 1-α è la probabilità che l intervallo ({θ - δ, θ + δ) contenga il valore incognito θ della popolazione e tale intervallo varia col variare del campione. Questo esprime la fiducia che possiamo avere nella stima di θ Di conseguenza, possiamo dire che il valore θ può essere, con una certa probabilità 1-α uno dei valori compresi nell intervallo di confidenza. Al crescere di n e al diminuire della varianza del fenomeno oggetto dello studio, tale intervallo si riduce, aumentando la precisione delle stime ottenute, a parità del livello di fiducia. La probabilità dell intervallo di confidenza può essere nota solo per parametri a cui è associabile una distribuzione di probabilità nota. Il teorema del limite centrale ci dice che per la media possiamo sempre usare la distribuzione normale.

15 Intervallo di confidenza per la media Per la media μ, dunque, potendo usare la normale come distribuzione di probabilità, l intervallo di confidenza è: x z α σn μ x + z σ α oppure, standardizzando, z α x μ σ n z α dove z α è il valore della curva normale che racchiude a destra α/2 % dei casi, σ è lo scostamento quadratico medio della popolazione n è la numerosità campionaria. Esempio: determiniamo l intervallo di confidenza per μ sapendo che lo scarto quadratico medio della popolazione è σ =6, che la numerosità campionaria è n=100 e che nel campione si è calcolata una media di x =170 cm. Dalla formula, per un livello di fiducia del 95% (z α =1.96), otteniamo 0.95 =P{170-1,96*6/10 μ 170+1,96*6/10} = P{170-1,176 μ 170+1,176}=P{168,8 μ 171,2} n

16 Intervallo di confidenza per la media Abbiamo però detto che spesso lo scarto quadratico medio della popolazione non è noto e allora si può utilizzare una stima di esso calcolata con i dati del campione. Si sceglie però lo stimatore corretto, in quanto, come abbiamo detto, lo scarto quadratico medio semplice non gode della proprietà della correttezza. In questo caso la distribuzione di probabilità che dobbiamo considerare non è più la normale, bensì la t di Student con n-1 gradi di libertà x μ t = ~t s (n 1) n Anche la t di Student è una distribuzione di probabilità continua e definita su tutto l asse reale. La sua forma varia in base al parametro gradi di libertà, ma per n grande (circa > 100) può essere approssimata con la normale.

17 Intervallo di confidenza per la media L intervallo di confidenza per la media quando la varianza non è nota diventa: x t α n 1, 2 sn μ x + t s (n 1, α2 ) n Anche per t esistono delle tavole di riferimento che aiutano ad effettuare i calcoli. Esempio: determiniamo lo stesso intervallo di confidenza precedente, sapendo però che s =6,9, la numerosità campionaria è sempre 100 e la media campionaria è 170 cm. Dalla formula, per un livello di fiducia del 95% (t 99,0.05 =1,98), otteniamo 0.95 =P{ *6,9/10 μ *6,9/10} =P{168,6 μ 171,4} Anche in questo caso esistono funzioni automatiche sui fogli di calcolo (INV.T)

18 Verifica delle ipotesi La teoria della verifica delle ipotesi consente di stabilire se una certa assunzione, basata su un risultato campionario, può essere accettata o no. E questo si fa attraverso l uso di test che sono vere e proprie regole che consentono di accettare o rifiutare una certa ipotesi perché poco probabile. Esempio: supponiamo di aver acquistato delle pile che ci vengono garantite per durare più di 2000 ore ciascuna. Per decidere se ciò è vero, facciamo un campione di pile e le mettiamo in funzione per 2000 ore. Dai risultati che rileviamo su questo campione decidiamo se tutte le pile sono veramente durevoli quanto ci hanno garantito o no attraverso un test di ipotesi. L ipotesi formulata e che si vuole sottoporre al test, si chiama ipotesi nulla e si indica con H 0, l ipotesi alternativa ad essa si indica con H 1. Quindi, se si considera lo spazio dei parametri Ω e lo si divide in 2 sottoinsiemi disgiunti ω 1 e ω 2, si avrà che il parametro incognito θ può appartenere o a ω 1 o a ω 2

19 Verifica delle ipotesi In termini simbolici, abbiamo due ipotesi H 0 : θ ω 1 e H 1 : θ ω 2 dove con il simbolo si intende l appartenenza di θ ad uno dei due sottoinsiemi Occorre stabilire quale statistica si vuole prendere per stimare θ per poi decidere se è più probabile che valga l ipotesi nulla o l ipotesi alternativa. Nello spazio Ω in cui è definito θ individuiamo una regione R che chiamiamo regione di rifiuto e una regione A, di accettazione ad essa complementare. Se la statistica cadrà in essa rifiuteremo l ipotesi nulla, se cadrà fuori, la accetteremo. Così si possono commettere due tipi di errore: a) errore di I tipo o di prima specie: rifiuto l ipotesi nulla quando è vera b) errore di II tipo o di seconda specie: accetto l ipotesi nulla quando è falsa

20 Verifica delle ipotesi L inferenza nella statistica

21 Verifica delle ipotesi A questi errori sono sempre associate delle probabilità a) Probabilità di commettere un errore di prima specie: α = P{s R θ=θ 0 } cioè è la probabilità che la statistica test cada nella regione di rifiuto quando l ipotesi nulla è vera e quindi è l errore di prima specie. b) Probabilità di commettere un errore di seconda specie: β = P{s A θ=θ 1 } cioè è la probabilità che la statistica test cada nella regione di accettazione quando l ipotesi nulla è falsa e quindi è l errore di seconda specie α è detto livello di significatività e corrisponde alla dimensione della regione di rifiuto R. Il valore 1-β=P{s R θ=θ 1 } è detto potenza del test e dobbiamo scegliere R in modo che sia massimo.

22 Verifica delle ipotesi La potenza del test indica la probabilità di rifiutare l ipotesi nulla quando è vera l ipotesi alternativa. Più è alta questa probabilità, più il test ha la capacità di farci fare la scelta giusta. Ho le seguenti possibilità Realtà H 0 è vera H 0 è falsa x regione di accettazione Accetto H 0 Decisione giusta P=1-α Errore di seconda specie P=β Campione x regione di accettazione Rifiuto H 0 Errore di prima specie P=α Decisione giusta P=1-β

23 Test normale Se ho un carattere normale o un campione sufficientemente grande su cui, ad esempio, stimo una media che per grandi campioni è normale, e se la varianza della popolazione è nota, posso usare la statistica test z = x n μ 0 σ n che mi consente di dire che, la mia ipotesi sul valore della media della popolazione è validata o no dal campione. Ipotesi nulla H 0 : μ=μ 0 Ipotesi alternativa H 1 : μ μ 0 (ma si poteva scegliere μ μ 0 o μ μ 0 ) Si calcola z nel campione e si sceglie α. Per α=0.05 accetto H 0 se z<1.64

24 Test normale Esempio: Consideriamo una popolazione normale con σ=2 ed estraiamo un campione di ampiezza 10. Supponiamo di voler testare l ipotesi che la media della popolazione sia μ=20. Dunque l ipotesi nulla è H 0 : μ=20 l ipotesi alternativa è H 1 : μ 20 a) calcolare la regione di rifiuto all 1%, al 5%, al 10%; b) supponendo che la media campionaria sia x=18,58 prendere una decisione ai tre livelli di significatività di cui sopra Accetterò l ipotesi nulla se P(z)<α e, come sappiamo, per α=0.01 z=2.58, α=0.05 z=1.96, α=0.1 z=1.64. Calcolo dunque z nel campione: z = 18, / 10 = 1,42 2/3,16 = 1,42 0,63 = 2,25 Quindi, per una regione di rifiuto all 1% (la prob. che H 0 sia vera deve essere del 99%) accetto l ipotesi nulla, per ampiezze della regione di rifiuto maggiori la rifiuto (la prob. che H 0 sia vera deve essere del 95% o del 90%).

25 Test t di student Se non conosco la varianza della popolazione posso fare ricorso alla sua stima corretta. In questo caso la statistica test si distribuisce come una t di Student. Per grandi campioni posso sempre fare ricorso alla normale. t = x μ 0 s n Ipotesi nulla H 0 : μ=μ 0 Ipotesi alternativa H 1 : μ μ 0 Si calcola t nel campione e si sceglie α. t dipende anche dai gradi di libertà (n-1) Nella tavola la riga con n= è proprio uguale al valore della normale

26 Test t di student Esempio: Il contenuto nominale delle lattine di bibite è 330ml. Scegliamo un campione di 20 lattine in cui riscontriamo un contenuto medio di 328ml con deviazione standard 3.2ml. Assumiamo che la distribuzione del contenuto sia normale. Stabilire al livello di significatività del 5% se si tratta di frode. Dunque l ipotesi nulla è H 0 : μ=330 l ipotesi alternativa è H 1 : μ 330 Non conoscendo la varianza della popolazione, abbiamo una statistica test di tipo t di Student. t n-1,5% =t 19,0.05 =2.093 t = ,2/4,47 = 2 0,72 = 2,8 Quindi, poiché t>t 19,0.05 in quanto 2.8>2.093 concludo che devo rifiutare l ipotesi nulla e quindi si tratta di frode.

27 Test t di student per il confronto fra due medie Si può pensare anche di testare se due campioni indipendenti stimano la stessa media. In questo caso, se non conosco la varianza della popolazione, faccio ancora ricorso alla t di Student e stimo la varianza come s=(dev(x 1 ) + Dev(x 2 ))/(n 1 +n 1-2) ipotizzando che le due popolazioni abbiano la stessa varianza In questo caso la statistica test è t = x 1 x 2 H 0 : μ=0 Ipotesi Nulla H 1 : μ 0 Ipotesi alternativa s 1 n1 + 1 n2 ~t n1 +n 2 2,α con n 1 +n 1-2 gdl Cioè si testa se la differenza è nulla o no con una t con n 1 +n 1-2 gradi di libertà ad un livello α di significatività.

28 Test t di student per il confronto fra due medie Esempio: In un esperimento, su due gruppi, ciascuno di 10 animali dello stesso tipo, è stato misurato il peso, ma ad un gruppo è stato somministrato un ormone per la crescita. Valutiamo al livello di significatività α pari al 5% se il trattamento determina un incremento di peso. La differenza tra i due pesi medi è risultata di X 1 -X 2 =0.54 kg. Lo scarto quadratico medio complessivo è stato calcolato ed è risultato pari a 0.48 Dunque l ipotesi nulla è H 0 : D=0 Cioè la differenza dei pesi è nulla l ipotesi alternativa è H 1 : D 0 Calcolo la statistica test: t = 0,54 0,48 0,45 = 0,54 0,216 = 2,5 t 18,0.05 =2.101 quindi rifiuto l ipotesi nulla che la differenza di peso è nulla e che l ormone della crescita somministrato non ha avuto effetto significativo.

29 Test t di student In R abbiamo la funzione t.test effettua il test t di Student ad un campione, a due campioni e per dati appaiati. La sintassi completa di questa funzione è: t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95,...) dove: x e y sono vettori numerici di dati; alternative specifica l ipotesi alternativa, a seconda che si tratti di una verifica di ipotesi bilaterale o unilaterale; mu un numero che indica il valore reale della media (o la differenza tra le medie se si sta effettuando un test a due campioni); paired una variabile logica che indica se si vuole effettuare un test t per dati appaiati; var.equal una variabile logica che indica se porre le varianze dei due campioni uguali fra loro; conf.level livello di confidenza.

30 Test t di student Esempio. Un gruppo di 22 volontari presso un centro di ricerca medica viene esposto a vari tipi di virus influenzali e tenuto sotto controllo medico. Ad un campione casuale di 10 volontari viene somministrato un grammo di vitamina C quattro volte al giorno. Agli altri 12 volontari viene somministrato un placebo non distinguibile dal farmaco. I volontari vengono poi visitati spesso da un medico che non conosce la divisione in gruppi e non appena uno di essi viene trovato guarito si registra la durata della malattia. Alla fine dell esperimento si possiedono i seguenti dati: Placebo: 6.5, 6.0, 8.5, 7.0, 6.5, 8.0, 7.5, 6.5, 7.5, 6.0, 8.5, 7.0 Vitamina C 5.5, 6.0, 7.0, 6.0, 7.5, 6.0, 7.5, 5.5, 7.0, 6.5 Si inseriscono i vettori in R: vitamina_c <- c(5.5, 6.0, 7.0, 6.0, 7.5, 6.0, 7.5, 5.5,7.0, 6.5) placebo <- c(6.5, 6.0, 8.5, 7.0, 6.5, 8.0, 7.5, 6.5, 7.5, 6.0, 8.5, 7.0) Si può concludere che l assunzione di 4 grammi di vitamina C al giorno abbia accorciato il decorso medio della malattia? A che livello di significatività? H 0 : μ vitamina C μ placebo Eseguiamo il test: supponendo che le varianze della durata della malattia nei due H 1 : μ vitamina C < μ placebo casi siano uguali.

31 Test t di student L ipotesi nulla viene accettata solo per livelli di significatività α< = p-value; l ipotesi nulla viene dunque rifiutata ad un livello di significatività del 5% quindi, a questo livello di significatività, i dati raccolti evidenziano un accorciamento del decorso dell influenza somministrando vitamina C.

32 Test χ 2 - test non parametrici Conosciamo già la forma di questo indice, perché lo abbiamo studiato come indice di connessione fra due caratteri in una distribuzione doppia. Ora vogliamo usarlo per verificare l ipotesi di indipendenza tra due distribuzioni χ 2 = n n 2 hi h i χ 2 (h 1)(i 1) n h. n.i 1~ I gradi di libertà sono dunque (h-1)(i-1) Questo test può essere eseguito su qualunque distribuzione doppia, anche quando i caratteri non sono quantitativi (da qui la definizione di non parametrico). In questo caso l ipotesi nulla rappresenta la dipendenza tra le distribuzioni.

33 Test χ 2 - test non parametrici Esempio: Si supponga di aver rilevato, su un campione di 36 giovani, la pressione arteriosa e la pratica sportiva. Calcoliamo la statistica test χ 2 = n = 36 0,15 + 0,34 + 0,47 + 0,12 1 = 2, Dalla tavola del χ 2 per 1=(2-1)(2-1) gdl e un livello di significatività del 5% otteniamo il valore 3,84 Dunque accettiamo l ipotesi nulla: nel campione considerato, tra ipertensione e pratica dello sport c è dipendenza Ipertensione si Ipertensione no Totale Sport si Sport no Totale

Inferenza statistica

Inferenza statistica Inferenza statistica Si tratta di un complesso di tecniche, basate sulla teoria della probabilità, che consentono di verificare se sia o no possibile trasferire i risultati ottenuti per un campione ad

Dettagli

Concetti principale della lezione precedente

Concetti principale della lezione precedente Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica Strumenti quantitativi per la gestione Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli

Dettagli

Distribuzione normale

Distribuzione normale Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una

Dettagli

Teorema del Limite Centrale

Teorema del Limite Centrale Teorema del Limite Centrale Teorema. Sia data una popolazione numerica infinita di media µ e deviazione standard σ da cui vengono estratti dei campioni casuali formati ciascuno da n individui, con n abbastanza

Dettagli

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti

Dettagli

Contenuto del capitolo

Contenuto del capitolo Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1 . Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci

Dettagli

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori. Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Test delle ipotesi statistiche

Test delle ipotesi statistiche indice di posizione indici di variabilità principali var statistiche verifica di ipotesi introduzione (come si costruisce un test) test parametrici e non parametrici regressione? Test delle ipotesi statistiche

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure relative a una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere

Dettagli

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA IRCBG 19027 Modulo Dal campione alla popolazione: l'inferenza e l'intervallo di confidenza IRCCS Burlo Garofolo Formazione, Aula A via dell Istria

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

assuma valori in un determinato intervallo è data dall integrale della sua densità ( = )=

assuma valori in un determinato intervallo è data dall integrale della sua densità ( = )= VARIABILI ALEATORIE CONTINUE Esistono parecchi fenomeni reali per la cui descrizione le variabili aleatorie discrete non sono adatte. Per esempio è necessaria una variabile aleatoria continua ovvero una

Dettagli

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30 INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30 Intervallo di confidenza: media 2 / 30 Supponiamo di considerare la media campionaria X e assumiamo che Intervallo di confidenza: media 2 / 30 Supponiamo

Dettagli

Cenni di statistica statistica

Cenni di statistica statistica Cenni di statistica La statistica è una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare fenomeno in condizioni di incertezza o non determinismo, ovvero di non completa

Dettagli

Test di ipotesi. Test

Test di ipotesi. Test Test di ipotesi Test E una metodologia statistica che consente di prendere una decisione. Esempio: Un supermercato riceve dal proprio fornitore l assicurazione che non più del 5% delle mele di tipo A dell

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Campionamento e stima di parametri

Campionamento e stima di parametri Sia X una variabile aleatoria associata a un dato esperimento. Ripetiamo l esperimento n volte, ottenendo una famiglia di valori sperimentali della v.a. X : X = (X 1, X 2,..., X n ) ogni X i é una v.a.

Dettagli

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016 Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano

Dettagli

Elementi di Psicometria (con laboratorio software 1)

Elementi di Psicometria (con laboratorio software 1) Elementi di Psicometria (con laboratorio software 1) 05-La verifica delle ipotesi con le medie dei campioni (v. 1.0, 15 aprile 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1 Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa

Dettagli

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte Cap.1: Probabilità 1. Esperimento aleatorio (definizione informale): è un esperimento che a priori può avere diversi esiti possibili

Dettagli

SOLUZIONI PROVA SCRITTA DI STATISTICA (cod. 4038, 5047, 371, 377) 8 settembre 2005

SOLUZIONI PROVA SCRITTA DI STATISTICA (cod. 4038, 5047, 371, 377) 8 settembre 2005 SOLUZIONI PROVA SCRITTA DI STATISTICA cod. 4038, 5047, 371, 377) 8 settembre 2005 MODALITÀ B APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE Esercizio 1. 7 punti) Su un collettivo di 13 nuclei

Dettagli

Esercizio 1. Durante un inchiesta su 500 studenti frequentanti i corsi di Algebra (A), Fisica (F) e Statistica è stato rilevato che:

Esercizio 1. Durante un inchiesta su 500 studenti frequentanti i corsi di Algebra (A), Fisica (F) e Statistica è stato rilevato che: Esercizio 1 Durante un inchiesta su 500 studenti frequentanti i corsi di Algebra (A), Fisica (F) e Statistica è stato rilevato che: A 329 F 186 S 295 AS 217 AF 83 FS 63 AFS 53 Determinare la partizione

Dettagli

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 7 1. Utilizzando le tavole della distribuzione

Dettagli

Il Test di Ipotesi Lezione 5

Il Test di Ipotesi Lezione 5 Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!

Dettagli

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una

Dettagli

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Tecniche di sondaggio

Tecniche di sondaggio SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Approssimazione normale della Poisson (TLC) In un determinato tratto di strada il numero di incidenti

Dettagli

APPUNTI DI STATISTICA INFERENZIALE. Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO

APPUNTI DI STATISTICA INFERENZIALE. Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO APPUNTI DI STATISTICA INFERENZIALE Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO PREREQUISITI VARIABILE ALEATORIA (QUANTITATIVA): è una funzione che associa un numero reale ad ogni

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

Statistica Applicata all edilizia: Stime e stimatori

Statistica Applicata all edilizia: Stime e stimatori Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica

Dettagli

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE S.S.I.S TOSCANA F.I.M. -II anno STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE PROBLEMA 1 Vogliamo valutare la percentuale p di donne fumatrici tra le donne in età fertile. Procediamo all estrazione

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

I modelli probabilistici

I modelli probabilistici e I modelli probabilistici Finora abbiamo visto che esistono modelli probabilistici che possiamo utilizzare per prevedere gli esiti di esperimenti aleatori. Naturalmente la previsione è di tipo probabilistico:

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

Introduzione alla statistica per la ricerca in sanità

Introduzione alla statistica per la ricerca in sanità Introduzione alla statistica per la ricerca in sanità Modulo La verifica delle ipotesi: il test statistico dott. Eugenio Traini eugenio.traini@burlo.trieste.it Verifica d Ipotesi - 1 Che cos è un ipotesi

Dettagli

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Lezione 1 - Mercoledì 27 Settembre 2017 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice con Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 29 Outline con 1 2 3 con 4 5 campioni appaiati 6 Indipendenza tra variabili () Statistica 2 /

Dettagli

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre R - Esercitazione 5 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 16 Dicembre 2016 Intervalli di confidenza (1) Sia X 1,..., X n un campione casuale estratto da un densità f (x, θ) nota

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007 Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 007 Primo esercizio Per una certa stampante S 1, la probabilità che un generico foglio

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 II Esonero - 10 Gennaio 2014 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

STIMA DELLA VARIANZA CAMPIONARIA

STIMA DELLA VARIANZA CAMPIONARIA STIMA DELLA VARIANZA CAMPIONARIA Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X i è x n = (x 1 +.. + x n )/n. Una stima puntuale della varianza σ 2 delle

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

Dato che i risultati ottenuti tramite campioni casuali ed esperimenti comparativi sono legati al caso, non possiamo essere certi che le nostre

Dato che i risultati ottenuti tramite campioni casuali ed esperimenti comparativi sono legati al caso, non possiamo essere certi che le nostre Campione Dato che i risultati ottenuti tramite campioni casuali ed esperimenti comparativi sono legati al caso, non possiamo essere certi che le nostre conclusioni siano corrette. Quello che possiamo fare

Dettagli

Matematica con elementi di Informatica

Matematica con elementi di Informatica Statistica descrittiva ed inferenziale Matematica con elementi di Informatica Tiziano Vargiolu Dipartimento di Matematica vargiolu@math.unipd.it Corso di Laurea Magistrale in Chimica e Tecnologie Farmaceutiche

Dettagli

Metodi Statistici per il Marketing. #05 Elementi di statistica inferenziale e di teoria dei campioni

Metodi Statistici per il Marketing. #05 Elementi di statistica inferenziale e di teoria dei campioni Corso di Metodi Statistici per il Marketing LUISS A.A. 2017-2018 #05 Elementi di statistica inferenziale e di teoria dei campioni 15 Marzo 2018 Alessio Guandalini (Docente: P. D Urso) #05 Elementi di statistica

Dettagli

Intervallo di confidenza.

Intervallo di confidenza. Intervallo di confidenza annarita.vestri@uniroma1.it campione inferenza popolazione Media Riportare sempre anche la deviazione standard Stima puntuale di Media, dev.standard, numerosità Qualche semplice

Dettagli

Test d Ipotesi Introduzione

Test d Ipotesi Introduzione Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Teorema del Limite Centrale

Teorema del Limite Centrale Teorema del Limite Centrale Problema. Determinare come la media campionaria x e la deviazione standard campionaria s misurano la media µ e la deviazione standard σ della popolazione. È data una popolazione

Dettagli

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,

Dettagli

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Matematica II: Calcolo delle Probabilità e Statistica Matematica Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie

Dettagli

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Esercizi possibili di probabilità e statistica Notazioni: U(a, b) è la distribuzione di probabilità uniforma nell intervallo (a,

Dettagli

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003 Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Ipotesi statistica parametrica non parametrica una qualunque affermazione che specifica completamente o parzialmente la distribuzione di probabilità di una v.c. X. semplice: se la

Dettagli

Corso di Statistica Esercitazione 1.8

Corso di Statistica Esercitazione 1.8 Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli

Dettagli

Statistica 2 parte ARGOMENTI

Statistica 2 parte ARGOMENTI Statistica 2 parte ARGOMENTI Vettori gaussiani Matrice di covarianza e sua positività Marginali di un vettore normale Trasformazioni affini di vettori normali Indipendenza delle componenti scorrelate di

Dettagli

OD TEST DI IPOTESI 50

OD TEST DI IPOTESI 50 TEST DI IPOTESI 50 TEST D'IPOTESI È possibile ipotizzare che la durata media del ricovero ospedaliero al Policlinico San Matteo, negli ultimi 3 anni, è stata di 3 giorni? È possibile ipotizzare che un

Dettagli

Parametri statistici

Parametri statistici SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice

Dettagli

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali A.A 2009-2010 Esercitazione E Scopo dell esercitazione Applicazioni del teorema del limite centrale. Rappresentazione delle incertezze

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 014/015 II Esonero - 15 Gennaio 015 1 3 4 5 6 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU) STATISTICA a.a. 2001-2002 (3 CFU) Federico M. Stefanini Dipartimento di Statistica G.Parenti viale Morgagni 59, 50134 Firenze, tel. 055-4237211 PARTE 5-3.12.2001 e.mail: stefanin@ds.unifi.it http://www.ds.unifi.it/ricerca/pagperson/docenti/stefanini.htm

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Intervalli di confidenza Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

RICHIAMI DI CALCOLO DELLE PROBABILITÀ UNIVERSITA DEL SALENTO INGEGNERIA CIVILE RICHIAMI DI CALCOLO DELLE PROBABILITÀ ing. Marianovella LEONE INTRODUZIONE Per misurare la sicurezza di una struttura, ovvero la sua affidabilità, esistono due

Dettagli

Capitolo 8. Probabilità: concetti di base

Capitolo 8. Probabilità: concetti di base 1 Capitolo 8 Probabilità: concetti di base Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl 2 Concetti primitivi di

Dettagli

Il metodo statistico: prova dell ipotesi, intervallo di confidenza

Il metodo statistico: prova dell ipotesi, intervallo di confidenza Il metodo statistico: prova dell ipotesi, intervallo di confidenza Tratto con modifiche da : Buzzetti, Mastroiacovo. Le prove di efficacia in pediatria. 2000, UTET 1 Il problema Si supponga di voler verificare

Dettagli

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa. Statistica Matematica A Esercitazione # 6 DUE MEDIE CON VARIANZE NOTE: Esercizio # Le ditte A e B producono sfere luminose. Una volta attivata la reazione chimica che rende luminosa una di queste sfere,

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:

Dettagli

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione La verifica delle ipotesi In molte circostanze il ricercatore si trova a dover decidere quale, tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento di Economia

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. Esercizio 1 Un chimico che lavora per una fabbrica di batterie, sta cercando una batteria

Dettagli