Appunti: Teoria Dei Test

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Appunti: Teoria Dei Test"

Transcript

1 Appunti: Teoria Dei Test Fulvio De Santis, Luca Tardella e Isabella Verdinelli Corsi di Laurea A + E + D + G + R 1. Introduzione. Il test d ipotesi è un area dell inferenza statistica in cui si valuta una congettura (ipotesi) riguardo un parametro θ della popolazione, sulla base di dati campionari. La congettura che si vuole valutare si chiama ipotesi nulla e viene indicata con H 0. I dati del campione sono raccolti ed analizzati per determinare l evidenza contro l ipotesi nulla. Se l evidenza solleva dubbi sulla plausibilità dell ipotesi nulla, questa viene rifiutata in favore dell ipotesi alternativa. L ipotesi alternativa è indicata con H 1 (o con H a ) e rappresenta quello che si pensa possa essere vero se l ipotesi nulla è falsa. L Inferenza Statistica considera due metodi principali per affrontare il problema: l approccio basato sulle regioni di accettazione e di rifiuto, trattato nel paragrafo 5, e l approccio basato sul valore-p, esaminato nei paragrafi 2, 3 e 4 qui di seguito. Si vedrà che i due metodi sono equivalenti ed utilizzano le distribuzione campionarie di appropriate Statistiche Test, quando si assume vera l ipotesi nulla (H 0 ) individuata dal problema in esame. 2. Concetti di base per il metodo del valore-p. Il valore-p è largamente usato nelle procedure di test d ipotesi, anche se il suo utilizzo è oggetto di critiche, dovute principalmente alle confusioni che possono sorgere nella sua interpretazione. In modo non rigoroso, la motivazione del metodo può essere giustificata attraverso la seguente affermazione: Se, sotto una data assunzione, la probabilità dell evento osservato, (o di un evento più estremo), è molto piccola, allora è plausibile che l assunzione fatta non sia corretta. L idea di base nell attivare una procedura di test d ipotesi è quella di raccogliere ed analizzare un campione, per poter distinguere tra risultati che si verificano facilmente e risultati che sono molto improbabili Esempio 1. Lancio di una Moneta. Affermazione 1: La moneta è bilanciata (H 0 ) Affermazione 2: La moneta favorisce testa (H 1 ) Si consideri un campione di 100 lanci della moneta in questione e si supponga di osservare il risultato: 96 teste e 4 croci. 1

2 Se L Affermazione 1 (H 0 ) fosse vera, sarebbe plausibile aver ottenuto questi dati? Se L Affermazione 2 (H 1 ) fosse vera, sarebbe plausibile aver ottenuto questi dati? Dopo aver osservato i dati vogliamo trarre una conclusione riguardo la moneta lanciata. Il parametro della popolazione è π = P(ottenere testa). Le ipotesi che consideriamo sono: H 0 : π = 1/2 H 0 : π > 1/2 Che conclusione si può trarre una volta visti i dati? H 0 oppure H 1? Se la moneta fosse bilanciata sarebbe plausibile ottenere il risultato: 96 teste su 100 lanci? Ovviamente No Conclusione: La moneta non è bilanciata perché i dati non sono compatibili con l ipotesi H 0 : π = 1/2 (moneta bilanciata). Queste considerazioni intuitive devono essere portate avanti attraverso una rigorosa procedura statistica. Innanzitutto è necessario scegliere una statistica test (in questo caso la proporzione di teste nel campione). Poi bisogna valutare la probabilità di osservare lo specifico valore ottenuto della statistica od un valore più estremo, nel caso in cui H 0 sia vera (Ammettendo, cioè, che π sia proprio uguale ad 1/2): P ( Ottenere 96 [o più] teste in 100 lanci ; la moneta è bilanciata ). Indicando con π oss la proporzione di teste osservate nel campione e con Π MLE lo stimatore di massima verosimiglianza per π ( Π MLE = 1 n Xi ), la precedente probabilità si può scrivere come: P ( ΠMLE π oss ; Ammettendo H 0 vera ) = P ( ΠMLE 0.96 ; H 0 vera ) = P ( ΠMLE 0.96 ; π = 1/2 ) ( 1 n ) = P X i 0.96 ; π = 1/2 = n i=1 ( 100 ) 100 ( )( ) nx ( ) 100 nx P X i 96 ; π = 1/2 = = nx 2 2 i=1 nx=96 E il valore trovato è la corretta valutazione probabilistica che giustifica la conclusione tratta precedentemente in modo intuitivo. Condurre un test di ipotesi in statistica significa valutare probabilisticamente se, partendo dal campione osservato, sia sensato accettare o rifiutare una congettura riguardante un parametro della popolazione. Esempio 2. Cereali. Il peso dichiarato su una scatola di cereali è di 420 grammi. Questo valore è un peso di riferimento che il produttore certifica come peso dei cereali contenuti in ogni scatola messa in commercio. Dunque 420 è il peso medio (netto) di tutte la scatole di cereali di questa marca. È noto che il processo di produzione ha una certa variabilità, e si assume che 2

3 il peso dei cereali in ogni scatola, estratta in un campione casuale di scatole, sia una variabile aleatoria normale di media θ e di varianza considerata, per semplicità, nota, σ 2 = 25. Si assume quindi che la deviazione standard nella determinazione del peso alla produzione sia σ = 5 grammi. Con una procedura casuale, si sceglie un campione di n = 9 scatole di cereali x oss = (x 1, x 2,, x 9 ). In base al particolare campione osservato, vogliamo valutare se la dichiarazione del produttore θ = 420 sia vera o falsa. Vogliamo quindi verificare se sia vera l ipotesi nulla: H 0 : θ = 420 oppure se l ipotesi nulla è falsa ed il peso medio alla produzione è più basso del dichiarato, ed è vera l ipotesi alternativa: H 1 : θ < 420. La notazione statistica è: H 0 : θ = θ 0 contro H 1 : θ < θ 0 dove θ 0 = 420. Per condurre il test d ipotesi e scegliere tra H 0 ed H 1 è necessario: basare l analisi sul campione osservato; utilizzare la distribuzione campionaria dello stimatore θ di θ, quando si assume H 0 vera; valutare la probabilità che lo stimatore θ assuma un valore uguale o più estremo della stima di θ ottenuta con x oss. In questo esempio lo stimatore di θ è θmle = X. Consideriamo due diversi valori possibili di x, ottenuti da due diversi campioni osservati. (a) Supponiamo che si sia osservato x = 416 grammi: Se il peso alla produzione fosse effettivamente 420, si deve valutare se sia facile (molto probabile) o difficile (poco probabile) che il peso medio di 9 scatole sia uguale a 416, e che quindi la distanza tra x e θ 0 (da standardizzare con lo scarto quadratico medio) sia pari a = 4σ X grammi. La procedura statistica richiede di calcolare la probabilità dell evento: P ( X 416 ; Ammettendo H 0 vera ) ( X θ0 = P ( X θ0 P σ/ n < 416 θ ) ( 0 σ/ n ; θ 0 = 420 = P Z < P ( Z < 12/5 ) = pnorm( 12/5) = σ X < 416 θ 0 σ X ; θ 0 = /3 ) = ) = (1) dove Z N(0, 1): Questa probabilità è piuttosto bassa e suggerisce di rifiutare H 0. 3

4 (b) Supponiamo, invece, che si sia osservato x = 419 grammi: Se il peso alla produzione fosse effettivamente 420 si deve valutare se sia facile (molto probabile) o difficile (poco probabile) che il peso medio di 9 scatole sia uguale a 419. Calcoliamo la probabilità di osservare questo valore x = 419 o un valore più piccolo (più estremo): P ( X 419 ; Ammettendo H 0 vera ) ( X θ0 = P ( X θ0 P σ/ n < 419 θ ) ( 0 σ/ n ; θ 0 = 420 = P Z < P ( Z < 3/5 ) = pnorm( 3/5) = σ X < 419 θ 0 σ X ; θ 0 = /3 ) = ) = (2) Questa probabilità non è elevata, ma è decisamente maggiore della probabilità calcolata supponendo x = 416. Potrebbe essere opportuno non rifiutare H 0. L affermazione a pagina 1 suggerisce di rifiutare H 0 nel caso del campione osservato con media x = 416 e di conservare H 0 nel caso del campione osservato con media x = 419. Chiaramente è necessario disporre di un valore di riferimento che permetta di valutare le probabilità calcolate come alte o basse. 3. Livello di significatività e valore-p. Il valore di riferimento per giudicare la dimensione delle probabilità che si valutano in una procedura di test d ipotesi è una probabilità α, detta livello di significatività che si utilizza come quantità di confronto. Il livello di significatività viene scelto pari ad un valore abbastanza piccolo. Valori tipici sono α = 0.05 oppure α = I valori delle probabilità calcolate in (1) e in (2), devono quindi essere dichiarati grandi o piccoli rispetto ad α. La procedura di calcolo per valutare (1) o (2) è la stessa, cambia solamente il campione osservato nei due casi, e quindi cambia il valore della statistica x, media del campione. La probabilità calcolata nelle due formule è la probabilità che la variabile aleatoria X, media campionaria, assuma un valore uguale o più piccolo del valore osservato di x, ammettendo che l ipotesi nulla sia vera. In questo esempio, quando la media del campione è x = 416, la probabiilità dell evento E = X < x H 0 è vera} vale Se invece il la media del campione è x = 419, lo stesso evento E = X < x H 0 è vera} ha probabilità Supponiamo di aver fissato α = 0.05: se nel campione osservato la media x è = 416, la probabilità calcolata è < α; se invece nel campione osservato x = 419, la probabilità calcolata è > α. In questa procedura per condurre un test ipotesi, si devono calcolare i valori delle probabilità di eventi analoghi all evento E. Le probabilità in questione sono chiamate valori-p. Il valore-p è una probabilità che misura l evidenza dei dati contro l ipotesi nulla H 0. Valori-p piccoli (minori di α) indicano che l evidenza proveniente dai dati è contraria ad H 0. Si dice che c è evidenza statisticamente significativa contraria ad H 0. In questo caso l ipotesi nulla H 0 viene rifiutata. 4

5 Valori-p grandi (maggiori di α) indicano che l evidenza dei dati non è contraria ad H 0. Si dice che c è evidenza statisticamente significativa a favore di H 0. L ipotesi nulla viene quindi conservata o non rifiutata. Il livello di significatività α è una probabilità di riferimento che permette di decidere se il valore-p è grande o piccolo. La figura 1, qui di seguito, illustra l Esempio 2, nel caso x = 416 dove la valutazione della probabilità in (1) porta a rifiutare H 0. densita' della media campionaria densita' della normale stanzardizz x.oss x* theta0=420 z.oss. z* 0 Peso delle scatole di cereali Peso standardizzato scatole cereali Fig. 1 Sinistra: Distribuzione campionaria di X ammettendo H 0 vera}. Si è osservato il valore x = 416, indicato nel grafico come x.oss. Destra: Distribuzione normale standardizzata. Il valore z.oss è x.oss θ ottenuto standardizzando x.oss: 0 σ/ = = 2.4. n 5/3 A sinistra nella Fig 1 è riportato il grafico della distribuzione campionaria di X, sotto l ipotesi nulla, cioè assumendo che θ 0 sia vera e quindi che (X ; θ = θ 0 ) N(θ 0, 25/n), o, più esplicitamente (X ; θ = 420) N(420, 25/n). Nel calcolo in (1), infatti, si è utilizzata la distribuzione campionaria dello stimatore θ = X condizionata al fatto che H 0 è vera}, X N(θ 0, 25/n), perchè il processo di produzione che pesa ed inscatola i cereali segue una distribuzione normale con X N(θ, 25). I tre triangoli rossi in Fig 1 (sinistra) indicano, rispettivamente, il valore osservato della media, x = 416 (x.oss), il valore (indicato con x ) del quantile della distribuzione campionaria di X che lascia alla sua sinistra una probabilità pari ad α = 0.05: x = ed il valore della media della distribuzione campionaria di X, condizionata all ipotesi H 0 è vera}. L area in verde al disotto della densità normale è proprio il valore-p, cioè la probabilità: P ( X 416 ; θ = 420 ), che viene calcolata formalmente nella (1) standardizzando la distribuzione normale di X. In questo modo, se necessario, si possono utilizzare le tavole della normale standardizzata Z. In pratica è spesso più immediato usufruire del comando R: dnorm(x.oss,theta0, sigma/sqrt(n)) = dnorm(416, 420, 5/3) =

6 Il grafico a destra in Fig 1 è la distribuzione della variabile normale standardizzata Z. Il valore z.oss. = x θ 0 σ/ n = 2.4 è il valore standardizzato (sotto l ipotesi H 0) corrispondente ad x.oss. Il valore-p, per la normale standardizzata è l area in verde nel grafico a destra, che è chiaramente identica all area in verde nel grafico a sinistra. Il valore α = 0.05 nei due grafici di Fig 1 è dato dall unione delle due aree in verde ed in rosso. Il valore-p (in verde) è, evidentemente, più piccolo di α. La figura 2, qui sotto, illustra l Esempio 2, nel caso x = 419 dove la valutazione della probabilità in (2) porta a non rifiutare (o conservare) H 0. densita' della media campionaria densita' della normale stanzardizz x* Peso delle scatole di cereali z* z.oss 0 Peso standardizzato scatole cereali Fig. 2 Sinistra: Distribuzione campionaria di X condizionata all evento H 0 è vera}. Si è osservato il valore x = 419. Destra: Distribuzione normale standardizzata. Il valore z.oss= = /3 Il calcolo della probabilità (2) per l Esempio 2 è simile al precedente. In figura 2, analogamente a figura 1, sono riportati i grafici della distribuzione campionaria di X, sotto l ipotesi nulla, e della distribuzione della variabile aleatoria normale standardizzata. In questo caso la media del campione x è 419 grammi ed il valore-p, calcolato in (2), è: P ( X 419 ; θ = 420 ) = Nei due grafici, il valore-p è l area a sinistra di x = 419 o di z.oss = = 3/5 ed è 5/3 rappresentato dall unione dell area verde e di quella rossa. L area rossa, a sinistra di x = qnorm(0.05,θ 0, σ/ n) = e di z = qnorm(0.05) = è α = In questo caso il valore-p è maggiore di α. 6

7 Alcuni Commenti sull uso del valore-p Nel confronto del valore-p con il livello di significatività α si possono ottenere due risultati: (a) l ipotesi nulla è rifiutata al livello scelto di α (b) l ipotesi nulla non può essere rifiutata al livello scelto di α (e viene quindi conservata). Non si può semplicemente accettare H 0 se il valore-p > α. Per l accettazione di H 0 è necessario accumulare ulteriore evidenza e considerare altri test come, per esempio, test sulla bontà di adattamento Il valore-p non misura la probabilità che H 0 sia vera. Ma misura la probabilità che la variabile aleatoria X assuma un valore uguale o più estremo di quello osservato. (e quindi misura la probabilità che l ipotesi nulla possa spiegare il risultato ottenuto con x oss ). Esercizi 1. Con riferimento all Esempio 2. Si ritiene possibile che la bilancia utilizzata nella produzione dei cereali sia stata mal tarata, dopo l ultima pulizia dei macchinari. Si estrae un campione casuale di 9 scatole di cereali. Il peso medio nel campione è: x = 423 grammi. Si vuole testare il seguente sistema di ipotesi: H 0 : θ = θ 0 = 420 contro H 1 : θ > θ 0 = 420. Calcolare il valore-p, cioè la probabilità che, se l ipotesi nulla è vera, la variabile aleatoria X assuma valore uguale o più grande di x. Effettuare il test d ipotesi fissando α = Sia noto che in Germania la proporzione media di giovani tra i 12 ed i 18 anni che utilizza regolarmente un computer si distribuisce normalmente con media θ = 3/4 = 0.75 e varianza σ 2 = In un campione casuale di n = 144 ragazzi e ragazze italiani tra i 12 ed i 18 anni si è rilevato che la media campionaria è pari a x = Condurre un test d ipotesi a livello α = 0.05 per verificare l affermazione che in Italia la proporzione di giovani tra i 12 e i 18 anni che usano il computer con regolarità è minore di quella tedesca. 4. Procedura di base per condurre un test d ipotesi Facendo riferimento all Esercizio 1 stabiliamo ora, con maggior precisione, quali sono i punti essenziali per condurre un Test d ipotesi o Test di Significatività. 7

8 1. Fissare le ipotesi: Ipotesi Nulla Ipotesi Alternativa H 0 : θ = 420 (θ 0 ) (Parametro d interesse = valore) H 1 : θ > 420 (Parametro d interesse > di valore) 2. Raccogliere i dati e calcolare il valore osservato della statistica test: Nell Esercizio 1, x = 423, n = 9. Si usa la media campionaria come statistica test (è una statistica sufficiente per θ) e la sua distribuzione campionaria. Per misurare la distanza tra i dati e l ipotesi nulla si standardizza X usando la sua deviazione standard. La variabile aleatoria che si ottiene è la quantità pivotale Q(X, θ 0 ) calcolata in θ = θ 0, la cui distribuzione non dipende dal parametro. Il valore osservato della quantità pivotale z.oss = q(x, θ 0 ) = è: z.oss = x θ 0 σ/ n = / 9 = Calcolare il valore-p : Il valore-p si calcola utilizzando la distribuzione campionaria della quantità pivotale Q(X, θ 0 ) valutata in θ 0. Si calcola cioè la probabilità di ottenere lo specifico valore osservato per la statistica test (z.oss = 1.8) oppure un valore più estremo, ammettendo che H 0 sia vera}. Se è vera H 0 : θ = θ 0, la distribuzione campionaria della media X è: ( ) σ X N θ 0, e la distribuzione di Z = Q(X, θ 0 ) = (X θ 0) n σ/ n N(0, 1). In questo caso l ipotesi alternativa è H 1 : θ > θ 0. Si calcola quindi la probabilità che la v.a. media campionaria sia uguale o maggiore del valore osservato nel campione, x = 423. valore-p = P ( X x ; Ammettendo H 0 vera ) = P ( X θ0 σ/ n x θ ) 0 σ/ = n ( ) X θ0 P σ/ n z.oss = P (Z 1.8) = 1 pnorm(1.8) = = Il valore-p risulta minore del livello di significatività scelto, α = Trarre Conclusioni. Relativamente al livello α scelto, i dati forniscono evidenza contro H 0, a favore dell ipotesi alternativa H 1. C è evidenza statisticamente significativa contraria ad H 0 a livello α = Si conclude che La bilancia utilizzata nella produzione dei cereali è mal tarata con un livello di significatività pari a

9 5. Regione di accettazione e regione di rifiuto. Un altro metodo per condurre un test ipotesi è quello di definire due regioni nello spazio dei campioni o, più semplicemente, nello spazio in cui varia la statistica test. Partendo dal livello di significatività fissato, si individuano una Regione di Rifiuto (RR) ed una Regione di Accettazione (RA). L ipotesi H 0 verrà rifiutata o conservata a livello di significatività α, controllando se il valore osservato della statistica test ottenuto con x oss appartiene alla regione di rifiuto, oppure a quella di accettazione. In figura 3 sono evidenziate la regione di accettazione (in blu) e di rifiuto (in rosso) per l Esempio 2 e per l Esercizio 1. densita' della media campionaria x* Esempio 2 densita' della media campionaria Esercizio 1 x* 423 Peso delle scatole di cereali Peso delle scatole di cereali Fig. 3 Sinistra: Regione di accettazione (in blu) e regione di rifiuto (in rosso) per il test d ipotesi: H 0 : θ = θ 0 = 420 H 1 : θ < θ 0 = 420 e nel campione si è osservato x = 416. Destra: Regione di accettazione (in blu) e regione di rifiuto (in rosso) per il test d ipotesi: H 0 : θ = θ 0 = 420 H 1 : θ > θ 0 = 420 e nel campione si è osservato nel campione x = 423. Nei due grafici il valore osservato di x cade nella regione di rifiuto. Le due regioni sono legate strettamente al valore scelto per α: La Regione di Rifiuto è l intervallo dei valori della statistica test che determinano il livello di significatività α. La Regione di Accettazione è l intervallo complementare alla regione di rifiuto. Dai grafici di figura 3 si vede che valori di x maggiori di x nel grafico a sinistra o minori di x nel grafico a destra appartengono alla regione di accettazione; valori di x minori di x nel grafico a sinistra o maggiori di x nel grafico a destra appartengono alla regione di rifiuto. Dal momento che il valore di x.bar = x (416 nell esempio 2 e 423 nell esercizio 1) è il valore del quantile che identifica il valore-p, questa procedura è equivalente a quella illustrata nei paragrafi precedenti. Alternativamente, le regioni di accettazione e di rifiuto possono essere identificate anche utilizzando la variabile aleatoria normale standardizzata Z, ovvero la quantità pivotale calcolata in θ 0 ed il valore osservato della quantità pivotale q(x oss, θ 0 ) = z.oss = x θ 0 σ/ n. 9

10 Esempio 3. Spesa Alimentare. Consideriamo, come in precedenza, un modello normale con varianza nota. Per un campione casuale di n = 100 famiglie con non più di quattro componenti, si consideri la variabile aleatoria X = spesa media alimentare per settimana. Il campione viene esaminato per verificare se la spesa media per alimenti sia diversa da θ 0 = 600 Euro, ad un livello di significatività α = 0.05 e si assume che il valore dello scarto quadratico medio sia σ 0 = 30 Euro. Supponiamo che la media del campione x oss sia x = Il sistema di ipotesi da porre a confronto è bilaterale, e cioè: Ipotesi nulla H 0 : θ = θ 0 = 600 Ipotesi alternativa: H 1 : θ θ 0 = 600. (3) La distribuzione campionaria della statistica test θ MLE = X è N(θ, σ 2 0/n). Dato che il sistema di ipotesi in (3) è bilaterale, appare ragionevole scegliere come regione di rifiuto un insieme di valori di X che siano lontani da θ 0. Quindi la regione di rifiuto sarà del tipo: RR = X X n : X θ 0 > c } Il valore di c > 0 viene determinato richiedendo che α = P RR } = P X θ 0 > c } X θ 0 = P σ 0 / n > P (Z < k) (Z > k) } = k ϕ(z)dz + k } c σ 0 / = P Z > k } = n ϕ(z)dz k = z 1 α/2 dove ϕ( ) è la funzione di densità della normale standardizzata. Da (4) si ottengono la regione di rifiuto e quella di accettazione, e si ricava che c = z 1 α/2 σ 0 / n. } RR = X X n : X θ 0 σ 0 / n > z 1 α/2 ( X < z 1 α/2 σ 0 / ) ( n + θ 0 X > z1 α/2 σ 0 / )} n + θ 0 } RA = X X n : X θ 0 σ 0 / n z 1 α/2 z 1 α/2 σ 0 / n + θ 0 X z 1 α/2 σ 0 / } n + θ 0. Nell esempio RR = ( X < 1.96 (3) ) ( X > 1.96 (3) )} = ( X < ) ( X > ) } e dato che x = l ipotesi nulla viene conservata. Nei due grafici della figura 4 sono rappresentate la regione di rifiuto e quella di accettazione, nel caso dell ipotesi bilaterale (3) e nel caso in cui, invece per lo stesso livello α = 0.05 fosse stato deciso di portare aventi un test unilaterale del tipo: H 0 : θ = θ 0 = 600 contro H 1 : θ > θ 0 = 600, (5) con la media del campione osservato x oss ancora uguale a Come visto in precedenza, la regione di rifiuto per l ipotesi unilaterale (5) diventa: RR = X > z 1 α σ 0 / n + θ 0 } = X > 1.64 (3) } = X > } E H 0 sarebbe rifiiutata a livello 0.05 in favore di H 1 : La spesa alimentare settimanale per famiglia è maggiore di 600 Euro. (4) 10

11 In figura 4 sono rappresentate le regioni di accettazione e di rifiuto dell esempio 3 per i due sistemi di ipotesi bilaterali e unilaterali fissate nelle equazioni (3) e (5). Il valore x.o corrisponde al valore osservato della media del campione x = L ipotesi H 0 è conservata nel caso (3) e rifiutata nel caso (5). densita' della media campionaria Esempio x.o Media campionaria: Spesa media settimanale per famiglia densita' della media campionaria x.o Media campionaria: Spesa media settimanale per famiglia Fig. 4 In Alto: Regioni di accettazione di rifiuto (rosso) per il test d ipotesi bilaterale in (3). In Basso: Regioni di accettazione e di rifiuto per il test di ipotesi unilaterale in (5) Per il sistema di ipotesi in (3) l area α = 0.05 che determina la regione di accettazione è divisa a metà (α/2) tra le due code della distribuzione di X. Invece per il sistema di ipotesi in (5) l area α = 0.05 interessa solo la coda destra. La somiglianza tra un test d ipotesi bilaterale e la costruzione di un intervallo di confidenza è evidente dalla figura 4 in alto. L intervallo che rappresenta l area di accettazione corrisponde di fatto ad un intervallo di confidenza per θ a livello 1 α = Ricordiamo che il valore-p è la probabilità che la variabile aleatoria (in questo caso la quantità pivotale Z ) assuma valore uguale o più estremo di quello osservato, ammettendo H 0 vera} (pag. 4). Allora il valore-p nel caso di ipotesi bilaterale, si calcola con la distribuzione della quantità pivotale e si valuta la probabilità che Z sia maggiore o uguale al valore pivotale osservato z.o = x θ 0 σ 0 / n = ( )/3 = 1.83 X θ 0 valore-p = P σ 0 / n x θ 0 σ 0 / n }= P } z.o Z z.o = ϕ(z)d(z) + = pnorm( z.o) + 1 pnorm(z.o) = 2 ( 1 pnorm(1.83) ) = > α. z.o ϕ(z)d(z) 11

12 7. Errori di I e di II specie. Ogni volta che si prende una decisione in una procedura statistica di test d ipotesi si possono commettere due tipi di errore, che vengono indicati come errori di I e di II specie. Errore di Prima Specie: consiste nel rifiutare l ipotesi nulla quando, in realtà, è vera. (x oss RR, ma H o è vera). Errore di Seconda Specie: consiste nell accettare l ipotesi nulla che in realtà è falsa. (x oss RA, ma H 1 è vera). Questo è lo schema degli errori che si possono commettere in una procedura statistica di test d ipotesi: Ipotesi Vera H 0 H 1 Ipotesi H 0 Err. I specie Scelta H 1 Err. II specie Questi errori sono sempre possibili. L ideale sarebbe poter minimizzare le rispettive probabilità di commetterli. La procedura vista, però, permette solo di determinare RA e RR utilizzando il livello α scelto. Dato che per definizione α = PRR ; H 0 vera}, allora la probabilità dell errore di I specie è data proprio da α. La probabilità dell errore di II specie viene indicata con β. Si definiscono le seguenti probabilità: α = P x oss RR ; H 0 vera } = P Errore I specie } = Livello del test β = P x oss RA ; H 1 vera } = P Errore II specie } γ = 1 β = P x oss RR ; H 1 vera } = 1 P Errore II specie } = Potenza del test Il test migliore che si può condurre è quello che ha un livello basso ed una poternza alta, così da avere basse le probabilità di commettere un errore di prima o di seconda specie. Generalizzando quanto visto fino qui, i sistemi di ipotesi da porre a verifica statistica possono essere specificati introducendo una partizione dello spazio dei parametri Θ. Si considerano, cioè, due sottoinsiemi dello spazio dei parametri Θ 0 e Θ 1 tali che: θ 0 Θ 1 = Θ e che θ 0 Θ 1 =. Un sistema di ipotesi in generale si scrive come: Ipotesi Nulla. H 0 : θ Θ 0 Contro Ipotesi Alternativa. H 1 : θ Θ 1 Si parla di ipotesi semplici o puntuali se Θ 0 = θ 0 e Θ 1 = θ 1 ed il test riguarda due singoli valori possibili per il parametro: H 0 : θ = θ 0 H 1 : θ = θ 1. 12

13 Si parla di ipotesi composte quando Θ 0 e Θ 1 sono insiemi di più punti. composte si hanno: H 0 : θ > θ 0 H 0 : θ < θ 0 Ipotesi composte unilaterali: e H 1 : θ θ 0 Ipotesi unilaterali: semplice contro composta: Ipotesi bilaterali: semplice contro composta: H 1 : θ θ 0 H 0 : θ = θ 0 H 1 : θ θ 0 H 0 : θ = θ 0 H 1 : θ θ 0. e Tra le ipotesi H 0 : θ = θ 0 H 1 : θ θ 0 densita' theta0 x* theta1 Media campionaria Fig. 5 Test di ipotesi semplici. L area in verde è β quella in rosso è α. La potenza del test è rappresentata dall area sottostante la curva verde a destra di x. Nel caso di un test di ipotesi semplici, sia β che la potenza del test dipendono solamente dal valore fissato per α, in tutti gli altri casi sono funzioni dei valori di θ Θ 1. In generale, allora, è necessario determinare procedure di test d ipotesi che permettano di ottenere valori bassi sia della probabilità α dell errore di I specie, che della probabilità β dell errore di II specie. Il grafico in figura 5 mostra α (area in rosso) e β (area in verde) per un caso di un sistema di test di ipotesi semplici per scegliere tra H 0 : θ = θ 0 contro H 1 : θ = θ 1 dove θ è la media di una variabile aleatoria normale con varianza nota. Il test statistico deve scegliere tra l ipotesi nulla che il campione osservato x oss provenga da X N(θ 0, σ 2 0) o l ipotesi alternativa che provenga da X N(θ 1, σ 2 1) con θ 0 < θ 1 ed entrambe le varianze note. Chiaramente se α fosse stato scelto più piccolo del valore 0.05, fissato in figura 5 il valore x sarebbe spostato verso destra aumentando il valore di β e diminuendo la potenza del test. 13

14 I grafici in figura 6 mostrano la probabilità dell errore di seconda specie e la potenza del test in funzione del valore di θ Θ 1, considerando, come nel caso precedente, un sistema di ipotesi unilaterali semplice contro composta: Θ 0 = θ 0 e Θ 1 = θ > θ 0 }, dove θ è la media di una distribuzione normale con varianza nota: H 0 : θ = θ 0 contro H 1 : θ > θ 0 densita' θ 0 θ v.a. Media Campionaria Beta densita' θ 0 θ v.a. Media Campionaria Potenza Fig. 6. Test di ipotesi unilaterali, semplice contro composta. Funzioni di densità di X. La funzione rossa rappresenta il caso H 0 vera, θ = θ 0. Le altre cinque funzioni colorate rappresentano cinque possibilità per H 1 vera e θ Θ 1 } θ > θ 0 }. Il grafico in alto mostra, in rosso, l area corrispondente ad α e in viola, verde e giallo le aree corrispondenti a β(θ), dove θ è la media delle tre rispettive distribuzioni. Analogamente, il grafico in basso mostra α e le aree corrispondenti alla potenza del test 1 β(θ), dove θ è la media delle due distribuzioni in viola e in giallo. Dalla figura si deduce chiaramente che per α fissato sia la probabilità dell errore di seconda specie, che la potenza del test sono funzioni del valore assunto da θ Θ 1. 14

15 8. Funzione di Potenza di un Test. Si consideri un test con regione di rifiuto RR per un sistema di ipotesi composte, che utilizza una partizione dello spazio dei parametri, per cui: Θ = Θ 0 Θ 1 e Θ 0 Θ 1 = Definizione 4. Funzione di Potenza. si definisce funzione di potenza del test la probabilità, dipendente da θ Θ: γ(θ) = 1 β(θ) = PX RR ; θ Θ}; (6) si definisce dimensione del test la probabilità α = sup θ Θ 0 1 β(θ)} = sup θ Θ 0 γ(θ); si dice che un test ha livello α se la sua dimensione α è minore od uguale ad α. Quindi un test di dimensione α = 0.01 può essere condotto a livello α = 0.05, ma non a livello α = Il grafico in basso nella figura 6 mostra che la dimensione di quel test è α = 1 β(θ 0 ), e dato che in quel caso l ipotesi nulla è semplice (Θ 0 = θ 0 ) si ha che il livello del test è anche uguale alla sua dimensione (α = α). Se invece anche H 0 fosse un ipotesi composta, e Θ 0 fosse, per esempio, un insieme di valori minori o uguali di a θ 0, allora l ipotesi nulla sarebbe rappresentata con più di una curva rossa e l area in rosso sarebbe più grande o più piccole a seconda di quale valore di θ 0 Θ 0 si considera. La minima area in rosso rappresenterebbe la dimensione del test ed i test che si possono condurre dovranno avere livello α α La funzione di potenza di un test può essere valutata analiticamente per sistemi di ipotesi composte unilaterali o bilaterali. La forma analitica della funzione di potenza dipende dalla funzione di ripartizione della statistica test o della corrispondente quantità pivotale. Per illustrazione, consideriamo ancora il caso di un test d ipotesi composte per la media di un modello normale con varianza nota, σ 2. Per questo modello si consideri il seguente sistema di ipotesi: H 0 : Θ 0 θ 0 contro H 1 : Θ 1 > θ 0 (7) Come visto in precedenza, X è la statistica test e la regione di rifiuto di livello α è data da: RR = X X n : X θ } 0 σ/ n > z 1 α. Dalla (6) la funzione di potenza del test è quindi: γ(θ) = 1 β(θ) = P X RR ; θ Θ } = PX > σ/ n z 1 α + θ 0 ; θ Θ } = P X > σ/ } X θ n z 1 α + θ 0 = P σ/ n > z 1 α + θ 0 θ σ/ n ( θ0 θ = 1 Φ σ/ n + z 1 α } = P Zz 1 α + θ } 0 θ σ/ = n ) = 1 pnorm((theta-theta0)/(sigma/sqrt(n) + z 1 α ), 15

16 dove Φ( ) è la funzione di ripartizione di una variabile aleatoria normale standardizzata. Si vede immediatamente che la funzione di potenza dipende da θ Θ e dalla distribuzione (funzione di ripartizione) della quantità pivotale (in questo caso Φ( )). Il grafico in alto nella figura 7 mostra la funzione di potenza γ(θ) del test per il sistema di ipotesi composte unilaterali in (7). La funzione di potenza è rappresentata dalla curva verde; il valore della dimensione del test α si ottiene per θ = θ 0, il valore che separa i due insiemi Θ 0 e Θ 1 ed è infatti α = sup θ Θ0 γ(θ). Il test si conduce, in questo caso, a livello α = α. La regione in blu indica l insieme Θ 1 e quella in rosso l insieme Θ 0. Per θ = θ si raggiunge una potenza pari a 0.8. Potenza α ~ 0.8 Θ 0 θ 0 θ Θ 1 Potenza α ~ = α 0.8 θ 0 θ Θ 1 θ 0 Θ 1 θ 0 + θ Fig. 7 In alto: funzione di potenza di un test di ipotesi composte unilaterali per un modello normale con media θ e varianza nota σ 2. In basso: funzione di potenza di un test di ipotesi bilaterali per un modello normale con media θ e varianza nota σ 2. Per lo stesso modello normale, il grafico in basso mostra la funzione di potenza per il sistema di ipotesi bilaterali H 0 : θ = θ 0 contro H 1 : Θ θ 0. Un calcolo analogo a quello fatto alla fine di pagina 15 mostra che in questo caso la funzione di potenza del test è data da: γ(θ) = 1 β(θ) = P X RR ; θ Θ } ( ) ( ) θ0 θ = 1 Φ σ/ n + z θ0 θ 1 α/2 +Φ σ/ n z 1 α/2. 16

17 Nel grafico l insieme Θ 1 è in blu. Il valore θ 0 è il punto rosso, α = α si ottiene per θ = θ 0 e, data la simmetria della funzione di potenza, il valore 0.8 è raggiunto in due punti dell insieme Θ Lemma di Neyman e Pearson. È importante disporre di procedure di test ipotesi che, una volta scelto il valore di α, permettano di condurre un test con una potenza elevata (o con un valore di β piccolo). Si definisce ottimo un test che, per α fissato ha potenza maggiore o uguale a qualsiasi altro test che ha la stessa probabilità α di un errore di I specie. Teorema 5. (Lemma di Neyman e Pearson) Dato un modello statistico X n, f n (x ; θ), θ Θ } ed un sistema di ipotesi semplici: H 0 : θ = θ 0 contro H 1 : θ = θ 1 la regione di accettazione di un test ottimo è costituita dai campioni in corrispondenza dei quali il rapporto tra la verosimiglianza del parametro θ sotto l ipotesi nulla e quella del parametro θ sotto l ipotesi alternativa risulta elevato. RA = x X n : L } x(θ 0 ) L x (θ 1 ) k. (8) Si può notare che il test ottimo di Neyman Pearson risulta funzione di una statistica sufficiente, infatti, se esiste una statistica sufficiente T (X) per il modello, allora le due verosimiglianze nella (8) possono essere scritte: L x (θ 0 ) L x (θ 1 ) = h(x)g(t (x, θ 0) h(x)g(t (x, θ 1 ) = g(t (x, θ 0) g(t (x, θ 1 ) = λ(t (x)) e quindi, si può identificare la regione di accettazione attraverso una statistica sufficiente: RA = x X n : λ(t (x)) k}. A seconda del modello uniparametrico considerato, sarà necessario risolvere la disuguaglianza che definisce RA in modo che le regioni di accettazione e di rifiuto possano essere costruite considerando un valore soglia k per i valori assunti dalla statistica sufficiente. Fissando la probabilità dell errore di prima specie α, attraverso la distribuzione campionaria della statistica sufficiente T (X) è possibile determinare il valore soglia k che separa le regioni di accettazione e di rifiuto. Analogamente, fissando una soglia k che separa RA ed RR, attraverso la distribuzione campionaria di T (X) è possibile determinare i valori corrispondenti di α, di β e della potenza del test. Esempio 6. Test per un campione Bernoulliano Per un campione casuale di dimensione n proveniente da una popolazione bernoulliana di parametro incognito θ, con distribuzione di probabilità: f X (x; θ) = θ x (1 θ) 1 x, x = 0, 1. θ (0, 1), 17

18 si consideri il sistema di ipotesi: H 0 : θ = θ 0 contro H 1 : θ = θ 1, dove θ 0 < θ 1. Il test ottimo secondo la procedura di Neyman e Pearson si costruisce identificando la regione di accettazione definita in (8). In un modello Bernoulliano il rapporto delle verosimiglianze è: P n i=1 x i L x (θ 0 ) L x (θ 1 ) = θ 0 (1 θ 0 ) n P n i=1 x i P n = i=1 θ x i 1 (1 θ 1 ) n P n i=1 x i Quindi, da (8) si ottiene: ( θ0 θ 1 ) nx ( ) n(1 x) 1 θ0 = 1 θ 1 ( θ0 (1 θ 1 ) θ 1 (1 θ 0 ) ) nx ( ) n 1 θ0. 1 θ 1 L x (θ 0 ) L x (θ 1 ) k [ )] nx [ ] n θ0 (1 θ 1 ) 1 θ0 k θ 1 (1 θ 0 ) 1 θ [ 1 nx log θ ] 0 (1 θ 1 ) log k + n log 1 θ 1 θ 1 (1 θ 0 ) 1 θ 0 nx log k + n log 1 θ 1 1 θ 0 log θ 0 (1 θ 1 ) θ 1 (1 θ 0 ). dove si è invertito il verso della disequazione perché se θ 0 < θ 1 allora θ 0 (1 θ 1 ) θ 1 (1 θ 0 ) < 0. Allora la regione di accettazione per il test ottimo è definita da: RA = x X n : n x i k } dove k = i=1 log k + n log 1 θ 1 1 θ 0 log θ 0 (1 θ 1 ) θ 1 (1 θ 0 ) rapresenta la soglia per la statistica sufficiente n i=1 x i. Valori di n i=1 x i k appartengono alla regione di accettazione RA e valori di n i=1 x i > k appartengono a RR. Per un valore fissato di α è possibile identificare il valore di k e le regioni di accettazione e di rifiuto corrispondenti. Per valori piccoli di n, quando non è opportuno ricorrere ad approssimazioni, è necessario considerare la distribuzione campionaria della statistica S n = n i=1 X i. Quindi, utilizzando la distribuzione Binomiale di parametri n e θ: } α = P X RR ; H o vera = P n } X i > k ; θ = θ 0 = P Sn > k } = 1 F Sn (k ), i=1 cioè 1 α = F Sn (k ), dove F Sn ( ) è la funzione di ripartizione della variabile aleatoria S n Bin(n, θ 0 ) e k è il valore del quantile 1 α di tale distribuzione. Se, per esempio, n = 3, θ 0 = 1/2 e θ 1 = 3/4, allora il valore di k per α = 0.05 è il 95-mo quantile di una binomiale con parametri n = 3 e θ = 1/2: k = qbinom(1/2,3,0.95) = 3. 18

19 Viceversa, se si assume k = 2 si possono ricavare i valori di α e β, supponendo fissate le regioni di accettazione e di rifiuto. α = P ( ) } 3 1 S 3 > 2 ; θ = θ 0 = PS3 = 3 ; θ = 1/2} = 3 2 = ( = dbinom(3,3,1/2) ). 3 β = P S 3 2 ; θ = θ 1 } = PS3 = 0 S 3 = 1 S 3 = 2 ; θ = 3/4} = [ 1 4 ] [ 1 4 ] [ i=0 ( 3 i )[ 3 4 ] i [ ] 3 i 1 = 4 ] 2 = ( = dbinom(0,3,3/4)+ dbinom(1,3,3/4)+ dbinom(2,3,3/4) ). Nel caso di ipotesi composte si considera il test del rapporto tra le verosimiglianze simile, in spirito, al test di Neyman e Pearson. Il test del rapporto tra le verosimiglianze per due ipotesi composte: H 0 ; θ Θ 0 contro H 1 : θ Θ 1 con Θ = Θ 0 Θ 1 ; ; Θ 0 Θ 1 =, definisce la regione di accettazione come: RA = X X n : λ(x) k} dove λ(x) = sup θ Θ 0 L x (θ) sup θ Θ L x (θ). (9) Ci si poteva aspettare che, in analogia con il test di Neyman Pearson, la quantità al denominatore in (9) fosse sup θ Θ1 L x (θ). In pratica, però, sostituire Θ 0 con Θ ha un effetto trascurabile sulla statistica test λ(x). Inoltre le proprietà teoriche di λ(x) sono più semplici se si definisce la statistica test come nella (9). 10. Test di Wald. Quando la numerosità campionaria è elevata, e si considera un modello uniparametrico, il cui parametro è θ, si può utilizzare la procedura di test ipotesi di Wald. Sia θ uno stimatore di θ, con varianza V [ θ ] della quale si possiede uno stimatore V[ θ ]. Definizione 7. Test di Wald. Dato un sistema di ipotesi: H 0 : θ = θ 0 contro H 1 : θ θ 0, se θ è asintoticamente normale, e quindi ( θ θ 0 ) V[ θ ] D N(0, 1). Il test di Wald di livello α rifiuta l ipotesi H 0 se W > z 1 α/2, dove W = ( θ θ 0 ) V[ θ ]. Si consideri, per esempio, lo stimatore di massima verosimiglianza θ MLE per θ che, quando n è elevato, può essere approssimato con una variabile aleatoria normale: θ MLE D N(θ, I 1 n (θ)), e quindi ( θ MLE θ) I 1 n (θ) D N(0, 1). 19

20 È allora possibile utilizzare i risultati dei test d ipotesi per modelli normali, considerando una delle due seguenti statistiche test di Wald: W 1 (X) = ( θ MLE θ 0 ) I 1 ( θ MLE ) oppure W 2 (X) = ( θ MLE θ 0 ) I 1 ( θ 0 ) che, sotto l ipotesi H 0, hanno una distribuzione asintotica normale standardizzata. Si noti che per stimare la varianza di θ MLE è equivalente utilizzare al posto dell inverso dell informazione attesa di Fisher I 1 (θ) sia l inverso dell informazione osservata I 1 ( θ MLE ) che l inverso dell informazione attesa, calcolato in θ = θ 0. Per i test d ipotesi composte esaminati fin ora si hanno le regioni di rifiuto e le funzioni di potenza approssimate nella tavola seguente: H 0 H 1 RR Funzione di potenza approssimata ( ) ( ) θ0 θ θ = θ 0 θ θ 0 W (X) > z 1 α/2 1 Φ I 1 (θ 0 ) + z θ0 θ 1 α/2 +Φ I 1 (θ 0 ) z 1 α/2 ( ) θ0 θ θ θ 0 θ > θ 0 W (X) < z 1 α Φ I 1 (θ 0 ) + z 1 α ( ) θ0 θ θ θ 0 θ < θ 0 W (X) > z 1 α 1 Φ I 1 (θ 0 ) z 1 α 20

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Introduzione Livelli di significatività Verifica di ipotesi sulla media di una popolazione normale Verifica di ipotesi sulla varianza di una popolazione normale Verifica di ipotesi

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Inferenza statistica I Alcuni esercizi. Stefano Tonellato Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,

Dettagli

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stima puntuale per la proporzione Da un lotto di arance se ne estraggono 400, e di queste 180

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte

Dettagli

Esercitazione n.2 Inferenza su medie

Esercitazione n.2 Inferenza su medie Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione

Dettagli

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizi test ipotesi Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 L4, Corso Integrato di Psicometria - Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Rev. 18/04/2011 Inferenza statistica Formulazione

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

La logica statistica della verifica (test) delle ipotesi

La logica statistica della verifica (test) delle ipotesi La logica statistica della verifica (test) delle ipotesi Come posso confrontare diverse ipotesi? Nella statistica inferenziale classica vengono sempre confrontate due ipotesi: l ipotesi nulla e l ipotesi

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI statistica, Università Cattaneo-Liuc, AA 006-007, lezione del 08.05.07 IDICE (lezione 08.05.07 PROBABILITA, VALORE ATTESO E VARIAZA DELLE QUATITÁ ALEATORIE E LORO RELAZIOE CO I DATI OSSERVATI 3.1 Valore

Dettagli

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione in base ad informazioni ricavate da un campione. Inferenza statistica: indurre

Dettagli

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato. Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI CAPITOLO III CONFRONTI TRA DISTRIBUZIONI 3.1 CONFRONTI TRA DISTRIBUZIONI OSSERVATE E DISTRIBUZIONI TEORICHE OD ATTESE. Nella teoria statistica e nella pratica sperimentale, è frequente la necessità di

Dettagli

Parte 3. Rango e teorema di Rouché-Capelli

Parte 3. Rango e teorema di Rouché-Capelli Parte 3. Rango e teorema di Rouché-Capelli A. Savo Appunti del Corso di Geometria 203-4 Indice delle sezioni Rango di una matrice, 2 Teorema degli orlati, 3 3 Calcolo con l algoritmo di Gauss, 6 4 Matrici

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Capitolo 7 TEST DELLE IPOTESI

Capitolo 7 TEST DELLE IPOTESI B. Chiandotto F. Cipollini Versione 3 Cap. 7 Capitolo 7 TEST DELLE IPOTESI In questo capitolo si affronta il problema della verifica d ipotesi statistiche limitando la trattazione alla cosiddetta teoria

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che VARIABILI ALATORI MULTIPL TORMI ASSOCIATI Fonti: Cicchitelli Dall Aglio Mood-Grabill. Moduli 6 9 0 del programma. VARIABILI ALATORI DOPPI Dopo aver trattato delle distribuzioni di probabilità di una variabile

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Per il suo compleanno, il goloso Re di un lontano regno riceve in regalo da un altro sovrano un grande canestro contenente 4367 caramelle di tanti

Per il suo compleanno, il goloso Re di un lontano regno riceve in regalo da un altro sovrano un grande canestro contenente 4367 caramelle di tanti Per il suo compleanno, il goloso Re di un lontano regno riceve in regalo da un altro sovrano un grande canestro contenente 4367 caramelle di tanti colori, tra cui 382 rosse. Qualche tempo dopo il donatore

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 3 A. Sia una variabile casuale che si distribuisce secondo

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 28/05/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Nel gico del

Dettagli

TECNICHE DI SIMULAZIONE

TECNICHE DI SIMULAZIONE TECNICHE DI SIMULAZIONE MODELLI STATISTICI NELLA SIMULAZIONE Francesca Mazzia Dipartimento di Matematica Università di Bari a.a. 2004/2005 TECNICHE DI SIMULAZIONE p. 1 Modelli statistici nella simulazione

Dettagli

TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST

TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Statistica 1 Parte A 1.1 La formula µ = x ± s n

Dettagli

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr. Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame dell 11/1/2012 NOME COGNOME N. Matr. Rispondere alle domande nel modo più completo possibile, cercando di

Dettagli

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Politecnico di Milano - Anno Accademico 200-20 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Esercitazione 9 2 Giugno 20 Esercizio. In un laboratorio per il test dei materiali,

Dettagli

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano

Dettagli

Esercitazione n.4 Inferenza su varianza

Esercitazione n.4 Inferenza su varianza Esercizio 1 Un industria che produce lamiere metalliche ha ricevuto un ordine di acquisto di un grosso quantitativo di lamiere di un dato spessore. Per assicurare la qualità della propria fornitura, l

Dettagli

Indicando con x i minuti di conversazione effettuati in un mese, con la spesa totale nel mese e con il costo medio al minuto:

Indicando con x i minuti di conversazione effettuati in un mese, con la spesa totale nel mese e con il costo medio al minuto: PROBLEMA 1. Il piano tariffario proposto da un operatore telefonico prevede, per le telefonate all estero, un canone fisso di 10 euro al mese, più 10 centesimi per ogni minuto di conversazione. Indicando

Dettagli

Premesse alla statistica

Premesse alla statistica Premesse alla statistica Versione 22.10.08 Premesse alla statistica 1 Insiemi e successioni I dati di origine sperimentale si presentano spesso non come singoli valori, ma come insiemi di valori. Richiamiamo

Dettagli

decidiamo, sulla base di un campione, se l ipotesi formulata è plausibile oppure no.

decidiamo, sulla base di un campione, se l ipotesi formulata è plausibile oppure no. LA VERIFICA D IPOTESI Alla base dell inferenza statistica vi è l assunzione che i fenomeni collettivi possano essere descritti efficacemente mediante delle distribuzioni di probabilità. Abbiamo già considerato

Dettagli

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Nome N. Matricola Ancona, 14 luglio 2015 1. Tre macchine producono gli stessi pezzi

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

8 Elementi di Statistica

8 Elementi di Statistica 8 Elementi di Statistica La conoscenza di alcuni elementi di statistica e di analisi degli errori è importante quando si vogliano realizzare delle osservazioni sperimentali significative, ed anche per

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

Corso di Analisi Matematica. Successioni e serie numeriche

Corso di Analisi Matematica. Successioni e serie numeriche a.a. 2011/12 Laurea triennale in Informatica Corso di Analisi Matematica Successioni e serie numeriche Avvertenza Questi sono appunti informali delle lezioni, che vengono resi disponibili per comodità

Dettagli

è decidere sulla verità o falsità

è decidere sulla verità o falsità I test di ipotesi I test di ipotesi Il test delle ipotesi consente di verificare se, e in quale misura, una determinata ipotesi (di carattere sociale, biologico, medico, economico, ecc.) è supportata dall

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -

Dettagli

INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1)

INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1) INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1) 151 Introduzione Un esperimento è una prova o una serie di prove. Gli esperimenti sono largamente utilizzati nel campo dell ingegneria. Tra le varie applicazioni;

Dettagli

Teoria della Stima. Stima della Media e di una Porzione di Popolazione. Introduzione. Corso di Laurea in Scienze Motorie AA2002/03 - Analisi dei Dati

Teoria della Stima. Stima della Media e di una Porzione di Popolazione. Introduzione. Corso di Laurea in Scienze Motorie AA2002/03 - Analisi dei Dati Teoria della Stima. Stima della Media e di una Porzione di Popolazione Introduzione La proceduta in base alla quale ad uno o più parametri di popolazione si assegna il valore numerico calcolato dalle informazioni

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

RISONANZA. Introduzione. Risonanza Serie.

RISONANZA. Introduzione. Risonanza Serie. RISONANZA Introduzione. Sia data una rete elettrica passiva, con elementi resistivi e reattivi, alimentata con un generatore di tensione sinusoidale a frequenza variabile. La tensione di alimentazione

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

Richiami di inferenza statistica

Richiami di inferenza statistica C Richiami di inferenza statistica SOMMARIO C.1. Un campione di osservazioni C.2. Un modello econometrico C.3. Stima della media di una popolazione C.4. Stima della varianza e di altri momenti della popolazione

Dettagli

Introduzione. Consideriamo la classica caratteristica corrente-tensione di un diodo pn reale: I D. V γ

Introduzione. Consideriamo la classica caratteristica corrente-tensione di un diodo pn reale: I D. V γ Appunti di Elettronica Capitolo 3 Parte II Circuiti limitatori di tensione a diodi Introduzione... 1 Caratteristica di trasferimento di un circuito limitatore di tensione... 2 Osservazione... 5 Impiego

Dettagli

La variabile casuale Binomiale

La variabile casuale Binomiale La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola

Dettagli

Elaborazione dei dati su PC Regressione Multipla

Elaborazione dei dati su PC Regressione Multipla 21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525.

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525. UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 15 dicembre 2014 7 LEZIONE PROBABILITA L incertezza Nella misura di una qualsiasi

Dettagli

Controllo Statistico della Qualità. Qualità come primo obiettivo dell azienda produttrice di beni

Controllo Statistico della Qualità. Qualità come primo obiettivo dell azienda produttrice di beni Controllo Statistico della Qualità Qualità come primo obiettivo dell azienda produttrice di beni Qualità come costante aderenza del prodotto alle specifiche tecniche Qualità come controllo e riduzione

Dettagli

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni) STATISTICA (2) ESERCITAZIONE 4 18.02.2013 Dott.ssa Antonella Costanzo Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni) Sia X una popolazione distribuita secondo la legge Bernoulliana

Dettagli

Temi di Esame a.a. 2012-2013. Statistica - CLEF

Temi di Esame a.a. 2012-2013. Statistica - CLEF Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

ELEMENTI DI STATISTICA

ELEMENTI DI STATISTICA Dipartimento di Ingegneria Meccanica Chimica e dei Materiali PROGETTAZIONE E GESTIONE DEGLI IMPIANTI INDUSTRIALI Esercitazione 6 ORE ELEMENTI DI STATISTICA Prof. Ing. Maria Teresa Pilloni Anno Accademico

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze

Dettagli

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI FUNZIONI ELEMENTARI - ESERCIZI SVOLTI 1) Determinare il dominio delle seguenti funzioni di variabile reale: (a) f(x) = x 4 (c) f(x) = 4 x x + (b) f(x) = log( x + x) (d) f(x) = 1 4 x 5 x + 6 ) Data la funzione

Dettagli

La Programmazione Lineare

La Programmazione Lineare 4 La Programmazione Lineare 4.1 INTERPRETAZIONE GEOMETRICA DI UN PROBLEMA DI PROGRAMMAZIONE LINEARE Esercizio 4.1.1 Fornire una rappresentazione geometrica e risolvere graficamente i seguenti problemi

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova

Dettagli

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni Statistica Economica Materiale didattico a cura del docente Analisi dei residui Test Esatto di Fisher Differenza fra proporzioni 1 Analisi dei residui Il test statistico ed il suo p-valore riassumono la

Dettagli

Concetto di potenza statistica

Concetto di potenza statistica Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1 Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

Introduzione alla Teoria degli Errori

Introduzione alla Teoria degli Errori Introduzione alla Teoria degli Errori 1 Gli errori di misura sono inevitabili Una misura non ha significato se non viene accompagnata da una ragionevole stima dell errore ( Una scienza si dice esatta non

Dettagli

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr. Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame del 18/7/2013 NOME COGNOME N. Matr. Rispondere ai punti degli esercizi nel modo più completo possibile, cercando

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni

Dettagli