SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

Documenti analoghi
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Capitolo 11 Test chi-quadro

Distribuzioni di probabilità

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Metodi statistici per le ricerche di mercato

Teorema del limite centrale TCL

Inferenza statistica

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

Il confronto fra medie

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

Esercitazioni di statistica

1 L estrazione di radice

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Capitolo 6. La distribuzione normale

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Analisi della varianza

Distribuzioni campionarie. Antonello Maruotti

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

STIMA DELLA VARIANZA CAMPIONARIA

STATISTICHE DESCRITTIVE Parte II

Il test (o i test) del Chi-quadrato ( 2 )

Esercizio assegnato in data 28 novembre

Esame di Statistica A-Di Prof. M. Romanazzi

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Corso di Psicometria Progredito

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

LEZIONI DI STATISTICA MEDICA

Esercitazioni di statistica

Esercitazioni di Statistica

12) Metodo dei minimi quadrati e linea di tendenza

Campionamento La statistica media campionaria e la sua distribuzione

ESERCITAZIONE DI LABORATORIO A: VERIFICA DI STRUMENTAZIONE DI LABORATORIO

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson

Modelli descrittivi, statistica e simulazione

Esercizio 1. Si rilevano le variabili età, altezza e peso di 18 pazienti:

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA

Esercitazioni di Statistica

normopeso <=25 sovrappeso obesità I obesità II obesità III >=40

Lezione 4 a - Misure di dispersione o di variabilità

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Esercitazioni di Statistica

7 Disegni sperimentali ad un solo fattore. Giulio Vidotto Raffaele Cioffi

ANALISI CHIMICO FARMACEUTICA I

Tema d esame del 15/02/12

MISURE DI SINTESI 54

Statistica Inferenziale

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983:

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Istituzioni di Statistica 1 Esercizi su strumenti grafici e funzione di frequenza relativa cumulata

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III

Il Metodo Cinematico lineare, comunemente anche detto Metodo della Corrivazione, si basa su alcune considerazioni:

Procedura operativa per la gestione della funzione di formazione classi prime

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

RISOLUZIONE N.229/E. Roma,06 giugno 2008

SCHEDA 13A: ADEGUAMENTO DEI TRATTORI A CINGOLI MODELLO FIAT 411C E SIMILI (FIAT 451C, FIAT 455C, etc.)

Misure di dispersione (o di variabilità)

Lavoro Quantità. si determinino prodotto marginale e medio del fattore lavoro.

SOLUZIONI ESERCITAZIONE NR. 6 Variabili casuali binomiale e normale

Incertezza di Misura: Concetti di Base

Esercizi sui sistemi di equazioni lineari.

DETERMINAZIONE DEI DIAMETRI E CONTROLLO FRA LABORATORI

Analisi sequenziale (rollback)

Qualche esercizio di riepilogo

PROBABILITÀ SCHEDA N. 7 LA VARIABILE ALEATORIA NORMALE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

ALCUNI ELEMENTI DI VERIFICA DI IPOTESI STATISTICHE Vittorio Colagrande

Statistica. Esercitazione 10. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice. V.C.

Tempo a disposizione: 150 minuti. 1 È dato l endomorfismo f : R 3 R 3 definito dalle relazioni

Concetti principale della lezione precedente

SCHEDA N 8 DEL LABORATORIO DI FISICA

Esercitazioni di Statistica

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

20/04/2015. Retrospettivi Caso-controllo. Prospettici Per Coorte

Risoluzione dei triangoli rettangoli

Gestione Stato di Famiglia

Come utilizzare i riferimenti assoluti e relativi in Microsoft Excel

ESAME DI STATO LICEO SCIENTIFICO MATEMATICA 2011

Esercitazione n. 5 di Metodologia della Ricerca Psicologica

Esercizio. Sia a R non nullo e siano m, n numeri interi non nulli con m n. Allora a m /a n è uguale a. [1] 1/a n m [2] 1/a m n [3] 1/a n m [4] a n m

LA LUNGHEZZA DEI GENI UMANI (Es4.1)

TEST DI INGRESSO. Al seguente indirizzo puoi trovare il test di matematica di base per scienze biotecnologiche

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

ESERCIZIO SOLUZIONE. 13 Aprile 2011

I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito.

Interpolazione Statistica

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

INDICAZIONI PER LA RICERCA DEGLI ASINTOTI VERTICALI

TEOREMA DEL RESTO E REGOLA DI RUFFINI

Parte 6 Esercitazione sull accesso ai file

INDAGINE SUL CLIMA DI FIDUCIA DELLE FAMIGLIE SAMMARINESI. Indagine sul clima di fiducia delle famiglie sammarinesi 2007

Documento non definitivo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

FluNews Rapporto Epidemiologico Settimanale

NUVOLA COMUNICAZIONI

Transcript:

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato sulla base del numero di ore di quality time in grado di ritagliarsi durante la settimana. Seguono i dati grezzi rilevati: 2.8 3 3.2 1.5 4 4.2 3.7 5.2 4.5 5. Supponendo noto che il campione in esame provenga da una popolazione Normale caratterizzata da varianza del numero di ore di quality time settimanali pari a 4, si risponda ai seguenti quesiti: 1. si verifichi se ad un livello di significativitá del 99% sia possibile concludere che il campione in esame provenga da una popolazione caratterizzata da numero medio di ore di quality time settimanali pari a 3 Il campione casualmente selezionato dalla popolazione dei pazienti di sesso maschile in cura per comportamenti aggressivi in famiglia si deve ragionevolmente ritenere come risultato di altrettante estrazioni condotte senza reinserimento, ossia nei termini di campione casuale semplice. Supponendo, peró, che un ampiezza campionaria di n 10 soggetti possa ritenersi sufficientemente grande e allo stesso tempo piccola rispetto la numerositá della popolazione statistica in questione, le tecniche di estrazione con e senza reinserimento si dimostrano condurre a risultati equivalenti da un punto di vista probabilistico. In definitiva, sulla base di tali premesse, il campione in esame puó essere inteso come bernoulliano. Si indichi dunque con X la variabile casuale che interpreti il numero di ore di quality time settimanali dei pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare; per quanto esplicitato dal testo dell esercizio: X N (µ, 4), ossia ci si trova nelle condizioni iniziali di popolazione Normale caratterizzata da varianza σ 2 nota. Evidentemente, il parametro della popolazione oggetto di inferenza é l ignoto numero medio µ di ore di quality time settimanali e, con riferimento ad esso, si é interessati a verificare la seguente ipotesi nulla bilaterale: H 0 : µ 3, ossia l ipotesi secondo cui la popolazione in questione sia caratterizzata da numero medio di ore di quality time settimanali pari a µ 0 3. Ai fini della verifica della presente ipotesi, poiché nota la varianza della popolazione e bilaterale l ipotesi nulla di interesse, si deve necessariamente eseguire uno Z test a due code, con regione critica (regione di rifiuto di H 0 ) composta dalle due code della statistica test X µ 0 σ2 /n N (0.1),

sotto le quali la probabilitá di un errato rifiuto di H 0, α, viene equamente ripartita. Il campione bernoulliano osservato fornisce media campionaria del fenomeno statistico in questione: x 1 n 10 i1 x i 1 (2.8 + 3 + 3.2 +... + 5.2 + 4.5 + 5) 10 1 37.1 3.71 10 Inoltre, essendo il livello di significativitá del test pari a 0.99 (99%), risulta: 1 α 0.99, α 0.01, α 2 0.005, pertanto il valore critico, ossia il valore della statistica test che divide, unitamente al proprio simmetrico, la zona di accettazione di H 0 dalla regione critica, z α/2 z 0.005, che lascia alla propria destra una probabilitá pari a 0.005, é tale che: P (Z z 0.005 ) 0.005; essendo pari a 1 l area sottesa dalla curva a campana che rappresenta la funzione di densitá della variabile casuale Normale standard, si ha che: da cui: 1 P (Z < z 0.005 ) 0.005, P (Z < z 0.005 ) 0.995. Dalle tavole della variabile casuale Normale standard, risulta, in corrispondenza della riga intestata con 2.5 e della colonna intestata con.08, ossia in corrispondenza di z 2.58: P (Z 2.58) 0.9951, ossia z 2.58 identifica lo Z score di interesse. Si rifiuta dunque H 0 a livello 99% se il valore sperimentale della statistica test é tale che: x µ 0 σ2 /n 2.58 o x µ 0 σ2 /n 2.58. Poiché: e x µ 0 σ2 /n 3.71 3 4/10 0.71 0.4 0.71 0.63 1.13 > 0 1.13 < 2.58, il valore sperimentale cade nella regione di accettazione di H 0, dunque si accetta H 0 al 99% di livello di significativitá, ossia, sulla base dell evidenza sperimentale ottenuta, l ipotesi proposta dal testo dell esercizio deve ritenersi fondata.

2. Si determini il p value e sulla base di esso si dia conferma della conclusione tratta al punto 1 In generale, il p value si identifica operativamente nella probabilitá che sotto H 0 vera la statistica test assuma valori pari a quello osservato o piú sfavorevoli rispetto ad esso nei confronti di H 0. Nel presente caso, avendo riscontrato come valore sperimentale z 1.13 > 0, i valori della statistica test piú sfavorevoli rispetto ad esso nei confronti di H 0 sono quelli alla relativa destra. In definitiva, essendo pari a 1 l area totale sotto la curva a campana che rappresenta la funzione di densitá della variabile casuale Normale standard, il p value risulta: ( ) X µ0 p value P σ2 /n 1.13 P (Z 1.13) 1 P (Z < 1.13) 1 P (Z 1.13) ; a questo punto, ai fini della determinazione di P (Z 1.13) é possibile ricorrere alle tavole della variabile casuale Normale standard, dalle quali, incentrando l attenzione sulla casella giacente sull intersezione tra la riga intestata con 1.1 (parte intera e prima cifra dopo la virgola di z 1.13) e la colonna intestata con.03 (seconda cifra dopo la virgola di z 1.13), risulta: Pertanto: e poiché: P (Z 1.13) 0.8708. p value 1 P (Z 1.13) 1 0.8708 0.1292 p value 0.1292 > 0.005 α 2, il valore sperimentale cade nella regione di accettazione di H 0, dunque si accetta H 0 ad un livello di significativitá del 99%: ció conferma la conclusione tratta al punto 1. ESERCIZIO nr. 2 Per giustificare la loro richiesta di aumento di stipendio, gli impiegati di una ditta di vendite per corrispondenza affermano di riuscire ad evadere mediamente un ordine d acquisto in non piú di 13 minuti. Al fine di verificare l attendibilitá di quanto sostenuto dagli impiegati, il direttore generale della ditta in questione effettua una verifica dei tempi di evasione di 16 ordini casualmente selezionati registrando un tempo medio di evasione di 14 minuti ed una varianza campionaria corretta di 100 minuti 2. Ció premesso, supponendo che il tempo di evasione di un ordine d acquisto possa essere ragionevolmente interpretato da una variabile casuale Normale, si verifichi ad un livello di significativitá del 95% se la richiesta degli impiegati debba ritenersi fondata Il campione casualmente selezionato dalla popolazione degli ordini d acquisto della ditta di vendite per corrispondenza in questione si deve ragionevolmente ritenere come risultato di

altrettante estrazioni condotte senza reinserimento, ossia nei termini di campione casuale semplice. Supponendo, peró, che un ampiezza campionaria di n 16 ordini possa ritenersi sufficientemente grande e allo stesso tempo piccola rispetto la numerositá della popolazione statistica in questione, le tecniche di estrazione con e senza reinserimento si dimostrano condurre a risultati equivalenti da un punto di vista probabilistico. In definitiva, sulla base di tali premesse, il campione in esame puó essere inteso come bernoulliano. Si indichi dunque con X la variabile casuale che interpreti il tempo di evasione degli ordini d acquisto della ditta in questione; per quanto esplicitato dal testo dell esercizio: X N ( µ, σ 2), con σ 2 ignota, ossia ci si trova nelle condizioni iniziali di popolazione Normale caratterizzata da varianza σ 2 ignota. Evidentemente, il parametro della popolazione oggetto di inferenza é l ignoto tempo medio µ di evasione degli ordini d acquisto e, con riferimento ad esso, si é interessati a verificare la seguente ipotesi nulla unilaterale sinistra: H 0 : µ 13, che traduce formalmente l affermazione proposta dal testo dell esercizio secondo cui gli impiegati della ditta siano in grado di evadere mediamente un ordine d acquisto in non piú di µ 0 13 minuti. Ai fini della verifica della presente ipotesi, poiché non nota la varianza della popolazione e unilaterale sinistra l ipotesi nulla di interesse, si deve necessariamente eseguire un T test ad una coda, con regione critica (regione di rifiuto di H 0 ) rappresentata dalla coda di destra della statistica test X µ 0 S2 /n T n 1, coda sotto la quale viene posta l intera probabilitá di un errato rifiuto di H 0, α. A tal proposito, con riferimento al campione bernoulliano osservato, sono noti dal testo dell esercizio la media campionaria del fenomeno statistico in questione: e la relativa varianza campionaria corretta: x 14 s 2 100. Inoltre, essendo il livello di significativitá del test pari a 0.95 (95%), risulta: 1 α 0.95, α 0.05, pertanto dalle tavole della variabile casuale T di Student con g n 1 16 1 15 gradi di libertá, si ricava il valore critico, ossia il valore della statistica test che separa la zona di accettazione di H 0 dalla regione critica e che lascia alla propria destra probabilitá pari a 0.05: t n 1,α t 15,0.05 1.7531.

Si rifiuta dunque H 0 a livello 95% se il valore sperimentale della statistica test é tale che: x µ 0 s2 /n 1.7531. Poiché: e x µ 0 s2 /n 14 13 100/16 1 6.25 1 2.5 0.4 0.4 < 1.7531, il valore sperimentale cade nella regione di accettazione di H 0, dunque si accetta H 0 al 95% di livello di significativitá, ossia, sulla base dell evidenza sperimentale ottenuta, l affermazione degli impiegati in questione deve ritenersi fondata. ESERCIZIO nr. 3 Si supponga che nell ambito di un campione casuale di 50 pazienti diabetici aventi subito una perdita di peso, 20 di essi si siano dichiarati consumatori di antidepressivi. Inoltre, si supponga noto che nella popolazione di soggetti sani aventi subito una perdita di peso la proporzione di uso di antidepressivi sia pari a 0.3. Ció premesso, si risponda ai seguenti quesiti: 1. si verifichi se ad un livello di significativitá del 90% la proporzione di uso di antidepressivi nella popolazione dei pazienti diabetici aventi subito una perdita di peso sia non inferiore di quella relativa ai soggetti sani, esplicitando il riferimento teorico a cui si é fatto ricorso Il campione casualmente selezionato dalla popolazione dei pazienti diabetici aventi subito una perdita di peso si deve ragionevolmente ritenere come risultato di altrettante estrazioni condotte senza reinserimento, ossia nei termini di campione casuale semplice. Supponendo, peró, che un ampiezza campionaria di n 50 pazienti possa ritenersi sufficientemente grande e allo stesso tempo piccola rispetto la numerositá della popolazione statistica in questione, le tecniche di estrazione con e senza reinserimento si dimostrano condurre a risultati equivalenti da un punto di vista probabilistico. In definitiva, sulla base di tali premesse, il campione in esame puó essere inteso come bernoulliano. Ció premesso, si indichi con X la variabile casuale discreta che assuma valore 1 in corrispondenza dei pazienti diabetici facenti uso di antidepressivi (classificabili come successi) e valore 0 in corrispondenza dei pazienti diabetici non facenti uso di antidepressivi (classificabili come insuccessi). Evidentemente, il parametro della popolazione oggetto di inferenza é l ignota proporzione p di pazienti diabetici aventi subito una perdita di peso facenti uso di antidepressivi e, con riferimento ad essa, si é interessati a verificare la seguente ipotesi nulla unilaterale destra: H 0 : p 0.3,

ossia l ipotesi secondo cui la proporzione dei facenti uso di antidepressivi nella popolazione dei pazienti diabetici sia non inferiore a quella riscontrata nella popolazione dei soggetti sani pari a p 0 0.3. Disponendo di un campione di tipo bernoulliano ed essendo l ampiezza campionaria n 50 sufficientemente grande per applicare il Teorema Centrale del Limite, ai fini della verifica della presente ipotesi, é possibile eseguire uno Z test approssimato per grandi campioni ad una coda, con regione critica (regione di rifiuto di H 0 ) rappresentata dalla coda di sinistra della statistica test ˆP p 0 p0 (1 p 0 ) /n N (0, 1), coda sotto la quale viene posta l intera probabilitá di un errato rifiuto di H 0, α. A tal proposito, con riferimento al campione bernoulliano osservato, essendo 50 i1 x i 20 il numero di pazienti diabetici aventi subito una perdita di peso che tra gli n 50 considerati sono stati classificati come successi (poiché facenti uso di antidepressivi), l ignota proporzione p dei facenti uso di antidepressivi nella popolazione dei pazienti diabetici aventi subito una perdita di peso puó essere stimata puntualmente mediante la frequenza relativa campionaria di successi, che risulta: ˆp 1 n 50 i1 x i 1 20 0.4. 50 Inoltre, essendo il livello di significativitá del test approssimativamente pari a 0.90 (90%), risulta: 1 α 0.90, α 0.10, pertanto il valore critico, ossia il valore della statistica test che divide la zona di accettazione di H 0 dalla regione critica, z α z 0.10, che lascia alla propria sinistra una probabilitá pari a 0.10, presenta simmetrico tale che: P (Z z 0.10 ) 0.10; essendo pari a 1 l area sottesa dalla curva a campana che rappresenta la funzione di densitá della variabile casuale Normale standard, si ha che: da cui: 1 P (Z < z 0.10 ) 0.10, P (Z < z 0.10 ) 0.90. Dalle tavole della variabile casuale Normale standard, risulta, in corrispondenza della riga intestata con 1.2 e della colonna intestata con.08, ossia in corrispondenza di z 1.28: P (Z 1.28) 0.8997,

ossia z 1.28 identifica lo Z score di interesse. Si rifiuta dunque H 0 a livello approssimativamente pari al 90% se il valore sperimentale della statistica test é tale che: ˆp p 0 p0 (1 p 0 ) /n 1.28. Poiché: ˆp p 0 p0 (1 p 0 ) /n 0.4 0.3 0.3 (1 0.3) /50 0.1 0.3 0.7/50 0.1 0.0042 e 0.1 0.0648 1.54 1.54 > 1.28, il valore sperimentale cade nella regione di accettazione di H 0, dunque si accetta H 0 ad un livello di significativitá approssimativamente pari al 90%, ossia, sulla base dell evidenza sperimentale ottenuta, l ipotesi proposta dal testo dell esercizio deve ritenersi fondata. 2. Si determini il p value e sulla base di esso si dia conferma della conclusione tratta al punto 1 Nel presente caso, avendo riscontrato come valore sperimentale z 1.54, i valori della statistica test piú sfavorevoli rispetto ad esso nei confronti di H 0 sono quelli alla relativa sinistra. Il p value risulta dunque: ( ) ˆP p 0 p value P p0 (1 p 0 ) /n 1.54 P (Z 1.54) 0.9382, poiché, incentrando l attenzione sulla casella della tavola della variabile casuale Normale standard giacente sull intersezione tra la riga intestata con 1.5 (parte intera e prima cifra dopo la virgola di z 1.54) e la colonna intestata con.04 (seconda cifra dopo la virgola di z 1.54), risulta: P (Z 1.54) 0.9382. Pertanto, poiché: p value 0.9382 > 0.10 α, il valore sperimentale cade nella regione di accettazione di H 0, dunque si accetta H 0 ad un livello di significativitá approssimativamente pari al 90%.

ESERCIZIO nr. 4 Al fine di verificare la qualitá della produzione di una certa fabbrica, un ingegnere controlla il numero di pezzi difettosi prodotti da tre macchinari differenti, ottenendo i seguenti risultati: Macchina 1 Macchina 2 Macchina 3 Pezzi non difettosi 150 140 200 Pezzi difettosi 25 40 20 Ciò premesso, si verifichi ad un livello di significativitá del 95% se il macchinario utilizzato non influenzi il numero di pezzi difettosi della produzione della fabbrica in questione. La tabella a doppia entrata proposta dal testo dell esercizio, completata con le distribuzioni di frequenza marginali campionarie dei due fenomeni in questione, risulta come segue: Macchina 1 Macchina 2 Macchina 3 f i. Pezzi non difettosi 150 140 200 490 Pezzi difettosi 25 40 20 85 f.j 175 180 220 575 Ció premesso, il campione casualmente selezionato dalla produzione di pezzi della fabbrica in questione si deve ragionevolmente ritenere come risultato di altrettante estrazioni condotte senza reinserimento, ossia nei termini di campione casuale semplice. Supponendo, peró, che un ampiezza campionaria di n 575 di pezzi di produzione possa ritenersi sufficientemente grande e allo stesso tempo piccola rispetto la numerositá dei pezzi prodotti dalla fabbrica, le tecniche di estrazione con e senza reinserimento si dimostrano condurre a risultati equivalenti da un punto di vista probabilistico. In definitiva, sulla base di tali premesse, il campione di pezzi in esame puó essere inteso come bernoulliano. L esercizio richiede di verificare ad un livello di signifivcativitá del 95% l ipotesi nulla: H 0 : χ 2 0, ossia l ipotesi secondo cui i fenomeni statistici in questione siano statisticamente indipendenti nell ambito della popolazione rappresentata dalla produzione dei pezzi della fabbrica in questione. A tal fine, essendo l ampiezza campionaria sufficientemente grande, é possibile eseguire il Test Chi-Quadrato di Indipendenza per grandi campioni, test ad una coda con regione critica rappresentata dalla coda di destra della statistica test: χ 2 Chi Quadrato (g), che, sotto l ipotesi nulla vera, si identifica approssimativamente in una variabile casuale Chi-Quadrato caratterizzata da gradi di libertá pari a: g (h 1) (k 1) 1 2 2, essendo h 2 e k 3, rispettivamente, le dimensioni di riga e di colonna della tabella a doppia entrata in questione.

Ricorrendo alla relativa formulazione alternativa, il valore sperimentale della statistica test Chi-Quadrato risulta: ( 2 ) 3 f χ 2 ij 2 n 1 ; f i. f.j i1 j1 procedendo per righe, i contributi delle 6 celle della tabella a doppia entrata in questione al calcolo del χ 2 basato sulla relativa formulazione alternativa risultano come segue: f 2 11 f 1. f.1 1502 490 175 22500 85750 0.262, In definitiva: f 2 12 f 1. f.2 1402 490 180 19600 88200 0.222, f 2 13 f 1. f.3 2002 490 220 40000 107800 0.371, f 2 21 f 2. f.1 252 85 175 625 14875 0.042, f 2 22 f 2. f.2 402 85 180 1600 15300 0.104, f 2 23 f 2. f.3 202 85 220 400 18700 0.021. χ 2 575 (0.262 + 0.222 + 0.371 + + 0.042 + 0.104 + 0.021 1) 575 (1.022 1) 575 0.022 12.65. Essendo il livello di significativitá del presente test approssimativamente pari a 0.95 (95%), risulta: 1 α 0.95, α 0.05; dalle tavole della variabile casuale Chi-Quadrato, in corrispondenza della riga g 2 e della colonna α 0.05, risulta 5.9915, che identifica il valore critico del test (che lascia alla propria destra probabilitá pari a 0.05). In definitiva, poiché: χ 2 12.65 5.9915, si rifiuta l ipotesi nullla di indipendenza statistica tra i due fenomeni in questione nella popolazione in esame ad un livello di significativitá approssimativamente pari al 95%.