Capitolo 11 Test chi-quadro



Похожие документы
Capitolo 11 Test chi-quadro

STATISTICA IX lezione

Capitolo 12 La regressione lineare semplice

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Statistica. Lezione 6

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Capitolo 4 Probabilità

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Inferenza statistica. Statistica medica 1

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.


Elementi di Psicometria con Laboratorio di SPSS 1

Concetto di potenza statistica

3. Confronto tra medie di due campioni indipendenti o appaiati

Elementi di Psicometria con Laboratorio di SPSS 1

Il confronto fra proporzioni

Metodi statistici per le ricerche di mercato

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Corso di Psicometria Progredito

VERIFICA DELLE IPOTESI

LEZIONE n. 5 (a cura di Antonio Di Marco)

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

IL TEST CHI QUADRATO χ 2

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

Il test del Chi-quadrato

Corso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle

Istituzioni di Statistica e Statistica Economica

Statistiche campionarie

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Corso di Psicometria Progredito

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Facoltà di Psicologia Università di Padova Anno Accademico

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Metodi statistici per le ricerche di mercato

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

Dimensione di uno Spazio vettoriale

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Il concetto di valore medio in generale

DISTRIBUZIONI DI PROBABILITÀ

Elementi di Psicometria con Laboratorio di SPSS 1

1. Distribuzioni campionarie

La distribuzione Gaussiana

Prova di autovalutazione Prof. Roberta Siciliano

è decidere sulla verità o falsità

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI

La regressione lineare multipla

FONDAMENTI DI PSICOMETRIA - 8 CFU

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Statistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Strumenti informatici 13.1

Capitolo 2 Distribuzioni di frequenza

decidiamo, sulla base di un campione, se l ipotesi formulata è plausibile oppure no.

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

VERIFICA DELLE IPOTESI

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Esercitazioni di Statistica

Corso di. Dott.ssa Donatella Cocca

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

ANALISI DELLA VARIANZA A PIU CRITERI DI CLASSIFICAZIONE

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Analisi di dati di frequenza

19txtI_BORRA_ /11/13 10:52 Pagina 449 TAVOLE STATISTICHE

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Prof.ssa Paola Vicard

età sesso luogo-abitazione scuola superiore esperienza insegnamento

UNIVERSITÀ DEGLI STUDI DI BERGAMO. Corso di Risk Management

11. Analisi statistica degli eventi idrologici estremi

Equivalenza economica

Verifica di ipotesi

Regressione Logistica: un Modello per Variabili Risposta Categoriali

La logica statistica della verifica (test) delle ipotesi

Facciamo qualche precisazione

4. Confronto tra medie di tre o più campioni indipendenti

Dr. Marco Vicentini Anno Accademico Rev 30/03/2011

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

Esercitazione n.4 Inferenza su varianza

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Interesse, sconto, ratei e risconti

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

matematica probabilmente

Servizi di consulenza specialistica per IGRUE

Analisi e diagramma di Pareto

Транскрипт:

Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain Argomenti Test Chi-quadrato per la differenza tra due (campioni indipendenti) Test Chi-quadrato per la differenza tra più di due Test Chi-quadrato per l indipendenza

Test Chi-quadrato per la differenza tra due Il problema della verifica di ipotesi sulla differenza tra due (test Z) può essere affrontato anche con una procedura alternativa basata su una statistica test la cui distribuzione tende ad approssimarsi con una distribuzione chi-quadrato (χ 2 ). I risultati ottenuti saranno del tutto equivalenti a quelli dalla statistica Z Se siamo interessati a confrontare le di casi che presentano una certa caratteristica in due gruppi indipendenti possiamo costruire una tabella a doppia entrata (o di contingenza) di dimensioni 2 2 nella quale sono riportati il numero (o le percentuali) di successi e insuccessi nei due gruppi Test Chi-quadrato per la differenza tra due Ad esempio

Test Chi-quadrato per la differenza tra due Per verifica l ipotesi nulla secondo cui non c è differenza tra le due H 0 : π 1 = π 2 contro l alternativa H 1 : π 1 π 2 si può considerare la statistica χ 2 Statistica test χ 2 per la differenza tra due ( ) 2 2 f0 fe χ = (11.1) f tutte le celle La statistica χ 2 si ottiene calcolando per ogni cella della tabella di contingenza la differenza al quadrato fra la frequenza osservata (f 0 ) e quella attesa (f e ), divisa per f e, e sommando quindi il risultato ottenuto per ogni cella e Test Chi-quadrato per la differenza tra due Per calcolare la frequenza attesa si deve tener conto del fatto che se l ipotesi nulla è vera la proporzione di successi e insuccessi è la stessa nei due gruppi e le campionarie dovrebbero differire solo per effetto del caso. In questo caso per stimare il parametro π conviene utilizzare una combinazione delle due frequenze campionarie, indicata con p Calcolo della proporzione globale di successi X1+ X2 X p = = n + n n 1 2 (11.2) Per calcolare la frequenza attesa f e per le celle relative al successo (prima riga) si dovrà moltiplicare l ampiezza campionaria n 1 e n 2 (totali di colonna) per p

Test Chi-quadrato per la differenza tra due Analogamente, per calcolare la frequenza attesa f e per le celle relative all insuccesso (seconda riga) si dovrà moltiplicare l ampiezza campionaria n 1 e n 2 di ciascuno dei due gruppi per (1 p) La statistica test introdotta nell equazione (11.1) si distribuisce approssimativamente secondo una distribuzione chi-quadrato con 1 grado di libertà Fissato α, l ipotesi nulla dovrà essere rifiutata se il valore osservato della statistica χ 2 è maggiore del valore critico χ 2 U di una distribuzione χ 2 con 1 grado di libertà Test Chi-quadrato per la differenza tra due

Test Chi-quadrato per la differenza tra due Test Chi-quadrato per la differenza tra due

Test Chi-quadrato per la differenza tra più di due Il test χ 2 opportunamente generalizzato può essere utilizzato per confrontare le di più popolazioni indipendenti. Supponiamo di voler verificare l ipotesi nulla secondo cui le di c popolazioni sono uguali H 0 : π 1 = π 2 = = π c contro l alternativa H 1 : non tutte le π j sono uguali tra loro (con j=1,,c) Per risolvere questo problema dovremo costruire una tabella di contingenza di due righe (successo e insuccesso) che avrà un numero di colonne pari a c La statistica test sarà la stessa dell equazione (11.1), dove la frequenza attesa viene calcolata dalla stima p di π = π 1 = π 2 = = π c che in questo caso si ottiene come combinazione delle c frequenze campionarie Test Chi-quadrato per la differenza tra più di due Calcolo della proporzione globale di successi X1+ X2 +... + Xc X p = = n + n +... + n n 1 2 c (11.3) La statistica test dell equazione (11.1) si distribuisce approssimativamente secondo una distribuzione chiquadrato con (2 1) (c 1)=(c 1) gradi di libertà Fissato α, l ipotesi nulla dovrà essere rifiutata se il valore osservato della statistica χ 2 è maggiore del valore critico χ 2 U di una distribuzione χ 2 con (c 1) gradi di libertà

Test Chi-quadrato per la differenza tra più di due Esempio: tabella di contingenza 2x3 relativa alla soddisfazione dei clienti di 3 alberghi Frequenze attese Test Chi-quadrato per la differenza tra più di due Calcolo della statistica test χ 2 per l esempio relativo alla soddisfazione dei clienti di 3 alberghi Regione di rifiuto e di accettazione del test χ 2 (2 gradi di libertà) per la differenza tra tre al livello di significatività α=0.05

Test Chi-quadrato per la differenza tra più di due Foglio di Microsoft Excel con i calcoli necessari per calcolare valore critico e p-value (test chi-quadro, 3 gruppi) Test Chi-quadrato per l indipendenza Se si considera una tabella di contingenza con r righe c colonne il procedimento del test χ 2 può essere generalizzato per verificare l indipendenza tra due variabili categoriali X e Y In questo contesto le ipotesi nulla e alternativa sono H 0 : le due variabili categoriali sono indipendenti ( X Y) (non sussistono relazioni tra le due variabili) H 1 : le due variabili categoriali sono dipendenti ( X Y) (sussiste una relazione tra le due variabili) Il test si basa ancora una volta sull equazione (11.1) ( ) 2 2 f0 fe χ = tutte le celle fe La regola decisionale consiste nel rifiutare H 0 se il valore osservato della statistica χ 2 è maggiore del valore critico χ 2 U della distribuzione χ 2 con (r 1) (c 1) gdl

Test Chi-quadrato per l indipendenza Pure se presentano delle analogie, la differenza fondamentale tra il test chi-quadrato per le e per l indipendenza riguarda lo schema di campionamento: Nel confronto tra siamo di fronte a campioni estratti da popolazioni indipendenti Nel test di indipendenza abbiamo un solo campione su cui rileviamo due variabili qualitative che possono assumere r e c modalità distinte Nel caso di test chi-quadrato per l indipendenza è possibile semplificare il calcolo delle frequenze attesa applicando la seguente regola: f e = totale di riga totale di colonna n Test Chi-quadrato per l indipendenza Esempio: tabella della frequenze osservate con riferimento al principale motivo di insoddisfazione e all albergo Frequenze attese

Test Chi-quadrato per l indipendenza Calcolo della statistica χ 2 per il test di indipendenza Test Chi-quadrato per l indipendenza Regione di rifiuto e di accettazione del test χ 2 per l indipendenza nell esempio sulla soddisfazione dei clienti (al livello di significatività 0.05 con 6 gradi di libertà)

Test Chi-quadrato per l indipendenza Foglio di Microsoft Excel con i calcoli necessari per la verifica dell ipotesi di indipendenza tra motivo di insoddisfazione e albergo Riepilogo