3 Confronto fra due popolazioni attraverso il test t e test analoghi



Documenti analoghi
9 Confronto fra due o più popolazioni attraverso test non parametrici

Relazioni tra variabili

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

VERIFICA DELLE IPOTESI

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica. Lezione 6

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Elementi di Psicometria con Laboratorio di SPSS 1

Corso di Psicometria Progredito

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

1. Distribuzioni campionarie

Strumenti informatici 13.1

Il coefficiente di correlazione di Spearman per ranghi

Facoltà di Psicologia Università di Padova Anno Accademico

Il confronto fra proporzioni

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

E naturale chiedersi alcune cose sulla media campionaria x n

Inferenza statistica. Statistica medica 1

Corso di Psicometria Progredito


Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Statistica inferenziale

Verifica di ipotesi

Elementi di Psicometria con Laboratorio di SPSS 1

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

SOLUZIONI ESERCITAZIONE NR. 6 Variabili casuali binomiale e normale

LEZIONE n. 5 (a cura di Antonio Di Marco)

Statistica descrittiva

La distribuzione Normale. La distribuzione Normale

STATISTICA MATEMATICA 1 A.A. 2006/07 LABORATORIO DI SAS A. MICHELETTI

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

Misure della dispersione o della variabilità

Metodi Matematici e Informatici per la Biologia Maggio 2010

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Metodi statistici per le ricerche di mercato

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Laboratorio di Pedagogia Sperimentale. Indice

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Appendice I. Principali procedure ed istruzioni per la gestione di files, l'analisi statistica di tipo descrittivo e la correlazione semplice

Capitolo 12 La regressione lineare semplice

Prova di autovalutazione Prof. Roberta Siciliano

3) ANALISI DEI RESIDUI

La distribuzione Gaussiana

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

CHIUSURE di MAGAZZINO di FINE ANNO

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Relazioni statistiche: regressione e correlazione

Elementi di Psicometria con Laboratorio di SPSS 1

Statistiche campionarie

Tecniche di analisi multivariata

Analisi della varianza (anova) a due vie

3. Confronto tra medie di due campioni indipendenti o appaiati

PROGRAMMA SVOLTO NELLA SESSIONE N.

Grafici delle distribuzioni di frequenza

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a Corso di Statistica Medica. Inferenza sulle medie

Piacenza, 10 marzo 2014 La preparazione della tesi di Laurea Magistrale

Esercizi di Programmazione del progetto

La significatività PROVE DI SIGNIFICATIVITA PROVE DI SIGNIFICATIVITA PROVE DI SIGNIFICATIVITA

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

SPC e distribuzione normale con Access

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Istituzioni di Statistica e Statistica Economica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

4. Confronto tra medie di tre o più campioni indipendenti

Automazione Industriale (scheduling+mms) scheduling+mms.

2 Confronto fra due o più distribuzioni di frequenza

STATISTICA IX lezione

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1)

Analisi Statistica per le Imprese (6 CFU) - a.a Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

La logica statistica della verifica (test) delle ipotesi

ANALISI DI CORRELAZIONE

Parte 4. Progettazione di una simulazione

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Analisi di dati di frequenza

Capitolo 25: Lo scambio nel mercato delle assicurazioni

Strumenti e metodi per la redazione della carta del pericolo da fenomeni torrentizi

LE ASSUNZIONI DELL'ANOVA

Corso di Psicometria Progredito

Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Capitolo 2. Operazione di limite

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

SISTEMI DI NUMERAZIONE E CODICI

ANALISI DELLA VARIANZA A PIU CRITERI DI CLASSIFICAZIONE

IL COLLAUDO DI ACCETTAZIONE

Matrice Excel Calcolo rata con DURATA DEL FINANZIAMENTO determinata dall'utente

Temi di Esame a.a Statistica - CLEF

Transcript:

3 Confronto fra due popolazioni attraverso il test t e test analoghi Consideriamo in questo capitolo gli esperimenti comprendenti un solo fattore fisso, e nel loro ambito quelli in cui questo criterio di classificazione abbia due sole varianti o livelli. Considerata una variabile quantitativa, si intende verificare per le medie delle due popolazioni l'ipotesi nulla: H 0 : µ 1 = µ 2 All'interno di questa situazione, con riferimento ai due campioni estratti dalle altrettante popolazioni confrontate, possiamo distinguere i seguenti casi: 1) campioni indipendenti: si tratta di una situazione equivalente a quella dell'analisi della varianza ad un criterio di classificazione (di seguito indicata come AV-1) 2) campioni associati a coppie: la situazione è stavolta equivalente a quella dell'analisi della varianza a due criteri di classificazione (AV-2), modello misto, essendo ciascun individuo assimilabile ad una variante del fattore casuale normalmente indicato come blocco. La procedura TTEST, oggetto del presente paragrafo, è applicabile solo al primo caso; per il secondo, si adotta invece l'analisi della varianza come per un comune esperimento in blocchi randomizzati. Considerando il primo caso, il test t di Student richiede fra le condizioni per la sua applicazione l'uguaglianza delle varianze delle due popolazioni. Tale condizione diviene meno vincolante nel caso che il numero di unità sperimentali per campione sia costante. La relativa ipotesi nulla H 0 : σ 1 = σ 2 = σ è verificata attraverso il relativo test F bilaterale (F' test o variance-ratio test), che viene automaticamente eseguito nell'ambito della procedura TTEST. Nel caso di varianze disuguali con un numero di unità sperimentali disuguali, occorrerà ricorrere al test di Welch ovvero di Satterthwaite, oppure al più conservativo test di Cochran. Il primo di questi due tests è automaticamente incluso nella procedura TTEST, mentre il secondo va richiesto attraverso un'opzione. Infine, un'ulteriore possibilità nel caso in esame è rappresentata da una trasformazione dei dati che stabilizzi le varianze. Tutti i test su indicati richiedono come condizione di applicazione che ciascuna popolazione abbia una distribuzione normale. Tale condizione diviene però poco rilevante nel caso di unità sperimentali in numero costante ed è trascurabile per campioni di entità piuttosto consistente (indicativamente non inferiore alle 30 unità). Nel caso di non normalità e di un numero di unità sperimentali per campione disuguale e ridotto si dovrà ricorrere a certe trasformazioni di Confronto fra due popolazioni attraverso il test t e test analoghi 23

variabile od infine ad un test non parametrico. I test richiedono infine campioni che siano casuali ed indipendenti fra loro. Confronto fra due popolazioni attraverso il test t e test analoghi 24

3.1 Campioni indipendenti Nota sull Analisi...(2 a ed.) L'esempio si riferisce ad un confronto fra due metodi di campionamento del terreno per l'analisi del contenuto in ossido di potassio. Il primo metodo prevede il prelievo e l'analisi separata di 20 prelievi individuali. Col secondo metodo, si analizzano 10 prelievi medi ottenuti ciascuno dal raggruppamento di 25 prelievi individuali. Si vuole stabilire se i due metodi conducano in media a dei risultati equivalenti. Nel corso dell'analisi si vuole verificare l'ipotesi di normalità delle due popolazioni, essendo gli effettivi dei due campioni relativamente ridotti. PROGRAMMA SAS Il tipo di campionamento ed il contenuto in ossido di potassio sono indicati rispettivamente dalle due varianti indiv e medio della variabile prelievo e dai valori della variabile oxpotass. Attraverso l opzione NORMAL della procedura UNIVARIATE si verifica l ipotesi di normalità; ciò viene eseguito per ogni singola popolazione attraverso l istruzione BY, il cui impiego va preceduto, come abbiamo già visto, dalla PROC SORT. Infine viene eseguita la PROC TTEST, indicante in CLASS la variabile che fornisce il criterio di classificazione. Essa richiede anche, attraverso l'opzione COCHRAN, l'esecuzione dell'omologo test di uguaglianza delle medie nel caso, considerato qui a priori molto probabile, che l'ipotesi di uguaglianza delle due varianze debba essere respinta. * * 3.1 TEST T E TEST ANALOGHI - CAMPIONI INDIPENDENTI * DAGNELIE (1975) - PAG. 28 *; DATA esempio; INPUT prelievo $ oxpotass; CARDS; medio.96 medio 1.00 medio 1.04 medio 1.04 medio 1.08 medio 1.08 medio 1.08 medio 1.16 medio 1.20 medio 1.28 indiv.80 indiv.84 indiv.88 indiv.88 indiv.92 indiv.92 indiv 1.00 indiv 1.04 indiv 1.20 indiv 1.24 indiv 1.28 indiv 1.40 indiv 1.48 indiv 1.48 Confronto fra due popolazioni attraverso il test t e test analoghi 25

indiv 1.48 indiv 1.52 indiv 1.56 indiv 1.88 indiv 1.92 indiv 2.20 ; PROC SORT; BY prelievo; PROC UNIVARIATE NORMAL; VAR oxpotass; BY prelievo; TITLE '3.1 Test t e test analoghi - campioni indipendenti'; TITLE2 'verifica della condizione di normalità delle popolazioni'; PROC TTEST COCHRAN; CLASS prelievo; VAR oxpotass; TITLE2 'esecuzione dei test'; RUN; OUTPUT SAS L'output della PROC UNIVARIATE riporta una mole notevole di informazioni, che commenteremo solo in parte. Il test di normalità di Shapiro-Wilks (➌) indica, attraverso la sua statistica W, che per entrambe le popolazioni l'ipotesi di normalità non può essere respinta. In altri termini l'esistenza desunta dal campione, secondo i parametri di Fisher, di una asimmetria (➊) verso sinistra in entrambe le popolazioni (τ 1 > 0) e di valori di curtosi (➋) che renderebbero la prima popolazione (τ 2 < 0) e la seconda (τ 2 > 0) rispettivamente meno e più appiattita rispetto alla curva della distribuzione normale non permette di escludere, per una probabilità di errore accettabile, che ciascuna popolazione sia normale. La PROC TTEST indica, attraverso l'elevato valore del test F (➐), che l'ipotesi di uguaglianza delle due varianze va respinta. Essendo disuguale il numero di unità sperimentali a disposizione per campione, solo i primi due dei tre test di uguaglianza delle medie riportati nell'output sono quindi adeguati, cioè quello di Satterthwaite (nel quale ciò che è indicato come T equivale al valore u osservato del test di Welch) (➍) e quello di Cochran (➎). I due test adottabili indicano che i due tipi di prelievo del terreno conducono a misure del contenuto in ossido di potassio significativamente diverse. Non avremmo ottenuto lo stesso risultato se, senza tenere conto della diversità delle varianze, avessimo semplicemente considerato il test di Student (➏). 3.1 Test t e test analoghi - campioni indipendenti verifica della condizione di normalità delle popolazioni ------------------------------ PRELIEVO=indiv ------------------------------- Variable=OXPOTASS UNIVARIATE PROCEDURE Moments N 20 Sum Wgts 20 Mean 1.296 Sum 25.92 Std Dev 0.399241 Variance 0.159394 ➊ Skewness 0.661144 Kurtosis -0.23408 ➋ USS 36.6208 CSS 3.02848 Confronto fra due popolazioni attraverso il test t e test analoghi 26

CV 30.80566 Std Mean 0.089273 T:Mean=0 14.51725 Prob> T 0.0001 Sgn Rank 105 Prob> S 0.0001 Num ^= 0 20 W:Normal 0.923156 Prob<W 0.1205 ➌ Quantiles(Def=5) 100% Max 2.2 99% 2.2 75% Q3 1.5 95% 2.06 50% Med 1.26 90% 1.9 25% Q1 0.92 10% 0.86 0% Min 0.8 5% 0.82 1% 0.8 Range 1.4 Q3-Q1 0.58 Mode 1.48 Extremes Lowest Obs Highest Obs 0.8( 1) 1.52( 16) 0.84( 2) 1.56( 17) 0.88( 4) 1.88( 18) 0.88( 3) 1.92( 19) 0.92( 6) 2.2( 20) ------------------------------ PRELIEVO=medio ------------------------------- Variable=OXPOTASS UNIVARIATE PROCEDURE Moments N 10 Sum Wgts 10 Mean 1.092 Sum 10.92 Std Dev 0.09624 Variance 0.009262 ➊ Skewness 0.756263 Kurtosis 0.231289 ➋ USS 12.008 CSS 0.08336 CV 8.813227 Std Mean 0.030434 T:Mean=0 35.88104 Prob> T 0.0001 Sgn Rank 27.5 Prob> S 0.0020 Num ^= 0 10 W:Normal 0.940446 Prob<W 0.5415 ➌ Quantiles(Def=5) 100% Max 1.28 99% 1.28 75% Q3 1.16 95% 1.28 50% Med 1.08 90% 1.24 25% Q1 1.04 10% 0.98 0% Min 0.96 5% 0.96 1% 0.96 Range 0.32 Q3-Q1 0.12 Mode 1.08 Extremes Lowest Obs Highest Obs 0.96( 1) 1.08( 6) 1( 2) 1.08( 7) 1.04( 4) 1.16( 8) 1.04( 3) 1.2( 9) 1.08( 7) 1.28( 10) Confronto fra due popolazioni attraverso il test t e test analoghi 27

Variable: OXPOTASS TTEST PROCEDURE PRELIEVO N Mean Std Dev Std Error ---------------------------------------------------------------------------- indiv 20 1.29600000 0.39924139 0.08927309 medio 10 1.09200000 0.09624044 0.03043390 Variances T Method DF Prob> T -------------------------------------------------------- Unequal 2.1629 Satterthwaite 23.0 0.0412 ➍ Cochran. 0.0452 ➎ Equal 1.5800 28.0 0.1253 ➏ For H0: Variances are equal, F' = 17.21 DF = (19,9) Prob>F' = 0.0001 ➐ Confronto fra due popolazioni attraverso il test t e test analoghi 28