CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

Documenti analoghi
Facoltà di Psicologia Università di Padova Anno Accademico

Verifica delle ipotesi

IPOTESI SULLA MEDIA: caso di un campione

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Effettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

Esercizi di statistica inferenziale

OD TEST DI IPOTESI 50

Confronto tra due popolazioni Lezione 6

Elementi di Psicometria con Laboratorio di SPSS 1

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Statistica Inferenziale

Esercizi di statistica

Corso di Statistica Esercitazione 1.8

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

La distribuzione t. Federico Plazzi. 7 Novembre 2015

Laboratorio di Probabilità e Statistica

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Elementi di Psicometria (con laboratorio software 1)

Caratterizzazione dei consumi energetici (parte 3)

DISTRIBUZIONI DI CAMPIONAMENTO

Corso di Psicometria Progredito

Laboratorio di Probabilità e Statistica

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

Test d ipotesi: confronto fra medie

Inferenza su una popolazione

Argomenti della lezione:

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica (parte II) Esercitazione 4

Esercizi di Probabilità e Statistica

Intervallo di confidenza

Test delle Ipotesi Parte I

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Analisi della varianza

Intervallo di confidenza.

ESERCITAZIONE N. 7 corso di statistica

Metodi statistici per le ricerche di mercato

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Facoltà di Psicologia Università di Padova Anno Accademico

Elementi di Psicometria con Laboratorio di SPSS 1

Intervalli di confidenza

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Esercitazione 8 del corso di Statistica 2

Metodi statistici per lo studio dei fenomeni biologici

05. Errore campionario e numerosità campionaria

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Teorema del Limite Centrale

STATISTICA A K (60 ore)

lezione 4 AA Paolo Brunori

Metodi statistici per le ricerche di mercato

Approssimazione normale alla distribuzione binomiale

Contenuto del capitolo

Statistica 1- parte II

Teoria della stima dei parametri:

Esercizio 1. La variabile casuale G, somma di due V.C. normali, si distribuisce anch essa come una normale.

Tecniche statistiche di analisi del cambiamento

Analisi della varianza

Contenuti: Capitolo 14 del libro di testo

Tecniche statistiche di analisi del cambiamento

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

Distribuzione normale

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A

Dr. Marco Vicentini Anno Accademico Rev 20/04/2011

Parte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

ECONOMETRIA: Laboratorio I

Intervallo di confidenza

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Esercitazione 8 maggio 2014

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

distribuzione normale

LEZIONI DI STATISTICA MEDICA

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

LEZIONI DI STATISTICA MEDICA

standardizzazione dei punteggi di un test

07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni

STATISTICA ESERCITAZIONE 13

Intervalli di confidenza

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c.

Probabilità e Statistica

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato

Elementi di Psicometria con Laboratorio di SPSS 1

La verifica delle ipotesi

IPOTESI STATISTICA. IPOTESI di RICERCA

Statistica inferenziale per variabili quantitative

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

TECNICHE DI ANALISI DEI DATI

Statistica8-3/11/2015

Transcript:

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti, se tali campioni provengono da due popolazioni diverse o meno.

informazioni sulla varianza del fenomeno le varianze della popolazioni da cui provengono i campioni sono note? SI NO utilizzo della distribuzione normale utilizzo della distribuzione t le varianze sono omogenee? SI (stima della varianza comune) NO (utilizzo formula corretta) 3

Confronto tra medie in due campioni indipendenti (σ è noto) ASSUNZIONI ) che entrambi i campioni siano distribuiti normalmente; ) che siano tra loro indipendenti; 3) che le popolazioni da cui derivano abbiano varianze omogenee. 4

la distribuzione della differenza tra medie quando σ è noto, la distribuzione campionaria della differenza tra le due medie ha le seguenti caratteristiche: a) si distribuisce in forma normale b) c) μ σ μ μ σ n + n 0 5

la distribuzione della differenza tra medie σ noto il test associato alla differenza tra le medie è: z X σ X n + n 6

esempio Un ricercatore vuole sapere se vi siano differenze nell atteggiamento verso l attività etradomestica tra le donne sposate con figli e quelle senza figli. Allo scopo somministra una scala di atteggiamento a due campioni casuali di donne coniugate, di cui n 45 con figli e n 36 senza figli, ottenendo i seguenti punteggi medi: X 65, X 75. Ipotizzando che la distribuzione dei punteggi sulla scala di atteggiamento sia normale in entrambi i gruppi, con σ σ 0, si vuole sapere se i due campioni siano estratti da popolazioni con media uguale oppure no. 7

esempio (). formulazione delle ipotesi H 0 : μ μ H : μ μ. calcolo del valore z Usiamo la formula per grandi campioni e σ noto: z cal σ X X 6575 9 n + n 0/ 45+ 36 / 8

esempio (3) 3. determinazione dei valori critici Fissato un livello di significatività α 0,0, e dato che il test è bidirezionale, bisogna trovare sulla tavola della normale il punto b che dà luogo ad un area di 0.495? 0,495 α/ 0,005 b ±,57 9

esempio (4) 4. decisione Poiché z cal 9 è maggiore del valore critico z c,58, dobbiamo rigettare l ipotesi H 0. CONCLUSIONE: il punteggio medio delle donne con figli è significativamente diverso da quello delle donne senza figli; l atteggiamento dei due gruppi verso il lavoro etradomestico è differente. 0

confronto fra medie di due campioni indipendenti con varianze omogenee σ ingnoto La statistica che utilizziamo ha una distribuzione di probabilità che si approssima a quella del t di Student con n + n -gradi di libertà. t ( X X ) ( ) ˆ σ μ μ

X X ( μ μ ) è la differenza tra le medie calcolate nei due campioni è la differenza tra le medie delle due popolazioni ˆ σ è la stima della deviazione standard della distribuzione campionaria della differenza tra le medie ˆ σ s n + s n n + n n + n n n, n n le numerosità dei due campioni

esempio Un commerciante verifica la durata di due diverse marche di lampadine. Con 8 lampadine della marca A ottiene una media 37 ore con s 36; con 7 lampadine della marca B ottiene una media di 036 ore con s 40. A fronte di tale risultato il commerciante vuole sapere se la differenza tra le due medie è tale da poter affermare con una probabilità del 95% che le lampadine di marca A hanno una durata superiore a quelle di marca B. 3

4 esempio (). formulazione delle ipotesi B A H μ μ : 0 B A H μ μ > :. calcolo del valore t Usiamo la formula: ˆ ) ( ) ( X X t σ μ μ

5. calcolo del valore t Per prima cosa dobbiamo stimare il valore della deviazione standard della differenza tra le medie: esempio (3) 9,63 7 8 7 8 7 8 7 40 8 36 ˆ + + + + + + n n n n n n n s n s σ

esempio (3). calcolo del valore t Quindi calcoliamo il valore di t con la formula: t ( X X 37036 0,4 9,63 ˆ σ ) ( μ μ ) 6

esempio (4) 3. determinazione dei valori critici Il livello di significatività fissato è α 0,05; il test è unidirezionale, i gradi di libertà sono (8 + 7 - ) 3. 4. decisione t,77 Poiché t cal 0,4 è maggiore del valore critico t c,77, dobbiamo rigettare l ipotesi H 0. CONCLUSIONE: Le lampadine della marca A sono migliori di quelle della marca B. 7

confronto fra medie di due campioni indipendenti con varianze non omogenee σ ignoto Se viene violato l assunto di omogeneità delle varianze è necessario introdurre una correzione al test, rimane comunque necessario che la distribuzione delle popolazioni sia normale. 8

9 La statistica viene calcolata con la formula: formula corretta nel caso formula corretta nel caso di di varianze varianze non omogenee non omogenee in cui i gdl sono dati dalla: ( ) ( ) ( ) ˆ ˆ ˆ + + + n n d σ σ σ ) ( ) ( + n s n s X X t μ μ

formula corretta nel caso di varianze non omogenee () σˆ s s + n n è la stima della varianza della distribuzione campionaria della differenza tra le medie σˆ n s σˆ n s sono le stime delle varianze delle distribuzioni campionarie delle medie stimate a partire dalle varianze dei campioni 0

esempio 3 A due gruppi di n 0 e n 6 soggetti viene somministrato un test sull ansia. Il primo gruppo ottiene un valore medio 8 con s 0,5; il secondo gruppo un punteggio medio con s 5. Ci si chiede se i due gruppi differiscono relativamente al livello d ansia. Supponiamo che sia violato l assunto di omogeneità delle varianze e che i due gruppi derivino da popolazioni con varianze non omogenee.

esempio 3 (). formulazione delle ipotesi H 0 : μ μ H : μ μ. calcolo del valore t Usiamo la formula: t ( X s + n X n ) s

esempio 3 (3). calcolo del valore t (8 ) t ( 0,5) ( 5) 3,95 + 0 6 I cui gdl saranno dati da: d (,03) ( 0,03) () 0 + + 6 + 6,58 3

esempio 3 (3) 3. determinazione dei valori critici Il livello di significatività fissato è α 0,05; il test è bidirezionale, i gradi di libertà sono 6,58 7. 4. decisione t,05 Poiché t cal 3,95 è maggiore del valore critico t c,05, dobbiamo rigettare l ipotesi H 0. CONCLUSIONE: I due gruppi differiscono per livello d ansia. 4

Approfondimento: metodo alternativo nel caso di varianze non omogenee Nel caso le varianze non siano omogenee esiste un metodo alternativo, rispetto a quello appena visto, che prevede il calcolo di un t critico corretto attraverso la seguente formula: in cui: t c t c t c σˆ t c σˆ + σˆ t c è il valore critico di t con n - gdl (n numero di elementi del campione ) e livello di sig. α è il valore critico di t con n - gdl (n numero di elementi del campione ) e livello di sig. α 5

esempio 3 metodo alternativo determinazione dei valori critici Il livello di significatività fissato è α 0,05; il test è bidirezionale, t c valore critico con 9 gdl:,6 t c valore critico con 5 gdl:,06 t c Riprendiamo i dati dell esercizio 3 e adottiamo il metodo alternativo. decisione ( 0,03),6 + ( ),0,06, Poiché t cal 3,95 è maggiore del valore critico t c,, dobbiamo rigettare l ipotesi H 0. 6

NOTA In passato, la distribuzione t di Student veniva utilizzata solo per il confronto tra medie di due piccoli campioni (n +n < 30), per evitare calcoli elaborati. Attualmente, grazie alla diffusione dei calcolatori, la distribuzione t viene sempre utilizzata quando la varianza della popolazione è ignota, anche quando la numerosità campionaria è elevata. Và infine ricordato, che per campioni molto numerosi (n +n > 00), l utilizzo della distribuzione t porta praticamente agli stessi risultati rispetto a quelli della distribuzione normale. 7

confronto fra medie di due campioni non indipendenti 8

Nel caso di coppie di osservazioni non indipendenti la media della distribuzione campionaria della differenza tra le medie risulta essere: μ μ μ μ μ la varianza della distribuzione campionaria della differenza tra le medie sarà: ˆ σ ˆ σ + ˆ σ ˆ σ ˆ σ in cui l ultimo termine r è la correlazione tra le medie di tutti i possibili campioni non indipendenti tratti dalle popolazioni in esame. r 9

Poiché non si conosce il valore r di è impossibile utilizzare la distribuzione campionaria della differenza tra le medie; per superare questo inconveniente si considera un unico campione costituito da coppie di elementi appaiati; il punteggio cui si fa riferimento è dato dalla differenza tra i punteggi di ciascuna coppia; nell ipotesi H 0, se non vi sono differenze tra le due serie di punteggi, la media delle differenze risulterà ZERO 30

differenza dei punteggi Di tale differenza possiamo calcolare la media con la formula: X D D n i ( X X ) i i X X n e calcolare la varianza con: s D D i n n D i 3

distribuzione campionaria della differenza dei punteggi. la media è pari alla differenza tra le medie delle popolazioni da cui sono tratti i campioni μ D μ μ μ. la varianza è: ˆ σ D s D i D n n n n i 3

distribuzione campionaria della differenza dei punteggi 3. il test t avrà la seguente forma t X D sd n la stessa statistica si può calcolare direttamente dai dati grezzi con la formula: t ( n D ) ( D) ( n D ) 33

esempio 4 Si vuole studiare l effetto dell affaticamento sul rendimento in una prova di precisione. A questo scopo si contano il numero di errori commessi da un gruppo di 0 soggetti in una prova di precisione. Dopo averli sottoposti ad un lavoro gravoso per un certo periodo di tempo, si contano nuovamente gli errori commessi dai 0 soggetti nella stessa prova di precisione. I dati ottenuti sono riportati nella tabella seguente. 34

esempio 4 () sogg. numero di errori differenza prova prova D X - X D A 0-4 B 8 9 - C 3 5-4 D 3 - E 4 6-4 F G 3-4 H 8 8 0 0 I 9 0 - L 6 6 0 0.3 3.3-0 0 medie somme 35

esempio 4 (3). formulazione delle ipotesi H 0 : μ μ H : μ μ. calcolo del valore t Usiamo la formula: t ( n D ) ( D) ( n D ) 36

esempio 4 (3). formulazione delle ipotesi H 0 : μ μ H : μ μ. calcolo del valore t Usiamo la formula: t 0 ( 0 0) ( 0) (0 ) 3 37

esempio 4 (4) 3. determinazione dei valori critici Il livello di significatività fissato è α 0,05; il test è bidirezionale, i gradi di libertà sono (0-) 9. 4. decisione t,6 Poiché t cal 3è maggiore del valore critico t c,6, dobbiamo rigettare l ipotesi H 0. CONCLUSIONE: L affaticamento influisce sui risultati della prova. 38