TEST NON PARAMETRICO DI MANN-WHITNEY

Documenti analoghi
R 2 1 j /n j] 3(n+1)

Il confronto fra medie

Mann-Whitney esercizio 1 Non n esposti esposti

Esercizi di statistica

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Statistica nelle applicazioni sanitarie

PROBABILITÀ ELEMENTARE

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Analisi della varianza

Inferenza statistica Donata Rodi 04/10/2016

Premessa: la dipendenza in media

Inferenza statistica II parte

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

ESAME. 9 Gennaio 2017 COMPITO B

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco

tabelle grafici misure di

Teoria e tecniche dei test. Concetti di base

Tipi di variabili. Indici di tendenza centrale e di dispersione

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

ESERCIZI DI STATISTICA SOCIALE

Test non parametrici. Federico Plazzi. 19 Novembre 2015

COGNOME.NOME...MATR..

standardizzazione dei punteggi di un test

Analisi della varianza

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

Analisi della varianza

Statistica applicata alla ricerca scientifica. Antonio Di Matteo Università Federico II

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

INDICATORI DI TENDENZA CENTRALE

1.1 Obiettivi della statistica Struttura del testo 2

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

SCHEDA DIDATTICA N 7

Scale di Misurazione Lezione 2

Esercitazione: La distribuzione NORMALE

Confronto tra più di due campioni

Statistica Elementare

Contenuti: Capitolo 14 del libro di testo

Verifica delle ipotesi

INDICATORI DI TENDENZA CENTRALE

Confronto tra due popolazioni Lezione 6

Prova scritta di Statistica

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Il campionamento e l inferenza. Il campionamento e l inferenza

Il coefficiente di correlazione di Spearman per ranghi

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

MISURE DI SINTESI 54

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Statistica Inferenziale

INDICATORI DI TENDENZA CENTRALE

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Elementi di Psicometria con Laboratorio di SPSS 1

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Misure di dispersione (o di variabilità)

Distribuzioni campionarie. Antonello Maruotti

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Statistica di base per l analisi socio-economica

Transcript:

TEST NON PARAMETRICO DI MANN-WHITNEY Questo test viene può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza è nota ed il test t di Student se la varianza non è nota). Il test di Mann-Whitney si applica solitamente quando le assunzioni per effettuare il test parametrico non sono soddisfatte, ovvero quando entrambe le condizioni 1 e 2 sono presenti: 1) le distribuzione della variabile oggetto di studio non è normale 2) le dimensioni campionarie sono ridotte ( n < di 30 casi in almeno un campione).

Density 0.05.1.15 0 5 10 15 var Shapiro-Wilk W test for normal data Variable Obs W V z Prob>z var 26 0.91255 2.501 1.878 0.03017 Esempio di variabile distribuita non normalmente con forte asimmetria positiva e n numero di casi < 30 ( 26 casi), Nelle condizioni (1+2) è possibile analizzare i dati con questa procedura che valuta ipotesi di confronto sulla mediana dei due campioni ed utilizza i ranghi delle osservazioni. Il test mann-whitney utilizzando i ranghi ed è più informativo e completo del test semplice della mediana che valuta solo il numero di casi sopra o sotto questa misura di posizione.

Le assunzioni che sottostanno il test sono ridotte rispetto ai test parametrici ( Z e t): i due campioni di dimensione n ed m sono casuali ed indipendenti la scala di misurazione è almeno ordinale la variabile di interesse è continua (anche se misurata sulla scala ordinale) Le ipotesi considerate dal test di Mann-Whitney: ------------------------------------------------------------ H0: le due popolazioni da cui sono estratti i campioni hanno mediana uguale. HA: la mediana della popolazione 1 è maggiore della mediana della pop 2 (test unidirezionale con valori di rifiuto della statistica test maggiori del valore critico). --------------------------------------------------------------------------------------------

Oppure HA: la mediana della popolazione 1 è minore della mediana della pop 2 (test unidirezionale con valori di rifiuto della statistica test minori del valore critico). ------------------------------------------------------------- Oppure HA: la mediana della popolazione 1 è diversa della mediana della pop 2 (test bidirezionale con valori di rifiuto della statistica test minori o maggiori dei 2 valori critici: minori di U alfa/2, o maggiori di +U alfa/2). Procedura: 1) E necessario ordinare i dati in maniera crescente, tenendo separati i due campioni (campione X e campione Y) di provenienza, che hanno un numero n (del campione X) ed m (del campione Y) di osservazioni. E opportuno che le due serie di valori siano riportate in colonna lasciando uno spazio accanto alla prima serie e che si lasci uno o più spazi nella elencazione dei valori della serie x (ed y rispettivamente) quando il valore successivo della elencazione sia quello della serie d confronto. Vedi esempio.

2) Quindi si assegnano i ranghi (vedi procedura specifica dispensa 1 trasformazione scala ranghi) che tiene conto anche dei ties, ovvero valori uguali a i quali viene attribuito il valor medio del rango. 3) La statistica viene quindi semplicemente calcolata come segue: n( n + 1) U = S - 2 Dove n è la dimensione campionaria del campione usato come riferimento (uno dei due campioni, ad es. campione X) ed S la somma dei ranghi specifica dello stesso campione. A seconda delle ipotesi del test il valore di U viene confrontato con il valore critico della tabella specifica per un alfa (es. alfa= 0.05) ed un numero n ed m di osservazioni.

--------------------------------------------------------------------------------------- Caso HA: Mx < My La mediana del campione x è minore di quella del campione Y Si rifiuta H0 se il valore calcolato di U risulta minore del valore U critico riportato nella tabella per n, m ed alfa specificato. --------------------------------------------------------------------------------------- Caso HA: Mx > My La mediana del campione x è maggiore di quella del campione Y Si rifiuta H0 se il valore calcolato di U risulta maggiore del valore U critico riportato nella tabella per n m ed alfa specificato. --------------------------------------------------------------------------------------- Caso HA: Mx My La mediana del campione x diversa della mediana del campione Y Si rifiuta H0 se il valore calcolato di U risulta rispettivamente maggiore del valore +U critico alfa/2 o minore del valore - U critico alfa/2 riportato nella tabella per n m ed alfa specificato. -----------------------------------------------------------

Se i campioni sono più grandi (in questo caso valutare la possibilità di effettuare un t test) ovvero quando n o m sono > di 20 è possibile ricorrere ad una valutazione della statistica ricorrendo ai valori della distribuzione normale standardizzata Z come segue: U mn / 2 z= nm( n + m + 1) / 12

Esempio dati da analizzare Valori variabile nel Campione X Valori variabile nel Campione Y n 1 1 2 2 2 3 3 0 2 4 1 4 5 2 2 6 3 1 7 2 Esempio ordinamento dati ed assegnazione ranghi Valori variabile ordinati nel Campione X Rango Campione X Valori variabile ordinati nel Campione Y Rango Campione Y n 1 0 1 2 1 3 3 1 3 4 1 3 5 2 7.5 6 2 7.5 7 2 7.5 8 2 7.5 9 2 7.5 10 2 7.5 11 3 11.5 12 3 11.5 13 4 13 somma ranghi S= 41 ranghi S= 50