Relazioni tra variabili

Похожие документы

Analisi della varianza

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Elementi di Psicometria

Statistica. Lezione 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Analisi di dati di frequenza

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

IL TEST CHI QUADRATO χ 2

Elementi di Psicometria con Laboratorio di SPSS 1

Capitolo 12 La regressione lineare semplice

Istituzioni di Statistica e Statistica Economica

1. Distribuzioni campionarie

E naturale chiedersi alcune cose sulla media campionaria x n

INDICE PREFAZIONE VII

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

VERIFICA DELLE IPOTESI

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Elementi di Psicometria con Laboratorio di SPSS 1

Concetto di potenza statistica

LEZIONE n. 5 (a cura di Antonio Di Marco)

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

STATISTICA IX lezione

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

FONDAMENTI DI PSICOMETRIA - 8 CFU

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente:

Metodologia epidemiologica

errore I = numero soggetti (I = 4) K = numero livelli tratt. (K = 3) popolazione varianza dovuta ai soggetti trattamento

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Temi di Esame a.a Statistica - CLEF

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Confronto tra gruppi (campioni indipendenti)

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Il confronto fra proporzioni

LA CORRELAZIONE LINEARE

Il coefficiente di correlazione di Spearman per ranghi

Elementi di Psicometria con Laboratorio di SPSS 1

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno.

3 Confronto fra due popolazioni attraverso il test t e test analoghi

Test statistici di verifica di ipotesi

Corso di Psicometria Progredito

Inferenza statistica. Statistica medica 1

Corso di. Dott.ssa Donatella Cocca

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test statistici non-parametrici

Tecniche di analisi multivariata

Lezione 1. Concetti Fondamentali

Statistiche campionarie

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

L analisi statistica

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1)

Facoltà di Psicologia Università di Padova Anno Accademico

Regressione Logistica: un Modello per Variabili Risposta Categoriali

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

General Linear Model. Esercizio

Corso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle

In una tabella 2 x 2 il valore del chiquadrato, che quantifica la differenza fra i numero osservati e quelli attesi, è la somma delle quattro celle

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

Facoltà di Psicologia - Corso FSE gennaio febbraio Marco Vicentini info@marcovicentini.it

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

CENNI DI METODI STATISTICI

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Esercizi sulle variabili aleatorie Corso di Probabilità e Inferenza Statistica, anno , Prof. Mortera

Sommario. Capitolo 1 Impiego della statistica per la gestione dell azienda 1. Capitolo 2 Disponibilità e produzione delle informazioni statistiche 19

Ricerca di outlier. Ricerca di Anomalie/Outlier

4. Confronto tra medie di tre o più campioni indipendenti

CORSO DI STATISTICA La Misurazione, Scale di Misura, Errori di Misura

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

DISTRIBUZIONI DI PROBABILITÀ

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Elementi di Psicometria con Laboratorio di SPSS 1

3. Confronto tra medie di due campioni indipendenti o appaiati

Metodi statistici per le ricerche di mercato

Corso di Psicometria Progredito

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Università degli Studi di L Aquila. Facoltà di Ingegneria. Corso di Laurea in Ingegneria Elettronica Corso di Sistemi Informativi

Tasso di interesse e capitalizzazione

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

ANALISI DI CORRELAZIONE

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre.

Automazione Industriale (scheduling+mms) scheduling+mms.

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

Capitolo 11 Test chi-quadro

(a cura di Francesca Godioli)

Транскрипт:

Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina Preventiva Lezioni tronco comune Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO Relazioni tra variabili - Confronto tra due medie (test t di Student) - Confronto tra più di due medie (Analisi della varianza) 1 PROBLEMA QUESITO SCIENTIFICO DISEGNO DELLO STUDIO VARIABILE ESITO (OUTCOME) Variabile dipendente VARIABILE PREDITTORE Variabile indipendente SCELTA DEL TEST STATISTICO 1

COMPLESSITÀ DELL ANALISI () Univariata Media, Mediana, moda, range, percentili, deviazione standard Bivariata - t-test, chi-quadrato, correlazione, Kaplan-Meier Multivariabile Regressione logistica multipla, regressione lineare multipla, regressione con modelli a rischio proporzionale Multivariata Correlazioni canoniche, analisi fattoriale, componenti principali 3 Variabile indipendente Variabile dipendente Tipo di test Dicotomica Politomica Dicotomica Politomica Chi-quadrato, z-test, test esatto di Fisher, test di McNemar Chi-quadrato Ordinale Dicotomica Chi-quadrato,Test per il trend Dicotomica Continua T-test Politomica Continua Analisi della varianza, confronti multipli Continua Continua Correlazione, Regressione 4

CONFRONTI TRA GRUPPI VARIABILI CONTINUE Per scegliere l appropriato metodo d analisi si devono considerare più fattori: Numero di gruppi di osservazioni: o 1 o o più di gruppi di osservazioni o indipendenti gruppi di unità statistiche non associati tra loro (i gruppi possono aver differenti numerosità) o dipendenti ogni gruppo di osservazioni è eseguito sullo stesso set di individui (i gruppi hanno la stessa numerosità). Tipicamente si tratta di rilevazioni effettuate sugli stessi soggetti prima e dopo un certo evento. Caso particolare è l appaiamento. 5 Distribuzioni dei dati per gruppi indipendenti, i test parametrici richiedono che la variabile sia distribuita normalmente all interno dei gruppi e che la deviazione standard dei vari gruppi sia simile (omoscedastica). Nel caso la variabile non fosse distribuita normalmente si può porvare ad operare una trasformazione dei dati. Se la trasformazione non fosse efficace, bisogna ricorrere a metodi di analisi non parametrici. L oggetto del quesito può trattarsi di un quesito di stima o di verifica d ipotesi 6 3

Assunti per i test parametrici Le variabili osservate devono essere misurabili su una scala per intervallo Le osservazioni campionarie devono essere indipendenti, ovvero il campione deve essere casuale Le osservazioni devono appartenere a popolazioni distribuite normalmente Molti test parametrici sono abbastanza robusti da sopportare lievi deviazioni da alcune di questi postulati, soprattutto quando la numerosità campionaria è sufficientemente elevata. 7 Test non parametrici Un test non parametrico è un test il cui modello non precisa condizioni circa i parametri della popolazione da cui proviene il campione studiato Vantaggi dei test non parametrici Assunti meno restrittivi Possibilità di impiego anche con piccoli campioni Analisi di ranghi Svantaggi dei test non parametrici Meno potenti a parità di informazione 8 4

TEST PARAMETRICI T di Student ( campioni indipendenti) T di Student ( campioni dipendenti- dati appaiati) Analisi della Varianza ad 1 criterio (+ di campioni indipendenti) Analisi della Varianza a criteri TEST NON PARAMETRICI Mann-Whitney ( campioni indipendenti) Wilcoxon ( campioni dipendenti- dati appaiati) Kruskal-Wallis (+ di campioni indipendenti) Friedman 9 Gittata cardiaca in L/min in soggetti alimentati secondo diversi tipi di dieta seq 1 3 4 5 6 7 Dieta Standard 4.6 4.7 4.7 4.9 5.1 5.3 5.4 Dieta con elevato introito di Carboidrati 4.6 5.0 5. 5. 5.5 5.5 5.6 L/min 6 5 4 3 1 0 Standard Carboidrati Esiste associazione tra il tipo di dieta e la gittata cardiaca? La differenza tra la gittata cardiaca media di soggetti alimentati con dieta standard e quella di soggetti con elevato apporto di carboidrati è significativa? 10 5

11 Verifica d ipotesi su una variabile di tipo quantitativo su scala rapporto usando campioni indipendenti ASSUNZIONI 1. Campioni casuali seq 1 Dieta Standard 4.6 Dieta con elevato introito di Carboidrati 4.6. Variabile distribuita normalmente 3. Varianze omogenee (stessa varianza) 3 4 5 6 4.7 4.7 4.9 5.1 5.3 5.0 5. 5. 5.5 5.5 7 5.4 5.6 Media 5.0 5. DS 0.3 0.35 Varianza 0.09954 0.1381 1 6

Si vuole verificare se il la gittata cardiaca media dei soggetti con dieta standard sia diversa da quella dei soggetti con dieta basata su carboidrati ad un livello di significatività α=0,05. H 0 : µ M S = µ O H 1 : µ M µ O S C C t n x + n y = s M x M 1 1 + n n x y y dove : s ( n = x 1) s n x x + ( n + n y y 1) s y 13 5.0 5. t0 = = 1.51( p = 0,15) 1 1 0.33 + 7 7 Al livello di significatività del 5% la gittata cardiaca media dei soggetti con dieta standard non è diversa da quella dei soggetti con dieta basata su carboidrati 14 7

15 CONFRONTO TRA PIU DI DUE GRUPPI DI OSSERVAZIONI VARIABILE QUANTITATIVA Nonostante questa analisi si proponga di confrontare valori medi delle distribuzioni di più di due gruppi di osservazioni, il suo nome fa riferimento alla varianza ANOVA: ANalysis Of VAriance. Se i gruppi sono individuati sulla base di una sola variabile indipendente, essa prende il nome di Analisi della Varianza ad un criterio di classificazione 16 8

Esiste associazione tra il tipo di dieta e la gittata cardiaca? La gittata cardiaca media di soggetti alimentati con differenti tipi di dieta è significativamente differente? seq Dieta Standard Dieta con elevato introito di Carboidrati Dieta con elevato introito di Proteine Dieta con elevato introito di Fibre 1 4.6 4.6 4.3 4.3 4.7 5.0 4.4 4.4 3 4.7 5. 4.9 4.5 4 4.9 5. 4.9 4.9 5 5.1 5.5 5.1 4.9 6 5.3 5.5 5.3 5.0 7 5.4 5.6 5.6 5.6 Media 5.0 5. 4.9 4.8 DS 0.3 0.35 0.46 0.45 Varianza 0.09954 0.1381 0.15714 0. 17 18 9

6 5 4 L/min 3 1 0 Standard Carboidrati Proteine Fibre 19 0 10

1 11

3 4 1

5 6 13

N k N - k 7 8 14

9 Il test è basato sul confronto tra la varianza tra trattamenti e la varianza d errore. -Se l ipotesi nulla è vera, le due varianze dovrebbero essere molto simili tra loro, mentre -se l ipotesi nulla è falsa, la varianza tra trattamenti dovrebbe essere molto più grande della varianza d errore. 30 15

31 Se le medie sono tutte uguali, la varianza tra i gruppi e la varianza entro gruppi dipendono esclusivamente dalla variabilità esistente tra i dati, esse quindi sono la stima della stessa varianza vera e dovrebbero assumere lo stesso valore. 3 16

33 Esempio Gittata cardiaca H 0 : µ 1 =µ =µ 3 H 1 : le µ i non sono tutte uguali Sorgente di variazione GdL Stima della varianza F p SS Tra gruppi = SS Entro gruppi = 0.6814 K-1=4-1=3 0.71 1.4 0.6 3.857 N-K=8-4=4 0.1594 SS Totale = 4.5071 N-K=7 34 17

Se si volessero evidenziare tutte le possibili differenze tra le medie, non è corretto ricorrere al test t di Student per ripetere l analisi tante volte quanti sono i possibili confronti a coppie [K. (K-1)/] tra i gruppi. Per ogni applicazione del test t si userebbe solo una parte dei dati, e se i confronti sono numerosi, la probabilità complessiva che almeno uno di essi si dimostri significativo solo per effetto del caso è maggiore. Se α è la probabilità che una differenza risulti significativa quando nella realtà non lo è, (1- α) è la probabilità è la probabilità che una differenza risulti non significativa quando nella realtà non lo è. Per n confronti, la probabilità che nessun confronto risulti significativo è (1- α) n. 35 Es. α=0,05 1-α =0,95 10 confronti 0,95 10 =0,60 probabilità che nessun confronto risulti casualmente significativo 1-0,60 =0,40 probabilità che casualmente almeno un confronto risulti significativo 36 18

I confronti specifici tra medie di gruppi differenti possono essere: a priori (pianificati od ortogonali). I confronti sono pianificati in fase di programmazione confronti multipli a posteriori (post hoc) eseguono tutti i possibili confronti tra le medie alla ricerca di una qualche differenza significativa (da eseguirsi solo dopo che l analisi della varianza ha permesso di respingere l ipotesi di uguaglianza tra le medie) 37 Tecniche per i confronti multipli: Bonferroni (la probabilità di ogni confronto deve essere minore di a/p) test di Tukey test di Scheffé test di Dunnett test di Duncan 38 19