Gestione ed Analisi Statistica dei dati

Documenti analoghi
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Gli errori nella verifica delle ipotesi

Analisi della varianza

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Concetti principale della lezione precedente

Il test (o i test) del Chi-quadrato ( 2 )

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Distribuzioni e inferenza statistica

Esercitazione 8 del corso di Statistica 2

Il confronto fra medie

Proprietà della varianza

Esercizi riassuntivi di Inferenza

Analisi della varianza

Casa dello Studente. Casa dello Studente

Analisi della varianza a una via

Statistica. Lezione 8

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

Test d ipotesi. Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona. Ipotesi alternativa (H 1 )

Capitolo 11 Test chi-quadro

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

C.I. di Metodologia clinica

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Test di ipotesi su due campioni

Esercizi di Probabilità e Statistica

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Premessa: la dipendenza in media

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Seconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016

Approssimazione normale alla distribuzione binomiale

Esercitazione 8 maggio 2014

Schema lezione 5 Intervalli di confidenza

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

standardizzazione dei punteggi di un test

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Intervallo di confidenza

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Esercitazione di Statistica Indici di associazione

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Test d Ipotesi Introduzione

Scuola di specializzazione In Fisica Sanitaria a.a. 2005/2006 Epidemiologia Prof. Maria Antonietta Penco

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Elementi di Psicometria con Laboratorio di SPSS 1

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Note sulla probabilità

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.

Capitolo 8. Probabilità: concetti di base

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Test delle ipotesi sulla media.

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Elementi di Psicometria

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

Distribuzioni di probabilità

Capitolo 9 Verifica di ipotesi: test basati su un campione

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Statistica di base per l analisi socio-economica

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Luigi Santoro. Hyperphar Group S.p.A., MIlano

Test per la correlazione lineare

Statistica multivariata Donata Rodi 17/10/2016

ESERCIZIO 1. b) E' necessario formulare ipotesi per procedere al test richiesto al punto a? (motivare brevemente la risposta)

Caratterizzazione dei consumi energetici (parte 3)

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Distribuzione Gaussiana - Facciamo un riassunto -

Capitolo 10 Test delle ipotesi

Elementi di Psicometria con Laboratorio di SPSS 1

Esercitazioni di statistica

Verifica delle ipotesi: Binomiale

Metodi statistici per le ricerche di mercato

Intervalli di confidenza

I TEST STATISTICI. dott.ssa Gabriella Agrusti

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Distribuzioni campionarie

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Esame di Istituzioni di Matematiche II del 11 luglio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

CAPITOLO 11 ANALISI DI REGRESSIONE

Test F per la significatività del modello

Transcript:

Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 12 giugno 2014

TEST di ipotesi Finora abbiamo visto come l uso l degli intervalli di confidenza permettono di estendere i risultati di un campione alla popolazione di riferimento. Il passo successivo nell analisi statistica è mettere a confronto due o più gruppi, oppure mettere a confronto un risultato ottenuto dal campione e un valore atteso.

TEST di IPOTESI: Significatività Statistica Si mettono a confronto due misure, allo scopo di verificare se la loro differenza è probabilmente dovuta al caso oppure no. Se la differenza NON è CASUALE cioè non è dovuta al caso, si dice che è «statisticamente significativa». La metodologia utilizzata è quella del Test di ipotesi

TEST di ipotesi TEST significa prova, verifica, accertamento Tutti i Test (test di gravidanza, test elettorale, test di ammissione, test statistico, ecc.) si basano sulla verifica di una certa condizione ipotizzata. La verifica non avviene mai in modo diretto ma attraverso la valutazione di fenomeni strettamente correlati.

TEST di ipotesi Quindi l'esito del test Statistico non da certezza, ma solo una fiducia valutabile in termini di probabilità. In statistica la verifica si effettua mediante dati campionari e poiché manca l evidenza diretta, non avremo certezza ma solo una fiducia più o meno grande nel fatto che la condizione esista.

EPIDEMIOLOGIA: il TEST diagnostico Risultato di un test Positivo Negativo Condizione Clinica ignota Sano falso positivo vero negativo Malato vero positivo falso negativo sensibilità del test la frequenza di risultati veri-positivi specificità del test la frequenza di veri-negativi α la frequenza di falsi-positivi (errore del 1 tipo) β la frequenza di falsi-negativi (errore del 2 tipo)

EPIDEMIOLOGIA: il TEST diagnostico Sensibilità e β sono complementari cioè veri-positivi e falsi-negativi sono complementari. Infatti se un test è sempre giustamente positivo (100% di veri-positivi) non segnalerà mai negatività per errore (0% di falsi negativi). Specificità e α sono complementari cioè veri-negativi e falsi-positivi sono complementari. Infatti se un test è specifico con il 100% di veri-negativi non segnalerà mai positività per errore (0% di falsi-positivi). Quindi dire che un test è specifico è come dire che ha una bassa probabilità di falsi positivi, cioè che α è piccolo

EPIDEMIOLOGIA: il TEST diagnostico In sintesi Condizione Clinica reale ignota H0: Sano H1: Malato Positivo falsi positivi errore α (di 1 tipo) veri positivi Sensibilità Risultato del test Negativo veri negativi Specificità falsi negativi errore β (di 2 tipo) Un test per essere affidabile deve possedere sia un'alta specificità che un'alta sensibilità.

STATISTICA: il TEST d ipotesi Lo schema del test statistico è simile a quello del test diagnostico ma ha la peculiarità di privilegiare l evidenza dei falsi-positivi rispetto ai falsi-negativi L ipotesi di partenza è l ipotesi nulla H0 (cioè l ipotesi dello scettico) quella che nega il risultato, attribuendo le differenze osservate alla naturale variabilità dei fenomeni o al campionamento.

STATISTICA: il TEST d ipotesi Ipotesi nulla H0: le differenze osservate sono dovute al caso l'ipotesi nulla viene mantenuta fino a che le prove o i dati in nostro possesso non siano tali da costringerci a rifiutarla Concediamo quindi fiducia all ipotesi nulla, rifiutandola solo quando l'evidenza dei risultati sia macroscopica, cioè quando la probabilità di falsi-positivi α sia minore del 5%.

Risultato del TEST statistico Il risultato di un test statistico è α ovvero il p-value Ipotesi nulla Condizione reale ignota H0 H1 Risultato del test statistico se α<5% H0 rifiutata se α>=5% H0 accettata Dato significativo Dato non significativo falsi positivi errore di 1 tipo valutato con α veri positivi nessun errore veri negativi nessun errore falsi negativi errore di 2 tipo valutato con β Ipotesi alternativa

TEST di ipotesi Ad esempio : Da un indagine campionaria su 50 soggetti, si è rilevato un tasso di colesterolemia medio pari a 270 mg/dl e deviazione standard =79, sapendo che il tasso medio in soggetti normali è 210 mg/dl vogliamo verificare se questa differenza è dovuta al caso oppure no

IPOTESI NULLA H 0 Per verificare se la colesterolemia media rilevata nel campione, 270 mg/dl sia significativamente diversa dal valore normale 210 mg/dl, si parte dall ipotesi che i due valori medi siano uguali e che la loro differenza è semplicemente dovuta al caso, cioè all errore casuale. Questa ipotesi di partenza viene chiamata IPOTESI NULLA e viene indicata come H 0 quindi: IPOTESI NULLA H 0 I due valori sono uguali e la loro differenza è dovuta al caso

Il test d ipotesi quindi consiste nel dimostrare se H0 èvera Si considera una distribuzione teorica di probabilità e si verifica se la media campionaria è all interno dell intervallo a cui corrisponde il 95% di probabilità oppure è fuori da questo intervallo Regione di Regione di Regione di accettazione rifiuto di H0 rifiuto di H0 Regione di di H0 Regione di Regione di rifiuto di H rifiuto di H 0 accettazione 0 di H 0? 210 270 270 Media normale Media campionaria

La logica del TEST di IPOTESI IPOTESI NULLA H 0 Non c èc nessuna differenza, ovvero la differenza osservata è dovuta al caso Accetto o rifiuto l ipotesi l nulla? Per rispondere effettuo un TEST DI IPOTESI

Errore di 1 tipo: livello di significatività di un test statistico Il livello di significatività di un test statistico è α la probabilità di commettere un errore di 1 tipo ovvero è la probabilità di rifiutare l ipotesi nulla, quando questa è vera Livello di significatività α = P(errore di 1 tipo ) = P(rifiutare H 0 quando H 0 è vera)

Errore di 1 tipo: livello di significatività di un test statistico Il livello di significatività 5% viene adottato molto frequentemente in quanto si ritiene che il rapporto 1/20 (cioè 0.05) sia sufficientemente piccolo da poter concludere che sia piuttosto improbabile che la differenza osservata sia dovuta al semplice caso Ovviamente, se si vuole escludere con maggiore probabilità l'effetto del caso, si adotterà un livello di significatività inferiore (es. 1% )

Test d ipotesi tra 2 medie Per effettuare il test utilizzo una formula chiamata Statistica Test. Nel caso del confronto tra 2 medie la statistica test è la t di Student definita come: t = m 1 m 2 ES Dove m 1 ed m 2 sono le due medie a confronto ES è l Errore Standard calcolato come deviazione standard divisa la radice della numerosità campionaria: : DS/ n

TEST di IPOTESI tra 2 medie: test t di Student confronto tra una media campionaria e una media attesa Esempio Da un indagine campionaria su 50 soggetti, si è rilevato un tasso di colesterolemia medio pari a 270 mg/dl e deviazione standard =79, sapendo che il tasso medio in soggetti normali è 210mg/dl vogliamo verificare se questa differenza è dovuta al caso oppure no t = Gradi di libertà: n-1=50-1=49 Significatività m 1 m 2 ES Valore critico t di student per 49 gradi di liberà 90% 1.299 95% 1.676 97.5% 2.009 99% 2.403 99.5% 2.678 99.75% 2.937 99.9% 3.261 99.95% 3.496 (270-210) = 79/ 50 = 60 7,1 = 8,45 Rifiuto l ipotesi l nulla H 0 : La differenza è statisticamente significatica -1.7 1.7 8,45 ALMA MATER STUDIORUM Università di Bologna

In sintesi il risultato del Test di ipotesi va confrontato con un VALORE CRITICO tabulato in apposite tabelle già definite, che riportano i valori della distribuzione di probabilità per diversi livelli di significatività α e gradi di libertà Se il risultato del test di ipotesi SUPERA il valore critico,, allora la differenza fra i gruppi viene dichiarata statisticamente significativa e, quindi, l'ipotesi NULLA viene RESPINTA. Se il risultato del test di ipotesi È INFERIORE al valore critico,, allora la differenza fra i gruppi viene dichiarata statisticamente NON significativa e, quindi, l'ipotesi NULLA viene ACCETTATA.

Ma cosa sono i gradi di libertà? i gradi di libertà rappresentano il numero di possibilità che i dati che compongono un campione hanno di variare liberamente. In generale si calcolano togliendo dal numero delle unità del campione il numero delle condizioni cui essi sono vincolati. Nel nostro esempio abbiamo 50 valori di colesterolemia, ciascuno dei quali può assumere un valore qualsiasi ed un vincolo, la media deve essere 270, io posso assegnare un valore qualsiasi ai primi 50-1 =49 numeri, ma l'ultimo sarà vincolato dal fatto che la media deve essere 270, quindi in questo caso, i gradi di libertà sono 50-1=49.

La t di Student e i gradi di libertà La distribuzione della t di Student cambia al variare dei gradi di libertà: all aumentare dei gradi di libertà la curva diventa più stretta e più alta!. Per questo motivo quando applichiamo il test t di Student, per trovare il valore critico con cui confrontare il valore della statica test abbiamo bisogno di calcolare i gradi di libertà. Esistono quindi tanti valori critici a seconda dei gradi di libertà

TEST di IPOTESI :test t di Student confronto tra 2 medie campionarie Es. Sono stati rilevati i tempi di ventilazione meccanica, espressi in ore, in due Terapie Intensive post-chirurgiche e si vuole valutare se differiscono in modo significativo. TI a: 5 7 9 7 5 15 6 8 4 7 4 5 5 TI b: 11 10 8 0 17 4 0 22 6 24 0 m a =6,7 e m b =9,3 n a =13 e n b =11 s=5,76 Applicando questa formula Gradi di libertà:(n a -1 )+ (n b -1)=22 Risulta: t=1,09 e confrontando questo valore con quello critico della t di Student corrispondente a 22 gradi di libertà che è 2,07 possiamo dire che la differenza NON è statisticamente significativa con p=0.14 ALMA MATER STUDIORUM Università di Bologna

TEST di IPOTESI :test t di Student confronto tra 2 medie campionarie Il valore della statistica test t di Student è inferiore al valore critico quindi: L ipotesi nulla viene accettata. Questo significa che la differenza nei tempi medi di ventilazione meccanica rilevati nelle due Terapie Intensive è dovuta al caso Risulta: t=1,09 e confrontando questo valore con quello critico della t di Student corrispondente a 22 gradi di libertà che è 2,07 possiamo dire che la differenza NON è statisticamente significativa con p=0.14-2,07 1,09 2,07

Sintesi TEST di IPOTESI IPOTESI NULLA H 0 La differenza è dovuta al caso Accetto o rifiuto l ipotesi l nulla? Per rispondere effettuo un TEST DI IPOTESI Confronto il valore ottenuto dal TEST con dei valori critici già calcolati su apposite tabelle Ipotesi nulla RIFIUTATA differenza significativa Valore del test maggiore Valore critico Valore del test minore Valore critico Ipotesi nulla ACCETTATA differenza NON significativa

Test t di student con SPSS SPSS Click Analizza Confronta medie Test t campioni indipendenti

TEST di IPOTESI :test Chi-quadrato Esempio: Si vuole verificare l efficacia di due diversi farmaci: le differenze sono statisticamente significative, ad un livello di significatività α del 5%? guariti non guariti totali farmaco 1 52 10 62 farmaco2 40 21 61 totali 92 31 123 guariti (farmaco1)=52/62=84% guariti (farmaco2)= 40/61=66% Totale guariti=92/123=74,8% IPOTESI NULLA H 0 : la differenza delle % di guariti è dovuta al CASO, I due farmaci sono ugualmente efficaci Ipotesi Nulla Dati attesi percentuale di guariti del 74,8% per entrambi i farmaci guariti non guariti totali farmaco 1 46 16 62 farmaco2 46 15 61 totali 92 31 123

TEST di IPOTESI :test Chi-quadrato Esempio: Si vuole verificare l efficacia di due diversi farmaci: le differenze sono statisticamente significative, ad un livello di significatività α del 5%? Dati campionari rilevati guariti non guariti totali farmaco 1 52 10 62 farmaco2 40 21 61 totali 92 31 123 Dati attesi sotto l ipotesi nulla guariti non guariti totali farmaco 1 46 16 62 farmaco2 46 15 61 totali 92 31 123 Per ciascuna combinazione farmaco guariti si calcola

TEST di IPOTESI :test Chi-quadrato Ora, confrontando il nostro valore (5.46) con quelli tabulati, notiamo che esso è >3.841 e <6.635. Ciò consente di ritenere che la differenza fra i due gruppi sia significativa al livello di significatività α 5% ma non al livello di significatività 1%. Nel nostro caso, il valore ottenuto è un chiquadrato con «1 grado di libertà»; infatti, per tabelle come quella che stiamo studiando, il grado di libertà è uguale a (numero di righe-1)x(numero di colonne-1).

Osservazioni Nell esempio precedente è stato scelto un livello di significatività α del 5%, cioè si è scelto che il rischio massimo accettabile, di commettere l errore rifiutando l ipotesi nulla, quando questa è vera, è il 5%. la probabilità corrispondente al valore del chi-quadrato 5.46, in corrispondenza di 1 grado di libertà è 0.019 e questo valore prende il nome di p-value. Quindi il p-value della differenza di efficacia dei nostri due farmaci messi a confronto è: p=0.019 che è minore di α=0.05 In sintesi: il p-value p=0.019 minore di 0.05 (del 5%) significa che la probabilità che la differenza riscontrata sia dovuta al caso è minore del 5% ovvero la probabilità che la differenza sia statisticamente significativa è del 95%. Se avessimo scelto un livello di significatività inferiore, ad esempio dell 1% non avremmo riscontrato alcuna differenza significativa nell efficacia dei due farmaci messi a confronto.

IL CHI_QUADRATO e i GRADI DI LIBERTA Anche il chi-quadrato come la t di Student varia al variare dei gradi di libertà. All aumentare dei gradi di libertà la curva diventa più bassa e più larga!

Test CHI-QUADRATO con SPSS SPSS Click Analizza Statistiche descrittive Tavole di contingenza Statistiche click Chi-quadrato

Studio di efficacia: ODDS RATIO Negli studi di efficacia di un trattamento spesso è necessario mettere a confronto gli esiti del gruppo di trattamento con quelli del gruppo di controllo espressi come ODDS Ratio. In questo caso il test di ipotesi deve verificare se l ODDS RATIO è significativamente diverso da 1 Esempio: studio di efficacia di un nuovo trattamento per la prevenzione delle lesioni da pressione Odds Ratio LDP Sì No Trattati 19 121 Controlli 17 115 OR=(19/121)/(17/115)=0,157/0,148=1,06

TEST per verificare la significatività degli ODDS RATIO Il test d ipotesi utilizzato per verificare se un odds ratio è significativamente diverso da 1 e con quale probabilità (p-value) è il test di Cochran Mantel- Heanszel, che è una variante del test chi-quadrato SPSS Click Analizza Statistiche descrittive Tavole di contingenza Statistiche click Chi-quadrato click Statistiche di Cochran e Mantel-Heanszel

TEST per verificare la significatività degli ODDS RATIO OUTPUT di SPSS Stima di Mantel-Haenszel del rapporto odds comune Stima 1,062 ln(stima),060 Errore standard di ln(stima),358 Significatività asintotica (2 sensi),866 Intervallo di confidenza al 95% asintotico Rapporto odds comune ln(rapporto odds comune) Limite inferiore Limite superiore Limite inferiore Limite superiore La stima di Mantel-Haenszel del rapporto odds comune viene distribuita in modo asintotico e normale in base al rapporto odds comune dell'assunzione 1,000, in modo analogo al log naturale della stima.,526 2,144 -,642,763 ODDS RATIO p-value Intervallo di confidenza Poichè il p- value=0,866 ed è superiore a 0,05 l odds ratio non è significativamente diverso da 1 Il rischio di LDP è lo stesso nei due trattamenti

In sintesi per il confronto tra 2 MEDIE Test t di Student per il confronto tra 2 PROPORZIONI o percentuali Test Chi-quadrato per la Significatività degli ODDS RATIO Test di Cochran Mantel Heanszel

Il confronto delle medie tra più di 2 gruppi Esempio: su 272 pazienti sottoposti ad intervento chirurgico si vuole valutare se la degenza media e significativamente diversa tra le classi di età Età N Degenza media Std Dev Minimum Maximum 18-30 anni 14 6.6 5.7 2 18 30-40 anni 28 6.4 4.2 2 24 40-50 anni 55 7.9 3.9 3 18 50-60 anni 54 10.9 10.4 2 53 60-70 anni 71 10.5 7.0 3 41 70-80 anni 41 11.8 8.3 2 42 80-90anni 9 15.9 8.5 4 31 Il Test t di Student può essere utilizzato solo per il confronto tra 2 medie

Il confronto delle medie tra più di 2 gruppi: Analisi della Varianza (ANOVA) L analisi della varianza (in inglese: Analysis of Variance, abbreviata con l acronimo ANOVA) è utilizzata per testare la significatività statistica delle differenze tra medie campionarie sulla base delle rispettive varianze.

Analisi della Varianza (ANOVA) Il principio alla base di questo test è quello di stabilire se due o più medie campionarie possono derivare da popolazioni che hanno la stessa media. Quando le medie sono solamente due è indifferente usare l ANOVA o il test t di Student, mentre dobbiamo necessariamente utilizzare l ANOVA quando le medie sono più di due.

La logica dell ANOVA L'ipotesi alla base dell'analisi della varianza è che : dati n gruppi, la varianza totale può essere suddivisa in due componenti: Varianza interna ai gruppi (anche detta Within) e Varianza tra i gruppi (Between). Varianza totale = Varianza within + Varianza between Ipotesi nulla H0 Varianza between < Varianza within e quindi la differenza tra i gruppi è dovuta alla sola variabilità interna

Analisi della Varianza (ANOVA) Quindi l analisi della varianza si basa sul rapporto Varianza tra i gruppi (Between( Between) Varianza interna ai gruppi (Within( Within) e la significatività è verificata mediante il test F di Fisher

ANOVA in SPSS SPSS Click Analizza Confronta medie ANOVA univariata Il risultato SPSS per l ANOVA sulle degenze medie per gruppi di età durata della degenza (in giorni) Fra gruppi Entro gruppi Totale ANOVA Somma dei Media dei quadrati df quadrati F Sig. 1275.054 6 212.509 3.968.001 14192.226 265 53.556 15467.279 271 le degenze medie sono significativamente diverse tra le classi di età considerate