Analisi della Varianza - II
|
|
|
- Armando Cara
- 9 anni fa
- Visualizzazioni
Transcript
1 Analisi della Varianza - II ANOVA tra i soggetti M Q Cristina Zogmaister Milano-Bicocca 1 Lez: XXIX
2 Analisi della Varianza (ANOVA, Analysis of Variance) Obiettivo - Confrontare due o più gruppi per stabilire se differiscono significativamente nella media di una (ANOVA, ANCOVA) o più variabili (MANOVA) Tipi - ANOVA a una via - Una sola V.I., una sola V.D. - ANOVA fattoriale - Più di una V.I., una sola V.D. - ANCOVA (Analysis of Covariance; Analisi della Covarianza) - Presenza di Covariate (variabili di cui si desidera controllare statisticamente l effetto sulla V.D.) - MANOVA (Multivariate Analysis of Variance; ANOVA multivariata) - Più di una V.D. ANOVA tra i soggetti (between subjects), entro i soggetti (within subjects), ANOVA mista 2 Lezione: XXVIII
3 ANOVA a una via tra i soggetti - Esempio Studio sui consumi - Obiettivo: studiare il livello di soddisfazione degli acquirenti di 4 tipi di automobili di media cilindrata (per semplicità indichiamo il marchio), a un anno dall acquisto. - Intervista a 20 acquirenti per ogni marchio, calcolo di un indicatore di soddisfazione H 0 : μ 1 = μ 2 = μ 3 = μ 4 Fattore MODELLO D AUTOMOBILE x ij = μ + α i + ε ij x ij = X + (X i X) + (X ij X i ) DEVIANZA (= SOMMA DEI QUADRATI, SQ) = x i X 2 i SQ TOT SQ TRA SQ ENTRO 3 Lezione: XXVIII
4 ANOVA a una via la VARIANZA Possiamo stimare la varianza (MQ = media dei quadrati) - Varianza totale: MQ TOT = SQ TOT (N 1) - Varianza entro: MQ ENTRO = SQ ENTRO (N k) - Varianza tra: MQ TRA = SQ TRA (k 1) N = numerosità complessiva; k = numero di livelli Il rapporto F F = MQ TRA MQ ENTRO F è il rapporto tra la varianza stimata a partire dalla variabilità tra le condizioni e la varianza stimata a partire dalla variabilità entro le condizioni. Se è vera H 0 allora questo rapporto dovrebbe approssimarsi a 1. Segue la distribuzione F di Fisher. 4 Lezione: XXVIII
5 ANOVA Torniamo al nostro esempio H 0 : μ 1 = μ 2 = μ 3 = μ 4 Ipotesi alternativa: almeno una delle medie, nella popolazione, è diversa dalle altre SQ MQ F = MQ TRA MQ ENTRO = = Lezione: XXVIII
6 ANOVA Ampiezza dell effetto Eta quadrato: la proporzione di variabilità osservata attribuibile al fattore η 2 = SQ EFFETTO SQ TOTALE = = Lezione: XXVIII
7 ANOVA - assunzioni Distribuzione normale della V.D. entro le condizioni Omoschedasticità (= varianza uguale in ogni condizione) - La violazione di queste assunzioni provoca problemi soprattutto se il disegno non è bilanciato (ossia se il numero di soggetti varia molto da cella a cella) - Il problema è che il livello nominale di significatività è distorto Indipendenza degli errori: il punteggio di un soggetto non deve essere correlato con quello di altri soggetti. Violazione Esempio 1 : voglio valutare l effetto di due diverse modalità di insegnamento della statistica. Prendo due classi preesistenti, a una insegno nel modo A, all altra nel modo B. Non va bene perché gli appartenenti a uno stesso gruppo possono essere in partenza più simili tra loro e l errore non è indipendente Violazione Esempio 2: un soggetto contribuisce più di un valore (es. un soggetto è misurato nella condizione A e anche nella condizione B). Conseguenze della violazione: Il livello nominale di significatività è distorto. L effetto dei fattori è additivo Esempio di effetto potenzialmente non additivo: uno spot provoca un incremento nei consumi del 10% rispetto al consumo di base (ossia, un incremento di 5 in chi già consumava 50, un incremento di 2 in chi consumava 20). Soluzione: trasformare la variabile per avere un effetto additivo. 7
8 ANOVA a una via interpretazione Possiamo rigettare H 0 : μ 1 = μ 2 = μ 3 = μ 4 : - la probabilità di osservare le differenze che abbiamo osservato tra le medie dei 4 campioni è molto bassa, se provengono tutti da una stessa popolazione. - Il fattore marca ha un effetto statisticamente significativo sul grado di soddisfazione dei clienti. Il livello di soddisfazione è influenzato dalla marca acquistata. Possiamo allora affermare che tutte le medie differiscono significativamente tra loro? No: sappiamo che almeno una differisce significativamente dalle altre. 8
9 ANOVA a una via interpretazione Possiamo fare 6 t-test e vedere quali differenze tra le marche sono staticamente significative? Sì, ma dobbiamo considerare che i 6 t-test non sono indipendenti. Perciò fare 6 t-test porterebbe a un aumento del livello reale di probabilità d errore nel rigettare H 0 Dobbiamo apportare una correzione per tenere conto di questo rischio: Confronti post hoc 9
10 ANOVA confronti post hoc post hoc = dopo il fatto (non abbiamo ipotesi a priori) confronto tra diversi livelli di un fattore, effettuato dopo un analisi iniziale dei dati. nei confronti post hoc generalmente ogni media viene confrontata con tutte le altre. aumentando il nr. di confronti, aumenta la probabilità che almeno uno risulti significativo per caso dobbiamo apportare delle correzioni alla significatività di ogni singolo test. DISUGUAGLIANZA DI BONFERRONI: Dati c confronti post hoc, probabilità che almeno uno sia significativo per caso c * α c dove α c è il valore che adotto per decidere se il singolo confronto è significativo. Anche se ci limitassimo a confrontare, per esempio, la condizione Audi e la condizione Peugeot perché sono le più estreme, avremmo implicitamente fatto anche tutti gli altri 5 confronti Scelgo il valore α c = α / c Esempio: se il nr di confronti totale è 6 e voglio che il valore complessivo α =.05, per ciascun confronto giudico la differenza come significativa solo se p < (.05 /6), ossia se p < = criterio di Bonferroni 10
11 ANOVA confronti post hoc SPSS offre anche altre possibilità Esempi: - Scheffè confronti tra tutti i gruppi - Dunnett quando uno dei gruppi assume il ruolo di controllo [tutti gli altri gruppi vengono confrontati con il gruppo di controllo 11
12 12
13 ANOVA confronti post hoc Nota: i valori di p riportati da SPSS nel caso dei confronti post hoc contengono già la correzione per il numero di confronti effettuati. Tenendo conto del che sono stati fatti 6 confronti a coppie, la probabilità di osservare una differenza di 4.54 o superiore tra il grado di soddisfazione nelle due condizioni se le due medie nella popolazione non differiscono è uguale a.043. Se avessimo effettuato un t-test senza la correzione di Bonferroni: 13
14 ANOVA a una via riportare i risultati Il livello di soddisfazione dei clienti, a un anno dall acquisto, è significativamente diverso a seconda del modello acquistato, F (3,76) = 16.55, p <.001, η 2 =.39. Le principali statistiche descrittive (medie e deviazioni standard) relative all indice di soddisfazione, a seconda della condizione sperimentale, sono riportate nella tabella 1. I risultati dei test post hoc (eseguiti apportando la correzione di Bonferroni) sono riportati nella tabella 2. Essi evidenziano una differenza significativa tra le valutazioni medie della marca Peugeot e quelle delle altre marche. Anche la differenza tra l indice medio di soddisfazione degli acquirenti Audi e degli acquirenti BMW è significativa. Nessun altra differenza si è rivelata significativa ai test post hoc. 14
15 Contrasti pianificati Il ricercatore ha ipotesi a priori circa le differenze tra le medie. si decide in anticipo quali medie verranno confrontate. Esempio: programma di formazione. Ipotizzo che se, durante il corso, viene fornito un feedback sulla prestazione, questo influenzi l efficacia del corso. Ipotizzo che l effetto del feedback sia diverso se è orale o scritto. 3 condizioni: A: condizione di controllo (nessun feedback) B: condizione feedback orale C: condizione feedback scritto Devo fare 2 confronti: Tra A e (B + C) per verificare l effetto del feedback Tra B e C per testare il modo in cui viene fornito provoca differenze Non è necessario effettuare prima l ANOVA omnibus (è possibile testare subito le differenze d interesse) 15
16 Contrasti pianificati - II 1) Stabilire le ipotesi da testare Nel nostro caso: a) La media del gruppo A non è diversa dalla media complessiva dei gruppi B e C b) La media del grupppo B non è diversa dalla media del gruppo C 2) Assegnare dei coefficienti dei contrasti = tradurre le ipotesi in contrasti l a 1 1 a 2 2 a t t che soddisfano il requisito t a i i 1 0 Nel nostro caso: a) μ A non è diversa da μ B+C allora 2 * μ A = μ B + μ C 2 * μ A 1* μ B 1* μ C = 0 e il primo contrasto è l1 2 ( 1) ( 1) b) se μ B non è diversa da μ C allora μ B = μ C 1 * μ B 1* μ C = 0 A B C e il secondo contrasto è l 2 0* A 1* B ( 1) * C 16
17 Contrasti pianificati - II 3) Verificare che i contrasti siano ortogonali l l 1 2 A ( 1) B ( 1) 2 0* 1* ( 1) * A B C C t a i i 1 0 Contrasti ortogonali: forniscono informazioni indipendenti (cioè i risultati del primo non consentono di ottenere indicazioni sul secondo, e vice versa). Dati k livelli di un fattore, possiamo ottenere al massimo (k-1) contrasti ortogonali. Come si testa l ortogonalità: la somma dei prodotti dei coefficienti relativi a due contrasti è uguale a zero. t l * l a b a b a b a b t t i i i 1 17 l 1 * l 2 2*0 ( 1)*1 ( 1)*( 1) 0 ( 1) 1 0 0
18 Importanza dell ortogonalità tra tutti i (k-1) contrasti Se i (k-1) contrasti sono tutti ortogonali tra loro, allora la somma delle loro devianza ( SQ l ) corrisponde alla devianza osservata tra i gruppi ( SQ TRA ) In altre parole: la variabilità dell effetto può essere ripartita tra i (k-1) contrasti lineari che forniscono così (k-1) elementi di informazione indipendenti sulle medie. 18
19 Esempio di contrasti non-ortogonali Confronto condizione di controllo con condizione feedback orale Confronto condizione di controllo con condizione feedback scritto l 3 ( 1) A ( 1) B l 4 1* A ( 1) * C Entrambi i contrasti sono formalmente corretti, ma non sono ortogonali tra loro. 19
20 Contrasti pianificati - esempio Esempio: programma di formazione. Ipotizzo che se, durante il corso, do un feedback sulla prestazione, questo abbia effetti sull efficacia del corso. Ipotizzo che gli effetti sull efficacia siano influenzati conoscere il modo in cui viene valutata la prestazione. 3 condizioni: A: condizione di controllo (nessun feedback) B: condizione feedback orale C: condizione feedback scritto l 1 2 A ( 1) B ( 1) l 0* 2 A B 1* ( 1) * C C 20
21 Contrasti pianificati esempio Con i post-hoc avrei ottenuto risultati diversi 3 condizioni: A: condizione di controllo (nessun feedback) B: condizione feedback orale C: condizione feedback scritto Se avessi effettuato un ANOVA con test post hoc, avrei concluso che non ci sono differenze significative tra le due condizioni feedback orale e feedback scritto. I contrasti pianificati mostrano che la differenza tra queste due condizioni è significativa. Se ho chiare ipotesi a priori, i contrasti pianificati sono più potenti (preferibili). 21
22 ANOVA fattoriale tra i soggetti (between subjects) ANOVA fattoriale = ci sono due o più variabili indipendenti (fattori) Esempio: soddisfazione degli acquirenti di 4 modelli di automobili di media cilindrata, di sesso femminile e maschile tra i soggetti: ogni soggetto viene assegnato a una sola cella (condizione) Lezione: 22 XXIX
23 ANOVA fattoriale tra i soggetti (between subjects) ANOVA fattoriale = ci sono due o più variabili indipendenti (fattori) Esempio: soddisfazione degli acquirenti di 4 modelli di automobili di media cilindrata, di sesso femminile e maschile tra i soggetti: ogni soggetto viene assegnato a una sola cella (condizione) Lezione: 23 XXIX
24 ANOVA fattoriale - vantaggi Vantaggi dei disegni fattoriali Consentono lo studio dell interazione Aumentano la potenza del test (cioè la probabilità di rilevare un effetto, se l effetto è presente) perché consentono di ridurre la varianza d errore (cfr. slides successive) 24
25 ANOVA fattoriale effetti principali e interazioni Effetto principale: effetto medio di un fattore sulla V.D., senza considerare i livelli degli altri fattori. C è un effetto del tipo di modello sul grado di soddisfazione. Non c è un effetto significativo del sesso dell acquirente Interazione: L effetto di un fattore sulla V.D. è diverso ai diversi livelli dell altro fattore L effetto del tipo di modello è influenzato dal sesso dell acquirente 25
26 ANOVA fattoriale le ipotesi Effetti principali Gli effetti principali fanno riferimento alle medie marginali H 0 : μ audi = μ bmw = μ peugeot = μ citroen H 0 : μ donne = μ uomini Interazioni fanno riferimento alle differenze tra le medie nelle diverse combinazioni sperimentali H 0 : (μ donne - μ uomini ) audi = (μ donne - μ uomini ) bmw = (μ donne - μ uomini ) peugeot = (μ donne - μ uomini ) citroen 26
27 ANOVA fattoriale interpretazione dei risultati Non c è un effetto principale del sesso: non possiamo rifiutare l ipotesi nulla che il sesso non incida sul livello medio di soddisfazione, F(1,72) = 1,14, p =.29. C è un effetto principale del modello: in generale l indice di soddisfazione è influenzato dal modello acquistato, F(3,72) = 19.52, p <.001, η 2 p =.45. L effetto del modello è qualificato da un interazione significativa, F(3,72) = 5.50, p =.002, η 2 p =.19 - Quando c è un interazione significativa, bisogna sempre interpretare gli effetti principali alla luce di tale interazione. 27
28 ANOVA fattoriale e interazione Se l interazione è significativa gli effetti principali vanno interpretati discutendo anche le interazioni. L effetto principale di un fattore potrebbe verificarsi solo su un livello dell altro fattore: 28
29 ANOVA fattoriale e interazione gli effetti semplici Come interpretiamo l interazione significativa? Scomponiamo il disegno e analizziamo gli effetti semplici. - Effetti semplici: effetti di un fattore sulla V.D., separatamente per i diversi valori dell altro fattore. - Analizziamo l effetto del fattore Modello separatamente per i diversi livelli del fattore Sesso. 29
30 ANOVA fattoriale e interazione gli effetti semplici 30
31 Nel caso delle donne, tutti i confronti a coppie sono significativi, tranne quello tra audi e citroen. Nel caso degli uomini, solo il confronto tra Peugeot e le altre marche è significativo. 31
32 ANOVA fattoriale - interpretazione Se l interazione non è significativa Vanno analizzati e discussi gli effetti principali (con i contrasti pianificati o con i confronti post hoc, a seconda della presenza o meno di ipotesi a priori). Esempio: in un negozio d abbigliamento si vuole testare l effetto del tipo di servizio dato al cliente (a. cliente autonomo nel cercarsi i capi e provarli, b. viene fornita assistenza solo se richiesta, c. i commessi servono il cliente) sulla spesa media effettuata. Viene considerato anche il sesso dell acquirente. 32
33 ANOVA fattoriale - interpretazione Le donne, mediamente, hanno speso più degli uomini. L ANOVA fattoriale tra i soggetti rivela che l effetto principale del sesso è significativo, F (1, 54) = 64,65, p <.001, η p2.=.54. Anche l effetto principale del tipo di servizio è significativo, F (2, 54) = , p <.001, η p2.=.46. L interazione invece non si è rivelata statisticamente significativa, F (2, 54) = 2.11, p =.13. L effetto principale del tipo di servizio è stato ulteriormente indagato attraverso dei confronti multipli post hoc (correzione di Bonferroni). 33
34 ANOVA fattoriale - interpretazione I test post hoc hanno evidenziato che tutte e tre le medie di acquisto sono significativamente diverse tra loro, tutti i p <
35 ANOVA fattoriale la scomposizione della varianza Il modello teorico dell ANOVA a una via tra i soggetti: x ij = μ + α i + ε ij Nell ANOVA fattoriale: x ij = μ + α i + β j + φ ij + ε ijk dove - α i = μ i - μ rappresenta l effetto del livello i del fattore A - β j = μ j - μ rappresenta l effetto del livello j del fattore B - φ ij = μ ij - μ (α i + β j ) rappresenta l effetto dell interazione: quella parte dello scostamento della media della cella ij dalla media generale che non dipende né dal fattore A, né dal fattore B. - ε ijk rappresenta l errore 35
36 ANOVA fattoriale la scomposizione della varianza Nell ANOVA fattoriale x ij = μ + α i + β j + φ ij + ε ijk per esaminare empiricamente il modello consideriamo le stime campionarie dei suoi parametri: x ij = X + (X Ai X) + (X Bj X) + (X AiBj + X X Ai X Bj ) + (X ij X ij ) SQ TOT g.l.: N - 1 SQ ENTRO SQ TRA g.l.: N a*b SQ A SQ B SQ A * B g.l.: a 1 g.l.: b 1 g.l.: (a 1)*(b 1) 36
37 ANOVA fattoriale la scomposizione della varianza SQ TOT g.l.: N - 1 SQ ENTRO SQ TRA g.l.: N a*b SQ A SQ B SQ A * B g.l.: a 1 g.l.: b 1 g.l.: (a 1)*(b 1) MQ = SQ / g.l. F A = MQ A / MQ ENTRO F B = MQ B / MQ ENTRO F A*B = MQ A*B / MQ ENTRO Vantaggio dell ANOVA fattoriale: SQ ENTRO e MQ ENTRO sono tipicamente più piccole che nell ANOVA a una via perché alcune fonti di variabilità non sono più d errore. Questo aumenta la potenza del test. 37
38 ANOVA fattoriale perché aumenta la potenza del test La devianza d errore diminuisce Perché l altro fattore e l interazione spiegano parte della variabilità. Anche i g.l. dell errore diminuiscono, ma [se l altro fattore ha degli effetti sulla V.D.] questa diminuzione è più che compensato dalla diminuzione della devianza. L effetto del fattore A emerge ancora più chiaramente. 38
Analisi della varianza
1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della
L analisi della Varianza (ANOVA): i disegni fattoriali tra i soggetti
Lezione 14 L analisi della Varianza (ANOVA): i disegni fattoriali tra i soggetti Argomenti della lezione: Effetti principali e interazioni Analisi dei disegni fattoriali Disegni fattoriali (o a più vie):
Analisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
Analisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
Analisi della Varianza - III
Analisi della Varianza - III Analisi Multivariata della Varianza (MANOVA, Multivariate Analysis of Variance) M Q Cristina Zogmaister Milano-Bicocca 1 Lez: XXXII Analisi Multivariata della Varianza (MANOVA)
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
Tecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 05-Anova (bozza) (vers. 1.0, 27 novembre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2015-16
ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.
Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
Premessa: la dipendenza in media
Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa
Analisi della Varianza Fattoriale
Analisi della Varianza Fattoriale AMD Marcello Gallucci [email protected] Ripasso dell ANOVA Lo studio degli effetti di una serie di variabili indipendenti nominale (gruppi) su un variabile dipendente
ESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti.
ESERCIZIO. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con fattori tra i soggetti. Variabile dipendente: PERF Sorgente Modello corretto Intercept SEX_96
ANALISI DELLA VARIANZA A DUE VIE CON INTERAZIONE Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 ANALISI DELLA VARIANZA A DUE VIE CON INTERAZIONE Prof. Antonio
Analisi della varianza: I contrasti e il metodo di Bonferroni
Analisi della varianza: I contrasti e il metodo di Bonferroni 1 Contrasti In molti problemi risulta importante stabilire, nel caso venga rifiutata l ipotesi nulla, di uguaglianza delle medie µ j delle
Il modello lineare misto
Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 15 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica
Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
Introduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci [email protected] Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello
Test F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
Esercizi riassuntivi di Inferenza
Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del
Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Statistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,
i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI
PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione
Ulteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
Tecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.0, 3 dicembre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2015-16
Gli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
Statistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
Esercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
Tecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 06-Anova per misure ripetute (vers. 1.0a, 1 dicembre 2016) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
L'ANALISI DELLA VARIANZA (ANOVA, Analysis of Variance)
L'ANALISI DELLA VARIANZA (ANOVA, Analsis of Variance) Scopo dell analisi della varianza: verificare ipotesi relative a differenze tra medie di due o più popolazioni. Variabile dipendente: su scala a intervalli
3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
Approssimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
C.I. di Metodologia clinica
C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni
Analisi della varianza
Analisi della varianza Analisi della varianza L analisi della varianza (ANOVA, ANalysis Of VAriance) è una tecnica di analisi dei dati che consente di verificare ipotesi relative a differenze tra le medie
X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica
Corso di Calcolo delle Probabilità e Statistica II Parte - STATISTICA X Lezione Analisi della varianza Esempi e esercizi 1 Argomenti della X Lezione Tests per il confronto di più medie: ANOVA Utilità e
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.
Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi
Concetti principale della lezione precedente
Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale
Contrasti e confronti multipli
Contrasti e confronti multipli Andrea Onofri 25 gennaio 2012 Indice 1 Introduzione 1 2 I contrasti pianificati 2 Test di confronto multiplo 4 4 Limitazione delle MCP 5 5 Scegliere la MCP 7 Sommario Scopo
LEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
8. ANALISI DELLA COVARIANZA (ANCOVA)
8. ANALISI DELLA COVARIANZA (ANCOVA) L analisi della covarianza è un metodo statistico che risulta dalla combinazione dell analisi di regressione con l analisi della varianza. È utile quando all analisi
ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1
. Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci
Corso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
Il confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo
TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di
I TEST STATISTICI. dott.ssa Gabriella Agrusti
I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire
Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)
Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,
Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci
Misure Ripetute Analisi dei dati in disegni di ricerca con misure ripetute Marcello Gallucci Introduzione Consideriamo una ricerca in cui un gruppo di pazienti è sottoposto ad un trattamento terapeutico
b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):
ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
Gestione ed Analisi Statistica dei dati
Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 12 giugno 2014 TEST di ipotesi Finora abbiamo visto
Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
Principi di analisi causale Lezione 3
Anno accademico 2007/08 Principi di analisi causale Lezione 3 Docente: prof. Maurizio Pisati Approccio causale Nella maggior parte dei casi i ricercatori sociali utilizzano la regressione per stimare l
Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
Metodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)
STATISTICA (2) ESERCITAZIONE 5 26.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un azienda che
Esercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
Esercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
Test d Ipotesi Introduzione
Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto
Il test (o i test) del Chi-quadrato ( 2 )
Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
ANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
Schema lezione 5 Intervalli di confidenza
Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari
b) Calcolare la devianza tra i gruppi (devianza esterna), la devianza entro i gruppi (devianza interna) e la devianza totale
ESERCIZIO 1 La tendenza recente del mercato dell auto vede i veicoli SUV ed i fuoristrada sempre di più soppiantare le macchine tradizionali. Il loro utilizzo, soprattutto nei centri cittadini, viene criticato
STATISTICA ESERCITAZIONE
STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in
STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
SCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
Matematica II: Calcolo delle Probabilità e Statistica Matematica
Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente
STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA
STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di
Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003
Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore
Modelli a effetti misti
Probabilità e Statistica per l analisi di dati sperimentali Modelli a effetti misti Sviluppo e gestione di Data Center per il calcolo scientifico ad alte prestazioni Master Progetto PRISMA, UniBA/INFN
Intervallo di confidenza
Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima
Caratterizzazione dei consumi energetici (parte 3)
ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale
Esercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
L indagine campionaria Lezione 3
Anno accademico 2007/08 L indagine campionaria Lezione 3 Docente: prof. Maurizio Pisati Variabile casuale Una variabile casuale è una quantità discreta o continua il cui valore è determinato dal risultato
Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016
Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione
ANALISI DELLA VARIANZA
ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di
PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07
PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 006/07 Esercizio 1 Prova scritta del 16/1/006 In un ufficio postale lavorano due impiegati che svolgono lo stesso compito in maniera indipendente, sbrigando
Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione
Consentono di descrivere la variabilità all interno della distribuzione di requenza tramite un unico valore che ne sintetizza le caratteristiche CAMPO DI VARIAZIONE DIFFERENZA INTERQUARTILE SCOSTAMENTO
Statistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: [email protected] 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
