Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza (ANOVA)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza (ANOVA)"

Transcript

1 Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza (ANOVA) Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze mattei@disia.unifi.it LM 88 SOCIOLOGIA E RICERCA SOCIALE A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 1 / 95

2 Confronto fra gruppi: Analisi della Varianza (ANOVA) Confrontare g (sotto-)popolazioni Obiettivo: Stabilire se le g popolazioni sono identiche Confronto tra g campioni: I g campioni provengono dalla stessa popolazione o da popolazioni aventi un parametro caratteristico di uguale valore? Esiste evidenza (significatività statistica) che le osservazioni campionarie siano generate da g popolazioni diverse? Valutare se le variazioni osservate su una variabile risposta siano dovute alle differenti situazioni sperimentali riguardanti uno, due, o più fattori ritenuti influenti A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 2 / 95

3 Fattori Si dice fattore una variabile esplicativa discreta con un certo numero finito g di modalità chiamate livelli. Un fattore può rappresentare un trattamento: variabile le cui modalità sono assegnate ad ogni individuo/unità secondo opportune regole di assegnazione Un fattore può rappresentare un carattere intrinseco come l età o il sesso di un individuo Un fattore può rappresentare un raggruppamento arbitrario delle unità come, ad esempio, i blocchi di un esperimento o delle zone geografiche Il livelli del fattore sono considerati su scala nominale, ma verranno per comodità indicati con numeri interi i = 1,..., g A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 3 / 95

4 Esempi Sperimentazione agraria finalizzata a valutare come varia la produzione di mais a seconda del tipo di fertilizzante impiegato Fertilizzante (A,B,C) = Fattore a 3 livelli Produzione di mais (per unità di superficie) = Variabile risposta Una ditta che produce elettrodomestici ha condotto un esperimento su 5 prototipi di lavatrice, misurando il loro livello di rumorosità durante alcune prove di lavaggio: l obiettivo è quello di individuare il prototipo a cui è associata una minore rumorosità Prototipo di lavatrice = Fattore a 5 livelli Rumorosità = Variabile risposta Un eccessiva presenza di ozono nell aria è indice di inquinamento atmosferico. In relazione a ciò, sono stati raccolti ed esaminati sei campioni di aria per quattro luoghi diversi. Sito = Fattore a 4 livelli Quantitativi di ozono rilevati = Variabile risposta (in parti per milione) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 4 / 95

5 Ozono Quantitativi di ozono rilevati (in parti per milione) in quattro diversi siti Siti Osservazioni Le unità sperimentali sono costituite dalle 24 operazioni di misurazione dell ozono Il fattore studiato è la localizzazione: i 4 siti in cui sono state effettuate le osservazioni In ogni sito si sono effettuate 6 misurazioni: campioni casuali della stessa ampiezza, pari a 6, da ogni popolazione (sito) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 5 / 95

6 Capacità cognitive dei bambini I dati seguenti riguardano uno studio condotto per confrontare l effetto di diversi programmi di assistenza all infanzia (fattore a 3 livelli) sulle capacità cognitive di bambini tra 3 e 4 anni I bambini sono suddivisi in tre gruppi: 1. No Programma: Bambini che non frequentano l asilo; 2. Programma Standard: Bambini che frequentano asili in cui è adottato il programma educativo standard; 3. Programma innovativo: Bambini che frequentano asili in cui è adottato un programma educativo innovativo, Al termine dell anno scolastico viene somministrato un test a tutti i bambini per rilevare le loro capacità cognitive A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 6 / 95

7 Capacità cognitive dei bambini (Dati simulati) No Programma Programma Standard Programma Innovativo A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 7 / 95

8 Schematizzazione dei dati negli studi a un solo fattore Fattore Osservazioni oppure 1 y 11 y y 1i... y 1n1 2 y 21 y y 2i... y 2n2... g y g1 y g2... y gi... y gng Livelli del fattore g y 11 y y g1 y 12 y y g2... y 1i y 2i... y gi y 1n1 y 2n2... y gng A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 8 / 95

9 Schematizzazione dei dati negli studi a un solo fattore oppure Unità Variabile risposta Livelli del u i y i fattore 1 y y 2 1 n 1 y n1 1 n y n n y n n 1 + n 2 y n1 +n 2 2 i y i l n y n g A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 9 / 95

10 Assunzioni Sono disponibili g campioni casuali semplici indipendenti di numerosità n 1,..., n g Y 11,..., Y 1n1 ; Y 21,..., Y 2n2 ;... Y 1g,..., Y gng Ogni campione è tratto da una distribuzione normale di media µ l (l = 1,..., g) e varianza costante σ 2 (ipotesi di omoschedasticità) Y li N(µ l, σ 2 ) i = 1,..., n l µ 1 µ 2 µ 3 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 10 / 95 y

11 Medie campionarie Medie entro gruppi Media globale dove n = n 1 + n n g ˆµ 1 = Y 1 = 1 n 1 1 ˆµ l = Y l = n l 1 ˆµ g = Y g = g n g ˆµ = Y = 1 Y li = 1 n i=1 n l=1 n l n 1 Y 1i i=1 n l Y li i=1 n g Y gi i=1 g l=1 Y l n l A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 11 / 95

12 Medie campionarie: Capacità cognitive dei bambini No Programma Programma Standard Programma Innovativo Totale n l Medie A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 12 / 95

13 Medie campionarie: Capacità cognitive dei bambini n = = 33 g n l ˆµ = Y = 1 n l=1 i=1 Y li = = ˆµ = = 1 n g l=1 Y l n l = = = = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 13 / 95

14 Varianze campionarie Varianze entro gruppi S1 2 = Sl 2 = Sg 2 = 1 n 1 (Y 1i Y 1 ) 2 n 1 1 i=1 1 n l (Y li Y l ) 2 n l 1 i=1 1 n g (Y gi Y g ) 2 n g 1 i=1 Varianza totale (marginale) 1 n 1 g n l (Y li Y ) 2 l=1 i=1 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 14 / 95

15 Varianze entro gruppi: Capacità cognitive dei bambini No Programma Programma Standard Programma Innovativo n l Medie Varianze A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 15 / 95

16 Varianza entro il gruppo di bambini con programma innovativo Gruppo 3: Programma Innovativo Bambino y 3,i (y 3,i y 3 ) Totale y 3 = s 2 1 = = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 16 / 95

17 Varianza campionaria: Capacità cognitive dei bambini n = 33 Y = = n 1 g n l (Y li Y ) 2 = l=1 i= [( )2 + + ( ) 2 + ( ) ( ) 2 + ( ) ( ) 2 ] = = = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 17 / 95

18 Devianze Devianza totale (Somma dei quadrati totale) g n l D T = (Y li Y ) 2 = l=1 i=1 n 1 i=1 n l (Y 1i Y ) (Y gi Y ) 2 Devianza entro gruppi (Somma dei quadrati entro gruppi): Somma delle devianze entro gruppi g n l D W = (Y li Y l ) 2 = l=1 i=1 g l=1 dove D l = n l (Y li Y l ) 2 = sl 2 (n l 1) i=1 Devianza tra gruppi (Somma dei quadrati tra gruppi): Devianza delle medie entro gruppi D B = g l=1 (Y l Y ) 2 n l = (Y 1 Y ) 2 n (Y g Y ) 2 n g A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 18 / 95 D l i=1

19 Devianze: Capacità cognitive dei bambini Gruppo n l Media Devianza sl 2 No programma Programma standard Programma innovativo Tutti D T = = D W = = D B = ( ) ( ) ( ) 2 11 = = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 19 / 95

20 Scomposizione della devianza Devianza Totale = Devianza entro gruppi + Devianza tra gruppi Somma dei Quadrati Totale = Somma dei Quadrati Entro Gruppi = Somma dei Quadrati Tra Gruppi D T = D W + D B Esempio: Capacità cognitive dei bambini D T = = = D W + D B A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 20 / 95

21 Varianza tra gruppi Varianza tra gruppi = Devianza tra gruppi gdl B = Media dei quadrati tra gruppi In formule S 2 B = D B g 1 Esempio: Capacità cognitive dei bambini s 2 B = = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 21 / 95

22 Varianza entro i gruppi Varianza entro i gruppi = In formule Devianza entro i gruppi gdl W S 2 = D W n g = Media dei quadrati entro i gruppi Varianza entro i gruppi = Media ponderata delle varianze entro i singoli gruppi dove S 2 = S 2 1 (n 1 1) + S 2 2 (n 2 1) + + S 2 g (n g 1) (n 1 1) + (n 2 1) + + (n g 1) (n 1 1) + (n 2 1) + + (n g 1) = (n 1 + n n g ) g = n g La varianza entro i gruppi, S 2, è uno stimatore della varianza σ 2 comune (pooled) delle popolazioni da cui sono estratti i g campioni A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 22 / 95

23 Varianza entro i gruppi Esempio: Capacità cognitive dei bambini s 2 = = [ (8 1) (14 1) (11 1)] 30 = dove 30 = 33 3 = (8 1) + (14 1) + (11 1) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 23 / 95

24 Scomposizione della devianza: sintesi Fonte di Somma dei Media dei Variabilità Quadrati GdL Quadrati Tra Gruppi D B g 1 D B /(g 1) Entro i Gruppi D W n g D W /(n g) Totale D T n 1 D T /(n 1) Esempio: Capacità cognitive dei bambini Fonte di Somma dei Media dei Variabilità Quadrati GdL Quadrati Tra Gruppi D B = g 1 = 3 1 = Entro i Gruppi D W = n g = 33 3 = Totale D T = n 1 = 33 1 = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 24 / 95

25 Varianza spiegata e varianza residua La varianza tra gruppi, varianza delle medie entro i gruppi, viene anche detta varianza spiegata La varianza spiegata rappresenta la parte di variabilità totale riprodotta dalle medie condizionate La varianza entro gruppi, media ponderata delle varianze entro i gruppi, viene anche detta varianza residua La varianza residua rappresenta la parte di variabilità totale non spiegata dai gruppi Misura la variabilità interna alle distribuzioni condizionate rispetto alle proprie medie A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 25 / 95

26 Varianza spiegata e varianza residua µ 1 µ 2 µ 3 y µ 1 µ 2 µ 3 y A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 26 / 95

27 Verifica di ipotesi per l uguaglianza tra le medie Sistema di ipotesi Statistica test H 0 µ 1 = µ 2 =... = µ g versus H a Almeno un uguaglianza in H 0 è falsa F = Varianza tra gruppi Varianza entro i gruppi = D B/(g 1) D W /(n g) Sotto H 0 F F (g 1),(n g) Regione di rifiuto al livello di significatività α RC α F f (g 1),(n g) (α) dove f (g 1),(n g) (α) Pr(F (g 1),(n g) f (g 1),(n g) (α)) = α p value = Pr(F (g 1),(n g) F oss ; H 0 ) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 27 / 95

28 Tavola ANOVA Fonte di Somma dei Media dei Variabilità Quadrati GdL Quadrati F-value p value Tra Gruppi D B g 1 s 2 B = D B/(g 1) s 2 B /s2 p value Entro i Gruppi D W n g s 2 = D W /(n g) Totale D T n 1 D T /(n 1) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 28 / 95

29 Verifica di ipotesi per l uguaglianza tra le medie Esempio: Capacità cognitive dei bambini Sistema di ipotesi H 0 µ 1 = µ 2 = µ 3 versus H a Almeno un uguaglianza in H 0 è falsa (µ 1 µ 2 oppure µ 1 µ 3 oppure µ 2 µ 3 ) Statistica test F oss = /(3 1) /(33 3) = = Sotto H 0, F F (3 1),(33 3) Regione di rifiuto al livello di significatività α = 0.05 RC 0.05 F f (3 1),(33 3) (0.05) = F oss = > = f (3 1),(33 3) (0.05) I dati mostrano evidenza contro l ipotesi nulla al livello di significatività del 5% p value = Pr(F (3 1),(33 3) 6.215; H 0 ) = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 29 / 95

30 Tavola ANOVA Esempio: Capacità cognitive dei bambini Fonte di Somma dei Media dei Variabilità Quadrati GdL Quadrati F-value p value Tra Gruppi Entro i Gruppi Totale A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 30 / 95

31 Test per la differenza tra le medie Popolazioni Normali e varianze ignote ma uguali Popolazioni: Y 1 N(µ 1, σ 2 1 ) versus Y 2 N(µ 2, σ 2 2 ) indipendenti, σ2 1 e σ 2 2 ignote ma σ2 1 = σ2 2 σ2 Campioni casuali indipendenti: (Y 11,..., Y 1n1 ) i.i.d. (Y 21,..., Y 2n2 ) i.i.d. indipendenti Sistema di ipotesi H 0 µ 1 = µ 2 versus H a µ 1 µ 2 Stimatore congiunto (pooled) della varianza: S 2 1 = S 2 2 = 1 n 1 (Y 1i Y 1 ) 2 n 1 1 i=1 2 Sp = (n 1 1)S1 2 + (n 2 1)S2 2 1 n 2 (Y 2i Y 2 ) 2 n 1 + n 2 2 n 2 1 i=1 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 31 / 95

32 Test per la differenza tra le medie Popolazioni Normali e varianze ignote ma uguali Statistica test Y 1 Y 2 T = (Y 1 Y 2 ) 0 Y 1 Y 2 = S p 2 + S p 2 Sp 2 ( ) n 1 n n 1 n 2 2 Sotto l ipotesi nulla T t n1 +n 2 2 Livello di significatività del test = α Regione Critica (Regione di Rifiuto) RC(α) T t (n1 +n 2 2),α/2 oppure T t (n1 +n 2 2),α/2 p value = 2 [1 P(T n1 +n 2 2 t oss ; H 0 )] = P(F 1,n1 +n 2 2 F oss ; H 0 ) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 32 / 95

33 Test per la differenza tra le medie Popolazioni Normali e varianze ignote ma uguali Tavola ANOVA Devianza SQ GdL MQ F-value p value Tra Gruppi D B 2 1 s 2 B = D B/(2 1) s 2 B /s2 p value Entro i Gruppi D W n 2 s 2 = D W /(n 2) Totale D T n 1 D T /(n 1) dove n = n 1 + n 2 s 2 = D W n 2 = (n 1 1)s1 2 + (n 2 1)s2 2 n 1 + n 2 2 = n 1 i=1 (y 1i y 1 ) 2 + n2 (y 2i y 2 ) 2 i=1 n 1 + n 2 2 D B = (y 1 y) 2 n 1 + (y 2 y) 2 n 2 y = (y y 1n1 ) + (y y 2n2 ) n 1 + n 2 Sotto H 0, F F 1,n1+n 2 2 = t 2 n 1+n 2 2 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 33 / 95

34 Test per la differenza tra le medie Popolazioni Normali e varianze ignote ma uguali: Esempio Obiettivo: Confrontare il voto medio alla fine del primo anno di studenti di istituti professionali in classi in cui si sono adottati metodi di insegnamento standard (popolazione 1) e in classi in cui si sono adottati metodi di insegnamento interattivi (popolazione 2) Metodo di insegnamento Metodo di insegnamento standard interattivo Ipotesi H 0 µ 1 = µ 2 vs H a µ 1 µ 2 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 34 / 95

35 Test per la differenza tra le medie Popolazioni Normali e varianze ignote ma uguali: Esempio Stima della differenza tra le medie y 2 y 1 = Stima della varianza pooled = = 0.8 Quindi s 2 p = s 2 1 = = e s2 2 = = = = = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 35 / 95

36 Test per la differenza tra le medie Popolazioni Normali e varianze ignote ma uguali: Esempio Regione di rifiuto al livello di significatività α = 0.01 RC 0.01 = T oppure T perché sotto H 0 T t 6 Valore osservato della statistica test t oss = y 2 y 1 s 2 p ( 1 n n 2 ) = ( ) = = = Decisione: IIl valore osservato della statistica test NON appartiene alla regione di rifiuto: t 0.005,6 = < t oss = < = t 0.005,6. I dati NON mostrano evidenza contraria all ipotesi nulla al livello di significatività del 1% p value = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 36 / 95

37 Test per la differenza tra le medie Popolazioni Normali e varianze ignote ma uguali: Esempio Tavola ANOVA Gruppo n l Media Devianza sl D T = = 2.32 D W = = 1.12 D B = (6 6.3) ( ) 2 3 = = 1.2 Devianza SQ GdL MQ F-value p value Tra Gruppi Entro i Gruppi Totale RC(0.01) F f 1,6(0.01) = = Decisione: I dati NON mostrano evidenza contraria all ipotesi nulla al livello di significatività del 1%: F oss = 6.43 = (T oss) 2 = (2.535) 2 < = f 1,6(0.01) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 37 / 95

38 Test F versus test t Per g > 2 si possono considerare confronti a coppie g (g 1)/2 possibili confronti Multipli test t: la probabilità di commettere l errore di prima specie è relativo al singolo confronto ma non si applica a tutti i confronti congiuntamente considerati Fissato il livello di significatività del test t, α, α è la probabilità di commettere l errore di prima specie in ciascuno dei g (g 1)/2 possibili confronti, ossia la probabilità di rifiutare l ipotesi che due medie siano uguali quando le due popolazioni hanno uguale media Il test F permette di controllare la probabilità di commettere l errore di I specie nei confronti multipli Fissato il livello di significatività del test F, α, α è la probabilità di commettere l errore di prima specie, ossia di rifiutare l ipotesi che le g medie siano uguali quando le g popolazioni hanno tutte la stessa media A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 38 / 95

39 Confronti a coppie: Intervalli di confidenza per la differenza tra due medie Popolazioni: Y 1 N(µ 1, σ 2 ),..., Y g N(µ g, σ 2 ) indipendenti, Campioni casuali indipendenti: (Y 11,..., Y 1n1 ) i.i.d.... (Y g1,..., Y gng ) i.i.d. indipendenti Stimatore della differenza tra le medie Y h Y k N (µ h µ k, σ2 n h + σ2 n k ) Stimatore congiunto (pooled) della varianza: S 2 = D W n g = S 1 2 (n 1 1) + S2 2 (n 2 1) + + Sg 2 (n g 1) (n 1 1) + (n 2 1) + + (n g 1) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 39 / 95

40 Confronti a coppie: Intervalli di confidenza per la differenza tra due medie Statistica T = (Y h Y k ) (µ h µ k ) S 2 p ( 1 n h + 1 n k ) t n g Intervallo di confidenza al livello di confidenza 1 α s IC 1 α (µ h µ k ) = (y y ) t h k (n g),α/2 p 2 ( 1 n + 1 h n ); k (y h y k ) + t (n g),α/2 sp 2 ( ) n h n k A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 40 / 95

41 Il livello di confidenza nei confronti multipli Il livello di confidenza 1 α di ogni intervallo di confidenza non può essere interpretato come il livello di fiducia che ciascun intervallo di confididenza contenga la vera differenza tra le medie Confronti multipli: Fissare il livello di confidenza congiunto Nel campionamento ripetuto, il livello di confidenza congiunto (1 α) rappresenta la probabilità che tutti i g (g 1)/2 intervalli di confidenza contengano la vera differenza tra le medie α% dei campioni porta a almeno un intervallo di confidenza tra i g (g 1)/2 intervalli di confidenza che non contiene la vera differenza tra le medie Confronto multiplo di Bonferroni: Per ottenere intervalli di confidenza di livello di confidenza congiunto (1 α), ciascun intervallo di confidenza è costruito utilizzando un livello di confidenza 1 α Bonferroni = 1 α Numero di confronti = 1 α g (g 1)/2 Il livello di confidenza di Bonferroni garantisce che il livello di confidenza complessivo sia almeno pari a 1 α (approccio conservativo) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 41 / 95

42 Confronti multipli: Capacità cognitive dei bambini g = 3 g (g 1)/2 = 3 (3 1)/2 = 3 possibili confronti Stima pooled della varianza s 2 = = Livello di confidenza: 1 α = 0.95 t 30,0.025 = Livello di confidenza di Bonferroni: 1 α Bonferroni = = = 0.98 t 30,0.017/2 = Confronti Gruppi y h y k IC 0.95 IC 0.95 Bonferroni (P.I, No P.) 22.5 ( 9.44; 35.56) (6.29; 38.71) (P.I.,P.S.) 10.5 ( 0.82; 21.82) ( 3.56; 24.56) (P.S.,No.P) 12.0 ( 0.45; 24.45) ( 3.46; 27.46) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 42 / 95

43 Confronti multipli: Capacità cognitive dei bambini Livello di confidenza: 1 α = 0.90 t 30,0.05 = Livello di confidenza di Bonferroni: 1 α Bonferroni = = = t 30,0.033/3 = Confronti Gruppi y h y k IC 0.90 IC 0.90 Bonferroni (P.I, No P.) 22.5 (11.65; 33.35) (8.24; 36.76) (P.I.,P.S.) 10.5 (1.09; 19.91) ( 1.87; 22.87) (P.S.,No.P) 12.0 (1.65; 22.35) ( 1.60; 25.60) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 43 / 95

44 Variabili indicatrici Dato un fattore A con livelli l = 1,..., g si definiscono le variabili A il = { 1 se l unità i appartiene al gruppo l 0 Altrimenti Le variabili A il si dicono anche variabili dummy o variabili indicatrici associate ai livelli del fattore A e indicano la presenza o l assenza di quel livello, ossia l appartenenza dell unità i a un dato gruppo l A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 44 / 95

45 Variabili indicatrici u i y i A i,1 A i,2 A i,3 u i y i A i,1 A i,2 A i, A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 45 / 95

46 Il modello di analisi della varianza Y li = µ l + ɛ li ɛ li N(0, σ 2 ) indipendenti (Y li N(µ l, σ 2 ) indipendenti) Oppure, equivalentemente, Y i = µ 1 A i1 + µ 2 A i2 + + µ g A ig + ɛ i ɛ i N(0, σ 2 ) indipendenti (Y i N(µ 1 A i1 + + µ g A ig, σ 2 ) indipendenti) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 46 / 95

47 Il modello di analisi della varianza Esempio: Capacità cognitive dei bambini Y 1,i = µ 1 + ɛ 1,i Y 2,i = µ 2 + ɛ 2,i Y 3,i = µ 3 + ɛ 3,i ɛ l,i N(0, σ 2 ) indipendenti l = 1, 2, 3 = No programma, Programma standard, Programma innovativo Oppure, equivalentemente, con ɛ i N(0, σ 2 ) indipendenti Y i = µ 1 A i,1 + µ 2 A i,2 + µ 3 A i,3 + ɛ i A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 47 / 95

48 Il modello di analisi della varianza con vincolo baseline Y i = β 0 + β 2 A i2 + + β g A ig + ɛ i ɛ i N(0, σ 2 ) indipendenti Y i N(β 0 + β 2 A i2 + + β g A ig, σ 2 ) indipendenti β 0 = µ 1 β l = µ l µ 1 µ l = β l + β 0 l = 1,..., g Avremmo potuto includere anche la prima variabile indicatrice, A 1i ma in tal caso avremmo incluso g + 1 parametri, β 0, β 1,..., β g contro g medie µ 1,..., µ k, strettamente necessarie. Dal punto di vista della stima, il modello con g + 1 parametri ha infinite soluzioni per le stime dei minimi quadrati Per convenzione come gruppo di riferimento (baseline) si considera il gruppo 1 ma la scelta è arbitraria Le stime dei parametri β l sono differenze o contrasti tra la media nel livello/gruppo l e la media del gruppo considerato come baseline A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 48 / 95

49 Il modello di analisi della varianza con vincolo baseline Vincolo baseline β 0 = Y 1 β1 = 0 βl = Y l Y 1 l = 2,..., g Stima dell intercetta = Media campionaria per il gruppo baseline Le stime dei parametri β l sono differenze o contrasti tra la media nel livello/gruppo l e la media del gruppo considerato come baseline I contrasti β l misurano l effetto del fattore A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 49 / 95

50 Il modello di analisi della varianza con vincolo baseline Esempio: Capacità cognitive dei bambini con Y i = β 0 + β 2 A i,2 + β 3 A i,3 + ɛ i ɛ i N(0, σ 2 ) indipendenti e gruppo 1 ( No programma ) come gruppo di riferimento Stima SE t value p value Costante Programma standard Programma Innovativo A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 50 / 95

51 Il test F H 0 µ 1 = µ 2 =... = µ g µ 2 µ 1 = 0 µ 3 µ 1 = 0 µ g µ 1 = 0 H 0 β 2 = β 3 =... = β g = 0 F = Varianza tra gruppi Media dei quadrati di regressione = Varianza entro i gruppi Media dei quadrati dei residui D B /(g 1) RSS/k = D W /(n g) SSE/(n k 1) con k = g 1 n k 1 = n (g 1) 1 = n g. Sotto l ipotesi nulla F F k,(n k 1) F (g 1),(n g), quindi RC(α) = F f k,(n k 1) (α) f (g 1),(n g) (α) p value = Pr(F k,(n k 1) F oss ; H 0 ) Pr(F (g 1),(n g) F oss ; H 0 ) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 51 / 95

52 Tavola ANOVA Fonte di Somma dei Media dei Variabilità Quadrati GdL Quadrati F-value p value Tra Gruppi D B g 1 sb 2 = D B/(g 1) sb 2 /s2 p value Entro i Gruppi D W n g s 2 = D W /(n g) Totale D T n 1 D T /(n 1) Fonte di Somma dei Media dei Variabilità Quadrati GdL Quadrati F -value p value Regressione RSS k RSS/k RMS/MSE p value Residua SSE n k 1 SSE/(n k 1) Totale TSS n 1 TSS/(n 1) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 52 / 95

53 Verifica di ipotesi per l uguaglianza tra le medie Esempio: Capacità cognitive dei bambini Ipotesi H 0 µ 1 = µ 2 = µ 3 versus H a µ 1 µ 2 o µ 1 µ 3 o µ 2 µ 3 oppure, equivalentemente, H 0 β 2 = β 3 = 0 versus H a β 2 0 o β 3 0 Tavola ANOVA Fonte di Somma dei Media dei Variabilità Quadrati GdL Quadrati F-value p value Tra Gruppi (Regressione) Entro i Gruppi (Residua) Totale A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 53 / 95

54 Verifica di ipotesi per l uguaglianza tra le medie Esempio: Capacità cognitive dei bambini k = g 1 = 3 1 = 2 F F 2,(33 2 1) F (3 1),(33 3) sotto H 0 Regione di rifiuto al livello di significatività α = 0.05 RC 0.05 F f (3 1),(33 3) (0.05) = F oss = > = f 2,(33 2 1) (0.05) f (3 1),(33 3) (0.05) I dati mostrano evidenza contro l ipotesi nulla al livello di significatività del 5% p-value p value = Pr(F 2,(33 2 1) 6.215; H 0 ) = Pr(F (3 1),(33 3) 6.215; H 0 ) = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 54 / 95

55 Analisi della varianza con due fattori Due fattori (variabili categoriche) A e B possono esercitare un influenza sulla variabile risposta Y Esempio I: Il direttore di una società ha raccolto le entrate (in migliaia di dollari) per 5 anni e in base al mese Anno = Fattore a 5 livelli (Anno 1, Anno 2,... Anno 5) Mese = Fattore a 12 livelli (Gennaio,..., Dicembre) Entrate = Variabile risposta Esempio II: Valutare l effetto di tre differenti trattamenti dietetici per soggetti obesi classificati per sesso. Trattamento dietetico = Fattore a 3 livelli Sesso = Fattore a 2 livelli (Maschio, Femmina) Peso = Variabile risposta A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 55 / 95

56 Analisi della varianza con due fattori Una impresa di servizi informatici ha condotto un indagine per valutare i fattori che determinano le differenze di salario Livello di istruzione (Fattore A) = Fattore a 3 livelli (1 = Diploma, 2 = Laurea, 3 = Master/Dottorato) Ruolo nell azienda (Fattore B) = Fattore a 2 livelli (0 = Impiegato, 1 = Funzionario) Salario = Variabile risposta A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 56 / 95

57 Salari degli informatici u i y i A i B i u i y i A i B i u i y i A i B i A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 57 / 95

58 Analisi della varianza con due fattori: Medie di gruppo Siano A e B due fattori con H e K livelli rispettivamente Totale gruppi: g = H K Si possono calcolare H K medie di gruppo Fattore Fattore B A 1... k... K 1 µ µ 1k... µ 1K h µ h1... µ hk... µ hk H µ H1... µ Hk... µ HK Confrontare le medie di Y per i livelli di A controllando per B Confrontare le medie di Y per i livelli di B controllando per A Confrontare le medie di cella A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 58 / 95

59 Analisi della varianza con due fattori: Esempi teorici Esempio I: Il salario medio non cambia rispetto al ruolo nell azienda, controllando per il livello di istruzione Livello di Ruolo nell azienda Istruzione Impiegato Funzionario Diploma Laurea Master/Dottorato Esempio II: Il salario medio non varia con il livello di istruzione, controllando per il ruolo nell azienda Livello di Ruolo nell azienda Istruzione Impiegato Funzionario Diploma Laurea Master/Dottorato A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 59 / 95

60 Analisi della varianza con due fattori: Esempi Esempio III: Istruzione e ruolo nell azienda non hanno alcun effetto sul salario Livello di Ruolo nell azienda Istruzione Impiegato Funzionario Diploma Laurea Master/Dottorato A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 60 / 95

61 Analisi della varianza con due fattori: Medie di gruppo Esempio: Salari degli informatici A e B hanno rispettivamente H = 3 e K = 2 livelli Totale gruppi: g = H K = 3 2 = 6 Si possono calcolare H K = 3 2 = 6 medie di gruppo Livello di Ruolo nell azienda Istruzione Impiegato Funzionario Totale Diploma (n 11 = 9) (n 12 = 5) (n 1. = 14) Laurea (n 21 = 12) (n 22 = 7) (n 2. = 19) Master/Dottorato (n 31 = 5) (n 32 = 8) (n 3. = 13) Totale (n.1 = 26) (n.2 = 20) (n = 46) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 61 / 95

62 Variabili indicatrici Variabili indicatrici per il fattore A A ih = { 1 se l unità i appartiene al gruppo h 0 Altrimenti h = 1,..., H Variabili indicatrici per il fattore B B ik = { 1 se l unità i appartiene al gruppo k 0 Altrimenti k = 1,..., K A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 62 / 95

63 Variabili indicatrici Esempio: Salari degli informatici u i y i A i1 A i2 A i3 B i1 B i A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 63 / 95

64 Modello di analisi della varianza con due fattori senza interazione Vincolo Baseline Y i = β 0 + β A 2 A i β A H A ih + β B 2 B i β B K B ik + ɛ i con ɛ i N(0, σ 2 ) indipendenti Nel modello di analisi della varianza con due fattori A e B (senza interazione) aventi H e K livelli si costruiscono H 1 variabili indicatrici per A e K 1 variabili indicatrici per B Numero parametri: 1 + (H 1) + (K 1) GdL: n 1 (H 1) (K 1) = n H K + 1 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 64 / 95

65 Modello di analisi della varianza con due fattori senza interazione Vincolo Baseline - Interpretazione dei parametri β 0 = µ 11 : Valore medio di Y nel gruppo con A = 1 e B = 1 β A h = µ hk µ 1k : Differenza tra la media di Y nel gruppo con A = h e B = k e la media di Y nel gruppo con A = 1 e B = k, quale che sia k = 1,..., K β B k = µ hk µ h1 : Differenza tra la media di Y nel gruppo con A = h e B = k e la media di Y nel gruppo con A = h e B = 1, quale che sia h = 1,..., H µ 11 = β 0 µ h1 = β 0 + β A h µ 1k = β 0 + β B k µ hk = β 0 + β A h + βb k A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 65 / 95

66 Modello di analisi della varianza con due fattori senza interazione Vincolo Baseline: Salari degli informatici Y i = β 0 + β A LaureaA i,laurea + β A Master/PhDA i,master/phd + β B FunzionarioB i,funzionario + ɛ i β 0: Salario medio degli impiegati con diploma β A Laurea: Differenza tra il salario medio dei laureati e il salario medio dei diplomati fissato il ruolo nell azienda βlaurea A = µ Laurea,Impiegato µ Diploma,Impiegato = µ Laurea,Funzionario µ Diploma,Funzionario β A Master/PhD: Differenza tra il salario medio di dipendenti con master o dottorato e il salario medio dei diplomati fissato il ruolo nell azienda β A Master/PhD = µ Master/PhD,Impiegato µ Diploma,Impiegato = µ Master/PhD,Funzionario µ Diplona,Funzionario β B Funzionario: Differenza tra il salario medio di funzionari e il salario medio di impiegati fissato il livello di istruzione βfunzionario B = µ Diploma,Funzionario µ Diploma,Impiegato = µ Laurea,Funzionario µ Laurea,Impiegato = µ Master/PhD,Funzionario µ Master/PhD,Impiegato A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 66 / 95

67 Modello di analisi della varianza con due fattori senza interazione Vincolo Baseline: Salari degli informatici Variabile Stima ES tvalue p value Costante Istruzione (Baseline: Diploma) Laurea Master/PhD Ruolo (Baseline: Impiegato) Funzionario β 0 = : Salario medio degli impiegati con diploma β A Laurea = : Differenza tra il salario medio dei laureati e il salario medio dei diplomati fissato il ruolo nell azienda β A Master/PhD = : Differenza tra il salario medio di dipendenti con master o dottorato e il salario medio dei diplomati fissato il ruolo nell azienda β Funzionario B = : Differenza tra il salario medio di funzionari e il salario medio di impiegati fissato il livello di istruzione A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 67 / 95

68 Modello di analisi della varianza con due fattori senza interazione Valori teorici Livello di Ruolo nell azienda istruzione Impiegato Funzionario Diploma µ D,I = β 0 µ D,F = β 0 + β Funzionario B Laurea µ L,I = β 0 + β Laurea A µ L,F = β 0 + β Laurea A + β Funzionario B Master/PhD µ M/PhD,I = β 0 + β A Master/PhD µ M/PhD,F = β 0 + β A Master/PhD + β Funzionario B Diploma,Impiegato µ D,I = Diploma,Funzionario µ D,F = = Laurea,Impiegato µ L,I = = Laurea,Funzionario µ L,F = = Master/PhD,Impiegato µ M/PhD,I = = Master/PhD,Funzionario µ M/PhD,F = = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 68 / 95

69 Modello di analisi della varianza con due fattori senza interazione Impiegato Funzionario Diploma Laurea Master/PhD Diploma Laurea Master/PhD Impiegato Funzionario A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 69 / 95

70 Il test F Y i = β 0 + β A 2 A i β A H A ih + β B 2 B i β B K B ik + ɛ i Sistema di ipotesi H 0 β A 2 = = βa H = βb 2 = = βb K = 0 versus H a Almeno un coefficiente è diverso da zero Statistica test RSS/(H 1 + K 1) F = SSE/(n H K + 1) = RMS MSE F (H 1+K 1),(n H K+1) sotto H 0 Regione critica di livello di significatività α RC α dove f (H 1+K 1),(n H K+1) (α): F f (H 1+K 1),(n H K+1) (α) Pr(F (H 1+K 1),(n H K+1) f (H 1+K 1),(n H K+1) (α)) = α A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 70 / 95

71 Tavola di Analisi della Varianza (Tavola ANOVA) Fonte di Somma dei Media dei Statistica Variabilità quadrati GdL quadrati F p value Regressione RSS (H 1) + (K 1) RMS RMS/MSE p value Residua SSE n H K + 1 MSE Totale TSS n 1 MQT dove p value = Pr(F (H 1+K 1),(n H K+1) F oss ; H 0 ) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 71 / 95

72 Il test F : Salari degli informatici Y i = β 0 +β A Laurea A i,laurea+β A Master/PhD A i,master/phd+β B Funzionario B i,funzionario+ɛ i Ipotesi Tavola ANOVA H 0 β A Laurea = βa Master/PhD = βb Funzionario = 0 versus H a Almeno un coefficiente è diverso da zero Fonte di Somma dei Media dei Statistica Variabilità quadrati GdL quadrati F p value Regressione Residua Totale A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 72 / 95

73 Il test F : Salari degli informatici Statistica test F oss = / /42 = = Regione critica di livello di significatività α = 0.05 p value RC 0.05 F f 3,42 (0.05) = p value = Pr(F 3, ; H 0 ) = Forte evidenza contro l ipotesi nulla A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 73 / 95

74 Modelli a confronto Modello esteso Y i = β 0 + β A 2 A i β A H A ih + β B 2 B i β B K B ik + ɛ i versus Modell ridotto Y i = β 0 + β B 2 B i β B K B ik + ɛ i H 0 β A 2 = βa 3 = = βa H = 0 versus H a Almeno un uguaglianza in H 0 è falsa Esempio: Salari degli informatici M e Y i = β 0 + β A Laurea A i,laurea + β A Master/PhD A i,master/phd + β B Funzionario B i,funzionario + ɛ i versus M r Y i = β 0 + β B Funzionario B i,funzionario + ɛ i H 0 β A Laurea = β A Master/PhD = 0 versus H a β A Laurea 0 oppure β A Master/PhD 0 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 74 / 95

75 Modelli a confronto Valori teorici ŷ ie = β 0 + β A 2 A i2 + + β A H A ih + β B 2 B i2 + + β B K B ik ŷ ir = β 0 + β B 2 B i2 + + β B K B ik Somma dei quadrati degli errori Modello Esteso Modello Ridotto SSE e = n (y i ŷ ie ) 2 con gdl e = n H K + 1 i=1 SSE r = n (y i ŷ ir ) 2 con gdl r = n (K 1) 1 i=1 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 75 / 95

76 Modelli di regressione a confronto Statistica Test F = (SSE r SSE e )/(gdl r gdl e ) = (SSE r SSE e )/(H 1) SSE e /gdl e SSE e /(n H K + 1) dove gdl r gdl e = H 1 = numero di termini aggiuntivi presenti nel modello esteso Sotto l ipotesi nulla F F (H 1),n H K+1 Regione di rifiuto al livello di significatività α: RC α F f H 1,n H K+1 (α) p value = Pr(F H 1,n H K+1 F oss ; H 0 ) A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 76 / 95

77 Modelli a confronto Esempio: Salari degli informatici Modello esteso Y i = β 0 + β A Laurea A i,laurea + β A Master/PhD A i,master/phd+ β B Funzionario B i,funzionario + ɛ i versus Modell ridotto Y i = β 0 + β B Funzionario B i,funzionario + ɛ i H 0 β A Laurea = βa Master/PhD = 0 versus H a β A Laurea 0 oppure βa Master/PhD 0 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 77 / 95

78 Modelli a confronto Esempio: Salari degli informatici Tavola ANOVA modello esteso Fonte di Somma dei Media dei Statistica Variabilità quadrati GdL quadrati F p value Regressione Residua Totale Tavola ANOVA modello ridotto Fonte di Somma dei Media dei Statistica Variabilità quadrati GdL quadrati F p value Regressione Residua Totale A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 78 / 95

79 Il test F : Salari degli informatici Statistica test F oss = ( )/(44 42) /42 Regione critica di livello di significatività α = 0.05, 0.01 = = RC 0.05 F f 2,42 (0.05) = 3.22 RC 0.01 F f 2,42 (0.01) = p value p value = Pr(F 2, ; H 0 ) = Evidenza contro l ipotesi nulla al livello di significatività del 5% ma i dati non mostrano sufficiente evidenza contraria all ipotesi nulla al livello di significatività del 1% A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 79 / 95

80 Modelli a confronto Esempio: Salari degli informatici Modello SSE GdL F value p value Modello esteso Istruzione: H 0 βlaurea A = βa Master/PhD = Ruolo nell azienda: H 0 βfunzionario B = Modello nullo: H 0 βlaurea A = βa Master/PhD = βfunzionario B = 0 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 80 / 95

81 Modello di analisi della varianza con due fattori con interazione Y i = β 0 + β2 AA i βh AA ih + β2 BB i βk BB ik + β22 ABA i2 B i β2k ABA i2 B ik βh2 ABA ih B i βhk AB ih B ik + ɛ i con ɛ i N(0, σ 2 ) indipendenti Nel modello di analisi della varianza con due fattori A e B (con interazione) aventi H e K livelli si costruiscono H 1 variabili indicatrici per A; K 1 variabili indicatrici per B; (H 1) (K 1) prodotti di variabili indicatrici per i parametri di interazione Non sono incluse le variabili indicatrici A 1 e B 1 e i prodotti di tali due variabili indicatrici con ogni altra variabile indicatrice (A 1 B 1,..., A 1 B K, A 2 B 1,..., A H B 1 ) Numero parametri: 1 + (H 1) + (K 1) + (H 1) (K 1) GdL: n [1 + (H 1) + (K 1) + (H 1) (K 1)] = n H K A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 81 / 95

82 Modello di analisi della varianza con due fattori con interazione Interpretazione dei parametri µ 11 = β 0 µ h1 = β 0 + β A h µ 1k = β 0 + β B k µ hk = β 0 + β A h + β B k + β AB hk β 0 = µ 11: Valore medio di Y nel gruppo con A i1 = 1 e B i1 = 1 β A h = µ h1 µ 11: Differenza tra la media di Y nel gruppo con A ih = 1 e B i1 = 1 la media di Y nel gruppo con A i1 = 1 e B i1 = 1 βk B = µ 1k µ 11: Differenza tra la media di Y nel gruppo con A i1 = 1 e B ik = 1 la media di Y nel gruppo con A i1 = 1 e B i1 = 1 β AB hk : Variazione dell effetto della variabile dummy A h nel gruppo con B ik = 1 rispetto al gruppo con B i1 = 1 Variazione dell effetto della variabile dummy B k nel gruppo con A ih = 1 rispetto al gruppo con A i1 = 1 Il termine di interazione rappresenta una differenza di differenze tra medie: [Media per A ih = 1, B ik = 1 Media per A ih = 1, B i1 = 1] [Media per A i1 = 1, B ik = 1 Media per A i1 = 1, B i1 = 1] [Media per A ih = 1, B ik = 1 Media per A i1 = 1, B ik = 1] [Media per A ih = 1, B i1 = 1 Media per A i1 = 1, B i1 = 1] A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 82 / 95

83 Modello di analisi della varianza con due fattori con interazione Esempio: Salari degli informatici Y i = β 0 + β A LaureaA i,laurea + β A Master/PhDA i,master/phd + β B FunzionarioB i,funzionario + β AB L,F A i,laurea B i,funzionario + β AB Master/PhD,F A i,master/phd B i,funzionario + ɛ i Numero parametri interazione H K (H + K 1) = (H 1) (K 1) = (3 1) (2 1) = 2 GdL n H K = = 40 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 83 / 95

84 Modello di analisi della varianza con due fattori con interazione Esempio: Salari degli informatici β 0: Salario medio degli impiegati con diploma β A Laurea: Differenza tra il salario medio dei laureati impiegati e il salario medio dei diplomati impiegati β A Laurea = µ Laurea,Impiegato µ Diploma,Impiegato β A Master/PhD: Differenza tra il salario medio di dipendenti con master o dottorato impiegati e il salario medio dei diplomati impiegati β A Master/PhD = µ Master/PhD,Impiegato µ Diploma,Impiegato β B Funzionario: Differenza tra il salario medio di funzionari diplomati e il salario medio di impiegati diplomati β B Funzionario = µ Diploma,Funzionario µ Diploma,Impiegato A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 84 / 95

85 Modello di analisi della varianza con due fattori con interazione Esempio: Salari degli informatici β AB L,F : Variazione dell effetto della laurea per i funzionari rispetto agli impiegati Variazione dell effetto del ruolo nell azienda tra i laureati rispetto ai diplomati βl,f AB = [µ Laurea,Funzionario µ Laurea,Impiegato ] [µ Diploma,Funzionario µ Diploma,Impiegato ] = [µ Laurea,Funzionario µ Diploma,Funzionario ] [µ Laurea,Impigato µ Diploma,Impiegato ] β AB Master/PhD,F : Variazione dell effetto del master/dottorato per i funzionari rispetto agli impiegati Variazione dell effetto del ruolo nell azienda tra coloro che hanno il master o il dottorato rispetto a coloro che hanno solo il diploma β AB Master/PhD,F = = [µ Master/PhD,Funzionario µ Master/PhD,Impiegato ] [µ Diploma,Funzionario µ Diploma,Impiegato ] = [µ Master/PhD,Funzionario µ Diploma,Funzionario ] [µ Master/PhD,Impigato µ Diploma,Impiegato ] A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 85 / 95

86 Modello di analisi della varianza con due fattori con interazione Esempio: Salari degli informatici Variabile Stima ES t value p value Costante Istruzione (Baseline: Diploma) Laurea Master/PhD Ruolo (Baseline: Impiegato) Funzionario Interazione Laurea Funzionario Master/PhD Funzionario A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 86 / 95

87 Modello di analisi della varianza con due fattori con interazione Esempio: Salari degli informatici β 0 = : Salario medio degli impiegati con diploma β A Laurea = : Differenza tra il salario medio dei laureati impiegati e il salario medio dei diplomati impiegati β A Master/PhD = : Differenza tra il salario medio di dipendenti impiegati con master o dottorato e il salario medio dei dipendenti impiegati con diploma β B Funzionario = : Differenza tra il salario medio di funzionari con diploma e il salario medio di impiegati con diploma β AB L,F = : L effetto della laurea sul salario è maggiore di Euro per i funzionari rispetto agli impiegati L effetto del ruolo di funzionario sul salario è maggiore di Euro per i laureati rispetto ai diplomati β AB Master/PhD,F = : L effetto del Master/dottorato sul salario è maggiore di Euro per i funzionari rispetto agli impiegati L effetto del ruolo di funzionario sul salario è maggiore di Euro per i dipendenti con master/dottorato rispetto ai dipendenti con diploma A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 87 / 95

88 Analisi della varianza con due fattori con interazione Valori teorici Livello di Ruolo nell azienda istruzione Impiegato Funzionario Diploma µ D,I = β 0 µ D,F = β 0 + β Funzionario B Laurea µ L,I = β 0 + β Laurea A µ L,F = β 0 + β Laurea A + β Funzionario B + βl,f AB Master/PhD µ M/PhD,I = β 0 + β A Master/PhD µ M/PhD,F = β 0 + β A Master/PhD + β Funzionario B + β AB Master/PhD,F Diploma,Impiegato µ D,I = Diploma,Funzionario µ D,F = = Laurea,Impiegato µ L,I = = Laurea,Funzionario µ L,F = = Master/PhD,Impiegato µ M/PhD,I = = Master/PhD,Funzionario µ M/PhD,F = = A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 88 / 95

89 Modello di analisi della varianza con due fattori con interazione Impiegato Funzionario Diploma Laurea Master/PhD Diploma Laurea Master/PhD Impiegato Funzionario A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 89 / 95

90 Valutare la significatività dell interazione Modello esteso: Modello ridotto: Y i = β 0 + β2 AA i βh AA ih + β2 BB i βk BB ik + β22 ABA i2 B i β2k ABA i2 B ik βh2 ABA ih B i βhk AB ih B ik + ɛ i versus Y i = β 0 + β A 2 A i β A H A ih + β B 2 B i β B K B ik + ɛ i H 0 β22 AB = = βab 2K = = βab H2 = = βab HK = 0 versus H a Almeno un uguaglianza in H 0 è falsa A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 90 / 95

91 Valutare la significatività dell interazione Esempio: Salari degli informatici M e Y i = β 0 + βlaurea A A i,laurea + βmaster/phd A A i,master/phd+ βfunzionario B B i,funzionario + βl,f AB i,laurea B i,funzionario + βmaster/phd,f AB i,master/phd B i,funzionario + ɛ i versus M r Y i = β 0 + βlaurea A A i,laurea + βmaster/phd A A i,master/phd+ βfunzionario B B i,funzionario + ɛ i H 0 βl,f AB = βab Master/PhD,F = 0 versus H a βl,f AB 0 oppure βab Master/PhD,F 0 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 91 / 95

92 Valutare la significatività dell interazione Valori teorici ŷ ie = β 0 + β 2 A A i2 + + β h A A ih + β 2 B B i2 + β K B B ik + β 22 AB A AB i2 B i2 + + β HK A ih B ik ŷ ir = β 0 + β 2 A A i2 + + β h A A ih + β 2 B B i2 + β K B B ik Somma dei quadrati degli errori Modello Esteso Modello Ridotto SSE e = n (y i ŷ ie ) 2 con gdl e = n H K i=1 SSE r = n (y i ŷ ir ) 2 con gdl r = n H K + 1 i=1 A. Mattei (Università di Firenze) Metodi statistici per la ricerca sociale 92 / 95

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA)

Dettagli

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

Metodi Statistici per la Ricerca Sociale: Formulario

Metodi Statistici per la Ricerca Sociale: Formulario Metodi Statistici per la Ricerca Sociale: Formulario Attenzione. Il Formulario contiene una selezione delle formule. Le formule non riportate sono supposte note Associazione tra variabili categoriche Misure

Dettagli

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università

Dettagli

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni

Dettagli

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

Lezione 15. L analisi della Varianza (ANOVA): i disegni entro i sogetti e misti. Argomenti della lezione: Disegni entro i soggetti

Lezione 15. L analisi della Varianza (ANOVA): i disegni entro i sogetti e misti. Argomenti della lezione: Disegni entro i soggetti Lezione 15 L analisi della Varianza (ANOVA): i disegni entro i sogetti e misti Argomenti della lezione: Disegni entro i soggetti Disegni misti Effect size e potenza Disegni entro i soggetti Gli stessi

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Analisi della varianza: I contrasti e il metodo di Bonferroni

Analisi della varianza: I contrasti e il metodo di Bonferroni Analisi della varianza: I contrasti e il metodo di Bonferroni 1 Contrasti In molti problemi risulta importante stabilire, nel caso venga rifiutata l ipotesi nulla, di uguaglianza delle medie µ j delle

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.12 - Test statistico Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona IPOTESI SCIENTIFICA Affermazione che si può sottoporre a verifica

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Analisi della varianza

Analisi della varianza 1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU) STATISTICA a.a. 2001-2002 (3 CFU) Federico M. Stefanini Dipartimento di Statistica G.Parenti viale Morgagni 59, 50134 Firenze, tel. 055-4237211 PARTE 5-3.12.2001 e.mail: stefanin@ds.unifi.it http://www.ds.unifi.it/ricerca/pagperson/docenti/stefanini.htm

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Introduzione alla statistica per la ricerca in sanità

Introduzione alla statistica per la ricerca in sanità Introduzione alla statistica per la ricerca in sanità Modulo La verifica delle ipotesi: il test statistico dott. Eugenio Traini eugenio.traini@burlo.trieste.it Verifica d Ipotesi - 1 Che cos è un ipotesi

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Parte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione

Parte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione ! Test d'ipotesi Parte 1 : Inferenza! Intervalli di confidenza! Test parametrici! Calcoli di potenza! Test non parametrici Distribuzioni asintotiche dei test A seconda dei casi il nostro test può convergere

Dettagli

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

ESERCITAZIONE N. 7 corso di statistica

ESERCITAZIONE N. 7 corso di statistica ESERCITAZIONE N. 7corso di statistica p. 1/15 ESERCITAZIONE N. 7 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONE N. 7corso di statistica p. 2/15 Introduzione Variabili aleatorie continue

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Esercitazione 5 Sta/s/ca Aziendale

Esercitazione 5 Sta/s/ca Aziendale Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Effettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari

Effettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari Effettuazione di un TEST D IPOTESI 1. Formulazione H 0 e H 1 2. Scelta del test statistico 3. Calcolo del test statistico ˆ 0 test ES[ˆ] dove ˆ = stima del parametro di interesse calcolata sui dati campionari

Dettagli

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Introduzione alla verifica d ipotesi

Introduzione alla verifica d ipotesi Introduzione alla verifica d ipotesi Dipartimento di Matematica Università di Roma Tor Vergata 17 dicembre 2017 Consideriamo il caso in cui la nostra variabile risposta sia continua Immaginiamo che obiettivo

Dettagli

Esercizi di statistica inferenziale

Esercizi di statistica inferenziale Dipartimento di Fisica SMID a.a. 004/005 Esercizi di statistica inferenziale Prof. Maria Antonietta Penco tel. 0103536404 penco@fisica.unige.it 6/1/005 Esercizio1 E noto che un grande numero di pazienti

Dettagli

Tecniche di sondaggio

Tecniche di sondaggio SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell ' Lezione 2 Argomenti della lezione: La statistica inferenziale: concetti di base Campionamento Stima Distribuzione campionaria Popolazione (o universo) Insieme di tutti gli elementi cui si rivolge il ricercatore

Dettagli

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1 Confronto tra medie Si considerino due popolazioni di individui sottoposti a due diversi trattamenti farmacologici. Si vuole valutare se tali trattamenti producono uguali effetti (ipotesi nulla) o diversi

Dettagli

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice con Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 29 Outline con 1 2 3 con 4 5 campioni appaiati 6 Indipendenza tra variabili () Statistica 2 /

Dettagli

Contenuto del capitolo

Contenuto del capitolo Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, ) Università degli Studi di Milano Bicocca Scuola di Economia e Statistica Corso di Laurea in Economia e Amministrazione delle Imprese (ECOAMM) Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE

Dettagli

Fondamenti statistici : Test d Ipotesi (1)

Fondamenti statistici : Test d Ipotesi (1) Fondamenti statistici : Test d Ipotesi (1) Ipotesi statistica: È una assunzione formulata su un particolare aspetto della popolazione considerazioni teoriche Informazioni relative a popolazioni analoghe

Dettagli

Metodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali

Metodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali Metodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università

Dettagli

Metodi Statistici per il Management

Metodi Statistici per il Management Metodi Statistici per il Management Statistica Multivariata I Simone Borra - Roberto Rocci Introduzione e obiettivi La statistica multivariata si occupa di analizzare e studiare in modo simultaneo un set

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 3 Argomenti della lezione: La verifica delle ipotesi: principi generali Ipotesi statistiche Ipotesi sulla media Indicatore campionario: X Il campione è stato estratto da una popolazione con parametro

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più

Dettagli

Metodi statistici per lo studio dei fenomeni biologici

Metodi statistici per lo studio dei fenomeni biologici Metodi statistici per lo studio dei fenomeni biologici Alla fine di questa lezione dovreste essere in grado di: descrivere la distribuzione di campionamento della differenza di due medie costruire gli

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

TECNICHE DI ANALISI DEI DATI

TECNICHE DI ANALISI DEI DATI TECNICE DI ANALISI DEI DATI AA 08/09 PRO. V.P. SENESE Questi materiali sono disponibili per tutti gli studenti al seguente indirizzo: https://goo.gl/xy5fr Seconda Università di Napoli (SUN) Dipartimento

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi Esercizio 1 Data la variabile casuale X con funzione di densità f(x) = 2x, per 0 x 1; f(x) = 0 per x [0, 1], determinare: a) P( - 0,5 < X< 0,7) b)

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe

Dettagli

STATISTICA. Regressione-4 ovvero Macron!

STATISTICA. Regressione-4 ovvero Macron! STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

Inferenza statistica Donata Rodi 04/10/2016

Inferenza statistica Donata Rodi 04/10/2016 Inferenza statistica Donata Rodi 04/10/2016 Popolazione Campionamento Campione Parametri Inferenza Statistiche µ, ϭ 2 descrittive Stima X, s 2 Quale test? Parametrico o no Scala di misura 1 gruppo 2 gruppi

Dettagli

Statistica economica

Statistica economica Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati

Dettagli

Confronto tra due popolazioni Lezione 6

Confronto tra due popolazioni Lezione 6 Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media

Dettagli

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011 Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1 Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

Statistica (parte II) Esercitazione 4

Statistica (parte II) Esercitazione 4 Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Test d Ipotesi Test per lo studio dell associazione tra variabili Nella teoria dei test, il ricercatore fornisce ipotesi riguardo la distribuzione

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75 00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei

Dettagli

Caratterizzazione dei consumi energetici (parte 3)

Caratterizzazione dei consumi energetici (parte 3) ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 6 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Intervallo di confidenza per la media Verifica d ipotesi sulla media

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

S 2 p n X. + S2 p. n Y

S 2 p n X. + S2 p. n Y ESERCIZIO 1 Attraverso un indagine effettuata su un campione di 83 pellicole cinematografiche, si verifichi, a livello 0.01, se vi sono differenze, in media, tra i budget dei film di produzione americana

Dettagli