Modelli Log-lineari Bivariati

Похожие документы
Esercizi di statistica

Analisi della varianza

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Verifica delle ipotesi

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Minimi quadrati vincolati e test F

Capitolo 12 La regressione lineare semplice

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Statistica Inferenziale

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Statistica. Alfonso Iodice D Enza

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

STATISTICA ESERCITAZIONE 13

Esercitazioni di Statistica

STATISTICA ESERCITAZIONE

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica. Alfonso Iodice D Enza

Test F per la significatività del modello

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

I appello di calcolo delle probabilità e statistica

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Corso di Psicometria Progredito

La regressione lineare. Rappresentazione analitica delle distribuzioni

PROBABILITÀ ELEMENTARE

Caratterizzazione dei consumi energetici (parte 3)

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Corso di Psicometria Progredito

Statistica Applicata all edilizia: il modello di regressione

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di Psicometria Progredito

Contenuti: Capitolo 14 del libro di testo

Dispensa di Statistica

Statistica economica

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

A titolo di esempio proponiamo la risoluzione del sistema sia con il metodo della matrice inversa sia con il metodo di Cramer.

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

L analisi della Varianza (ANOVA): i disegni fattoriali tra i soggetti

Транскрипт:

Modelli Log-lineari Bivariati Luca Stefanutti Università di Padova Dipartimento di Psicologia Applicata Via Venezia 8, 35131 Padova L.Stefanutti (Università di Padova) Modelli Log-lineari 1 / 71

Contenuti 1 Il Modello Additivo 2 Proprietà del Modello Additivo 3 Modello Log-lineare di Analisi Multipla 4 Stima dei Parametri 5 Varianza ed Errore Standard della Stima 6 La Standardizzazione dei Parametri L.Stefanutti (Università di Padova) Modelli Log-lineari 2 / 71

Il Modello Additivo Modello Moltiplicativo e Modello Additivo Il modello di indipendenza è un modello moltiplicativo: p ij = p i. p.j Ad esso corrisponde biunivocamente una rappresentazione additiva (modello additivo) ottenuta attraverso una semplice trasformazione logaritmica: ln p ij = ln p i. + ln p.j Questa rappresentazione è in generale più semplice da trattare della precedente e consente lo sviluppo di modelli basati su equazioni lineari (come accade ad es. nell analisi della varianza o nella regressione) L.Stefanutti (Università di Padova) Modelli Log-lineari 3 / 71

Il Modello Additivo Modello Moltiplicativo e Modello Additivo Nel modello moltiplicativo di indipendenza le frequenze teoriche (attese) sono F ij = F i.f.j N Nel modello additivo di indipendenza la medesima relazione assume una forma lineare: ln F ij = ln F i. + ln F.j ln N Fissata la numerosità del campione, ln F ij è una funzione lineare dei logaritmi delle frequenze marginali di riga e colonna. L.Stefanutti (Università di Padova) Modelli Log-lineari 4 / 71

Il Modello Additivo Confronto fra i Modelli Moltiplicativo e Additivo Un Esempio Le frequenze nella seguente tavola rispettano il modello (moltiplicativo) di indipendenza Var 1 Var 2 1 2 3 4 5 1 5.0 10.0 20.0 23.3 31.7 90.0 2 3.9 7.8 15.6 18.1 24.6 70.0 3 2.8 5.6 11.1 13.0 17.6 50.0 4 2.2 4.4 8.9 10.4 14.1 40.0 5 1.1 2.2 4.4 5.2 7.0 20.0 15.0 30.0 60.0 70.0 95.0 270.0 La trasformazione logaritmica (modello additivo) è la seguente Var 1 Var 2 1 2 3 4 5 1 1.61 2.30 3.00 3.15 3.46 4.50 2 1.36 2.05 2.74 2.90 3.20 4.25 3 1.02 1.71 2.41 2.56 2.87 3.91 4 0.80 1.49 2.18 2.34 2.64 3.69 5 0.11 0.80 1.49 1.65 1.95 3.00 2.71 3.40 4.09 4.25 4.55 5.60 L.Stefanutti (Università di Padova) Modelli Log-lineari 5 / 71

Il Modello Additivo Confronto fra i Modelli Moltiplicativo e Additivo Un Esempio Nei due diagrammi seguenti ogni segmento di retta corrisponde a una riga della tavola Frequenza Attesa (F ij ) 35 30 25 20 15 10 5 MODELLO MOLTIPLICATIVO Riga 1 Riga 2 Riga 3 Riga 4 Riga 5 0 0 20 40 60 80 100 Totale marginale di colonna (F.j ) ln F ij 3.5 3 2.5 2 1.5 MODELLO ADDITIVO 1 Riga 1 Riga 2 0.5 Riga 3 Riga 4 Riga 5 0 2.5 3 3.5 4 4.5 5 ln F.j Nel diagramma corrispondente al modello additivo è facile rilevare l indipendenza: i segmenti sono tutti tra loro paralleli L.Stefanutti (Università di Padova) Modelli Log-lineari 6 / 71

Il Modello Additivo Media Generale dei Logaritmi Effettuate le trasformazioni logaritmiche ln F ij, possiamo calcolare una media generale µ = 1 rc r c ln F ij i=1 j=1 Sottraendo µ da ognuna delle log-frequenze ln F ij si effettua un semplice cambio di scala (traslazione) che pone la media µ all origine della scala: ln F ij µ Questo non cambia i reciproci rapporti tra le celle della tavola. L.Stefanutti (Università di Padova) Modelli Log-lineari 7 / 71

Il Modello Additivo Scarti dalla Media Generale dei Logaritmi Diagramma dei ln F ij a sinistra Diagramma degli scarti ln F ij µ dalla media generale a destra 3.5 MODELLO ADDITIVO 1.5 SCARTI DALLA MEDIA GENERALE 3 1 2.5 0.5 2 0 ln F ij 1.5 ln F ij 0.5 1 Riga 1 Riga 2 0.5 Riga 3 Riga 4 Riga 5 0 2.5 3 3.5 4 4.5 5 ln F.j 1 Riga 1 Riga 2 1.5 Riga 3 Riga 4 Riga 5 2 2.5 3 3.5 4 4.5 5 ln F.j L.Stefanutti (Università di Padova) Modelli Log-lineari 8 / 71

Proprietà Notevole Proprietà del Modello Additivo Si prenda in esame una qualunque cella (i, j) Considerando la media dei logaritmi delle frequenze appartenenti alla riga i 1 c ln F il c l=1 e la media dei logaritmi delle frequenze appartenti alla colonna j 1 r ln F kj r k=1 Sotto la condizione di indipendenza si osserva la seguente proprietà notevole: ln F ij = 1 c ln F il + 1 r ln F kj µ c r l=1 k=1 L.Stefanutti (Università di Padova) Modelli Log-lineari 9 / 71

Proprietà del Modello Additivo Rappresentazione Geometrica della Proprietà Notevole Retta della riga i Media di riga i ln F ij Media generale Deviazione della media di riga dalla media generale Deviazione della media di colonna dalla media generale ln F.j Media dei logaritmi delle frequenze marginali di colonna L.Stefanutti (Università di Padova) Modelli Log-lineari 10 / 71

Proprietà del Modello Additivo Dimostrazione Algebrica Volendo verificare l uguaglianza ln F ij = 1 c c ln F il + 1 r l=1 r ln F kj 1 rc k=1 r c ln F kl k=1 l=1 moltiplichiamo entrambi i termini per rc: rc ln F ij = r c r r c ln F il + c ln F kj ln F kl l=1 k=1 k=1 l=1 ciò equivale a scrivere r c r c r c rc ln F ij = ln F il + ln F kj ln F kl k=1 l=1 k=1 l=1 k=1 l=1 L.Stefanutti (Università di Padova) Modelli Log-lineari 11 / 71

Proprietà del Modello Additivo Dimostrazione Algebrica Dalla precedente uguaglianza, raccogliendo sotto la medesima sommatoria si ottiene rc ln F ij = r k=1 l=1 c (ln F il + ln F kj ln F kl ) ricordando che, in generale, per indipendenza vale si può scrivere rc ln F ij = r k=1 l=1 ln F ij = ln F i. + ln F.j ln N, c (ln F i. + ln F.l ln N + ln F k. + ln F.j ln N ln F k. ln F.l + ln N) L.Stefanutti (Università di Padova) Modelli Log-lineari 12 / 71

Proprietà del Modello Additivo Dimostrazione Algebrica Semplificando il termine di destra della precedente uguaglianza si ottiene r c rc ln F ij = (ln F i. + ln F.j ln N) k=1 l=1 ed essendo entrambi i termini in parentesi costanti rispetto agli indici k ed l rc ln F ij = rc(ln F i. + ln F.j ln N) da cui: ln F ij = ln F i. + ln F.j ln N L uguaglianza risulta pertanto verificata. L.Stefanutti (Università di Padova) Modelli Log-lineari 13 / 71

Proprietà del Modello Additivo Esempio. Media Generale La seguente è la tavola dei logaritmi delle frequenze F ij ottenuta in precedenza Var 2 1 2 3 4 5 1 1.61 2.30 3.00 3.15 3.46 4.50 2 1.36 2.05 2.74 2.90 3.20 4.25 Var 1 3 1.02 1.71 2.41 2.56 2.87 3.91 4 0.80 1.49 2.18 2.34 2.64 3.69 5 0.11 0.80 1.49 1.65 1.95 3.00 2.71 3.40 4.09 4.25 Calcoliamo la media generale dei logaritmi in tabella: 4.55 5.60 µ = 1.61 + 2.30 + + 1.95 5 5 = 2.07 L.Stefanutti (Università di Padova) Modelli Log-lineari 14 / 71

Proprietà del Modello Additivo Esempio. Media di Riga Var 1 Var 2 1 2 3 4 5 1 1.61 2.30 3.00 3.15 3.46 2 1.36 2.05 2.74 2.90 3.20 3 1.02 1.71 2.41 2.56 2.87 4 0.80 1.49 2.18 2.34 2.64 5 0.11 0.80 1.49 1.65 1.95 Calcoliamo la media della riga 1: 1 c c ln F 1l = l=1 1.61 + 2.30 + + 3.46 5 = 2.70 L.Stefanutti (Università di Padova) Modelli Log-lineari 15 / 71

Proprietà del Modello Additivo Esempio. Media di Colonna Var 1 Var 2 1 2 3 4 5 1 1.61 2.30 3.00 3.15 3.46 2 1.36 2.05 2.74 2.90 3.20 3 1.02 1.71 2.41 2.56 2.87 4 0.80 1.49 2.18 2.34 2.64 5 0.11 0.80 1.49 1.65 1.95 Calcoliamo la media della colonna 1: 1 r r ln F k1 = k=1 1.61 + 1.36 + + 0.11 5 = 0.98 L.Stefanutti (Università di Padova) Modelli Log-lineari 16 / 71

Proprietà del Modello Additivo Esempio. Verifica Numerica Verifichiamo numericamente la proprietà notevole rispetto alla cella (1, 1): ln F 11 = 1 5 5 ln F 1l + 1 5 l=1 5 ln F k1 µ k=1 sostituendo i numeri ai simboli: 1.61 = 2.70 + 0.98 2.07 L.Stefanutti (Università di Padova) Modelli Log-lineari 17 / 71

Proprietà del Modello Additivo Proprietà Notevole e Deviazioni dalla Media Considerando le deviazioni dalla media generale µ la proprietà notevole ln F ij = 1 c ln F il + 1 r ln F kj µ c r l=1 k=1 può essere riscritta come (sottraiamo µ da entrambi i termini): ln F ij µ = 1 c c ln F il µ + 1 r l=1 r ln F kj µ k=1 L.Stefanutti (Università di Padova) Modelli Log-lineari 18 / 71

Proprietà del Modello Additivo Proprietà Notevole e Deviazioni dalla Media Si ottiene in questo modo la seguente scomposizione: ln F ij µ = }{{} deviaz. di F ij da media generale 1 c 1 r = ln F il µ + ln F kj µ c r l=1 k=1 }{{}}{{} deviaz. riga i da media generale deviaz. colonna j da media generale L.Stefanutti (Università di Padova) Modelli Log-lineari 19 / 71

Proprietà del Modello Additivo Indichiamo con µ 1(i) la deviazione della riga i dalla media generale: µ 1(i) = 1 c ln F il µ c Indichiamo con µ 2(j) la deviazione della colonna j dalla media generale: µ 2(j) = 1 r ln F kj µ r l=1 k=1 Possiamo ora riscrivere la precedente scomposizione come ln F ij µ = µ 1(i) + µ 2(j) da cui: ln F ij = µ + µ 1(i) + µ 2(j) L.Stefanutti (Università di Padova) Modelli Log-lineari 20 / 71

Modello Log-lineare di Analisi Multipla Modello Log-lineare di Analisi Multipla Nel modello log-lineare di analisi multipla, sotto la condizione di indipendenza, il logaritmo della frequenza attesa F ij si scompone in: una media generale µ una deviazione µ 1(i) della riga i dalla media generale µ una deviazione µ 2(j) della colonna j dalla media generale µ Vale cioè il seguente modello additivo: ln F ij = µ + µ 1(i) + µ 2(j) Il modello si compone di: un parametro µ r parametri µ 1(i), uno per ogni riga i c parametri µ 2(j), uno per ogni colonna j totale: r + c + 1 parametri L.Stefanutti (Università di Padova) Modelli Log-lineari 21 / 71

Modello Log-lineare di Analisi Multipla Esempio Negli esempi precedenti si era ottenuto: e 1 c µ = 1.61 + 2.30 + + 1.95 5 5 c ln F 1l = 2.70, l=1 1 r = 2.07, r ln F k1 = 0.98 I parametri della riga 1 e della colonna 1 risultano pertanto essere k=1 e µ 1(1) = 1 c ln F 1l µ = 2.70 2.07 = 0.63 c l=1 µ 2(1) = 1 r ln F k1 µ = 0.98 2.07 = 1.09 r k=1 L.Stefanutti (Università di Padova) Modelli Log-lineari 22 / 71

Modello Log-lineare di Analisi Multipla Vincoli dei Parametri La somma delle deviazioni di riga dalla media è zero: r µ 1(i) = 0 i=1 Analogamente, la somma delle deviazioni di colonna dalla media è zero: c µ 2(j) = 0 j=1 L.Stefanutti (Università di Padova) Modelli Log-lineari 23 / 71

Modello Log-lineare di Analisi Multipla Deviazioni Sistematiche dal Modello di Indipendenza La dipendenza (o non indipendenza) fra due variabili può essere intesa come una deviazione sistematica dal modello di indipendenza. ln Fij secondo il modello di indipendenza (1,6) (1,1) (1,2) (1,3) (1,4) (1,5) Deviazione sistematica dal modello di indipendenza L.Stefanutti (Università di Padova) Modelli Log-lineari 24 / 71

Modello Log-lineare di Analisi Multipla Interazione La deviazione sistematica dal modello di indipendenza può essere diversa nelle diverse celle della tavola Essa esprime una interazione tra una specifica categoria della variabile di riga e una specifica categoria della variabile di colonna A partire dal modello di indipendenza ln F ij = µ + µ 1(i) + µ 2(j) l interazione è modellata con un parametro µ 12(ij) specifico della cella (i, j) chiamato parametro di interazione Si ottiene così un modello di dipendenza specificato nel modo seguente: ln F ij = µ + µ 1(i) + µ 2(j) + µ 12(ij) L.Stefanutti (Università di Padova) Modelli Log-lineari 25 / 71

Modello Log-lineare di Analisi Multipla Modello Log-lineare di Dipendenza (o Saturo) Nel modello log-lineare di dipendenza (anche detto modello log-lineare saturo il logaritmo della frequenza attesa F ij si scompone in una media generale µ dei logaritmi una deviazione di riga µ 1(i) dalla media generale una deviazione di colonna µ 2(j) dalla media generale una deviazione µ 12(ij) dalla indipendenza (parametro di interazione) Nel complesso il modello si compone di: 1 parametro µ r parametri µ 1(i) c parametri µ 2(j) rc parametri µ 12(ij) Totale: 1 + r + c + rc parametri (tuttavia alcuni di essi non sono liberi di variare, come si vedrà) L.Stefanutti (Università di Padova) Modelli Log-lineari 26 / 71

Modello Log-lineare di Analisi Multipla Vincoli dei Parametri di Interazione La somma entro una qualunque riga i dei parametri di interazione è zero: c µ 12(ij) = 0 j=1 La somma entro una qualunque colonna j dei parametri di interazione è zero: r µ 12(ij) = 0 i=1 Da quanto sopra è evidente che r i=1 j=1 c µ 12(ij) = 0 L.Stefanutti (Università di Padova) Modelli Log-lineari 27 / 71

Stima dei Parametri Stima dei Parametri del Modello Saturo Per calcolare i parametri del modello saturo è necessario conoscere le frequenze attese F ij Tipicamente queste frequenze non sono note e debbono essere stimate dai dati. Le stime delle frequenze F ij possono essere impiegate per stimare i parametri del modello. Ricordiamo che nel modello saturo la stima per massima verosimiglianza della probabilità p ij è ˆp ij = n ij N la stima della frequenza attesa F ij è ˆF ij = Nˆp ij = n ij L.Stefanutti (Università di Padova) Modelli Log-lineari 28 / 71

Stima dei Parametri Stima dei Parametri del Modello Saturo Sostituendo le stime ˆF ij = n ij ai valori veri F ij nelle formule di calcolo dei parametri del modello saturo si ottiene: r c ˆµ = 1 rc i=1 j=1 ln n ij ˆµ 1(i) = 1 c c ln n ij ˆµ, j=1 ˆµ 2(j) = 1 r r ln n ij ˆµ i=1 ˆµ 12(ij) = ln n ij ˆµ ˆµ 1(i) ˆµ 2(j) L.Stefanutti (Università di Padova) Modelli Log-lineari 29 / 71

Stima dei Parametri Gradi di Libertà Dal momento che i parametri µ 1(i) sommano a zero, solamente r 1 di essi sono effettivamente stimati dai dati (l r-esimo parametro è ottenuto per differenza) Dal momento che i parametri µ 2(j) sommano a zero, solamente c 1 di essi sono effettivamente stimati dai dati (il c-esimo parametro è ottenuto per differenza) Dal momento che i parametri µ 12(ij) sommano a zero sia attraverso le righe, sia attraverso le colonne, solamente (r 1)(c 1) di essi sono stimati dai dati (gli altri sono ottenuti per differenza) L.Stefanutti (Università di Padova) Modelli Log-lineari 30 / 71

Stima dei Parametri Gradi di Libertà Numero di parametri stimati dai dati: 1 parametro µ r 1 parametri µ 1(i) c 1 parametri µ 2(j) (r 1)(c 1) parametri µ 12(ij) Totale: q = 1 + (r 1) + (c 1) + (r 1)(c 1) = 1 + r 1 + c 1 + rc r c + 1 = rc Numero di celle della tavola effettivamente utilizzate per stimare i parametri: r c Gradi di libertà: rc q = 0 L.Stefanutti (Università di Padova) Modelli Log-lineari 31 / 71

Esercizio/Esempio Stima dei Parametri Completiamo l analisi dei dati sul mancinismo stimando i parametri del modello saturo destrimani mancini ambidestri femmina 1070 92 8 1170 maschio 934 113 20 1067 2004 205 28 2237 Già sappiamo che il modello di indipendenza è stato respinto. L.Stefanutti (Università di Padova) Modelli Log-lineari 32 / 71

Stima dei Parametri Esempio. Logaritmi delle Frequenze Osservate Calcoliamo innanzitutto i logaritmi delle frequenze n ij : destrimano mancino ambidestro femmina 6.975 4.522 2.079 maschio 6.839 4.727 2.996 L.Stefanutti (Università di Padova) Modelli Log-lineari 33 / 71

Stima dei Parametri Esempio. Medie Marginali Calcoliamo quindi le medie di riga... destrimano mancino ambidestro femmina 6.975 4.522 2.079 4.526 maschio 6.839 4.727 2.996 4.854... e le medie di colonna destrimano mancino ambidestro femmina 6.975 4.522 2.079 maschio 6.839 4.727 2.996 6.907 4.625 2.538 L.Stefanutti (Università di Padova) Modelli Log-lineari 34 / 71

Stima dei Parametri Esempio. Media Generale Otteniamo la media generale µ come media delle medie di riga (o, equivalentemente, come media delle medie di colonna) destrimano mancino ambidestro femmina 6.975 4.522 2.079 4.526 maschio 6.839 4.727 2.996 4.854 6.907 4.625 2.538 4.690 L.Stefanutti (Università di Padova) Modelli Log-lineari 35 / 71

Stima dei Parametri Esempio. Deviazioni di Riga dalla Media Generale Stimiamo il parametro µ 1(1) : ˆµ 1(1) = 1 ln n 1j µ = 4.526 4.690 = 0.164 c j Stimiamo il parametro µ 1(2) : ˆµ 1(2) = 1 ln n 2j µ = 4.854 4.690 = 0.164 c j Osserviamo che ˆµ 1(1) = ˆµ 1(2) L.Stefanutti (Università di Padova) Modelli Log-lineari 36 / 71

Stima dei Parametri Esempio. Deviazioni di Colonna dalla Media Generale Stimiamo i parametri µ 2(j) : ˆµ 2(1) = 1 r ˆµ 2(2) = 1 r ˆµ 2(3) = 1 r ln n i1 µ = 6.907 4.690 = 2.218 i ln n i2 µ = 4.625 4.690 = 0.065 i ln n i3 µ = 2.538 4.690 = 2.152 i Osserviamo nuovamente (salvo errori di approssimazione) ˆµ 2(1) + ˆµ 2(2) + ˆµ 2(3) = 2.218 + ( 0.065) + ( 2.152) = 0 L.Stefanutti (Università di Padova) Modelli Log-lineari 37 / 71

Stima dei Parametri Esempio. Stima dei Parametri di Interazione La stima del parametro µ 12(11) è ˆµ 12(11) = ln n 11 ˆµ 1(1) ˆµ 2(1) µ = 6.975 ( 0.164) 2.218 4.690 = 0.232 La stima del parametro µ 12(12) è ˆµ 12(12) = ln n 12 ˆµ 1(1) ˆµ 2(2) µ = 4.522 ( 0.164) ( 0.065) 4.690 = 0.062 L.Stefanutti (Università di Padova) Modelli Log-lineari 38 / 71

Stima dei Parametri Esempio. Stima dei Parametri di Interazione Procedendo in modo simile per tutti gli altri parametri si ottiene: destrimano mancino ambidestro femmina 0.232 0.062 0.294 maschio 0.232 0.062 0.294 E facile osservare che i marginali di riga e di colonna sono tutti zero L.Stefanutti (Università di Padova) Modelli Log-lineari 39 / 71

Stima dei Parametri Deviazione dall Indipendenza Confrontiamo i logaritmi delle frequenze attese secondo il modello di indipendenza e quelli delle frequenze osservate 8 7 6 femmina attese maschio attese femmina osservate maschio osservate destrimani ln F ij 5 mancini 4 ambidestri 3 2 3 3.5 4 4.5 5 5.5 6 6.5 7 7.5 8 ln F.j L.Stefanutti (Università di Padova) Modelli Log-lineari 40 / 71

Varianza ed Errore Standard della Stima Stima dei Parametri ed Errore Casuale Il parametro di interazione µ 12(ij) è una misura della deviazione dal modello di indipendenza nello specifico incrocio tra le categorie i e j µ 12(ij) = 0 indica che, nello specifico incrocio (i, j) le due variabili sono tra loro indipendenti La stima ˆµ 12(ij) è affetta da errore casuale è può differire dal valore vero µ 12(ij). E estremamente probabile che ˆµ 12(ij) 0 anche quando, in effetti µ 12(ij) = 0 L.Stefanutti (Università di Padova) Modelli Log-lineari 41 / 71

Varianza ed Errore Standard della Stima Errore Standard della Stima I parametri µ, µ 1(i), µ 2(j), µ 12,(ij) sono stimati per massima verosimiglianza. In particolare la distribuzione campionaria delle stime di questi parametri è normale, con valore atteso uguale al valore vero. L ampiezza della distribuzione dipende dall errore standard della stima. L.Stefanutti (Università di Padova) Modelli Log-lineari 42 / 71

Varianza ed Errore Standard della Stima Varianza delle Frequenze Osservate La frequenza n ij osservata nel campione può essere intesa come la particolare realizzazione di una variabile casuale N ij il cui rango (insieme delle possibili realizzazioni) è l insieme dei numeri naturali La trasformazione logaritmica ln n ij di conseguenza è una realizzazione della variabile casuale ln N ij Questa variabile casuale ha varianza (Plackett, 1962) var(ln n ij ) = 1 n ij L.Stefanutti (Università di Padova) Modelli Log-lineari 43 / 71

Varianza ed Errore Standard della Stima Varianza delle Frequenze Osservate Ricordiamo che, date due variabili casuali X 1 e X 2 la loro somma X 1 + X 2 è anch essa una variabile casuale avente varianza var(x 1 + X 2 ) = var(x 1 ) + var(x 2 ) In generale, date X 1, X 2,..., X n, var(x 1 + X 2 + + X n ) = var(x 1 ) + var(x 2 ) + + var(x n ) L.Stefanutti (Università di Padova) Modelli Log-lineari 44 / 71

Varianza ed Errore Standard della Stima Varianza delle Frequenze Osservate Ricordiamo inoltre che, data una qualunque variabile casuale X avente varianza var(x) e una costante numerica a, il prodotto ax è anch esso una variabile casuale e la sua varianza è a 2 var(x) Dunque: var(a ln n ij ) = a2 n ij L.Stefanutti (Università di Padova) Modelli Log-lineari 45 / 71

Varianza ed Errore Standard della Stima Varianza del Parametro µ 1(i) Considerata la k-esima riga di una tavola r c, ci proponiamo di derivare la varianza della stima del parametro µ 1(k) : var(ˆµ 1(k) ) = var 1 c = var 1 c c ln n kj ˆµ j=1 c ln n kj 1 rc j=1 r i=1 j=1 c ln n ij L.Stefanutti (Università di Padova) Modelli Log-lineari 46 / 71

Varianza ed Errore Standard della Stima Varianza del Parametro µ 1(i) Alcune semplici osservazioni ci porteranno a riscrivere var 1 c ln n kj 1 r c ln n ij c rc nella forma j=1 r var i=1 j=1 i=1 j=1 c a ij ln n ij Infatti esistono particolari scelte dei coefficienti a ij che rendono le due scritture soprastanti fra loro equivalenti L.Stefanutti (Università di Padova) Modelli Log-lineari 47 / 71

Varianza ed Errore Standard della Stima I Coefficenti a ij. Esempio Consideriamo ad esempio una tavola 3 4 e calcoliamo la stima della deviazione di riga µ 1(1) ˆµ 1(1) = 1 4 (ln n 11 + ln n 12 + ln n 13 + ln n 14 ) 1 12 (ln n 11 + ln n 12 + ln n 13 + ln n 14 ) 1 12 (ln n 21 + ln n 22 + ln n 23 + ln n 24 ) 1 12 (ln n 31 + ln n 32 + ln n 33 + ln n 34 ) L.Stefanutti (Università di Padova) Modelli Log-lineari 48 / 71

Varianza ed Errore Standard della Stima I Coefficenti a ij. Esempio La precedente equazione può essere riscritta come ˆµ 1(1) = 3 12 (ln n 11 + ln n 12 + ln n 13 + ln n 14 ) 1 12 (ln n 11 + ln n 12 + ln n 13 + ln n 14 ) 1 12 (ln n 21 + ln n 22 + ln n 23 + ln n 24 ) 1 12 (ln n 31 + ln n 32 + ln n 33 + ln n 34 ) L.Stefanutti (Università di Padova) Modelli Log-lineari 49 / 71

Varianza ed Errore Standard della Stima I Coefficenti a ij. Esempio Segue che ˆµ 1(1) = 3 1 12 (ln n 11 + ln n 12 + ln n 13 + ln n 14 ) 1 12 (ln n 21 + ln n 22 + ln n 23 + ln n 24 ) 1 12 (ln n 31 + ln n 32 + ln n 33 + ln n 34 ) da cui ˆµ 1(1) = 2 12 ln n 11 + 2 12 ln n 12 + 2 12 ln n 13 + 2 12 ln n 14+ ( 1 ) ( ln n 21 + 1 ) ( ln n 22 + + 1 ) ln n 34 12 12 12 L.Stefanutti (Università di Padova) Modelli Log-lineari 50 / 71

Varianza ed Errore Standard della Stima I Coefficenti a ij. Esempio Se definiamo i coefficienti a ij nel modo seguente: a ij = allora possiamo scrivere { 2/12 se i = 1 1/12 se i 1 ˆµ 1(1) = r c a ij ln n ij i=1 j=1 L.Stefanutti (Università di Padova) Modelli Log-lineari 51 / 71

Varianza ed Errore Standard della Stima I Coefficienti a ij per il Parametro µ 1(i) In generale, data una tavola r c, considerata la k-esima riga della tavola possiamo scrivere: ˆµ 1(k) = r c a ij ln n ij i=1 j=1 dove: a ij = { r 1 rc 1 rc se i = k se i k L.Stefanutti (Università di Padova) Modelli Log-lineari 52 / 71

Varianza ed Errore Standard della Stima Varianza della Stima del Parametro µ 1 Possiamo ora derivare la varianza della stima del parametro µ 1(k) : r c var(ˆµ 1(k) ) = var a ij ln n ij i=1 j=1 Per la proprietà delle variabili casuali somma di variabili casuali: var(ˆµ 1(k) ) = r c var(a ij ln n ij ) i=1 j=1 Essendo a ij una costante: var(ˆµ 1(k) ) = r c aij 2 var(ln n ij) i=1 j=1 L.Stefanutti (Università di Padova) Modelli Log-lineari 53 / 71

Varianza ed Errore Standard della Stima Errore Standard della Stima del Parametro µ 1 Essendo var(ln n ij ) = 1/n ij si ottiene infine: var(ˆµ 1(k) ) = r c a 2 ij n ij i=1 j=1 L errore standard della stima del parametro µ 1(k) è r s(ˆµ 1(k) ) = var(ˆµ 1(k) ) = c a 2 ij n ij i=1 j=1 L.Stefanutti (Università di Padova) Modelli Log-lineari 54 / 71

Varianza ed Errore Standard della Stima Esempio Calcoliamo la varianza e l errore standard della stima ˆµ 1(1) per la tavola sul mancinismo. Si tratta di una tavola 2 3: r = 2, c = 3 I coefficienti a ij sono: a ij = r 1 rc = 2 1 2 3 = 1 6 se i = 1 e a ij = 1 rc = 1 6 se i = 2 L.Stefanutti (Università di Padova) Modelli Log-lineari 55 / 71

Varianza ed Errore Standard della Stima Esempio Approntiamo la seguente tabella di calcolo: Si ottiene dunque: i j a ij n ij aij 2/n ij 1 1 1/6 1070.0000 + 1 2 1/6 92.0003 + 1 3 1/6 8.0035 + 2 1 1/6 934.0000 + 2 2 1/6 113.0002 + 2 3 1/6 20.0014 =.0055 var(ˆµ 1(1) ) =.0055 e s(ˆµ 1(1) ) = var(ˆµ 1(1) ) =.0739 L.Stefanutti (Università di Padova) Modelli Log-lineari 56 / 71

Varianza ed Errore Standard della Stima Varianza delle Stime del Parametro µ 2 Seguendo analoghe considerazioni per il parametro µ 2(l) si ottiene: r c aij 2 var(ˆµ 2(l) ) = n ij i=1 j=1 In questo caso, tuttavia i coefficienti a ij sono a ij = { c 1 rc 1 rc se j = l se j l L.Stefanutti (Università di Padova) Modelli Log-lineari 57 / 71

Varianza ed Errore Standard della Stima Esempio Approntiamo la seguente tabella di calcolo: Si ottiene dunque: i j a ij n ij aij 2/n ij 1 1 2/6 1070.0001 + 1 2 1/6 92.0003 + 1 3 1/6 8.0035 + 2 1 2/6 934.0001 + 2 2 1/6 113.0002 + 2 3 1/6 20.0014 =.0056 var(ˆµ 2(1) ) =.0056 e s(ˆµ 2(1) ) = var(ˆµ 1(1) ) =.0750 L.Stefanutti (Università di Padova) Modelli Log-lineari 58 / 71

Varianza ed Errore Standard della Stima Varianza delle Stime del Parametro µ 12 La varianza del parametro µ 12(kl) ha anch essa forma generale var(µ 12(kl) ) = r c a 2 ij n ij i=1 j=1 Tuttavia, i coefficienti a ij sono definiti nel modo seguente: (r 1)(c 1) rc se i = k e j = l (r 1) a ij = rc se i = k e j l (c 1) rc se i k e j = l se i k e j l 1 rc L.Stefanutti (Università di Padova) Modelli Log-lineari 59 / 71

Varianza ed Errore Standard della Stima Coefficienti a ij per la Varianza del Parametro µ 12 Valori dei coefficienti a ij per il calcolo della varianza della stima del parametro µ 12(kl) 1 1 1 2 rc. k. 1 2 l c 1 rc rc c 1 1 rc rc 1 rc c 1 1 rc rc. r 1 rc. r 1 rc. r 1 rc.. (r 1)(c 1) rc r 1 rc... 1 rc c 1 1 rc rc L.Stefanutti (Università di Padova) Modelli Log-lineari 60 / 71

Esempio Varianza ed Errore Standard della Stima Calcoliamo i coefficienti a ij per la varianza della stima parametro µ 12(23) in una tavola 3 4 1 2 3 4 1 1 12 1 12 3 12 1 12 2 2 12 2 12 6 12 2 12 3 1 12 1 12 3 12 1 12 L.Stefanutti (Università di Padova) Modelli Log-lineari 61 / 71

Varianza ed Errore Standard della Stima Coefficienti a ij per µ 12(22) Volendo ad esempio calcolare la varianza della stima del parametro µ 12(22) nella tavola 2 3 sul mancinismo: destrimano mancino ambidestro maschio 1/6 2/6 1/6 femmina 1/6 2/6 1/6 L.Stefanutti (Università di Padova) Modelli Log-lineari 62 / 71

Varianza ed Errore Standard della Stima Calcoliamo la varianza di ˆµ 12(22) i j a ij n ij aij 2/n ij 1 1 0.167 1070.0000 1 2-0.333 92.0012 1 3 0.167 8.0035 2 1-0.167 934.0000 2 2 0.333 113.0010 2 3-0.167 20.0014 0.000.0071 Si ottiene dunque: e s(ˆµ 12(22) ) = var(ˆµ 12(22) ) =.0071 var(ˆµ 12(22) ) =.0843 L.Stefanutti (Università di Padova) Modelli Log-lineari 63 / 71

La Standardizzazione dei Parametri Standardizzazione dei Parametri Si consideri ad esempio il parametro µ 12(ij) Se µ 12(ij) 0, esso indica una deviazione dall indipendenza all incrocio tra la riga i e la colonna j Per verificare µ 12(ij) 0 a partire dalla stima ˆµ 12(ij) si definisce il seguente sistema di ipotesi: H 0 : µ 12(ij) = 0 (non c è deviazione dall indipendenza) H 1 : µ 12(ij) 0 (c è deviazione dall indipendenza) La statistica-test è z 12(ij) = ˆµ 12(ij) 0 var(ˆµ 12(ij) ) Per N la distribuzione di z 12(ij) si approssima a una distribuzione normale con media 0 e deviazione standard 1. L.Stefanutti (Università di Padova) Modelli Log-lineari 64 / 71

La Standardizzazione dei Parametri Test di Ipotesi Multipli e Simultanei Dati n test di ipotesi tra loro indipendenti, effettuati simultaneamente sul medesimo campione, ognuno a un livello di significatività (probabilità di errore del I tipo) pari ad α: Probabilità di non commettere un errore del I tipo nel singolo test: 1 α Probabilità di non commettere un errore del I tipo in nessuno degli n test: (1 α) n Probabilità di commettere un errore del I tipo in almeno uno dei test: 1 (1 α) n Esempio, scelto α =.05, la probabilità di commettere un errore del I tipo in almeno uno di 10 test simultanei è 1 (1.05) 10 =.40 L.Stefanutti (Università di Padova) Modelli Log-lineari 65 / 71

La Standardizzazione dei Parametri Correzione di Bonferroni per Test Multipli Indipendenti Sia α la probabilità di commettere un errore del I tipo in almeno uno di n test simultanei e indipendenti La correzione di Bonferroni consiste nel valutare ognuno degli n test a un livello di significatività pari a α n Esempio: con n = 10 test indipendenti, scelto α =.05, il livello di significatività per ogni singolo test è Osserviamo che.05 10 =.005 1 (1.005) 10.05 = α L.Stefanutti (Università di Padova) Modelli Log-lineari 66 / 71

La Standardizzazione dei Parametri Correzione di α per i Parametri di Interazione Ipotesi Monodirezionale (a Una Coda) Volendo verificare l ipotesi che ognuna delle stime dei parametri di interazione ˆµ 12(ij) sia maggiore (risp. minore) di zero (ipotesi monodirezionale) si effettuano complessivamente r c test statistici Gli r c test tuttavia non sono indipendenti a causa dei vincoli introdotti sui parametri di interazione Si hanno complessivamente (r 1)(c 1) parametri liberi di variare Questo è anche il numero di test tra loro indipendenti La correzione è dunque: α (r 1)(c 1) L.Stefanutti (Università di Padova) Modelli Log-lineari 67 / 71

La Standardizzazione dei Parametri Correzione di α per i Parametri di Interazione Ipotesi Bidirezionale (a Due Code) Se l ipotesi è bidirezionale è necessario dividere ulteriormente per due: α 2(r 1)(c 1) Esempio: fissato α a.05 in una tavola 2 3 il livello di significatività per il test bidirezionale della stima del parametro ˆµ 12(ij) sarà.05 2(2 1)(3 1) =.05 4 =.0125 L.Stefanutti (Università di Padova) Modelli Log-lineari 68 / 71

Esempio La Standardizzazione dei Parametri Stima del parametro µ 12(22) : Errore standard: Parametro standardizzato: ˆµ 12(22) =.062 s(ˆµ 12(22) ) =.0843 z 12(22) = ˆµ 12(22) s(ˆµ 12(22) ) =.062.0843 =.735 L.Stefanutti (Università di Padova) Modelli Log-lineari 69 / 71

La Standardizzazione dei Parametri Esempio Livello di significatività - ipotesi bidirezionale.05 2(2 1)(3 1) =.05 4 =.0125 Valore critico: z.0125 = 2.24 Decisione statistica: essendo z 12(22) =.735 minore di z.0125 = 2.24 non si respinge l ipotesi nulla Non possiamo concludere che µ 12(22) sia diverso da zero Non possiamo concludere che all incrocio tra la categoria maschio e la categoria mancino vi sia una deviazione dall indipendenza L.Stefanutti (Università di Padova) Modelli Log-lineari 70 / 71

La Standardizzazione dei Parametri Correzione di α In generale, con ipotesi bidirezionale: α 2gdl Parametri delle deviazioni di riga µ 1(i) : α 2(r 1) Parametri delle deviazioni di colonna µ 2(j) : Parametri di interazione µ 12(ij) : α 2(c 1) α 2(r 1)(c 1) L.Stefanutti (Università di Padova) Modelli Log-lineari 71 / 71