Soluzioi esercizi Capitolo 7 Quado si valuta la relazioe fra due variabili, occorre prestare particolare attezioe al fatto che i modelli statistici specifici per ogi scala di misura siao applicabili: i altre parole, occorre verificare che siao soddisfatte le assuzioi per l applicabilità del test statistico. Questa accortezza riguarda l associazioe a livello omiale (assuzioi per l applicazioe del test del chi-quadrato), e quella a livello metrico (verifica della liearità della relazioe mediate diagramma a dispersioe). Esercizio La domada chiede se è possibile affermare che esiste ua relazioe fra frequeza settimaale della colazioe e peso corporeo. Di per sé le due variabili soo ordiali, per cui la relazioe potrebbe essere valutata co u metodo di aalisi specifico per queste due scale di misura, che ci permetterebbe di valutare se all aumetare della frequeza della colazioe è associata ua variazioe, i più o i meo, ello status del peso corporeo. I ogi caso, o è detto che la relazioe stia i questi termii solo perché le variabili soo ordiali, per cui ache l applicazioe del test chi-quadrato per l idipedeza di variabili categoriali potrebbe comuque forirci isight iteressati sulla relazioe ad esempio, potremmo trovare che solo particolari icroci di categorie, o vicolati al loro ordie itriseco, producoo u effetto di sigificatività. Puto (a) Obiettivo: verificare se esiste ua relazioe fra frequeza della colazioe e status rispetto al peso corporeo Variabili Variabile : Frequeza della colazioe (ordiale: 0-; -3; 4-5; 6-7 volte a settimaa) Variabile : Status rispetto al peso corporeo (ordiale: Sottopeso; Normopeso; Sovrappeso; Obeso) Ipotesi: se le due variabili soo i relazioe fra di loro, dovremmo osservare che fare colazioe co ua certa frequeza modifica la probabilità di trovarsi su ua particolare categoria dello status rispetto al peso corporeo H 0 : Π(Sottopeso 0-) Π(Sottopeso -3) Π(Sottopeso 4-5); Π(Normopeso 0-) Π(Normopeso -3) Π(Normopeso 4-5); Π(Sovrappeso 0-) Π(Sovrappeso -3) Π(Sovrappeso 4-5) 3 ella popolazioe, la probabilità di trovarsi i u certo status rispetto al peso corporeo dato che si fa colazioe co ua certa frequeza è uguale alla probabilità di trovarsi i u altro status rispetto al peso corporeo dato che si fa colazioe co ua certa altra frequeza le due variabili soo idipedeti H : Almeo due Π diverse ella popolazioe, la probabilità di trovarsi i u certo status rispetto al peso corporeo dato che si fa colazioe co ua certa frequeza è diversa dalla probabilità di trovarsi i u altro status rispetto al peso corporeo dato che si fa colazioe co ua certa altra frequeza le due variabili soo associate fra loro. Si veda Approfodimeto 7. e Strumeti Iformatici 7. No viee idicato quale variabile è cosiderata idipedete e quale dipedete, i quato etrambe le variabili, per vari motivi, potrebbero ricoprire sia l uo che l altro ruolo. Ua bassa frequeza di colazioe potrebbe essere idice di u regime alimetare scorretto che potrebbe favorire il trovarsi i uo status di peso a rischio, così come l essere sovrappeso potrebbe essere resposabile di ua mior frequeza della colazioe, legata al tetativo di dimagrire. Queste soo solo due delle possibili circa la direzioalità della relazioe. 3 Vegoo idicate le probabilità codizioate solo per le celle che rappresetao i gradi di libertà della tavola. Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Poiché itediamo utilizzare il test del chi-quadrato per l idipedeza di variabili categoriali, dobbiamo prima verificare che siao soddisfatte le codizioi per la sua applicabilità:. Osservazioi idipedeti: ogi osservazioe deve essere stata otteuta su u soggetto diverso, per cui o ci devoo essere categorie delle variabili che rappresetao misure ripetute sugli stessi soggetti l assuzioe sembra soddisfatta, poiché o c è motivo di riteere che le osservazioi siao il risultato, ad esempio, di misure ripetute sugli stessi soggetti. No più del 0% di frequeze attese iferiori a 5 per verificare questa assuzioe basta calcolare le frequeze attese per ogi cella. Calcoliamo iazitutto i totali margiali Frequeza colazioe Peso corporeo Sottopeso Normopeso Sovrappeso Obesità Totale 0- volte/settimaa 50 50 80 49 39-3 volte/settimaa 58 53 66 5 30 4-5 volte/settimaa 56 69 58 8 30 6-7 volte/settimaa 44 34 3 33 Totale 08 706 7 04 45 Calcoliamo le frequeze attese i ogi cella mediate la formula: Totale margiale di riga Totale margiale di coloa Frequeza attesa i ua cella Numero soggetti Frequeza colazioe 0- volte/settimaa 54, 97 Peso corporeo Sottopeso Normopeso Sovrappeso Obesità 39 08 45 30 08 50, 45 30 08 50, 45 33 08 5, 45-3 volte/settimaa 45 4-5 volte/settimaa 9 6-7 volte/settimaa 9 39 706 39 7 39 04 86,57 59, 99 7, 48 45 45 45 30 706 30 7 30 04 7,5 55, 06 5, 3 45 45 45 30 706 30 7 30 04 70,69 54, 88 5, 4 45 45 45 33 706 33 7 33 04 77,49 57, 07 6, 5 45 45 45 Totale 39 30 30 33 Totale 08 706 7 04 45 Poiché essua frequeza attesa è iferiore a 5, l assuzioe è soddisfatta. 3. Nessua frequeza osservata uguale a zero o vi soo frequeze osservate uguali a zero Dato che tutte e tre le assuzioi per l applicabilità del test del chi-quadrato per l idipedeza di variabili categoriali soo soddisfatte, possiamo procedere co il test. I questo caso i gradi di libertà della tavola soo (umero righe della tavola ) (umero coloe della tavola ) (4 ) (4 ) 9, per cui il chi-quadrato critico per α,0 e 9 gradi di libertà è,666 4. La regola di decisioe sarà: 4 Si potrebbe pesare ache u ipotesi di tipo bidirezioale, i cui i valori critici soo quelli relativi ai valori di probabilità α/,005 e α/,005,995, ossia 3,589 e,735, rispettivamete. I questo caso la regola di decisioe è: se calcolato < critico iferiore oppure calcolato > critico superiore è troppo improbabile Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
se calcolato > critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo se calcolato < critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo No ci resta che calcolare il : ( f k o a f a (58 50,45) 50,45 (56 50,9) 50,9 f ) (50 54,97) 54,97 (53 7,5) 7,5 (69 70,69) 70,69 (66 55,06) 55,06 (58 54,88) 54,88 (44 5,9) (34 77,49) (3 57,07) 5,9 77,49 57,07 0,449 7,67 6,677 6,847,8,946,7 0,00 0,649 0,07 0,77,030,35 7,990 0,339 7,654 86,56 (50 86,57) 86,57 (80 59,99) 59,99 (5 5,3) 5,3 (8 5,4) 5,4 ( 6,5) 6,5 (49 7,48) 7,48 Coclusioe: poiché calcolato > critico (86,56 >,666), è troppo improbabile che quato osservato sia il risultato di u ipotesi ulla vera, per cui la rifiutiamo. Questi risultati suggeriscoo che molto probabilmete esiste ua relazioe fra frequeza della colazioe e status rispetto al peso corporeo. L aver rifiutato l ipotesi ulla idica che probabilmete le due variabili soo associate. Per sapere quali celle, i particolare, soo resposabili dell associazioe dovremmo cosultare i residui stadardizzati aggiustati (vedi Approfodimeto 7.). Ad ogi modo, l ispezioe dei compoeti del chi-quadrato può già forire qualche idicazioe, dato che u residuo alto idica ua maggiore differeza fra frequeze osservate ed attese. Nel ostro caso i compoeti maggiori soo [0-; Obeso], [6-7; Normopeso] e [6-7; Sovrappeso]. Nel primo e el secodo caso le frequeze attese soo iferiori alle osservate, el terzo è il cotrario. Questo potrebbe idicare che è più probabile, rispetto all ipotesi ulla di idipedeza, che u adolescete sia obeso dato che fa colazioe 0- volte a settimaa (o viceversa, a secoda della direzioe di causalità scelta) e che u adolescete sia ormopeso se fa colazioe 6-7 volte a settimaa (o viceversa), metre è meo probabile che sia sovrappeso posto dato che fa colazioe 6-7 volte a settimaa (o viceversa). Puto (b) Dimesioe dell effetto Dimesioe dell'effetto I questo caso utilizziamo l'idice di dimesioe dell effetto w. Il calcolato è 86,56, e la dimesioe totale del campioe 45, per cui: che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo; se critico iferiore < calcolato < critico superiore o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo. Nodimeo, di solito si tede a cosiderare il valore critico ad ua coda. Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
w 86,56 45 0,6 Le liee guida per l iterpretazioe di w riportate ella Tabella 4.5 ci permettoo di cocludere che siamo di frote a u effetto piccolo. Si oti come questo risultato appaia i cotrasto co la sigificatività del test statistico: odimeo, sappiamo che il test del chi-quadrato risete dell ampiezza campioaria, per cui è più facile che risulti sigificativo ache i preseza di effetti piccoli o addirittura trascurabili quado l ampiezza campioaria è molto grade, come è ifatti questo il caso. Puto (c) Rappresetazioe grafica Utilizziamo u grafico a barre affiacate. Possiamo scegliere se utilizzare barre di colore diverso per l ua o per l altra variabile a secoda se vogliamo mettere i evideza le differeze fra le categorie di peso corporeo per ogi categoria di frequeza della colazioe o viceversa. Frequeza 50 00 50 00 Frequeza colazioe (volte/settimaa) 0- -3 4-5 6-7 50 0 Sottopeso Normopeso Sovrappeso Obesità Categoria di peso 50 00 Categoria di peso Sottopeso Normopeso Sovrappeso Obesità Frequeza 50 00 50 0 0- -3 4-5 6-7 Frequeza colazioe (volte/settimaa) Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Esercizio Ache questo esercizio, come l Esercizio, chiede di valutare l associazioe fra due variabili categoriali (decisioe di azioare o meo lo scambio e tipo di reato dell idividuo che pagherebbe le cosegueze dell azioameto del dispositivo). Come vedremo, però, o è possibile applicare il test del chi-quadrato per l idipedeza di variabili categoriali poiché due delle assuzioi per la sua applicazioe o soo rispettate. Obiettivo: verificare se esiste ua relazioe fra categoria di reato dell'idividuo che morirebbe se veisse azioato lo scambio e decisioe del soggetto di azioare lo scambio Variabili Variabile : Categoria di reato (omiale, dicotomica: Truffa; Evasioe) variabile che cosideriamo come causa, perciò è la variabile idipedete dello studio Variabile : Decisioe di appropriatezza dell azioare lo scambio (omiale, dicotomica: Sì, No) variabile che cosideriamo come effetto, perciò è la variabile dipedete dello studio Ipotesi: se le due variabili soo i relazioe fra di loro, dovremmo osservare che la categoria di reato modifica la probabilità che il soggetto decida o meo che sia appropriato azioario lo scambio H 0 : Π(Sì Truffa) Π(Sì Evasioe) ella popolazioe, la probabilità che il soggetto decida di azioare lo scambio o è modificata dalla categoria di reato le due variabili soo idipedeti H : Π(Sì Truffa) Π(Sì Evasioe) ella popolazioe, la probabilità che il soggetto decida di azioare lo scambio è modificata dalla categoria di reato le due variabili soo associate fra loro L associazioe fra variabili categoriali di solito viee valutata mediate u test del chi-quadrato, ma per applicare questo test statistico dobbiamo prima verificare che siao rispettate le assuzioi per la sua applicabilità:. Osservazioi idipedeti: ogi osservazioe deve essere stata otteuta su u soggetto diverso, per cui o ci devoo essere categorie delle variabili che rappresetao misure ripetute sugli stessi soggetti l assuzioe sembra soddisfatta, poiché i due campioi di osservazioi defiiti dalla categoria di reato soo idipedeti, e la decisioe del soggetto di azioare lo scambio può essere solo Sì o No.. No più del 0% di frequeze attese iferiori a 5 per verificare questa assuzioe basta calcolare le frequeze attese per ogi cella. Realizziamo iazitutto la tavola di cotigeza: Categoria di reato Sì Decisioe No Totale Truffa 6 4 0 Evaso 9 0 9 Totale 5 4 9 e calcoliamo le frequeze attese: Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Decisioe Categoria di reato Totale Sì No 0 5 9 9 5 7, 9 Truffa 7, 89 Evaso 0 4, 9 9 4,89 9 0 9 Totale 5 4 9 Notiamo che due celle (50%) presetao frequeze attese iferiori a 5, per cui l assuzioe o è soddisfatta. 3. Nessua frequeza osservata uguale a zero l ispezioe delle frequeze osservate rivela che vi è ua cella co frequeza osservata uguale a zero, per cui ache questa assuzioe o è soddisfatta. Dato che due assuzioi su tre o soo soddisfatte, o possiamo applicare il test del chi-quadrato per l idipedeza di variabili categoriali. O meglio, potremmo ache applicare la formula, ma il valore risultate o sarebbe distribuito come il χ della distribuzioe teorica, per cui o avrebbe seso cofrotarlo co quello critico ricavato dalle tavole i base al livello di sigificatività α e ai gradi di libertà. I questi casi si ricorre ai test di probabilità esatta, i particolare quello di Fisher (si veda ache la soluzioe dell Esercizio del Capitolo 5). Per applicare questo test, dobbiamo applicare il coefficiete ipergeometrico alla tabella i oggetto e a tutte quelle che presetao situazioi più estreme. I realtà, ci troviamo già ella situazioe più estrema, dato che i soggetti del gruppo Evaso hao scelto tutti di azioare lo scambio. Per cui, la soluzioe dell esercizio si limiterà al calcolo della seguete probabilità, che cofroteremo poi co il livello di sigificatività diviso per due (l ipotesi alterativa è bidirezioale, per cui α/,05) e la regola di decisioe sarà: se p <,05 è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo se p >,05 o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo ( a b)! ( c d)! ( a c)! ( b d)! p a! b! c! d!! dove ogi lettera corrispode ai dati della seguete tabella: Categoria di reato Sì Decisioe No Totale Truffa a b ab Evaso c d cd Totale ac bd per cui avremo: 0! 9! 5! 4! p 6! 4! 9! 0! 9! Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Ricordado che 0!, sviluppiamo il 9! a deomiatore fio a 5! i modo da semplificarlo col 5! a umeratore e semplifichiamo ache il 9! e il 4! a umeratore co quelli a deomiatore: 0! p 6! (9 8 7 6) Ora svolgiamo il 0! a umeratore fio a 6! per semplificarlo col 6! a deomiatore: 0 9 8 7 p 9 8 7 6 e semplifichiamo fiché possiamo i rimaeti fattori (il 9 e l 8 a umeratore col 8 e il 6 deomiatore): 0 7 p,054 9 7 Coclusioe: poiché p > α (,054 >,05), o è così improbabile che quato osservato sia il risultato di u ipotesi ulla vera, per cui la accettiamo. Questi risultati suggeriscoo che o vi è associazioe fra categoria di reato e decisioe di azioare lo scambio. Ad essere proprio pigoli, la probabilità per il test a due code dovrebbe essere calcolata i u altro modo, ossia, sommare la probabilità che abbiamo appea calcolato (che è quella ad ua coda) co quella relativa alle possibili permutazioi dei dati sull altro estremo della distribuzioe. Abbiamo osservato la seguete tabella: Categoria di reato Sì Decisioe No Totale Truffa 6 4 0 Evaso 9 0 9 Totale 5 4 9 L altro estremo della distribuzioe, i questo caso, è costituito dal caso i cui tutti i soggetti del gruppo Truffa hao scelto di azioare lo scambio: Categoria di reato Sì Decisioe No Totale Truffa 0 0 0 Evaso 5 4 9 Totale 5 4 9 0! 9! 5! 4! La probabilità associata a questa tavola è: p, 033, che, sommata alla 0! 0! 5! 4! 9! precedete, restituisce ua probabilità a due code di,054,033,087. Per maggiori delucidazioi sul test esatto di Fisher a due code si veda Agresti (00, p. 93). Dimesioe dell effetto Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
I questo caso per calcolare la dimesioe dell effetto dobbiamo risalire ad u valore di t, e da questo ad u valore di r. Perché l operazioe sia accurata, abbiamo bisogo di più decimali possibile per p (,05479567), e di u software i grado di risalire ad u valore di t a partire da quello di p. Excel o OpeOfficeCalc fao al caso ostro. Il umero di gradi di libertà è uguale al umero totale di soggetti meo due, che el ostro caso è 9 7. Per cui i Excel scriveremo INV.T(,05479567;7), il cui risultato è,068. A questo puto applichiamo la formula per covertire t i r: r t t gdl,068,068 7,45 I base alle liee guida della Figura 7., tale valore è idice di ua relazioe moderata 5. Rappresetazioe grafica Per la rappresetazioe grafica utilizziamo u grafico a barre affiacate: Frequeza 0 9 8 7 6 5 4 3 0 Categoria Reato Truffa Evaso Sì No Decisioe sull'azioare lo scambio Frequeza 0 9 8 7 6 5 4 3 0 Decisioe sull'azioare lo scambio Sì No Truffa Categoria reato Evaso 5 Nel caso di u test a due code iserire ella fuzioe di Excel la probabilità a due code calcolata al puto precedete, e utilizzare il valore di t risultate. Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Esercizio 3 Come ell Esercizio, ci troviamo a dover verificare l esisteza di ua relazioe fra due variabili dicotomiche: l aver o meo coseguito la laurea ei tempi previsti il riuscire o meo a trovare lavoro etro u ao dalla laurea. I questo caso l attribuzioe del ruolo di causa ed effetto è meo giustificata che ell Esercizio, dove la variabile cosiderata idipedete era stata maipolata e c era stata assegazioe casuale dei soggetti ai gruppi. I questo caso ci troviamo di frote a dati osservativi, per cui o sarebbe corretto, per certi versi, supporre ua relazioe diretta per quato il laurearsi si verifichi temporalmete prima del trovare lavoro: potrebbe ad esempio esistere ua terza variabile, come il task commitmet (impego ello svolgere u compito), che, se posseduto dal soggetto i alto grado, potrebbe determiare sia ua più rapida coclusioe del percorso uiversitario, sia maggiori probabilità di trovare lavoro i breve tempo. La relazioe fra le due variabili i esame sarebbe quidi spuria (covariazioe i asseza di causazioe). Puto (a) Obiettivo: verificare se esiste ua relazioe fra l aver o meo coseguito la laurea ei tempi previsti e riuscire o meo a trovare lavoro etro u ao dalla laurea Variabili Variabile : Laurearsi ei tempi previsti (omiale, dicotomica: Sì, No) Variabile : Trovare lavoro etro u ao dalla laurea (omiale, dicotomica: Sì, No) Ipotesi: se le due variabili soo i relazioe fra di loro, dovremmo osservare che laurearsi ei tempi previsti modifica la probabilità di trovare lavoro etro u ao dalla laurea H 0 : Π(Trovare lavoro etro u ao dalla laurea Laurea ei tempi previsti) Π(Trovare lavoro etro u ao dalla laurea Laurea o ei tempi previsti) ella popolazioe, la probabilità che il soggetto trovi lavoro etro u ao dalla laurea dato che si è laureato ei tempi previsti è uguale alla probabilità che il soggetto trovi lavoro etro u ao dalla laurea dato che o si è laureato ei tempi previsti le due variabili soo idipedeti H : Π(Trovare lavoro etro u ao dalla laurea Laurea ei tempi previsti) Π(Trovare lavoro etro u ao dalla laurea Laurea o ei tempi previsti) ella popolazioe, la probabilità che il soggetto trovi lavoro etro u ao dalla laurea dato che si è laureato ei tempi previsti è diversa dalla probabilità che il soggetto trovi lavoro etro u ao dalla laurea dato che o si è laureato ei tempi previsti le due variabili soo associate Verifichiamo che possa essere utilizzato il test del chi-quadrato per l idipedeza di variabili categoriali cotrollado che tutte la assuzioi per la sua applicabilità siao rispettate. Osservazioi idipedeti: ogi osservazioe deve essere stata otteuta su u soggetto diverso, per cui o ci devoo essere categorie delle variabili che rappresetao misure ripetute sugli stessi soggetti l assuzioe sembra soddisfatta, poiché i due campioi di osservazioi defiiti dall essersi o meo laureati ei tempi previsti soo idipedeti, così come soo categorie idipedeti l aver o meo trovato lavoro etro u ao dalla laurea. No più del 0% di frequeze attese iferiori a 5 per verificare questa assuzioe basta calcolare le frequeze attese per ogi cella. Realizziamo iazitutto la tavola di cotigeza: Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Laurea ei tempi previsti Lavoro etro u ao dalla laurea No Sì Totale No 99 48 47 Sì 5 60 Totale 50 08 358 e calcoliamo le frequeze attese: Laurea ei tempi previsti Lavoro etro u ao dalla laurea No 47 50 47 08 No 7, 49 74, 5 358 358 50 08 Sì 77, 5 33, 49 358 358 Sì Totale 47 Totale 50 08 358 Nessua frequeza attesa è iferiore a 5, per cui l assuzioe è rispettata. 3. Nessua frequeza osservata uguale a zero l ispezioe delle frequeze osservate rivela che essua è uguale a zero, per cui ache questa assuzioe è rispettata. Possiamo quidi procedere col test del. I questo caso i gradi di libertà della tavola soo (umero righe della tavola ) (umero coloe della tavola ) ( ) ( ), per cui il chi-quadrato critico 6 per α,0 e gradi di libertà è 6,635. La regola di decisioe sarà: se calcolato > critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo se calcolato < critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo No ci resta che calcolare il : ( f o f a ) (99 7,49) (48 74,5) (5 77,5) (60 33,49) f 7,49 74,5 77,5 33,49 k a 4,08 9,43 9,07 0,99 43,57 Coclusioe: poiché calcolato > critico (43,57 > 6,635), è troppo improbabile che quato osservato sia il risultato di u ipotesi ulla vera, per cui la rifiutiamo. Questi risultati suggeriscoo che molto probabilmete esiste ua relazioe fra l essersi o meo laureati ei tempi previsti e trovare lavoro etro u ao dalla laurea. 6 I base all ipotesi alterativa che abbiamo formulato, i realtà sarebbe più corretto idividuare i valori di chi-quadrato critico a due code, per cui i valori critici sarebbero quelli relativi ai valori di probabilità α/,005 e α/,005,995, ossia 7,879 e 0,00004, rispettivamete. I questo caso la regola di decisioe è: se calcolato < critico iferiore oppure calcolato > critico superiore è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo; se critico iferiore < calcolato < critico superiore o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo. Nodimeo, di solito si tede a cosiderare il valore critico ad ua coda. Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
L aver rifiutato l ipotesi ulla idica che probabilmete le due variabili soo associate. Per sapere quali celle, i particolare, soo resposabili dell associazioe dovremmo cosultare i residui stadardizzati aggiustati (vedi Approfodimeto 7.). Ad ogi modo, l ispezioe dei compoeti del chi-quadrato può già forire qualche idicazioe, dato che u residuo alto idica ua maggiore differeza fra frequeze osservate ed attese. Nel ostro caso i compoeti soo tutti alti, ma quello otiamo è che, rispetto a quato atteso sotto l ipotesi di idipedeza, che ci soo più laureati fuori corso che o trovao lavoro etro u ao dalla laurea, e più laureati ei tempi previsti che trovao lavoro etro u ao dalla laurea. Questo dato sembrerebbe suggerire che laurearsi ei tempi previsti faccia ua differeza sostaziale rispetto al trovare lavoro etro u ao. Gli idici di dimesioe dell effetto richiesti dal puto (b) aiuterao a fare ulteriore luce sul feomeo A livello grafico possiamo rappresetare i grafici ei segueti modi: 50 Lavoro etro u ao No 00 Sì Frequeza 50 00 50 0 No Si Laurea ei tempi previsti 50 Laurea ei tempi previsti No 00 Si Frequeza 50 00 50 0 No Sì Lavoro etro u ao Puto (b) Trattadosi di ua tavola, possiamo calcolare tutta ua serie di idici di dimesioe dell effetto e di associazioe. Comiciamo dalla dimesioe dell effetto w, che si calcola: w 43,57 358 0,35 Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Le liee guida per l iterpretazioe di w riportate ella Tabella 4.5 ci permettoo di cocludere che siamo di frote a u effetto moderato. Possiamo poi calcolare l odds ratio, o rapporto di associazioe (θ), che ci dirà quato è più probabile per u laureato ei tempi previsti trovare lavoro etro u ao dalla laurea rispetto ad u laureato fuori corso. Per calcolare θ dobbiamo però calcolare gli odds (Ω), o rapporti di probabilità, per le due codizioi del trovare lavoro i base all essersi o meo laureati ei tempi previsti: Ω Ω Frequeza Laureati ei tempi previsti che trovao lavoro etro u ao 60 Frequeza Laureati ei tempi previsti che o trovao lavoro etro u ao 5 lavoro ei tempi Frequeza Laureati fuori corso che trovao lavoro etro u ao 48 Frequeza Laureati fuori corso che o trovao lavoro etro u ao 99 lavoro fuori corso Ora possiamo calcolare l odds ratio θ: 0,4,8 θ Ω Ω lavoro ei tempi lavoro fuori corso,8 0,4 4,9 Questo dato sigifica che chi si laurea ei tempi previsti ha ua probabilità 4,9 volte maggiore di trovare lavoro etro u ao dalla laurea di chi ivece si laurea fuori corso. Possiamo ache sottoporre a verifica l ipotesi che l odds ratio sia statisticamete uguale a oppure o: H 0 : θ Nella popolazioe da cui è stato estratto il campioe, l odds ratio è uguale a le variabili soo idipedeti H 0 : θ Nella popolazioe da cui è stato estratto il campioe, l odds ratio è diverso le variabili soo associate Il test di sigificatività sull odds ratio è basato ua statistica distribuita come z calcolata el seguete modo: lθ z a b c d dove l θ è il logaritmo aturale dell odds ratio e a, b, c, e d soo le quattro frequeze di cella. Per α,0 e ipotesi alterativa bidirezioale lo z critico è,58. La regola di decisioe sarà: se z calcolato > z critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo l odds ratio è sigificativamete diverso da le variabili soo associate se z calcolato < z critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo l odds ratio o è sigificativamete diverso da le variabili soo idipedeti Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
z 99 l 4,9 48 5 60 6,39 Coclusioe: poichè z calcolato > z critico (6,39 >,58), è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo l odds ratio è sigificativamete diverso da le variabili soo associate Le altre misure di associazioe che possiamo calcolare soo il coefficiete phi (ϕ), e il V di Cramér, che si ottegoo mediate le segueti formule: ad bc ϕ ; ( a b)( a c)( c d)( b d) V mi( r, c ) a, b, c, e d soo le frequeze di cella come ella tabella: Laurea ei tempi previsti Lavoro etro u ao dalla laurea No Sì Totale No a b ab Sì c d cd Totale ac bd per cui avremo che: 99 60 48 6 43,57 ϕ 0,35 ; V 0, 35 47 50 08 358 La sigificatività (ossia, il fatto che siao statisticamete diversi da zero) è garatita dalla sigificatività del test del. Il coefficiete ϕ è iterpretabile come u coefficiete di correlazioe, per cui, essedo compreso fra,30 e,50, è idice di ua correlazioe moderata (vedi Figura 7.). Si oti ifie come i questo caso il V di Cramér coicida co w. Esercizio 4 Per verificare la relazioe fra le due variabili possiamo utilizzare l iformazioe a livello ordiale coteuta ei dati. La preseza della valutazioe No idoeo ci impedisce ifatti di cosiderare metrica la scala di misura delle votazioi, ma ci iforma che i quella prova il soggetto ha otteuto u puteggio iferiore a 30. Per rispodere alla domada calcoliamo duque il rho di Spearma. Poiché le due prove soo valutate da due diverse commissioi idipedeti, o ha seso supporre che ua delle variabili sia idipedete e l altra dipedete. Obiettivo: verificare se esiste ua relazioe fra la valutazioe alla prova pratica e la valutazioe alla prova teorica dell'esame di abilitazioe alla professioe di psicologo Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Variabili Variabile : Valutazioe alla prova teorica (ordiale) Variabile : Valutazioe alla prova pratica (ordiale) Ipotesi: se le due variabili soo i relazioe fra di loro, dovremmo osservare che il fatto di aver otteuto ua certa valutazioe alla prova teorica è i relazioe co la valutazioe alla prova pratica. Nel caso, i due puteggi possoo essere cosiderati reciprocamete predittivi H 0 : ρ s 0 ella popolazioe o esiste u associazioe a livello ordiale fra la valutazioe alla prova teorica e la valutazioe alla prova pratica ella popolazioe il coefficiete di correlazioe rho di Spearma è uguale a zero H : ρ s 0 ella popolazioe esiste u associazioe a livello ordiale fra la valutazioe alla prova teorica e la valutazioe alla prova pratica ella popolazioe il coefficiete di correlazioe rho di Spearma è diverso da zero Dalla Tavola 3 i Appedice ricaviamo che il valore di ρ s critico per α,05, ipotesi alterativa bidirezioale e è,5804. La regola di decisioe sarà: se rho calcolato > rho critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo le due variabili soo i relazioe fra loro se rho calcolato < rho critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo le due variabili soo idipedeti fra loro Per calcolare il rho di Spearma occorre procedere i base ai segueti passi:. Calcolare i raghi dei puteggi della variabile e per la variabile Y, assegado il rago medio i caso di puteggi a pari merito. Appaiare soggetto per soggetto i raghi delle due variabili 3. Calcolare d, ossia la differeza fra il rago Y e il rago 4. Elevare al quadrato i d e sommarli, i modo da otteere Σd 6 d 5. Applicare la formula rho, dove è il umero di soggetti (o coppie di valori) 3 Calcoliamo i raghi per la prova teorica: e per la prova pratica Soggetto Valutazioe Rago Rago medio No idoeo 8 No idoeo No idoeo 3 3 4 0 33 5 35 6 4 37 7 9 4 8 6 4 9 5 43 0 3 45 7 46 Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Soggetto Valutazioe Rago Rago medio 9 No idoeo No idoeo,5 5 33 3 8 33 4 4 33 5 7 35 6 6 38 7 39 8 4 40 9 0 4 0 3 44 45 Calcoliamo ora i d stado be atteti a riappaiare i dati dei soggetti el modo corretto: Cadidato Valutazioe prova Valutazioe prova d teorica () pratica (Y) Rago Y Rago grezzo rago grezzo rago d 35 6 45 6 36 No idoeo 39 8 6 36 3 45 44 0 0 4 37 7 40 9 4 5 43 0 33 4-6 36 6 4 9 38 7-4 7 46 35 6-6 36 8 No idoeo 33 4 4 9 4 8 No idoeo,5-6,5 4,5 0 No idoeo 5 4 0 5 5 0 No idoeo,5-0,5 0,5 3 4 33 4 0 0 Σd 3,50 6 d 6 3,50 Applichiamo la formula rho, 3 3 Coclusioe: poiché rho calcolato < rho critico (, <,5804), o è così improbabile che quato osservato sia il risultato di u ipotesi ulla vera, per cui la accettiamo. Questi risultati suggeriscoo che molto probabilmete o esiste ua relazioe a livello ordiale fra la valutazioe alla prova teorica e la valutazioe alla prova pratica dell esame di abilitazioe alla professioe di psicologo. Dimesioe dell effetto Iterpretado il valore d rho come u coefficiete di correlazioe (Figura 7.), cocludiamo che si tratta di ua relazioe debole, i quato,0 < rho <,30. Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Esercizio 5 I puteggi ai test psicologici soo tipicamete su scala ad itervalli, per cui i questo caso per valutare la relazioe fra le due variabili utilizzeremo il coefficiete r di Pearso [puto (b)]. Perché l applicazioe di tale coefficiete sia corretta, però, dobbiamo prima verificare che la relazioe fra le due variabili sia cosiderabile come lieare, e per far questo realizziamo u diagramma a dispersioe [puto (a)]. Il valore di r è già di per sé u idice di dimesioe dell effetto, per cui per rispodere al puto (c) basterà cofrotare il valore otteuto co le liee guida della Figura 7.. Per risolvere il puto (d) dovremo calcolare il coefficiete rho di Spearma, metre per rispodere alle domade del puto (e) ricorreremo al calcolo dei coefficieti della retta di regressioe, cosiderado alterativamete le due variabili ora come, ora come Y. Puto (a) Il diagramma a dispersioe si realizza come u ormale riferimeto cartesiao, per cui, se cosideriamo Performace come e Verbale come Y avremo: 30 5 0 Verbale 5 0 5 0 0 5 0 5 0 5 Performace La ube di puti sembra idicare che la relazioe fra le due variabili sia lieare. Nodimeo, vi è u puto che si discosta i maiera abbastaza evidete dagli altri, i modo tale da sospettare che possa trattarsi di u outlier. Sarà iteressate, quidi, calcolare il coefficiete di correlazioe sia icludedo, sia escludedo quel valore dalle aalisi. Puto (b) Dato che il diagramma a dispersioe del puto (a) ha mostrato la plausibilità dell esisteza di ua relazioe lieare fra i due puteggi di QI, procediamo co il calcolo del coefficiete di correlazioe r e co la verifica delle ipotesi ad esso associata. Obiettivo: verificare se esiste ua relazioe lieare fra puteggio di QI di Perfomace e puteggio di QI Verbale Variabili Variabile : Puteggio QI di Perfomace (itervalli) Variabile : Puteggio QI Verbale (itervalli) Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
No c è motivo di pesare che ua delle due variabili possa essere causa dell altra. Più realisticamete, la relazioe fra di esse potrebbe essere cosiderata spuria, i quato etrambe potrebbero dipedere da u fattore di itelligeza più geerale. Ipotesi H 0 : ρ 0 ella popolazioe o esiste ua relazioe lieare fra puteggio di QI di perfomace e puteggio di QI verbale il coefficiete di correlazioe ρ è uguale a zero H : ρ 0 ella popolazioe esiste ua relazioe lieare fra puteggio di QI di perfomace e puteggio di QI verbale il coefficiete di correlazioe ρ è diverso a zero Per sottoporre a verifica l ipotesi ulla, utilizziamo u test statistico che fa riferimeto alla distribuzioe t di Studet. I questo caso i gradi di libertà soo uguali al umero di soggetti meo due, quidi 5 3. Il valore di t critico per α,05, ipotesi alterativa bidirezioale e 3 gradi di libertà è,60. La regola di decisioe sarà: se t calcolato > t critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo se t calcolato < t critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo xi yi xi yi i i i Per applicare la formula per il calcolo di r r abbiamo xi xi yi yi i i i i bisogo di calcolare il quadrato sia delle che delle Y, i prodotti Y soggetto per soggetto, e le relative somme: Soggetto QI Performace QI Verbale Y Y Y s0 5 5 6 36 30 s0 7 49 5 5 35 s03 9 8 99 s04 3 69 43 s05 4 4 6 8 s06 5 5 3 69 95 s07 0 00 44 0 s08 0 00 5 5 50 s09 44 5 5 60 s0 4 96 4 96 96 s 0 0 4 6 0 s 3 69 43 s3 484 5 65 550 s4 3 9 4 6 s5 7 49 7 49 49 Somma 4 796 45 90 784 Iseriamo i dati ecessari ella formula e calcoliamo r r 5 784 4 45 (5 796 4 ) (5 90 45 ),866 Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Verifichiamo che r possa essere cosiderato statisticamete diverso da zero: r t r,866 5,866 6,4 Coclusioe: poiché t calcolato > t critico (6,4 >,60), è troppo improbabile che quato osservato sia il risultato di u ipotesi ulla vera, per cui la rifiutiamo. Questi risultati suggeriscoo che molto probabilmete esiste ua relazioe lieare positiva fra QI di Perfomace e QI Verbale. Nell ispezioe del diagramma a dispersioe, però, avevamo otato la preseza di u possibile outlier, corrispodete al soggetto s3. Poiché gli outlier soo oti distorcere il valore di r, e i particolare redere evidete a livello statistico ua relazioe lieare che probabilmete o esiste effettivamete, ricalcoliamo r escludedo s3. A questo puto il campioe è costituito da 4 soggetti e il valore di t critico diveta,79, i quato abbiamo perso u grado di libertà. Soggetto QI Performace QI Verbale Y Y Y s0 5 5 6 36 30 s0 7 49 5 5 35 s03 9 8 99 s04 3 69 43 s05 4 4 6 8 s06 5 5 3 69 95 s07 0 00 44 0 s08 0 00 5 5 50 s09 44 5 5 60 s0 4 96 4 96 96 s 0 0 4 6 0 s 3 69 43 s4 3 9 4 6 s5 7 49 7 49 49 Somma 0 3 0 76 34 r 4 34 0 0 (4 3 0 ) (4 76 0 ),776 Il valore di r è dimiuito, per quato cotiui a rimaere idice di ua relazioe lieare positiva forte. Verifichiamoe la sigificatività: r t r,776 4,766 4,6 Coclusioe: poiché t calcolato > t critico (4,6 >,79), è troppo improbabile che quato osservato sia il risultato di u ipotesi ulla vera, per cui la rifiutiamo. Questi risultati suggeriscoo che molto probabilmete esiste ua relazioe lieare positiva fra QI di Perfomace e QI Verbale e che s03, per quato abbia otteuto puteggi estremi i etrambe le variabili, o distorce i modo sostaziale la valutazioe della relazioe lieare fra le due variabili. Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Puto (c) La dimesioe dell effetto dell associazioe può essere valutata direttamete dal valore di r cosiderado le liee guida i Figura 7.. Sia icludedo s3, sia escludedolo, siamo el caso di ua relazioe forte (r >,50). Il coefficiete di determiazioe, vale a dire la proporzioe di variabilità comue fra le due variabili, è,866,750 el primo caso e,776,60 el secodo. I altri termii, le due variabili codividoo il 75% di variabilità (60,% el caso i cui escludiamo dalle aalisi s3). Puto (d) A livello ordiale, cambiao leggermete le ipotesi, poiché si tiee coto solo dell iformazioe relativa all ordie dei valori: Obiettivo: verificare se esiste ua relazioe lieare fra puteggio di QI di Perfomace e puteggio di QI Verbale Variabili Variabile : Puteggio QI di Perfomace (ordiale) Variabile : Puteggio QI Verbale (ordiale) No c è motivo di pesare che ua delle due variabili possa essere causa dell altra. Più realisticamete, la relazioe fra di esse potrebbe essere cosiderata spuria, i quato etrambe potrebbero dipedere da u fattore di itelligeza più geerale. Ipotesi H 0 : ρ s 0 ella popolazioe o esiste ua relazioe ordiale fra puteggio di QI di perfomace e puteggio di QI verbale ella popolazioe il coefficiete di correlazioe rho di Spearma è uguale a zero H : ρ s 0 ella popolazioe esiste ua relazioe ordiale fra puteggio di QI di perfomace e puteggio di QI verbale ella popolazioe il coefficiete di correlazioe rho di Spearma è diverso da zero Dalla Tavola 3 i Appedice ricaviamo che il valore di ρ s critico per α,05, ipotesi alterativa bidirezioale e 5 è,579. La regola di decisioe sarà: se rho calcolato > rho critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo le due variabili soo i relazioe fra loro se rho calcolato < rho critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo le due variabili soo idipedeti fra loro Calcoliamo i raghi per i puteggi di QI di Performace: Soggetto Performace Rago Rago Medio s 0 s05 s4 3 3 s0 5 4 s0 7 5 s5 7 6 5,5 s07 0 7 7,5 Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
s08 0 8 s03 9 s04 0 s09 s 3 s0 4 3 s06 5 4 s3 5 0,5 e per la prova pratica Soggetto Verbale Rago Rago Medio s4 s05 4 s 4 3,5 s0 5 4 s09 5 5 4,5 s0 6 6 s5 7 7 s03 9 8 s 9 s07 0 s04 3 s06 3,5 s0 4 3 s08 5 4 s3 5 5 Soggetto QI di Performace () QI Verbale (Y) d grezzo rago grezzo rago Rago Y Rago d s0 5 4 6 6 4 s0 7 5,5 5 4,5 - s03 9,5 9 8 -,5,5 s04 9,5 3,5 4 s05 4,5 0,5 0,5 s06 5 4 3,5 -,5 6,5 s07 0 7,5 0,5 6,5 s08 0 7,5 5 4 6,5 4,5 s09 5 4,5-6,5 4,5 s0 4 3 4 3 0 0 s 0 4,5,5,5 s 3 9-3 9 s3 5 5 5 0 0 s4 3 3-4 s5 7 5,5 7 7,5,5 Σd 6 6 d 6 6 Applichiamo la formula rho, 775 3 3 5 5 Coclusioe: poiché rho calcolato > rho critico (,775 <,579), o è così improbabile che quato osservato sia il risultato di u ipotesi ulla vera, per cui la accettiamo. Questi risultati suggeriscoo Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
che molto probabilmete o esiste ua relazioe a livello ordiale fra il puteggio di QI di Performace e quello di QI Verbale. I questo caso i valori estremi del soggetto s03 o creao problemi, dato che questo soggetto ha puteggi più alti degli altri i etrambe le variabili. No sembra ifluire più di tato el tipo, ella forza e ella direzioe della relazioe (si cofrotio i valori di r calcolati al puto (b) e quello di rho appea otteuto). Ioltre, o serve provare a rifare le aalisi a livello ordiale escludedolo, dato che il suo valore di d era zero e quello di d ugualmete zero, per cui o ifluiva el calcolo di rho (per quato la dimiuzioe del umero di soggetti avrebbe comportato u diverso rho critico, che sappiamo dipedere dal umero di soggetti). La cosa avrebbe potuto avere seso se s3 fosse stato u possibile outlier i ua sola variabile. Dimesioe dell effetto Iterpretado il valore di rho come u coefficiete di correlazioe (Figura 7.), cocludiamo che si tratta di ua relazioe forte, i quato rho >,50. Puto (e) Per rispodere alle due domade occorre idividuare le rette di regressioe i cui QI Verbale Y e QI Performace (prima domada) e QI Verbale e QI Performace Y (secoda domada). I etrambi i casi valuteremo la sigificatività del coefficiete di regressioe b e dell itercetta a, e calcoleremo l errore totale di predizioe. Obiettivo: idividuare la retta di regressioe per predire il puteggio di QI Verbale (Y) i base al puteggio di QI di Performace () Ipotesi H 0 : α 0 ella popolazioe, l itercetta, ossia il valore medio atteso i Y quado è uguale a zero, è uguale a zero H : α 0 ella popolazioe, l itercetta, ossia il valore medio atteso i Y quado è uguale a zero, è diversa da zero H 0 : β 0 ella popolazioe, il coefficiete di regressioe, ossia la variazioe media attesa i Y per ua variazioe uitaria i, è uguale a zero H : β 0 ella popolazioe, il coefficiete di regressioe, ossia la variazioe media attesa i Y per ua variazioe uitaria i, è diversa da zero Facciamo riferimeto alla distribuzioe di probabilità t di Studet, che i questo caso ha gradi di libertà uguali al umero di soggetti meo due (5 3). Per α,05 e ipotesi alterativa bidirezioale, il t critico per 3 gradi di libertà è,60. La regola di decisioe sarà: se t calcolato > t critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo se t calcolato < t critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo Calcoliamo i base ai dati della tabella al puto (b) i valori di a e di b: QI Performace QI Verbale Soggetto Y Y Y s0 5 5 6 36 30 Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
s0 7 49 5 5 35 s03 9 8 99 s04 3 69 43 s05 4 4 6 8 s06 5 5 3 69 95 s07 0 00 44 0 s08 0 00 5 5 50 s09 44 5 5 60 s0 4 96 4 96 96 s 0 0 4 6 0 s 3 69 43 s3 484 5 65 550 s4 3 9 4 6 s5 7 49 7 49 49 Somma 4 796 45 90 784 b a x y x i i i i i i i xi xi i i i y i b i x i y 5 784 4 45 0,9 5 796 ( 4) 45 0,9 4,047 5 Per calcolare gli errori stadard dei coefficieti, abbiamo bisogo dell errore totale di predizioe, che si calcola co la formula: ( Y Yˆ) s e I questa formula Ŷ è il valore di Y stimato i base al modello di regressioe. Calcoliamo quidi per ogi valore di il valore di Y, calcoliamo gli scarti fra valori Y osservati e stimati, eleviamo al quadrato gli scarti e sommiamoli: Y Ŷ,047 0,9 Ŷ Y (Ŷ Y) 5 6 5,60-0,398 0,58 7 5 7,44,44 5,876 9,068,068 4,77 3,068 -,93 3,733 4,869 -,3,79 5 3 4,7,7,93 0 0,57 -,843 3,397 0 5 0,57-4,843 3,455 5,979 6,979 48,706 4 4 3,80-0,99 0,040 0 4,047 -,953 8,70 3,890,890 3,57 5,089-3,9 5,96 3 3,780,780 3,68 7 7 7,44 0,44 0,80 Σ 4,787 Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
4,787 L errore stadard di predizioe è duque: s e 3, 098 5 Per calcolare gli errori stadard abbiamo bisogo ache della media (M ) e della deviaza [Σ( M ) ] degli, i quato: a t a ; ( Y Yˆ) M ( ) ( M ) t b ( Y Yˆ) ( ) b ( M ) La media degli è 4 / 5 9,47, metre la deviaza può essere calcolata dai dati a disposizioe moltiplicado la variaza per ( M ) s M 796 9,45 5 5 450,79 Adesso basta sostituire i dati elle formule:,047 0,9 t a,5 ; t b 0, 99 9,47 3,098 3,098 5 450,79 450,79 Coclusioe: poiché t calcolato < t critico per l itercetta (,5 <,60) e t calcolato > t critico (0,99 >,60) per il coefficiete di regressioe, possiamo accettare l ipotesi ulla el caso di a e rifiutarla el caso di b. Questi risultati suggeriscoo che l itercetta, ossia il valor medio atteso ella popolazioe quado è uguale a zero, o è statisticamete diversa da zero, metre il coefficiete di regressioe, ossia il cambiameto medio atteso i Y per u cambiameto uitario i, è statisticamete diverso da zero. I particolare possiamo scrivere u equazioe di predizioe per Y del tipo Ŷ,047 0,9, che ci suggerisce che per u cambiameto uitario el puteggio di QI di Performace possiamo aspettarci u cambiameto di 0,9 puti el valore del QI Verbale. Per rappresetare la retta di regressioe calcoliamo due puti e poi facciamo passare ua liea retta per questi due puti. Ad esempio, sappiamo che se 0, Ŷ,047, metre se 3 (come richiesto dalla domada dell esercizio), Ŷ,047 0,9 3,89 (puti biachi del grafico): Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
30 5 Ŷ,047 0,9 R,750 0 Verbale 5 0 5 0 0 5 0 5 0 5 Performace Se il puteggio di QI di Performace è 3, quidi, il puteggio atteso di QI Verbale è,89. Dimesioe dell effetto La dimesioe dell effetto della regressioe può essere calcolata a partire dal valore di R, che è,750. Calcoliamo la dimesioe dell effetto f come: f R R,750 3,00,750 che i base alle liee guida della Tabella 7.4 iterpretiamo come grade. * * * Se dovessimo ivertire il ruolo di e Y delle due variabili, avremmo il seguete schema: Obiettivo: idividuare la retta di regressioe per predire il puteggio di QI di Performace (Y) i base al puteggio di QI Verbale () Ipotesi H 0 : α 0 ella popolazioe, l itercetta, ossia il valore medio atteso i Y quado è uguale a zero, è uguale a zero H : α 0 ella popolazioe, l itercetta, ossia il valore medio atteso i Y quado è uguale a zero, è diversa da zero H 0 : β 0 ella popolazioe, il coefficiete di regressioe, ossia la variazioe media attesa i Y per ua variazioe uitaria i, è uguale a zero H : β 0 ella popolazioe, il coefficiete di regressioe, ossia la variazioe media attesa i Y per ua variazioe uitaria i, è diversa da zero Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Facciamo riferimeto alla distribuzioe di probabilità t di Studet, che i questo caso ha gradi di libertà uguali al umero di soggetti meo due (5 3). Per α,05 e ipotesi alterativa bidirezioale, il t critico per 3 gradi di libertà è,60. La regola di decisioe sarà: se t calcolato > t critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo se t calcolato < t critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo e avremmo la seguete tabella per i calcoli: Soggetto QI Verbale QI Performace Y Y Y s0 6 36 5 5 30 s0 5 5 7 49 35 s03 9 8 99 s04 3 69 43 s05 4 6 4 8 s06 3 69 5 5 95 s07 44 0 00 0 s08 5 5 0 00 50 s09 5 5 44 60 s0 4 96 4 96 96 s 4 6 0 0 0 s 3 69 43 s3 5 65 484 550 s4 4 3 9 6 s5 7 49 7 49 49 Somma 45 90 4 796 784 b a x y x i i i i i i i xi xi i i i y i b i x i y 5 784 4 45 0,84 5 90 ( 45) 4 0,84 45,50 5 Si oti come le stime dei coefficieti della retta di regressioe cambio rispetto al caso precedete. Per calcolare gli errori stadard dei coefficieti, abbiamo bisogo dell errore totale di predizioe, che si calcola co la formula: ( Y Yˆ) s e I questa formula Ŷ è il valore di Y stimato i base al modello di regressioe. Calcoliamo quidi per ogi valore di il valore di Y, calcoliamo gli scarti fra valori Y osservati e stimati, eleviamo al quadrato gli scarti e sommiamoli: Y Ŷ,50 0,84 Ŷ Y (Ŷ Y) Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
6 5 6,45 -,45,09 5 7 5,6,38,90 9 8,9,08 4,34 3, -,,47 4 4,80 -,80 7,8 3 5,,79 7,77 0,39 -,39,93 5 0 3,86-3,86 4,9 5 5,6 6,38 40,69 4 4 3,04 0,96 0,93 4 0 4,80-4,80 3,0 3 0,57,44 5,93 5,0-0,0 0,0 3 3,5-0,5 0,0 7 7 7,7-0,7 0,07 Σ,89,89 L errore stadard di predizioe è duque: s e, 947 5 Per calcolare gli errori stadard abbiamo bisogo ache della media (M ) e della deviaza [Σ( M ) ] degli, i quato: a t a ; ( Y Yˆ) M ( ) ( M ) t b ( Y Yˆ) ( ) b ( M ) La media degli è 45 / 5 9,67, metre la deviaza può essere calcolata dai dati a disposizioe moltiplicado la variaza per ( M ) s M 90 9,67 5 5 555,79 Adesso basta sostituire i dati elle formule:,50 0,84 t a,80 ; t b, 3 9,67,947,947 5 555,79 555,79 Coclusioe: poiché t calcolato < t critico per l itercetta (,80 <,60) e t calcolato > t critico (,3 >,60) per il coefficiete di regressioe, possiamo accettare l ipotesi ulla el caso di a e rifiutarla el caso di b. Questi risultati suggeriscoo che l itercetta, ossia il valor medio atteso ella popolazioe quado è uguale a zero, o è statisticamete diversa da zero, metre il coefficiete di regressioe, ossia il cambiameto medio atteso i Y per u cambiameto uitario i, è statisticamete diverso da zero. I particolare possiamo scrivere u equazioe di predizioe per Y del tipo Ŷ,50 0,84, che ci suggerisce che per u cambiameto uitario el puteggio di QI Verbale possiamo aspettarci u cambiameto di 0,84 puti el valore del QI di Performace. Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Per rappresetare la retta di regressioe calcoliamo due puti e poi facciamo passare ua liea retta per questi due puti. Ad esempio, sappiamo che se 0, Ŷ,50, metre se 30 (come richiesto dalla domada dell esercizio), Ŷ,50 0,84 30 6, (puti biachi del grafico): 30 5 Ŷ,50 0,84 R,750 Performace 0 5 0 5 0 0 0 0 30 40 Verbale Se il puteggio di QI Verbale è 30, quidi, il puteggio atteso di QI di Performace è 6,. Si oti come, differetemete dal caso precedete, il valore da predire o cada ella gamma della osservate, costrigedoci ad estrapolare i dati (e o ad iterpolarli). Nel mauale abbiamo visto come l estrapolazioe sia sempre u operazioe rischiosa, i quato o siamo i grado di verificare che la relazioe fra e Y sia lieare ache al di fuori della gamma delle osservate. Nodimeo, la predizioe di Y i base alla retta di regressioe è comuque possibile. Dimesioe dell effetto La dimesioe dell effetto è la stessa del caso precedete i quato il valore di R dipede dalla relazioe fra le due variabili, e o da quale assume il ruolo di e quale il ruolo di Y. Esercizio 6 I puteggi ai test psicologici soo tipicamete su scala ad itervalli, per cui i questo caso per valutare la relazioe fra le due variabili utilizzeremo il coefficiete r di Pearso [puto (b)]. Perché l applicazioe di tale coefficiete sia corretta, però, dobbiamo prima verificare che la relazioe fra le due variabili sia cosiderabile come lieare, e per far questo realizziamo u diagramma a dispersioe [puto (a)]. Al puto (c) applicheremo le formule per la verifica delle ipotesi sui parametri del modello di regressioe, metre per risolvere il puto (d) dovremo elevare al quadrato il valore di r e l errore stadard della stima s e. Al puto (e) calcoleremo l idice f, metre per rispodere alla domada del puto (f) ricorreremo al calcolo dei coefficieti della retta di regressioe, cosiderado il puteggio di vulerabilità arcisistica come e quello di autostima come Y. Puto (a) Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Il diagramma a dispersioe si realizza come u ormale riferimeto cartesiao, per cui, se cosideriamo la Vulerabilità Narcisistica come e l Autostima come Y avremo: 5 0 Autostima 5 0 5 0 0 5 0 5 0 5 Vulerabilità arcisistica La ube di puti sembra idicare che la relazioe fra le due variabili sia lieare. Ioltre, o sembrao essere valori estremi tali da suggerire la preseza di outliers. Puto (b) Dato che il diagramma a dispersioe del puto (a) ha mostrato la plausibilità dell esisteza di ua relazioe lieare fra i due puteggi di vulerabilità arcisistica e autostima, procediamo co il calcolo del coefficiete di correlazioe r e co la verifica delle ipotesi ad esso associata. Obiettivo: verificare se esiste ua relazioe lieare fra puteggio di vulerabilità arcisistica e autostima Variabili Variabile : Puteggio di vulerabilità arcisistica (itervalli) Variabile : Puteggio di autostima (itervalli) No c è motivo di pesare che ua delle due variabili possa essere causa dell altra, i quato soo due dimesioi di persoalità per le quali soo plausibili più spiegazioi causali Ipotesi H 0 : ρ 0 ella popolazioe o esiste ua relazioe lieare fra puteggio di vulerabilità arcisistica e puteggio di autostima il coefficiete di correlazioe ρ è uguale a zero H : ρ < 0 ella popolazioe esiste ua relazioe lieare egativa fra puteggio di vulerabilità arcisistica e puteggio di autostima il coefficiete di correlazioe ρ è miore di zero Per sottoporre a verifica l ipotesi ulla, utilizziamo u test statistico che fa riferimeto alla distribuzioe t di Studet. I questo caso i gradi di libertà soo uguali al umero di soggetti meo due, quidi 9 7. Il valore di t critico per α,05, ipotesi alterativa moodirezioale e 7 gradi di libertà è,740. La regola di decisioe sarà: Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
se t calcolato > t critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo se t calcolato < t critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo xi yi xi yi i i i Per applicare la formula per il calcolo di r r abbiamo xi xi yi yi i i i i bisogo di calcolare il quadrato sia delle che delle Y, i prodotti Y soggetto per soggetto, e le relative somme: Y Vulerabilità Soggetto arcisistica Autostima Y Y s0 7 49 3 69 9 s0 0 0 0 400 0 s03 8 34 3 9 54 s04 0 00 3 9 30 s05 5 5 65 s06 44 8 64 96 s07 44 s08 6 56 4 6 64 s09 3 9 7 89 5 s0 5 5 5 5 75 s 0 400 4 40 s 9 8 5 5 35 s3 9 8 99 s4 4 6 6 56 64 s5 8 64 44 96 s6 3 69 9 8 7 s7 4 96 4 s8 6 36 4 6 4 s9 4 5 5 30 Somma 74 0 89 479 57 Iseriamo i dati ecessari ella formula e calcoliamo r r 9 57 74 89 (9 0 74 ) (9 479 89 ),774 Verifichiamo che r possa essere cosiderato statisticamete diverso da zero: r t r,774 9,774 5,04 Coclusioe: poiché t calcolato > t critico (5,04 >,740), è troppo improbabile che quato osservato sia il risultato di u ipotesi ulla vera, per cui la rifiutiamo. Questi risultati suggeriscoo che molto probabilmete esiste ua relazioe lieare egativa fra vulerabilità arcisistica e autostima. Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Puto (c) Per sapere se le stime del modello di regressioe soo sigificative dobbiamo iazitutto calcolare le stime di a e di b. Si presti attezioe al fatto che ci attediamo che la relazioe sia egativa, quidi l ipotesi alterativa di b è moodirezioale, metre quella di a è bidirezioale. Obiettivo: idividuare la retta di regressioe per predire il puteggio di autostima (Y) i base al puteggio di vulerabilità arcisistica () Ipotesi H 0 : α 0 ella popolazioe, l itercetta, ossia il valore medio atteso i Y quado è uguale a zero, è uguale a zero H : α 0 ella popolazioe, l itercetta, ossia il valore medio atteso i Y quado è uguale a zero, è diversa da zero H 0 : β 0 ella popolazioe, il coefficiete di regressioe, ossia la variazioe media attesa i Y per ua variazioe uitaria i, è uguale a zero H : β < 0 ella popolazioe, il coefficiete di regressioe, ossia la variazioe media attesa i Y per ua variazioe uitaria i, è miore di zero Facciamo riferimeto alla distribuzioe di probabilità t di Studet, che i questo caso ha gradi di libertà uguali al umero di soggetti meo due (9 7). Per α,05 e ipotesi alterativa bidirezioale, il t critico per 7 gradi di libertà è,0 [itercetta]. Per α,05 e ipotesi alterativa moodirezioale, il t critico per 7 gradi di libertà è,740 [coefficiete di regressioe]. La regola di decisioe sarà: se t calcolato > t critico è troppo improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la rifiutiamo se t calcolato < t critico o è così improbabile che i dati osservati siao il risultato del fatto che H 0 è vera, per cui la accettiamo I base ai valori della tabella del puto (b) avremo: b a x y x i i i i i i i xi xi i i i y i b i x i y 9 57 74 89 0,756 9 0 ( 74) 89 ( 0,756 74) 6,87 9 Per calcolare gli errori stadard dei coefficieti, abbiamo bisogo dell errore totale di predizioe, che si calcola co la formula: ( Y Yˆ) s e Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
I questa formula Ŷ è il valore di Y stimato i base al modello di regressioe. Calcoliamo quidi per ogi valore di il valore di Y, calcoliamo gli scarti fra valori Y osservati e stimati, eleviamo al quadrato gli scarti e sommiamoli: Y Ŷ 6,87 0,756 Ŷ Y (Ŷ Y) 7 3,58 -,4,0 0 0 6,87-3,3 9,79 8 3 3,6 0,6 0,07 0 3 9,3 6,3 39,83 5 5,53-5,47 9,9 8 7,80-0,0 0,04 6, 4, 6,93 6 4 4,78 0,77 0,60 3 7 4,60 -,40 5,75 5 5 3,09 -,9 3,64 0,75-0,5 0,06 9 5 0,07-4,93 4,33 9 8,56-0,45 0,0 4 6 3,85 -,5 4,64 8 0,8 -,8,39 3 9 7,04 -,96 3,83 4 6,9 5,9 7,95 6 4,34 8,34 69,47 5 5,36 0,36 0,3 Σ 40,580 40,580 L errore stadard di predizioe è duque: s e 3, 76 9 Per calcolare gli errori stadard abbiamo bisogo ache della media (M ) e della deviaza [Σ( M ) ] degli, i quato: a t a ; ( Y Yˆ) M ( ) ( M ) t b ( Y Yˆ) ( ) b ( M ) La media degli è 74 / 9 9,6, metre la deviaza può essere calcolata dai dati a disposizioe moltiplicado la variaza per ( M ) s M 0 9,6 9 9 65,79 Adesso basta sostituire i dati elle formule: 6,87 0,756 t a 0,838 ; t b 9, 75 9,6 3,76 3,76 9 65,79 65,79 Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
Coclusioe: poiché t calcolato < t critico per l itercetta (0,838 <,0) e t calcolato > t critico (9,75 >,740) per il coefficiete di regressioe, possiamo accettare l ipotesi ulla el caso di a e rifiutarla el caso di b. Questi risultati suggeriscoo che l itercetta, ossia il valor medio atteso ella popolazioe quado è uguale a zero, o è statisticamete diversa da zero, metre il coefficiete di regressioe, ossia il cambiameto medio atteso i Y per u cambiameto uitario i, è statisticamete diverso da zero. I particolare possiamo scrivere u equazioe di predizioe per Y del tipo Ŷ 6,87 0,756, che ci suggerisce che per u cambiameto uitario el puteggio di vulerabilità arcisistica possiamo aspettarci ua dimiuzioe di 0,756 puti el valore di autostima Puto (d) Il coefficiete di determiazioe vale (,774),599, che idica che le due variabili codividoo quasi il 60% di variabilità. Possiamo ache dire, i base al modello di regressioe, che il 60% della variabilità del puteggio di autostima è spiegabile i base alla sua relazioe lieare co il puteggio di vulerabilità arcisistica. L errore stadard della stima lo abbiamo calcolato al puto (c) e abbiamo visto che vale 3,76. Puto (e) Dimesioe dell effetto La dimesioe dell effetto della regressioe può essere calcolata a partire dal valore di R, che è,599. Calcoliamo la dimesioe dell effetto f come: f R R,599,49,599 che i base alle liee guida della Tabella 7.4 iterpretiamo come grade. Puto (f) Poiché sappiamo che Ŷ 6,87 0,756, se il puteggio di vulerabilità arcisistica () è 7, quello di autostima sarà Ŷ 6,87 0,756 7 4,09. Sapedo ioltre che Ŷ 6,87 quado 0, tracciamo la retta di regressioe: Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia
5 0 Ŷ 6,87-0,756 R,599 Autostima 5 0 5 0 0 5 0 5 0 5 Vulerabilità arcisistica La stima di Y per 7 è attedibile i quato il valore di cade all itero della gamma di valori osservati (che è 0 0). Carlo Chiorri, Fodameti di psicometria Copyright 00 The McGraw-Hill Compaies S.r.l., Publishig Group Italia