UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA FACOLTÀ DI SOCIOLOGIA a. a. 9 Esame del -6- Statistica ESERCIZIO Relazioi tra Variabili (totale puti: ) Ad ua riuioe del circolo Amati dell acquario, i soci preseti discutoo della presuta ocività di ua sostaza chimica comuemete presete el magime per pesci. er valutare la veridicità di questa otizia, vegoo registrati la quatità di questa sostaza presete per razioe di magime utilizzato abitualmete, il umero di pesci morti ell ultimo mese ed il tipo di acquario. I Tabella A soo riportati i dati relativi alle variabili: quatità di sostaza sospetta per razioe di magime [espressa i milligrammi] (X), umero di pesci morti ell ultimo mese (Y), tipo di acquario [TTropicale, N No tropicale] (Q). Tab.A ID 4 5 6 7 8 9 X 4 9 9 7 5 5 6 8 7 4 8 5 Y 6 5 4 5 4 Q T N T N T T T N N T N T a) Orgaizzare i ua tabella a doppia etrata le variabili statistiche X e Y; per X raggruppare i valori osservati elle classi: (4-6), (6-8), (8 -) e per Y raggruppare i valori osservati elle classi: ( -), ( -5), (5-7) (.5 puti). b) Forire la distribuzioe codizioata del umero di pesci morti ell ultimo mese (Y) date le tre classi relative al peso della sostaza chimica presete el magime (X), cofrotarle co la distribuzioe margiale e stabilire se i due feomei soo statisticamete idipedeti (.5 puti) c) I caso di risposta egativa al puto precedete, valutare co u opportuo idice la dipedeza i media del umero di pesci morti dal peso della sostaza chimica per razioe, commetado i risultati otteuti. ( puti). d) Utilizzado i dati classificati ella tabella a doppia etrata, costruire il diagramma a dispersioe, disegare la spezzata di regressioe e commetare la atura matematica della relazioe fra X e Y. Utilizzado sempre i dati classificati determiare quidi la retta di regressioe dei miimi quadrati che iterpreta la dipedeza del umero di pesci morti dal peso della sostaza chimica. Disegare la retta sul diagramma e iterpretare il valore otteuto per i parametri. ( puti) e) Valutare la botà di adattameto del modello costruito al puto d). Su tale base, prevedere il umero di pesci morti al mese el caso i cui vega utilizzato u magime avete milligrammi di sostaza chimica sospetta.( puti) ESERCIZIO Aalisi Multivariata (totale puti: ) a) Si vuole estedere l aalisi precedete all isieme di tutti i possessori di acquari d Italia; i dati i Tabella A si assumoo come u campioe beroulliao di ampiezza da tale popolazioe. Dai dati foriti dai produttori di magimi per pesci risulta che il peso per razioe della sostaza chimica sospetta (X) si distribuisce ella popolazioe come ua Normale di media igota e variaza ota pari a.89, utilizzado i dati i Tab. A:. Stimare il valore µ della media di X. I base al risultato otteuto al puto precedete, calcolare la probabilità che, presa a caso ua razioe di magime, il peso della sostaza sospetta ivi presete sia maggiore di 7milligrammi. ( uti) U più ampio campioe beroulliao di umerosità 5 è stato estratto dalla stessa popolazioe ed ha forito i dati relativi alle variabili Y e Q sitetizzati ella Tabella B: Tab. B Q:"Tipo di acquario" ( -) ( -5) (5-7) f i. T 4 46 4 N 4 45 4 f.j 84 9 75 5 b) Utilizzare i dati campioari i Tab.B per verificare co u opportuo test e co α. se ella popolazioe di iteresse esiste ua sigificativa relazioe statistica tra umero di pesci morti e tipo di acquario. ( uti) c) Stimare l igota proporzioe di acquari di tipo tropicale ella popolazioe di iteresse e costruire u itervallo di cofideza a livello 99%. Iterpretare e commetare il risultato. (.5 uti) d) Testare al livello di sigificatività del 95% l ipotesi che l igota proporzioe di acquari tropicali preseti i Italia sia pari a.5. (.5 uti) e) ESERCIZIO Domade Teoriche (totale puti: ). Forire u esempio co dati a scelta di tabella a doppia etrata i cui esista perfetta correlazioe. Discutere i questo caso i valori degli idici ρ XY, η X, η Y e χ (5 puti).. Dare le defiizioi di: ipotesi statistica, ipotesi ulla, statistica test, livello di sigificatività, valore critico e valore sperimetale e discutere l utilizzo ella coduzioe di u test statistico. (5 puti)
UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA FACOLTÀ DI SOCIOLOGIA a. a. 9 Esame del -6- Statistica - Soluzioi ESERCIZIO Relazioi tra Variabili a) Orgaizzare i ua tabella a doppia etrata le variabili statistiche X e Y; per X raggruppare i valori osservati elle classi: (4-6), (6-8), (8 -) e per Y raggruppare i valori osservati elle classi: ( -), ( -5), (5-7) (,5 puti). X:"eso per razioe della sostaza chimica sospetta" ( -) ( -5) (5-7) f i. (4-6) 4 5 (6-8) (8 -) 4 f.j 4 5 b) Forire la distribuzioe codizioata del umero di pesci morti ell ultimo mese (Y) date le tre classi relative al peso della sostaza chimica presete el magime (X), cofrotarle co la distribuzioe margiale e stabilire se i due feomei soo statisticamete idipedeti (.5 puti) ( -) ( -5) (5-7) f i (4-6) f j 4 5.8. X:"eso per razioe della sostaza chimica sospetta" (6-8) (8 -) f j f j 4.5.75 TOT f.j 4 5..4.5 Si osserva ua otevole differeza fra le frequeze delle v.s. codizioate Y X rispetto alle frequeze margiali di Y. Il comportameto di Y codizioato alle diverse modalità di X è differete rispetto al comportameto margiale (idipedetemete da X). Da ciò possiamo cocludere che esiste ua relazioe statistica fra i due feomei el collettivo di acquari osservati, i particolare X codizioa Y. c) I caso di risposta egativa al puto precedete, valutare co u opportuo idice la dipedeza i media del umero di pesci morti dal peso della sostaza chimica per razioe, commetado i risultati otteuti. ( puti). Cosiderado i valori cetrali delle classi, otteiamo rispettivamete la media margiale e quelle codizioate :
Le tre medie codizioate risultao diverse tra loro e diverse dalla media del feomeo sull itera popolazioe Il feomeo X codizioa il feomeo Y, Quidi Y dipede da X. Il grado di dipedeza viee calcolato tramite l idice eta quadro: Il peso medio di sostaza sospetta per razioe di magime spiega il 77% della variabilità del umero di pesci morti. d) Utilizzado i dati classificati ella tabella a doppia etrata, costruire il diagramma a dispersioe, disegare la spezzata di regressioe e commetare la atura matematica della relazioe fra X e Y. Utilizzado sempre i dati classificati determiare quidi la retta di regressioe dei miimi quadrati che iterpreta la dipedeza del umero di pesci morti dal peso della sostaza chimica. Disegare la retta sul diagramma e iterpretare il valore otteuto per i parametri. ( puti) La spezzata di regressioe si disega cosiderado per Y i valori delle medie codizioate calcolate al puto precedete e per X i valori cetrali degli itervalli relativi alle diverse classi: 4 + 6 6 + 8 8 + 5 7 9
La retta di regressioe passate per tali puti (le medie codizioate di Y) è la seguete I puti presetao ua chiara struttura crescete che suggerisce ua correlazioe positiva tra X ed Y. Determiado la retta dei miimi quadrati ŷ a + b si ottiee: * 5 5 + 7 + 9 4 i f i 6.8 y. 8 (dall esercizio precedete) i i ( ) i f Y. (dall esercizio precedete) µ j i y i j f ij ( 5 6.8) 5 + ( 7 6.8) + ( 9 6.8) 4 5.67 i 5 4 + 5 4 +... + 9 6 4 8.5 y 8.5 6.8.8.4 µ b.4.97.79 Icremeto del umero di pesci morti per u aumeto uitario i milligrammi del peso medio della sostaza sospetta per razioe di magime. Ogi a y b.8.79 6.8.57 Numero medio di pesci morti co ua preseza di zero grammi di sostaza sospetta..97 La retta che si ottiee è la seguete : y.57 +. 79 Dal grafico emerge che la spezzata di regressioe otteuta posizioado el grafico le medie codizioate è be approssimata dalla retta. e) Valutare la botà di adattameto del modello costruito al puto d). Su tale base, prevedere il umero di pesci morti al mese el caso i cui vega utilizzato u magime avete milligrammi di sostaza chimica sospetta.( puti) Valutado la botà di adattameto ai dati della retta si ottiee:.4.4.4.89.97. 6.86.6 ρ ρ (.89). 79 y ( ).57 +.79 6. Y ˆ 4
Tramite la retta dei m.q. si prevede che il umero di morti è di 6. per u acquario i cui viee utilizzato u magime co ua preseza media per razioe di milligrammi di sostaza sospetta. La previsioe, a parità di tred, è affidabile al 79% (circa il % della variabilità totale di Y o è spiegata dalla retta). ESERCIZIO Aalisi Multivariata (totale puti: ) a) Si vuole estedere l aalisi precedete all isieme di tutti i possessori di acquari d Italia; i dati i Tabella A si assumoo come u campioe beroulliao di ampiezza da tale popolazioe. Dai dati foriti dai produttori di magimi per pesci risulta che il peso per razioe della compoete chimica sospetta (X) si distribuisce ella popolazioe come ua Normale di media igota e variaza ota pari a.89, utilizzado i dati i Tabella A:.. Stimare il valore µ della media di X. I base al risultato otteuto al puto precedete, calcolare la probabilità che, presa a caso ua razioe di magime, il peso della sostaza pericolosa ivi presete sia maggiore di 7 milligrammi. ( uti). Stimatore o distorto ed efficiete per la media della popolazioe è la media campioaria. Stimiamo dai dati campioari la media campioaria : 4 + 9 +... + 5 i i 6.4 i i. La probabilità che, presa a caso ua razioe di magime, il peso della sostaza pericolosa ivi presete sia maggiore di 7 milligrammi è data da: Y µ 7 6.4.58 ( X 7 ) Z ( Z.4) ( Z.4).6. 7.89.7 b) Utilizzare i dati campioari i Tab.B per verificare co u opportuo test e co α. se ella popolazioe di iteresse esiste ua sigificativa relazioe statistica tra umero di pesci morti e tipo di acquario. ( uti) I dati foriti i tabella B soo i segueti: Q:"Tipo di acquario" ( -) ( -5) (5-7) f i. T 4 46 4 N 4 45 4 f.j 84 9 75 5 La tabella delle frequeze teoriche di idipedeza statistica f fi f j * ij è: N Q:"Tipo di acquario" ( -) ( -5) (5-7) f i. T 4.68 47. 9 N 4. 4.68 6 f.j 84 9 75 5 Si vuole verificare l ipotesi secodo cui Y e Q soo statisticamete idipedeti, H :. χ Essedo 5 sufficietemete elevato per utilizzare la statistica test χ co u test ad ua coda, co la regioe critica sotto la coda destra e co α.. Valore critico: dalle tavole, dati gradi di libertà si ottiee χ 9. Valore sperimetale:,. gradi di libertà. Eseguiamo 5
χ ( fij fij ) ( 4 4.68) ( 46 47.) ( 4 6) + +... + f i j ij Ricordado che si rifiuta l ipotesi ulla H : * * 4.68 47. critica o di rifiuto, ovvero se il valore sperimetale valore critico ossia se 6. χ co probabilità di sbagliare dell % se il valore sperimetale cade ella zoa χ > χ,., poiché.<9., o è possibile rifiutare l ipotesi di idipedeza fra umero di pesci morti e tipologia di acquario ella popolazioe di iteresse a livello di sigificatività del 99%. c) Stimare l igota proporzioe di acquari di tipo tropicale ella popolazioe di iteresse e costruire u itervallo di cofideza a livello 99%. Iterpretare e commetare il risultato. (.5 uti) qi pˆ 5 i Il campioe forisce la seguete stima per p:. 5 Data l elevata umerosità del campioe è possibile, grazie al Teorema Cetrale Limite, approssimare la distribuzioe ad ua Normale di media p pˆ pˆ pˆ e variaza ( ) E possibile quidi impiegare la statistica Z per costruire l itervallo di cofideza: pˆ z pˆ α, + zα Co livello di cofideza al 99%, si ha -α.99, α. α/.5 z( ) z. 58 α + α.995 p pˆ.5 ˆ( ˆ p p).5.48. 5 Ma quidi l itervallo di cofideza cercato è il seguete:.5.5.5.58,.5 +.58 [.44,.6] 5 5 ossiamo cofidare che l itervallo [.44;.6] sia uo dei 99 su che cotegoo la reale proporzioe di acquari tropicali ella popolazioe di iteresse. d) Testare al livello di sigificatività del 95% l ipotesi che l igota proporzioe di acquari tropicali ella popolazioe di iteresse sia pari a.5. (.5 uti) ˆ er la verifica dell ipotesi bilaterale H : p. 5, essedo sufficietemete grade, possiamo impiegare il test Z per gradi campioi a due code. qi pˆ 5 i Il campioe forisce la seguete stima per p:. 5 α.95 α.5 α/.5 Valore critico dalle tavole : z. 96 z α.975 pˆ p Valore sperimetale : z. 6 ˆ p( p).5.5.5(.5) 5 Il test rifiuta H : p. 5 co probabilità di sbagliare del 5% se il valore sperimetale cade ella zoa di rifiuto, ovvero se: Essedo.96 <.6 <. 96..6 pˆ p pˆ p z.96 oppure se z. 96 p( p) p( p) il valore cade ella zoa di o rifiuto e l ipotesi : pˆ. 5 del 95% o può essere rifiutata. H al livello di sigificatività 6
7