umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare il grado di associazione si deve stimare il coefficiente di correlazione: r xy xy x y Bisogna quindi in primo luogo calcolare la covarianza xy 1 x uy u μ x μ y el nostro caso le unità sono gli stati ed 11. Si denoti con y il carattere numero di omicidi e con x il carattere percentuale di popolazione povera.
Stato Omicidi, Povertà, (U) y u x u x u y u (1) AK 9,0 9,1 81,9 (2) AL 11,6 17,4 201,84 (3) AR 10,2 20 204 (4) AZ 8,6 15,4 132,44 (5) CA 13,1 18,2 238,42 (6) C 11,3,4 162,72 (7) CO 5,8 9,9 57,42 (8) CT 6,3 8,5 53,55 (9) VA 8,3 9,7 80,51 (10) SC 10,3 18,7 192,61 (11) TX 11,9 17,4 207,06 106,4 158,7 1612,47 xy 1 x uy u μ y 1 y u μ x 1 x u 106,4 11 9,67 158,7 11,43 μ x μ y 1612,47 (,43 9,67) 6,59 139,54 7,05 11 Calcoliamo ora lo scarto quadratico medio di ciascuno dei due caratteri: Stato Omicidi, Povertà, (U) y u x u 2 y u 2 x u AK 9,0 9,1 81 82,81 AL 11,6 17,4 134,56 302,76 AR 10,2 20 104,04 400 AZ 8,6 15,4 73,96 237,16 CA 13,1 18,2 171,61 331,24 C 11,3,4 127,69 207,36 CO 5,8 9,9 33,64 98,01 CT 6,3 8,5 39,69 72,25 VA 8,3 9,7 68,89 94,09 SC 10,3 18,7 106,09 349,69 TX 11,9 17,4 1,61 302,76 106,40 158,70 1082,78 2478,13 y y 2 1 y u 2 μ 2 y 1082,78 (9,67) 11 2 98,43 93,51 2,22
x x 2 1 x u 2 μ 2 x 2478,13 (,43) 11 2 225,28 208,22 4,13 Il coefficiente di correlazione è quindi pari a r xy xy x y 7,05 0, 77 4,13 2,22 ed indica una concordanza positiva fra i due caratteri che indica che all aumentare della percentuale della popolazione con reddito sotto la soglia di povertà aumenta in media anche il numero di omicidi (abbiamo una conferma di ciò anche osservando il diagramma di dispersione al punto a). La correlazione lineare tra due caratteri assume un valore medio alto in quanto è pari a 0,77 ed il valore massimo del coefficiente di correlazione è pari ad 1. c) I parametri della regressione y u β 0 + β 1 x u, per u 1,,11, sono la pendenza β 1 che è pari a β 1 xy 2 7,05 0, 41 x (4,13) 2 e l intercetta β 0 che è data da β 0 μ y β 1μ x 9,67 0,41,43 3, 75 L intercetta β 0, che è pari a 3,75, rappresenta il valore del numero di omicidi nel caso in cui la percentuale di popolazione sotto la soglia di povertà è pari a 0. Il parametro β 1 è invece pari al coefficiente angolare della retta; β 1 0,41 > 0 indica che c è concordanza tra i due caratteri, ad un incremento unitario della percentuale di popolazione povera corrisponde un aumento del numero di omicidi pari a 0,41. d) Per determinare la bontà di adattamento del modello di regressione ai dati si utilizza il coefficiente di determinazione lineare R 2. Avendo calcolato al punto b la correlazione fra i nostri caratteri possiamo calcolare il coefficiente di determinazione nel seguente modo: R 2 (r xy ) 2 0,77 2 0, 59 Alternativamente è possibile calcolare il coefficiente di determinazione nel seguente modo:
R 2 Dev reg (y u μ y ) Dev y y 2 2 Il calcolo della devianza di y è immediato in quanto nella soluzione del punto b si ha la varianza del carattere y, numero omicidi: y 2,22 e sappiamo che 11. Quindi la devianza di y è pari a Dev y y 2 11 4,92 54,12 Per calcolare la devianza di regressione è necessario costruirsi la seguente tabella: Stato Omicidi, Povertà, (U) y u x u y u (y u μ y ) 2 AK 9,00 9,1 7,48 4,79 AL 11,60 17,4 10,88 1,47 AR 10,20 20 11,95 5,20 AZ 8,60 15,4 10,06 0,16 CA 13,10 18,2 11,21 2,38 C 11,30,4 9,65 0,00 CO 5,80 9,9 7,81 3,46 CT 6,30 8,5 7,24 5,93 VA 8,30 9,7 7,73 3,78 SC 10,30 18,7 11,42 3,05 TX 11,90 17,4 10,88 1,47 Dev reg 31,7 R 2 Dev reg 31,7 0, 59 Dev y 54,12 R 2 pari a 0,59 indica che il modello di regressione spiega il 59% della variabilità del numero di omicidi. e) L equazione della retta che descrive l andamento di y u, il numero di omicidi, in funzione di x u, la percentuale di popolazione povera, può essere scritta nel seguente modo: y u β 0 + β 1x u el caso in cui la percentuale di popolazione povera è pari a 8 (x u 8) si ottiene che il numero di omicidi è pari a y u β 0 + β 18 3,75 + 0,41 8 7, 03
Esercizio II. Si denoti con A l evento adesione alla campagna e con A la sua negazione, ovvero non adesione alla campagna ; sia B invece l evento essere disposti a pagare il sovrapprezzo e sia B la sua negazione, non essere disposti a pagare il sovrapprezzo. a) Probabilità di estrarre casualmente dal collettivo un individuo che aderisca alla campagna di ritiro: Pr(A) 96 0, 09 1117 Probabilità di estrarre causalmente dal collettivo uno individuo che non è disposto a pagare il sovrapprezzo: Pr(B ) 963 0, 86 1117 b) Probabilità di estrarre casualmente dal collettivo un individuo che aderisce alla campagna e non è disposto a pagare il sovrapprezzo: Pr(A B ) 30 0, 03 1117 A si definisce indipendente rispetto a B se Pr(A B ) Pr(A)Pr(B ) Pr(A)Pr(B ) 0,09 0,86 0,08 0,03 I due eventi non sono indipendenti. c) Probabilità di estrarre casualmente dal collettivo un individuo che non aderisce alla campagna o non è disposto a pagare il sovrapprezzo: Pr(A B ) Pr(A ) + Pr(B ) Pr(A B ) 1021 933 + 0,86 + 0,91 + 0,86 0,84 0. 93 1117 1117
Gli eventi A e B sono incompatibili quando: Pr(A B ) Pr(A ) + Pr(B ), ovvero Pr(A B ) 0. La Pr(A B ) 0,84, quindi i due eventi non sono incompatibili. d) Probabilità di estrarre casualmente dal collettivo un individuo che non aderisce alla campagna dato che è noto che non è disposto a pagare il sovrapprezzo: Pr(A B ) Pr(A B ) Pr(B ) 0,84 0, 98 0,86 Esercizio III. Si denoti con A l evento ricevere un finanziamento e con A la sua negazione, ovvero non ricevere un finanziamento ; sia B invece l evento avere un contratto a tempo indeterminato e sia B la sua negazione, non avere un contratto a tempo indeterminato. Sappiamo quindi che Pr(A) 0,32 e Pr(B) 0,23 a) Calcolare la probabilità di ricevere un finanziamento o non avere un contratto a tempo indeterminato: Pr(A B ) Pr(A) + Pr(B ) Pr(A B ) Pr(A) + Pr(B ) Pr(A) Pr(B ) Pr(B ) 1 Pr(B) 0,77 Pr(A B ) 0,32 + 0,77 (0,32 0,77) 0, 84 b) Calcolare la probabilità di non ricevere un finanziamento dato che non ha un contratto a tempo indeterminato: Pr(A B ) Pr(A B ) Pr(B ) Pr(A )Pr(B ) Pr(B ) Pr(A ) 1 Pr(A) 0, 68 Esercizio IV. Sia μ 100 e. Il QI si distribuisce approssimativamente come una normale (100, ) a) Si vuole calcolare la probabilità di estrarre uno studente con un QI maggiore di X 1 110, ovvero
Pr(X > X 1 ) Pr(X > 110) Per calcolare tale probabilità si deve fare riferimento alle tavole della normale standardizzata; è quindi necessario riformulare l affermazione di probabilità in termini di normale standardizzata: X μ Pr(X > X 1 ) Pr ( > X 1 μ ) Pr(Z > Z 1) Dove Z 1 è pari a Z 1 X 1 μ 110 100 0,71 Guardando alla tavola di riferimento si osserva che quando Z 0,71, l area compresa tra 0 e 0,71 è pari a 0,2611. oto che l area sotto la curva della normale standardizzata da a 0 è pari a 0.5 la proporzione di studenti con QI maggiore di 110 è pari a Pr(X > X 1 ) 0,5 0,2611 0, 24 b) Si calcoli ora la probabilità di estrarre uno studente con QI maggiore di X 1 70. X μ Pr(X > X 1 ) Pr ( > X 1 μ ) Pr(Z > Z 1) Si deve nuovamente calcolare il valore standardizzato: Z 1 X 1 μ 70 100 2, Utilizzando le tavole della normale standardizzata si evince che l area compresa fra 0 e 2, è pari a : 0,4838. La proporzione di studenti con QI minore di 70 è quindi pari a Pr(X X 1 ) 0,5 + 0,4838 0, 98 c) Per calcolare la probabilità di estrarre uno studente con QI compreso fra X 1 80 e X 2 120 bisogna calcolare Z 1 e Z 2 :
Pr(80 X 120) Pr(Z 1 Z Z 2 ) Z 1 X 1 μ 80 100 1,43 Z 2 X 2 μ 120 100 1,43 L area compresa fra 0 e 1,43 è pari a 0,4236. Poiché la normale è una distribuzione simmetrica l area fra 1,43 e 0 è anch essa pari a 0,4236. Si ottiene quindi che la proporzione di studenti con QI compreso fra 80 e 120 è pari a Pr(80 X 120) Pr(Z 1 Z Z 2 ) 2 0,4236 0, 85 d) la probabilità di estrarre uno studente con QI compreso fra 60 e 80: Pr(60 X 80) Pr(Z 1 Z Z 2 ) Z 1 X 1 μ 60 100 2,86 Z 2 X 2 μ 80 100 1,43 Pr(60 X 80) Pr(Z 1 Z Z 2 ) 0,4979 0,4236 0, 07