Analisi delle relazioni Corso di statistica sociale prof. Natale Carra - Università degli Studi di Bergamo Facoltà di Lingue e Letterature straniere a. a. 2012-13
Potremmo dire che la statistica ci aiuta a cogliere le relazioni attraverso i nessi causali. Possiamo così spiegarci perché ad esempio tanta fortuna ha il detto : Rosso di sera bel tempo si spera Analisi delle relazioni
Domande per ipotesi di ricerca La disabilità in Italia è più diffusa al sud? In altri termini: Esiste una relazione tra disabilità e territorio? Analisi delle relazioni bivariate
Disabili di sei anni e più per Regione.Tassi standardizzati per 1.000 persone al 2000 Pop (*1000) Tasso Disabili Piemonte 4.028 44,5 179.246 Valle d'aosta 112 38,6 4.323 Lombardia 8.480 41,8 354.464 Trentino Alto Adige 889 36,8 32.715 Veneto 4.203 40,6 170.642 Friuli Venezia Giulia 1.118 35,5 39.689 Liguria 1.543 35,5 54.777 Emilia Romagna 3.753 42,1 158.001 Toscana 3.337 46,0 153.502 Umbria 788 40,9 32.229 Marche 1.374 47,9 65.815 Lazio 4.912 43,8 215.146 Abruzzo 1.203 49,6 59.669 Molise 309 48,9 15.110 Campania 5.335 56,3 300.361 Puglia 3.802 61,5 233.823 Basilicata 568 56,4 32.035 Calabria 1.918 68,1 130.616 Sicilia 4.723 68,9 325.415 Sardegna 1.555 59,5 92.523 Italia 53.950 48,5 2.616.575 La disabilità nelle regioni d Italia
Per rilevare il fenomeno della disabilità l Istat, nell indagine campionaria sulle Condizioni di salute e il ricorso ai servizi sanitari, fa riferimento ad una batteria di quesiti, predisposti da un gruppo di lavoro dell OCSE (Organizzazione per la Cooperazione e lo Sviluppo Economico) sulla base della classificazione ICIDH dell'organizzazione Mondiale della Sanità, che consente di studiare specifiche dimensioni della disabilità: la dimensione fisica, riferibile alle funzioni della mobilità e della locomozione, che nelle situazioni di gravi limitazioni si configura come confinamento; la sfera di autonomia nelle funzioni quotidiane che si riferisce alle attività di cura della persona; la dimensione della comunicazione che riguarda le funzioni della vista, dell udito e della parola. La definizione di disabilità
Pop (*1000) Tasso Disabili Piemonte 4.028 44,5 179.246 Valle d'aosta 112 38,6 4.323 Lombardia 8.480 41,8 354.464 Trentino Alto Adige 889 36,8 32.715 Veneto 4.203 40,6 170.642 Friuli Venezia Giulia 1.118 35,5 39.689 Liguria 1.543 35,5 54.777 Emilia Romagna 3.753 42,1 158.001 Nord 24.126 41,2 993.857 Toscana 3.337 46,0 153.502 Umbria 788 40,9 32.229 Marche 1.374 47,9 65.815 Lazio 4.912 43,8 215.146 Abruzzo 1.203 49,6 59.669 Molise 309 48,9 15.110 Centro 11.923 45,4 541.470 Campania 5.335 56,3 300.361 Puglia 3.802 61,5 233.823 Basilicata 568 56,4 32.035 Calabria 1.918 68,1 130.616 Sicilia 4.723 68,9 325.415 Sardegna 1.555 59,5 92.523 Sud 17.901 62,3 1.114.772 La disabilità nelle ripartizioni d Italia
La disabilità in Italia è più diffusa al Sud? H 1 :µ S > µ C > µ N H 0 :µ S =µ C =µ N oppure H 1 :µ S > µ C = µ N La disabilità in Italia
Se H 0 :µ S =µ C =µ N allora µ j = µ e µ j µ=0 Se H 1 :µ S >µ C > µ N oppure H 1 :µ S > µ C = µ N allora µ j µ 0 α j =µ j µ La disabilità è più diffusa
Cosa determina la variazione? Y ij =µ+α j +e ij dove Y ij = valore dell osservazione i del gruppo j µ =media generale, comune a tutte le osservazioni α j =effetto comune esercitato dal gruppo j e ij =errore o residuo del singolo i del gruppo j Analisi della varianza
Per determinare gli effetti α j e e ij, si parte da: N i= 1 ( ) 2 Y i Y = 1 n j i= 1 ( ) 2 Y Y ij Rappresenta la somma dei quadrati totale SQ TOTALE La somma dei quadrati
L analisi della varianza suddivide la SQ TOTALE in SQ INTRAGRUPPO SQ INTERGRUPPO La somma dei quadrati
SQ TOTALE è scomponibile in SQ INTRAGRUPPO = 1 n j i= 1 ( ) 2 Y Y ij SQ INTERGRUPPO = 1 n ( ) 2 Y j Y La somma dei quadrati
Piemonte 44,5 Valle d'aosta 38,6 Lombardia 41,8 Trentino Alto Adige 36,8 Veneto 40,6 Friuli Venezia Giulia 35,5 Liguria 35,5 Emilia Romagna 42,1 Nord 41,2 Toscana 46,0 Umbria 40,9 Marche 47,9 Lazio 43,8 Abruzzo 49,6 Molise 48,9 Centro 45,4 Campania 56,3 Puglia 61,5 Basilicata 56,4 Calabria 68,1 Sicilia 68,9 Sardegna 59,5 Sud 62,3 Somma dei quadrati e disabilità
SQ INTRAGRUPPO =(44,5-41,2) 2 +(38,6-41,2) 2 + +(68,9-62,3) 2 +(59,5-62,3) 2 = 318,9 SQ INTERGRUPPO = 8 (41,2-48,5) 2 + 6 (45,4-48,5) 2 + 6 (62,3-48,5) 2 = 1622,5 S Q Intragruppo e S Q Intergruppo
I quadrati medi QM INTRAGRUPPO = SQ INTRAGRUPPO / N - ( ) 2 1 1 N Y Y n j i ij = = QM INTERGRUPPO = SQ INTERGRUPPO / - 1 ( ) 1 1 2 = Y Y n j j
QM INTRAGRUPPO = 318,9 / (20-3) = 18,8 QM INTERGRUPPO = 1622,5 / (3-1) =811,2 Q M Intragruppo e Q M Intergruppo
F = 1, N QM QM INTERGRUPPO INTRAGRUPPO F 811,2 18,8 2,17 = = 43,2 Poiché il valore critico per probabilità 0,01 = 6,11 Possiamo rifiutare l ipotesi nulla Verifica ipotesi H 0 e quoziente F
Tavola Valori F di Fisher
2 η = SQ SQ INTERGRUPPO TOTALE ˆ 2 η = 1622,5 1941,4 = 0,836 Potremmo dire che l 83,6 % della variazione osservata nei tassi di disabilità è spiegato dall area geografica Forza della relazione η 2
Analisi delle relazioni Corso di statistica sociale prof. Natale Carra - Università degli Studi di Bergamo Facoltà di Lingue e Letterature straniere a. a. 2012-13