Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi

Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni anziani intervistati sono state fatte, tra l altro, due domande: qual è il livello della tua felicità e quale pensi che sia il livello della felicità dei tuoi coetanei. Le risposte variavano da 1 a 10 per ciascuna domanda posta. Le risposte ottenute sono rappresentate in questa tabella che mostra la distribuzione unitaria delle due risposte, cioè la lista delle risposte di ciascun intervistato (colonne x e y) identificato con un numero progressivo visibile nella prima colonna della tabella. Questa è già una tabella doppia

Rappresentazioni delle distribuzioni doppie In generale, se indichiamo con X e Y i due caratteri e con x i e y i le modalità dei due caratteri nell unità i (i = 1, 2,, n), possiamo rappresentare la unitaria come: Questa rappresentazione può andare bene solo fino a che le unità nel collettivo sono poche. Per n molto grande occorre passare ad una forma più compatta di rappresentazione, proprio come abbiamo visto per le distribuzioni semplici.

Rappresentazioni delle distribuzioni doppie Utilizziamo allora la (o bidimensionale o bivariata) di frequenze che otteniamo contando le unità del collettivo che possiedono la stessa coppia di modalità dei due caratteri. Una di frequenze è rappresentata generalmente con la tabella a doppia entrata: nella colonna madre abbiamo le modalità del carattere X, nella testata ci sono le modalità del carattere Y e nel mezzo ci sono le frequenze assolute

Rappresentazioni delle distribuzioni doppie L ultima riga e l ultima colonna della tabella doppia contengono le somme delle frequenze assolute per riga o per colonna. Con notazione analitica, scriviamo

Rappresentazioni delle distribuzioni doppie Esempio. Consideriamo la distribuzione di 6.080 alunni delle scuole del Lazio, di 8 anni nel 1999, dei quali sono stati misurati la statura (X) e il peso (Y) (Fonte, Inran) Questa tabella doppia ha una colonna madre che rappresenta le modalità del carattere statura in classi, una testata che rappresenta il carattere peso in classi, una serie di valori all interno che rappresentano le frequenze assolute dei ragazzi che presentano la coppia di modalità dei due caratteri a cui corrispondono riga e colonna. L ultima riga e l ultima colonna sono costituite dai totali. Il valore all incrocio di queste righe e colonne è il totale generale delle frequenze, cioè è il numero di unità nel collettivo.

Rappresentazioni delle distribuzioni doppie La contiene s+t+2 distribuzioni unidimensionali: 1. la distribuzione delle unità del collettivo secondo il carattere X, qualunque sia la modalità del carattere Y che è presente nelle unità detta distribuzione totale o marginale, secondo il carattere X, della ; 2. la distribuzione totale o marginale, secondo il carattere Y, della distribuzione doppia;

Rappresentazioni delle distribuzioni doppie 3. le t (tante quante sono le modalità del carattere Y) distribuzioni unidimensionali, secondo il carattere X, delle unità del collettivo che presentano tutte o la modalità y 1 del carattere, o la modalità y 2,, o la modalità y t ; la generica distribuzione, corrispondente alla modalità y i del carattere Y è detta distribuzione parziale secondo il carattere X corrispondente alla modalità y i del carattere Y; 4. le s (tante quante sono le modalità del carattere X) distribuzioni unidimensionali, secondo il carattere Y, delle unità del collettivo che presentano tutte o la modalità x 1 del carattere, o la modalità x 2,, o la modalità x s ; la generica distribuzione, corrispondente alla modalità x h del carattere X, è detta distribuzione parziale secondo il carattere Y corrispondente alla modalità x h del carattere X.

Rappresentazioni delle distribuzioni doppie Possiamo considerare anche la distribuzione delle frequenze relative in cui con h=1,2,...,s e i=1,2,...,t è la frequenza relativa con cui si presentano associate la modalità x h del carattere X e la modalità y i del carattere Y.

Rappresentazioni delle distribuzioni doppie Graficamente, una si può rappresentare con una nuvola di punti su un piano cartesiano. Se però abbiamo una distribuzione di frequenze, si passa alla rappresentazione cartesiana ortogonale tridimensionale o stereogramma.

Rappresentazioni delle distribuzioni doppie Le sintesi delle distribuzioni doppie possono derivare da una generalizzazione di quanto visto per le distribuzioni unidimensionali. Quindi, anche in questo caso, possiamo calcolare moda, mediana, media, misure della variabilità, ecc. a seconda del livello di misura dei due caratteri della. Ora avremo una coppia di mode, per il carattere X e per il carattere Y, una coppia di mediane (un punto mediano della ) e una coppia di medie (un punto medio della, anche detto baricentro) e varianze.

Rappresentazioni delle distribuzioni doppie Esempio. Per la distribuzione vista prima di un certo numero di anziani interrogati sulla propria felicità e su quella dei coetanei, si possono calcolare il baricentro B, il punto Q medio quadratico e il punto M mediano Per calcolare il baricentro B basta fare la somma dei punteggi dichiarati divisa per il numero di intervistati per ciascuna delle due domande. Si ottiene il punto B(6,2;5,1)

Rappresentazioni delle distribuzioni doppie Per calcolare il punto mediano utilizziamo la distribuzione di frequenze assolute. Nella prima distribuzione le unità che occupano nella distribuzione ordinata il 20 o e il 21 o posto, presentano entrambe la modalità 7, mentre nella seconda ciò accade per la modalità 5. Quindi il punto mediano è M(7; 5) Infine la media quadratica è il punto Q(6,7;5,5) Esempio. Determiniamo il baricentro B della distribuzione, secondo la statura e il peso, di 6.080 alunni delle scuole del Lazio, di 8 anni nel 1999. A tale scopo è sufficiente calcolare la media aritmetica della statura e quella del peso che sono rispettivamente Statura media=133,2 cm Peso medio=33,1 kg. Perciò il baricentro della distribuzione considerata è B (133,2; 33,1).

Rappresentazioni delle distribuzioni doppie Non è detto che le medie assunte per i due caratteri debbano essere le stesse, perché possiamo assumere, ad esempio, come rappresentativo della distribuzione il punto (media aritmetica dei valori x h, mediana dei valori y i ). Ciò vale soprattutto quando i caratteri non sono dello stesso tipo, come accade, ad esempio, se il carattere X è quantitativo e l altro è qualitativo ordinato rettilineo, ecc. Se però i due caratteri sono quantitativi ed espressi nella stessa unità di misura, come indice di variabilità delle distribuzioni doppie si può usare lo scostamento quadratico medio dal baricentro

Diciamo che il carattere Y dipende perfettamente dal carattere X se ogni modalità x h di X individua una modalità di Y. Cioè: Il carattere Y dipende perfettamente dal carattere X se ad ogni modalità x h di X corrisponde una modalità y i del carattere Y per la quale è n hi = n i e quindi è n hj =0 per ogni j i ; inoltre debbono esserci almeno due modalità x h e x l di X a cui corrispondono rispettivamente due modalità y i e y j di Y fra loro diverse. Sono perciò le modalità di X a determinare quelle di Y. La perfetta dipendenza di Y da X non implica però generalmente la perfetta dipendenza di X da Y, in quanto, se ad ogni x h corrisponde una sola modalità y i, non si ha di conseguenza che ad ogni modalità y i corrisponda una sola x h. Pertanto la nozione di dipendenza perfetta generalmente è unilaterale e non bilaterale.

Se Y e X sono reciprocamente in dipendenza perfetta, ossia se la dipendenza fra i due caratteri è bilaterale, ad ogni x h deve corrispondere una sola modalità y i e viceversa. Ciò si verifica se è s=t, ossia se la tabella doppia è quadrata e se i due gruppi n 1, n 2,, n s e n 1, n 2,, n t, oltre che avere lo stesso numero di termini, sono costituiti dagli stessi numeri e cioè un gruppo deve essere una permutazione dell altro. Il caso opposto della dipendenza perfetta è quello dell indipendenza Prendendo come guida il concetto matematico di indipendenza di y da x, diciamo che in una il carattere Y è indipendente da X, o che Y non è connesso con X, se sono fra loro uguali tutte le distribuzioni parziali, secondo il carattere Y, corrispondenti alle varie modalità di X.

Se invece fra tutte le possibili coppie di distribuzioni parziali ve ne sono almeno due che sono fra loro diverse, noi diciamo che Y è connesso con X o che Y dipende da X. Esempio. Il carattere «colore dei capelli» (Y) è connesso con il carattere «regione di nascita» (X) perché, per esempio, la distribuzione secondo il colore dei capelli di coloro che sono nati in Sardegna (tra i quali prevale il colore nero dei capelli) è diversa da quella dei nati nel Trentino-Alto Adige (tra i quali non prevale il colore nero). Esempio. Il peso dei neonati dipende dall età della madre in quanto i pesi dei neonati si distribuiscono diversamente a seconda dell età della madre Quindi, per affermare che, in una, un carattere è dipendente o indipendente da un altro, dobbiamo confrontare le distribuzioni parziali o operando direttamente sulle distribuzioni stesse oppure ricorrendo agli indici con cui si sintetizzano le distribuzioni

Nel primo caso possiamo considerare uguali due distribuzioni se hanno le stesse modalità e se ogni modalità ha, nelle due distribuzioni, frequenze relative uguali (consideriamo le frequenze relative e non quelle assolute per non essere vincolati dal numero di unità delle distribuzioni). Nel secondo caso diciamo uguali due distribuzioni, per esempio rispetto alla media aritmetica, se esse hanno la stessa media aritmetica; se però le due distribuzioni non sono uguali rispetto alla media aritmetica, possiamo misurare la diversità fra le due distribuzioni mediante la disuguaglianza fra le medie aritmetiche; se le due distribuzioni hanno uguali scostamenti quadratici medi le diciamo uguali rispetto a tale caratteristica ma, se le distribuzioni non sono uguali rispetto allo scostamento quadratico medio, possiamo misurare la loro disuguaglianza mediante la diversità fra gli scostamenti quadratici medi.

La prima definizione di uguaglianza di due distribuzioni è più vincolante dell uguaglianza rispetto ad una caratteristica perché implica un maggior numero di condizioni di quante ne richieda l uguaglianza rispetto ad una caratteristica. Noi prenderemo in esame dapprima l indipendenza che fa riferimento al primo tipo di uguaglianza delle distribuzioni parziali e poi quella che si riferisce all uguaglianza rispetto ad una caratteristica. Nel primo caso parleremo di connessione o dipendenza e di connessione nulla o indipendenza (in caso di assenza di connessione); nel secondo caso di dipendenza o di indipendenza rispetto alla caratteristica considerata (la media artimetica)

Connessione nulla o indipendenza I caratteri X e Y, che consideriamo possono essere di qualunque tipo (ossia o sconnessi o qualitativi ordinati o quantitativi) in quanto facciamo riferimento soltanto alle frequenze relative delle loro modalità Diciamo che il carattere Y non è connesso con il carattere X nella se sono uguali fra loro tutte le distribuzioni parziali, secondo il carattere Y, corrispondenti alle varie modalità del carattere X ossia se sono uguali le s distribuzioni parziali corrispondenti alle modalità x 1, x 2,, x s del carattere X. Quindi il carattere Y non è connesso con il carattere X se, qualunque sia i (i=1, 2,, t), valgono le uguaglianze

Connessione nulla o indipendenza che, con un semplice passaggio matematico diventa Cioè: se Y non è connesso con X ogni distribuzione parziale secondo il carattere Y (corrispondente ad una qualunque modalità x h di X) è uguale alla distribuzione marginale o totale secondo il carattere Y. Viceversa, se ogni distribuzione parziale secondo il carattere Y è uguale alla distribuzione marginale o totale, sono anche uguali fra loro tutte le coppie di distribuzioni parziali secondo il carattere Y e quindi Y non è connesso con X Inoltre: ogni distribuzione parziale secondo il carattere X, corrispondente ad una qualunque modalità y i di Y, è uguale alla distribuzione marginale o totale secondo il carattere Y, in quanto la formula precedente si può scrivere come:

Connessione nulla o indipendenza Tutte le distribuzioni parziali secondo il carattere X, essendo ognuna uguale alla marginale, sono anche uguali tra loro; pertanto, se in una il carattere Y non è connesso con X, anche il carattere X non è connesso con Y. Possiamo perciò dire che X e Y sono non connessi o indipendenti o che fra essi vi è connessione nulla o indipendenza. Infine, sempre dalla formula precedente, si ricava che: Quindi è possibile calcolare la distribuzione di connessione nulla, sia di frequenze assolute che di frequenze relative.

Connessione nulla o indipendenza

Indici di connessione: contingenza quadratica media Un indice di connessione deve assumere il valore minimo, generalmente 0, nel caso di connessione nulla e il massimo (possibilmente 1) nel caso di dipendenza perfetta. Esso è una sintesi delle diversità fra le frequenze relative della distribuzione osservata e le corrispondenti frequenze relative della di connessione nulla L indice più usato è stato proposto da K. Pearson ed è denominato contingenza quadratica media. Indicandolo con Φ 2, l indice ha la seguente forma analitica

Indici di connessione: indice medio di contingenza Φ 2 =s 1 solo se la dipendenza di X da Y è perfetta Φ 2 =t 1 solo se la dipendenza di Y da X è perfetta Sono pertanto indici relativi unilaterali di connessione: mentre è un indice relativo bilaterale di connessione: detto contingenza quadratica media relativa o indice medio di contingenza

Indici di connessione Esempio. Calcoliamo gli indici Φ 2, ϕ 2 X/Y, ϕ 2 Y/X, ϕ 2 per la distribuzione doppia della tabella. Per farlo, calcoliamo le quantità Il totale di queste quantità è 1,527 Poiché la formula era basta sottrarre 1 da questa somma Φ 2 =1,527-1=0,527 Essendo s=t=4, ϕ 2 X/Y= ϕ 2 Y/X = ϕ 2 = =Φ 2 /(s-1)=0,527/3=0,18 Bassa connessione fra i due caratteri

Indici di connessione: il χ 2 di Pearson Un altro indice collegato a Φ 2 è il celeberrimo χ 2 (chi quadrato) di K. Pearson, L indice χ 2 si annulla nel caso di connessione nulla ma il suo massimo dipende da n Esempio. Calcoliamo l indice χ 2 per la della tabella precedente. Per la formula appena vista abbiamo χ 2 = nφ 2 = 264,097 0,527 = 139.095

Dipendenza in media Passiamo ora al caso 2, cioè quello dell uguaglianza delle distribuzioni parziali rispetto alla media aritmetica Supponiamo anzitutto che Y sia quantitativo e X qualunque. Se Y è indipendente in media da X, ogni distribuzione parziale secondo il carattere Y deve avere la stessa media aritmetica, cioè deve aversi che qualunque distribuzione parziale con media: y h = 1 n h. t i=1 y i n hi è uguale a tutte le altre ed è uguale alla media generale Altrimenti diciamo che c è dipendenza in media di Y da X. Quindi un indice relativo di dipendenza in media deve contenere le distanze delle medie parziali dalla media generale.

Dipendenza in media: rapporto di correlazione Quindi è un indice relativo di dipendenza in media il rapporto introdotto da K. Pearson che lo chiamò rapporto di correlazione dove σ y non è altro che lo scostamento quadratico medio del carattere Y e quello indicato al numeratore di questo indice è lo scostamento quadratico medio delle medie del carattere Y.

Dipendenza in media: rapporto di correlazione Esempio. Calcoliamo η y per la distribuzione, secondo la statura (X) e il peso (Y), di 6.080 alunni delle scuole del Lazio, di 8 anni nel 1999. È necessario anzitutto calcolare la media aritmetica e la varianza del peso e per fare ciò occorre rappresentare ogni classe con un solo valore. Scegliamo come valori rappresentativi quelli centrali per le classi interne e per la prima e l ultima classe, rispettivamente, i valori 19 kg e 45,4 kg. La media aritmetica del peso risulta quindi essere y = 1 6.080 201.180 19 7 + 22 494 + + 45,4 1.146 = = 33,1 6.080 E la varianza σ y 2 = 1 6.080 19 33,1 2 7 + 22 33,1 2 494 + + 45,4 33,1 2 1.146 = 318.725,68 6.080 = 52,42

Dipendenza in media: rapporto di correlazione Ora dobbiamo determinare le medie aritmetiche delle distribuzioni parziali, secondo il peso, corrispondenti alle varie classi di statura.

Correlazione fra due caratteri quantitativi Date due unità di un collettivo sulle quali rileviamo i due caratteri quantitativi X e Y, diciamo che in esse vi è concordanza fra i due caratteri, se, nel passaggio da un unità all altra, entrambi i caratteri o crescono o decrescono; diciamo che vi è discordanza se, al crescere dell uno, l altro decresce; diciamo che vi è indifferenza se almeno uno dei due caratteri è costante Cioè, in termini analitici, rilevati i valori x j e y j sull unità j e x l e y l sull unità l, diciamo che nelle due unità vi è, rispettivamente, concordanza, discordanza o indifferenza a seconda che il prodotto (x j x l )(y j y l ) sia positivo, negativo o nullo Abitualmente nella statistica i termini concordanza, discordanza e indifferenza di due caratteri sono sostituiti all unico sostantivo correlazione

Correlazione fra due caratteri quantitativi Un indice di correlazione molto utilizzato è il coefficiente di correlazione di Bravais (1846) Ovunque il coefficiente di correlazione di Bravais è indicato con r (o con la corrispondente lettera greca ρ). Questo indice varia tra -1 e 1 ed assume valore 0 quando la correlazione tra X e Y è nulla. Una formulazione di esso più semplice ai fini del calcolo, fa uso degli scarti, degli scarti standardizzati o dello scostamento quadratico medio.

Correlazione fra due caratteri quantitativi: coefficiente di correlazione di Bravais Con gli scarti dalla media Con lo scostamento quadratico medio dove il numeratore di questa formula è chiamato covarianza e si calcola come oppure con gli scarti standardizzati

Esempio. Calcoliamo r per la riportata nelle prime tre colonne della tabella precedente. Utilizziamo le formule appena viste. Dalla tabella otteniamo: Quindi vi è una certa correlazione. Questo valore deve essere ottenuto anche con le altre formule. Per fare ciò ci conviene calcolare gli scarti e poi il calcolo diventa immediato La piccola differenza è dovuta alle approssimazioni nei calcoli

Infine, questi calcoli possono essere usati anche per l ultima formula.

Naturalmente, le formule che abbiamo visto fino ad ora, che valgono per le distribuzioni unitarie, possono essere scritte anche per le distribuzioni di frequenza. Poiché in questo caso la covarianza è e le varianze sono la formulazione con covarianza e scarto quadratico medio non cambia Infine la formula con gli scarti standardizzati diventa

Esempio. Utilizziamo la formula con gli scarti per calcolare il coefficiente di correlazione lineare per la distribuzione, secondo la statura e il peso, degli alunni delle scuole del Lazio di 8 anni nel 1999. Scegliamo un valore rappresentativo delle classi e calcoliamo gli scarti dalla media, che per il peso è stata già calcolata in un esempio precedente ed è pari a 33,1 kg. Analogamente procediamo per le stature che hanno media pari 133,2 cm. I due totali di questa tabella sono le varianze da porre al denominatore. Per il calcolo della covarianza usiamo un altra tabella. Quindi