Distribuzioni Doppie Quando si raccolgono più informazioni su una singola unità Questionario somministrato nell ambito di un progetto di ricerca sulla Human Perception(Univ. Napoli Federico II, Prof. D. Piccolo) 1
Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 Distribuzione unitaria doppia Si tratta dell elencazione delle modalità di due caratteri, osservate per ogni unità statistica del campione considerato (distribuzione doppia disaggregata). Una distribuzione doppia disaggregata viene rappresentata come: Identificativo Genere Occhiali 0001 o SI 0002 o NO 0003 Femmina SI 0004 Femmina NO 0005 Femmina NO Lo spoglio dei dati Occhiali SI (1) o (0) / / Femmina (1) / // Occhiali NO(0) Modo per raccogliere le informazioni. Non si possono effettuare sintesi... ma possono essere sintetizzate. Come? 2
Tabelle a doppia entrata Se si vogliono esaminare due caratteri contemporaneamente, un utile strumento per riassumere le informazioni raccolte sui due caratteri è rappresentato dalla tabella a doppia entrata. Occhiali Genere Occhiali NO Occhiali SI Totale 62 29 91 31 41 72 Distribuzione marginale del carattere OCCHIALI Distribuzione congiunta Occhiali 62 Genere Occhiali NO Occhiali SI Totale 163 100 38,04% 17,79% 55,83% Distribuzione marginale del carattere GENERE Frequenze assolute congiunte Distribuzione marginale del carattere GENERE 19,02% 25,15% 44,17% Frequenze relative Totale 57,06% 42,94% 100 percentuali 31 163 100 31 Distribuzione marginale del carattere OCCHIALI 163 100 Se usiamo grafici tridimensionali 40,00 35,00 30,00 Istogramma tridimensionale 25,00 20,00 15,00 10,00 5,00 0,00 Occhiali NO Occhiali SI 50 45 40 35 30 25 41 29 44,17% Grafico a Bolle 55,83% 20 15 10 5 0 0 20 31 40 6062 80 Occhiali NO 3
Istogramma composto 40,00 35,00 38,04 30,00 25,00 25,15 20,00 15,00 10,00 17,79 19,02 L uso della frequenza relativa è necessario. 5,00 0,00 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Occhiali NO Occhiali SI Proiezione su 100 Occhiali NO Occhiali SI Un ulteriore significato Distribuzione marginale Occhiali. 60,00 57,06 50,00 42,94 40,00 30,00 20,00 10,00 0,00 Occhiali NO Occhiali SI Distribuzioni condizionate Distribuzione congiunta Occhiali Genere Occhiali NO Occhiali SI Totale,, 38,04% 17,79% 55,83% 19,02% 25,15% 44,17% Totale 57,06% 42,94% 100 100 66,67%,, Tra coloro che non portano occhiali, qual è la percentuale di? 38,04 100 33,33% Occhiali Genere Occhiali NO Occhiali SI 66,67% 41,43% 33,33% 58,57% Totale 100% 100% Distribuzione condizionata del GENERE rispetto ad OCCHIALI. Esempio: Calcolare la distribuzione condizionata di OCCHIALI rispetto a GENERE. C è una relazione tra Genere e Uso degli occhiali? (Associazione tra 2 caratteri ) 4
E adesso un po di notazioni X Y Totale Totale Tabella delle frequenze relative = = Tabella delle frequenze assolute X Y Totale Totale 1 Y/X X Tabella delle frequenze relative condizionate Y Totale 1 1 Paradosso di Simpson Ad Alberto e Barbara piace giocare a basket e si sfidano in una gara di tiri. Ognuno prova 200 tiri con i seguenti risultati. Alberto Barbara Canestri 100 80 Out 100 120 Totale 200 200 Chi è più bravo?!? Alberto, senza dubbio! Ha una percentuale del 50% di centri contro il 40% di Barbara! Stratifichiamo rispetto ai tiri da sotto canestro. Alberto Barbara Da fuori Da sotto Totale Da fuori Da sotto Totale Canestri 10 90 100 50 30 80 Out 30 70 100 100 20 120 Totale 40 160 200 150 50 200 Nei tiri da fuori area, Alberto ha una percentuale del 25% (10/40) mentre Barbara ha una percentuale del 33% (50/150). Nei tiri da fuori, Barbara è più brava. Nei tiri da sotto canestro, Alberto ha una percentuale del 56,25% (90/160) mentre Barbara ha una percentuale del 60% (30/50). Dunque anche nei tiri da sotto canestro, Barbara è più brava! 5
I dati si riferiscono a come due ospedali (Xe Y) operano su una certa malattia. Il dato complessivo è che l ospedale Xha il 55% di successi e quello Y, il 60%. Successo X Y Totale Gravi Lievi Totale 55% 60% Successo X Y Totale Gravi 50% di 90% Lievi 100% di 10% Totale 55% 60% Per l ospedale Yil 40% sono casi lievi, ne risolve il 90%, (36% del totale), mentre sul 60% di casi gravi il successo è del 40% (24% del totale). Successo X Y Totale Gravi 45% 24% 69% Lievi 10% 36% 46% Totale 55% 60% Per quella certa malattia, l ospedale Xopera sul 90% di casi gravi, ne risolve il 50% (45% del totale), mentre sui restanti 10%, lievi, ha il 100% di successo (10% del totale). Successo X Y Totale Gravi Lievi 45% 40% di 60% 45%+ 10% 90% di 40% 10%+ Totale 55% 60% Da questi dati invece emerge che conviene sempre operarsi nell ospedale X. Distribuzioni miste Tra le domande proposte nel questionario, una è relativa alla percezione della propria felicità: Dato=misura di questo segmento L istogramma dell indice di felicità Stratificarerispetto al GENERE. 6
Media= 6,44 Dev. standard = 2,44 Coeff.var. = 0,37 Media= 6,91 Dev. standard = 2,22 Coeff.var. = 0,32 [0,1) [1,2) [2,3) [3,4) [4,5) [5,6) [6,7) [7,8) [8,9) [9,10) [10,11) [11,12) Totale 0 1 8 4 4 15 7 8 23 11 11 6 1 99 1 2 1 2 4 15 8 9 10 14 14 5 2 86 Totale 3 9 6 8 30 15 17 33 25 25 11 3 185 Per tre variabili qualitative Occhiali Genere Mano S 7 4 11 91 Mano D 55 25 80 Mano S 3 3 6 72 Mano D 28 38 66 no. di intervistati mancini 17 In termini di insiemi: Distribuzione congiunta no. maschi, che scrivono con la mano sinistra e portano gli occhiali Distribuzione doppia no. femmine che scrivono con la mano destra 7
Per tre variabili qualitative Occhiali Genere Mano S 7 4 11 91 Mano D 55 25 80 Mano S 3 3 6 72 Mano D 28 38 66 no. di intervistati mancini 17 In termini di insiemi: Distribuzione congiunta no. maschi, che scrivono con la mano sinistra e portano gli occhiali Distribuzione doppia no. femmine che scrivono con la mano destra.. Per tre variabili qualitative Occhiali Mano Genere Mano S 7 4 11 91 Mano D 55 25 80 Mano S 3 3 6 72 Mano D 28 38 66 no. di intervistati mancini 17 In termini di insiemi: Distribuzione congiunta no. maschi, che scrivono con la mano sinistra e portano gli occhiali Distribuzione doppia no. femmine che scrivono con la mano destra.. 8
Ricapitolando. Esaustivi Disgiunti Esaustivi Disgiunti Esaustivi Disgiunti Occhiali Mano Genere Mano S 7 4 11 91 Mano D 55 25 80 Mano S 3 3 6 72 Mano D 28 38 66 Grafici Occhiali Mano Genere Mano S 7 4 11 91 Mano D 55 25 80 Mano S 3 3 6 72 Mano D 28 38 66 60 50 40 30 20 10 0 Mano S Mano D Mano S Mano D Occhiali S Occhiali N 60 50 40 30 20 10 0 Mano S Mano D Mano S Mano D Occhiali N Occhiali S Occhiali S Occhiali N 9
Distribuzione condizionata di Occhiali & Scrittura vs Genere Occhiali Mano Genere Mano S 7/91 4/91 11 91 Mano D 55/91 25/91 80 Mano S 3/72 3/72 6 72 Mano D 28/72 38/72 66 Quando si restringe l insieme delle unità campionarie considerato, allora si usa una differente notazione: = %unità con occhiali e mancini tra maschi = 38 72 6 72 = %unità senza occhiali e non mancini tra femmine = = %unità mancini tra le femmine = Distribuzione condizionata di Occhiali vs Scrittura & Genere Occhiali Mano Genere Mano S 7/11 4/11 11 91 Mano D 55/80 25/80 80 Mano S 3/6 3/6 6 72 Mano D 28/63 38/66 66 Quali sono gli insiemi coinvolti? = %unità con occhiali tra mancini e maschi = = %unità con occhiali tra mancini e femmine= 10