Pro. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di requenza e rappresentazione graica ARGOMENTI DELLA LEZIONE Le distribuzioni di requenza in classi La rappresentazione graica Le tabelle di requenza DISTRIBUZIONI DI FREQUENZA Le distribuzioni in classi Le distribuzioni in classi Quando le modalità della variabile sono molte è preeribile raggrupparle in classi o intervalli Le distribuzioni in classi La requenza relativa alla classe = Numero di dati (soggetti) compresi tra i valori che deiniscono la classe (o intervallo) Quante classi devo costruire? Quanto devono essere ampie?
Pro. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di requenza e rappresentazione graica Tre criteri - guida. coprire l intera gamma dei punteggi. classi di uguale ampiezza (se possibile). classi mutualmente esclusive x 8 9 5 5 N= x 8-9 (+) - (+) - 9 (5+) -5 5 (+) N= Classi di ampiezza = Classi di ampiezza =. Coprire l intera gamma dei punteggi se, nell esempio, il primo intervallo osse -, perderei tutti i soggetti di 8 e 9 anni. Classi di uguale ampiezza (se possibile) E meglio avere classi di uguale ampiezza: perché sono comparabili tra loro è più acile la rappresentazione graica Le ampiezze usuali sono:, 5,, o multipli di.. Classi mutualmente esclusive deve essere chiaro dove va inserito ogni soggetto Classi 8-9 9 - - ESEMPIO Un soggetto di età X = 9 in quale classe viene inserito? Nella ª o nella ª? I limiti delle classi si deiniscono LIMITI TABULATI ma esistono i cosiddetti LIMITI REALI della classe che consentono di assegnare in modo univoco un dato ad una classe e ad una soltanto
Pro. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di requenza e rappresentazione graica LIMITI REALI Si aggiunge.5 al LIMITE TABULATO SUPERIORE e si sottrae.5 al LIMITE TABULATO INFERIORE ESEMPIO 9 9 7 5 78 7 5 5 78 87 9 8 8 77 8 79 8 8 75 88 8 9 78 79 8 9 89 8 77 Gamma= (X max X min + )= 9 + = 55 Ampiezza=(gamma : n classi) = 55 : 5 = Limiti tabulati -5 5- -7 7-8 8-9 Limiti reali 9.5 5.5 5.5.5.5 7.5 7.5 8.5 8.5 9.5 Frequenze = 5 = = 5 = 5 = 9 N = Σ i = RIASSUMENDO Si deinisce la gamma della distribuzione (max-min + ) e si divide per il numero delle classi volute ampiezza delle classi Le classi devono essere mutualmente esclusive deinizione dei limiti ineriore e superiore RIASSUMENDO I LIMITI TABULATI dell intervallo comprendono tutti i valori maggiori o uguali al limite ineriore e minori o uguali al limite superiore. I LIMITI REALI si considerano mezzo punto sotto il limite ineriore e mezzo punto sopra il limite superiore. RIASSUMENDO Posso calcolare il punto medio di ciascuna classe acendo la semisomma dei limiti ineriore e superiore: si indica con x c Il numero delle classi non deve essere troppo elevato (5 < k < ) ed è preeribile che l ampiezza delle classi sia uguale(es.,, 5, e multipli).
Pro. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di requenza e rappresentazione graica Se la variabile è discreta RAPPRESENTAZIONI GRAFICHE le categorie della variabile le requenze di ciascuna categoria ISTOGRAMMA A BARRE ISTOGRAMMA A BARRE Se la variabile è continua Stato civile Celibe/nubile Coniugato/a Divorziato/a,5,5,5,5 i valori della variabile le requenze di ciascun valore Valori = classi di ampiezza unitaria Vedovo/a cel con div ved ISTOGRAMMA ISTOGRAMMA Variabile continua, ampiezza unitaria requenze 8 5 7 8 valori variabile Se la variabile è continua i limiti reali delle classi Se le classi hanno la stessa ampiezza le requenze di ciascuna classe ISTOGRAMMA
Pro. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di requenza e rappresentazione graica Variabile continua, dati in classi con uguale ampiezza Ascissa : valori variabile, ampiezza classe = larghezza del rettangolo Ordinata : requenze 8.5-.5.5-.5.5-.5 Se la variabile è continua i limiti reali delle classi Se le classi hanno ampiezza diversa le altezze di ciascun rettangolo La requenza = area del rettangolo Limiti Limiti tabulati reali a h 8-7.5.5 -.5.5 5-7.5 7.5 5 5 a = ampiezza della classe = base = requenza = area rettangolo h = altezza del rettangolo 5 corretto 5 7.5.5.5 7.5 8 errato 7.5.5.5 7.5 POLIGONO DI FREQUENZA Linea spezzata che rappresenta l andamento delle requenze ottenute 9 8 7 5 5 7 8 5
Pro. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di requenza e rappresentazione graica CURVE DI FREQUENZA Quando una variabile continua ha molti valori o classi e Nè grande il poligono diventa una curva x DIAGRAMMA A TORTA Rappresentazione graica delle requenze percentuali cel con div ved OGIVA Rappresentazione graica cum requenze cumulate Ascissa: valori variabile Ordinata: requenze cumulate x TABELLE DI FREQUENZA TABELLE SEMPLICI TABELLE A DOPPIA ENTRATA TABELLE A ENTRATA MULTIPLA TABELLE SEMPLICI I dati sono classiicati secondo una variabile Modalità e requenze corrispondenti anni anni 5 7 TABELLE A DOPPIA ENTRATA O TABELLE DI CONTINGENZA I dati sono classiicati secondo due variabili Le requenze sono calcolate tenendo conto delle combinazioni delle modalità delle due variabili
Pro. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di requenza e rappresentazione graica anni anni * Tab. x 5 5 5 ( righe x colonne) 75 75 5 * = req. di cella distribuzione ij congiunta = req. di riga distribuzione i. marginale = req. di colonna distribuzione.j marginale = req. totali ij i..j ; M ; F anni anni *.*... Tab. x.7. 5.7 5.7 5. 75 75 5 * = req. e congiunta (/5 x ) = req. e marginale (/5 x ) = req. e marginale (75/5 x ) anni anni 5 5 5 = condizionata di riga ( ij / j x ) entro i anni la ripart. in per genere (/ x =5) anni anni 5.7.. 5.7.. 75 75 = condizionata di colonna ( ij / i x ) entro i maschi ripart. in x classe età (/75 x =.7) TABELLE A ENTRATA MULTIPLA I dati sono classiicati secondo tre o più variabili. Le requenze sono calcolate tenendo conto delle molteplici combinazioni delle modalità delle variabili. anni anni Figlio Fratelli unico 7 8 Figlio Fratelli unico 9 Tab. xx ( righe x colonne x colonne) 7