Le rappresentazioni grafiche Descrivono diversi aspetti dell informazione contenuta nei dati e si basano sulla rappresentazione di corrispondenze tra dati numerici e enti geometrici elementari (punti, segmenti, linee, figure, volumi, ecc.) o, alternativamente, tratteggi, colorazioni, ecc.. Le rappresentazioni grafiche Le distribuzioni di frequenza di variabili qualitative possono essere efficacemente rappresentate con segmenti o barre (orizzontali o verticali) proporzionali alla frequenza di ogni modalità (diagrammi a barre e diagrammi a nastri) 1
Diagramma a nastri Marrone Nero Azzurro Verde 0 20 2040 60 40 80 100 60 Maschi Femmine Diagramma a barre 2
Diagramma a barre Voti 18 Studenti 3 19 5 20 7 21 5 22 10 23 6 24 10 25 6 26 11 27 6 28 5 29 10 30 4 Totale 88 12 10 8 6 4 2 0 18 19 20 21 22 23 24 25 26 27 28 29 30 3
Diagramma circolare (o a torta) Serve a raffigurare la composizione di un insieme di n unità statistiche in k classi. Un cerchio è ripartito in k settori circolari proporzionali alle frequenze relative delle classi. Diagramma a torta 21,6% 22,7% 26,1% 29,6% 4
Istogramma di frequenza Consente di rappresentare in coordinate cartesiane distribuzioni di frequenze assolute o relative per caratteri quantitativi 5
Esempio di istogramma (classi di uguale ampiezza) Classi di reddito annuo TOTALE 10.000-1 1-15.000 15.000-17.500 17.500-20.000 20.000-2 2-25.000 25.000-27.500 27.500-30.000 30.000-3 3-35.000 35.000-37.500 37.500-40.000 40.000-4 4-45.000 Frequenze 200 500 700 1200 1800 2600 3000 3100 2400 1900 1000 800 500 300 20000 Esempio di istogramma con classi di pari ampiezza 3000 2000 frequenze 1000 reddito 10.000 20.000 30.000 40.000 50.000 6
Si supponga ora di raggruppare le prime 3 e le ultime 3 classi, che hanno ora, rispettivamente, frequenza 1400 e frequenza 1600. Come sarà il nuovo istogramma? Se continuiamo ad indicare le frequenze in ordinata, otteniamo quanto esposto nella diapositiva seguente. Istogramma sbagliato 3000 2000 frequenze 1500 1000 reddito 10.000 20.000 30.000 40.000 50.000 7
Il nuovo istogramma ha un profilo ben diverso dal precedente: la classe iniziale e quella finale hanno frequenze dilatate, solo perché la loro ampiezza è tripla rispetto alle altre. Di questo occorre tenere conto. Come? Dividendo, per ogni classe, la frequenza per l ampiezza della classe stessa. Si ottiene così, per ogni classe, la densità di frequenza, che nell istogramma sarà riportata in ordinata. Accorpamento delle prime 3 e delle ultime 3 classi Classi di reddito annuo 10.000-17.500 17.500-20.000 20.000-2 2-25.000 25.000-27.500 27.500-30.000 30.000-3 3-35.000 35.000-37.500 37.500-45.000 TOTALE Frequenze ni 1400 1200 1800 2600 3000 3100 2400 1900 1000 1600 20000 Ampiezza Densità di classi frequenza di hi = ni/ di 7.500 0,19 0,48 0,72 1,04 1,20 1,24 0,96 0,76 0,40 7.500 0,21 ------ ------ 8
Istogramma corretto 1,20 1,00 0,80 0,60 densità di frequenza 0,40 0,20 reddito 10.000 20.000 30.000 40.000 50.000 Istogramma di frequenza Su ciascun intervallo, rappresentato in ascissa, si costruisce un rettangolo di altezza pari alla densità di frequenza della classe corrispondente, definita come il rapporto tra la frequenza e l ampiezza della classe. In tal modo l area di ogni rettangolo risulta proporzionale alla frequenza della classe rappresentata 9
Andamento del tasso di disoccupazione italiana dal settembre 1997 al luglio 2003 14,0% 12,0% 10,0% 8,0% 11,7% 11,9% 11,6% 10,1% 9,3% 8,9% 8,3% 6,0% 4,0% 2,0% 0,0% set-97 dic-97 mar-98 giu-98 set-98 dic-98 mar-99 giu-99 set-99 dic-99 mar-00 giu-00 set-00 dic-00 mar-01 giu-01 set-01 dic-01 mar-02 giu-02 set-02 dic-02 mar-03 giu-03 Concentrazione di PM10 rilevato nelle province dell Emilia Romagna dal 4 al 13 febbraio 2005 10
11