Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard DISTRIBUZIONE DI UN CARATTERE Terminata la fase di acquisizione dei dati, iniziamo a vedere come rappresentarli e sintetizzarli. Il primo risultato della rilevazione dei dati è una lista delle modalità con cui ognuno dei caratteri si presenta in ciascuna unità del collettivo (dati grezzi). Possiamo quindi immaginare una lista con tante righe quante sono le unità. Questa altro non è che la distribuzione del collettivo secondo i caratteri considerati. Dal momento che per ogni unità indichiamo la modalità con la quale ciascun carattere si manifesta, si parla di distribuzione unitaria (o per unità). La distribuzione unitaria è semplice se si riferisce ad un solo carattere, è multipla se si riferisce a due o più caratteri. Esempio. Su N=20 aziende nel Lazio si rileva la modalità assunta dal carattere numero di addetti. Indichiamo con x 1 la modalità assunta nell azienda 1, con x 2 la modalità assunta nell azienda 2,, con x 20 la modalità assunta nell azienda 20. In generale indichiamo con x 1,...x N le modalità associate alle unità 1,..N. La distribuzione per unità è la seguente Azienda n. addetti Azienda n. addetti 1 = 4 11 = 3 2 3 4 5 6 7 8 9 10 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 = 2 = 8 = 6 = 3 = 2 = 5 = 5 = 10 = 5 12 13 14 15 16 17 18 19 20 x 11 x 12 x 13 x 14 x 15 x 16 x 17 x 18 x 19 x 20 = 3 = 2 = 2 = 9 = 11 = 10 = 9 = 2 = 15 Tab. 1: distribuzione unitaria di 20 aziende del Lazio per numero di addetti Nota: Quando i dati vengono riportati in forma di distribuzione per unità, è disponibile l informazione riguardante l associazione unità-modalità, cioè data una modalità possiamo sapere esattamente quale/quali unità la presentano. Il problema della distribuzione unitaria è la sua mancanza di sintesi soprattutto nel caso in cui il collettivo sia molto numeroso e su di esso vengano rilevati caratteri che possono assumere un elevato numero di modalità. Ricordiamoci infatti che il nostro scopo è quello di estrarre informazioni dai nostri dati, informazioni che siano rilevanti per lo scopo della nostra indagine. Per ottenere una maggiore sintesi si costruisce la distribuzione di frequenze. Anche in questo caso si parla di distribuzioni di frequenza semplice se questa è riferita ad un solo carattere; altrimenti si parla di distribuzione doppia se si riferisce a due caratteri, e in generale multipla se si riferisce a più caratteri. Consideriamo una distribuzione di frequenze semplice.
Per ogni modalità distinta assunta dal carattere nel collettivo in esame si registra: - il numero di unità che presentano tale modalità. Questo numero viene detto frequenza assoluta della modalità, cioè il numero di volte che la modalità viene osservata nel collettivo (ovvero il numero di unità del collettivo con quella modalità). - la frazione, sul totale delle unità del collettivo, di unità che presentano tale modalità. Questo numero viene detto frequenza relativa della modalità. (In via teorica ciò significa che ci si riporta ad avere numerosità del collettivo pari a 1) - la percentuale di unità del collettivo che presentano tale modalità. Questo numero viene detto frequenza percentuale della modalità. (In via teorica ciò significa che ci si riporta ad avere numerosità del collettivo pari a 100) Vediamo come quanto esposto viene espresso in termini formali. Sia K il numero di modalità distinte che il carattere assume nel collettivo; indichiamo: - con x 1,, x K tali modalità - con n 1,, n K le frequenze assolute associate - con f 1,, f K le frequenze relative associate, dove f i = n i /N, i=1,,k - con p 1,, p K le frequenze percentuali associate, dove p i = f i 100 = (n i /N) 100, i=1,,k Torniamo all esempio delle 20 aziende del Lazio dove N = 20 e K=10. Abbiamo visto la distribuzione unitaria; qui sotto è riportata la distribuzione di frequenze. Modalità x i Freq. assolute n i freq. relative f i freq. percentuali p i 2 (= x 1 ) 5 (=n 1 ) 5/20 = 0.25 (=f 1 ) 0.25 100 = 25 (=p 1 ) 3 (= x 2 ) 3 (=n 2 ) 3/20 = 0.15 (=f 2 ) 0.15 100 = 15 (=p 2 ) 4 (= x 3 ) 1 (=n 3 ) 1/20 = 0.05 (=f 3 ) 0.05 100 = 5 (=p 3 ) 5 (= x 4 ) 3 (=n 4 ) 3/20 = 0.15 (=f 4 ) 0.15 100 = 15 (=p 4 ) 6 (= x 5 ) 1 (=n 5 ) 1/20 = 0.05 (=f 5 ) 0.05 100 = 5 (=p 5 ) 8 (= x 6 ) 1 (=n 6 ) 1/20 = 0.05 (=f 6 ) 0.05 100 = 5 (=p 6 ) 9 (= x 7 ) 2 (=n 7 ) 2/20 = 0.1 (=f 7 ) 0.1 100 = 10 (=p 7 ) 10 (= x 8 ) 2 (=n 8 ) 2/20 = 0.1 (=f 8 ) 0.1 100 = 10 (=p 8 ) 11 (= x 9 ) 1 (=n 9 ) 1/20 = 0.05 (=f 9 ) 0.05 100 = 5 (=p 9 ) 15 (= x 10 ) 1 (=n 10 ) 1/20 = 0.05 (=f 10 ) 0.05 100 = 5 (=p 10 ) totale 20 (=N) 1 100 Tab. 2: distribuzione di frequenze di 20 aziende del Lazio per numero di addetti (carattere quantitativo discreto) Leggendo la tabella vediamo che ad esempio il numero di aziende del Lazio con 2 addetti (cioè il numero di aziende con la modalità x 1 ) è pari a 5 (cioè n 1 =5) e che le aziende con 5 addetti costituiscono il 25% delle aziende osservate, cioè p 1 =25. Proprietà 1: la somma (per colonna) di tutte le frequenze relative è pari a 1, in simboli f f + + f 1 (ovvero anche f = 1) 1 + 2 K = K i= 1 i 1
Proprietà 2: la somma (per colonna) di tutte le frequenze percentuali è pari a 100, in simboli p p + + p 100 (ovvero anche p = 100 ) 1 + 2 K = K i= 1 i Osservazione: se il carattere X è qualitativo ordinato o quantitativo le modalità vengono elencate in ordine crescente come nell esempio riportato sopra in cui il carattere è quantitativo (discreto) e si parte dalla modalità corrispondente al numero più basso di addetti per arrivare alla modalità corrispondente al numero più alto di addetti rilevato. Se il carattere è qualitativo sconnesso, invece, per definizione non esiste un ordine in base al quale presentare le modalità Consideriamo il seguente esempio relativo alla distribuzione per fede religiosa Religione (Africa) n i f i Cristiani 317 0.48 Musulmani 269 0.41 Animasti 68 0.1 Altro 8 0.01 Totale 662 1.000 Nota: è importante osservare che quando si considera la distribuzione di frequenze, non è più disponibile l informazione riguardante l associazione unità-modalità. Ciò significa che ad esempio sappiamo che nel Lazio 2 aziende hanno 10 addetti (cioè presentano la modalità x 8 ) ma non sappiamo quali aziende specifiche. 2 CONFRONTO FRA DISTRIBUZIONI Le frequenze relative (e quelle percentuali) consentono sia di capire l'importanza di una modalità nel collettivo perché indicano la frazione (percentuale) di unità che detengono quella modalità sia di confrontare frequenze corrispondenti ad una stessa modalità in distribuzioni secondo lo stesso carattere su collettivi di diversa numerosità. Infatti, grazie alla proprietà 1, la frequenza relativa equivale ad una trasformazione dell unità di misura delle frequenze in modo tale che il totale risulti pari ad 1 (e grazie alla proprietà 2 la frequenza percentuale equivale ad una trasformazione dell unità di misura delle frequenze in modo tale che il totale risulti pari a 100). Questo significa che lavorare con le frequenze relative (percentuali) equivale e fissare a 1 (100) la numerosità del collettivo e a riproporzionare corrispondentemente le frequenze assolute. Consideriamo ancora l esempio dell indagine sul n. addetti. Abbiamo visto il caso del Lazio. Supponiamo di avere fatto una rilevazione anche su N M =10 aziende nel Molise e di avere ottenuto la seguente distribuzione di frequenze. Modalità x i Freq. assolute n i Freq. relative f i Freq. percentuali p i 2 5 0.5 50 10 5 0.5 50 totale 10 1 100
Mettiamo a confronto le due distribuzioni di frequenze. Innanzitutto notiamo che nella distribuzione del Molise molte modalità hanno frequenza nulla cioè non si presentano nella popolazione. Dalla tabella che segue risulta più facile effettuare un confronto. LAZIO MOLISE Modalità freq. Assolute freq. relative freq. assolute freq. relative 2 5 0.25 5 0.5 3 3 0.15 0 0 4 1 0.05 0 0 5 3 0.15 0 0 6 1 0.05 0 0 8 1 0.05 0 0 9 2 0.1 0 0 10 2 0.1 5 0.5 11 1 0.05 0 0 15 1 0.05 0 0 Totale 20 1 10 1 I due collettivi hanno numerosità diversa. Pertanto come prima cosa modifichiamo le frequenze in modo tale che i due collettivi abbiano la stessa numerosità, cioè calcoliamo le frequenze relative. Dall osservazione delle frequenze relative vediamo che nel Molise le aziende con 2 addetti sono più che nel Lazio (in particolare sono il doppio). Se ci fossimo, invece, limitati ad osservare le frequenze assolute saremmo giunti alla conclusione ERRATA (!) che nel Lazio e nel Molise c è lo stesso numero di aziende con 2 addetti. Pertanto quando si vogliono fare confronti tra due o più distribuzioni relative allo stesso carattere rilevato su due o più popolazioni, occorre confrontare o le distribuzioni di frequenze relative o le distribuzioni di frequenze percentuali. Raggruppamento in classi Come abbiamo visto, il raggruppamento in classi si applica a caratteri sia quantitativi discreti che continui. Classi di diversa ampiezza Consideriamo Tab. 1. Effettuiamo il raggruppamento in classi, come si vede nella prima colonna della tabella che segue. Osserviamo che le classi non sono di uguale ampiezza. Allora aggiungiamo una colonna in cui riportiamo l ampiezza della classe che indichiamo con α i. Come si vede la seconda e la terza classe hanno ampiezza diversa (α 2 = 3 e α 3 = 5) quindi non ha senso confrontare le frequenze assolute (o relative o percentuali) di queste due classi. È necessario eliminare l effetto della 3
dimensione della classe; lo si fa calcolando la densità assoluta di ciascuna classe (H i ) che è data dal rapporto tra la frequenza assoluta della classe i e l ampiezza della classe i, cioè n i /α i. In questo modo troviamo H 2 = 2.3 e H 3 = 1.2 e quindi osserviamo che mentre le frequenze assolute e relative delle due classi sono molto vicine, le densità sono molto diverse cioè le unità sono molto più addensate nella seconda che nella terza classe. Ciò è del tutto ovvio visto che nella classe di minore ampiezza (3 6) ci sono più imprese di quante sono nella classe di ampiezza maggiore (6 11). È infine immediato calcolare anche le densità relative (o percentuali) che consentono di eliminare oltre all effetto dell ampiezza della classe anche quello della numerosità del collettivo qualora si voglia confrontare questa distribuzione con quella del Molise (una volta effettuato un eguale raggruppamento in classi). Classi di addetti n i f i Ampiezza della classe (α i ) Densità assoluta (H i ) Densità relativa (h i ) 0 3 5 0.25 3 1.7 0.08 3 6 7 0.35 3 2.3 0.12 6 11 6 0.30 5 1.2 0.05 11 2 0.1 2 1 0.05 totale 20 1 Tab. 3 Distribuzione in classi Indichiamo con c i-1 l estremo inferiore e con c i l estremo superiore della generica classe i; abbiamo introdotto le seguenti quantità: α i = (c i -c i-1 ): ampiezza classe i H i = n i /α i : densità assoluta della classe i h i = f i /α i = H i /N: densità relativa della classe i h i % = p i /α i = h i *100: densità percentuale della classe i Nelle distribuzioni in classi le frequenze sono quantità eterogenee in quanto dipendenti dall ampiezza delle classi. I rapporti tra ciascuna frequenza (assoluta o relativa) e l ampiezza della classe si chiamano densità ed esprimono correttamente l addensamento delle frequenze nelle varie classi. Importante: La densità rappresenta la frequenza che si avrebbe in un intervallino di ampiezza unitaria se all interno di una data classe le frequenze fossero uniformemente distribuite ovvero se ad ogni classe unitaria interna a ciascuna classe competesse lo stesso numero di unità. Le densità assolute consentono il confronto tra classi di una stessa distribuzione (solo Lazio); le densità relative (e percentuali) tra classi di distribuzioni diverse (Lazio e Molise). Classi di stessa ampiezza. L analisi è molto più semplice quando le modalità vengono raggruppate in classi di uguale ampiezza. In tal caso non è necessario calcolare le densità per confrontare le numerosità che competono a classi diverse. Qui di seguito è riportato un esempio di distribuzione in classi con classi di uguale ampiezza. 4
statura n i f i 160 170 4 0.25 170 180 8 0.5 180 190 3 0.1875 190 1 0.0625 totale 1 1.0 Una rappresentazione del tutto generale (ossia valida sia nel caso di classi di uguale ampiezza sia nel caso di classi di diversa ampiezza) di distribuzioni di frequenze di un carattere raggruppato in classi è la seguente X n i f i p i c 0 - c 1 n 1 f 1 p 1 c 1 c 2 n 2 f 2 p 2 c i-1 - c i n i f i p i c K-1 - c K n K f K p K Si noti che nel caso in cui le classi siano di ampiezza diversa si possono aggiungere le colonne relative all ampiezza della classe e alle densità. 5
DISTRIBUZIONI DI QUANTITÀ Le distribuzioni di quantità sono il risultato dell operazione di classificazione (che suddivide il collettivo in classi) e dell operazione di misurazione in ciascuna classe di un carattere quantitativo trasferibile. Con questa distribuzione si vede come l ammontare globale del carattere si distribuisce fra le varie classi. Consideriamo la Tab. 2 e diamo la distribuzione di quantità del carattere numero di addetti usando la divisioni in classi di Tab. 3 dove è riportata la distribuzione di frequenze. Classi di addetti Numero di addetti 0 3 2 5=10 3 6 3 3+4+5 3=28 6 11 6+8+9 2+10 2=52 11 11+15=26 totale 116 Tab. 4 Distribuzione di quantità Nota: Il carattere rispetto al quale si fa la classificazione può essere diverse da quello che viene misurato e poi sommato in ogni classe. SERIE STORICHE Un particolare tipo di distribuzione si ha quando il fenomeno rilevato varia nel tempo e noi siamo interessate a conoscere e studiare la sua evoluzione temporale (PIL, consumi, produzione, inflazione, vendite, nascite, incidenti stradali,...). In questo caso per ogni prefissato momento temporale si rileva l entità (intensità) del fenomeno oggetto di studio. Nell es. che segue le unità statistiche sono gli incidenti stradali verificatisi in Italia tra il 1987 e il 2001. Anno Incidenti 1987 3500 1988 3000...... 2001 2800 6
RAPPRESENTAZIONI GRAFICHE E difficile cogliere da una tabella tutte (o parte delle) informazioni in essa contenute. Un aiuto viene dalle rappresentazioni grafiche che, grazie al loro impatto visivo, sono generalmete di facile lettura e sono spesso memorizzabili. Ovviamente la rappresentazione grafica costituisce una sintesi delle informazioni contenute in una tabella, pertanto è una fonte di informazioni meno ricca della tabella di partenza. Per questo è consigliabile generalmente presentare insieme il grafico e la tabella da cui si è ricavato il grafico; in questo modo si potrà leggere l informazione più rilevante dal grafico mentre tutte gli altri chiarimenti e dettagli potranno essere estratti dalla tabella. Le sintesi grafiche consistono nel rappresentare graficamente una distribuzione di frequenza. Esistono molti tipi di rappresentazioni grafiche. In molti casi la scelta tra rappresentazioni possibili è dettata dal tipo di distribuzione che si sta analizzando e in particolar modo dal tipo di carattere che è stato rilevato. In termini molto generali, le rappresentazioni grafiche sono tanto più dettagliate, specifiche e capaci di contenere informazioni quanto più alto è il posto occupato dal carrattere nell graduatoria dei tipi di carattere (si ricordi che il posto più basso è occupato dai caratteri qualitativi sconnessi e il più alto dai quantitativi continui). Esistono rappresentazioni grafiche utilizzabili qualunque sia la natura del carattere. 7
Grafici per distribuzioni seconodo un carattere qualsiasi La rappresentazione grafica più usata per questo tipo di caratteri è il grafico a barre (verticali) o a nastri (orizzontali). Il grafico a barre ha - tante barre o nastri quante sono le modalità del carattere - l altezza delle colonne (nei grafici a barre verticali) o la lunghezza dei nastri (nei grafici a barre orizzontali) è proporzionale alla frequenza assoluta o relativa o percentuale. Esempio: Consideriamo la tabella seguente dove è riportata la distribuzione per nazione delle 500 maggiori compagnie di servizi del mondo. (Lista pubblicata annualmente dalla rivista Fortune) Nazione Numero di Compagnie Stati Uniti 135 Giappone 128 Germania 45 Gran Bretagna 42 Francia 33 Canada 18 Spagna 16 Italia 15 Svizzera 15 Altri 53 Totale 500 Certamente guardando questa distribuzione vediamo che la maggior parte di queste società si travono negli USA e in Giappone. A questo punto per cogliere meglio questo fatto può esesre utile fare un digramma a barre verticali (detto anche a colonne); eè riportato qui di seguito Distribuzione per nazione delle 500 maggiori compagnie di servizi del mondo 160 140 120 100 80 60 40 20 0 Stati Uniti Giappone Germania Gran Bretagna Francia Canada Spagna Italia Svizzera Altri 8
Una rappresentazione equivalente è data dal diagramma a nastri (o a barri orizzontali) che è qui di seguito. Notiamo che in questo grafico abbiamo anche inserito l informazione relativa alla frequenza assoluta cosa che consente di rendere più informativo il grafico disegnato. Avremmo potuto fare lo stesso anche nel grafico precedente. Distribuzione per nazione delle 500 maggiori compagnie di servizi del mondo Altri Svizzera Italia Spagna Canada Francia Gran Bretagna Germania Giappone Stati Uniti 15 15 16 18 33 42 45 53 128 135 0 20 40 60 80 100 120 140 160 Consideriamo un altro esempio Religione (Africa) n i f i Cristiani 317 0.48 Musulmani 269 0.41 Animisti 68 0.1 Altro 8 0.01 totale 662 1.000 9
Grafico a Nastri Altro Animisti Musulmani Cristiani 0 100 200 300 400 GRAFICO A TORTA Un altro tipo di grafico è: grafico a torta. Le fette di una torta circolare rappresentano le modalità del carattere e sono costruite in modo che la loro dimensione sia proporzionale alla corrispondente frequenza. Per costruire questo tipo di grafico, bisogna calcolare l angolo A i delle fette di torta. Questo si calcola usando la seguente proporzione n i : N = A i : 360. Equivalentemente, in termini di frequenza relativa, si può scrivere f i : 1 = A i : 360. In sostanza l angolo della fetta relativa alla i-esima modalità è dato dalla frazione di unità, con questa modalità, moltiplicata per 360, cioè A i = f i 360. 10
Qui di seguito si riporta prima il diagramma a torta relativo alla distribuzione per religione e poi quello relativo alla distribuzione 500 maggiori società di servizi. Come 68 8 269 317 Cristiani Musulmani Animisti Altro si può notare quando le modalità (in questo caso il numero di nazioni) è abbastanza grande (qui abbiamo 10 modalità), il diagramma a torta diviene difficilmente leggibile perche le fette sono troppo strette e si ha difficoltà a percepire visivamente differenze tra le frequenze assolute. Anche inserendo nel grafico l informazione (anche percentuale) comunque la lettura non è ottimale perchè il grafico è troppo fitto. In questo caso quindi è più consigliabile usare il diagramma a barre verticali o orizzontali; il confronto tra altezze di colonne o lunghezze di nastri è certamente più facile e immediato. Distribuzione per nazione delle 500 maggiori compagnie di servizi del mondo 11% 3% 3% 26% 3% 4% 7% 8% 9% 26% Stati Uniti Giappone Germania Gran Bretagna Francia Canada Spagna Italia Svizzera Altri 11
Grafici delle distribuzioni secondo un carattere quantitativo discreto non in classi I caratteri quantitativi discreti vengono rappresentati mediante un diagramma a pettine. Tale diagramma viene costruito a partire da un piano cartesiano: sull asse delle ascisse vengono poste le modalità del carattere mentre sull asse delle ordinate vengono poste le frequenze (assolute o relative o percentuali). Vediamo il seguente esempio. Esempio: nel maggio 2008, su una classe di 100 studenti iscritti al primo anno della Facoltà di Economia è stato rilevato il numero di esami sostenuti fino all inizio del III quadrimestre. I dati sono i seguenti Esami sostenuti n i 0 8 1 16 2 30 3 35 4 11 Tot 100 100 80 60 40 20 0 0 1 2 3 4 N..esami Il grafico viene costruito disegnando, in corrispondenza di ogni modalità, un segmento la cui altezza sia pari alla frequenza (assoluta o relativa o percentuale) di quella modalità nel collettivo. 12
Grafici delle distribuzioni secondo un carattere ordinato Questo tipo di rappresentazione vale per caratteri sia quantitativi sia qualitativi ordinati. Questa NON può essere usata per caratteri qualitativi sconnessi. Le modalità di un carattere ordinato hanno un ordine e una prima e ultima modalità. Il grafico usato per questi caratteri è l istogramma. Quando si cotruisce un istogramma si devono tenere distinti due casi: 1. Carattere qualitativo ordinato 2. Carattere quantitativo a) classi di stessa ampiezza. b) classi di ampiezza diversa. 13
1. Distribuzioni secondo caratteri qualitativi ordinati. In questo contesto, l istogramma è un grafico costituito da barre non distanziate con basi che rappresentano le modalità del carattere e altezze proporzionali alle frequenze (assolute, percentuali o relative) delle modalità. Per le modalità di questo carattere è possibile solo stabilire un ordinamento, pertanto per convenzione possiamo rappresentare le modalità come segmenti di lunghezza unitaria (base dei rettangoli = 1) e quindi l altezza dei rettangoli sarà esattamente corrispondente alla frequenza (assoluta, relativa o percentuale). Esempio1: Istogramma per un carattere qualitativo ordinato. Consideriamo la seguente distribuzione percentuale per titolo di studio. Titolo di studio Freq. Percentuali Nessuno 2 Lic Elementare 7 Lic. Media 14 Diploma 58 Laurea 16 Dottorato 3 Totale 100 Distribuzione per titolo di studio 70 60 50 40 30 20 10 0 Nessuno Lic Elementare Lic. Media Diploma Laurea Dottorato 14
2 a). Distribuzioni di caratteri quantitativi con modalità raggruppate in classi di uguale ampiezza. In questo caso la costruzione dell istogramma è uguale a quella vista per i caratteri qualitativi ordinati. Pertanto ancora l altezza dei rettangoli sarà pari alla frequenza (assoluta, relativa o percentuale) Esempio: si consideri la seguente distribuzione delle frequenze dei rendimenti percentuali a un anno realizzati da 59 fondi a capitalizzazione integrale. Rendimenti percentuali a un anno Numero di fondi n i 20 25 2 25 30 13 30 35 24 35 40 4 40 45 11 45 50 5 Totale 59 L istogramma è il seguente 25 20 15 10 5 0 20 25 30 35 40 45 50 Rendimenti percentuali a un 2 b). Distribuzioni di caratteri quantitativi con modalità raggruppate in classi di ampiezza diversa. Il caso è più complicato perchè ora le basi dei rettangolo sono diverse (visto che le classi hanno ampiezza diversa). In questo caso l istogramma si presenta come una serie di rettangoli dove l area di ciascun rettangolo è pari alla frequenza (assoluta, relativa o percentuale) della modalità cui si riferisce. Quindi ora l altezza del rettangolo è data dalla densità (assoluta, relativa o percentuale). 15
Ricordo che la densità assoluta della classe i = [c i-1, c i ) è data dal rapporto tra la frequenza assoluta e l ampiezza della classe, cioè H i = n i /α i. Pertanto operando così, è verificato che per ogni rettangolo si ha area = α i H i = n i = frequenza, dove α i = base del rettangolo e H i = altezza del rettangolo. Esempio: Aziende classificate per classe di reddito (miliardi) classi di reddito n i f i α i h i 0-5 10 0.167 5 0.033 5-20 5 0.083 15 0.006 20-50 20 0.333 30 0.011 50-100 25 0.417 50 0.008 totale 60 1.0 Istogramma 0.030 d e n s i t à 0.020 0.010 0.000 0 20 40 60 80 100 reddito 16
Vediamo come sarebbe venuto l istogramma se SBAGLIANDO avessi usato le frequenze invece delle densità. Come di può ben vedere confrontando il grafo che segue con quello sopra, avrei ottenuto una rappresentazione completamente distorta del fenomeno. 25 f r e q u e n z a 20 15 10 5 0 0 5 20 50 Reddito 100 17
Serie Storiche Consideriamo la seguente serie storica relativa all andamento del commercio con l estero della Francia tra il 1984 e il 1989. Anni Esportazioni Importazioni 1984 18,1 18,4 1985 21 21,5 1986 22,7 21,7 1987 24,6 23,8 1988 27,6 26,7 1989 31,4 30,8 Il grafico con cui rappresentiamo una serie storica è il seguente. Nel primo grafico abbiamo rappresentato la serie storica relativa alle sole esportazioni. Nel secondo grafico sono rappresentate contemporaneamente le due serie storiche. Esportazioni del Commercio con l'estero in Francia dal 1984 al 1989 Esportazioni (migliaia di miliardi) 35 30 25 20 15 10 5 0 1984 1985 1986 1987 1988 1989 Anni Esportazioni Esportazioni e importazioni del Commercio con l'estero in Francia dal 1984 al 1989 18 Esport. e Import. (migliaia di miliardi) 35 30 25 20 15 10 5 0 1984 1985 1986 1987 1988 1989 Anni Esportazioni Importazioni