Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale) Grafici e distribuzioni univariate 1. Da un campione di 100 aziende agricole della provincia di Bologna è stata rilevata la classe di superficie (in migliaia di ettari) ottenendo i seguenti risultati: Classe di Numero di Superfici totali superficie (S) aziende (cioè ammontari) 0 1 33 15 1 5 43 110 5 10 12 85 10 50 10 250 50 100 2 140 a) Si rappresentino graficamente i dati nel modo che si ritiene più opportuno. b) Si determinino la classe modale e la classe mediana. c) Si calcolino la mediana e l indice di asimmetria λ d) Si costruisca il box-plot (si ricorda che min(s)=0 e max(s)=100) e si commenti. e) Si disegni la curva di Lorenz e si misuri la concentrazione 2. La seguente tabella riporta i furti commessi scoperti in un grande magazzino in un anno, a seconda del settore merceologico e dell età del colpevole. Settore Età 10 18 18 20 20-60 Abbigliamento 312 913 3367 Bigiotteria 710 377 208 Profumi 248 211 341 dire se (giustificando le risposte) a) la classe modale della distribuzione marginale dell età è A 10-18 B 18-20 C 20-60 D la distribuzione è bimodale b) la moda della distribuzione marginale del settore merceologico è A abbigliamento B bigiotteria C non si può calcolare D profumi c) la mediana della distribuzione marginale del settore merceologico è A abbigliamento B bigiotteria C non si può calcolare D la modalità corrispondente a funzione di ripartizione = 0,5 1
3. La seguente tabella rappresenta il numero di imprese secondo il settore economico (X) e il numero di addetti (Y): Y 0-10 10-50 50-100 X Industria 245 101 23 Agricoltura 46 4 2 Servizi 1034 39 1 a) Per le imprese con un numero di addetti fra 10 e 50, determinare, se possibile, la moda, la mediana e la media di X b) Per le imprese nel settore dell industria, determinare, se possibile, la moda, la mediana e la media della distribuzione di Y c) Scrivere e disegnare la funzione di ripartizione di Y per le imprese nel settore dell industria (cioè per X=Industria). d) Determinare la frequenza relativa delle imprese nel settore dell industria con: 1) meno di 40 addetti; 2) fra 50 e 80 addetti. e) Descrivere attraverso un indice opportuno la dipendenza fra X e Y. Commentare. 4. Su un campione di 60 istituti di credito è stato rilevato il numero di filiali presenti a Roma; di seguito si riporta la distribuzione in classi: Classe di numero Numero di di filiali (S) Istituti di credito Numero totale di filiali (cioè ammontari) 1 3 6 15 3 5 12 48 5 10 11 110 10 20 32 500 20 50 9 400 a) Scrivere e disegnare la funzione di ripartizione. Si individui graficamente la mediana (approssimativamente). b) Si determinino la classe modale e la mediana. c) Si calcoli l indice di asimmetria λ e si costruisca il box-plot e si commenti. d) Si disegni la curva di Lorenz e si misuri la concentrazione; si commenti il risultato. e) Si consideri ora la stessa distribuzione ma riferita a Viterbo Classe di numero di filiali (S) 1 3 3 5 5 10 10 20 20 50 Numero di istituti di credito 18 22 13 6 1 Confrontare la variabilità delle due distribuzioni. 5. La seguente tabella descrive la distribuzione di 110 aziende per fatturato mensile (in centinaia di migliaia di Euro) e per area geografica Fatturato (centinaia di migliaia di ) Area geografica 0-2 2-5 5-10 NORD 8 12 30 CENTRO 5 10 23 SUD e ISOLE 8 8 6 a) Qual è la frazione di aziende con fatturato superiore a 5 (centinaia di migliaia di Euro) su tutto il territorio nazionale? Con riferimento alla classe 5-10 (centinaia di migliaia di Euro) del carattere fatturato b) si misuri la concentrazione delle aziende per area geografica. Commentare. Con riferimento all area geografica NORD, c) costruire il box-plot 2
6. Considerate la seguente distribuzione di frequenze del carattere X X f i -1 0.1 0 f 2 1 f 3 Sapendo che la media di X è 0.2, determinare, se possibile, le frequenze relative f 2 e f 3 7. Un azienda rileva su un campione 15 famiglie il numero di volte che è stato acquistato il prodotto saponetta nell arco di 3 anni 18 14 21 27 3 8 14 17 28 33 40 36 39 20 12 a) Ricavare il valore mediano, i quartili e disegnare il box-plot. b) Sulle stesse famiglie è stato rilevato anche il numero di biglietti dell autobus acquistati nello stesso intervallo di tempo: 118 27 3 0 87 121 8 48 152 67 80 0 0 234 99 Si confronti la variabilità osservata nei due insiemi di dati mediante il calcolo del coefficiente di variazione. Commentare il risultato. 8. La tabella seguente riporta la distribuzione di un campione di 220 individui distinti per classi di età ed abitudini al fumo. Classi d età Fumatori Non Ex-fumatori Totale fumatori 15-25 25 30 2 57 26-35 21 35 12 68 36-50 16 32 23 71 51-70 10 28 36 74 72 125 73 270 Calcolare l indice opportuno per verificare se vi sia indipendenza tra età ed abitudine al fumo. Commentare. 9. La seguente tabella riporta le videocassette noleggiate in un anno, a seconda del tipo di film e dell età. Tipo di film Età preso a 15 20 21 29 30-60 noleggio Commedia 312 913 3367 Giallo 710 377 208 Fantascienza 248 211 341 dire se (giustificando le risposte) a) la classe modale della distribuzione marginale dell età è A 15-20 B 21-29 C 30-60 D la distribuzione è bimodale b) la moda della distribuzione marginale del tipo di film è 3
A commedia B giallo C non si può calcolare D fantascienza c) la mediana della distribuzione marginale del tipo di film è A commedia B giallo C non si può calcolare D fantascienza 4
Numeri indici 10. Con riferimento alla serie storica delle esportazioni di beni di lusso fra il 1990 e il 1994, si consideri la serie di numeri indice semplici a base mobile Anno 1990 1991 1992 1993 1994 i - 1,02 1,06 0,82 1,14 Dire se (giustificando le risposte): a) il numero indice a base fissa del 1991 in base 1992 (I 91/92 ) è pari a: A 0,94 B 0,95 C 1,06 D 1 b) il numero indice a base fissa del 1994 in base 1990 (I 94/90 ) è pari a: A 1,16 B 1,01 C 1,14 D non si hanno sufficienti informazioni c) l incremento medio annuo delle esportazioni dal 1990 al 1994 A 0,003 B 0,01 C 1,01 D nessuno di questi valori 11. Con riferimento alla serie storica degli investimenti fissi lordi nel settore industriale in Italia nel periodo 1995 e il 1999, si consideri la serie di numeri indice semplici a base mobile Anno 1995 1996 1997 1998 1999 i - 1,04 0,97 0.99 0.85 Dire se (giustificando le risposte): a) il numero indice a base fissa del 1995 in base 1997 (I 95/97 ) è pari a: b) il numero indice a base fissa del 1999 in base 1997 (I 99/97 ) è pari a: 12. Con riferimento alla serie storica del costo (per metro quadrato) dei beni immobili a Roma dal 1998 al 2002, si consideri la serie di numeri indice semplici a base mobile Anno 1998 1999 2000 2001 2002 i - 0.97 1.03 1.14 1.21 a) costruire la serie dei numeri indice semplici a base fissa (base=2000) b) dire se (giustificando le risposte) l incremento medio annuo del costo delle case dal 1998 al 2002 è pari a A 1.25 B 1.09 C 0.09 D 0.08 13. Con riferimento alla serie storica degli investimenti fissi lordi nel settore industriale in Italia nel periodo 1995 e il 1999, si consideri la serie di numeri indice semplici a base mobile Anno 1995 1996 1997 1998 1999 I - 1,04 0,97 0.99 0.85 Dire se (giustificando le risposte): 5
a) il numero indice a base fissa del 1995 in base 1997 (I 95/97 ) è pari a: A 0,99 B 0,96 C 1,01 D non si può calcolare b) il numero indice a base fissa del 1999 in base 1997 (I 99/97 ) è pari a: A 1,19 B 0,82 C 0,84 D non si hanno sufficienti informazioni 14. Con riferimento alla serie storica degli investimenti fissi lordi nel settore agricolo in Italia nel periodo 1996 e il 2000, si consideri la serie di numeri indice semplici a base mobile Anno 1996 1997 1998 1999 2000 i - 0,97 0,91 1,04 1,06 Dire se (giustificando le risposte): a) il numero indice a base fissa del 1996 in base 1999 (I 96/99 ) è pari a: A 0,97 B 0,92 C 1,09 D non si hanno sufficienti informazioni b) il numero indice a base fissa del 1999 in base 1998 (I 99/98 ) è pari a: A 0,96 B 1,04 C 0,95 D 1,05 6
Correlazione e regressione 15. In un indagine su 7 imprese agricole sono stati rilevati i seguenti dati sulla superficie (in ettari) X e sui profitti (in Euro) Y Superficie (X) 3 2 4 3 6 5 6 Profitto (Y) 27 26 29 28 33 29 31 b) Determinare la retta di regressione per esprimere il profitto (Y) in funzione della superficie (X). d) Ricavare la retta di regressione di X in funzione di Y senza ripercorrere tutti i calcoli effettuati nel punto b). e) Supponiamo per semplicità che 1Euro = 2000Lire. Senza rifare i calcoli trovare la covarianza tra profitti in Lire e superficie, e determinare il nuovo coefficiente angolare della retta di regressione di profitti in Lire rispetto a superficie. f) Sia Z=X/10, senza rifare i calcoli trovare la covarianza tra Z e Y, la varianza di Z e determinare il nuovo coefficiente angolare della retta di regressione di Y rispetto a Z 16. In 5 negozi sono stati rilevati la dimensione (in metri quadrati) e il fatturato medio giornaliero (euro) X: dimensione negozio (metri quadrati) 150 230 85 125 160 Y: fatturato medio giornaliero (euro) 450 570 230 350 490 b) Determinare la retta di regressione per esprimere il fatturato Y in funzione della dimensione del negozio X. d) Determinare la retta di regressione che esprime la dimensione del negozio X in funzione del fatturato -Y senza rifare tutti i calcoli. A quanto ammonta la devianza spiegata dal modello? e) Se i profitti (Z) sono i due terzi del fatturato Y, determinare la nuova retta di regressione fra Z e X senza rifare tutti i calcoli. Quali sono i profitti per un negozio di 375 metri quadrati? f) Se sul fatturato del singolo negozio si applica una tassa una tantum di 120 euro, determinare la nuova retta di regressione del fatturato tassato (V) sulla dimensione del negozio (X) senza rifare tutti i calcoli. 17. In un indagine su 6 imprese manifatturiere sono stati rilevati i seguenti dati sulla superficie dei magazzini X (in centinaia di mq) e sul valore delle scorte immagazzinate Y (in migliaia di Euro) Superficie (X) 2 3 6 9 8 8 Valore (Y) 35 42 110 190 175 150 b) Determinare la retta di regressione per esprimere il valore delle scorte (Y) in funzione della superficie di magazzino (X). d) Ricavare la retta di regressione di X in funzione di Y senza ripercorrere tutti i calcoli effettuati nel punto b). e) Senza rifare i calcoli, calcolare la covarianza tra le variabili U=X-7 e V=Y+2 e la retta di regressione di V ripetto a U. f) Sia Z=5X, senza rifare i calcoli trovare la covarianza tra Z e Y, la varianza di Z e determinare il nuovo coefficiente angolare della retta di regressione di Z rispetto a Y 7
18. In un indagine su 6 imprese manifatturiere sono stati rilevati i seguenti dati sulla superficie dei magazzini X (in centinaia di mq) e sul volume delle scorte immagazzinate Y (in decine di m 3 ) Superficie (X) 4 10 8 11 5 10 Volume (Y) 47 187 122 202 54 162 b) Determinare la retta di regressione per esprimere il valore delle scorte (Y) in funzione della superficie di magazzino (X). d) Ricavare la retta di regressione di X in funzione di Y senza ripercorrere tutti i calcoli effettuati nel punto b). e) Senza rifare i calcoli, calcolare la covarianza tra le variabili U=X+3 e V=Y-3 e la retta di regressione di V ripetto a U. f) Sia Z=X/2, senza rifare i calcoli trovare la covarianza tra Z e Y, la varianza di Z e determinare il nuovo coefficiente angolare della retta di regressione di Z rispetto a Y 19. Nel 1998 venne lanciato sul mercato un telefono cellulare di ultima generazione. La serie storica seguente presenta l evoluzione del prezzo (in centinaia di Euro) di questo telefono dal 1998 al 2002. Anno 1998 1999 2000 2001 2002 Prezzo (Y) 9 5 3 2 1.5 Si ponga come origine il 1997 (cioè in corrispondenza di 1998 porre X=1, ecc ) b) Determinare la retta di regressione (retta A) per esprimere il prezzo (Y) in funzione dell anno (X). Quale sarà il prezzo del telefono cellulare nel 2003? c) Sia V=Y-0.5 il prezzo al netto della rottamazione, senza rifare i calcoli trovare la covarianza tra X e V e determinare la retta di regressione di V rispetto a X. d) Determinare la retta di regressione (retta B) per esprimere il prezzo (Y) in funzione di 1/X. e) Considerate le rette A e B. Rappresentare su due grafici distinti le nuvole dei punti e le corrispondenti rette di regressione. Qual è la retta migliore tra A e B? Commentare. 20. In un indagine su 7 imprese agricole sono stati rilevati i seguenti dati sulla superficie (in ettari) X e sui rendimenti (in quintali) Y Superficie (X) 6 5 7 6 9 8 9 Rendimento (Y) 24 23 26 25 30 26 28 b) Determinare la retta di regressione per esprimere il rendimento (Y) in funzione della superficie (X). d) Ricavare la retta di regressione di X in funzione di Y senza ripercorre tutti i calcoli effettuati nel punto b). e) Sappiamo che 1quintale = 100Kg. Senza rifare i calcoli trovare la covarianza tra rendimenti in Kg e superficie, e detreminare il nuovo coefficiente angolare della retta di regressione di rendimenti in Kg rispetto a superficie. f) Sia Z=1+X/2, senza rifare i calcoli trovare la covarianza tra Z e Y, la varianza di Z e determinare il nuovo coefficiente angolare della retta di regressione di Y rispetto a Z 8
21. dati che seguono si riferiscono al peso (in quintali) e al consumo di benzina (in litri/10km) di 10 diverse macchine. Peso Consumo 10,37 2,86 10,85 3,03 11,3 3,12 11,75 3,57 11,95 3,45 13,27 3,85 13,72 4 14,42 4,35 14,67 4,35 14,87 4,54 a) Determinare la retta di regressione del consumo (Y) sulla variabile peso (X). In quale unità di misura è espressa l'intercetta della retta? b) Tracciare la retta di regressione sul grafico con la nuvola dei punti e dare una valutazione grafica (commentando) della bontà di adattamento della retta trovata. c) Si calcoli il coefficiente di determinazione della retta trovata. Commentare la bontà dell adattamento. d) In base alla retta di regressione individuata si preveda il consumo associato ad un peso pari a 15 quintali. e) Se il consumo fosse aumentato di una unità per tutte le 10 macchine, in quale modo dovrebbe essere modificata la retta di regressione? 22. In un indagine su 7 supermercati sono stati rilevati i seguenti dati sullo spazio sugli scaffali (in m) X e sulle vendite (in migliaia di Euro) Y Spazio (X) 3 2 4 3 6 5 6 Vendite (Y) 27 26 29 28 33 29 31 b) Determinare la retta di regressione per esprimere le vendite (Y) in funzione dello spazio (X). d) Ricavare la retta di regressione di X in funzione di Y senza ripercorrere tutti i calcoli effettuati nel punto b). e) Supponiamo per semplicità che 1Euro = 2000Lire. Senza rifare i calcoli trovare la covarianza tra vendite in Lire e spazi, e determinare il nuovo coefficiente angolare della retta di regressione delle vendite in Lire rispetto allo spazio. 9