Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa fino a quando non viene emesso lo scontrino). Questo tempo di attesa potrebbe dipendere dal numero dei clienti presenti all interno della struttura. In un grande supermercato vengono raccolte le informazioni relative al numero di clienti presenti nel supermercato e il tempo di attesa in fila alle casse (in minuti). I dati sono riportati nella tabella seguente: Giorno n. clienti Tempo Tempo Tempo Giorno n. clienti Giorno n. clienti di attesa di attesa di attesa 1 15 1,50 11 21 2,00 21 24 1,00 2 18 1,20 12 35 5,20 22 14 1,70 3 9 0,80 13 25 2,30 23 15 3,00 4 7 0,50 14 8 0,20 24 21 2,80 5 19 2,00 15 16 0,70 25 27 1,00 6 30 2,50 16 21 2,50 26 17 2,50 7 27 3,00 17 17 1,00 27 21 2,90 8 13 2,00 18 22 3,80 28 20 3,40 9 11 1,70 19 16 1,50 29 31 4,00 10 9 0,50 20 24 2,80 30 38 4,80 a) stimare la retta di regressione; b) Stimare il tempo di attesa se il numero di clienti presenti è 50; c) determinare l intervallo di confidenza del coefficiente di regressione ß con un livello di confidenza pari al 95%; d) verificare l esistenza di dipendenza del tempo di attesa dal numero di clienti presenti ad un livello di significatività del 5%. Soluzione 1 a) La retta di regressione stimata è, dove. I calcoli per stimare i due coefficienti sono riportati nella tabella che segue. 609 30 20,3 64,80 30 2,16 285,76 0,1285 2,160,1285 20,30,44855 2224,30 per cui la retta di regressione stimata è: 0,448550,1285 b) Il tempo di attesa quando il numero di clienti presenti è di 50 è: 0,448550,1285 505,98!"# 1
giorni n. clienti Tempo di attesa 1 15 1,50-5,30-0,66 3,498 28,09 1,48 0,00044 2 18 1,20-2,30-0,96 2,208 5,29 1,86 0,44158 3 9 0,80-11,30-1,36 15,368 127,69 0,71 0,00841 4 7 0,50-13,30-1,66 22,078 176,89 0,45 0,00237 5 19 2,00-1,30-0,16 0,208 1,69 1,99 0,00005 6 30 2,50 9,70 0,34 3,298 94,09 3,41 0,82116 7 27 3,00 6,70 0,84 5,628 44,89 3,02 0,00043 8 13 2,00-7,30-0,16 1,168 53,29 1,22 0,60504 9 11 1,70-9,30-0,46 4,278 86,49 0,97 0,53991 10 9 0,50-11,30-1,66 18,758 127,69 0,71 0,04338 11 21 2,00 0,70-0,16-0,112 0,49 2,25 0,06247 12 35 5,20 14,70 3,04 44,688 216,09 4,05 1,32587 13 25 2,30 4,70 0,14 0,658 22,09 2,76 0,21513 14 8 0,20-12,30-1,96 24,108 151,29 0,58 0,14424 15 16 0,70-4,30-1,46 6,278 18,49 1,61 0,82368 16 21 2,50 0,70 0,34 0,238 0,49 2,25 0,06253 17 17 1,00-3,30-1,16 3,828 10,89 1,74 0,54176 18 22 3,80 1,70 1,64 2,788 2,89 2,38 2,02094 19 16 1,50-4,30-0,66 2,838 18,49 1,61 0,01157 20 24 2,80 3,70 0,64 2,368 13,69 2,64 0,02711 21 14 1,00-6,30-1,16 7,308 39,69 1,35 0,12294 22 15 1,70-5,30-0,46 2,438 28,09 1,48 0,04880 23 21 3,00 0,70 0,84 0,588 0,49 2,25 0,56260 24 27 2,80 6,70 0,64 4,288 44,89 3,02 0,04874 25 17 1,00-3,30-1,16 3,828 10,89 1,74 0,54176 26 21 2,50 0,70 0,34 0,238 0,49 2,25 0,06253 27 20 2,90-0,30 0,74-0,222 0,09 2,12 0,60613 28 31 3,40 10,70 1,24 13,268 114,49 3,53 0,01813 29 38 4,00 17,70 1,84 32,568 313,29 4,43 0,18831 30 42 4,80 21,70 2,64 57,288 470,89 4,95 0,02186 Tot. 609 64,80 9,91988 c) L intervallo di confidenza è: Pr&# ',)*. /0/# ',)*. 112 Pr&0,12852,0484 0,595. /0/0,12852,0484 0,595. 10,95 2224,30 2224,30 Pr0,1027/0/0,15430,95 Con una confidenza del 95% il coefficiente di regressione è compreso tra 0,10 e 0,15. dove +, 4 5 *4 5 6 )* d) Il sistema d ipotesi è 7,78799 9 0,354 +, -0,3540,595 2
Il test è? Esercitazione n.6 0 < +,. : ; <:00 ; 8 :0>0 0,12850 10,185 0,595 @ 47,162 I valori soglia della T di Student con n-2 g.d.l. e 20,05 sono 2,0484 e + 2,0484; per cui, essendo il risultato del test esterno a detti valori soglia, rifiutiamo l ipotesi nulla e possiamo affermare che il tempo d attesa dipende dal numero dei clienti presenti nel supermercato (p-value=0,00000001). 3
Esercizio 2 Una azienda che produce DVD ha condotto un indagine per stabilire quale sia la relazione tra le vendite dei DVD e la spesa in pubblicità effettuata per ognuno di essi. I dai riportati nella tabella seguente si riferiscono ad un campione di 30 DVD relativi a film da poco usciti nelle sale cinematografiche, su cui sono rilevate le vendite (in migliaia di unità) e il budget destinato alla pubblicità (milioni di euro): DVD Spesa pubblicità Vendite DVD Spesa pubblicità Vendite DVD Spesa pubblicità Vendite 1 51,10 57,18 11 52,42 115,31 21 67,91 162,95 2 51,13 26,17 12 55,34 87,04 22 68,25 109,20 3 51,18 92,79 13 55,70 128,45 23 73,13 280,79 4 51,25 61,60 14 56,43 126,64 24 77,62 229,51 5 51,44 46,50 15 58,59 107,28 25 87,09 277,68 6 51,53 85,06 16 59,36 190,80 26 90,73 226,73 7 51,53 103,52 17 59,89 121,57 27 95,55 365,14 8 51,69 30,88 18 62,66 183,30 28 96,62 218,64 9 51,74 49,29 19 65,35 204,72 29 104,70 286,31 10 51,77 24,14 20 67,55 112,47 30 108,51 254,58 a) Stimare la retta di regressione; b) Interpretare il significato del coefficiente di regressione stimato; c) Predire le vendite dei DVD quando il budget ammonta a 75 milioni di euro; d) Fissato 20,05verificare se vi è una significativa relazione tra le variabili; e) Costruire un intervallo di confidenza al 95% per il coefficiente 0. Soluzione 2 a) La retta di regressione stimata è, dove. I calcoli per stimare i due coefficienti sono riportati nella tabella che segue. 1977,76 65,9 30 4366,24 145,5 30 39578,93 4,333 2,160,1285 20,3140,1203 9134,07 per cui la retta di regressione stimata è: 140,12034,333 b) Per ogni ulteriore milione investiti in pubblicità le vendite medie stimate di DVD aumenteranno di 4333,1 unità. c) Il tempo di attesa quando il numero di clienti presenti è di 75 è: 140,12034,333 75184.862,85 "!#à d) Il sistema d ipotesi è : ; <:00 ; 8 :0>0 Il test è 4
? Esercitazione n.6 0 < +,. 4,33310 8,65 47,87 @ 95,57 I valori soglia della T di Student con n-2 g.d.l. e 20,05 sono 2,0484 e + 2,0484; per cui, essendo il risultato del test esterno a detti valori soglia, rifiutiamo l ipotesi nulla e possiamo affermare che le vendite dipendono dalla spesa per la pubblicità (p-value=0,00000001). e) L intervallo di confidenza è: Pr&# ',)*. /0/# ',)*. 112 PrC4,33312,0484 47,87 @ /0/4,33312,0484 47,87 @ D0,95 9134,07 9134,07 Pr3,3070/0/5,35910,95 Con una confidenza del 95% il coefficiente di regressione è compreso tra 3,31 e 5,36. dove +, 4 5 *4 5 6 )* EF8GF 9 2291,23 +, 2291,2347,87 giorni n. clienti Tempo di attesa 1 51,10 57,18-14,83-88,36 1309,99 219,79 81,30 581,85 2 51,13 26,17-14,80-119,37 1766,14 218,90 81,43 3053,84 3 51,18 92,79-14,75-52,75 777,84 217,42 81,65 124,14 4 51,25 61,60-14,68-83,94 1231,87 215,37 81,95 414,18 5 51,44 46,50-14,49-99,04 1434,65 209,82 82,77 1315,86 6 51,53 85,06-14,40-60,48 870,65 207,23 83,16 3,59 7 51,53 103,52-14,40-42,02 604,91 207,23 83,16 414,33 8 51,69 30,88-14,24-114,66 1632,24 202,64 83,86 2806,68 9 51,74 49,29-14,19-96,25 1365,36 201,22 84,07 1209,98 10 51,77 24,14-14,16-121,40 1718,48 200,37 84,20 3607,77 11 52,42 115,31-13,51-30,23 408,28 182,39 87,02 800,25 12 55,34 87,04-10,59-58,50 619,26 112,05 99,67 159,62 13 55,70 128,45-10,23-17,09 174,76 104,56 101,23 740,72 14 56,43 126,64-9,50-18,90 179,47 90,16 104,40 494,75 15 58,59 107,28-7,34-38,26 280,66 53,81 113,76 41,95 16 59,36 190,80-6,57 45,26-297,14 43,10 117,09 5432,72 17 59,89 121,57-6,04-23,97 144,67 36,43 119,39 4,75 18 62,66 183,30-3,27 37,76-123,29 10,66 131,39 2694,41 19 65,35 204,72-0,58 59,18-34,05 0,33 143,05 3803,39 20 67,55 112,47 1,62-33,07-53,73 2,64 152,58 1608,91 21 67,91 162,95 1,98 17,41 34,55 3,94 154,14 77,60 22 68,25 109,20 2,32-36,34-84,48 5,40 155,61 2154,29 23 73,13 280,79 7,20 135,25 974,42 51,91 176,76 10822,25 24 77,62 229,51 11,69 83,97 981,99 136,77 196,22 1108,52 25 87,09 277,68 21,16 132,14 2796,67 447,94 237,25 1634,58 26 90,73 226,73 24,80 81,19 2013,86 615,27 253,02 691,30 27 95,55 365,14 \29,62 219,60 6505,54 877,62 273,91 8323,24 28 96,62 218,64 30,69 73,10 2243,74 942,16 278,54 3588,57 5
29 104,70 286,31 38,77 140,77 5458,26 1503,47 313,56 742,35 30 108,51 254,58 42,58 109,04 4643,38 1813,45 330,07 5698,03 Tot. 1977,76 4366,24 0,00 0,00 39578,93 9134,07 64154,42 Esercizio 3 Supponete che un azienda produttrice di beni di largo consumo intenda valutare l efficacia di diversi tipi di pubblicità nella promozione dei suoi prodotti. A tale scopo si prendono in considerazione due tipi di pubblicità: la pubblicità per radio e televisione e la pubblicità sui giornali. Un campione di 12 città con approssimativamente la medesima popolazione viene sottoposto a un test per un mese: in ciascuna città viene allocato un dato livello di spesa per la pubblicità mediante radio e televisione e per quella sui giornali e si raccolgono i dati relativi alle vendite dei prodotti. Nella seguente tabella si riportano i dati raccolti per un mese in relazione all ammontare della spesa per la pubblicità mediante radio e televisione, di quella su giornali e alle vendite dei prodotti. Città Vendite Pubblicità per radio e Pubblicità su giornali ( *1000) televisione ( *1000) ( *1000) 1 973 0 40 2 875 25 25 3 910 30 30 4 1177 35 35 5 882 40 25 6 1628 45 45 7 1044 50 0 8 1329 55 25 9 1405 60 30 10 1521 65 35 11 1741 75 35 12 1717 70 40 a) Costruire un intervallo di confidenza del 99% per l inclinazione delle vendite rispetto alle spese di pubblicità per radio e televisione; b) Per un livello di significatività del 5%, verificate se sussiste una relazione lineare tra il volume delle vendite e le spese per la pubblicità per radio e televisione; c) Costruire un intervallo di confidenza del 90% per l inclinazione delle vendite rispetto alle spese di pubblicità su giornali; d) Per un livello di significatività del 5%, verificate se sussiste una relazione lineare tra il volume delle vendite e le spese per la pubblicità su giornali. Soluzione 3 a) Preliminarmente bisogna stimare la retta di regressione delle vendite (Y) rispetto alle spese di pubblicità per radio e televisione (X): I calcoli sono riportati nella tabella seguente: 6
Pubblicità città per radio e vendite televisione 1 0 973-45,83-293,83 13467,36 2100,69 708,86 69768,02 2 25 875-20,83-391,83 8163,19 434,03 1013,21 19102,21 3 30 910-15,83-356,83 5649,86 250,69 1074,08 26922,30 4 35 1177-10,83-89,83 973,19 117,36 1134,95 1768,24 5 40 882-5,83-384,83 2244,86 34,03 1195,82 98482,37 6 45 1628-0,83 361,17-300,97 0,69 1256,69 137872,28 7 50 1044 4,17-222,83-928,47 17,36 1317,56 74833,90 8 55 1329 9,17 62,17 569,86 84,03 1378,43 2443,06 9 60 1405 14,17 138,17 1957,36 200,69 1439,30 1176,26 10 65 1521 19,17 254,17 4871,53 367,36 1500,17 434,05 11 75 1741 29,17 474,17 13829,86 850,69 1621,90 14183,63 12 70 1717 24,17 450,17 10879,03 584,03 1561,04 24324,91 Tot. 550 15202 0,00 0,00 61367,67 5041,67 471311,23 Quindi: per cui la retta di regressione stimata è: 550 12 45,8 15202 12 1266,8 61367,67 5041,67 12,17 ; 1266,812,17 45,8708,87 L intervallo di confidenza è: 708,8712,71 PrI# ',)*. /0/# ',)*. J12 La varianza dei residui è: +, 471311,23 47131,123 + 2 10, -47131,123217,097 PrI12,713,169 217,097. /0/12,713,169 217,097. J0,99-5041,67-5041,67 Pr3,0208/0/22,39920,99 Con una confidenza del 99% il coefficiente di regressione è compreso tra 3,02 e 22,4. b) Il sistema d ipotesi è 7
Il test è? Esercitazione n.6 0 < +,. : ; <:00 ; 8 :0>0 12,710 4,15 217,097 @ 71,005 I valori soglia della T di Student con n-2 g.d.l. e 20,05 sono 2,228 e + 2,228; per cui, essendo il risultato del test esterno a detti valori soglia, rifiutiamo l ipotesi nulla e possiamo affermare che sussiste una relazione lineare tra il volume delle vendite e le spese per la pubblicità per radio e televisione (pvalue=0,0009). c) Preliminarmente bisogna stimare la retta di regressione delle vendite (Y) rispetto alle spese di pubblicità su giornali (X): I calcoli sono riportati nella tabella seguente: città Pubblicità su giornali vendite 1 40 973 9,58-293,83-2815,90 91,84 1399,76 182127,33 2 25 875-5,42-391,83 2122,43 29,34 1191,70 100298,08 3 30 910-0,42-356,83 148,68 0,17 1261,05 123238,73 4 35 1177 4,58-89,83-411,74 21,01 1330,41 23534,25 5 25 882-5,42-384,83 2084,51 29,34 1191,70 95913,30 6 45 1628 14,58 361,17 5267,01 212,67 1469,12 25243,23 7 0 1044-30,42-222,83 6777,85 925,17 844,92 39631,40 8 25 1329-5,42 62,17-336,74 29,34 1191,70 18851,64 9 30 1405-0,42 138,17-57,57 0,17 1261,05 20720,52 10 35 1521 4,58 254,17 1164,93 21,01 1330,41 36325,02 11 35 1741 4,58 474,17 2173,26 21,01 1330,41 168585,16 12 40 1717 9,58 450,17 4314,10 91,84 1399,76 100638,81 Tot. 365 15202 0,00 0,00 20430,83 1472,92 935107,49 Quindi: per cui la retta di regressione stimata è: 365 12 30,4 15202 12 1266,8 61367,67 5041,67 13,87 ; 1266,813,87 30,4844,92 L intervallo di confidenza è: 844,9213,87 8
PrI# ',)*. /0/# ',)*. J12 La varianza dei residui è: +, 935107,49 93510,749 + 2 10, -93510,749305,79 PrI13,871,812 305,80. /0/13,871,812 305,80. J0,90 1472,92 1472,92 Pr0,56776/0/28,307760,90 Con una confidenza del 90% il coefficiente di regressione è compreso tra -0,57 e 28,31. d) Il sistema d ipotesi è Il test è? 0 < +,. : ; <:00 ; 8 :0>0 13,870 1,74 305,795 @ 38,379 I valori soglia della T di Student con n-2 g.d.l. e 20,05 sono 2,228 e + 2,228; per cui, essendo il risultato del test interno a detti valori soglia, accettiamo l ipotesi nulla e possiamo affermare che non sussiste una relazione lineare tra il volume delle vendite e le spese per la pubblicità su gionali (pvalue=0,056242). Esercizio 4 Il manager di una catena di supermercati intende verificare se lo spazio destinato a una certa tipologia di prodotto influisce sulle vendite. A tale scopo su un campione casuale di 10 supermercati si ottengono i seguenti risultati: Supermercati Spazio sullo Vendite settimanali scaffale ( in metri) ( in euro) 1 5 160 2 5 220 3 10 190 4 10 260 5 15 230 6 15 270 7 15 280 8 20 260 9 20 290 10 20 310 a) Stimare la retta di regressione; b) Interpretare il significato del coefficiente di regressione; c) Stimare quali potrebbero essere le vendite settimanali del prodotto nel caso in cui lo spazio sullo scaffale è pari a 12 metri, 18 metri e 24 metri; d) Costruire l intervallo di confidenza del coefficiente di regressione con un livello di confidenza pari al 98%; 9
e) Verificare al livello del 5% la relazione tra lo spazio e le vendite. Soluzione 4 a) La stima dei coefficienti retta di regressione delle vendite settimanali (Y) rispetto allo spazio sullo scaffale (X) : I calcoli sono riportati nella tabella seguente: superm ercato Spazio sullo scaffale vendite 1 5 160-8,50-87,00 739,50 72,25 192,07 1028,24 2 5 220-8,50-27,00 229,50 72,25 192,07 780,30 3 10 190-3,50-57,00 199,50 12,25 224,38 1182,00 4 10 260-3,50 13,00-45,50 12,25 224,38 1268,77 5 15 230 1,50-17,00-25,50 2,25 256,69 712,58 6 15 270 1,50 23,00 34,50 2,25 256,69 177,04 7 15 280 1,50 33,00 49,50 2,25 256,69 543,16 8 20 260 6,50 13,00 84,50 42,25 289,01 841,48 9 20 290 6,50 43,00 279,50 42,25 289,01 0,98 10 20 310 6,50 63,00 409,50 42,25 289,01 440,65 Tot. 135 2470 0,00 0,00 1955,00 302,50 6975,21 Quindi: per cui la retta di regressione stimata è: 135 10 13,5 2470 10 247 1955 302,5 6,46 ; 24713,5 6,46159,75 159,756,46 b) All aumentare di 1 metro lo spazio sullo scaffale, si stima che le vendite aumentino in media di 6,46 euro. c) Le stime delle vendite settimanali del prodotto, nel caso in cui lo spazio sullo scaffale sia pari a 12 metri, 18 metri e 24 metri, sono: 8 159,756,46 12237,27 89 159,756,46 18276,03 159,756,46 24313,79 L intervallo di confidenza è: F PrI# ',)*. /0/# ',)*. J12 10
La varianza dei residui è: +, 2 Esercitazione n.6 6975,21 8 871,9 +, -871,929,5 PrI6,462,896 29,5. /0/6,462,896 29,5. J0,98-302,5-302,5 Pr1,54616/0/11,3790,98 Con una confidenza del 98% il coefficiente di regressione è compreso tra 1,5 e 11,4. d) Il sistema d ipotesi è Il test è? 0 < +,. : ; <:00 ; 8 :0>0 6,460 3,8067 29,5 @ 17,39 I valori soglia della T di Student con n-2 (8) g.d.l. e 20,05 sono 2,306 e + 2,306; per cui, essendo il risultato del test esterno a detti valori soglia, rifiutiamo l ipotesi nulla e possiamo affermare che sussiste una relazione lineare tra il volume delle vendite e spazio sullo scaffale (p-value=0,001734). 11