Soluzioni Capitolo

Transcript

1 Soluzioni Capitolo (a) Mantenendo costante l effetto di X 2, ci aspettiamo che per ogni unità addizionale di X 1 la variabile risposta Y aumenti in media di 5 unità. Mantenendo costante l effetto di X 1, ci aspettiamo che per ogni unità addizionale di X 2 la variabile risposta Y aumenti in media di 3 unità. (b) L intercetta b 0 rappresenta la parte di variabilità della Y non dovuta alle variabili esplicative X 1 e X 2. (c) Il 60% della variabilità di Y è spiegato dalla variabilità di X 1 e X (a) Ŷ i X 1i X 2i. (b) Per un dato valore della variabile MIDSOLE, ci aspettiamo che un aumento di una unità della variabile FOREIMP determini un aumento della variabile risposta LTIMP di unità. Per un dato valore della variabile FOREIMP, ci aspettiamo che un aumento di una unità della variabile MIDSOLE determini un aumento della variabile risposta LTIMP di unità. (c) r 2 Y ; 94.21% della variabilità della variabile risposta LTIMP può essere spiegata dalla variabilità delle variabili esplicative MIDSOLE e FOREIMP. (d) r 2 adj (a) Ŷ i X 1i X 2i dove X 1 pubblicità per radio e televisione (in migliaia di dollari) e X 2 pubblicità su giornali (in migliaia di dollari). (b) Mantenendo costante la pubblicità sui giornali, ci aspettiamo che per ogni aumento di $ 1000 della pubblicità per radio e per televisione le vendite aumentino di $ Mantenendo costante la pubblicità per radio e per televisione, ci aspettiamo che per ogni aumento di un $ 1000 della pubblicità sui giornali le vendite aumentino di $ (c) Ŷ i $ (d) r 2 Y ; 80.9% l 80.9% della variabilità delle vendite può essere spiegata dalla variabilità della spesa in pubblicità per radio e televisione e della spesa in pubblicità su giornali. (e) r 2 adj I grafici dei residui rispetto alla pubblicità per radio e televisione e rispetto alla pubblicità sui giornali rivelano la presenza di una relazione non lineare. Pertanto sarebbe opportuno inserire nel modello di regressione dei termini polinomiali in entrambe le variabili esplicative 13.8 (a) F F U 3.89 con 2 e 18 gradi di libertà. Si rifiuta H 0. Vi è una relazione lineare tra almeno una delle variabili indipendenti e la variabile dipendente Y. (b) La probabilità di ottenere un modello di regressione multipla in cui la statistica test F con 2 e 12 gradi di libertà assume un valore uguale o maggiore di quando l ipotesi nulla è vera è uguale a (p-value). 87

2 13.10 (a) F F U 3.52 con 2 e 19 gradi di libertà. Si rifiuta H 0. Vi è una relazione lineare significativa tra le vendite e la pubblicità per radio e televisione e tra le vendite e la pubblicità sui giornali. (b) Il p-value (o la probabilità di ottenere un modello di regressione multipla in cui la statistica test F con 2 e 19 gradi di libertà assume un valore uguale o maggiore di quando l ipotesi nulla è vera) è uguale a (a) L inclinazione della variabile risposta rispetto a X 2 è maggiore di quella rispetto a X 1. (b) (c) t 2.50 t con 22 gradi di libertà. Si rifiuta H 0. Vi è prova che la variabile X 1 dia un contributo significativo al modello in cui sia inserita come variabile esplicativa X 2. t 1.25 t Non si rifiuta H 0. Non vi è prova che la variabile X 2 dia un contributo significativo al modello in cui sia inserita come variabile esplicativa X 1. Solo la variabile X 1 dovrebbe essere inserita nel modello. Sebbene come osserviamo in (a) l inclinazione di Y rispetto a X 2 sia minore, la variabilità attorno a b 2 è maggiore. Pertanto X 1 contribuisce in maniera significativa al modello al contrario di X (a) (b) Per la variabile X 1 : t t con 12 gradi di libertà. Si rifiuta H 0. Per la variabile X 2 : t 8.43 t con 12 gradi di libertà. Si rifiuta H 0. Pertanto ciascuna variabile indipendente dà un contributo significativo al modello di regressione. Entrambe dovrebbero essere inserite (a) Per la variabile X 1 : F 5.25 F U 4.41 con 1 e 18 gradi di libertà. Si rifiuta H 0. Per la variabile X 2 : F 2.25 F U 4.41 con 1 e 18 gradi di libertà. Non si rifiuta H 0. Poiché in presenza della variabile X 1, la variabile X 2 non dà un contributo significativo al modello, solo X 1 dovrebbe essere inserita nel modello e si dovrebbe sviluppare un modello di regressione semplice. (b) r 2 Y Tenendo costante l effetto della variabile X 2, 22.58% il 22.58% della variabilità di Y può essere spiegata dalla variabilità di X 1. r 2 Y Tenendo costante l effetto della variabile X 2, il 11.11% della variabilità di Y può essere spiegata dalla variabilità di X (a) Per la variabile X 1 : F F U 4.38 con 1 e 19 gradi di libertà. Si rifiuta H 0. Per la variabile X 2 : F F U 4.38 con 1 e 19 gradi di libertà.. Si rifiuta H 0. Pertanto ciascuna variabile indipendente dà un contributo significativo al modello di regressione. Entrambe dovrebbero essere inserite. (b) r 2 Y Dato l ammontare della spesa in pubblicità sui giornali, il 74.42% della variabilità della vendite può essere spiegato dalla variabilità della pubblicità per radio e televisione. r 2 Y Dato l ammontare della spesa in pubblicità per radio e televisione, il 62.83% della variabilità della vendite può essere spiegato dalla variabilità della pubblicità sui giornali (a) Ŷ i 17 (b) t Poiché t 2.35, l effetto quadratico è significativo. (c) t Poiché t 1.17, l effetto quadratico non è significativo. (d) Ŷ i 5 88 SOLUZIONI

3 13.19 (b) Ŷ X 1i X1i 2 i (c) Ŷ i miglia per gallone. (d) L analisi dei residui rivela la presenza di una struttura. Il modello stimato dovrà essere usato con cautela. (e) F Si rifiuta H 0. Il modello complessivo è significativo. Il p-value = meno di (f) t Si rifiuta H 0. Il modello complessivo è significativo. Il p-value = meno di (g) r 2 Y.12 il 91.9% della variabilità delle miglia per gallone può essere spiegata dalla relazione lineare tra le miglia per gallone e la velocità in autostrada (a) Tenendo conto della variabile X 2, ci aspettiamo che per ogni aumento di un unità della variabile X 1, la variabile dipendente aumenti di 4 unità. (b) Tenendo conto della variabile X 1, ci aspettiamo che per ogni aumento di un unità della variabile X 2 la variabile dipendente aumenti di 2 unità. (c) t Si rifiuta H 0. L effetto polinomiale è significativo (a) Ŷ i X 1i 0.45X 2i, dove X 1 spazio sullo scaffale, X 2 0 se lo scaffale è dietro X 2 1 se lo scaffale è davanti. (b) Tenendo costante l effetto della posizione dello scaffale nella corsia, ci aspettiamo che per ogni piede addizionale di spazio sullo scaffale le vendite aumentino di dollari. Per un dato ammontare di spazio, ci aspettiamo che se lo scaffale è posizionato davanti le vendite aumentino di 0.45 dollari. (c) Ŷ i o $ (d) Il modello risulta adeguato alla luce dell analisi dei residui. (e) F Si rifiuta H 0. Vi è prova di una relazione lineare tra le vendite e le due variabili dipendenti. (f) t e t Pertanto ciascuna variabile esplicativa dà un contributo significativo e dovrebbe essere inclusa nel modello. (g) (h) L inclinazione in questo caso tiene conto dell effetto dell altro previsore, che non si prende in considerazione nell Esercizio 9.2 (i) r 2 Y ; 86.4% della variabilità delle vendite può essere spiegata dalla variabilità nello spazio sullo scaffale e nella posizione dello scaffale. (j) r 2 adj (k) r ; r 2 Y L inclusione della variabile posizione dello scaffale nella corsia dà luogo a un aumento. (l) r 2 Y Tenendo costante l effetto della posizione dello scaffale, l 83.4% della variabilità nelle vendite può essere spiegato dalla variabilità nello spazio sullo scaffale. r 2 Y Tenendo costante l effetto dello spazio sullo scaffale, il 56.9% della variabilità nelle vendite può essere spiegato dalla variabilità nella posizione dello scaffale (m) L inclinazione delle vendite rispetto allo spazio sullo scaffale è la stessa indipendentemente dall inclusione o meno della variabile dummy. (n) Ŷ i X 1i 0.75X 2i 0.024X 1i X 2i, dove X 1 spazio sullo scaffale, X 2 0 se lo scaffale è dietro X 2 1 se lo scaffale è davanti. t Non si rifiuta H 0. Non vi è prova che il termine di interazione dia un contributo significativo al modello. SOLUZIONI 89

4 (o) Si dovrebbero usare entrambe le variabili in (e) (a) Ŷ i X 1i X 2i, dove X 1 numero di stanze, X 2 0 se se la casa è a Est, X 2 1 se se la casa è a Ovest. (b) Tenendo costante l effetto dell area della città, ci aspettiamo che per ogni stanza in più, il prezzo di vendita aumenti di mila dollari. Per un dato numero di stanze, ci aspettiamo che il prezzo di vendita aumenti di mila dollari se la casa è a Ovest. (c) Ŷ i or $ 126,710. (d) Il modello risulta adeguato alla luce dell analisi dei residui. (e) F Si rifiuta H 0. Vi è prova di una relazione lineare tra le vendite e le due variabili dipendenti. (f) t e t Pertanto ciascuna variabile esplicativa dà un contributo significativo e dovrebbe essere inclusa nel modello. (g) VIF VIF e VIF Non vi è ragione di sospettare la presenza di multicollinearità (a) C p (b) C p supera di molto p 1 3, il numero dei parametri, pertanto questo modello non soddisfa le condizioni necessarie per poter essere incluso tra i modelli tra cui selezionare il migliore I valori del VIF sono rispettivamente uguali a 1.3, 1.0 e 1.2, pertanto non vi è prova di multicollinearità. La regressione stepwise seleziona un modello con il valore accertato e il periodo di vendita come variabili esplicative. Il C p per questo modello è, infatti, 2.8, minore o uguale a p 1. Il modello stimato è: Prezzo di vendita valore accertato periodo di vendita Il 95.9% della variabilità del prezzo di vendita può essere spiegato dalla variabilità del valore accertato e del periodo di vendita della casa. Mantenendo costante il periodo di tempo in cui le case sono vendute, ci aspettiamo che, se il valore accertato cresce di $ 1000, il prezzo di vendita cresca di $ Mantenendo costante il valore accertato, ci aspettiamo che il prezzo di vendita cresca di $ 507 per ogni periodo di tempo addizionale. Mantenendo costante il periodo di tempo in cui le case sono vendute, il 95.1% della variabilità del prezzo può essere spiegato dalla variabilità del valore accertato. Mantenendo costante il valore accertato, il 78.5% della variabilità del prezzo di vendita può essere spiegato dalla variabilità nel periodo di tempo in cui avvengono le vendite (a) Ŷ i X 1i X 2i dove X 1 la superficie riscaldata (in migliaia di piedi), X 2 età (in anni). (b) Mantenendo costante l effetto dell età, se la superficie riscaldata aumenta di 1000 piedi ci aspettiamo che il valore delle case aumenti di mila dollari. Mantenendo costante la superficie riscaldata, ci aspettiamo che per ogni anno in più il valore delle case diminuisca di mila dollari. 90 SOLUZIONI

5 (c) Ŷ i mila dollari (d) Il grafico dei residui Ŷ i evidenzia la presenza di una possibile struttura. Tuttavia gli altri grafici non danno la medesima indicazione, mentre uno dei valori sembra essere un outlier in tutti e quattro i grafici. (e) F F U 3.98 con 2 e 11 gradi di libertà. Si rifiuta H 0. Sussiste una relazione lineare tra almeno una delle variabili esplicative e la variabile dipendente Y. (f) Il p-value (o la probabilità di ottenere un modello di regressione multipla in cui la statistica test F con 2 e 11 gradi di libertà assume un valore uguale o maggiore di quando l ipotesi nulla è vera) è minore di (g) r 2 Y ; 87.0% della variabilità del valore accertato può essere spiegata dalla variabilità della superficie riscaldata e dalla variabilità dell età. (h) r 2 adj (i) t 5.06 t con 11 gradi di libertà. Si rifiuta H 0. Vi è prova che la variabile X 1 contribuisce in maniera significativa a un modello di regressione che includa la variabile X 2. t 5.27 t con 11 gradi di libertà. Si rifiuta H 0. Vi è prova che la variabile X 2 contribuisce in maniera significativa a un modello di regressione che includa la variabile X 1. Entrambe le variabili dovrebbero essere incluse nel modello. (j) Per la variabile X 1 il p-value è minore di La probabilità di ottenere un modello in cui la statistica test t differisce da 0 per più di 5.06, quando l ipotesi nulla, è vera è minore di (k) Tenendo conto dell età delle case, l inclinazione rappresenta l aumento del valore accertato che ci si aspetta se la superficie riscaldata aumenta di 1000 piedi al quadrato. Nell Esercizio 9.43 non si tiene conto dell effetto dell età. (l) r 2 Y Data l età della casa, il 69.97% della variabilità del valore accertato può essere spiegato dalla variabilità della superficie riscaldata. r 2 Y Data la superficie riscaldata, il 71.63% della variabilità del valore accertato può essere spiegata dalla variabilità dell età. (m) (m) No. L età dell età è un previsore del valore accertato leggermente migliore della superficie riscaldata (a) Ŷ i X 1i X 2i dove X 1 la lunghezza (in pollici), X 2 peso (in libbre). (b) Mantenendo costante l effetto del peso, ci aspettiamo che per ogni pollice in più di lunghezza, le miglia percorse per gallone diminuiscano di Mantenendo costante la lunghezza, ci aspettiamo che per ogni libbra in più di peso, le miglia percorse per gallone diminuiscano di (c) Ŷ i miglia per gallone. (d) Tutti i grafici dei residui confermano l adeguatezza del modello. (e) F F U 3.11 con 2 e 86 gradi di libertà. Si rifiuta H 0. Sussiste una relazione lineare tra Almeno una delle variabili esplicative e la variabile dipendente Y. (f) Il p-value (o la probabilità di ottenere un modello di regressione multipla in cui la statistica test F con 2 e 86 gradi di libertà assume un valore uguale o maggiore di quando l ipotesi nulla è vera) è minore di (g) r 2 Y ; l 82.1% della variabilità delle miglia per gallone può essere spiegata dalla variabilità nella lunghezza e nel peso. SOLUZIONI 91

6 (h) r 2 adj (i) t 0.51 t con 86 gradi di libertà. Non si rifiuta H 0. Non vi è prova che la variabile X 1 contribuisca in maniera significativa a un modello che includa la variabile X 2. t 7.90 t con 86 gradi di libertà. Si rifiuta H 0. La variabile X 2 contribuisce in maniera significativa a un modello che includa la variabile X 1. Pertanto solo la variabile X 2, dovrebbe essere includa nel modello e un modello di regressione lineare semplice deve essere sviluppato. (j) Per la variabile X 1 il p-value è La probabilità di ottenere un modello in cui la statistica test t differisce da 0 per più di 0.51 quando l ipotesi nulla è vera è uguale a Per la variabile X 2 il p-value è minore di La probabilità di ottenere un modello in cui la statistica test t differisce da 0 per più di 7.90 quando l ipotesi nulla è vera è minore o uguale a (k) Tenendo conto dell effetto del previsore non significativo X 1 l inclinazione rappresenta la diminuzione delle miglia per gallone che ci si aspetta per ogni libbra addizionale di peso dell automobile. (l) r 2 Y Dato il peso, lo 0.3% della variabilità nelle miglia per gallone può essere spiegata dalla variabilità della lunghezza. r 2 Y Data la lunghezza, il 41.92% della variabilità nelle miglia per gallone può essere spiegata dalla variabilità del peso. Considerate il seguente modello di regressione lineare semplice in cui il peso viene impiegato per prevedere le miglia per gallone: Equazione di regressione: Ŷ i X 2i. Previsione: Ŷ i miles per gallon. Analisi dei residui: Entrambi i grafici dei residui evidenziano che il modello di regressione è adeguato. Test di significatività: Per la variabile X 2, t t con 87 gradi di libertà. Si rifiuta H 0. La variabile X 2 contribuisce in maniera significativa al modello p-value: La probabilità di ottenere un modello di regressione in cui la test t con 87 gradi di libertà è uguale o maggiore di è minore di R quadro: r ; l 82.0% della variabilità delle miglia per gallone può essere spiegata dalla variabilità del peso. Inclinazione: L inclinazione rappresenta la riduzione nelle miglia per gallone che ci si aspetta per ogni libbra addizionale di peso. 92 SOLUZIONI

7 ˆ ; t Capitolo (a) La proporzione di non conformi è maggiore (0.22) in corrispondenza del quinto giorno e più piccola (0.10) in corrispondenza del terzo giorno. (b) p 0.148; LCL 0.041; UCL (c) Non ci sono cause straordinarie di variazione: il processo è sotto controllo (a) p ; LCL ; UCL La proporzione di ritardi corrispondente al tredicesimo giorno si trova all esterno dei limiti di controllo. L analista deve investigare le possibili cause straordinarie di variazione. (b) p ; LCL ; UCL La situazione non cambia rispetto a quella descritta nel punto (a) 14.4 (a) p ; UCL Il limite di controllo inferiore non esiste. (b) Anche se non si assiste a situazioni fuori controllo la carta evidenzia un andamento sistematico (pattern) delle osservazioni nel tempo (a) p ; LCL ; UCL Anche se non si assiste a situazioni fuori controllo la carta evidenzia un andamento sistematico (pattern) delle osservazioni nel tempo (gli ultimi 8 punti si trovano tutti sopra la media e quasi tutti i precedenti al di sotto di questo valore). Prima di modificare il processo l analista dovrà investigare le cause alla base di questa sistematicità. (b) Una volta eliminate le cause di variazione alla base dell andamento sistematico delle osservazioni, l analista può tentare di migliorare il processo, per esempio attraverso l applicazione dei 14 punti di Deming (a) d (b) d (c) D 3 0 (d) D (e) A (a) R ; UCL LCL non esiste. Non vi sono punti al di fuori dei limiti di controllo e non si evidenzia alcun pattern nel diagramma R. X ; LCL 41.97; UCL Non vi sono punti al di fuori dei limiti di controllo e non si evidenzia alcun pattern nel diagramma X. (b) Il processo sembra sotto controllo (a) R e X Per il diagramma R, LCL e UCL Il processo sembra sotto controllo perché non ci sono punti al di fuori dei limiti superiore e inferiore e le osservazioni non evidenziano alcuna struttura particolare. Dal momento che il processo è sotto controllo, sta al management decidere di ridurne le cause ordinarie di variazione ricorrendo alla teoria dei 14 punti di Deming. SOLUZIONI 93