Soluzioni Capitolo
|
|
- Gianluigi Mauro
- 5 anni fa
- Visualizzazioni
Transcript
1 Soluzioni Capitolo (a) Mantenendo costante l effetto di X 2, ci aspettiamo che per ogni unità addizionale di X 1 la variabile risposta Y aumenti in media di 5 unità. Mantenendo costante l effetto di X 1, ci aspettiamo che per ogni unità addizionale di X 2 la variabile risposta Y aumenti in media di 3 unità. (b) L intercetta b 0 rappresenta la parte di variabilità della Y non dovuta alle variabili esplicative X 1 e X 2. (c) Il 60% della variabilità di Y è spiegato dalla variabilità di X 1 e X (a) Ŷ i X 1i X 2i. (b) Per un dato valore della variabile MIDSOLE, ci aspettiamo che un aumento di una unità della variabile FOREIMP determini un aumento della variabile risposta LTIMP di unità. Per un dato valore della variabile FOREIMP, ci aspettiamo che un aumento di una unità della variabile MIDSOLE determini un aumento della variabile risposta LTIMP di unità. (c) r 2 Y ; 94.21% della variabilità della variabile risposta LTIMP può essere spiegata dalla variabilità delle variabili esplicative MIDSOLE e FOREIMP. (d) r 2 adj (a) Ŷ i X 1i X 2i dove X 1 pubblicità per radio e televisione (in migliaia di dollari) e X 2 pubblicità su giornali (in migliaia di dollari). (b) Mantenendo costante la pubblicità sui giornali, ci aspettiamo che per ogni aumento di $ 1000 della pubblicità per radio e per televisione le vendite aumentino di $ Mantenendo costante la pubblicità per radio e per televisione, ci aspettiamo che per ogni aumento di un $ 1000 della pubblicità sui giornali le vendite aumentino di $ (c) Ŷ i $ (d) r 2 Y ; 80.9% l 80.9% della variabilità delle vendite può essere spiegata dalla variabilità della spesa in pubblicità per radio e televisione e della spesa in pubblicità su giornali. (e) r 2 adj I grafici dei residui rispetto alla pubblicità per radio e televisione e rispetto alla pubblicità sui giornali rivelano la presenza di una relazione non lineare. Pertanto sarebbe opportuno inserire nel modello di regressione dei termini polinomiali in entrambe le variabili esplicative 13.8 (a) F F U 3.89 con 2 e 18 gradi di libertà. Si rifiuta H 0. Vi è una relazione lineare tra almeno una delle variabili indipendenti e la variabile dipendente Y. (b) La probabilità di ottenere un modello di regressione multipla in cui la statistica test F con 2 e 12 gradi di libertà assume un valore uguale o maggiore di quando l ipotesi nulla è vera è uguale a (p-value). 87
2 13.10 (a) F F U 3.52 con 2 e 19 gradi di libertà. Si rifiuta H 0. Vi è una relazione lineare significativa tra le vendite e la pubblicità per radio e televisione e tra le vendite e la pubblicità sui giornali. (b) Il p-value (o la probabilità di ottenere un modello di regressione multipla in cui la statistica test F con 2 e 19 gradi di libertà assume un valore uguale o maggiore di quando l ipotesi nulla è vera) è uguale a (a) L inclinazione della variabile risposta rispetto a X 2 è maggiore di quella rispetto a X 1. (b) (c) t 2.50 t con 22 gradi di libertà. Si rifiuta H 0. Vi è prova che la variabile X 1 dia un contributo significativo al modello in cui sia inserita come variabile esplicativa X 2. t 1.25 t Non si rifiuta H 0. Non vi è prova che la variabile X 2 dia un contributo significativo al modello in cui sia inserita come variabile esplicativa X 1. Solo la variabile X 1 dovrebbe essere inserita nel modello. Sebbene come osserviamo in (a) l inclinazione di Y rispetto a X 2 sia minore, la variabilità attorno a b 2 è maggiore. Pertanto X 1 contribuisce in maniera significativa al modello al contrario di X (a) (b) Per la variabile X 1 : t t con 12 gradi di libertà. Si rifiuta H 0. Per la variabile X 2 : t 8.43 t con 12 gradi di libertà. Si rifiuta H 0. Pertanto ciascuna variabile indipendente dà un contributo significativo al modello di regressione. Entrambe dovrebbero essere inserite (a) Per la variabile X 1 : F 5.25 F U 4.41 con 1 e 18 gradi di libertà. Si rifiuta H 0. Per la variabile X 2 : F 2.25 F U 4.41 con 1 e 18 gradi di libertà. Non si rifiuta H 0. Poiché in presenza della variabile X 1, la variabile X 2 non dà un contributo significativo al modello, solo X 1 dovrebbe essere inserita nel modello e si dovrebbe sviluppare un modello di regressione semplice. (b) r 2 Y Tenendo costante l effetto della variabile X 2, 22.58% il 22.58% della variabilità di Y può essere spiegata dalla variabilità di X 1. r 2 Y Tenendo costante l effetto della variabile X 2, il 11.11% della variabilità di Y può essere spiegata dalla variabilità di X (a) Per la variabile X 1 : F F U 4.38 con 1 e 19 gradi di libertà. Si rifiuta H 0. Per la variabile X 2 : F F U 4.38 con 1 e 19 gradi di libertà.. Si rifiuta H 0. Pertanto ciascuna variabile indipendente dà un contributo significativo al modello di regressione. Entrambe dovrebbero essere inserite. (b) r 2 Y Dato l ammontare della spesa in pubblicità sui giornali, il 74.42% della variabilità della vendite può essere spiegato dalla variabilità della pubblicità per radio e televisione. r 2 Y Dato l ammontare della spesa in pubblicità per radio e televisione, il 62.83% della variabilità della vendite può essere spiegato dalla variabilità della pubblicità sui giornali (a) Ŷ i 17 (b) t Poiché t 2.35, l effetto quadratico è significativo. (c) t Poiché t 1.17, l effetto quadratico non è significativo. (d) Ŷ i 5 88 SOLUZIONI
3 13.19 (b) Ŷ X 1i X1i 2 i (c) Ŷ i miglia per gallone. (d) L analisi dei residui rivela la presenza di una struttura. Il modello stimato dovrà essere usato con cautela. (e) F Si rifiuta H 0. Il modello complessivo è significativo. Il p-value = meno di (f) t Si rifiuta H 0. Il modello complessivo è significativo. Il p-value = meno di (g) r 2 Y.12 il 91.9% della variabilità delle miglia per gallone può essere spiegata dalla relazione lineare tra le miglia per gallone e la velocità in autostrada (a) Tenendo conto della variabile X 2, ci aspettiamo che per ogni aumento di un unità della variabile X 1, la variabile dipendente aumenti di 4 unità. (b) Tenendo conto della variabile X 1, ci aspettiamo che per ogni aumento di un unità della variabile X 2 la variabile dipendente aumenti di 2 unità. (c) t Si rifiuta H 0. L effetto polinomiale è significativo (a) Ŷ i X 1i 0.45X 2i, dove X 1 spazio sullo scaffale, X 2 0 se lo scaffale è dietro X 2 1 se lo scaffale è davanti. (b) Tenendo costante l effetto della posizione dello scaffale nella corsia, ci aspettiamo che per ogni piede addizionale di spazio sullo scaffale le vendite aumentino di dollari. Per un dato ammontare di spazio, ci aspettiamo che se lo scaffale è posizionato davanti le vendite aumentino di 0.45 dollari. (c) Ŷ i o $ (d) Il modello risulta adeguato alla luce dell analisi dei residui. (e) F Si rifiuta H 0. Vi è prova di una relazione lineare tra le vendite e le due variabili dipendenti. (f) t e t Pertanto ciascuna variabile esplicativa dà un contributo significativo e dovrebbe essere inclusa nel modello. (g) (h) L inclinazione in questo caso tiene conto dell effetto dell altro previsore, che non si prende in considerazione nell Esercizio 9.2 (i) r 2 Y ; 86.4% della variabilità delle vendite può essere spiegata dalla variabilità nello spazio sullo scaffale e nella posizione dello scaffale. (j) r 2 adj (k) r ; r 2 Y L inclusione della variabile posizione dello scaffale nella corsia dà luogo a un aumento. (l) r 2 Y Tenendo costante l effetto della posizione dello scaffale, l 83.4% della variabilità nelle vendite può essere spiegato dalla variabilità nello spazio sullo scaffale. r 2 Y Tenendo costante l effetto dello spazio sullo scaffale, il 56.9% della variabilità nelle vendite può essere spiegato dalla variabilità nella posizione dello scaffale (m) L inclinazione delle vendite rispetto allo spazio sullo scaffale è la stessa indipendentemente dall inclusione o meno della variabile dummy. (n) Ŷ i X 1i 0.75X 2i 0.024X 1i X 2i, dove X 1 spazio sullo scaffale, X 2 0 se lo scaffale è dietro X 2 1 se lo scaffale è davanti. t Non si rifiuta H 0. Non vi è prova che il termine di interazione dia un contributo significativo al modello. SOLUZIONI 89
4 (o) Si dovrebbero usare entrambe le variabili in (e) (a) Ŷ i X 1i X 2i, dove X 1 numero di stanze, X 2 0 se se la casa è a Est, X 2 1 se se la casa è a Ovest. (b) Tenendo costante l effetto dell area della città, ci aspettiamo che per ogni stanza in più, il prezzo di vendita aumenti di mila dollari. Per un dato numero di stanze, ci aspettiamo che il prezzo di vendita aumenti di mila dollari se la casa è a Ovest. (c) Ŷ i or $ 126,710. (d) Il modello risulta adeguato alla luce dell analisi dei residui. (e) F Si rifiuta H 0. Vi è prova di una relazione lineare tra le vendite e le due variabili dipendenti. (f) t e t Pertanto ciascuna variabile esplicativa dà un contributo significativo e dovrebbe essere inclusa nel modello. (g) VIF VIF e VIF Non vi è ragione di sospettare la presenza di multicollinearità (a) C p (b) C p supera di molto p 1 3, il numero dei parametri, pertanto questo modello non soddisfa le condizioni necessarie per poter essere incluso tra i modelli tra cui selezionare il migliore I valori del VIF sono rispettivamente uguali a 1.3, 1.0 e 1.2, pertanto non vi è prova di multicollinearità. La regressione stepwise seleziona un modello con il valore accertato e il periodo di vendita come variabili esplicative. Il C p per questo modello è, infatti, 2.8, minore o uguale a p 1. Il modello stimato è: Prezzo di vendita valore accertato periodo di vendita Il 95.9% della variabilità del prezzo di vendita può essere spiegato dalla variabilità del valore accertato e del periodo di vendita della casa. Mantenendo costante il periodo di tempo in cui le case sono vendute, ci aspettiamo che, se il valore accertato cresce di $ 1000, il prezzo di vendita cresca di $ Mantenendo costante il valore accertato, ci aspettiamo che il prezzo di vendita cresca di $ 507 per ogni periodo di tempo addizionale. Mantenendo costante il periodo di tempo in cui le case sono vendute, il 95.1% della variabilità del prezzo può essere spiegato dalla variabilità del valore accertato. Mantenendo costante il valore accertato, il 78.5% della variabilità del prezzo di vendita può essere spiegato dalla variabilità nel periodo di tempo in cui avvengono le vendite (a) Ŷ i X 1i X 2i dove X 1 la superficie riscaldata (in migliaia di piedi), X 2 età (in anni). (b) Mantenendo costante l effetto dell età, se la superficie riscaldata aumenta di 1000 piedi ci aspettiamo che il valore delle case aumenti di mila dollari. Mantenendo costante la superficie riscaldata, ci aspettiamo che per ogni anno in più il valore delle case diminuisca di mila dollari. 90 SOLUZIONI
5 (c) Ŷ i mila dollari (d) Il grafico dei residui Ŷ i evidenzia la presenza di una possibile struttura. Tuttavia gli altri grafici non danno la medesima indicazione, mentre uno dei valori sembra essere un outlier in tutti e quattro i grafici. (e) F F U 3.98 con 2 e 11 gradi di libertà. Si rifiuta H 0. Sussiste una relazione lineare tra almeno una delle variabili esplicative e la variabile dipendente Y. (f) Il p-value (o la probabilità di ottenere un modello di regressione multipla in cui la statistica test F con 2 e 11 gradi di libertà assume un valore uguale o maggiore di quando l ipotesi nulla è vera) è minore di (g) r 2 Y ; 87.0% della variabilità del valore accertato può essere spiegata dalla variabilità della superficie riscaldata e dalla variabilità dell età. (h) r 2 adj (i) t 5.06 t con 11 gradi di libertà. Si rifiuta H 0. Vi è prova che la variabile X 1 contribuisce in maniera significativa a un modello di regressione che includa la variabile X 2. t 5.27 t con 11 gradi di libertà. Si rifiuta H 0. Vi è prova che la variabile X 2 contribuisce in maniera significativa a un modello di regressione che includa la variabile X 1. Entrambe le variabili dovrebbero essere incluse nel modello. (j) Per la variabile X 1 il p-value è minore di La probabilità di ottenere un modello in cui la statistica test t differisce da 0 per più di 5.06, quando l ipotesi nulla, è vera è minore di (k) Tenendo conto dell età delle case, l inclinazione rappresenta l aumento del valore accertato che ci si aspetta se la superficie riscaldata aumenta di 1000 piedi al quadrato. Nell Esercizio 9.43 non si tiene conto dell effetto dell età. (l) r 2 Y Data l età della casa, il 69.97% della variabilità del valore accertato può essere spiegato dalla variabilità della superficie riscaldata. r 2 Y Data la superficie riscaldata, il 71.63% della variabilità del valore accertato può essere spiegata dalla variabilità dell età. (m) (m) No. L età dell età è un previsore del valore accertato leggermente migliore della superficie riscaldata (a) Ŷ i X 1i X 2i dove X 1 la lunghezza (in pollici), X 2 peso (in libbre). (b) Mantenendo costante l effetto del peso, ci aspettiamo che per ogni pollice in più di lunghezza, le miglia percorse per gallone diminuiscano di Mantenendo costante la lunghezza, ci aspettiamo che per ogni libbra in più di peso, le miglia percorse per gallone diminuiscano di (c) Ŷ i miglia per gallone. (d) Tutti i grafici dei residui confermano l adeguatezza del modello. (e) F F U 3.11 con 2 e 86 gradi di libertà. Si rifiuta H 0. Sussiste una relazione lineare tra Almeno una delle variabili esplicative e la variabile dipendente Y. (f) Il p-value (o la probabilità di ottenere un modello di regressione multipla in cui la statistica test F con 2 e 86 gradi di libertà assume un valore uguale o maggiore di quando l ipotesi nulla è vera) è minore di (g) r 2 Y ; l 82.1% della variabilità delle miglia per gallone può essere spiegata dalla variabilità nella lunghezza e nel peso. SOLUZIONI 91
6 (h) r 2 adj (i) t 0.51 t con 86 gradi di libertà. Non si rifiuta H 0. Non vi è prova che la variabile X 1 contribuisca in maniera significativa a un modello che includa la variabile X 2. t 7.90 t con 86 gradi di libertà. Si rifiuta H 0. La variabile X 2 contribuisce in maniera significativa a un modello che includa la variabile X 1. Pertanto solo la variabile X 2, dovrebbe essere includa nel modello e un modello di regressione lineare semplice deve essere sviluppato. (j) Per la variabile X 1 il p-value è La probabilità di ottenere un modello in cui la statistica test t differisce da 0 per più di 0.51 quando l ipotesi nulla è vera è uguale a Per la variabile X 2 il p-value è minore di La probabilità di ottenere un modello in cui la statistica test t differisce da 0 per più di 7.90 quando l ipotesi nulla è vera è minore o uguale a (k) Tenendo conto dell effetto del previsore non significativo X 1 l inclinazione rappresenta la diminuzione delle miglia per gallone che ci si aspetta per ogni libbra addizionale di peso dell automobile. (l) r 2 Y Dato il peso, lo 0.3% della variabilità nelle miglia per gallone può essere spiegata dalla variabilità della lunghezza. r 2 Y Data la lunghezza, il 41.92% della variabilità nelle miglia per gallone può essere spiegata dalla variabilità del peso. Considerate il seguente modello di regressione lineare semplice in cui il peso viene impiegato per prevedere le miglia per gallone: Equazione di regressione: Ŷ i X 2i. Previsione: Ŷ i miles per gallon. Analisi dei residui: Entrambi i grafici dei residui evidenziano che il modello di regressione è adeguato. Test di significatività: Per la variabile X 2, t t con 87 gradi di libertà. Si rifiuta H 0. La variabile X 2 contribuisce in maniera significativa al modello p-value: La probabilità di ottenere un modello di regressione in cui la test t con 87 gradi di libertà è uguale o maggiore di è minore di R quadro: r ; l 82.0% della variabilità delle miglia per gallone può essere spiegata dalla variabilità del peso. Inclinazione: L inclinazione rappresenta la riduzione nelle miglia per gallone che ci si aspetta per ogni libbra addizionale di peso. 92 SOLUZIONI
7 ˆ ; t Capitolo (a) La proporzione di non conformi è maggiore (0.22) in corrispondenza del quinto giorno e più piccola (0.10) in corrispondenza del terzo giorno. (b) p 0.148; LCL 0.041; UCL (c) Non ci sono cause straordinarie di variazione: il processo è sotto controllo (a) p ; LCL ; UCL La proporzione di ritardi corrispondente al tredicesimo giorno si trova all esterno dei limiti di controllo. L analista deve investigare le possibili cause straordinarie di variazione. (b) p ; LCL ; UCL La situazione non cambia rispetto a quella descritta nel punto (a) 14.4 (a) p ; UCL Il limite di controllo inferiore non esiste. (b) Anche se non si assiste a situazioni fuori controllo la carta evidenzia un andamento sistematico (pattern) delle osservazioni nel tempo (a) p ; LCL ; UCL Anche se non si assiste a situazioni fuori controllo la carta evidenzia un andamento sistematico (pattern) delle osservazioni nel tempo (gli ultimi 8 punti si trovano tutti sopra la media e quasi tutti i precedenti al di sotto di questo valore). Prima di modificare il processo l analista dovrà investigare le cause alla base di questa sistematicità. (b) Una volta eliminate le cause di variazione alla base dell andamento sistematico delle osservazioni, l analista può tentare di migliorare il processo, per esempio attraverso l applicazione dei 14 punti di Deming (a) d (b) d (c) D 3 0 (d) D (e) A (a) R ; UCL LCL non esiste. Non vi sono punti al di fuori dei limiti di controllo e non si evidenzia alcun pattern nel diagramma R. X ; LCL 41.97; UCL Non vi sono punti al di fuori dei limiti di controllo e non si evidenzia alcun pattern nel diagramma X. (b) Il processo sembra sotto controllo (a) R e X Per il diagramma R, LCL e UCL Il processo sembra sotto controllo perché non ci sono punti al di fuori dei limiti superiore e inferiore e le osservazioni non evidenziano alcuna struttura particolare. Dal momento che il processo è sotto controllo, sta al management decidere di ridurne le cause ordinarie di variazione ricorrendo alla teoria dei 14 punti di Deming. SOLUZIONI 93
La regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
Dettaglis a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value
Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliEsercitazioni di Statistica Dott.ssa Cristina Mollica
Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma.it Regressione Esercizio. Siano dati i seguenti valori per le due variabili X ed Y: 4 5 3 5 3 3 Con riferimento al modello
Dettagli1. variabili dicotomiche: 2 sole categorie A e B
Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili
Dettagli5. Per determinare il miglior grado del polinomio di una regressione polimoniale
Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 16/01/2017 Matricola versione A Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliRICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliLa regressione lineare semplice
La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice
DettagliGiorno n. clienti di attesa
Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa
DettagliSTATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliCorrelazione e regressione
Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
DettagliRegressione semplice: come applicarla come interpretare i risultati
Regressione semplice: come applicarla come interpretare i risultati Questo materiale è utile ai fini dell esecuzione della regressione con software statistico. Questo materiale non è in alcun modo utile
DettagliMetodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione
Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università
DettagliStatistica descrittiva: analisi di regressione
Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
Dettaglilezione 10 AA Paolo Brunori
AA 2016-2017 Paolo Brunori Redditi svedesi - il dataset contiene i dati di reddito di 838 individui - il dataset contiene le variabili: sex = sesso age = età edu = anni di istruzione y_gross = reddito
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliSTATISTICA. Regressione-2
STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliSTIMA DELLA PIENA INDICE
STIMA DELLA PIENA INDICE STIMA LOCALE - Anche se basata su un numero molto limitato di osservazioni (5-6) STIMA REGIONALE 1) Metodi basati su regressioni rispetto a parametri morfo-climatici 2) Metodi
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliUniversità del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione
Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche Corso di Statistica Medica Correlazione Regressione Lineare Statistica Medica Correlazione e Regressione lineare
DettagliRegressione Lineare Multipla
Regressione Lineare Multipla Fabio Ruini Abstract La regressione ha come scopo principale la previsione: si mira, cioè, alla costruzione di un modello attraverso cui prevedere i valori di una variabile
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
Dettagli2) REGRESSIONE. 1) Creo un diagramma a dispersione per ispezionare i dati. 2) Selezionare in SPSS Analizza -> Regressione Lineare.
Si vogliono studiare gli effetti delle spese pubblicitarie sulle vendite di album nella prima settimana dopo il lancio. Si tiene conto di altre due variabili: la presenza sulle radio e l appeal della band.
DettagliRappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
DettagliLEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
DettagliSTIMA DELLA PIENA INDICE
STIMA DELLA PIENA INDICE 1) Metodi a base geomorfoclimatica (es. Formula razionale) 2) Metodi basati su regressioni rispetto a parametri morfo-climatici 1 Valutazione della piena media Formula razionale
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliMetodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi
Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA)
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliMetodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione
Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
DettagliB il suo coe ciente si interpreta come la variazione di Y dovuta alla variazione unitaria di X (0! 1)
Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 01/02/2017 Matricola Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso per passare
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliRegressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo
Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliFasi del modello di regressione
Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori
DettagliESERCIZIO 1. Di seguito vengono riportati i risultati di una regressione multipla effettuata secondo il metodo standard (o per blocchi )
ESERCIZIO. Di seguito vengono riportati i risultati di una regressione multipla effettuata secondo il metodo standard (o per blocchi ) a. b. Riepilogo del modello b R-quadrato Errore std. Durbin-W R R-quadrato
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliLM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione
LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliCAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
DettagliMetodi Quantitativi per Economia, Finanza e Management
Metodi Quantitativi per Economia, Finanza e Management Lezione n 9 Regressione lineare multipla: la valutazione del modello, multicollinearità, metodi automatici di selezione dei regressor, analisi di
DettagliArgomenti della lezione:
Lezione 9 Argomenti della lezione: La regressione multipla: Approcci analitici Regressione standard Regressione gerarchica Regressione statistica Strategie Analitiche per la regressione Tre principali
Dettagli11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici
CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57
DettagliCorrelazione e regressione
Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliConfronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23
Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta
DettagliEsercitazione del 16 maggio 2014
Esercitazione del 16 maggio 2014 Conclusione dell esercizio sul consumo annuo di energia elettrica della lezione precedente. Avevamo un campione di n=101 abitazioni di metratura confrontabile e per ciascuna
DettagliAnalisi di Regressione Multipla
Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliPolitecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011
Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliLa regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
DettagliS 2 p n X. + S2 p. n Y
ESERCIZIO 1 Attraverso un indagine effettuata su un campione di 83 pellicole cinematografiche, si verifichi, a livello 0.01, se vi sono differenze, in media, tra i budget dei film di produzione americana
DettagliEsercitazione 5 Sta/s/ca Aziendale
Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di
DettagliIndice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione
Indice Prefazione all edizione italiana, di Piero Veronese pag. IX Prefazione 1. EE: un introduzione alle distribuzioni di probabilità e ai metodi di stima statistica 1.1. EE: incertezza e probabilità
DettagliStatistica inferenziale
Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Statistica inferenziale 6/5/2005 Relazione tra dati Possono esistere in uno studio connessioni tra dati differenti che possono legare caratteristiche:
DettagliSettimana 3. G. M. Marchetti. Marzo 2017
Settimana 3 G. M. Marchetti Marzo 2017 1 / 26 Prima parte Relazioni tra variabili e regressione lineare 2 / 26 Una legge fisica approssimata Il fisico scozzese Forbes 3 / 26 L esperimento di Forbes Sulla
DettagliAnalisi della Regressione Lineare
Analisi della Regressione Lineare Master in Tecnologie Bioinformatiche 29/09/06 Adriano Decarli 1 29/09/06 Adriano Decarli 2 29/09/06 Adriano Decarli 3 29/09/06 Adriano Decarli 4 29/09/06 Adriano Decarli
DettagliLaboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT
Laboratorio 8 Regressione multipla 8.1 Analisi del dataset HOOK.DAT I dati contenuti nel file hook.dat, raccolti da Joseph Hooker sulle montagne dell Himalaya, riportano le temperature di ebollizione dell
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliESERCITAZIONE ANCOVA
ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliPsicometria con Laboratorio di SPSS 2
Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18
DettagliEsercitazione 9 del corso di Statistica (parte seconda)
Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione
DettagliMetodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni
DettagliRegressione e Correlazione (cap. 11) Importazione dati da file di testo
Regressione e Correlazione (cap. 11) Importazione dati da file di testo Introduzione Nella statistica applicata si osserva la relazione (dipendenza) tra due o più grandezze. Esigenza: determinare una funzione
DettagliLaboratorio di Statistica Aziendale Modello di regressione lineare multipla
Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare
DettagliLa multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.
Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3
DettagliEsercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliStatistica economica
Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati
DettagliAnalisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
DettagliVecchie prove d esame Statistica e Calcolo delle Probabilità
Vecchie prove d esame Statistica e Calcolo delle Probabilità Esercizio 1 (Esame 11 Gennaio 2005): Alla fine di una giornata di lavoro un intervistatore si accorge di aver perso i dati raccolti su un certo
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliAnalisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
DettagliSOLUZIONI DI ALCUNI ESERCIZI. Appello del
SOLUZIONI DI ALCUNI ESERCIZI Appello del 21-06- 2012 E stato osservato per un certo tempo un tipo di piccoli animali galleggianti (zooplankton- Daphnia magna) e si è notato che questi animali tendono ad
Dettagli1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione
Inferenza di Intervallo 1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione T = 300 K σ T = 50 a. Calcolare un
DettagliRegressione logistica
Regressione logistica Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 11 Consegna Lavoro di gruppo Scadenza per la consegna del lavoro di gruppo e dell homework facoltativo (per
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
Dettagli