Modellare le vendite di Lowe's
|
|
- Luigi Stella
- 5 anni fa
- Visualizzazioni
Transcript
1 Modellare le vendite di Lowe's La previsione delle vendite è ovviamente di cruciale importanza per le aziende. Anche se le successioni dei ricavi sono, chiaramente, casuali, ci si aspetta che, in alcuni settori, alcuni fattori economici generali abbiano un eetto rilevante sulla quantità di prodotti venduti. Un tale settore è rappresentato dall'oerta di materiale edile, per la quale la costruzione di case è una misura che ne guida gli acquisti. È possibile modellare le vendite della Società Lowe's (il secondo rivenditore al mondo di materiale per la casa e il 14-esimo rivenditore negli USA) come funzione di fattori economici generalmente disponibili legati all'industria delle case? I dati analizzati si riferiscono a 79 trimestri consecutivi, dal primo trimestre del 1983 al terzo trimestre del Siamo interessati a modellare le vendite trimestrali di Lowe, in milioni di dollari, come funzione del numero di case nuove (in milioni) e del tasso medio dei mutui. L'esame della distribuzione dei ricavi mostra che questa è asimmetrica a destra; poiché si tratta di una variabile legata ai soldi, è naturale considerare come variabile risposta il logaritmo (in base 10) delle vendite. Cioè stimeremo un modello semilogartmico. Istogramma delle Vendite Frequenze Vendite Osserviamo che le vendite sono in milioni di dollari, quindi le vendite trimestrali osservate arrivano no ai $7.5 miliardi. Di seguito sono i diagrammi di dispersione dei logaritmi delle vendite rispetto al numero di case nuove e al tasso dei mutui. Come ci si aspetta, c'è una relazione diretta con il numero di case nuove (più case nuove vuol dire una maggior oerta di costruzioni), e una relazione inversa con i tassi dei mutui (tassi più alti sono legati a minor acquisti di case, quindi con minor numero di restauri). Osserviamo inoltre in entrambi i graci evidenze di due distinti sottogruppi di dati, con relazioni tra le variabili apparentemente diverse. Il gruppo con vendite più basse che corrisponde agli anni '80 e quello con maggiori vendite corrispondente agli anni '90. 1
2 Numero di case nuove Logaritmo delle Vendite Tassi dei mutui Logaritmo delle Vendite C'è anche una forte relazione tra logaritmi delle vendite e tempo, che riette una crescita annuale proporzionale nelle vendite. Ancora una volta vediamo una forte evidenza che gli anni '80 e i '90 corrispondono a due diversi periodi. Perché succede questo? Diversamente da Home Depot, che era il leader di mercato nel settore del materiale per la casa (sia nelle città che nelle campagne), Lowe's negli anni '80 si è concetrato principalmente nel mercato rurale, con l'obiettivo di supportare le ditte locali Tempo Logaritmo delle Vendite Quando poi, negli anni '90, il settore del restauro delle case è divenuto di grande successo 2
3 con una crescita molto forte dei protti, Lowe's ha cambiato la sua strategia entrando in competizione in maniera più diretta con Home Depot. Di seguito presentiamo i risultati della stima di un modello dei logaritmi dei ricavi rispetto alle tre variabili esplicative: lm(formula = Log.Vendite ~ Case.nuove + Mutuo + Tempo) (Intercept) < 2e-16 *** Case.nuove < 2e-16 *** Mutuo e-05 *** Tempo < 2e-16 *** Residual standard error: on 75 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: 4924 on 3 and 75 DF, p-value: < 2.2e-16 La relazione è apparentemente molto forte. I coecienti possono essere interpretati come segue. Un aumento di un milione di case nuove in un trimestre è associato con un incremento di vendite del 25.5%, se tutto il resto rimane ssato ( = 1.255). Il coeciente per i tassi dei mutui è un po' strano, visto che è positivo; un incremento nei tassi dei mutui di un punto percentuale è associato ad un aumento nelle vendite del 3.6% ( = 1.036), quanto tutto il resto rimane sso. In realtà, questa variabile aggiunge molto poco alla capacità di adattamento del modello, visto che il modello senza questa variabile ha R 2 = Inne, date le altre variabili, c'è un 4.2% di aumento trimestrale nelle vendite ( = 1.042). Sfortunatamente, ci sono alcuni problemi con questo modello. C'è un'apparente struttura rimasta nei dati, legata a un eetto del tempo che avevamo notato in precedenza. Inoltre, è molto evidente che nel terzo trimestre le vendite sono sistematicamente inferiori rispetto al resto dell'anno. 3
4 Q Q Plot Normale Quantili campionari Residui Standardizzati Quantili teorici Tempo Q1 Q2 Q3 Q4 Possiamo cercare di arontare questi problemi del nostro modello aggiungendo due nuove variabili esplicative: Tempo 2, per cercare di cogliere l'eetto parabolico legato al tempo che si osserva nei residui, e una variabile indicatrice che identica il terzo trimestre. Ecco il riassunto dei risultati del nuovo modello di regressione: lm(formula = Log.Vendite ~ Case.nuove + Mutuo + Tempo + Tempo.2 + Q3)
5 (Intercept) 2.065e e < 2e-16 *** Case.nuove 9.386e e < 2e-16 *** Mutuo 5.174e e Tempo 1.428e e < 2e-16 *** Tempo e e e-06 *** Q e e e-09 *** Residual standard error: on 73 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: 6100 on 5 and 73 DF, p-value: < 2.2e-16 Ci aspettiamo una collinearità tra Tempo e Tempo 2, ma, ovviamente, non ci preoccupa. Apparentemente, adesso, non abbiamo bisogno dei tassi dei mutui, e quindi anche il coeciente positivo che avevamo incontrato nel modello precedente non rappresenta essere qualcosa di cui preoccuparci. Eliminiamo la variabile: lm(formula = Log.Vendite ~ Case.nuove + Tempo + Tempo.2 + Q3) (Intercept) 2.138e e < 2e-16 *** Case.nuove 9.349e e < 2e-16 *** Tempo 1.333e e < 2e-16 *** Tempo e e e-10 *** Q e e e-08 *** Residual standard error: on 74 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: 7457 on 4 and 74 DF, p-value: < 2.2e-16 Dato il tempo, e se siamo nel terzo trimestre, un milione di nuove case è associato a un incremento di vendite del 24%. Dato il tempo e il numero di nuove case, le vendite sono 7.7% inferiori nel terzo trimestre. Perch'e accade questo? Una prima giusticazione viene dal fatto che la prima parte dell'anno è la stagione in cui vengono costruite la maggior parte delle 5
6 case nel nord degli Stati Uniti; ma perché non si nota il calo anche nell'ultimo trimestre? In eetti c'è un'evidenza che nell'ultima triemstre di ogni anno Lowe's applica una serie di sconti su molti prodotti, così i suoi guadagni come percentuale delle vendite sono un terzo inferiori rispetto agli altri trimestri. Questo potrebbe, forse, riettere il desiderio di spingere le vendite per raggiungere gli obiettivi di ne anno, in modo da accontentare le previsioni degli analisti. L'eetto del tempo è invece un po' più complicato da descrivere, visto che presenta una relazione quadratica. Poiché il coeciente per Tempo 2 è positivo, osserviamo un aumento del tasso di crescita delle vendite nel tempo. Per esempio, mantenendo tutto il resto ssato, passando dal primo al secondo trimestre del 1983, le vendite aumentano del 3.1% ([(Tempo = 2) (Tempo = 2) ] [(Tempo = 1) (Tempo = 1) ] = , e = 1.031); dall'altra parte, ssando tutto il resto, se si passa dal primo al secondo trimestre del 2002 la crescita attesa associata è del 4.7% ([(Tempo = 78) (Tempo = 78) ] [(Tempo = 77) (Tempo = 77) ] = , e = 1.047). Così, se non cambiano le condizioni economiche, sembra che ci si possa aspettare che le vendite di Lowe's continuino a salire. Il modello sembra ora adattarsi piuttosto bene (sebbene i graci dei residui rispetto al numero di case nuove e al tempo nell'anno sembrano poter suggerire una varianza non costante(. Residui standardizzati Residui standardizzati Valori interpolati Tempo 6
7 Q Q Plot Normale Quantili campionari Residui standardizzati Quantili teorici Case.nuove Considerando che l'r 2 è così elevato, possiamo dire che usando il numero di case nuove e le variabili legate al tempo, possiamo prevedere le vendite di Lowe's in maniera molto accurata. Infatti, l'errore standard della stima s = implica che il 95% delle volte le vendite di Lowes sono previste al massimo circa il 9 10% sopra o sotto il loro vero valore ( = 0.912; = 1.096). Naturalmente, questi valori in termini di dollari si trasformano in ±$750 milioni, quindi non così poco! Potremmo seguire un'altro approccio nell'analizzare questi dati, dividendo le osservazioni in due gruppi, prima e dopo il 1990, seguendo i suggerimenti ottenuti dall-analisi dei diagrammi di dispersione originali. Possiamo fare questo usando i diversi modelli di cui abbiamo discusso nora. Ecco il riassunto dei risultati del modello complessivo: lm(formula = Log.Vendite ~ Case.nuove + Mutuo + Tempo + Q3 + G1980s + Case80s + Mutuo80s + Tempo80s + Q380s) (Intercept) < 2e-16 *** Case.nuove < 2e-16 *** Mutuo e-05 *** Tempo < 2e-16 *** Q e-11 *** G1980sTRUE e-07 *** Case80s Mutuo80s e-05 *** 7
8 Tempo80s e-10 *** Q380s ** Residual standard error: on 69 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: 4923 on 9 and 69 DF, p-value: < 2.2e-16 La presenza di diverse pendenze per il numero di case nuove non sembra essere supportato dai dati: lm(formula = Log.Vendite ~ Case.nuove + Mutuo + Tempo + Q3 + G1980s + Mutuo80s + Tempo80s + Q380s) (Intercept) < 2e-16 *** Case.nuove < 2e-16 *** Mutuo e-05 *** Tempo < 2e-16 *** Q e-11 *** G1980sTRUE e-08 *** Mutuo80s e-05 *** Tempo80s e-10 *** Q380s *** Residual standard error: on 70 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: 5599 on 8 and 70 DF, p-value: < 2.2e-16 La previsione delle vendite con questo modello sarà, il 95% delle volte approssimativamente all'interno di un intervallo di 7 8%. Il modello gracamente comprende due rette: per gli anni '80, LogVendite = [Numero di case nuove] Tempo e per gli anni successivi al [Tasso dei mutui] Q3, LogVendite = [Numero di case nuove] Tempo 8
9 [Tasso dei mutui] Q3, L'eetto delle case nuove è molto simile a quello nel modello quadratico, e l'eetto del terzo trimestre risulta più forte nel secondo periodo. In maniera consistente con le previsioni di crescita per il modello quadratico, il tasso di crescita annuale stimato per le vendite (date tutte le altre variabili) è stato del 3.2% nel primo periodo, e del 4.5% del secondo periodo, che descrivono chiaramente ottimi risultati per Lowe's. È interessante osservare che una simile analisi eettuata utilizzando i dati di vendita di Home Depot mostra un andamento opposto, con tassi decrescenti nell'ultimo periodo. Forse tali risultati tengono conto del fatto che le azioni di Home Depot hanno avuto una performance relativamente bassa nell-ultimo periodo in esame; il prezzo di Home Depot è calato di oltre il 50% da Giugno 2002 a Marzo 2003, mentre quello di Lowe's è calato solo (!) del 15%. È inne interessante osservare che dati utilizzati formano una serie storica, ovviamente, e anche se il graco dei residui standardizzati rispetto al tempo non sembra mostrare autocorrelazione, in realtà di fatto una qualche forma di autocorrelazione è presente nei residui. Non è tuttavia molto forte; se utilizzassimo qualche semplice rimedio basato sull'analisi delle serie storiche otterremmo solo una modesta modica dell'errore standard delle stime da a
0.1 Percorrenza e Cilindrata
0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliLaboratorio di Statistica Aziendale Modello di regressione lineare multipla
Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare
DettagliAnalisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura
Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono
DettagliEsercizio Dire quale variabile debba essere usata come regressore e quale sia la variabile risposta.
Esercizio 1 Il file elettr.txt contiene dei dati sui consumi in miliardi di kilowatt/ora (eleccons) e sul prodotto interno lordo in miliardi di dollari (gdp) su 30 paesi in un determinato anno. Il prodotto
DettagliLaboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT
Laboratorio 8 Regressione multipla 8.1 Analisi del dataset HOOK.DAT I dati contenuti nel file hook.dat, raccolti da Joseph Hooker sulle montagne dell Himalaya, riportano le temperature di ebollizione dell
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliEsercitazione su outliers e osservazioni influenti
Esercitazione su outliers e osservazioni influenti Quando si stima un modello di regressione è fondamentale identificare eventuali osservazioni influenti. Una osservazione si definisce influente se la
DettagliWord ha il vantaggio che possiamo salvare un po' di risultati, anche grafici
INTRODUZIONE. TABELLE, CORRELAZIONE E PLOT Usare un foglio txt (o word o simile) di appoggio Word ha il vantaggio che possiamo salvare un po' di risultati, anche grafici Copiare su R il comando A
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
DettagliFac-simile prova di esame
UNIVERSITÀ CA FOSCARI DI VENEZIA FACOLTÀ DI ECONOMIA Statistica Computazionale I Prof. Stefano Tonellato COGNOME.................................... NOME.................................... MATRICOLA....................................
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
DettagliRegressione. Monica Marabelli. 15 Gennaio 2016
Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione
DettagliParità del potere d'acquisto - è vera?
Parità del potere d'acquisto - è vera? Il principio della parità del potere d'acquisto (PPP) aerma che nel lungo periodo i tassi di cambio tendono a riprodurre le dierenze nel tasso di inazione tra le
DettagliLABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente
DettagliAnova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011
Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliSTATISTICA. Regressione-3 L inferenza per il modello lineare semplice
STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione
DettagliESERCITAZIONE REGRESSIONE MULTIPLA
ESERCITAZIONE REGRESSIONE MULTIPLA Dati delle Nazioni Unite del 2005 riferiti, per diverse nazioni, al tasso di feconditá (bambini per donna) (variabile Fert), alla percentuale di donne che usa contraccettivi
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliAnalisi di Regressione Multipla
Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliStatistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
- metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
DettagliRegressione lineare - ripasso
Regressione lineare - ripasso Quando parliamo di regressione cosa intendiamo? Il modello di regressione è caratterizzato dai seguenti aspetti: 1. siamo interessati a una particolare variabile che vorremmo
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliModelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione
Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare
DettagliRegressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume
DettagliAnalisi della varianza a due fattori
Laboratorio 11 Analisi della varianza a due fattori 11.1 Analisi del dataset PENICILLIN.DAT I dati contenuti nel file penicillin.dat, si riferiscono ad un esperimento di produzione di penicillina tendente
DettagliCorso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007
Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 007 Primo esercizio Per una certa stampante S 1, la probabilità che un generico foglio
DettagliCorso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti
Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Professor Paolo Vitale Anno Accademico 2017-8 UdA, Scuola d Economia Domanda 1 [6 punti]. (a) La multi-collineartità
DettagliLA REGRESSIONE LINEARE SEMPLICE
LA REGRESSIONE LINEARE SEMPLICE Se due variabili X e Y sono tra loro correlate, e sono entrambe su scala a intervalli o rapporti equivalenti, la tecnica statistica della regressione lineare consente di
DettagliDistribuzione esponenziale. f(x) = 0 x < 0
Distribuzione esponenziale Funzione densità f(x) = λe λx x 0 0 x < 0 Funzione parametrica (λ) 72 Funzione di densità della distribuzione esponenziale 1 0.9 0.8 0.7 λ=1 0.6 f(x) 0.5 0.4 0.3 λ=1/2 0.2 0.1
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliSTATISTICA. Regressione-2
STATISTICA Regressione-2 Fare sempre il grafico! Fig. 5.12 pg 178, Statistica di S. Iacus Fare sempre il grafico! y 0 2 4 6 8 10 =-1 =+0.79 outlier o dato influente 0 2 4 6 8 10 x Inferenza Il modello
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
Dettagli11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici
CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliSiete invitati a cambiare un po di parametri dell esercizio (es. aumentare Nrow; diminuire sig2; diminuire i coefficienti di X3 ed X4).
1. ALLINEAMENTO DI FATTORI, ESEMPI SINTETICI Esercizio. Creare una tabella con dati sintetici in cui sia percepibile il fenomeno dell allineamento ed esaminare le sue conseguenze. Consideriamo il modello
DettagliLaboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )
Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 05-6) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola
DettagliESERCITAZIONE ANCOVA
ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono
Dettaglilezione 8 AA Paolo Brunori
AA 2016-2017 Paolo Brunori regressione multipla con n = k Immaginate di voler studiare i determinanti del voto all esame di econometria Y = β 1 X 1 + u Y i = β 1 H i + u i H=ore studiate alla settimana
DettagliEsercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.
Esercizio 8 La Swiss Economic Research della Union Bank of Switzerland conduce un controllo periodico dei livelli dei prezzi e dei salari nella principali città del mondo. Una delle variabili rilevate
DettagliSperimentazioni di Fisica I mod. A Statistica - Lezione 2
Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi
Dettagli> cement <- read.table("i:/modelli/cement.dat", col.names=c("tempo", "resist")) > attach(cement)
Laboratorio 6 Analisi dei residui 6.1 Analisi dei dati CEMENT.DAT I dati riportati nel file cement.dat si riferiscono ad uno studio sulla resistenza del cemento alla tensione. La resistenza dipende, tra
DettagliIl Teorema del limite Centrale (TLC)
(TLC) Teorema. Sia X 1,..., X n un campione i.i.d. per una v.a. X, avente E(X ) = µ e Var(X ) = σ 2 entrambi finiti. Allora Z n = X µ σ 2 n n Y N(0, 1) Si noti che nel calcolare Z n ho standardizzato X.
DettagliLezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili
DettagliDipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini
Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2017/2018 Quartili e distribuzioni di frequenze Stanze Appartamenti
DettagliIndice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliAncora sulla regressione multipla
Laboratorio 9 Ancora sulla regressione multipla 9.1 Analisi del dataset HILLS.DAT I dati contenuti nel file hills.dat riguardano il record registrato in 35 corse campestri effettuate sulle montagne scozzesi,
Dettagli1. variabili dicotomiche: 2 sole categorie A e B
Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili
DettagliQuiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione
Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Le domande 1-6 si riferiscono al seguente problema Un data set contiene i dati sui consumi di diversi tipi di automobili e alcune loro
DettagliCognome, Nome e Numero di matricola:
Politecnico di Milano - Scuola di Ingegneria Industriale I Appello di Statistica per Ingegneria Energetica 9 luglio 0 c I diritti d'autore sono riservati. Ogni sfruttamento commerciale non autorizzato
DettagliPROBABILITÀ - SCHEDA N. 3 VARIABILI ALEATORIE CONTINUE E SIMULAZIONE
PROBABILITÀ - SCHEDA N. 3 VARIABILI ALEATORIE CONTINUE E SIMULAZIONE (da un idea di M. Impedovo Variabili aleatorie continue e simulazione Progetto Alice n. 15, ) 1. La simulazione Nelle schede precedenti
DettagliRegressione multipla
Regressione multipla La regressione multipla è l'ovvia generalizzazione della regressione semplice, quando abbiamo più di una variabile esplicativa. Il modello è del tipo y i = β 0 + β x i +... + β p x
DettagliLa previsione delle vendite dei lm
La previsione delle vendite dei lm L'industria cinematograca è un business con un alto prolo e un'elevata variabilità nei ricavi. Nel 2005, gli americani hanno speso 8.8 miliardi di dollari di biglietti
DettagliLABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE
LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare
Dettagli05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:
esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliTempi delle esecuzioni immobiliari: gli effetti delle riforme Silvia Giacomelli - Banca d Italia
Tempi delle esecuzioni immobiliari: gli effetti delle riforme Silvia Giacomelli - Banca d Italia Obiettivo dello studio Analisi degli esiti delle procedure esecutive immobiliari e delle durate (anche per
DettagliLezione Introduzione
Lezione 19 1 Introduzione In questa lezione vediamo il modello di allocazione della spesa. Questo modello spiega la relazione tra le diverse componenti del PIL. In particolare mostra come, nel lungo periodo,
DettagliSTATISTICA. Regressione-2
STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante
DettagliModelli con predittori qualitativi e modelli con interazioni
Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari
DettagliLEZIONE N.8 (a cura di Teresa Fanelli) Questa forma risulta importante nel modello di regressione con più variabili.
LEZIONE N.8 (a cura di Teresa Fanelli) Forma matriciale del Modello di Regressione Semplice L assunzione di base del modello è: Y i =β 0 +x i β 1 +ε i i=1,2,..n. Lo stesso modello può essere scritto attraverso
Dettagli7. STATISTICA DESCRITTIVA
7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole
DettagliAncova: il modello lineare in generale
Ancova: il modello lineare in generale Massimo Borelli May 9, 2014 Massimo Borelli () Ancova: il modello lineare in generale May 9, 2014 1 / 18 Contenuti 1 L analisi della covarianza la notazione di Wilkinson
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliValidazione dei modelli. Strumenti quantitativi per la gestione
Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l5-validazione.html#(1) 1/27 Validazione dei modelli In questo esempio
DettagliCURVE DI DURATA: Introduzione e Rappresentazione analitica
CURVE DI DURATA: Introduzione e Rappresentazione analitica Premesse Si definisce durata di una portata Q riferita ad una sezione di misura, l'intervallo di tempo in cui le portate naturali del corso d
DettagliDistribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliStima dei parametri di modelli lineari
Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle
DettagliLaboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
DettagliLaboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
DettagliTipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
DettagliStatistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
DettagliSTATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)
STATISTICA a.a. 2001-2002 (3 CFU) Federico M. Stefanini Dipartimento di Statistica G.Parenti viale Morgagni 59, 50134 Firenze, tel. 055-4237211 PARTE 5-3.12.2001 e.mail: stefanin@ds.unifi.it http://www.ds.unifi.it/ricerca/pagperson/docenti/stefanini.htm
DettagliANALISI ESPLORATIVA DI SERIE DI OSSERVAZIONI
IDROLOGIA Analisi esplorativa di serie di dati ANALISI ESPLORATIVA DI SERIE DI OSSERVAZIONI P Claps IDROLOGIA Analisi esplorativa di serie di dati Rappresentazione tabellare della serie storica Sequenza
DettagliRegressione semplice: come applicarla come interpretare i risultati
Regressione semplice: come applicarla come interpretare i risultati Questo materiale è utile ai fini dell esecuzione della regressione con software statistico. Questo materiale non è in alcun modo utile
DettagliUniversità degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliStudio di osservazione, perché non viene imposto nessun trattamento alle unità campionarie
ALCUNI ESERCIZI ASSEGNATI (3 e 6 crediti) NELLA SESSIONE DI LUGLIO CON RELATIVE SOLUZIONI ATTENZIONE I VALORI OTTENUTI NEI CALCOLI (OTTENUTI CON UN SOFTWARE STATISTICO) POSSONO DIFFERIRE DI POCO DA QUELLI
DettagliMinimi quadrati vincolati e test F
Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo
DettagliUniversità del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica
Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica Medica Le distribuzioni teoriche di probabilità La distribuzione Normale (o di
DettagliConfronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23
Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta
DettagliCognome e nome Tempo disponibile: 75 minuti
Corso di Laurea in Biotecnologia Statistica medica. A.A. 2010-2011 21 giugno 2011 Cognome e nome Tempo disponibile: 75 minuti 1. Immaginate di condurre uno studio sperimentale in cui si confronta l effetto
DettagliEsercitazione 1. 6 Marzo 2019
Esercitazione 1 6 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)
DettagliIndagine Sole 24 Ore-Banca d Italia sulle aspettative di inflazione
Indagine Sole 24 Ore-Banca d Italia sulle aspettative di inflazione Dicembre 1999 INDICE 1. Sintesi dei risultati...3 2. Nota metodologica...4 3. Indice delle tavole e delle figure...7 4. Appendice: il
DettagliCorso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio
Corso di Laurea: Diritto per le Imprese e le istituzioni a.a. 2016-17 Statistica Statistica Descrittiva 3 Esercizi: 5, 6 Docente: Alessandra Durio 1 Contenuti I quantili nel caso dei dati raccolti in classi
DettagliPresentazione dell edizione italiana
Presentazione dell edizione italiana Prefazione xiii xvii 1 Introduzione 1 1.1 Statistica e medicina.......................... 1 1.2 Statistica e matematica........................ 2 1.3 Statistica ed
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliTECNICHE DI SIMULAZIONE
TECNICHE DI SIMULAZIONE Analisi e scelta dei dati di input Francesca Mazzia Dipartimento di Matematica Università di Bari a.a. 2004/2005 TECNICHE DI SIMULAZIONE p. 1 Dati di input Per l esecuzione di una
DettagliPrefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura
INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliLE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
Dettagli