Appunti per gli studenti. Modelli Quantitativi per il Marketing materiale delle lezioni di laboratorio

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Appunti per gli studenti. Modelli Quantitativi per il Marketing materiale delle lezioni di laboratorio"

Transcript

1 UNIVERSITÀ DI BOLOGNA FACOLTÀ DI ECONOMIA CORSO DI LAUREA IN ECONOMIA E MARKETING Appunti per gli studenti Modelli Quantitativi per il Marketing materiale delle lezioni di laboratorio VERSIONE PRELIMINARE Margherita Fort 1 Questa versione: Febbraio Università di Bologna, Facoltà di Economia. La versione 2010 della dispensa contiene materiale svilluppato da Tommaso Reggiani. Per segnalare imprecisioni o contribuire al miglioramento della dispensa contattare: Ufficio: Dipartimento di Scienze Economiche, Piazza Scaravilli 2, Bologna. tel:

2 1 Introduzione Questa dispensa raccoglie gli appunti relativi al laboratorio informatico del corso di Modelli Quantitativi per il Marketing, corso di laurea in Economia e Marketing, tenuto da Margherita Fort nell anno accademico , materiale del corso tenuto dal docente nel con la collaborazione di Elisabetta Olivieri e materiale raccolto e presentato in precedenza da Chiara Monfardini. Il materiale è ampiamente basato sugli esempi proposti in Franses and Paap [2001] e su materiale sviluppato da Chiara Monfardini ed Elisa Montaguti. Il software di riferimento è GRETL, ma altri softwares, quali ad esempio R e STATA tra gli altri, possono essere utilizzati per svolgere gli esercizi 2. La scelta del software da utilizzare per le elaborazioni è, in ultima analisi, una scelta personale e richiede in ogni caso un certo investimento. L enfasi nelle esercitazioni e nel materiale qui presentato è sull approccio alla specificazione di un modello econometrico, la diagnostica e l interpretazione dei risultati e non sulla programmazione in GRETL. Vengono tuttavia illustrati dei codici al solo fine di rendere più facile agli studenti lo sviluppo autonomo di codice di programmazione per analisi di base. Gli autori non si assumono alcuna responsabilità per l utilizzo di questi codici in ambiti diversi da quelli del corso in oggetto. La versione 2010 della dispensa include materiale sviluppato da Tommaso Reggiani. 2 Maggiori informazioni sul software R su e su GRETL su Il software STATA permette una vasta gamma di elaborazioni statistiche e di gestione dei dati ed è ampiamente utilizzato da ricercatori in discipline quali, ad esempio, l economia, la sociologia, la psicologia, la biostatistica. Per maggiori informazioni sul software STATA, gli studenti sono invitati a consultare i collegamenti a sessioni introduttive su vari argomenti disponibili al sito ufficiale 2

3 2 Esercitazione 1 3 In questa sezione, tramite un semplice esercizio applicato, vengono raccolte delle informazioni di base su alcuni comandi basilari di GRETL che saranno utilizzati nelle prossime esercitazioni. Tutte le sequenze in carattere TypeWriter, stanno ad indicare le sequenze di comandi (via icone) necessari a produrre gli outputs e le elaborazioni oggetto di descrizione, spiegazione ed interpretazione. 2.1 Help di GRETL GRETL, come molti programmi, contiene al suo interno una guida per facilitarne l utilizzo. Per accedere al menu si può utilizzare il menu a tendina (ultimo menu in alto a destra) e quindi scegliere l opzione di interesse. Si può accedere alla guida ai comandi anche cliccando sul simbolo del salvagente nella finestra in basso. 2.2 Per cominciare... Prima di poter caricare i dati su GRETL, è bene sapere quale è la cartella preimpostata in cui il programma cerca e salva i file. Per conoscere la cartella di riferimento ed il suo percorso è sufficiente digitare controllare all apposita voce nel menu File. Per cambiare la cartella di lavoro dobbiamo andare nel menu File ed indicare la directory (nel nostro caso ad esempio C:\Econometria2\lab1): nella cartella scelta mettiamo i dati che devono essere utilizzati per le elaborazioni. Nella stessa cartella salveremo i files.inp (con i comandi utilizzati) e file.txt (con l output costruito ed i comandi) che verranno creati nella sessione di lavoro. 4 E inoltre utile salvare come icona (vedi opzione file oppure mouse tasto 3 Questa sezione è stata preparata da Tommaso Reggiani, utilizzando anche materiale svillupato da Elisabetta Olivieri e Margherita Fort. 4 E possibile salvare il file della sessione con i risultati dei comandi ed i comandi stessi con estensione diversa da quella di un file di testo. Qui si consiglia di usare l estensione.txt perchè essa è visibile con un semplice editor di testo. 3

4 destro) ogni elaborazione o analisi effettuata. Questo permette di organizzare in modo rapido ed ordinato un completo backup dei risultati (grafici, descrizioni, regressioni etc..) che puo essere consultato tramite la Finestra Icone (in basso a sinistra, icona n.4). 2.3 Caricare i dati GRETL GRETL offre un ampia gamma di possibilità per importare dati in diversi formati. Per accedere ai comandi, è possibile utilizzare il menu che appare dal menu File nella finestra di GRETL: [ File > Apri dati > Importa ]. In questa nostra prima esercitazione, per prendere confidenza con il software, analizzeremo un dataset che raccoglie informazioni sulle variabili (genere, livello di istruzione, esperienza maturata in ambito lavorativo) che influenzano il livello dei salari all interno mercato del lavoro. Il campione di dati che utilizzeremo si riferisce ad un indagine condotta in USA per l anno 1980 (fonte dati: NLS) ed è composto da 3294 osservazioni Analisi descrittiva La fase di analisi descrittiva dei dati a nostra disposizione, rappresenta un passaggio preliminare molto importante. Se svolto con accuratezza e attenzione, ci premetterà di non incorrere in inutili errori nella successiva fase di analisi econometrica. 2.5 Descrizione delle Variabili Per prima cosa è necessario capire con precisione la tipologia e la descrizione dei dati che ci accingiamo ad analizzare [ Dati > Visualizza informazioni complete ]: vedere un esempio in Figura 1. exper indica gli anni di esperienza lavorativa maturati da ogni soggetto incluso nel dataset; male è una variabile dummy che vale 1 se il soggetto è uomo, assume valore 0 quando il soggetto è donna; 5 Il dataset e la relativa analisi seguono la traccia proposta in Verbeek (2007) cap. 2. 4

5 Figura 1: Descrizione delle variabili Descrizione: The WAGES1 files contain 3296 USA working individuals with the following information for The data are taken from the National Longitudinal Survey. Tipo di dati: non datato Intervallo: (n = 3294) Lista delle variabili: exper male school wage experience in years 1 if male, 0 otherwise years of schooling wage (in 1980 \$) per hour school indica gli anni di istruzione di ogni soggetto incluso nel dataset; wage indica il salario orario ricevuto da ogni lavoratore, espresso in US$ (nel 1980). Ora che conosciamo sommariamente la natura delle variabili a nostra disposizione, possiamo ispezionare dall interno la struttura del dataset [ Dati > Mostra valori ]. Osserviamo che il dataset è stato suddiviso in due parti: il primo gruppo di osservazioni (1-1569) si caratterizzano per avere la variabile male==0, ovvero vengono presentate tutte le osservazioni relative alle lavoratrici (donne); il secondo gruppo di osservazioni ( ) si riferisce invece ai lavoratori (uomini) dove la variabile assume valore male== Statistiche descrittive Procediamo ora a prendere confidenza direttamente con i dati producendo una serie di statistiche descrittive [Visualizza > Statistiche descrittive]: vedere un esempio in Figura 2. 5

6 Figura 2: Statistiche descrittive Statistiche descrittive, usando le osservazioni Media Mediana Minimo Massimo exper 8,0434 8,0000 1, ,000 male 0, ,0000 0, ,0000 school 11,631 12,000 3, ,000 wage 5,7576 5,2058 0, ,809 Dev. Std. Coeff. di variazione Asimmetria Curtosi exper 2,2907 0, , ,65477 male 0, , , ,9910 school 1,6575 0, , ,2380 wage 3,2692 0, ,9709 9,6341 Il valore medio 0.52 assunto dalla variabile dummy male indica la proporzione di uomini nel campione, confermando il fatto che nel nostro campione le osservazioni maschili eccedono quelle femminili (M: 1725; 52% vs F: 1569; 48%). Per quanto concerne il livello di istruzione, il campo di variazione della variabile (range) va da un minimo di 3 anni ad un massimo di 16 anni (laurea) dedicati agli studi. La media, che si attesta a poco meno di 12 anni di educazione (diploma/maturità) ci informa del fatto che in media la forza lavoro USA, già nel 1980, era caratterizzata da un alto livello di capitale umano. Il salario orario varia da un minimo di 0.07 $/h ad un massimo di circa 40 $/h e presenta una media pari a circa 5.8$/h. Alcuni richiami di statistica utili per l intepretazione: Mediana: si definisce come il valore assunto dalle unità statistiche che si trovano al centro della distribuzione. In sostanza la Mediana bipartisce la distribuzione in due sotto-distribuzioni di pari numerosità: la prima a sinistra della Mediana (costituita dalla metà delle unità la cui modalità è minore o uguale alla Mediana) e la seconda a destra della Mediana (costituita dalla metà delle unità la cui modalità è maggiore o uguale alla Mediana). Deviazione Standard - D.S.(Scarto Quadratico Medio): è un indice di dispersione (vale a dire una misura di variabilità di una popolazione o di una variabile casuale) 6

7 derivato direttamente dalla varianza, ha la stessa unità di misura dei valori osservati (mentre la varianza ha come unità di misura il quadrato dell unità di misura dei valori di riferimento). La deviazione standard misura la dispersione dei dati intorno al valore atteso. Coefficiente di Variazione - C.V.: è un indice di dispersione che permette di confrontare misure di fenomeni riferite a unità di misura differenti, in quanto si tratta di un numero puro (ovvero non riferito ad alcuna specifica unità di misura). Indice di Asimmetria: = 0, nel caso di perfetta simmetria < 0, per l asimmetria a sinistra (es. school) > 0, per l asimmetria a destra (es. wage) Coefficiente di Curtosi: = 0 la curva si definisce normocurtica, cioè piatta come una normale < 0 la curva si definisce platicurtica, cioè più piatta di una normale > 0 la curva si definisce leptocurtica, cioè più appuntita di una normale (es. wage). A questo punto siamo in grado di approfondire l analisi delle singole variabili a nostra disposizione. 2.7 Grafico delle Frequenze Possiamo produrre il grafico delle frequenze della variabile exper [ Variabile > Grafico delle frequenze ]: vedere Figura Analsi delle Frequenze Cumulate Possiamo ottenere l analisi delle frequenze cumulate per la variabile school[ Variabile > Frequenze cumulate ]: vedere Figura Misure di Concentrazione Per la variabile wage, in particolare, è interessante calcolare il coefficiente di concentrazione di Gini [ Variabile > Coefficiente di Gini ]. Vedere Figura 5. 7

8 Figura 3: Grafico Frequenze : exper Il coefficiente di Gini, rappresenta una misura della diseguaglianza di una distribuzione. È spesso usato per misurare la diseguaglianza nella distribuzione del reddito o anche della ricchezza. È un indice compreso tra 0 ed 1. Valori bassi del coefficiente indicano una distribuzione tendenzialmente uguale, con il valore 0 che corrisponde all uguaglianza perfetta, ad esempio la situazione in cui tutti percepiscano esattamente lo stesso reddito; valori alti del coefficiente indicano una distribuzione più diseguale, con il valore 1 che corrisponde alla più completa disuguaglianza, ovvero la situazione in cui una persona percepisce tutto il reddito del paese mentre tutti gli altri hanno un reddito nullo Campionamenti Essendo il nostro dataset suddiviso fra uomini e donne, è interessante osservare come si modifichino i caratteri a seconda del genere. 8

9 Figura 4: Statistica descrittiva delle frequenze cumulate: school Distribuzione di frequenza per school, oss Frequenza Rel. Cum ,03% 0,03% 4 2 0,06% 0,09% 5 5 0,15% 0,24% ,43% 0,67% ,73% 1,40% ,61% 4,01% ,89% 8,89% * ,11% 21,01% **** ,07% 41,07% ******* ,07% 77,14% ************ ,29% 87,43% *** ,01% 95,45% ** ,07% 99,51% * ,49% 100,00% 2.11 Campione degli Uomini Al fine di procedere con tale analisi di genere, isoliamo per primo il sottocampione (subset) di osservazioni riferite agli uomini [ Campione >Imposta in base a condizione > male==1 ]. Possiamo controllare il corretto isolamento del subset maschile ispezionando direttamente i dati dal loro interno e controllando i valori assunti dalla variabile male (==1) [ Dati > Mostra valori ]. Produciamo quindi anche in questo caso la batteria standard di statistiche descrittive relative al sotto-campione maschile [ Visualizza > Statistiche descrittive ]: vedere Figura Campione delle Donne Procediamo ora ad isolare il sottocampione di osservazioni riferite alle donne. Step (1) Ripristino campione completo: [ Campione > Ripristino campione completo ] 9

10 Figura 5: Indice di Concentrazione di Gini: wage; Gini=0, Figura 6: Statistiche descrittive sul subset uomini Statistiche descrittive, usando le osservazioni Media Mediana Minimo Massimo exper 8,3264 8,0000 2, ,000 male 1,0000 1,0000 1,0000 1,0000 school 11,442 12,000 3, ,000 wage 6,3130 5,6543 0, ,809 Dev. Std.Coeff. di variazione Asimmetria Curtosi exper 2,3592 0, , ,79417 male 0, ,00000 NA NA school 1,7373 0, , ,2408 wage 3,4989 0, ,9197 8,8164 Step (2) Definizione del sottocampione femminile: [ Campione > Imposta in base a condizione > male==0 ] 10

11 Possiamo controllare il corretto isolamento del subset femminile ispezionando direttamente i dati dal loro interno controllando i valori assunti dalla variabile male (==0) [ Dati > Mostra valori ]. Produciamo anche in questo caso la batteria di statistiche descrittive inerenti il sottocampione femminile[ Visualizza > Statistiche descrittive ]: vedere Figura 7. Figura 7: Statistiche descrittive subset donne Statistiche descrittive, usando le osservazioni Media Mediana Minimo Massimo exper 7,7323 8,0000 1, ,000 male 0, , , ,00000 school 11,837 12,000 5, ,000 wage 5,1469 4,6933 0, ,497 Dev. Std.Coeff. di variazione Asimmetria Curtosi exper 2,1715 0, , ,21116 male 0,00000 NA NA NA school 1,5394 0, , ,89434 wage 2,8762 0, , , Confronto Uomini vs Donne Con questa prima serie di statistiche descrittive dei due sottocampioni, disponiamo di informazioni utili al fine di eseguire un analisi comparativa fra le differenti caratteristiche presentate dagli uomini e donne intervistate. In primo luogo, è importante notare come in media le donne abbiano circa mezzo anno di scolarità in più rispetto agli uomini, i quali di converso mostrano in media circa mezzo anno in più di esperienza nel mondo del lavoro. Anche gli stipendi medi mostrano una sensibile differenza fra i due sessi: in media gli uomini guadagnano 1.17$/h in più rispetto alle donne (6.31$/h vs 5.14$/h). Ritorniamo ora al campione completo [ Campione > Ripristina campione completo ] per procedere con la nostra analisi. 11

12 2.14 Regressioni OLS Sulla base delle statistiche descrittive nei sottocampioni, abbiamo osservato un premio salariare a favore degli uomini, in altre parole abbiamo notato che il salario orario medio degli uomini è più alto rispetto alle donne. Ora riprodurremo lo stesso risultato utilizzando un modello di regressione semplice, stimato con il metodo dei minimi quadrati ordinari. Utilizziamo come variabile dipendente wage e includiamo tra le esplicative ( controlliamo per ) la variabile dummy male. wage = β 0 + β 1 male [ Modello > OLS: wage/cost,male ] Il risultato della stima è riportato in Figura 8. Figura 8: Regressione 1: wage = β 0 + β 1 male Modello 1: OLS, usando le osservazioni Variabile dipendente: wage coefficiente errore std. rapporto t p-value const 5, , ,37 0,0000 *** male 1, , ,39 6,71e-025 *** Media var. dipendente 5, SQM var. dipendente 3, Somma quadr. residui 34076,92 E.S. della regressione 3, R-quadro 0, R-quadro corretto 0, F(1, 3292) 107,9338 P-value(F) 6,71e-25 Log-verosimiglianza -8522,228 Criterio di Akaike 17048,46 Criterio di Schwarz 17060,66 Hannan-Quinn 17052,82 Note: SQM = scarto quadratico medio; E.S. = errore standard La costante β 0 ci informa del reddito percepito da un soggetto donna (male==0), mentre β 1 ci informa del premio salariale di cui possono beneficiare gli uomini (male==1). Entrambi i paramenti sono statisticamente significativi al livello del 1% (p-value inferiore a 0.01). Proviamo ora a introdurre nella regressione anche 12

13 le variabili school e exper per verificare il loro specifico impatto (tenendo costanti gli altri fattori, interpretazione ceteris paribus). Il risultato della stima è riportato in Figura 9. wage = β 0 + β 1 male + β 2 school + β 3 exper [ Modello > OLS: wage/cost,male,school,exper ] Figura 9: Regressione 2: wage = β 0 + β 1 male + β 2 school + β 3 exper Modello 3: OLS, usando le osservazioni Variabile dipendente: wage coefficiente errore std. rapporto t p-value const -3, , ,269 4,50e-013 *** male 1, , ,49 5,50e-035 *** school 0, , ,48 4,62e-080 *** exper 0, , ,253 1,59e-07 *** Media var. dipendente 5, SQM var. dipendente 3, Somma quadr. residui 30527,87 E.S. della regressione 3, R-quadro 0, R-quadro corretto 0, F(3, 3290) 167,6302 P-value(F) 4,0e-101 Log-verosimiglianza -8341,091 Criterio di Akaike 16690,18 Criterio di Schwarz 16714,58 Hannan-Quinn 16698,92 Note: SQM = scarto quadratico medio; E.S. = errore standard Utilizzando questa specificazione del modello, possiamo osservare come a parità di anni di educazione (school) e anni di esperienza nel mercato del lavoro (exper) un uomo guadagna 1.34$/h in più rispetto ad una donna. A parità di genere ed esperienza nel mercato del lavoro, un anno in più di educazione porta ad un aumento di 0.64$ il salario orario. Infine, a parità di genere e di anni di educazione ricevuta, un anno in più di esperienza lavorativa genera un incremento pari a 0.12$/h. Un utile modo per rendere molto intuitiva l interpretazione dei risultati derivanti dal modello di regressione, consiste nell applicare una trasformata logaritmica 13

14 alle variabili di interesse, così da ottenere risultati che possono essere interpretati in termini percentuali, ottenendo così misure di elasticità. Nella nostra indagine circa le determinanti che concorrono ad influenzare i salari, è quindi necessario creare tre nuove variabili su scala logaritmica: wage l wage [ Aggiungi > Logaritmi ] school l school [ Aggiungi > Logaritmi ] exper l exper [ Aggiungi > Logaritmi ] L interpretazione della specificazione Log(Y ) = β 0 +β 1 Log(X) è la seguente: una variazione pari all 1% di X, determina una variazione pari a β 1 % in Y, quindi β 1 rappresenta l elasticità di Y rispetto X. Calcoliamo l elasticità del salario al variare del grado di educazione (vedi risultati della stima in Figura 10) l wage = β 0 + β 1 l school [Modello > OLS : l wage/l school] Figura 10: Regressione 3.a: l wage = β 0 + β 1 l school Modello 3: OLS, usando le osservazioni Variabile dipendente: l_wage coefficiente errore std. rapporto t p-value const -1, , ,303 3,30e-010 *** l_school 1, , ,88 8,39e-055 *** Media var. dipendente 1, SQM var. dipendente 0, Somma quadr. residui 1186,072 E.S. della regressione 0, R-quadro 0, R-quadro corretto 0, F(1, 3292) 252,3170 P-value(F) 8,39e-55 Log-verosimiglianza -2991,646 Criterio di Akaike 5987,292 Criterio di Schwarz 5999,491 Hannan-Quinn 5991,659 Note: SQM = scarto quadratico medio; E.S. = errore standard 14

15 All incremento dell 1% del grado di istruzione, il salario cresce dello 1.08% circa. Calcoliamo ora l elasticità del salario al variare del grado di esperienza all interno del mercato del lavoro (risultati della stima in Figura 11) l wage = β 0 + β 1 l exper [Modello > OLS : l wage/l exper] Figura 11: Regressione 3.b: l wage = β 0 + β 1 l exper Modello 4: OLS, usando le osservazioni Variabile dipendente: l_wage coefficiente errore std. rapporto t p-value const 1, , ,23 4,86e-057 *** l_exper 0, , ,775 1,46e-011 *** Media var. dipendente 1, SQM var. dipendente 0, Somma quadr. residui 1259,417 E.S. della regressione 0, R-quadro 0, R-quadro corretto 0, F(1, 3292) 45,90566 P-value(F) 1,46e-11 Log-verosimiglianza -3090,469 Criterio di Akaike 6184,938 Criterio di Schwarz 6197,138 Hannan-Quinn 6189,305 Note: SQM = scarto quadratico medio; E.S. = errore standard All incremento dell 1% del grado di esperienza all interno del mercato del lavoro, il salario cresce dello 0.23% circa Registro dei Comadi Al fine di avere traccia di tutti i principali comandi effettuati durante la sessione di lavoro in GRETL, è possibile ottenere e salvare il Log dei comandi [ Strumenti > Visualizza log comandi > Salva ] 15

16 3 Esercitazioni 2 & 3: analisi dell efficiacia di azioni di marketing Descrizione del problema (da Franses and Paap [2001], capitolo 2 -sez e capitolo 3): Osservando i dati sulle vendite settimanali di ketchup Heinz si notano dei picchi nelle vendite. Interessa esplorare se questi picchi siano collegati alle promozioni attive sul prodotto, ed in ultima analisi verificare quale tra promozioni alternative sia la più efficace. Descrizione dei dati (da Franses and Paap [2001], capitolo 3): Il file heinz chpt3.csv contiene i dati relativi alle vendite settimanali di ketchup Heinz, misurate in dollari (US) e contiene 124 osservazioni, rilevate tra il 1985 ed il 1988 in un supermercato da A.C. Nielsen. In particolare, le variabili incluse nel data set sono: obs numero progressivo ad indicare la settimana di riferimento per la rilevazione; sales livello delle vendite settimanali misurate in dollari; price prezzo per articolo di prodotto, espresso in dollari; displayonly variabile dummy che vale 1 se il ketchup è in promozione di tipo display (ovvero in esposizione) e 0 altrimenti; coupononly variabile dummy che vale 1 se il ketchup è in promozione di tipo coupon (ovvero sul prodotto viene posto un bollino che indica che è in promozione) e 0 altrimenti; displaycoupon variabile dummy che vale 1 se il ketchup è sia in promozione di tipo coupon che in promozione di tipo display e 0 altrimenti. Obiettivi specifici dell analisi: 1. Studiare l associazione tra il livello settimanale delle vendite ed il prezzo. Commentare i risultati. 2. Studiare l associazione tra il livello settimanale delle vendite ed il prezzo, esprimendo le variabili in euro anzichè in dollari. Commentare i risultati alla luce di quanto ottenuto al punto Studiare l associazione tra il logaritmo delle vendite ed il logaritmo del prezzo. Svolgere l analisi sia esprimendo le quantità in dollari che in euro. Commentare i risultati. 16

17 4. Aggiornare le analisi al punto 3 tenendo conto della presenza di promozioni sul prodotto ketchup Heinz senza considerare l interazione tra le promozioni. Qual è secondo voi la promozione più vantaggiosa per l azienda? Motivate la risposta. 5. Esplorate se le conclusioni a cui siete giunti al punto 4, stimando un modello di regressione lineare con il metodo dei minimi quadrati, sono affidabili, usando i residui del modello per fare diagnostica. Motivate le vostre analisi e commentate i risultati delle analisi suddette. 6. Pare sensato, seguendo i risultati di precedenti analisi empiriche che valutano l effetto di promozioni dello stesso tipo su altri prodotti alimentari, considerare una specificazione del modello più flessibile che tenga conto della dinamica. In particolare, si vuole considerare il modello lsales w = α 0 + α 1 lsales w 1 + α 2 lprice w + α 3 lprice w 1 + α 4 displayonly w + α 5 displayonly w 1 + α 6 coupononly w + α 7 coupononly w 1 + α 8 displaycoupon w + α 9 displaycoupon w 1 + ε w Stimare il modello con il metodo dei minimi quadrati ordinari e valutare se tale metodo di stima risulta appropriato per il problema in esame. Commentare i risultati anche tenendo conto di quanto ottenuto al punto Alla luce dei risultati dell analisi condotta al punto precedente, dopo aver apportato le eventuali modificazioni necessarie, dare una indicazione all azienda su quale sia la promozione o combinazione di promozioni più efficace, motivando la risposta. Soluzione e (selezionato) output GRETL 1. Per studiare l associazione tra vendite e prezzo utilizziamo in prima approssimazione un modello di regressione lineare, in particolare stimiamo con il metodo dei minimi quadrati ordinari il modello in equazione (1). sales w = β 0 + β 1 price w + ε w (1) Le stime del modello ottenute con GRETL sono riportate in Figura 12. Sulla base delle stime si sarebbe portati a concludere che il prezzo non influenza 17

18 significativamente il livello delle vendite: si conclude in questa direzione sia osservando il valore della statistica t associata al parametro che esprime l effetto di una variazione unitaria di prezzo sul livello di vendite (β 1 ) 6, sia osservando il valore di probabilità osservato p-value 7, sia osservando gli estremi dell intervallo di confidenza al 95% per β 1 8. Il test F, che testa la significatività dell intera regressione, è coerente con quanto sopra riportato. In questo caso vi è un solo regressore ed è possibile dimostrare che il test F coincide con il quadrato della statistica t associata al parametro relativo all unico regressore. La quota di variabilità della variabile dipendente spiegata dal modello e misurata dall R 2 è meno dell 1% (circa 0.8%). Si osservi che, dal momento che il modello include la costante, è possibile calcolare R 2 secondo la formula R 2 = SQS SQT = 1 SQR SQT Nel caso specifico, SQT = (= (124 1)), SQR = , SQS = (SQT SQR) come si vede dalla tabella relativa a questo modello in figura 12. Il parametro β 1 in questo modello indica quale è la variazione nel livello di vendite in dollari che corrisponde ad una variazione unitaria nel livello del prezzo per articolo: un aumento di un dollaro nel prezzo porterebbe, secondo il modello, se le stime fossero significativamente diverse da zero, ad una riduzione di 110 dollari nelle vendite settimanali. 6 La statistica t assume il valore che è contenuto nella zona di accettazione del test -basata sulla distribuzione asintotica- al livello di significatività 5% [-1.96, 1.96]. Si osserva che il valore osservato del test cade anche nella zona di accettazione del test al livello di significatività 1%, ossia [-1.64, +1.64], ed ovviamente nella regione di accettazione del test al livello di significatività 10% [-2.57, 2.57]. Sulla base del valore della statistica si conclude che i dati sono coerenti con l ipotesi nulla, ovvero con l ipotesi che il vero valore del parametro sia zero. 7 Il p-value associato è infatti più alto di qualunque livello di significatività convenzionalmente adottato. 8 Il valore zero è incluso nell intervallo, quindi al 5% non possiam rigettare l ipotesi nulla che il vero valore del parametro sia zero. 18

19 2. Si stima il modello in equazione (2), analogo a quello in equazione (1), dove sia la variabile dipendente che i regressori sono espressi in euro anzichè in dollari utilizzando il tasso di cambio dollaro/euro al 28 marzo 2008 (0.6333). sales eu w = α 0 + α 1 price eu w + ǫ w (2) Si osserva che α 1 β 1. Lo stimatore ai minimi quadrati ordinari di una regressione semplice è infatti dato dal rapporto tra la covarianza tra la variabile dipendente e l esplicativa e la varianza dell esplicativa e β 1 Cov(sales,price) Var(price) α 1 Cov(sales eu,price eu) Var(price eu) = Cov(sales,price) Var(price) = Cov(sales,price) Var(price) = β 1 Il fatto che i coefficienti coicidano è quindi legato al fatto che la variazione nell unità di misura (la scala) nella variabile dipendente e dell esplicativa è la stessa e non sarebbe vero se la modificazione della scala fosse diversa per la variabile dipendente (sales) e per il regressore (price). Il coefficiente α 1 corrisponde alla variazione attesa in euro delle vendite corrispondente ad un aumento di un euro nel prezzo per articolo. Il coefficiente α 0 corrisponde al livello medio delle vendite in euro (si osservi che la stima di questo coefficiente è pari a β 0 ; per esercizio, utilizzando le formule per lo stimatore ai minimi quadrati ordinari di un modello di regressione semplice, mostrare perchè). Come ci si attendeva, l adattamento del modello non cambia se si cambia l unità di misura in cui sono misurate le variabili. Questo corrisponde all idea che il potere esplicativo del modello resta lo stesso, indipendentemente dall unità di misura. Anche le conclusioni inferenziali (significatività dei coefficienti e dell intera regressione) restano immutate. 19

20 Figura 12: Lab. 2: Output GRETL, domande 1-2. Modello 1: Stime OLS usando le 124 osservazioni Variabile dipendente: sales coefficiente errore std. rapporto t p-value const * price Media variabile dipendente SQM variabile dipendente Somma quadrati dei residui E.S. della regressione R-quadro R-quadro corretto F(1, 122) P-value(F) mod2: Stime OLS usando le 124 osservazioni Variabile dipendente: sales_eu coefficiente errore std. rapporto t p-value const * price_eu Media variabile dipendente SQM variabile dipendente Somma quadrati dei residui E.S. della regressione R-quadro R-quadro corretto F(1, 122) P-value(F) Log-verosimiglianza Note: SQM = scarto quadratico medio; E.S. = errore standard 20

21 3. I risultati della stima dei modelli corrispondenti a quelli in equazione (1) ed in equazione (2) dove le variabili sono espresse in scala logaritmica anzichè nei livelli, sono riportati in figura 13 e formalmente descritti nelle equazioni (3), (4). lsales w = δ 0 + δ 1 lprice w + ν w (3) lsales eu w = γ 0 + γ 1 lprice eu w + ψ w (4) In questo caso, la stima dei parametri δ 1 e γ 1 coinciderebbe anche se la variazione in scala della variabile dipendente e della variabile esplicativa non coincidessero. Ciò è dovuto all interpretazione dei coefficienti di questo modello (si veda Tabella 1): quando sia la variabile esplicativa che la dipendente sono espresse in scala logaritmica il coefficiente associato all esplicativa esprime la variazione percentuale della dipendente corrispondente ad una variazione percentuale dell esplicativa e quindi non dipende dalla scala in cui sono espresse le variabili. γ 1 ln(y) ln(x) derivata funzione composta {}}{ = y/y x/x γ 1 rappresenta l elasticità di y rispetto ad x e nel modello lineare in scala logaritmica si assume costante (si veda [Cappuccio and Orsi, 2005, pg ; 65-67] e [Monfardini, 2007, sez. 3.4]). Differentemente, nel modello espresso nei livelli, i coefficienti dipendono generalmente dalla scala in cui sono espresse le variabili. β 1 y x Dal momento che la forma funzionale per la variabile dipendente cambia tra i modelli stimati ai punti precedenti e questi modelli, non è possibile confrontare l adattamento dei modelli direttamente sulla base dell R 2 o R 2 (R 2 corretto adjusted ): i modelli non sono infatti nidificati ( nested ). L adattamento per questi modelli è comunque basso e suggerisce di modificare la specificazione del modello cercando di includere variabili per aumentarne il potere esplicativo. 21

22 Figura 13: Lab. 2: Output GRETL, domanda 3. mod3: Stime OLS usando le 124 osservazioni Variabile dipendente: lsales coefficiente errore std. rapporto t p-value const e-064 *** lprice Media variabile dipendente SQM variabile dipendente Somma quadrati dei residui E.S. della regressione R-quadro R-quadro corretto F(1, 122) P-value(F) Log-verosimiglianza Note: SQM = scarto quadratico medio; E.S. = errore standard Modello 4: Stime OLS usando le 124 osservazioni Variabile dipendente: lsales_eu coefficiente errore std. rapporto t p-value const e-027 *** lprice_eu Media variabile dipendente SQM variabile dipendente Somma quadrati dei residui E.S. della regressione R-quadro R-quadro corretto F(1, 122) P-value(F) Log-verosimiglianza Note: SQM = scarto quadratico medio; E.S. = errore standard 22

23 Tabella 1: Forme funzionali ed interpretazione dei coefficienti del modello di regressione Modello Variabile Variabile Interpretazione dipendente esplicativa coefficiente livello-livello y x y = β x livello-logaritmo y log(x) y = ( β 100 logaritmo-livello log(y) x % y = (100 β) x logaritmo-logaritmo log(y) log(x) % y = β% x un caso in cui l effetto marginale coincide con misura di elasticità Modello Var.dip. Var. esp. Inter. coef. logaritmo-logaritmo log(y) log(x) β = y/y % y x/x % x Fonte: Wooldridge [2006]. Nota su trasformazione logaritmica La trasformazione logaritmica è una trasformazione frequentemente utilizzata nelle elaborazioni questo perchè la trasformazione permette di ridurre la variabilità della serie originaria (si confronti il range di variazione della variabile sales ed lsales) e rende la distribuzione più simmetrica (vedere grafici in Figura 14). La trasformazione logaritmica è una particolare trasformazione nella classe delle trasformazioni di Box-Cox. Inoltre, come si è visto, nel caso del modello di regressione lineare quando sia la dipendente che l esplicativa di interesse sono espresse in logaritmi i parametri corrispondenti assumono una interpretazione molto conveniente, quella di elasticità. 4. Si considera il modello dove la variabile dipendente è espressa in logaritmi perchè risulta più adeguata in questo caso l ipotesi di normalità (si vedano i grafici in Figura 14; si noti che esistono anche procedure formali per testare l ipotesi di normalità di una variabile casuale, tra gli altri il test proposto da Jarque e Bera trattato nel testo -[Cappuccio and Orsi, 2005, sez ]- con riferimento ai residui ma non trattato in questo corso) che permette di avere risultati esatti sulla distribuzione dello stimatore ai minimi quadrati ordinari 23

24 Figura 14: Istogramma delle vendite di ketchup in dollari e del logaritmo delle vendite. Fonte dati: Franses e Paap (2001). 24

Regressione Lineare con un Singolo Regressore

Regressione Lineare con un Singolo Regressore Regressione Lineare con un Singolo Regressore Quali sono gli effetti dell introduzione di pene severe per gli automobilisti ubriachi? Quali sono gli effetti della riduzione della dimensione delle classi

Dettagli

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Esercizio 1 Si consideri il seguente modello ad effetti fissi con variabili binarie: + 1 2 a) supponete che N=3. Si mostri che i regressori

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Test di restrizioni lineari nel MRLM: Esempi

Test di restrizioni lineari nel MRLM: Esempi Test di restrizioni lineari nel MRLM: Esempi Eduardo Rossi Università degli Studi di Pavia Corso di Econometria Marzo 2012 Rossi Test F: esempi 2012 1 / 23 Funzione di produzione Cobb-Douglas Esempio GDP

Dettagli

1 BREVE RIPASSO DEI TEST STATISTICI 2 I TEST STATISTICI NEI SOFTWARE ECONOMETRICI E IL P-VALUE 3 ESERCIZI DI ALLENAMENTO

1 BREVE RIPASSO DEI TEST STATISTICI 2 I TEST STATISTICI NEI SOFTWARE ECONOMETRICI E IL P-VALUE 3 ESERCIZI DI ALLENAMENTO I TEST STATISTICI E IL P-VALUE Obiettivo di questo Learning Object è ripassare la teoria ma soprattutto la pratica dei test statistici, con un attenzione particolare ai test che si usano in Econometria.

Dettagli

La regressione lineare applicata a dati economici

La regressione lineare applicata a dati economici La regressione lineare applicata a dati economici Matteo Pelagatti 7 febbraio 2008 Indice 1 Il modello lineare 2 2 La stima dei coefficienti e le ipotesi classiche 2 3 Le conseguenze del venir meno di

Dettagli

Excel Terza parte. Excel 2003

Excel Terza parte. Excel 2003 Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina

Dettagli

Elaborazione dei dati su PC Regressione Multipla

Elaborazione dei dati su PC Regressione Multipla 21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione

Dettagli

Modello di regressione lineare

Modello di regressione lineare Modello di regressione lineare a cura di Giordano dott. Enrico enrico.giordano@meliorbanca.com Nel presente lavoro viene descritto in modo dettagliato (attraverso anche un impatto visivo), l analisi di

Dettagli

Elevata capacit di ripagare il debito Alta capacit di pagare il debito Solida capacit di ripagare il debito, che potrebbe essere influenzata da circostanze avverse Adeguata capacit di rimborso, che per

Dettagli

1 La Matrice dei dati

1 La Matrice dei dati Dispense sull uso di Excel Daniela Marella 1 La Matrice dei dati Un questionario è costituito da un insieme di domande raccolte su un determinato supporto (cartaceo o elettronico) e somministrate alla

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

SPREAD DEI TASSI DI INTERESSE E DINAMICA DELL INFLAZIONE: UNA VERIFICA EMPIRICA PER L EURO AREA

SPREAD DEI TASSI DI INTERESSE E DINAMICA DELL INFLAZIONE: UNA VERIFICA EMPIRICA PER L EURO AREA SPREAD DEI TASSI DI INTERESSE E DINAMICA DELL INFLAZIONE: UNA VERIFICA EMPIRICA PER L EURO AREA Indice Introduzione...pag. 3 Glossario..pag. 6 Dati... pag. 7 Analisi...pag. 10 Stima dell'inflazione col

Dettagli

Analisi statistica delle funzioni di produzione

Analisi statistica delle funzioni di produzione Analisi statistica delle funzioni di produzione Matteo Pelagatti marzo 28 Indice La funzione di produzione di Cobb-Douglas 2 2 Analisi empirica della funzione di produzione aggregata 3 Sommario Con la

Dettagli

Matlab per applicazioni statistiche

Matlab per applicazioni statistiche Matlab per applicazioni statistiche Marco J. Lombardi 19 aprile 2005 1 Introduzione Il sistema Matlab è ormai uno standard per quanto riguarda le applicazioni ingegneristiche e scientifiche, ma non ha

Dettagli

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie Università del Piemonte Orientale Corso di dottorato in medicina molecolare aa 2002 2003 Corso di Statistica Medica Inferenza sulle medie Statistica U Test z Test t campioni indipendenti con uguale varianza

Dettagli

STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2

STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2 STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2 Introduzione all uso di EViews di Daniele Toninelli 1. INTRODUZIONE ad EViews

Dettagli

Econometria applicata all intermediazione finanziaria Esercizi regressione multipla

Econometria applicata all intermediazione finanziaria Esercizi regressione multipla Econometria applicata all intermediazione finanziaria Esercizi regressione multipla Tiziano Razzolini Università di Siena. mail: razzolini4@unisi.it 3 aprile 2012 Esercizi 6.1-6.4 e 7.1-7.4 Questi esercizi

Dettagli

La Regressione Lineare

La Regressione Lineare La Regressione Lineare. Cos è l Analisi della Regressione Multipla? L analisi della regressione multipla è una tecnica statistica che può essere impiegata per analizzare la relazione tra una variabile

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Regressione con Variabili Dummy Regressione con Variabili Dummy La

Dettagli

Esercizi: i rendimenti finanziari

Esercizi: i rendimenti finanziari Esercizi: i rendimenti finanziari Operazioni algebriche elementari Distribuzione e dipendenza Teoria di probabilità Selezione portafoglio p. 1/25 Esercizio I Nella tabella sottostante relativa all indice

Dettagli

Ulteriori metodi per la stima di una singola equazione

Ulteriori metodi per la stima di una singola equazione 1 Materiali didattici: ANALISI E PREVISIONI NEI MERCATI FINANZIARI a.a. 2014-2015 DISPENSA N.3bis (APPENDICE alla dispensa n.3) Ulteriori metodi per la stima di una singola equazione (Prof. Giovanni Verga)

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità

Dettagli

Note introduttive Il software econometrico Easy Reg è scaricabile gratuitamente da internet (http://econ.la.psu.edu/~hbierens/easyreg.

Note introduttive Il software econometrico Easy Reg è scaricabile gratuitamente da internet (http://econ.la.psu.edu/~hbierens/easyreg. Note introduttive Il software econometrico Easy Reg è scaricabile gratuitamente da internet (http://econ.la.psu.edu/~hbierens/easyreg.htm) Per importare i dati in Easy Reg bisogna: 1. Cambiare le impostazioni

Dettagli

Esercitazione di riepilogo 23 Aprile 2013

Esercitazione di riepilogo 23 Aprile 2013 Esercitazione di riepilogo 23 Aprile 2013 Grafici Grafico a barre Servono principalmente per rappresentare variabili (caratteri) qualitative, quantitative e discrete. Grafico a settori circolari (torta)

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Esplorazione dei dati

Esplorazione dei dati Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

EMBA PART TIME 2012 ROMA I ANNO

EMBA PART TIME 2012 ROMA I ANNO BUSINESS STATISTICS: ASSIGNMENT II: EMBA PART TIME 2012 ROMA I ANNO PROF. MOSCONI ESERCIZIO 1: USO DEL MODELLO DI REGRESSIONE PER DETERMINARE IL VALORE DEGLI IMMOBILI. ESERCIZIO 2: PREVISIONE DI VARIABILI

Dettagli

Introduzione al software SAS

Introduzione al software SAS Introduzione al software SAS Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 1 Orario di ricevimento Alberto Saccardi alberto.saccardi@nunatac.it asaccardi@liuc.it Lunedì 17-18 Aula

Dettagli

IBM SPSS Regression 21

IBM SPSS Regression 21 IBM SPSS Regression 21 Nota: Prima di utilizzare queste informazioni e il relativo prodotto, leggere le informazioni generali disponibili in Note a pag. 44. Questa versione si applica a IBM SPSS Statistics

Dettagli

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

Le Serie Storiche e l Analisi del Ciclo Economico

Le Serie Storiche e l Analisi del Ciclo Economico Le Serie Storiche e l Analisi del Ciclo Economico Dr. Giuseppe Rose (PhD. MSc. London) Università degli Studi della Calabria Macroeconomia Applicata Prof.ssa Patrizia Ordine (Ph.D. MPhil. Oxford) a.a.

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Econometria. Universita di Salerno, A.A. 2013. Fausto Galli

Econometria. Universita di Salerno, A.A. 2013. Fausto Galli Econometria Universita di Salerno, A.A. 2013 Fausto Galli outline PARTE III Capitolo 14 Capitolo 15 Introduzione alle regressioni con serie storiche ed alla previsione (SW capitolo 14) I dati in serie

Dettagli

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Verifica di ipotesi e intervalli di confidenza nella regressione multipla Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo

Dettagli

Regressione lineare multipla Strumenti quantitativi per la gestione

Regressione lineare multipla Strumenti quantitativi per la gestione Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data

Dettagli

Appunti: Teoria Dei Test

Appunti: Teoria Dei Test Appunti: Teoria Dei Test Fulvio De Santis, Luca Tardella e Isabella Verdinelli Corsi di Laurea A + E + D + G + R 1. Introduzione. Il test d ipotesi è un area dell inferenza statistica in cui si valuta

Dettagli

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette

Dettagli

Lezione n. 2 (a cura di Chiara Rossi)

Lezione n. 2 (a cura di Chiara Rossi) Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Esercizi di Statistica

Esercizi di Statistica Esercizi di Statistica Selezione di esercizi proposti durante le esercitazioni dei corsi di Statistica tenute presso la Facoltà di Economia dell Università di Salerno Versione del 17 ottobre 2006 2 Per

Dettagli

Contenuto del libro...2 Convenzioni utilizzate nel libro...2

Contenuto del libro...2 Convenzioni utilizzate nel libro...2 Indice Introduzione... 1 Contenuto del libro...2 Convenzioni utilizzate nel libro...2 I INTERVALLI E FORMULE DI EXCEL 1 Ricavare il massimo dagli intervalli.... 7 Tecniche avanzate di selezione degli intervalli...7

Dettagli

UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE

UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE Laurea in Statistica,Economia e Finanza Tesi di laurea Stima degli effetti di uno shock al 'credit spread' per gli Stati Uniti: Un'analisi

Dettagli

lezione 18 AA 2015-2016 Paolo Brunori

lezione 18 AA 2015-2016 Paolo Brunori AA 2015-2016 Paolo Brunori Previsioni - spesso come economisti siamo interessati a prevedere quale sarà il valore di una certa variabile nel futuro - quando osserviamo una variabile nel tempo possiamo

Dettagli

ECONOMETRIA APPLICATA Prof. Rocco Mosconi Prova scritta del 13/5/2005

ECONOMETRIA APPLICATA Prof. Rocco Mosconi Prova scritta del 13/5/2005 Prova scritta del 13/5/2005 Disponiamo di dati cross-section relativi al 1982 per 595 lavoratori americani, tratti dal data base PSID (Panel Study of Income Dynamics, Cornwell-Rupert, 1988). Le variabili

Dettagli

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori AA 2014-2015 Paolo Brunori domande di mutui rigettate - nei dati raccolti a Boston negli anni 90 il tasso di rifiuto è 28% per i neri e 9% per i bianchi - si può parlare di discriminazione? - è possibili

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) La Regressione Multipla La Regressione Multipla La regressione multipla

Dettagli

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Politecnico di Milano - Anno Accademico 200-20 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Esercitazione 9 2 Giugno 20 Esercizio. In un laboratorio per il test dei materiali,

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Dai dati al modello teorico

Dai dati al modello teorico Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere

Dettagli

Appunti di Econometria

Appunti di Econometria Appunti di Econometria ARGOMENTO [2]: ESTENSIONI DEL MODELLO LINEARE Tommaso Nannicini Università Bocconi Ottobre 2010 1 Scelta della forma funzionale Abbiamo visto che abbandonare l assunzione di normalità

Dettagli

MODELLO DI REGRESSIONE PER DATI DI PANEL

MODELLO DI REGRESSIONE PER DATI DI PANEL MODELLO DI REGRESSIONE PER DAI DI PANEL 5. Introduzione Storicamente l analisi econometrica ha proceduto in due distinte direzioni: lo studio di modelli macroeconomici, sulla base di serie temporali di

Dettagli

CORSO DI STATISTICA ED ELEMENTI DI INFORMATICA

CORSO DI STATISTICA ED ELEMENTI DI INFORMATICA ANNO ACCADEMICO 2013-2014 UNIVERSITA DEGLI STUDI DI TERAMO FACOLTA DI MEDICINA VETERINARIA CORSO DI STATISTICA ED ELEMENTI DI INFORMATICA CFU 5 DURATA DEL CORSO : ORE 35 DOCENTE PROF. DOMENICO DI DONATO

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.

Dettagli

Formazione Aziendale per la Qualità

Formazione Aziendale per la Qualità 4 Corsi e Formazione per la Qualità Formazione Aziendale per la Qualità Il nostro obiettivo L organizzazione, l analisi e l interpretazione dei dati aziendali all interno del proprio business, può rappresentare

Dettagli

è decidere sulla verità o falsità

è decidere sulla verità o falsità I test di ipotesi I test di ipotesi Il test delle ipotesi consente di verificare se, e in quale misura, una determinata ipotesi (di carattere sociale, biologico, medico, economico, ecc.) è supportata dall

Dettagli

Richiami di inferenza statistica

Richiami di inferenza statistica C Richiami di inferenza statistica SOMMARIO C.1. Un campione di osservazioni C.2. Un modello econometrico C.3. Stima della media di una popolazione C.4. Stima della varianza e di altri momenti della popolazione

Dettagli

Fogli Elettronici: MS Excel. Foglio Elettronico

Fogli Elettronici: MS Excel. Foglio Elettronico Parte 6 Fogli Elettronici: MS Excel Elementi di Informatica - AA. 2008/2009 - MS Excel 0 di 54 Foglio Elettronico Un foglio elettronico (o spreadsheet) è un software applicativo nato dall esigenza di:

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Corso di Statistica Medica Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Sono previste 40 ore complessive, di cui almeno 16 di lezione frontale e le restanti

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

(accuratezza) ovvero (esattezza)

(accuratezza) ovvero (esattezza) Capitolo n 2 2.1 - Misure ed errori In un analisi chimica si misurano dei valori chimico-fisici di svariate grandezze; tuttavia ogni misura comporta sempre una incertezza, dovuta alla presenza non eliminabile

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di

Dettagli

Elaborazione dati in Analisi Sensoriale

Elaborazione dati in Analisi Sensoriale Elaborazione dati in Analisi Sensoriale Si è parlato di interpretazione corretta dei risultati ottenuti; a questo concorrono due fattori: affidabilità e validità. Se i test fossero stati ripetuti con lo

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare

Dettagli

GUIDA RAPIDA ALL USO DI EXCEL

GUIDA RAPIDA ALL USO DI EXCEL GUIDA RAPIDA ALL USO DI EXCEL I fogli elettronici vengono utilizzati in moltissimi settori, per applicazioni di tipo economico, finanziario, scientifico, ingegneristico e sono chiamati in vari modi : fogli

Dettagli

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città

Dettagli

Excel Guida introduttiva

Excel Guida introduttiva Excel Guida introduttiva Informativa Questa guida nasce con l intento di spiegare in modo chiaro e preciso come usare il software Microsoft Excel. Questa è una guida completa creata dal sito http://pcalmeglio.altervista.org

Dettagli

IBM SPSS Regression 19

IBM SPSS Regression 19 IBM SPSS Regression 19 Note: Before using this information and the product it supports, read the general information under Notices a pag. 46. This document contains proprietary information of SPSS Inc,

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto

Dettagli

La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali

La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali Elementi di Analisi Multivariata V SCUOLA ESTIVA AISV 5 -- 9 ottobre 009 - Soriano nel Cimino (VT) Sabrina Giordano Dipartimento

Dettagli

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione

Dettagli

1. Richiami di Statistica. Stefano Di Colli

1. Richiami di Statistica. Stefano Di Colli 1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche

Dettagli

PROGRAMMA FT-Graph-2

PROGRAMMA FT-Graph-2 PROGRAMMA FT-Graph-2 PROGRAMMA DI SVILUPPO GRAFICO CON STAMPA Elaborazione grafica con selezione dei dati. Si possono graficare e stampare tutti i file relativi alle apparecchiature della ECONORMA S.a.s.

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

Appunti di Econometria

Appunti di Econometria Appunti di Econometria ARGOMEO [5]: ANALISI DEI DATI PANEL Maria Luisa Mancusi Università Bocconi Novembre 2009 1 I dati panel Un panel è un campione che contiene osservazioni su N individui per T anni.

Dettagli

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico Capitolo 4 4.1 Il foglio elettronico Le più importanti operazioni richieste dall analisi matematica dei dati sperimentali possono essere agevolmente portate a termine da un comune foglio elettronico. Prenderemo

Dettagli

Problema pratico: Test statistico = regola di decisione

Problema pratico: Test statistico = regola di decisione La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107 t-test test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie Calcola medie e altre statistiche

Dettagli

Indice Prefazione xiii 1 Probabilità

Indice Prefazione xiii 1 Probabilità Prefazione xiii 1 Probabilità 1 1.1 Origini del Calcolo delle Probabilità e della Statistica 1 1.2 Eventi, stato di conoscenza, probabilità 4 1.3 Calcolo Combinatorio 11 1.3.1 Disposizioni di n elementi

Dettagli

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Corso di Statistica Medica 2004-2005 Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Sono previste 30 ore di lezione di statistica e 12 di

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Limited Dependent Variable Models

Limited Dependent Variable Models Limited Dependent Variable Models Logit Tobit Probit Modelli Logit e Probit Latent variable models for binary choice Models for descrete dependent variable Traducendo Spesso vogliamo studiare (le determinanti

Dettagli

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Rcmdr

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Rcmdr Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Rcmdr http://www.r-project.org http://qplab.psy.unipd.it Che cos è Rcmdr? Rcmdr è un pacchetto che possiamo scaricare dal CRAN e installare su

Dettagli

Il Foglio Elettronico. Microsoft Excel

Il Foglio Elettronico. Microsoft Excel Il Foglio Elettronico 1 Parte I Concetti generali Celle e fogli di lavoro.xls Inserimento dati e tipi di dati Importazione di dati Modifica e formattazione di fogli di lavoro FOGLIO ELETTRONICO. I fogli

Dettagli

Valori medi e misure della tendenza centrale

Valori medi e misure della tendenza centrale TERZA UNITA Valori medi e misure della tendenza centrale Una delle maggiori cause di confusione presso l uomo della strada nonché di diffidenza verso la statistica, considerata più un arte che una scienza,

Dettagli