Appunti per gli studenti. Modelli Quantitativi per il Marketing materiale delle lezioni di laboratorio

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Appunti per gli studenti. Modelli Quantitativi per il Marketing materiale delle lezioni di laboratorio"

Transcript

1 UNIVERSITÀ DI BOLOGNA FACOLTÀ DI ECONOMIA CORSO DI LAUREA IN ECONOMIA E MARKETING Appunti per gli studenti Modelli Quantitativi per il Marketing materiale delle lezioni di laboratorio VERSIONE PRELIMINARE Margherita Fort 1 Questa versione: Febbraio Università di Bologna, Facoltà di Economia. La versione 2010 della dispensa contiene materiale svilluppato da Tommaso Reggiani. Per segnalare imprecisioni o contribuire al miglioramento della dispensa contattare: Ufficio: Dipartimento di Scienze Economiche, Piazza Scaravilli 2, Bologna. tel:

2 1 Introduzione Questa dispensa raccoglie gli appunti relativi al laboratorio informatico del corso di Modelli Quantitativi per il Marketing, corso di laurea in Economia e Marketing, tenuto da Margherita Fort nell anno accademico , materiale del corso tenuto dal docente nel con la collaborazione di Elisabetta Olivieri e materiale raccolto e presentato in precedenza da Chiara Monfardini. Il materiale è ampiamente basato sugli esempi proposti in Franses and Paap [2001] e su materiale sviluppato da Chiara Monfardini ed Elisa Montaguti. Il software di riferimento è GRETL, ma altri softwares, quali ad esempio R e STATA tra gli altri, possono essere utilizzati per svolgere gli esercizi 2. La scelta del software da utilizzare per le elaborazioni è, in ultima analisi, una scelta personale e richiede in ogni caso un certo investimento. L enfasi nelle esercitazioni e nel materiale qui presentato è sull approccio alla specificazione di un modello econometrico, la diagnostica e l interpretazione dei risultati e non sulla programmazione in GRETL. Vengono tuttavia illustrati dei codici al solo fine di rendere più facile agli studenti lo sviluppo autonomo di codice di programmazione per analisi di base. Gli autori non si assumono alcuna responsabilità per l utilizzo di questi codici in ambiti diversi da quelli del corso in oggetto. La versione 2010 della dispensa include materiale sviluppato da Tommaso Reggiani. 2 Maggiori informazioni sul software R su e su GRETL su Il software STATA permette una vasta gamma di elaborazioni statistiche e di gestione dei dati ed è ampiamente utilizzato da ricercatori in discipline quali, ad esempio, l economia, la sociologia, la psicologia, la biostatistica. Per maggiori informazioni sul software STATA, gli studenti sono invitati a consultare i collegamenti a sessioni introduttive su vari argomenti disponibili al sito ufficiale 2

3 2 Esercitazione 1 3 In questa sezione, tramite un semplice esercizio applicato, vengono raccolte delle informazioni di base su alcuni comandi basilari di GRETL che saranno utilizzati nelle prossime esercitazioni. Tutte le sequenze in carattere TypeWriter, stanno ad indicare le sequenze di comandi (via icone) necessari a produrre gli outputs e le elaborazioni oggetto di descrizione, spiegazione ed interpretazione. 2.1 Help di GRETL GRETL, come molti programmi, contiene al suo interno una guida per facilitarne l utilizzo. Per accedere al menu si può utilizzare il menu a tendina (ultimo menu in alto a destra) e quindi scegliere l opzione di interesse. Si può accedere alla guida ai comandi anche cliccando sul simbolo del salvagente nella finestra in basso. 2.2 Per cominciare... Prima di poter caricare i dati su GRETL, è bene sapere quale è la cartella preimpostata in cui il programma cerca e salva i file. Per conoscere la cartella di riferimento ed il suo percorso è sufficiente digitare controllare all apposita voce nel menu File. Per cambiare la cartella di lavoro dobbiamo andare nel menu File ed indicare la directory (nel nostro caso ad esempio C:\Econometria2\lab1): nella cartella scelta mettiamo i dati che devono essere utilizzati per le elaborazioni. Nella stessa cartella salveremo i files.inp (con i comandi utilizzati) e file.txt (con l output costruito ed i comandi) che verranno creati nella sessione di lavoro. 4 E inoltre utile salvare come icona (vedi opzione file oppure mouse tasto 3 Questa sezione è stata preparata da Tommaso Reggiani, utilizzando anche materiale svillupato da Elisabetta Olivieri e Margherita Fort. 4 E possibile salvare il file della sessione con i risultati dei comandi ed i comandi stessi con estensione diversa da quella di un file di testo. Qui si consiglia di usare l estensione.txt perchè essa è visibile con un semplice editor di testo. 3

4 destro) ogni elaborazione o analisi effettuata. Questo permette di organizzare in modo rapido ed ordinato un completo backup dei risultati (grafici, descrizioni, regressioni etc..) che puo essere consultato tramite la Finestra Icone (in basso a sinistra, icona n.4). 2.3 Caricare i dati GRETL GRETL offre un ampia gamma di possibilità per importare dati in diversi formati. Per accedere ai comandi, è possibile utilizzare il menu che appare dal menu File nella finestra di GRETL: [ File > Apri dati > Importa ]. In questa nostra prima esercitazione, per prendere confidenza con il software, analizzeremo un dataset che raccoglie informazioni sulle variabili (genere, livello di istruzione, esperienza maturata in ambito lavorativo) che influenzano il livello dei salari all interno mercato del lavoro. Il campione di dati che utilizzeremo si riferisce ad un indagine condotta in USA per l anno 1980 (fonte dati: NLS) ed è composto da 3294 osservazioni Analisi descrittiva La fase di analisi descrittiva dei dati a nostra disposizione, rappresenta un passaggio preliminare molto importante. Se svolto con accuratezza e attenzione, ci premetterà di non incorrere in inutili errori nella successiva fase di analisi econometrica. 2.5 Descrizione delle Variabili Per prima cosa è necessario capire con precisione la tipologia e la descrizione dei dati che ci accingiamo ad analizzare [ Dati > Visualizza informazioni complete ]: vedere un esempio in Figura 1. exper indica gli anni di esperienza lavorativa maturati da ogni soggetto incluso nel dataset; male è una variabile dummy che vale 1 se il soggetto è uomo, assume valore 0 quando il soggetto è donna; 5 Il dataset e la relativa analisi seguono la traccia proposta in Verbeek (2007) cap. 2. 4

5 Figura 1: Descrizione delle variabili Descrizione: The WAGES1 files contain 3296 USA working individuals with the following information for The data are taken from the National Longitudinal Survey. Tipo di dati: non datato Intervallo: (n = 3294) Lista delle variabili: exper male school wage experience in years 1 if male, 0 otherwise years of schooling wage (in 1980 \$) per hour school indica gli anni di istruzione di ogni soggetto incluso nel dataset; wage indica il salario orario ricevuto da ogni lavoratore, espresso in US$ (nel 1980). Ora che conosciamo sommariamente la natura delle variabili a nostra disposizione, possiamo ispezionare dall interno la struttura del dataset [ Dati > Mostra valori ]. Osserviamo che il dataset è stato suddiviso in due parti: il primo gruppo di osservazioni (1-1569) si caratterizzano per avere la variabile male==0, ovvero vengono presentate tutte le osservazioni relative alle lavoratrici (donne); il secondo gruppo di osservazioni ( ) si riferisce invece ai lavoratori (uomini) dove la variabile assume valore male== Statistiche descrittive Procediamo ora a prendere confidenza direttamente con i dati producendo una serie di statistiche descrittive [Visualizza > Statistiche descrittive]: vedere un esempio in Figura 2. 5

6 Figura 2: Statistiche descrittive Statistiche descrittive, usando le osservazioni Media Mediana Minimo Massimo exper 8,0434 8,0000 1, ,000 male 0, ,0000 0, ,0000 school 11,631 12,000 3, ,000 wage 5,7576 5,2058 0, ,809 Dev. Std. Coeff. di variazione Asimmetria Curtosi exper 2,2907 0, , ,65477 male 0, , , ,9910 school 1,6575 0, , ,2380 wage 3,2692 0, ,9709 9,6341 Il valore medio 0.52 assunto dalla variabile dummy male indica la proporzione di uomini nel campione, confermando il fatto che nel nostro campione le osservazioni maschili eccedono quelle femminili (M: 1725; 52% vs F: 1569; 48%). Per quanto concerne il livello di istruzione, il campo di variazione della variabile (range) va da un minimo di 3 anni ad un massimo di 16 anni (laurea) dedicati agli studi. La media, che si attesta a poco meno di 12 anni di educazione (diploma/maturità) ci informa del fatto che in media la forza lavoro USA, già nel 1980, era caratterizzata da un alto livello di capitale umano. Il salario orario varia da un minimo di 0.07 $/h ad un massimo di circa 40 $/h e presenta una media pari a circa 5.8$/h. Alcuni richiami di statistica utili per l intepretazione: Mediana: si definisce come il valore assunto dalle unità statistiche che si trovano al centro della distribuzione. In sostanza la Mediana bipartisce la distribuzione in due sotto-distribuzioni di pari numerosità: la prima a sinistra della Mediana (costituita dalla metà delle unità la cui modalità è minore o uguale alla Mediana) e la seconda a destra della Mediana (costituita dalla metà delle unità la cui modalità è maggiore o uguale alla Mediana). Deviazione Standard - D.S.(Scarto Quadratico Medio): è un indice di dispersione (vale a dire una misura di variabilità di una popolazione o di una variabile casuale) 6

7 derivato direttamente dalla varianza, ha la stessa unità di misura dei valori osservati (mentre la varianza ha come unità di misura il quadrato dell unità di misura dei valori di riferimento). La deviazione standard misura la dispersione dei dati intorno al valore atteso. Coefficiente di Variazione - C.V.: è un indice di dispersione che permette di confrontare misure di fenomeni riferite a unità di misura differenti, in quanto si tratta di un numero puro (ovvero non riferito ad alcuna specifica unità di misura). Indice di Asimmetria: = 0, nel caso di perfetta simmetria < 0, per l asimmetria a sinistra (es. school) > 0, per l asimmetria a destra (es. wage) Coefficiente di Curtosi: = 0 la curva si definisce normocurtica, cioè piatta come una normale < 0 la curva si definisce platicurtica, cioè più piatta di una normale > 0 la curva si definisce leptocurtica, cioè più appuntita di una normale (es. wage). A questo punto siamo in grado di approfondire l analisi delle singole variabili a nostra disposizione. 2.7 Grafico delle Frequenze Possiamo produrre il grafico delle frequenze della variabile exper [ Variabile > Grafico delle frequenze ]: vedere Figura Analsi delle Frequenze Cumulate Possiamo ottenere l analisi delle frequenze cumulate per la variabile school[ Variabile > Frequenze cumulate ]: vedere Figura Misure di Concentrazione Per la variabile wage, in particolare, è interessante calcolare il coefficiente di concentrazione di Gini [ Variabile > Coefficiente di Gini ]. Vedere Figura 5. 7

8 Figura 3: Grafico Frequenze : exper Il coefficiente di Gini, rappresenta una misura della diseguaglianza di una distribuzione. È spesso usato per misurare la diseguaglianza nella distribuzione del reddito o anche della ricchezza. È un indice compreso tra 0 ed 1. Valori bassi del coefficiente indicano una distribuzione tendenzialmente uguale, con il valore 0 che corrisponde all uguaglianza perfetta, ad esempio la situazione in cui tutti percepiscano esattamente lo stesso reddito; valori alti del coefficiente indicano una distribuzione più diseguale, con il valore 1 che corrisponde alla più completa disuguaglianza, ovvero la situazione in cui una persona percepisce tutto il reddito del paese mentre tutti gli altri hanno un reddito nullo Campionamenti Essendo il nostro dataset suddiviso fra uomini e donne, è interessante osservare come si modifichino i caratteri a seconda del genere. 8

9 Figura 4: Statistica descrittiva delle frequenze cumulate: school Distribuzione di frequenza per school, oss Frequenza Rel. Cum ,03% 0,03% 4 2 0,06% 0,09% 5 5 0,15% 0,24% ,43% 0,67% ,73% 1,40% ,61% 4,01% ,89% 8,89% * ,11% 21,01% **** ,07% 41,07% ******* ,07% 77,14% ************ ,29% 87,43% *** ,01% 95,45% ** ,07% 99,51% * ,49% 100,00% 2.11 Campione degli Uomini Al fine di procedere con tale analisi di genere, isoliamo per primo il sottocampione (subset) di osservazioni riferite agli uomini [ Campione >Imposta in base a condizione > male==1 ]. Possiamo controllare il corretto isolamento del subset maschile ispezionando direttamente i dati dal loro interno e controllando i valori assunti dalla variabile male (==1) [ Dati > Mostra valori ]. Produciamo quindi anche in questo caso la batteria standard di statistiche descrittive relative al sotto-campione maschile [ Visualizza > Statistiche descrittive ]: vedere Figura Campione delle Donne Procediamo ora ad isolare il sottocampione di osservazioni riferite alle donne. Step (1) Ripristino campione completo: [ Campione > Ripristino campione completo ] 9

10 Figura 5: Indice di Concentrazione di Gini: wage; Gini=0, Figura 6: Statistiche descrittive sul subset uomini Statistiche descrittive, usando le osservazioni Media Mediana Minimo Massimo exper 8,3264 8,0000 2, ,000 male 1,0000 1,0000 1,0000 1,0000 school 11,442 12,000 3, ,000 wage 6,3130 5,6543 0, ,809 Dev. Std.Coeff. di variazione Asimmetria Curtosi exper 2,3592 0, , ,79417 male 0, ,00000 NA NA school 1,7373 0, , ,2408 wage 3,4989 0, ,9197 8,8164 Step (2) Definizione del sottocampione femminile: [ Campione > Imposta in base a condizione > male==0 ] 10

11 Possiamo controllare il corretto isolamento del subset femminile ispezionando direttamente i dati dal loro interno controllando i valori assunti dalla variabile male (==0) [ Dati > Mostra valori ]. Produciamo anche in questo caso la batteria di statistiche descrittive inerenti il sottocampione femminile[ Visualizza > Statistiche descrittive ]: vedere Figura 7. Figura 7: Statistiche descrittive subset donne Statistiche descrittive, usando le osservazioni Media Mediana Minimo Massimo exper 7,7323 8,0000 1, ,000 male 0, , , ,00000 school 11,837 12,000 5, ,000 wage 5,1469 4,6933 0, ,497 Dev. Std.Coeff. di variazione Asimmetria Curtosi exper 2,1715 0, , ,21116 male 0,00000 NA NA NA school 1,5394 0, , ,89434 wage 2,8762 0, , , Confronto Uomini vs Donne Con questa prima serie di statistiche descrittive dei due sottocampioni, disponiamo di informazioni utili al fine di eseguire un analisi comparativa fra le differenti caratteristiche presentate dagli uomini e donne intervistate. In primo luogo, è importante notare come in media le donne abbiano circa mezzo anno di scolarità in più rispetto agli uomini, i quali di converso mostrano in media circa mezzo anno in più di esperienza nel mondo del lavoro. Anche gli stipendi medi mostrano una sensibile differenza fra i due sessi: in media gli uomini guadagnano 1.17$/h in più rispetto alle donne (6.31$/h vs 5.14$/h). Ritorniamo ora al campione completo [ Campione > Ripristina campione completo ] per procedere con la nostra analisi. 11

12 2.14 Regressioni OLS Sulla base delle statistiche descrittive nei sottocampioni, abbiamo osservato un premio salariare a favore degli uomini, in altre parole abbiamo notato che il salario orario medio degli uomini è più alto rispetto alle donne. Ora riprodurremo lo stesso risultato utilizzando un modello di regressione semplice, stimato con il metodo dei minimi quadrati ordinari. Utilizziamo come variabile dipendente wage e includiamo tra le esplicative ( controlliamo per ) la variabile dummy male. wage = β 0 + β 1 male [ Modello > OLS: wage/cost,male ] Il risultato della stima è riportato in Figura 8. Figura 8: Regressione 1: wage = β 0 + β 1 male Modello 1: OLS, usando le osservazioni Variabile dipendente: wage coefficiente errore std. rapporto t p-value const 5, , ,37 0,0000 *** male 1, , ,39 6,71e-025 *** Media var. dipendente 5, SQM var. dipendente 3, Somma quadr. residui 34076,92 E.S. della regressione 3, R-quadro 0, R-quadro corretto 0, F(1, 3292) 107,9338 P-value(F) 6,71e-25 Log-verosimiglianza -8522,228 Criterio di Akaike 17048,46 Criterio di Schwarz 17060,66 Hannan-Quinn 17052,82 Note: SQM = scarto quadratico medio; E.S. = errore standard La costante β 0 ci informa del reddito percepito da un soggetto donna (male==0), mentre β 1 ci informa del premio salariale di cui possono beneficiare gli uomini (male==1). Entrambi i paramenti sono statisticamente significativi al livello del 1% (p-value inferiore a 0.01). Proviamo ora a introdurre nella regressione anche 12

13 le variabili school e exper per verificare il loro specifico impatto (tenendo costanti gli altri fattori, interpretazione ceteris paribus). Il risultato della stima è riportato in Figura 9. wage = β 0 + β 1 male + β 2 school + β 3 exper [ Modello > OLS: wage/cost,male,school,exper ] Figura 9: Regressione 2: wage = β 0 + β 1 male + β 2 school + β 3 exper Modello 3: OLS, usando le osservazioni Variabile dipendente: wage coefficiente errore std. rapporto t p-value const -3, , ,269 4,50e-013 *** male 1, , ,49 5,50e-035 *** school 0, , ,48 4,62e-080 *** exper 0, , ,253 1,59e-07 *** Media var. dipendente 5, SQM var. dipendente 3, Somma quadr. residui 30527,87 E.S. della regressione 3, R-quadro 0, R-quadro corretto 0, F(3, 3290) 167,6302 P-value(F) 4,0e-101 Log-verosimiglianza -8341,091 Criterio di Akaike 16690,18 Criterio di Schwarz 16714,58 Hannan-Quinn 16698,92 Note: SQM = scarto quadratico medio; E.S. = errore standard Utilizzando questa specificazione del modello, possiamo osservare come a parità di anni di educazione (school) e anni di esperienza nel mercato del lavoro (exper) un uomo guadagna 1.34$/h in più rispetto ad una donna. A parità di genere ed esperienza nel mercato del lavoro, un anno in più di educazione porta ad un aumento di 0.64$ il salario orario. Infine, a parità di genere e di anni di educazione ricevuta, un anno in più di esperienza lavorativa genera un incremento pari a 0.12$/h. Un utile modo per rendere molto intuitiva l interpretazione dei risultati derivanti dal modello di regressione, consiste nell applicare una trasformata logaritmica 13

14 alle variabili di interesse, così da ottenere risultati che possono essere interpretati in termini percentuali, ottenendo così misure di elasticità. Nella nostra indagine circa le determinanti che concorrono ad influenzare i salari, è quindi necessario creare tre nuove variabili su scala logaritmica: wage l wage [ Aggiungi > Logaritmi ] school l school [ Aggiungi > Logaritmi ] exper l exper [ Aggiungi > Logaritmi ] L interpretazione della specificazione Log(Y ) = β 0 +β 1 Log(X) è la seguente: una variazione pari all 1% di X, determina una variazione pari a β 1 % in Y, quindi β 1 rappresenta l elasticità di Y rispetto X. Calcoliamo l elasticità del salario al variare del grado di educazione (vedi risultati della stima in Figura 10) l wage = β 0 + β 1 l school [Modello > OLS : l wage/l school] Figura 10: Regressione 3.a: l wage = β 0 + β 1 l school Modello 3: OLS, usando le osservazioni Variabile dipendente: l_wage coefficiente errore std. rapporto t p-value const -1, , ,303 3,30e-010 *** l_school 1, , ,88 8,39e-055 *** Media var. dipendente 1, SQM var. dipendente 0, Somma quadr. residui 1186,072 E.S. della regressione 0, R-quadro 0, R-quadro corretto 0, F(1, 3292) 252,3170 P-value(F) 8,39e-55 Log-verosimiglianza -2991,646 Criterio di Akaike 5987,292 Criterio di Schwarz 5999,491 Hannan-Quinn 5991,659 Note: SQM = scarto quadratico medio; E.S. = errore standard 14

15 All incremento dell 1% del grado di istruzione, il salario cresce dello 1.08% circa. Calcoliamo ora l elasticità del salario al variare del grado di esperienza all interno del mercato del lavoro (risultati della stima in Figura 11) l wage = β 0 + β 1 l exper [Modello > OLS : l wage/l exper] Figura 11: Regressione 3.b: l wage = β 0 + β 1 l exper Modello 4: OLS, usando le osservazioni Variabile dipendente: l_wage coefficiente errore std. rapporto t p-value const 1, , ,23 4,86e-057 *** l_exper 0, , ,775 1,46e-011 *** Media var. dipendente 1, SQM var. dipendente 0, Somma quadr. residui 1259,417 E.S. della regressione 0, R-quadro 0, R-quadro corretto 0, F(1, 3292) 45,90566 P-value(F) 1,46e-11 Log-verosimiglianza -3090,469 Criterio di Akaike 6184,938 Criterio di Schwarz 6197,138 Hannan-Quinn 6189,305 Note: SQM = scarto quadratico medio; E.S. = errore standard All incremento dell 1% del grado di esperienza all interno del mercato del lavoro, il salario cresce dello 0.23% circa Registro dei Comadi Al fine di avere traccia di tutti i principali comandi effettuati durante la sessione di lavoro in GRETL, è possibile ottenere e salvare il Log dei comandi [ Strumenti > Visualizza log comandi > Salva ] 15

16 3 Esercitazioni 2 & 3: analisi dell efficiacia di azioni di marketing Descrizione del problema (da Franses and Paap [2001], capitolo 2 -sez e capitolo 3): Osservando i dati sulle vendite settimanali di ketchup Heinz si notano dei picchi nelle vendite. Interessa esplorare se questi picchi siano collegati alle promozioni attive sul prodotto, ed in ultima analisi verificare quale tra promozioni alternative sia la più efficace. Descrizione dei dati (da Franses and Paap [2001], capitolo 3): Il file heinz chpt3.csv contiene i dati relativi alle vendite settimanali di ketchup Heinz, misurate in dollari (US) e contiene 124 osservazioni, rilevate tra il 1985 ed il 1988 in un supermercato da A.C. Nielsen. In particolare, le variabili incluse nel data set sono: obs numero progressivo ad indicare la settimana di riferimento per la rilevazione; sales livello delle vendite settimanali misurate in dollari; price prezzo per articolo di prodotto, espresso in dollari; displayonly variabile dummy che vale 1 se il ketchup è in promozione di tipo display (ovvero in esposizione) e 0 altrimenti; coupononly variabile dummy che vale 1 se il ketchup è in promozione di tipo coupon (ovvero sul prodotto viene posto un bollino che indica che è in promozione) e 0 altrimenti; displaycoupon variabile dummy che vale 1 se il ketchup è sia in promozione di tipo coupon che in promozione di tipo display e 0 altrimenti. Obiettivi specifici dell analisi: 1. Studiare l associazione tra il livello settimanale delle vendite ed il prezzo. Commentare i risultati. 2. Studiare l associazione tra il livello settimanale delle vendite ed il prezzo, esprimendo le variabili in euro anzichè in dollari. Commentare i risultati alla luce di quanto ottenuto al punto Studiare l associazione tra il logaritmo delle vendite ed il logaritmo del prezzo. Svolgere l analisi sia esprimendo le quantità in dollari che in euro. Commentare i risultati. 16

17 4. Aggiornare le analisi al punto 3 tenendo conto della presenza di promozioni sul prodotto ketchup Heinz senza considerare l interazione tra le promozioni. Qual è secondo voi la promozione più vantaggiosa per l azienda? Motivate la risposta. 5. Esplorate se le conclusioni a cui siete giunti al punto 4, stimando un modello di regressione lineare con il metodo dei minimi quadrati, sono affidabili, usando i residui del modello per fare diagnostica. Motivate le vostre analisi e commentate i risultati delle analisi suddette. 6. Pare sensato, seguendo i risultati di precedenti analisi empiriche che valutano l effetto di promozioni dello stesso tipo su altri prodotti alimentari, considerare una specificazione del modello più flessibile che tenga conto della dinamica. In particolare, si vuole considerare il modello lsales w = α 0 + α 1 lsales w 1 + α 2 lprice w + α 3 lprice w 1 + α 4 displayonly w + α 5 displayonly w 1 + α 6 coupononly w + α 7 coupononly w 1 + α 8 displaycoupon w + α 9 displaycoupon w 1 + ε w Stimare il modello con il metodo dei minimi quadrati ordinari e valutare se tale metodo di stima risulta appropriato per il problema in esame. Commentare i risultati anche tenendo conto di quanto ottenuto al punto Alla luce dei risultati dell analisi condotta al punto precedente, dopo aver apportato le eventuali modificazioni necessarie, dare una indicazione all azienda su quale sia la promozione o combinazione di promozioni più efficace, motivando la risposta. Soluzione e (selezionato) output GRETL 1. Per studiare l associazione tra vendite e prezzo utilizziamo in prima approssimazione un modello di regressione lineare, in particolare stimiamo con il metodo dei minimi quadrati ordinari il modello in equazione (1). sales w = β 0 + β 1 price w + ε w (1) Le stime del modello ottenute con GRETL sono riportate in Figura 12. Sulla base delle stime si sarebbe portati a concludere che il prezzo non influenza 17

18 significativamente il livello delle vendite: si conclude in questa direzione sia osservando il valore della statistica t associata al parametro che esprime l effetto di una variazione unitaria di prezzo sul livello di vendite (β 1 ) 6, sia osservando il valore di probabilità osservato p-value 7, sia osservando gli estremi dell intervallo di confidenza al 95% per β 1 8. Il test F, che testa la significatività dell intera regressione, è coerente con quanto sopra riportato. In questo caso vi è un solo regressore ed è possibile dimostrare che il test F coincide con il quadrato della statistica t associata al parametro relativo all unico regressore. La quota di variabilità della variabile dipendente spiegata dal modello e misurata dall R 2 è meno dell 1% (circa 0.8%). Si osservi che, dal momento che il modello include la costante, è possibile calcolare R 2 secondo la formula R 2 = SQS SQT = 1 SQR SQT Nel caso specifico, SQT = (= (124 1)), SQR = , SQS = (SQT SQR) come si vede dalla tabella relativa a questo modello in figura 12. Il parametro β 1 in questo modello indica quale è la variazione nel livello di vendite in dollari che corrisponde ad una variazione unitaria nel livello del prezzo per articolo: un aumento di un dollaro nel prezzo porterebbe, secondo il modello, se le stime fossero significativamente diverse da zero, ad una riduzione di 110 dollari nelle vendite settimanali. 6 La statistica t assume il valore che è contenuto nella zona di accettazione del test -basata sulla distribuzione asintotica- al livello di significatività 5% [-1.96, 1.96]. Si osserva che il valore osservato del test cade anche nella zona di accettazione del test al livello di significatività 1%, ossia [-1.64, +1.64], ed ovviamente nella regione di accettazione del test al livello di significatività 10% [-2.57, 2.57]. Sulla base del valore della statistica si conclude che i dati sono coerenti con l ipotesi nulla, ovvero con l ipotesi che il vero valore del parametro sia zero. 7 Il p-value associato è infatti più alto di qualunque livello di significatività convenzionalmente adottato. 8 Il valore zero è incluso nell intervallo, quindi al 5% non possiam rigettare l ipotesi nulla che il vero valore del parametro sia zero. 18

19 2. Si stima il modello in equazione (2), analogo a quello in equazione (1), dove sia la variabile dipendente che i regressori sono espressi in euro anzichè in dollari utilizzando il tasso di cambio dollaro/euro al 28 marzo 2008 (0.6333). sales eu w = α 0 + α 1 price eu w + ǫ w (2) Si osserva che α 1 β 1. Lo stimatore ai minimi quadrati ordinari di una regressione semplice è infatti dato dal rapporto tra la covarianza tra la variabile dipendente e l esplicativa e la varianza dell esplicativa e β 1 Cov(sales,price) Var(price) α 1 Cov(sales eu,price eu) Var(price eu) = Cov(sales,price) Var(price) = Cov(sales,price) Var(price) = β 1 Il fatto che i coefficienti coicidano è quindi legato al fatto che la variazione nell unità di misura (la scala) nella variabile dipendente e dell esplicativa è la stessa e non sarebbe vero se la modificazione della scala fosse diversa per la variabile dipendente (sales) e per il regressore (price). Il coefficiente α 1 corrisponde alla variazione attesa in euro delle vendite corrispondente ad un aumento di un euro nel prezzo per articolo. Il coefficiente α 0 corrisponde al livello medio delle vendite in euro (si osservi che la stima di questo coefficiente è pari a β 0 ; per esercizio, utilizzando le formule per lo stimatore ai minimi quadrati ordinari di un modello di regressione semplice, mostrare perchè). Come ci si attendeva, l adattamento del modello non cambia se si cambia l unità di misura in cui sono misurate le variabili. Questo corrisponde all idea che il potere esplicativo del modello resta lo stesso, indipendentemente dall unità di misura. Anche le conclusioni inferenziali (significatività dei coefficienti e dell intera regressione) restano immutate. 19

20 Figura 12: Lab. 2: Output GRETL, domande 1-2. Modello 1: Stime OLS usando le 124 osservazioni Variabile dipendente: sales coefficiente errore std. rapporto t p-value const * price Media variabile dipendente SQM variabile dipendente Somma quadrati dei residui E.S. della regressione R-quadro R-quadro corretto F(1, 122) P-value(F) mod2: Stime OLS usando le 124 osservazioni Variabile dipendente: sales_eu coefficiente errore std. rapporto t p-value const * price_eu Media variabile dipendente SQM variabile dipendente Somma quadrati dei residui E.S. della regressione R-quadro R-quadro corretto F(1, 122) P-value(F) Log-verosimiglianza Note: SQM = scarto quadratico medio; E.S. = errore standard 20

21 3. I risultati della stima dei modelli corrispondenti a quelli in equazione (1) ed in equazione (2) dove le variabili sono espresse in scala logaritmica anzichè nei livelli, sono riportati in figura 13 e formalmente descritti nelle equazioni (3), (4). lsales w = δ 0 + δ 1 lprice w + ν w (3) lsales eu w = γ 0 + γ 1 lprice eu w + ψ w (4) In questo caso, la stima dei parametri δ 1 e γ 1 coinciderebbe anche se la variazione in scala della variabile dipendente e della variabile esplicativa non coincidessero. Ciò è dovuto all interpretazione dei coefficienti di questo modello (si veda Tabella 1): quando sia la variabile esplicativa che la dipendente sono espresse in scala logaritmica il coefficiente associato all esplicativa esprime la variazione percentuale della dipendente corrispondente ad una variazione percentuale dell esplicativa e quindi non dipende dalla scala in cui sono espresse le variabili. γ 1 ln(y) ln(x) derivata funzione composta {}}{ = y/y x/x γ 1 rappresenta l elasticità di y rispetto ad x e nel modello lineare in scala logaritmica si assume costante (si veda [Cappuccio and Orsi, 2005, pg ; 65-67] e [Monfardini, 2007, sez. 3.4]). Differentemente, nel modello espresso nei livelli, i coefficienti dipendono generalmente dalla scala in cui sono espresse le variabili. β 1 y x Dal momento che la forma funzionale per la variabile dipendente cambia tra i modelli stimati ai punti precedenti e questi modelli, non è possibile confrontare l adattamento dei modelli direttamente sulla base dell R 2 o R 2 (R 2 corretto adjusted ): i modelli non sono infatti nidificati ( nested ). L adattamento per questi modelli è comunque basso e suggerisce di modificare la specificazione del modello cercando di includere variabili per aumentarne il potere esplicativo. 21

22 Figura 13: Lab. 2: Output GRETL, domanda 3. mod3: Stime OLS usando le 124 osservazioni Variabile dipendente: lsales coefficiente errore std. rapporto t p-value const e-064 *** lprice Media variabile dipendente SQM variabile dipendente Somma quadrati dei residui E.S. della regressione R-quadro R-quadro corretto F(1, 122) P-value(F) Log-verosimiglianza Note: SQM = scarto quadratico medio; E.S. = errore standard Modello 4: Stime OLS usando le 124 osservazioni Variabile dipendente: lsales_eu coefficiente errore std. rapporto t p-value const e-027 *** lprice_eu Media variabile dipendente SQM variabile dipendente Somma quadrati dei residui E.S. della regressione R-quadro R-quadro corretto F(1, 122) P-value(F) Log-verosimiglianza Note: SQM = scarto quadratico medio; E.S. = errore standard 22

23 Tabella 1: Forme funzionali ed interpretazione dei coefficienti del modello di regressione Modello Variabile Variabile Interpretazione dipendente esplicativa coefficiente livello-livello y x y = β x livello-logaritmo y log(x) y = ( β 100 logaritmo-livello log(y) x % y = (100 β) x logaritmo-logaritmo log(y) log(x) % y = β% x un caso in cui l effetto marginale coincide con misura di elasticità Modello Var.dip. Var. esp. Inter. coef. logaritmo-logaritmo log(y) log(x) β = y/y % y x/x % x Fonte: Wooldridge [2006]. Nota su trasformazione logaritmica La trasformazione logaritmica è una trasformazione frequentemente utilizzata nelle elaborazioni questo perchè la trasformazione permette di ridurre la variabilità della serie originaria (si confronti il range di variazione della variabile sales ed lsales) e rende la distribuzione più simmetrica (vedere grafici in Figura 14). La trasformazione logaritmica è una particolare trasformazione nella classe delle trasformazioni di Box-Cox. Inoltre, come si è visto, nel caso del modello di regressione lineare quando sia la dipendente che l esplicativa di interesse sono espresse in logaritmi i parametri corrispondenti assumono una interpretazione molto conveniente, quella di elasticità. 4. Si considera il modello dove la variabile dipendente è espressa in logaritmi perchè risulta più adeguata in questo caso l ipotesi di normalità (si vedano i grafici in Figura 14; si noti che esistono anche procedure formali per testare l ipotesi di normalità di una variabile casuale, tra gli altri il test proposto da Jarque e Bera trattato nel testo -[Cappuccio and Orsi, 2005, sez ]- con riferimento ai residui ma non trattato in questo corso) che permette di avere risultati esatti sulla distribuzione dello stimatore ai minimi quadrati ordinari 23

24 Figura 14: Istogramma delle vendite di ketchup in dollari e del logaritmo delle vendite. Fonte dati: Franses e Paap (2001). 24

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Esercizio 1 Si consideri il seguente modello ad effetti fissi con variabili binarie: + 1 2 a) supponete che N=3. Si mostri che i regressori

Dettagli

Elevata capacit di ripagare il debito Alta capacit di pagare il debito Solida capacit di ripagare il debito, che potrebbe essere influenzata da circostanze avverse Adeguata capacit di rimborso, che per

Dettagli

Modello di regressione lineare

Modello di regressione lineare Modello di regressione lineare a cura di Giordano dott. Enrico enrico.giordano@meliorbanca.com Nel presente lavoro viene descritto in modo dettagliato (attraverso anche un impatto visivo), l analisi di

Dettagli

STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2

STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2 STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2 Introduzione all uso di EViews di Daniele Toninelli 1. INTRODUZIONE ad EViews

Dettagli

Excel Terza parte. Excel 2003

Excel Terza parte. Excel 2003 Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina

Dettagli

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie Università del Piemonte Orientale Corso di dottorato in medicina molecolare aa 2002 2003 Corso di Statistica Medica Inferenza sulle medie Statistica U Test z Test t campioni indipendenti con uguale varianza

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Regressione con Variabili Dummy Regressione con Variabili Dummy La

Dettagli

1 La Matrice dei dati

1 La Matrice dei dati Dispense sull uso di Excel Daniela Marella 1 La Matrice dei dati Un questionario è costituito da un insieme di domande raccolte su un determinato supporto (cartaceo o elettronico) e somministrate alla

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Note introduttive Il software econometrico Easy Reg è scaricabile gratuitamente da internet (http://econ.la.psu.edu/~hbierens/easyreg.

Note introduttive Il software econometrico Easy Reg è scaricabile gratuitamente da internet (http://econ.la.psu.edu/~hbierens/easyreg. Note introduttive Il software econometrico Easy Reg è scaricabile gratuitamente da internet (http://econ.la.psu.edu/~hbierens/easyreg.htm) Per importare i dati in Easy Reg bisogna: 1. Cambiare le impostazioni

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

IBM SPSS Regression 21

IBM SPSS Regression 21 IBM SPSS Regression 21 Nota: Prima di utilizzare queste informazioni e il relativo prodotto, leggere le informazioni generali disponibili in Note a pag. 44. Questa versione si applica a IBM SPSS Statistics

Dettagli

ECONOMETRIA APPLICATA Prof. Rocco Mosconi Prova scritta del 13/5/2005

ECONOMETRIA APPLICATA Prof. Rocco Mosconi Prova scritta del 13/5/2005 Prova scritta del 13/5/2005 Disponiamo di dati cross-section relativi al 1982 per 595 lavoratori americani, tratti dal data base PSID (Panel Study of Income Dynamics, Cornwell-Rupert, 1988). Le variabili

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Esercizi: i rendimenti finanziari

Esercizi: i rendimenti finanziari Esercizi: i rendimenti finanziari Operazioni algebriche elementari Distribuzione e dipendenza Teoria di probabilità Selezione portafoglio p. 1/25 Esercizio I Nella tabella sottostante relativa all indice

Dettagli

Esercitazione di riepilogo 23 Aprile 2013

Esercitazione di riepilogo 23 Aprile 2013 Esercitazione di riepilogo 23 Aprile 2013 Grafici Grafico a barre Servono principalmente per rappresentare variabili (caratteri) qualitative, quantitative e discrete. Grafico a settori circolari (torta)

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità

Dettagli

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Politecnico di Milano - Anno Accademico 200-20 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Esercitazione 9 2 Giugno 20 Esercizio. In un laboratorio per il test dei materiali,

Dettagli

Esplorazione dei dati

Esplorazione dei dati Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione

Dettagli

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori AA 2014-2015 Paolo Brunori domande di mutui rigettate - nei dati raccolti a Boston negli anni 90 il tasso di rifiuto è 28% per i neri e 9% per i bianchi - si può parlare di discriminazione? - è possibili

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Contenuto del libro...2 Convenzioni utilizzate nel libro...2

Contenuto del libro...2 Convenzioni utilizzate nel libro...2 Indice Introduzione... 1 Contenuto del libro...2 Convenzioni utilizzate nel libro...2 I INTERVALLI E FORMULE DI EXCEL 1 Ricavare il massimo dagli intervalli.... 7 Tecniche avanzate di selezione degli intervalli...7

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette

Dettagli

La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali

La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali Elementi di Analisi Multivariata V SCUOLA ESTIVA AISV 5 -- 9 ottobre 009 - Soriano nel Cimino (VT) Sabrina Giordano Dipartimento

Dettagli

Esercizi di Statistica

Esercizi di Statistica Esercizi di Statistica Selezione di esercizi proposti durante le esercitazioni dei corsi di Statistica tenute presso la Facoltà di Economia dell Università di Salerno Versione del 17 ottobre 2006 2 Per

Dettagli

MODELLO DI REGRESSIONE PER DATI DI PANEL

MODELLO DI REGRESSIONE PER DATI DI PANEL MODELLO DI REGRESSIONE PER DAI DI PANEL 5. Introduzione Storicamente l analisi econometrica ha proceduto in due distinte direzioni: lo studio di modelli macroeconomici, sulla base di serie temporali di

Dettagli

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città

Dettagli

Regressione lineare multipla Strumenti quantitativi per la gestione

Regressione lineare multipla Strumenti quantitativi per la gestione Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Dai dati al modello teorico

Dai dati al modello teorico Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere

Dettagli

Problema pratico: Test statistico = regola di decisione

Problema pratico: Test statistico = regola di decisione La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario

Dettagli

IBM SPSS Regression 19

IBM SPSS Regression 19 IBM SPSS Regression 19 Note: Before using this information and the product it supports, read the general information under Notices a pag. 46. This document contains proprietary information of SPSS Inc,

Dettagli

1. Richiami di Statistica. Stefano Di Colli

1. Richiami di Statistica. Stefano Di Colli 1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto

Dettagli

(accuratezza) ovvero (esattezza)

(accuratezza) ovvero (esattezza) Capitolo n 2 2.1 - Misure ed errori In un analisi chimica si misurano dei valori chimico-fisici di svariate grandezze; tuttavia ogni misura comporta sempre una incertezza, dovuta alla presenza non eliminabile

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Corso di Statistica Medica Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Sono previste 40 ore complessive, di cui almeno 16 di lezione frontale e le restanti

Dettagli

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di

Dettagli

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107 t-test test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie Calcola medie e altre statistiche

Dettagli

Gestione ed Analisi Statistica dei dati

Gestione ed Analisi Statistica dei dati Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 13 giugno 2014 Argomenti Parte teorica Relazioni

Dettagli

CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT

CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT CONVENZIONE SULLE CIFRE SIGNIFICATIVE La convenzione usata sul troncamento delle cifre è troncare

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7. Maria Elena Bontempi e.bontempi@economia.unife.it

LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7. Maria Elena Bontempi e.bontempi@economia.unife.it LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7 Maria Elena Bontempi e.bontempi@economia.unife.it VI LEZIONE: Analisi dei residui di stima: outlier, eteroschedasticità. Leverage.

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico Capitolo 4 4.1 Il foglio elettronico Le più importanti operazioni richieste dall analisi matematica dei dati sperimentali possono essere agevolmente portate a termine da un comune foglio elettronico. Prenderemo

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Corso di Statistica Medica 2004-2005 Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Sono previste 30 ore di lezione di statistica e 12 di

Dettagli

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Verifica di ipotesi e intervalli di confidenza nella regressione multipla Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo

Dettagli

Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Secondo foglio di esercizi per l esame.

Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Secondo foglio di esercizi per l esame. Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Secondo foglio di esercizi per l esame. Ognuno deve svolgere ambedue gli esercizi (a) e (b) del numero (da 1 a 9) assegnato. Bisogna scrivere un

Dettagli

Statistica. Alfonso Iodice D Enza iodicede@unina.it

Statistica. Alfonso Iodice D Enza iodicede@unina.it Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 16 Outline 1 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello

Dettagli

Appunti di Econometria

Appunti di Econometria Appunti di Econometria ARGOMEO [5]: ANALISI DEI DATI PANEL Maria Luisa Mancusi Università Bocconi Novembre 2009 1 I dati panel Un panel è un campione che contiene osservazioni su N individui per T anni.

Dettagli

Formazione Aziendale per la Qualità

Formazione Aziendale per la Qualità 4 Corsi e Formazione per la Qualità Formazione Aziendale per la Qualità Il nostro obiettivo L organizzazione, l analisi e l interpretazione dei dati aziendali all interno del proprio business, può rappresentare

Dettagli

Elaborazione dati in Analisi Sensoriale

Elaborazione dati in Analisi Sensoriale Elaborazione dati in Analisi Sensoriale Si è parlato di interpretazione corretta dei risultati ottenuti; a questo concorrono due fattori: affidabilità e validità. Se i test fossero stati ripetuti con lo

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 39 Introduzione Come si è detto,

Dettagli

1. Introduzione. 1.1 Cos è l econometria?

1. Introduzione. 1.1 Cos è l econometria? 1. Introduzione 1.1 Cos è l econometria? L econometria si occupa dello studio quantitativo delle relazioni economiche. Rappresenta lo strumento per interpretare la realtà alla luce della teoria economica,

Dettagli

Statistica Medica. Verranno presi in esame:

Statistica Medica. Verranno presi in esame: Statistica Medica Premessa: il seguente testo cerca di riassumere e rendere in forma comprensibile ai non esperti in matematica e statistica le nozioni e le procedure necessarie a svolgere gli esercizi

Dettagli

Cap. 3 - L'analisi dei dati

Cap. 3 - L'analisi dei dati Capitolo 3 L analisi dei dati 3.1. Relazioni tra grandezze fisiche Uno degli aspetti più importanti della fisica sperimentale è la ricerca di una relazione matematica in grado di interpretare il tipo di

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

UNIVERSITÁ DEGLI STUDI DI PADOVA

UNIVERSITÁ DEGLI STUDI DI PADOVA UNIVERSITÁ DEGLI STUDI DI PADOVA FACOLTÁ DI SCIENZE STATISTICHE CORSO DI LAUREA IN STATISTICA E GESTIONE DELLE IMPRESE La spesa in farmaci nella regione Friuli Venezia Giulia: alcune analisi. Relatore:

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Excel Guida introduttiva

Excel Guida introduttiva Excel Guida introduttiva Informativa Questa guida nasce con l intento di spiegare in modo chiaro e preciso come usare il software Microsoft Excel. Questa è una guida completa creata dal sito http://pcalmeglio.altervista.org

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

Esercizio 1. Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli.

Esercizio 1. Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli. Esercizio 1 Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli. Tabella A 138 150 144 149 164 132 125 157 161 135 150 145 145 142 156

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

UNIVERSITÀ DEGLI STUDI DI PADOVA Facoltà di Scienze Statistiche

UNIVERSITÀ DEGLI STUDI DI PADOVA Facoltà di Scienze Statistiche UNIVERSITÀ DEGLI STUDI DI PADOVA Facoltà di Scienze Statistiche CORSO DI LAUREA IN STATISTICA ECONOMIA E FINANZA TESI: BORSA E CICLO ECONOMICO: UNA VERIFICA EMPIRICA PER IL CASO STATUNITENSE Relatore:

Dettagli

6. Modelli statistici: analisi della regressione lineare

6. Modelli statistici: analisi della regressione lineare BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione in base ad informazioni ricavate da un campione. Inferenza statistica: indurre

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

= E(X t+k X t+k t ) 2 + 2E [( X t+k X t+k t + E

= E(X t+k X t+k t ) 2 + 2E [( X t+k X t+k t + E 1. Previsione per modelli ARM A Questo capitolo è dedicato alla teoria della previsione lineare per processi stocastici puramente non deterministici, cioè per processi che ammettono una rappresentazione

Dettagli

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Laurea in Ingegneria Meccatronica A.A. 2010 2011 n-dimensionali Riepilogo. Gli esiti di un esperimento aleatorio

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per continue. Alessandro Valbonesi. SARRF di Scienze ambientali

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per continue. Alessandro Valbonesi. SARRF di Scienze ambientali LEZIONI DI STATISTCA APPLICATA Parte 2 Statistica inferenziale Variabili continue per continue Alessandro Valbonesi SARRF di Scienze ambientali Anno accademico 2010-11 CAPITOLO 7 - RELAZIONI TRA DUE O

Dettagli

CONFRONTO TRA TECNICHE DI PREVISIONE: Processi regressivi e reti neurali artificiali

CONFRONTO TRA TECNICHE DI PREVISIONE: Processi regressivi e reti neurali artificiali Paolo Mezzera Ottobre 2003 CONFRONTO TRA TECNICHE DI PREVISIONE: Processi regressivi e reti neurali artificiali Questo lavoro ha lo scopo di confrontare previsioni ottenute mediante processi regressivi

Dettagli

Analisi dei dati. Statistica descrittiva

Analisi dei dati. Statistica descrittiva Analisi dei dati DATI GREZZI SINTESI DELLE OSSERVAZIONI ELABORAZIONE DATI Statistica descrittiva Si occupa dell analisi di un certo fenomeno relativo a un certo gruppo di soggetti (popolazione) sulla base

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste per la maggior parte nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo come esempio il data

Dettagli

DATA MINING PER IL MARKETING

DATA MINING PER IL MARKETING DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Algoritmi di classificazione Zani-Cerioli, Cap. XI CHAID: Chi-square Automatic Interaction

Dettagli

GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno

GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno La Vista CAS L ambiente di lavoro Le celle Assegnazione di una variabile o di una funzione / visualizzazione

Dettagli

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali)

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali) RICERCHE DI MERCATO 5.6 Analisi Fattoriale (Componenti Principali) Prof. L. Neri Dip. di Economia Politica Premessa Come evidenziato in precedenza l approccio di segmentazione per omogeneità prevede la

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

CORSO DI MISURE ANALISI DEI SEGNALI NEL DOMINIO DEL TEMPO

CORSO DI MISURE ANALISI DEI SEGNALI NEL DOMINIO DEL TEMPO CORSO DI MISURE ANALISI DEI SEGNALI NEL DOMINIO DEL EMPO ing Emanuele Zappa SEGNALI: grandezze di base nel dominio del tempo: Ampiezza picco-picco (pk.pk) Ampiezza massima positiva empo Ampiezza massima

Dettagli

Dipartimento di Scienze dell Educazione Università degli studi Roma Tre

Dipartimento di Scienze dell Educazione Università degli studi Roma Tre Dipartimento di Scienze dell Educazione Università degli studi Roma Tre Materiale del Laboratorio sulle Procedure Statistiche di base con SPSS CASD Centro Analisi Statistica Dati 1 1. Il Questionario Nella

Dettagli

3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS

3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS Per utilizzare SPSS sui PC dell aula informatica occorre accedere come: ID: SPSS Password: winidams Testo rapido di consultazione: Fideli R. Come analizzare i dati al computer. ed. Carocci, Urbino, 2002.

Dettagli

Accuratezza di uno strumento

Accuratezza di uno strumento Accuratezza di uno strumento Come abbiamo già accennato la volta scora, il risultato della misurazione di una grandezza fisica, qualsiasi sia lo strumento utilizzato, non è mai un valore numerico X univocamente

Dettagli

Concetti introduttivi

Concetti introduttivi Indice 1 Concetti introduttivi 3 1.1 Studi sperimentali e studi osservazionali..................... 3 1.2 Concetti iniziali: indipendenza fra eventi..................... 6 1.3 Indipendenza fra variabili

Dettagli

Laboratorio di Statistica con R

Laboratorio di Statistica con R Laboratorio di Statistica con R R è un vero e proprio linguaggio di programmazione. Il suo nome, è dovuto probabilmente al nome dei suoi sviluppatori:robert Gentleman e Ross Ihaka Le principali funzioni

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Introduzione Livelli di significatività Verifica di ipotesi sulla media di una popolazione normale Verifica di ipotesi sulla varianza di una popolazione normale Verifica di ipotesi

Dettagli

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione

Dettagli

Regressione logistica

Regressione logistica Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer Metodi di classificazione Tecniche principali Alcuni esempi Data set Default I dati La regressione logistica Esempio Il modello

Dettagli

Cenni di statistica descrittiva

Cenni di statistica descrittiva Cenni di statistica descrittiva La statistica descrittiva è la disciplina nella quale si studiano le metodologie di cui si serve uno sperimentatore per raccogliere, rappresentare ed elaborare dei dati

Dettagli