LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7. Maria Elena Bontempi
|
|
- Alessandra Rossini
- 8 anni fa
- Visualizzazioni
Transcript
1 LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7 Maria Elena Bontempi e.bontempi@economia.unife.it VI LEZIONE: Analisi dei residui di stima: outlier, eteroschedasticità. Leverage. Stimatori robusti. Esempio di perfetta collinearità: dummy variable trap Banca dati scolari list y eta f m y eta f m Percentuale di femmine tab f F Freq. Percent Cum Total La regressione con variabile dipendente la dummy e regressore la sola costante dà come stima la media della dummy, ossia la frequenza di osservazioni relative alle femmine. reg f Source SS df MS Number of obs = F( 0, 9) = 0.00 Model Prob > F =. Residual R-squared = Adj R-squared = Total Root MSE =.5164 f Coef. Std. Err. t P> t [95% Conf. Interval] _cons Media dell'abilità di lettura nei maschi e nelle femmine sort f 1
2 by f: summ y -> f = 0 Variable Obs Mean Std. Dev. Min Max y > f = 1 Variable Obs Mean Std. Dev. Min Max y TRE specificazioni alternative del modello con dummy: A B C Costante: valore medio di y quando x=0; pertanto, indica l'abilità di lettura media nei maschi (se includo la dummy femmine, come in A) oppure nelle femmine (se includo la dummy maschi, come in B). Coefficiente associato alla dummy: differenza tra abilità di lettura media dei maschi e delle femmine; se non significativo, il genere non conta nello spiegare l'abilità di lettura, ossia l'abilità di lettura media delle femmine non è statisticamente diversa da quella dei maschi. Nella specificazione C si ottengono le due medie, maschi e femmine. Dummy variable trap: se si utilizzano come esplicative p dummy o si includono tutte le p dummy e si omette la costante, oppure si includono p-1 dummy e la costante (specificazione più utile per verificare la presenza di differenze significative rispetto all'individuo-base rappresentato dalla costante). Non includere p dummy e costante (specificazione D) perchè si ottiene perfetta collinearità! A. reg y f Source SS df MS Number of obs = F( 1, 8) = 0.54 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = y Coef. Std. Err. t P> t [95% Conf. Interval] f _cons B. reg y m Source SS df MS Number of obs = F( 1, 8) = 0.54 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = y Coef. Std. Err. t P> t [95% Conf. Interval] m _cons
3 C. reg y f m, noconst Source SS df MS Number of obs = F( 2, 8) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = y Coef. Std. Err. t P> t [95% Conf. Interval] f m D. reg y f m Source SS df MS Number of obs = F( 1, 8) = 0.54 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = y Coef. Std. Err. t P> t [95% Conf. Interval] f m (dropped) _cons Risposte all'esercizio A CASA associato alla lezione V Banca dati URBAN.DTA Regressione semplice reg homic poor Source SS df MS Number of obs = F( 1, 18) = 6.14 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = homic Coef. Std. Err. t P> t [95% Conf. Interval] poor _cons Regressione multivariata: ora il coefficiente associato a poor misura l'incremento del tasso di omicidi per un incremento 3
4 unitario della % di famiglie sotto la soglia di povertà, se la popolazione delle città rimane immutata. reg homic poor pop Source SS df MS Number of obs = F( 2, 17) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = homic Coef. Std. Err. t P> t [95% Conf. Interval] poor pop _cons Il coefficiente associato a poor scende da 0.94 a 0.65: parte dell'effetto di poor nella regressione semplice era dovuto al fatto che la % di famiglie sotto la soglia di povertà ed il tasso di omicidi sono entrambi maggiori in città con popolazione più elevata. graph homic poor pop, matrix half label s([city]) Homicides/100,000 people 15 Columbus Rocheste 10 5 Berkeley Erie Salt Lak Peoria Albuquer AllentowPortland Virginia Honolulu Tulsa Milwauke Tempe Fullerto Concord Independ Sunnyval Sterling Dallas Percent families below poverty 0 Dallas Dallas Milwauke Portland Honolulu Albuquer Tulsa Virginia Rocheste Salt Lak Columbus Sterling Sunnyval Fullerto Concord Independ Allentow Tempe Peoria Erie Berkeley Milwauke Honolulu Tulsa Portland Albuquer Virginia Rocheste Salt Lak Columbus Sterling Sunnyval Concord Independ Fullerto Tempe Allentow Peoria ErieBerkeley Population in 1,000s La correlazione positiva tra poor e pop è dovuta principalmente a Dallas corr poor pop (obs=20) poor pop
5 poor pop corr poor pop if city!="dallas" (obs=19) poor pop poor pop Tuttavia, la correlazione tra poor e pop non è tale da fare temere problemi di multicollinearità. Inoltre, test t e F sono tra loro coerenti. In generale, per analizzare le correlazioni tra variabili può essere utile il comando pwcorr homic poor pop, star(.05) homic poor pop homic poor * pop * A differenza di corr, pwcorr permette l'opzione star(.05) che aggiunge un asterisco per le correlazioni significative al 5%. Analisi preliminare dei residui di regressione Data la regressione su cui (si spera!) avete svolto l'esercizio associato alla lezione V (reg homic poor pop), si costruiscono i dati fitted e si calcolano i residui della regressione: predict homichat g res=homic-homichat summ homic homichat res Variable Obs Mean Std. Dev. Min Max homic homichat res e (nota che la media di res è zero e che y e fit hanno la stessa media) L analisi dei residui della regressione (res) è la principale fase diagnostica della specificazione del modello; su di essa si basano i test di scorretta specificazione, da effettuare prima di procedere ai test di significatività (fondati sull'assioma di corretta specificazione del modello). I residui sono la stima degli errori ε (variabili casuali non osservabili). Ispezione preliminare dei residui. Una prima ispezione grafica dei residui contro i dati fitted può essere illuminante perché è in grado di evidenziare una serie di potenziali problematiche. (Si ricordano i temi dell' analisi univariata e multivariata dei dati, lezioni I e II). rvfplot,oneway twoway box yline(0) ylabel xlabel 5
6 10 5 Residuals Fitted values (nota che la retta in corrispondenza di 0 indica la media zero dei residui) rvfplot effettua il grafico residui contro fitted dell'ultima regressione effettuata. Nel caso di un modello ideale (con residui ideali), la retta di regressione (iperpiano nel caso di più regressori) riproduce abbastanza fedelmente l andamento dello scatter y - x e, quindi, i residui dovrebbero disporsi casualmente sopra e sotto tale retta. Quando invece i residui presentano un pattern non casuale, come in questo caso, allora è meglio rivedere la specificazione del modello perché tale pattern anomalo segnala problemi interpretativi della regressione proposta. Il fatto più evidente dall analisi grafica è che Dallas è, al contempo, caratterizzata da un elevato fit di homic e da un elevato errore positivo (il modello stimato sottostima il dato effettivo). Inoltre, nel complesso, si nota la tendenza ad ampliarsi della dispersione dei punti sopra e sotto la retta a mano a mano che aumentano i fitted values. Una dispersione dei residui crescente con il fit porta a pensare a rischi di eteroschedasticità (vedi test sotto) Simmetria e outlier della distribuzione dei residui: statistiche descrittive dei residui, test di normalità dei residui e boxplot del grafico precedente indicano una molto modesta asimmetria dei residui e una non particolarmente grave presenza di curtosi. Al 5% non si rifiuta l ipotesi di normalità dei residui (p-value = 9.3% nel complesso) e questo è particolarmente utile in piccoli campioni (quali quello in uso) in cui non ci si può riferire alla teoria asintotica; ciò garantisce distribuzioni «abbastanza» standard per le statistiche test (t, F, chi-quadro). In particolare, si nota che l outlier Dallas provoca un segnale di curtosi (il p-value è 3.2%). summ res, d Residuals Percentiles Smallest 1% % % Obs 20 25% Sum of Wgt % Mean -2.19e-08 6
7 Largest Std. Dev % % Variance % Skewness % Kurtosis sktest res Skewness/Kurtosis tests for Normality joint Variable Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi res E accettata l ipotesi nulla di simmetria, è rifiutata al 5% l ipotesi nulla di kurtosis pari a 3, congiuntamente la normalità è rifiutata al 5% ed accettata al 10%: possibile eteroschedasticità e presenza di un outlier. Test di scorretta specificazione: test di eteroschedasticità Le ipotesi sugli errori del modello classico di regressione lineare sono ε ~ iid(0,σ 2 ). L ipotesi E(ε) = 0 è sempre verificata alla luce dei residui: la somma dei residui è sempre zero a patto che la specificazione del modello includa la costante (vedi summ res). L ipotesi di errori independently distributed (non correlazione fra gli errori relativi ad osservazioni diverse) spesso non ha senso in modelli cross-section (l ordine delle osservazioni non è univoco e, comunque, il problema è evitato con opportune tecniche di campionamento casuale delle osservazioni). Al contrario, la correlazione tra gli errori (autocorrelazione) è molto rilevante nelle analisi delle serie storiche. Nel caso di modelli per cross-section (i cui dati sono caratterizzati da forte variabilità), il principale problema di scorretta specificazione è l eteroschedasticità (la varianza degli errori non è la stessa per tutte le osservazioni) e la non validità dell assunzione di errori identically distributed. In generale, la validità delle ipotesi del modello classico di regressione lineare è verificata con l ausilio dei test di scorretta specificazione i quali: (a) si basano sui residui (b) sotto la nulla hanno la validità della corrispondente ipotesi del modello classico; più problematica è la specificazione dell'ipotesi alternativa (c) vengono logicamente prima dei test di significatività (la significatività dei parametri del modello va valutata solo quando si è "sicuri" della corretta specificazione del modello, ossia i residui sono well behaved) Il test di eteroschedasticità ha sotto l ipotesi nulla errori omoschedastici (H0: σ 2 costante per tutte le ossevazioni), ma come specificare l ipotesi alternativa? Varianza non costante implica la scelta di uno specifico modello di riferimento per tale assenza di costanza. Una classica ipotesi alternativa è che la variabilità degli errori (eteroschedasticità) cambi al cambiare del quadrato dei regressori oppure del fitted. hettest poor pop Cook-Weisberg test for heteroskedasticity using variables specified Ho: Constant variance chi2(2) = Prob > chi2 = hettest Cook-Weisberg test for heteroskedasticity using fitted values of homic Ho: Constant variance chi2(1) = Prob > chi2 = Rifiutando la nulla, il test conferma i dubbi dell analisi grafica: i residui del modello sono tali da spingerci a rifiutare che gli 7
8 errori siano omoschedastici. Si sottolinea che, in presenza di eteroschedasticità degli errori, lo stimatore OLS perde la proprietà dell efficienza (varianza minima) e, quindi, l inferenza sui parametri (l analisi t e F di significatività ) ne è contaminata. Un modo di superare l eteroschedasticità evitando la rispecificazione del modello è quello di utilizzare tecniche di stima della varianza robuste al problema dell'eteoschedasticità: reg homic poor pop, robust Regression with robust standard errors Number of obs = 20 F( 2, 17) = Prob > F = R-squared = Root MSE = Robust homic Coef. Std. Err. t P> t [95% Conf. Interval] poor pop _cons Si noti che la stima dei parametri è la stessa; ciò che cambia sono solo gli standar errors delle stime. Le conclusioni del modello OLS non vengono modificate: entrambi i parametri sono significativamente diversi da zero. Test di scorretta specificazione: test RESET Un test generale di scorretta specificazione è il test RESET di Ramsey (1969): RE(gression) S(pecification) E(rror) T(est). Talvolta, tale test è detto di linearità perché regredisce la variabile dipendente y sulle esplicative e sulle potenze seconde, terze e quarte di fit, dopodiché effettua un test F di significatività degli ultimi tre parametri: ovtest Ramsey RESET test using powers of the fitted values of homic Ho: model has no omitted variables F(3, 14) = Prob > F = Il rifiuto dell ipotesi nulla implica il rischio di omissione di elementi non lineari (ad esempio quadratici) nella relazione, con l evidente rischio di stimatori distorti e inconsistenti. Nel presente caso, però, il fatto può essere in gran parte attribuibile alla presenza dell outlier Dallas (elevato homic ed elevato residuo). Esercizio PER GLI STUDENTI: Fino a che punto i problemi sopra sono ricollegabili alla presenza di outlier? [suggerimento: regredisci il modello senza Dallas e poi analizza i residui della nuova stima.] La tecnica dell'esercizo per gli studenti di escludere alcune osservazioni «anomale» dal campione di stima del modello e «vedere cosa succede alla regressione» è un modo naive di affrontare il problema dei dati influenti. L uso dell indicatore di leverage Cook s D misura la rilevanza di ciascuna osservazione nell influenzare i risultati di stima. predict D, cooksd graph res homichat [iweight=d], ylabel xlabel yline(0) 8
9 10 5 Residuals Fitted values Come lecito attendersi dalle precedenti analisi, il dato di Dallas è influente e sicuramente è anche un outlier della distribuzione di homic. In questi casi è bene cercare di capire quanto è influente. La nota fragilità degli OLS nei confronti di outliers può essere fortunatamente superata dall uso di uno stimatore robusto per i parametri del modello. Essenzialmente, la tecnica assegna un peso (influenza) ridotto alle osservazioni a cui si associano outliers. Quando un outlier è particolarmente severo, l osservazione è esclusa, cioè il suo peso è = 0; nella regressione robusta che segue N=19, ossia Dallas è stata esclusa. rreg homic poor pop Huber iteration 1: maximum difference in weights = Huber iteration 2: maximum difference in weights = Biweight iteration 3: maximum difference in weights = Biweight iteration 4: maximum difference in weights = Robust regression estimates Number of obs = 19 F( 2, 16) = Prob > F = homic Coef. Std. Err. t P> t [95% Conf. Interval] poor pop _cons Le stime e l inferenza non risultano troppo modificate. In particolare, l esito «robusto» in questo caso è molto simile a ciò che si è ottenuto (come esercizio) escludendo Dallas: reg homic poor pop if homic<25 Source SS df MS Number of obs = 19 9
10 F( 2, 16) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = homic Coef. Std. Err. t P> t [95% Conf. Interval] poor pop _cons
OLS multivariato: effetti parziali, multicollinearità
OLS multivariato: effetti parziali, multicollinearità CONCETTI DA RECUPERARE Per stimare questo modello utilizziamo le seguenti variabili esplicative educ, exper e tenure Primo passo da compiere sarà quello
DettagliFACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA
FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliLEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
DettagliRegressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
Dettagli1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliRegressione Lineare con un Singolo Regressore
Regressione Lineare con un Singolo Regressore Quali sono gli effetti dell introduzione di pene severe per gli automobilisti ubriachi? Quali sono gli effetti della riduzione della dimensione delle classi
DettagliVERIFICA DELLE IPOTESI
VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi
DettagliSTATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE
STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
DettagliANALISI DI CORRELAZIONE
ANALISI DI CORRELAZIONE Esempio: Dati raccolti da n = 129 studenti di Pavia (A.A. 21/2) Altezza (cm) Peso (Kg) Voto Algebra e Geometria Voto Fisica I Valutare la correlazione delle seguenti coppie: Peso
DettagliSoluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)
Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città
DettagliInferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
DettagliAnalisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione
DettagliCorso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Analisi della varianza (ANOVA) Analisi della varianza Analisi della varianza (ANOVA) ANOVA ad
Dettagli> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.
A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.
DettagliUniversità di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008
Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliStatistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014
Dettagli1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.
Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi
Dettagli(a cura di Francesca Godioli)
lezione n. 12 (a cura di Francesca Godioli) Ad ogni categoria della variabile qualitativa si può assegnare un valore numerico che viene chiamato SCORE. Passare dalla variabile qualitativa X2 a dei valori
DettagliStatistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) La Regressione Multipla La Regressione Multipla La regressione multipla
DettagliMetodi Matematici e Informatici per la Biologia----31 Maggio 2010
Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o
DettagliCapitolo 13: L offerta dell impresa e il surplus del produttore
Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:
Dettagli3. Confronto tra medie di due campioni indipendenti o appaiati
BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliStatistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.
Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni
DettagliEsercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test
STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
DettagliIl metodo della regressione
Il metodo della regressione Consideriamo il coefficiente beta di una semplice regressione lineare, cosa significa? È una differenza tra valori attesi Anche nel caso classico di variabile esplicativa continua
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
DettagliPro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food
DettagliTitolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza
Titolo della lezione Analisi dell associazione tra due caratteri: indipendenza e dipendenza Introduzione Analisi univariata, bivariata, multivariata Analizzare le relazioni tra i caratteri, per cercare
DettagliStatistica descrittiva
Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto
DettagliVerifica di ipotesi e intervalli di confidenza nella regressione multipla
Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
DettagliAnalisi della performance temporale della rete
Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliSiamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.
DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti
DettagliIL TEST CHI QUADRATO χ 2
IL TEST CHI QUADRATO χ 2 Test parametrici I test studiati nelle lezioni precedenti (test-t, testz) consentono la verifica di ipotesi relative al valore di specifici parametri di popolazione Esempio: differenza
DettagliEsercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010
Esercizi test ipotesi Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe
DettagliDisegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Indici di Affidabilità L Attendibilità È il livello in cui una misura è libera da errore di misura È la proporzione di variabilità della misurazione
DettagliCalcolo delle probabilità
Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità
Dettaglilezione 18 AA 2015-2016 Paolo Brunori
AA 2015-2016 Paolo Brunori Previsioni - spesso come economisti siamo interessati a prevedere quale sarà il valore di una certa variabile nel futuro - quando osserviamo una variabile nel tempo possiamo
DettagliI ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale
I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che
DettagliTest statistici di verifica di ipotesi
Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall
Dettagliiovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi
iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso
Dettagli11. Analisi statistica degli eventi idrologici estremi
. Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito Soluzioni della simulazione del 17/05/2011 Gianmarco Altoè Dipartimento di Psicologia Università di Cagliari, Anno Accademico 2010-2011 Leggere BENE le avvertenze prima
DettagliINDICE PREFAZIONE VII
INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione
DettagliVALORE DELLE MERCI SEQUESTRATE
La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune
DettagliMODELLO DI REGRESSIONE PER DATI DI PANEL
MODELLO DI REGRESSIONE PER DAI DI PANEL 5. Introduzione Storicamente l analisi econometrica ha proceduto in due distinte direzioni: lo studio di modelli macroeconomici, sulla base di serie temporali di
DettagliEsercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)
Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso
Dettagli1 BREVE RIPASSO DEI TEST STATISTICI 2 I TEST STATISTICI NEI SOFTWARE ECONOMETRICI E IL P-VALUE 3 ESERCIZI DI ALLENAMENTO
I TEST STATISTICI E IL P-VALUE Obiettivo di questo Learning Object è ripassare la teoria ma soprattutto la pratica dei test statistici, con un attenzione particolare ai test che si usano in Econometria.
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliMisure della dispersione o della variabilità
QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.
DettagliAnalisi della varianza (anova) a due vie
Analisi della varianza (anova) a due vie Andrea Onofri 27 marzo 2014 Indice 1 Il concetto di interazione 1 2 Tipi di interazione 2 3 Descrizione del caso studio 3 4 Analisi dei dati 4 Sommario Scopo di
DettagliL Analisi della Varianza ANOVA (ANalysis Of VAriance)
L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni
Dettagli3 Confronto fra due popolazioni attraverso il test t e test analoghi
3 Confronto fra due popolazioni attraverso il test t e test analoghi Consideriamo in questo capitolo gli esperimenti comprendenti un solo fattore fisso, e nel loro ambito quelli in cui questo criterio
Dettagliβˆ (pendenza della retta) =
LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7 Maria Elena Bontempi e.bontempi@economia.unife.it V LEZIONE: OLS multivariato: effetti parziali, multicollinearità Scopo dell
DettagliAbbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).
ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione
DettagliAnalisi di scenario File Nr. 10
1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica giorgio.calcagnini@uniurb.it http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html
DettagliExcel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
Dettagli4. Confronto tra medie di tre o più campioni indipendenti
BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliIntroduzione alle relazioni multivariate. Introduzione alle relazioni multivariate
Introduzione alle relazioni multivariate Associazione e causalità Associazione e causalità Nell analisi dei dati notevole importanza è rivestita dalle relazioni causali tra variabili Date due variabili
DettagliRelazioni tra variabili
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina
Dettagli6. Modelli statistici: analisi della regressione lineare
BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliRELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
DettagliEsercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza
Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette
DettagliRAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
DettagliALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio.
ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio. Per una migliore caratterizzazione del bacino idrologico dell area di studio, sono state acquisite
DettagliApplicazione reale dell AMP Forecast del Mercato IT
Variabili considerate (PIL a prezzi costanti) Applicazione reale dell AMP Forecast del Mercato IT TotMerCon (Totale Mercato Consumatori) TotDevCon (Totale Device Consumatori). Analisi delle variabili La
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
Dettagli1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
DettagliLaboratorio di Didattica dell analisi: Analisi a priori sulla funzione valore assoluto
Laboratorio di Didattica dell analisi: Analisi a priori sulla funzione valore assoluto Sissis Palermo, 14 Novembre 2007 Prof. Spagnolo Nadia Giovino - (nadiagiovino@libero.it) Giovanni Lo Iacono - (gi.loiacono@virgilio.it)
DettagliAND NON CAP WEIGHTED PORTFOLIO
SOCIALLY RESPONSIBLE INVESTMENT AND NON CAP WEIGHTED PORTFOLIO Forum per la Finanza Sostenibile Milano 30 giugno 2009 Giulio Casuccio Head of Quantitatives Strategies and Research Principi ed obiettivi:
DettagliLa regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliLEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010
LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno
DettagliMetodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla
Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui
DettagliRegressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare
DettagliModello di regressione lineare
Modello di regressione lineare a cura di Giordano dott. Enrico enrico.giordano@meliorbanca.com Nel presente lavoro viene descritto in modo dettagliato (attraverso anche un impatto visivo), l analisi di
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Regressione con Variabili Dummy Regressione con Variabili Dummy La
DettagliPROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO
PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliIl significato della MEDIA e della MEDIANA in una raccolta di dati numerici
Il significato della MEDIA e della MEDIANA in una raccolta di dati numerici Ogni qual volta si effettua una raccolta di dati di tipo numerico è inevitabile fornirne il valore medio. Ma che cos è il valore
DettagliESERCIZI SVOLTI PER LA PROVA DI STATISTICA
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI
DettagliGRUPPO QUATTRO RUOTE. Alessandro Tondo 19632 Laura Lavazza 19758 Matteo Scordo 19813 Alessandro Giosa 19894. Gruppo Quattro Ruote 1
GRUPPO QUATTRO RUOTE Alessandro Tondo 19632 Laura Lavazza 19758 Matteo Scordo 19813 Alessandro Giosa 19894 Gruppo Quattro Ruote 1 2. ANALISI BIVARIATA 3.1. RISULTATI (continua) 2.1 Consumi ridotti (variabile
DettagliSTATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RAPPRESENTAZIONI GRAFICHE Nella comunicazione una figura vale più di cento numeri e di mille parole! 1 SCOPI DELLE
DettagliModelli statistici per l analisi dei dati e la valutazione d efficacia Il caso del Comune di Perugia
Modelli statistici per l analisi dei dati e la valutazione d efficacia Il caso del Comune di Perugia Alessandra Pelliccia Matteo Cataldi Matteo Filippo Donadi 0 AGENDA Fonti Descrizione dei dati Variabili
DettagliPer studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R
Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.
Dettagli