UNIVERSITA DEGLI STUDI MEDITERRANEA DI REGGIO CALABRIA

Documenti analoghi
Caso studio 12. Regressione. Esempio

Istogrammi e confronto con la distribuzione normale

MEDIA DI Y (ALTEZZA):

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Quale retta? La retta migliore è quella che più si avvicina all insieme dei 115

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

Variabilità = Informazione

Lezione 4. La Variabilità. Lezione 4 1

Dott.ssa Marta Di Nicola

Università egli Studi di Bergamo Corso di laurea in Ingegneria Edile STATISTICA Stima di massima verosimiglianza

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

Classi di reddito % famiglie Fino a Oltre Totale 100

Esercitazione 6 del corso di Statistica (parte 1)

Matematica elementare art.1 di Raimondo Valeri

ρ XY risponde alla domanda esiste un associazione lineare tra le variabili X e Y?

LA REGRESSIONE LINEARE SEMPLICE

Contenuti. Facoltà di Economia. Scatterplot o diagramma a dispersione Analisi grafica della relazione tra due. francesco mola.

pè via che, lì, la media è sempre eguale risurta che te tocca un pollo all'anno: Me spiego: da li conti che se fanno seconno le statistiche d'adesso

LA FUNZIONE DI VEROSIMIGLIANZA

Il termine regressione fu introdotto da Francis Galton ( ), antropologo (promotore dell eugenetica).

7 STIMATORI DI REGRESSIONE LINEARE 7.1 INTRODUZIONE

Facoltà di Economia - STATISTICA - Corso di Recupero a.a Prof.ssa G. Balsamo CONCETTI di BASE Carattere X [o A ] i = 1

Caso studio 10. Dipendenza in media. Esempio

Funzioni di più variabili Massimi e Minimi una funzione definita in un insieme E. Un punto ( x0, y0)

Gli indici sintetici Forma. Gli indici sintetici. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

LEZIONI DI STATISTICA MEDICA

Regressione e Correlazione

Soluzione degli esercizi del capitolo 11

DATA MINING PER IL MARKETING (63 ore)

ANALISI DELLA REGRESSIONE ANALISI BIVARIATA DELLA REGRESSIONE

Analisi dei Dati. La statistica è facile!!! Correlazione

LA REGRESSIONE LINEARE SEMPLICE

Capitolo 6 Gli indici di variabilità

LE MEDIE. Le Medie. Medie razionali. Medie di posizione

( ) 2 i 1 X. n(n + 1) a) si determini se sono corretti; b) per quelli non corretti, si calcoli la distorsione d;

Generalmente sia l ampiezza che il valore medio della sollecitazione sono variabili nel tempo.

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Statistica descrittiva per l Estimo

exp("# (al posto di n) var Ca Coefficiente di asimmetria, indipendente dal valore dei parametri. f X DISTRIBUZIONE EV1 o DI GUMBEL.

CORSO DI STATISTICA I (Prof.ssa S. Terzi) 1 STUDIO DELLE DISTRIBUZIONI SEMPLICI. Esercitazione n 3

Modulo di Fisica Tecnica. Differenze finite per problemi di conduzione in regime instazionario

La Regressione. Y = f ( X ) Le motivazioni che ci spingono alla ricerca di f essenzialmente due: la Previsione ed il Controllo.

La regressione lineare. Rappresentazione analitica delle distribuzioni

Esercitazioni di Calcolo delle Probabilità (16/12/2011) Soluzioni

Aritmetica 2016/2017 Esercizi svolti in classe Quarta lezione

6. LA CONCENTRAZIONE

INDICI DI VARIABILITA

TEST CHI DI INDIPENDENZA STOCASTICA

Daniela Tondini

6. LA CONCENTRAZIONE

Interpolazione. Definizione: per interpolazione si intende la ricerca di una funzione matematica che approssima l andamento di un insieme di punti.

FUNZIONI LOGICHE FORME CANONICHE SP E PS

Stima puntuale Quando un parametro della popolazione incognito è valutato (stimato) da una sola statistica (parametro) tratto da un campione

PROVA SCRITTA DI STATISTICA (COD ) 4 Febbraio 2004 MODALITÀ A APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE

Compito A1- Soluzioni

Lezione 13. Anelli ed ideali.

Unità 11. Studio di più variabili. Interpolazione. Regressione. Correlazione. Notazione matriciale

CAPITOLO III SISTEMI DI EQUAZIONI LINEARI

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

IL MODELLO DI REGRESSIONE LINEARE MULTIPLA

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

Esercizi su Rappresentazioni di Dati e Statistica

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in due gruppi

Voti Diploma Classico Scientifico Tecn. E Comm Altro

SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1

Il modello di regressione multipla

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in

Capitolo 2 Errori di misura: definizioni e trattamento

I percentili e i quartili

Approfondimenti Lezione 3. Mara Bruzzi

Lezione 3. Gruppi risolubili.

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

Associazione tra due variabili quantitative

Corso di Architettura (Prof. Scarano) 06/03/2002

MISURE DI TENDENZA CENTRALE. Psicometria 1 - Lezione 2 Lucidi presentati a lezione AA 2000/2001 dott. Corrado Caudek

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

Università degli Studi di Napoli Parthenope. STATISTICA per il Turismo. IV Lezione

Caso studio 2. Le medie. Esercizio. La media aritmetica. Esempio

Design of experiments (DOE) e Analisi statistica

Modelli di accumulo del danno dovuto a carichi ciclici

Variabili casuali ( ) 1 2 n

Calcolo delle Probabilità: esercitazione 4

2 si da eguale peso alle misure senza tener conto dell incertezza, che in generale possono essere diverse.

SIMULAZIONE DI SISTEMI CASUALI 1 parte. Variabili casuali e Distribuzioni di variabili casuali. Calcolo delle probabilità

Dai dati osservati mediante scelta campionaria si giunge ad affermazioni i che riguardano la popolazione da cui essi sono stati prescelti

TRATTAMENTO STATISTICO DEI DATI ANALITICI

Esercitazione 5 del corso di Statistica (parte 1)

Propagazione di errori

Il campionamento e l inferenza

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER ATTRIBUTI

( ) ( ) ( ) ( ) Mutua variabilità. n n 1. n n 1. n n 1. n n 1

Lezione 4. Metodi statistici per il miglioramento della Qualità

Capitolo 13 Il modello di regressione lineare

La media aritmetica. La sua individuazione si basa sulla logica della trasferibilità di un carattere. Se la funzione f( ) corrisponde alla somma:

ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.

Le misure di variabilità

Transcript:

UNIVERSITA DEGLI STUDI MEDITERRANEA DI REGGIO CALABRIA Corso d Statstca Ecoomca a.a. / Prof. Alberto Botta

DERIVAZIONE DEGLI STIMATORI OLS La regressoe semplce Il procedmeto d calcolo degl stmator OLS sa el caso d ua regressoe leare semplce sa el caso della regressoe leare multpla s foda sulla stessa logca: la mmzzazoe della somma del quadrato degl scart. S defscao prmo luogo scart la dffereza tra valor effettv della varable dpedete emers dall operazoe d campoameto e corrspodet valor stmat svolgmeto dell aals d regressoe: otteut attraverso lo Essedo la fuzoe d regressoe del campoe PRF questo caso s tratta d ua + regressoe semplce a cu s fa rfermeto per stmare la varable casuale sulla base d varazo della varable dpedete. Obbettvo d qualsvogla regressoe è fttare el mglor modo possble dat effettv d cu s dspoe, ossa operare maera tale che le stme emerget dalla regressoe s dscosto el mor modo possble da dat effettv coteut el campoe. Tale obbettvo vee stetzzato matematcamete attraverso l cocetto d mmzzazoe della somma de quadrat degl scart: Come s evce charamete dall equazoe appea rportata, la sommatora del quadrato degl scart dpede, è fuzoe del valore assegato agl stmator e ; bsoga duque sceglere valor d e tal per cu la sommatora de quadrat degl scart sa la more possble N.B: gl altr elemet dell equazoe e soo ot quato soo rsultat dell opera d campoameto della varable dpedete e della varable esplcatva. Il procedmeto d mmzzazoe d ua fuzoe vettorale quale l equazoe è be oto e rchede che tutte le dervate parzal della fuzoe rspetto le propre varabl esplcatve sao tutte

cotemporaeamete poste uguale a zero. S tratta delle cosddette FOC Frst Order Codtos, esprmbl questo modo: Le dervate parzal appea rportate vao a formare u sstema d due equazo due cogte e che, ua volta soddsfatte cotemporaeamete, darao valor cercat d e : La soluzoe d tale sstema d equazo può essere otteuta attuado l be oto procedmeto d sosttuzoe. Dalla prma equazoe el sstema precedete s avrà: ossa: + Dvdedo da ambo lat per l umero d osservazo ossa la dmesoe del campoe, s ha: + ossa: + e qud: co e valor med della varable e rspettvamete. Sosttuedo l equazoe all tero della secoda equazoe del sstema poc az rportato, s ottee: Va da sé che preseza d regresso multple caratterzzate da pù d ua varable esplcatva e da u umero d stmator maggore d due, l umero d codzo da soddsfare cotemporaeamete sarà ach esso maggore d due e par al umero d stmator d cu s desdera determare l valore ottmale.

4 Moltplcado da ambo lat per, s ottee: + Raggustado: [ ] Da cu s può rcavare la seguete forma esplcta per lo stmatore : L equazoe umero può essere sesblmete semplfcata e resa pù dgerble prededo cosderazoe cocett d varaza e covaraza, attraverso qual, l equazoe s può rscrvere attraverso alcu aggustamet algebrc el modo seguete: 4 Co ;

5 La regressoe multpla Il procedmeto d calcolo degl stmator OLS o muta, da u puto d vsta cocettuale, el caso cu s abba a che fare co ua regressoe multpla, ossa ua regressoe cu s assume l essteza d due o pù varabl esplcatve. S preda come puto d rfermeto l caso della seguete regressoe caratterzzata dalla preseza d due varabl esplcatve e. S avrà: + + E qud: La sommatora de quadrat degl scart sarà: I questo caso sarao ovvamete tre le codzo da mettere a sstema al fe d determare valor de tre stmator, e che mmzzerao la somma del quadrato degl scart. Pù partcolare: Ovvero:

6 Dopo ua sere d calcol artmetc, s può dmostrare che le equazo rsolutve de tre stmator cosderat sarao le seguet:

CAPACITA ESPLICATIVA DI UNA REGRESSIONE Ua regressoe sarà tato mglore quato maggore sarà la sua capactà d spegare la varabltà della varable dpedete, ossa la sua capactà d spegare, attraverso gl effett delle varabl esplcatve cluse ella regressoe sulla varable dpedete, gl scostamet della varable dpedete rspetto l suo valor medo. I effett, sulla base d quato detto precedete, s può scrvere: + Dove rappreseta la parte del valore effettvo della varable dpedete colto e spegato dalla regressoe ed espresso attraverso l valore stmato dalla regressoe stessa. Vceversa, l terme d scarto dca quata parte del valore effettvo o vee colto dalla regressoe, restado duque o spegato. Tale espressoe può essere opportuamete relaborata sottraedo da ambo lat l valore medo : + 5 E opportuo questa sede rcordare che propretà tpca degl stmator OLS o meglo, della stma codotta co l metodo degl OLS è l uguaglaza tra valor medo de valor effettv e valor medo de valor stmat : modo seguete:. Per tale ragoe, l equazoe 5 potrà essere rscrtta el + 6 Co S preda ora l quadrato dell equazoe 6: + + + 7

Facedo la sommatora da ambo lat: + + 7 I vrtù delle propretà umer degl stmator OLS e degl scart da ess dervat, s può dmostrare che l doppo prodotto è ullo perché asseza d correlazoe tra scart e valor stmat. L equazoe 7 potrà duque essere rscrtta el modo seguete: + cu: TSS Total Sum of Squares ESS Eplaed Sum of Squares, ossa la parte d varabltà attoro alla sua meda della varable dpedete spegata e colta dalla regressoe. RSS Resdual Sum of Squares, ossa la parte d varabltà attoro alla sua meda della varable dpedete o spegata e o colta dalla regressoe, duque racchusa egl scart. Sulla base d tal defzo s defsce l dcatore stetco d botà della regressoe R : R ESS TSS RSS TSS 8 Il coeffcete R potrà assumere valor compres tra e ; la regressoe sarà tato mglore e pù effcace quato pù vco a sarà R. Il calcolo del coeffcete R sarà vco ad ; al cotraro, la regressoe sarà tato peggore, quato more e R è certamete utle per compredere la botà e la capacta esplcatva d ua regressoe. Cò oostate, tale coeffcete è altamete fluezato dal umero d varabl esplcatve cluse ella regressoe e deve percò essere aalzzato co cautela. I effett, partedo dalla defzoe stessa d R, s può be vedere come esso sa o-decrescete el umero d varabl esplcatve cluse ella regressoe. Se s aumeta artfcalmete l umero d varabl 8

esplcatve cluse ella regressoe, è assa probable che resdu della regressoe stessa, e d cosegueza la somma de loro quadrat, dmuscao. No camba ulla, vece, per quato rguarda la varabltà della varable dpedete, la quale emerge da dat e o è duque mmamete fluezata dalle operazo d stma. Ne cosegue che all aumetare del umero d varabl esplcatve, magar ache d portata esplcatva rdotta e trascurable, l coeffcete assumere valor pù alt. R tederà ad aumetare e ad Dal puto d vsta dell ecoometrco, è mportate evtare d correre ell errore d estedere artfcalmete ua regressoe co la sola faltà d far apparre la stessa mglore attraverso u valore pù elevato del coeffcete R. I vertà, ua regressoe è tato mglore quato pù è parsmoosa el umero d varabl esplcatve e cò oostate resce ad avere ua otevole capactà esplcatva del feomeo ecoomco che s cerca d aalzzare. Per capre se è davvero opportuo estedere l modello ecoometrco ed cludere uove varabl esplcatve ello stesso, è stato elaborato l coeffcete R aggustato adjusted modo seguete: R, formulato el R / k / k R k RSS TSS TSS ESS / TSS k TSS / TSS 9 Dove -k dcao grad d lbertà assocat agl scart, essedo l umero delle osservazo e k l umero d parametr da stmare; -, vece, rappresetao grad d lbertà assocat allo scostameto della varable dpedete rspetto alla propra meda. S prov ora ad osservare cosa accade agl dcator R e R el caso cu s espada ua data regressoe troducedo ua varable esplcatva aggutva, co l auslo d questa tabella: Effetto agguta varable esplcatva R R / + k / k / + / k / / / + + / 9

Come s dceva, l agguta d ua varable esplcatva produce, geerale quatomeo o aumeta, ua rduzoe della sommatora de quadrat degl scart e qud del rapporto RSS/TSS varazoe cotrassegata dal sego meo ella tabella. Secodo la defzoe d R ved equazoe 8, è evdete che R aumeterà. L sermeto d ua uova varable e duque d u uovo parametro da stmare, tuttava, farà ache dmure -k, ossa grad d lbertà assocat agl scart. Il rapporto / k potrà duque sa crescere che aumetare, a secoda d quale de due effett prevarrà rduzoe della somma del quadrato degl scart o rduzoe de grad d lbertà. E evdete che tale certezza s rverbera sulla varazoe d R, l quale potrà ach esso aumetare, ovvero rdurs. Se l troduzoe della uova varable esplcatva durrà ua rduzoe sgfcatva degl scart tale da fare dmure e o aumetare l rapporto / k, allora l coeffcete R, sulla base della sua defzoe, tederà ad aumetare. Evdetemete, avremo trodotto ella regressoe ua varable esplcatva rlevate che era opportuo cludere el ostro modello. I alteratva, qualora l agguta d ua varable esplcatva dovesse rvelars poco sgfcatva e rdurre d poco la Resdual Sum of Squrares, allora l rapporto / k tederà probablmete ad aumetare. Il coeffcete R, vece, s rdurrà s veda la sua formula, dcado come la uova varable esplcatva cosderata sa realtà poco rlevate e possa traqullamete essere esclusa dalla regressoe. Il coeffcete R assume sempre valor feror al coeffcete R e può assumere ache valor egatv ad dcare, evdetemete, ua regressoe mal posta che forsce scars rsultat. I questo caso, l valore del coeffcete R può essere semplcemete posto uguale a zero.