Campus d Arcavacata Unverstà della Calabra Corso d statstca RENDE a.a 0-00
3
4
5
6
7
8
9
0
3
4
5
6
7
8
9
Concentrazone Un altro aspetto d un nseme d dat che s aggunge alla meda e alla varabltà è costtuto dalla loro concentrazone. S defnsce concentrazone l modo n cu un determnato carattere s dstrbusce tra le n untà d un collettvo. Questo nuovo aspetto è affne alla varabltà ma non concde con quest ultma; esso rguarda fenomen cosddett trasferbl, coè que fenomen per qual è lecto ammettere che la loro ntenstà globale, o una parte d essa, possa essere posseduta da un solo elemento o da poch element. Ad esempo sono fenomen trasferbl patrmon personal, reddt ndvdual, gl abtant de sngol comun, ecc. Consderamo n untà le qual posseggono rspettvamente le quanttà (ordnate n ordne crescente) x x x3... xn d un certo carattere addtvo e trasferble. 0
Se ndchamo con Sx +x +x 3 +.+x n la quanttà totale posseduta dalle n untà, s chama concentrazone d n quanttà x, x, x 3,. x n, l modo con cu l totale SΣx s dstrbusce fra le untà. E evdente che sotto questo proflo s possono avere stuazon dverse: - le n untà possono possedere quanttà ugual - poche untà possono detenere una parte rlevante del totale S e qund le untà resdue possedere una lmtata frazone del totale - una untà può possedere l totale S e le altre n- untà avere qund zero A cascuna d queste stuazon deve corrspondere una dversa concentrazone. Esstono due stuazon lmte alle qual corrspondono due concentrazon lmte: - concentrazone nulla - concentrazone massma S ha concentrazone nulla quando la quanttà totale S è rpartta n modo uguale fra gl n soggett. In questo caso ogn untà avrà una quanttà uguale alla meda artmetca S/n Σx /nm qund x x x 3.x n M S dce allora che c è equdstrbuzone. Quando la concentrazone è nulla anche la varabltà è nulla e qund tutt gl ndc d varabltà sono ugual a zero. concentrazone nulla equdstrbuzonevarabltà nulla S ha nvece concentrazone massma quando n- soggett hanno tutt una quanttà nulla e qund soltanto l ultmo soggetto possede l totale S. S avrà allora x x x 3.x n- 0 x n S che rappresenta la massma varabltà e qund la concentrazone massma.
varabltà massma massma concentrazone In una successone ordnata d dat s dce che c è un trasfermento (n avant) quando l untà - ma perde una quanttà h la quale vene acqusta da un untà successva j- ma. Il totale evdentemente non camba. Una caratterstca degl ndc d concentrazone consste nel fatto che ess devono essere sensbl a quest trasferment. Gl ndc d varabltà nvece non lo sono e n cò sta appunto un elemento che dfferenza gl ndc d varabltà da quell d concentrazone. Rapporto d Concentrazone S predspongano le quanttà cumulate: S x S x +x S x +x + +x S n x +x + +x n S calcolno rapport: S p N e q S N Il grado d concentrazone può msurars medante un ndce ntrodotto da Gn, detto Rapporto d Concentrazone; esso è un numero puro (coè dmensonale) R N ( p N q ) p con 0R
Se p q, allora R0 ed è l caso d equdstrbuzone. La concentrazone è nulla ed anche la varabltà è nulla Se q 0, allora R n quanto numeratore e denomnatore dventano ugual. E l caso d concentrazone massma. Il carattere è concentrato su una sola untà statstca e la varabltà è notevole. In tutt gl altr cas p >q per cu R è compreso tra 0 ed. U fenomeno è tanto pù concentrato quanto maggor sono le dfferenze p -q Esempo x S (cum) p q p -q 3 3 0.43 0.054 0.089 5 8 0.86 0.7 0.69 3 6 54 0.49 0.5 0.04 4 35 89 0.57 0.37 0.0 5 4 3 0.74 0.546 0.68 6 49 80 0.857 0.750 0.07 7 60 40 40 3.000 0.938 R 0.938/3 0.35 3
Curva d Lorentz L amercano Lorentz ntrodusse una partcolare rappresentazone grafca molto utle per msurare la concentrazone d un nseme d dat. Questo dagramma s può traccare su valor effettv oppure su de valor rdott n modo da ottenere un tpo standardzzato. Se s rportano, n un sstema d ass cartesan, n ascssa valor d p ed n ordnata corrspondent valor d q, s ottene una curva che prende l nome d curva d Lorentz. In tal modo l dagramma che s ottene (dagramma rdotto o standardzzato) rsulta sempre compreso n un trangolo rettangolo soscele avente base e altezza ugual ad. 0.75 0.5 0.5 0 0 0.5 0.5 0.75 4
Sullo stesso dagramma che porta la curva d Lorentz s tracca sempre, come dstrbuzone d rfermento, anche la retta OP, retta d equdstrbuzone. Infatt nel caso d unforme rpartzone (equdstrbuzone) cascun soggetto deve possedere x M e qund successv valor cumulat rsultano allneat lungo la retta che unsce l orgne con l punto fnale della curva d Lorentz. Nel caso d contnutà l ndce R è uguale al rapporto tra l area d concentrazone coè l area compresa tra la retta e la curva d concentrazone- e l area del trangolo raffgurante la massma concentrazone. MODELLO DI REGRESSIONE LINEARE SEMPLICE Studa la relazone tra due varabl quanttatve Y varable dpendente X varable ndpendente tra le qual è potzzable una relazone d tpo lneare. y α + β x + ε In cu Y α + βx è la parte spegable attraverso una funzone lneare, mentre ε rappresenta la parte casuale che l modello non può spegare. Inoltre: α è la parte d varabltà d Y che non dpende da X β msura la varazone d Y conseguente ad una varazone untara d X 5
Grafcamente un nseme d coppe d osservazon x, y danno orgne ad un dagramma d dspersone: X Y x y x y M M x n y n e { y yˆ S cerca la retta pù vcna possble a punt: S cerca la retta pù vcna possble a punt: n cu: α è l ntercetta β è l coeffcente angolare ˆy a+ bx La quanttà: y ˆ y e è la -ma determnazone della v.c. ε errore e rappresenta l resduo relatvo all -ma osservazone 6
FASI DELLA DEFINIZIONE DEL MODELLO Specfcazone del modello: scelta del tpo d funzone da utlzzare per descrvere un fenomeno; defnzone delle potes d base Stma de parametr: Verfca: uso d stmator de parametr caratterstc della funzone scelta della sgnfcatvtà delle stme del rspetto delle potes d base Uso del modello: a fn per qual è stato specfcato (descrttv, prevsv, ecc.) IPOTESI DI BASE DEL MODELLO DI REGRESSIONE Ipotes debol: necessare per ottenere le stme. y α+βx + ε. E(ε ) 0 3. var(ε ) var(y ) σ (omoschedastctà) 4. cov(ε, ε j ) 0 ( j) (no autocorrelazone) 5. X nota e senza errore (non stocastca) 7
Ipotes forte: necessara per verfcare la sgnfcatvtà delle stme 6. ε N(0, σ ) La varanza d ε (o d y) σ rentra tra parametr da stmare Se c fosse correlazone tra gl error sgnfcherebbe che esstono altr fattor oltre a X ad nfluenzare Y, esclus dal modello. Inoltre mplcherebbe un legame anche tra le y, come può accadere nel caso de dat azonar L potes dstrbuzonale è fondamentale nella fase nferenzale METODO DEI MINIMI QUADRATI Stma d α e β medante a e b che rendono mnma la somma de quadrat degl scart tra valor osservat y e valor stmat Essendo, qund, ˆy a + bx la funzone obettvo sarà: f n y ˆy + e a + bx + e (, ) ( ˆ ) ( ) a b y y e ( y a bx) mn! f a f b n ( y a bx) n x n 0 ( y a bx ) 0 n 8
9 VARIANZE DEL MODELLO DI REGRESSIONE stme Varanza d regressone: n e n s errore standard della regressone Varanza d a: ( ) + n a x x x n s s errore standard stma (d α) Varanza d b: ( ) n b x x s s errore standard stma (d β) BONTÀ DELL ADATTAMENTO L ndce d determnazone lneare R s basa sulla propretà d decomposzone della devanza totale ( ) ( ) ( ) ( ) ( ) + + n n n n y y y y y y y y y y dev Y ˆ ˆ ˆ ˆ n cu ( ) ( ) dev reg y y n ˆ ( ) ( ) dev e y y n ˆ
R ( ) ( ) dev reg devy deve ( ) devy ( ) 0 R R 0 la devanza totale è par alla devanza resdua, qund l modello lneare non spega nulla della relazone tra X e Y che non è lneare, qund non è adatto a dat R la devanza totale è par alla devanza d regressone, qund l modello lneare spega completamente la relazone tra X e Y che è propro lneare, qund punt s trovano esattamente sulla retta. SIGNIFICATIVITÀ DELLE STIME Sgnfcatvtà d α H 0 : α 0 H : α 0 Statstca test: x test a α t n- s a regola d decsone: t accettamo H 0 α xtest tα xtest tα oppure xtest tα rfutamo H 0 30
Grafcamente: t n- α/ α/ -t a/,n- t a/,n- Sgnfcatvtà d β H 0 : β 0 H : β 0 Statstca test: x test b β t n- s b regola d decsone: t accettamo H 0 α xtest tα xtest tα oppure xtest tα rfutamo H 0 3
Grafcamente: tn- α/ -ta/,n- α/ ta/,n- Sgnfcatvtà dell R H 0 : R 0 H : R > 0 Statstca test: x test ( ) ( ) n dev reg F,n- dev e regola d decsone: x test Fα ; n ; accettamo H 0 x test > Fα ; n ; rfutamo H 0 3
Grafcamente: F,n- α Fa,,n- 33