03/03/2012. Campus di Arcavacata Università della Calabria

Documenti analoghi
REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Sommario. Obiettivo. Quando studiarla? La concentrazione. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

STATISTICA A K (63 ore) Marco Riani

Laboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica

Corso di. Dott.ssa Donatella Cocca

La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità:

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

1) Le medie e le varianze calcolate su n osservazioni relative alle variabili quantitative X ed Y sono tali che. σ x

Regressione e correlazione

materiale didattico I incontro

Campo di applicazione

Indicatori di dimensione e di concentrazione

ANALISI STATISTICA DELLE INCERTEZZE CASUALI

PREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

x 0 x 50 x 20 x 100 CASO 1 CASO 2 CASO 3 CASO 4 X n X n X n X n

si utilizzano per confrontare le distribuzioni

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

L analisi della correlazione lineare

La regressione. La Regressione. La Regressione. min. min. Var X. X Variabile indipendente (data) Y Variabile dipendente

Oltre la regressione lineare

Esame di Statistica tema B Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

Correlazione lineare

Lezione n La concentrazione

Elementi di statistica

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete

LA VARIABILITA. IV lezione di Statistica Medica

ELEMENTI DI STATISTICA

IL MODELLO DI MACK. Materiale didattico a cura di Domenico Giorgio Attuario Danni di Gruppo Società Cattolica di Assicurazioni

LEZIONE 2. Riassumere le informazioni: LE MEDIE MEDIA ARITMETICA MEDIANA, MODA, QUANTILI. La media aritmetica = = N

,29 7. Distribuzioni di frequenza. x 1 n 1 n 1 n 1 /N n 1 /N*100 x 2 n 2 n 1 +n 2 n 2 /N n 2 /N*100

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Capitolo 3. Cap. 3-1

Statistica Descrittiva

PIANIFICAZIONE DEI TRASPORTI

Relazioni tra variabili: Correlazione e regressione lineare

Il trattamento dei dati a fini descrittivi

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

y. E' semplicemente la media calcolata mettendo

Università degli Studi di Urbino Facoltà di Economia

Modelli descrittivi, statistica e simulazione

Modelli con varabili binarie (o qualitative)

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

Laboratorio 2B A.A. 2013/2014. Elaborazione Dati. Lab 2B CdL Fisica

Misure Ripetute ed Indipendenti

Misure indipendenti della stessa grandezza, ciascuna con una diversa precisione.

Università di Cassino. Esercitazioni di Statistica 1 del 19 Febbraio Dott. Mirko Bevilacqua

Il termine regressione fu introdotto da Francis Galton ( ), antropologo (promotore dell eugenetica).

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Università di Cassino. Esercitazione di Statistica 1 del 4 dicembre Dott.ssa Simona Balzano

Analisi degli errori. Introduzione J. R. Taylor, Introduzione all analisi degli errori, Zanichelli, Bo 1986

Strada B. Classe Velocità valore frequenza Frequ. ass Frequ. % hi Freq. Cum

Lezione 2 a - Statistica descrittiva per variabili quantitative

UNIVERSITÀ DEGLI STUDI DI TORINO CORSO DI LAUREA IN CHIMICA Dispense ad esclusivo uso introduttivo per il modulo di Fisica C

Regressione lineare con un singolo regressore

Appunti di Econometria

Risposta in frequenza

Università di Cassino Corso di Statistica 1 Esercitazione del 28/01/2008 Dott. Alfonso Piscitelli. Esercizio 1

S O L U Z I O N I. 1. Effettua uno studio qualitativo della funzione. con particolare riferimento ai seguenti aspetti:

Lezione 2 le misure di sintesi: le medie

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA

Sistemi Intelligenti Stimatori e sistemi lineari - III

Correlazione, Regressione, Test non parametrici

Le soluzioni della prova scritta di Matematica per il corso di laurea in Farmacia (raggruppamento M-Z)

L'Analisi in Componenti Principali. Luigi D Ambra Dipartimento di Matematica e Statistica Università di Napoli Federico II

= = = = = 0.16 NOTA: X P(X) Evento Acquisto PC Intel Acquisto PC Celeron P(X)

Definizione di campione

Probabilità cumulata empirica

Tutorato di Complementi di Analisi Matematica e Statistica 23 e 30 marzo 2017

Analisi della Varianza

I MODELLI LINEARI GENERALIZZATI GLM

La t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student.

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *

4.6 Dualità in Programmazione Lineare

Esercitazioni del corso: STATISTICA

Regressioni con variabili strumentali

Ettore Limoli. Lezioni di Matematica Prof. Ettore Limoli. Sommario. Calcoli di regressione

3 CAMPIONAMENTO DI BERNOULLI E DI POISSON

Unità n La concentrazione

Intorduzione alla teoria delle Catene di Markov

Università di Cassino Corso di Statistica 1 Esercitazione del 17/10/2006 Dott. Alfonso Piscitelli. Esercizio 1

Potenzialità degli impianti

1) Dato un carattere X il rapporto tra devianza entro e devianza totale è 0.25 e la devianza totale è 40. La devianza tra vale: a) 10 b) 20 c) 30

LE FREQUENZE CUMULATE

Esercitazioni del corso di Relazioni tra variabili. Giancarlo Manzi Facoltà di Sociologia Università degli Studi di Milano-Bicocca

MEDIA DI Y (ALTEZZA):

Misure Topografiche Tradizionali

ANALISI ESPLORATIVA DI SERIE DI OSSERVAZIONI

Richiami di modelli di utilità aleatoria

RAPPRESENTAZIONE DI MISURE. carta millimetrata

Transcript:

Campus d Arcavacata Unverstà della Calabra Corso d statstca RENDE a.a 0-00

3

4

5

6

7

8

9

0

3

4

5

6

7

8

9

Concentrazone Un altro aspetto d un nseme d dat che s aggunge alla meda e alla varabltà è costtuto dalla loro concentrazone. S defnsce concentrazone l modo n cu un determnato carattere s dstrbusce tra le n untà d un collettvo. Questo nuovo aspetto è affne alla varabltà ma non concde con quest ultma; esso rguarda fenomen cosddett trasferbl, coè que fenomen per qual è lecto ammettere che la loro ntenstà globale, o una parte d essa, possa essere posseduta da un solo elemento o da poch element. Ad esempo sono fenomen trasferbl patrmon personal, reddt ndvdual, gl abtant de sngol comun, ecc. Consderamo n untà le qual posseggono rspettvamente le quanttà (ordnate n ordne crescente) x x x3... xn d un certo carattere addtvo e trasferble. 0

Se ndchamo con Sx +x +x 3 +.+x n la quanttà totale posseduta dalle n untà, s chama concentrazone d n quanttà x, x, x 3,. x n, l modo con cu l totale SΣx s dstrbusce fra le untà. E evdente che sotto questo proflo s possono avere stuazon dverse: - le n untà possono possedere quanttà ugual - poche untà possono detenere una parte rlevante del totale S e qund le untà resdue possedere una lmtata frazone del totale - una untà può possedere l totale S e le altre n- untà avere qund zero A cascuna d queste stuazon deve corrspondere una dversa concentrazone. Esstono due stuazon lmte alle qual corrspondono due concentrazon lmte: - concentrazone nulla - concentrazone massma S ha concentrazone nulla quando la quanttà totale S è rpartta n modo uguale fra gl n soggett. In questo caso ogn untà avrà una quanttà uguale alla meda artmetca S/n Σx /nm qund x x x 3.x n M S dce allora che c è equdstrbuzone. Quando la concentrazone è nulla anche la varabltà è nulla e qund tutt gl ndc d varabltà sono ugual a zero. concentrazone nulla equdstrbuzonevarabltà nulla S ha nvece concentrazone massma quando n- soggett hanno tutt una quanttà nulla e qund soltanto l ultmo soggetto possede l totale S. S avrà allora x x x 3.x n- 0 x n S che rappresenta la massma varabltà e qund la concentrazone massma.

varabltà massma massma concentrazone In una successone ordnata d dat s dce che c è un trasfermento (n avant) quando l untà - ma perde una quanttà h la quale vene acqusta da un untà successva j- ma. Il totale evdentemente non camba. Una caratterstca degl ndc d concentrazone consste nel fatto che ess devono essere sensbl a quest trasferment. Gl ndc d varabltà nvece non lo sono e n cò sta appunto un elemento che dfferenza gl ndc d varabltà da quell d concentrazone. Rapporto d Concentrazone S predspongano le quanttà cumulate: S x S x +x S x +x + +x S n x +x + +x n S calcolno rapport: S p N e q S N Il grado d concentrazone può msurars medante un ndce ntrodotto da Gn, detto Rapporto d Concentrazone; esso è un numero puro (coè dmensonale) R N ( p N q ) p con 0R

Se p q, allora R0 ed è l caso d equdstrbuzone. La concentrazone è nulla ed anche la varabltà è nulla Se q 0, allora R n quanto numeratore e denomnatore dventano ugual. E l caso d concentrazone massma. Il carattere è concentrato su una sola untà statstca e la varabltà è notevole. In tutt gl altr cas p >q per cu R è compreso tra 0 ed. U fenomeno è tanto pù concentrato quanto maggor sono le dfferenze p -q Esempo x S (cum) p q p -q 3 3 0.43 0.054 0.089 5 8 0.86 0.7 0.69 3 6 54 0.49 0.5 0.04 4 35 89 0.57 0.37 0.0 5 4 3 0.74 0.546 0.68 6 49 80 0.857 0.750 0.07 7 60 40 40 3.000 0.938 R 0.938/3 0.35 3

Curva d Lorentz L amercano Lorentz ntrodusse una partcolare rappresentazone grafca molto utle per msurare la concentrazone d un nseme d dat. Questo dagramma s può traccare su valor effettv oppure su de valor rdott n modo da ottenere un tpo standardzzato. Se s rportano, n un sstema d ass cartesan, n ascssa valor d p ed n ordnata corrspondent valor d q, s ottene una curva che prende l nome d curva d Lorentz. In tal modo l dagramma che s ottene (dagramma rdotto o standardzzato) rsulta sempre compreso n un trangolo rettangolo soscele avente base e altezza ugual ad. 0.75 0.5 0.5 0 0 0.5 0.5 0.75 4

Sullo stesso dagramma che porta la curva d Lorentz s tracca sempre, come dstrbuzone d rfermento, anche la retta OP, retta d equdstrbuzone. Infatt nel caso d unforme rpartzone (equdstrbuzone) cascun soggetto deve possedere x M e qund successv valor cumulat rsultano allneat lungo la retta che unsce l orgne con l punto fnale della curva d Lorentz. Nel caso d contnutà l ndce R è uguale al rapporto tra l area d concentrazone coè l area compresa tra la retta e la curva d concentrazone- e l area del trangolo raffgurante la massma concentrazone. MODELLO DI REGRESSIONE LINEARE SEMPLICE Studa la relazone tra due varabl quanttatve Y varable dpendente X varable ndpendente tra le qual è potzzable una relazone d tpo lneare. y α + β x + ε In cu Y α + βx è la parte spegable attraverso una funzone lneare, mentre ε rappresenta la parte casuale che l modello non può spegare. Inoltre: α è la parte d varabltà d Y che non dpende da X β msura la varazone d Y conseguente ad una varazone untara d X 5

Grafcamente un nseme d coppe d osservazon x, y danno orgne ad un dagramma d dspersone: X Y x y x y M M x n y n e { y yˆ S cerca la retta pù vcna possble a punt: S cerca la retta pù vcna possble a punt: n cu: α è l ntercetta β è l coeffcente angolare ˆy a+ bx La quanttà: y ˆ y e è la -ma determnazone della v.c. ε errore e rappresenta l resduo relatvo all -ma osservazone 6

FASI DELLA DEFINIZIONE DEL MODELLO Specfcazone del modello: scelta del tpo d funzone da utlzzare per descrvere un fenomeno; defnzone delle potes d base Stma de parametr: Verfca: uso d stmator de parametr caratterstc della funzone scelta della sgnfcatvtà delle stme del rspetto delle potes d base Uso del modello: a fn per qual è stato specfcato (descrttv, prevsv, ecc.) IPOTESI DI BASE DEL MODELLO DI REGRESSIONE Ipotes debol: necessare per ottenere le stme. y α+βx + ε. E(ε ) 0 3. var(ε ) var(y ) σ (omoschedastctà) 4. cov(ε, ε j ) 0 ( j) (no autocorrelazone) 5. X nota e senza errore (non stocastca) 7

Ipotes forte: necessara per verfcare la sgnfcatvtà delle stme 6. ε N(0, σ ) La varanza d ε (o d y) σ rentra tra parametr da stmare Se c fosse correlazone tra gl error sgnfcherebbe che esstono altr fattor oltre a X ad nfluenzare Y, esclus dal modello. Inoltre mplcherebbe un legame anche tra le y, come può accadere nel caso de dat azonar L potes dstrbuzonale è fondamentale nella fase nferenzale METODO DEI MINIMI QUADRATI Stma d α e β medante a e b che rendono mnma la somma de quadrat degl scart tra valor osservat y e valor stmat Essendo, qund, ˆy a + bx la funzone obettvo sarà: f n y ˆy + e a + bx + e (, ) ( ˆ ) ( ) a b y y e ( y a bx) mn! f a f b n ( y a bx) n x n 0 ( y a bx ) 0 n 8

9 VARIANZE DEL MODELLO DI REGRESSIONE stme Varanza d regressone: n e n s errore standard della regressone Varanza d a: ( ) + n a x x x n s s errore standard stma (d α) Varanza d b: ( ) n b x x s s errore standard stma (d β) BONTÀ DELL ADATTAMENTO L ndce d determnazone lneare R s basa sulla propretà d decomposzone della devanza totale ( ) ( ) ( ) ( ) ( ) + + n n n n y y y y y y y y y y dev Y ˆ ˆ ˆ ˆ n cu ( ) ( ) dev reg y y n ˆ ( ) ( ) dev e y y n ˆ

R ( ) ( ) dev reg devy deve ( ) devy ( ) 0 R R 0 la devanza totale è par alla devanza resdua, qund l modello lneare non spega nulla della relazone tra X e Y che non è lneare, qund non è adatto a dat R la devanza totale è par alla devanza d regressone, qund l modello lneare spega completamente la relazone tra X e Y che è propro lneare, qund punt s trovano esattamente sulla retta. SIGNIFICATIVITÀ DELLE STIME Sgnfcatvtà d α H 0 : α 0 H : α 0 Statstca test: x test a α t n- s a regola d decsone: t accettamo H 0 α xtest tα xtest tα oppure xtest tα rfutamo H 0 30

Grafcamente: t n- α/ α/ -t a/,n- t a/,n- Sgnfcatvtà d β H 0 : β 0 H : β 0 Statstca test: x test b β t n- s b regola d decsone: t accettamo H 0 α xtest tα xtest tα oppure xtest tα rfutamo H 0 3

Grafcamente: tn- α/ -ta/,n- α/ ta/,n- Sgnfcatvtà dell R H 0 : R 0 H : R > 0 Statstca test: x test ( ) ( ) n dev reg F,n- dev e regola d decsone: x test Fα ; n ; accettamo H 0 x test > Fα ; n ; rfutamo H 0 3

Grafcamente: F,n- α Fa,,n- 33