ρ XY risponde alla domanda esiste un associazione lineare tra le variabili X e Y?

Documenti analoghi
MEDIA DI Y (ALTEZZA):

Analisi dei Dati. La statistica è facile!!! Correlazione

LA REGRESSIONE LINEARE SEMPLICE

Regressione e Correlazione

Caso studio 12. Regressione. Esempio

Quale retta? La retta migliore è quella che più si avvicina all insieme dei 115

Il termine regressione fu introdotto da Francis Galton ( ), antropologo (promotore dell eugenetica).

Dott.ssa Marta Di Nicola

Seconda Prova Parziale di STATISTICA Modalità A

Lezione 4. La Variabilità. Lezione 4 1

Contenuti. Facoltà di Economia. Scatterplot o diagramma a dispersione Analisi grafica della relazione tra due. francesco mola.

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

Associazione tra due variabili quantitative

Caso studio 10. Dipendenza in media. Esempio

DATA MINING PER IL MARKETING (63 ore)

Istogrammi e confronto con la distribuzione normale

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

ANALISI DELLA REGRESSIONE ANALISI BIVARIATA DELLA REGRESSIONE

SECONDA PROVA INTERMEDIA DI STATISTICA CLEA gennaio 2005 COMPITO C2

Variabilità = Informazione

Gli indici sintetici Forma. Gli indici sintetici. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Stima puntuale Quando un parametro della popolazione incognito è valutato (stimato) da una sola statistica (parametro) tratto da un campione

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Esercitazione 6 del corso di Statistica (parte 1)

12/11/2015 STATISTICA 1. Esercitazione 4. Dott.ssa Vera Gurtovaya

PROVA SCRITTA DI STATISTICA (COD ) 4 Febbraio 2004 MODALITÀ A APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE

LA REGRESSIONE LINEARE SEMPLICE

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

Compito A1- Soluzioni

Statistica per le ricerche di mercato. 13. La regressione lineare semplice

I percentili e i quartili

Soluzione degli esercizi sulla statistica descrittiva e gli intervalli di confidenza

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Analisi di regressione con SAS. Ci interessa. Matrice di covarianza. Esempio: due test su 31 individui PROC CORR PROC GPLOT PROC REG

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

INDICI DI VARIABILITA

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Statistica per le ricerche di mercato. 10. La regressione lineare semplice

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

La Regressione. Y = f ( X ) Le motivazioni che ci spingono alla ricerca di f essenzialmente due: la Previsione ed il Controllo.

Unità 11. Studio di più variabili. Interpolazione. Regressione. Correlazione. Notazione matriciale

Il modello di regressione multipla

Funzioni di più variabili Massimi e Minimi una funzione definita in un insieme E. Un punto ( x0, y0)

Analisi delle distribuzioni doppie: dipendenza

IL MODELLO DI REGRESSIONE LINEARE MULTIPLA

MISURE DI TENDENZA CENTRALE. Psicometria 1 - Lezione 2 Lucidi presentati a lezione AA 2000/2001 dott. Corrado Caudek

DISTRIBUZIONE DI STUDENT

Indipendenza in distribuzione

Classi di reddito % famiglie Fino a Oltre Totale 100

LA FUNZIONE DI VEROSIMIGLIANZA

DI IDROLOGIA TECNICA PARTE II

Esercitazione 5 del corso di Statistica (parte 1)

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

Propagazione di errori

La regressione lineare. Rappresentazione analitica delle distribuzioni

dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo K, possiamo affermare che:

SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1

pè via che, lì, la media è sempre eguale risurta che te tocca un pollo all'anno: Me spiego: da li conti che se fanno seconno le statistiche d'adesso

Esercizi su Rappresentazioni di Dati e Statistica

Capitolo 13 Il modello di regressione lineare

( ) 2 i 1 X. n(n + 1) a) si determini se sono corretti; b) per quelli non corretti, si calcoli la distorsione d;

Università degli Studi di Napoli Parthenope. STATISTICA per il Turismo. IV Lezione

4 CAMPIONE DI n UNITA STATISTICHE (lettere latine)

UNIVERSITA DEGLI STUDI MEDITERRANEA DI REGGIO CALABRIA

TRATTAMENTO STATISTICO DEI DATI ANALITICI

Facoltà di Economia - STATISTICA - Corso di Recupero a.a Prof.ssa G. Balsamo CONCETTI di BASE Carattere X [o A ] i = 1

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

Analisi della Dipendenza

valido se i dati E dato da max(x i )-min(x i )

Elementi di Statistica descrittiva Parte III

LEZIONI DI STATISTICA MEDICA

Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso

Matematica elementare art.1 di Raimondo Valeri

L analisi bivariata. L analisi bivariata. L analisi bivariata. Tabelle di contingenza. Corso di. docente: Cristina Davino. a.a.

Capitolo 6 Gli indici di variabilità

Caso studio 2. Le medie. Esercizio. La media aritmetica. Esempio

III Esercitazione: Sintesi delle distribuzioni semplici secondo un carattere qualitativo ordinale.

Capitolo 17. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 17.1: Suggerimento

Generalmente sia l ampiezza che il valore medio della sollecitazione sono variabili nel tempo.

Soluzione degli esercizi del capitolo 11

Var iabili aleatorie continue

Statistica descrittiva per l Estimo

La media aritmetica. Le medie. Esempio. Esempio. Media aritmetica Mediana. Medie analitiche Medie di posizione. x 1

Daniela Tondini

CENNI DI STATISTICA DESCRITTIVA BIVARIATA DISTRIBUZIONI MARGINALI RETTA DI REGRESSIONE. Angela Donatiello 1

Lezione 4. Metodi statistici per il miglioramento della Qualità

TEST CHI DI INDIPENDENZA STOCASTICA

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

Variabili casuali ( ) 1 2 n

Sommario. Facoltà di Economia. Obiettivo. Quando studiarla? Lezione n 7. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

Regressione. Modelli statistici. Esempio: le automobili si vendono a peso? Esempio: le automobili si vendono a peso? prezzo=a+b*(peso-500)+errore

Capitolo 2 Errori di misura: definizioni e trattamento

Teoria dei Fenomeni Aleatori AA 2012/13

3 Variabilità. variabilità. Senza deviazione dalla norma il progresso non è possibile. (Frank Zappa) Statistica - 9CFU

CORSO DI STATISTICA I (Prof.ssa S. Terzi) 1 STUDIO DELLE DISTRIBUZIONI SEMPLICI. Esercitazione n 3

Anche le rette raccontano

Dai dati osservati mediante scelta campionaria si giunge ad affermazioni i che riguardano la popolazione da cui essi sono stati prescelti

CONFRONTI TRA RETTE, CALCOLO DELLA RETTA CON Y RIPETUTE, CON VERIFICA DI LINEARITA E INTRODUZIONE ALLA REGRESSIONE LINEARE MULTIPLA

Approfondimenti Lezione 3. Mara Bruzzi

Transcript:

Relazoe fra varabl casual X e Y cogutamete dstrbute Test d potes due popolazo Coeffcete d Correlazoe ρ XY (9.5.3) Regressoe ρ XY rspode alla domada esste u assocazoe leare tra le varabl X e Y? Costrure u modello che cosete d spegare Y dato X e studare le propretà. 1

C occupamo d ua caso molto partcolare: La relazoe che lega Y a X è d tpo leare e coè Y E Y ) ( Noostate sao potes molto semplfcatve, comuque l modello d regressoe leare rmae uo de pù usat elle applcazo, per la sua robustezza, semplctà e versatltà Errore casuale d meda ulla ), ( F Y ) (0, F

Regressoe Leare Regressoe vuol dre arretrameto, questa defzoe fatt vee adoperata per la prma da Fracs Galto a proposto delle legg dell eredtaretà che vevao be rappresetate da ua retta co coeffcete agolare more d 1. Per ua retta d questo tpo s ha fatt che valor molto grad d tedoo a dare rsposte pù pccole e valor molto pccol d tedoo a dare rsposte pù grad, producedo cos ua sorta d «regressoe verso la meda» per valor troppo estrem Padre 60 6 64 65 66 67 68 70 7 74 Fglo 63.6 65. 66 65.5 66.9 67.1 67.4 68.3 70.1 70 Paragrafo 9.4.1.1 3

Fg. 9.6 4

Dato u set d dat, y ),(, y ),...,(, y ) ( 1 1 Step 1- dagramma d dspersoe Step 1- calcolo della retta d regressoe Step 3- valdazoe del modello 5

Step 1- dagramma d dspersoe Padre 60 6 64 65 66 67 68 70 7 74 Fglo 63.6 65. 66 65.5 66.9 67.1 67.4 68.3 70.1 70 6

Step - calcolo della retta d regressoe Usamo le seguet otazo.. 1 1 Y 1 1 Y 7

Step - calcolo della retta d regressoe Lo stmatore B del coeffcete agolare e lo stmatore A della tercetta s ottegoo mmzzado: SS Y A B 1 B S S Y A Y B Per l set d dat delle altezze padre/fglo che stamo aalzzado s ottee: S Y 79.7 S 171.6 Y 67.01 66.8 B 79.7/171.6 0.4646 A 67.01 66.8*0.46 35.9 8

SS R Sum Squared Resduals 9

la pedeza β rappreseta l cambameto medo stmato Y quado vara d u utà. Il suo sego dpede da S XY- l tercetta α rappreseta l valor medo stmato d Y quado assume valore zero (se zero è tra valor assut da X). y y Y β pedeza β 10

Step 3- valdazoe del modello La valdazoe del modello avvee prma d tutto dal puto d vsta grafco E po sotto l potes ulterore che l errore ɛ sa ) Gaussao ) Idpedete ) Varaza costate N(0, ) Rumore BIANCO.. d. S possoo trovare le dstrbuzo degl stmator A,B, SS R duque utlzzarl per codurre de test d potes che valdao maera formale le stme otteute 11

B S S Y Y Y 1 ( ) 1 1 1 Y Y N(, ) dpedet B N, S provamolo.. 1

Y S Y B Y A 1 1 ) ( dpedet N Y ), ( S N A 1, provamolo.. 13

R B A Y SS 1 ) ( 1 ) ( Y SS R provamolo.. 14 co A e B stmator d e

15 S N B, S N A /, 1 SS R m m t m Z / ) ( ) ( ) ( ) ( R R t A SS S t B SS S provamolo

.. co le dstrbuzo delle statstche appea trovate s possoo calcolare stme tervallar oppure fare test d potes per parametr cogt Se, ell esempo che stamo coducedo, volessmo testare l potes H 0 : 1; H1 : 1 Dovremmo: valutare la statstca ( ) S SS R ( B ) e dat a ostra dsposzoe S 171.6 10 1 B 0.46 T 8 16.3 SS R 1.54 16

e valutare po l p-de-dat P( T 8 16.3) 0 L potes che l coeffcete agolare sa maggore o uguale ad 1 è da rfutare ad u qualuque lvello d sgfcatvtà 17

Step 3- valdazoe del modello u altro modo per valdare l modello è attraverso la msura della botà del ft SS R 1 ( y ( A B )) pccolo meglo la retta d regressoe spega dat Ma esso è ua quattà dmesoata dalle utà d msura della Y, allora azché valutare quato resdu soo pccol modo assoluto s vede quato resdu soo pccol relatvamete alla dspersoe totale de dat 18

y y y A B y y A B A B y y 19

y B A B A y y y 0 1 ) ( ) ( ) ( 1 1 1 YY R YY y y B A y y y S SS S R meglo la retta d regressoe spega dat

Il coeffcete è detto coeffcete d DETERMINAZIONE e spega, term percetual, quata della varabltà d Y sa dovuta alla varabltà della : R R Se è prossmo a 1 allora quas tutta la varabltà è spegata dalle e duque la retta d regressoe ha ua buoa adereza a dat, coè resdu pccol R Se è prossmo a 0 allora quas per ete la varabltà è spegata dalle e duque è dovuta a resdu, che c aspettamo essere grad Nell esempo che stamo aalzzado abbamo SS R 1.54 S YY 38.5 R 0.96 Per cu s evce che l 96% della varabltà delle rsposte Y è dovuta alla varabltà degl gress e duque la retta d regressoe è molto aderete a dat 1

Dalle dettà: r SY SSYY e SSR SYY S S S Y R S SS S S S S Segue: YY R Y YY YY r R Duque per valutare s può ache valutare la correlazoe emprca e po elevarla al quadrato. Nell esempo che stamo aalzzado partcolare r 0. 0.98 r 0. 96

y y R 1 Relazoe leare perfetta tra X e Y: 100% della varazoe Y è spegata dalla varazoe X 3

y y 0 R 1 Relazoe leare debole tra X e Y: parte della varazoe d Y è spegata dalla varazoe d X ma o tutta!! 4

y R 0 Nessua relazoe leare tra X e Y: Y è dpedete da X (essua varazoe Y è spegata dalla varazoe d X). 5

Step 3- valdazoe del modello U altro modo per valdare l modello leare è l aals de resdu stadardzzat ( y A B ) ( y SS A B ) R /( ) N(0,1) Scop Valutare l assuzoe d leartà Valutare l assuzoe d varaza costate per tutt valor d X Valutare l assuzoe d ormaltà Aals grafca de resdu Effettuare u plot de resdu versus valor assut da X stogramma per valutare la ormaltà 6

resdu resdu Aals de resdu per la leartà y y No Leare Leare 7

resdu resdu Aals de resdu per la varaza costate y y Varaza o-costate Varaza costate 8

Aals de resdu per la ormaltà 9

Esempo Voglamo esamare la relazoe tra l prezzo d vedta d ua casa e la sua gradezza (msurata m ) Abbamo a dsposzoe u campoe d 10 case Varable dpedete Y = prezzo della casa mglaa d euro Varable dpedete X = metr quadr prezz mglaa d euro (Y) m (X) 45 1400 31 1600 79 1700 308 1875 199 1100 19 1550 405 350 34 450 319 145 55 1700 30

scatter plot e lea d regressoe Pedeza= 0,10977 Itercept= 98,48 prezzo 98,4833 0,10977(m ) 31

Iterpretazoe dell tercept b 0 e della pedeza b 1 prezzo 98,4833 0,10977(m ) b 0 è l valore medo stmato d Y quado l valore d X è zero (se = 0 è fra valor osservat). Qu essua casa ha 0 m, qud b 0 = 98,4833 dca che, per le case osservate, 98.48,33 euro è la porzoe d prezzo della casa o spegata da m. b 1 rappreseta l cambameto medo stmato Y quado X vara d u utà. Qud b 1 = 0,10977 dca che l prezzo medo d ua casa aumeta d 0,10977(mglaa d euro)=109,77 euro per u metro quadro aggutvo. 3

R 18934,9348 3600,5000 0,5808 Ifereza sulla pedeza b 1 : la gradezza della casa metr quadr spega l prezzo? 58.08% della varazoe e prezz delle case è spegata dalla varazoe e metr quadr H H b 0 1 1 : 1 0 : 0 1 0,10977 b 1 s β 1 β 1 ~T ( ) a/=0,05 3,39 s b 1 0,0397 df 8 T 3,39 Rfuto H 0 c è suffcete evdeza che la metratura della casa spegh l prezzo t,8 -,3060 t,8,3060 33

Itervallo d cofdeza per la pedeza b t s 1 / b 1 Co u grado d fduca del 95%, l tervallo d cofdeza per la pedeza è (0,0337, 0,1858) Samo cofdet al 95% che l mpatto medo sul prezzo d vedta sa fra 33,70 euro e 185,80 euro per metro quadro Nota Bee Tale tervallo d cofdeza o clude 0!! Coclusoe: c è ua relazoe sgfcatva tra prezz delle case e la metratura co u grado d fduca del 95%!! 34

Route d Matlab per la regressoe [r,beta,alpha]=regresso(,y) 35

Eserczo peso kg (Y) altezza cm (X) Cosdero la seguete tabella che forsce dat d peso e altezza relatv ad u campoe d 13 dvdu d sesso femmle. Voglamo studare la relazoe esstete. 37.3 15 6.8 110 55.3 160 69.3 178 43.8 150 73.1 180 69.8 166 70. 175 58.8 16 56.4 17 64.4 180 6.6 100 4.8 115 36