Regressione e correlazione

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Regressione e correlazione"

Transcript

1 Regressioe e correlazioe Regressioe e correlazioe I molti casi si osservao gradezze che tedoo a covariare, ma () Se c è ua relazioe di dipedeza fra due variabili, ovvero se il valore di ua variabile (dipedete) si può determiare come fuzioe di ua secoda variabile (idipedete), allora si può usare ua regressioe. Esempio: la pressioe arteriosa dipede dall età del soggetto () Se o c è ua relazioe di dipedeza fra le variabili, ovvero se essua delle due è causa delle variazioi dell altra, la tedeza a covariare si misura i termii di correlazioe. Esempio: lughezza e peso di u orgaismo

2 Età Pressioe Pressioe Età Per misurare l itesità di ua relazioe (lieare) si usa il coefficiete di correlazioe di Bravais-Pearso. Per u campioe: r Per ua popolazioe: ρ (rho) r e ρ variao fra + e - Proporzioalità diretta: r tede a + Proporzioalità iversa: r tede a - Nessua relazioe: r tede a 0 Nessua relazioe lieare: r tede a 0

3 r = (ΣXY) - (ΣX)(ΣY) [(ΣX ) - (ΣX) ][(ΣY ) - (ΣY) ] Per l esempio sulla pressioe arteriosa: Soggetto Età(X) PA(Y) XY X Y A B 48 0 C 56 5 D 6 4 E 67 4 F 70 5 ΣX=45 ΣY=89 ΣXY=4764 ΣX =099 ΣY =44 r =.897 Cioè: forte relazioe positiva Se r =.897 idica ua forte relazioe positiva, si può affermare che questa relazioe o è frutto del caso ed è quidi sigificativa?

4 Ipotesi da testare per la sigificatività di ua correlazioe: H 0 : ρ = 0 H : ρ 0 t = r N - = r t crit(.05, df=) =.776 Poichè t=4.059>.776, si rigetta H 0 e si coclude che esiste ua correlazioe positiva e sigificativa fra età e pressioe arteriosa. Attezioe! Ua correlazioe positiva e sigificativa o implica u rapporto causale. 4

5 Regressioe lieare Aalizza la atura e l itesità di ua relazioe lieare fra due variabili, di cui ua dipede dall altra (o almeo ua è misurata seza errore). Iterpoliamo ua retta Ua retta qualsiasi è descritta dall equazioe: Y = a +bx (per u campioe) Y = α + βx (per ua popolazioe) Per determiare la retta che meglio si adatta ai dati, si usa il metodo dei miimi quadrati. 5

6 d 6 d 7 Per determiare la retta che meglio si adatta ai dati, si usa il metodo dei miimi quadrati. d 8 d 6 d 7 d 5 d 4 d d d Si calcola la distaza di ogi puto dalla retta ello spazio della variabile dipedete (Y) La somma d 8 d +d +d +d 4 +d 5. d 8 ovvero d 5 d d 4 d d Σ[Y f(x)] deve essere miimizzata (N.B. Questa somma è ua compoete della somma dei quadrati e quidi della variaza della variabile Y) 6

7 7 Nell equazioe Y = a + bx, a è l itercetta sull asse Y b è la pedeza della retta o coefficiete di regressioe stessa b - differete a stessa a - differete b Esiste ua retta di regressioe per qualsiasi isieme di dati. Immagiiamo ua popolazioe di dati per cui β = 0

8 8 Se u campioe casuale compredesse i puti (), la retta Y = a + bx che si iterpolerebbe avrebbe b 0 Esiste ua retta di regressioe per qualsiasi isieme di dati. Immagiiamo ua popolazioe di dati per cui β = 0 Qual è la probabilità che l isieme di puti i rosso sia stato estratto dalla popolazioe studiata e che esso descriva accuratamete la relazioe fra X e Y? Defiiamo l ipotesi ulla e l ipotesi alterativa: H 0 : β = 0 H : β 0 Quidi usiamo u ANOVA

9 ) Si calcola la somma dei quadrati ovvero la variabilità complessiva di Y SS T = Σ(Y i -Y) ) Si calcola la somma dei quadrati per la regressioe (cioè per il modello usato) SS R = ΣX i Y i ΣX i ΣY i ΣX i -(ΣX i ) ) Si calcola la somma dei quadrati per i residui (scarti dalla regressioe) SS D = SS T -SS R 4) Si calcolao i quadrati medi per la regressioe e per i residui MS x = SS x /df x dove df T = -, df R =, df D = df T df R 5) Si determia F: F = MS R /MS D 6) Si determia il valore di p corrispodete 7) Il coefficiete di determiazioe r = SS R /SS D è la proporzioe di variaza totale spiegata dalla regressioe Relazioi o lieari Se ua retta o descrive la relazioe fra due variabili, si deve usare ua fuzioe o lieare Spesso a questo fie si usao delle trasformazioi o lieari dei dati, per esempio i logaritmo U caso tipico è quello di ua relazioe lieare fra i logaritmi delle due variabili, tale che la curva che si iterpola è: Y = a X b [cioè log(y)=a+b log(x)] Esempio: relazioi peso-lughezza i pesci 9

10 y = 0.09x.574 R = y = 0.09x.574 R = Peso (g) Lughezza (cm) Peso (g) Lughezza (cm) Ua relazioe peso-lughezza si descrive co la regressioe lieare log-log, ovvero co ua fuzioe di poteza Y=aX b Domada #: il peso dipede dalla lughezza? Domada #: se accettiamo di usare la lughezza come variabile idipedete (è più facile da misurare), possiamo affermare che l errore di misura della lughezza è ullo? Domada #: possiamo affermare che l errore di misura della lughezza è << di quello del peso? 0

11 d 6 d 7 d 6 d 7 Il peso o dipede dalla lughezza (e viceversa). Cosa sappiamo: soo gradezze che covariao quidi i valori dell ua possoo essere utili per stimare i valori dell altra etrambe le misure soo affette da errore l ordie di gradezza dell errore ella stima della lughezza (assuta come variabile idipedete) può variare i fuzioe del metodo di misura e degli orgaismi da misurare Il peso o dipede dalla lughezza (e viceversa). Quidi, la regressioe lieare o è u metodo adatto a descrivere questa relazioe, a meo che l errore di misura della lughezza o sia << di quello del peso. d 8 d 8 d 5 d d 4 d 5 d d 4 d d d d Regressioe lieare Asse maggiore ridotto

12 Asse Maggiore e Asse Maggiore Ridotto Regola empirica: se la variaza delle X è >/ di quella delle Y, o si dovrebbe usare la regressioe lieare L Asse Maggiore cosidera sia l errore della X che quello della Y: è la bisettrice dell agolo formato della retta di regressioe della X sulla Y co quella di regressioe della Y sulla X. L Asse Maggiore Ridotto è quasi cocidete co l Asse Maggiore, ma è più semplice da otteere. Asse Maggiore Si miimizza la somma dei quadrati delle proiezioi dei puti sull Asse Maggiore Il calcolo implica: Estrazioe di autovalori ed autovettori dalla matrice di covariaza oppure Calcolo delle regressioi Y su X e X su Y e della bisettrice delle due rette d 6 d 5 d d 4 d d Asse maggiore d 8 d 7

13 Asse Maggiore Ridotto I pratica, quasi coicide co l Asse Maggiore Il calcolo implica: Calcolo delle regressioi Y su X e X su Y e quidi b RMA = by = f ( X ) bx = f ( Y ) Calcolo delle somme dei quadrati SS x e SS Y o delle variaze b = SS SS = RMA Y X s Y s X I ogi caso: a RMA = Y b RMA X SSx=SX-(SX) / SSxy=SXY-(SX)(SY)/ b=ssxy/ssx a=sy/-b SX/

14 Dati ordiali e relazioi mootoiche: la correlazioe di rago di Spearma Esperimeto: valutare la relazioe fra qualità dei idi costruiti e tempo di appredimeto 4

15 Cosa dobbiamo attederci? ua relazioe o lieare (l appredimeto o cosete di migliorare all ifiito) ua relazioe mootoica (co l appredimeto la qualità dei idi o può peggiorare) Qualità del ido (Y) Tempo di appredimeto (X) Dati (fittizi) : Uccello Tempo di appredimeto Qualità del ido A 4 9 B C 0 0 D 8 Qualità del ido Tempo di appredimeto 5

16 Assegamo dei raghi ai dati : Uccello Tempo di appredimeto Qualità del ido A 4 9 B C D 8 Qualità del ido Tempo di appredimeto Calcolo della correlazioe di Spearma (metodo di base) ) Si assegao i raghi ai valori di X e Y ) Si calcola il coefficiete di Bravais-Pearsoo sui dati trasformati Uccello Tempo di appredimeto Qualità del ido XY A 9 B C D 4 ΣX = 0 ΣX = ΣXY = SS x = ΣX - (ΣX) = 6 Aalogamete, SS Y = 6 e SP = ΣXY - (ΣX) (ΣY) = 6 Quidi r s = SP =.0 (SS X )(SS Y ) 6

17 7 d r i i S = = 6 Se o ci soo raghi assegati ex-aequo, il calcolo può essere semplificato, essedo: Calcolo di r S dai raghi dove d è la differeza fra il rago della i-ma osservazioe per il descrittore j e quello per il descrittore k. = = = = = = m h hk hk m h hj hj i i m h hk hk m h hj hj S q q q q d q q q q r ) ( ) ( ) ( ) ( dove m è il umero di raghi e q hj e q hk soo il umero di osservazioi di rago h per il descrittore j e per quello k Calcolo di r S dai raghi Se ci soo (molti) raghi assegati ex-aequo, il calcolo deve essere corretto come segue:

REGRESSIONE LINEARE E POLINOMIALE

REGRESSIONE LINEARE E POLINOMIALE REGRESSIONE LINEARE E POLINOMIALE Nota ua tabella di dati relativi alle osservazioi di due gradezze X e Y, è aturale formulare ipotesi su quale possa essere ua ragioevole fuzioe che rappreseti o che approssimi

Dettagli

La correlazione e la regressione. Antonello Maruotti

La correlazione e la regressione. Antonello Maruotti La correlazioe e la regressioe Atoello Maruotti Outlie 1 Correlazioe 2 Associazioe tra caratteri quatitativi Date due distribuzioi uitarie secodo caratteri quatitativi X e Y x 1 x 2 x y 1 y 2 y associate

Dettagli

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni A Alcui cocetti di statistica: medie, variaze, covariaze e regressioi Esistoo svariati modi per presetare gradi quatità di dati. Ua possibilità è presetare la cosiddetta distribuzioe, raggruppare cioè

Dettagli

Esercitazioni di Statistica Dott.ssa Cristina Mollica [email protected]

Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it Esercitazioi di Statistica Dott.ssa Cristia Mollica [email protected] Cocetrazioe Esercizio 1. Nell'ultima settimaa ua baca ha erogato i segueti importi (i migliaia di euro) per prestiti a imprese:

Dettagli

1.6 Serie di potenze - Esercizi risolti

1.6 Serie di potenze - Esercizi risolti 6 Serie di poteze - Esercizi risolti Esercizio 6 Determiare il raggio di covergeza e l isieme di covergeza della serie Soluzioe calcolado x ( + ) () Per la determiazioe del raggio di covergeza utilizziamo

Dettagli

Stima della media di una variabile X definita su una popolazione finita

Stima della media di una variabile X definita su una popolazione finita Stima della media di ua variabile X defiita su ua popolazioe fiita otazioi: popolazioe, campioe e strati Popolazioe. umerosità popolazioe; Ω {ω,..., ω } popolazioe X variabile aleatoria defiita sulla popolazioe

Dettagli

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli Esercitazioi di Statistica Dott. Dailo Alui Fegatelli [email protected] Esercizio. Su 0 idividui soo stati rilevati la variabile X (geere) e (umero di auto possedute) X F F M F M F F M F M

Dettagli

Approfondimento 2.1 Scaling degli stimoli mediante il metodo del confronto a coppie

Approfondimento 2.1 Scaling degli stimoli mediante il metodo del confronto a coppie Approfodimeto 2.1 Scalig degli stimoli mediate il metodo del cofroto a coppie Il metodo del cofroto a coppie di Thurstoe (Thurstoe, 1927) si basa sull assuzioe che la valutazioe di u oggetto o di uo stimolo

Dettagli

a) la funzione costante k. Sia k un numero reale e consideriamo la funzione che ad ogni numero reale x associa k: x R k

a) la funzione costante k. Sia k un numero reale e consideriamo la funzione che ad ogni numero reale x associa k: x R k ALCUNE FUNZIONI ELEMENTARI ( E NON) E LORO GRAFICI (*) a) la fuzioe costate k. Sia k u umero reale e cosideriamo la fuzioe che ad ogi umero reale x associa k: x R k Tale fuzioe è detta fuzioe costate k;

Dettagli

Campionamento casuale da popolazione finita (caso senza reinserimento )

Campionamento casuale da popolazione finita (caso senza reinserimento ) Campioameto casuale da popolazioe fiita (caso seza reiserimeto ) Suppoiamo di avere ua popolazioe di idividui e di estrarre u campioe di uità (co < ) Suppoiamo di studiare il carattere X che assume i valori

Dettagli

LE MISURE DI SINTESI (misure di tendenza centrale)

LE MISURE DI SINTESI (misure di tendenza centrale) STATISTICA DESCRITTIVA LE MISURE DI SINTESI (misure di tedeza cetrale) http://www.biostatistica.uich.itit OBIETTIVO Altezza degli studeti 004-05 (cm) Tabella dei dati Idividuare u idice che rappreseti

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Doatella Siepi [email protected] tel: 075 5853525 05 dicembre 2014 6 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazioe dei

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioi di Statistica Il modello di Regressioe Prof. Livia De Giovai [email protected] Esercizio Solitamete è accertato che aumetado il umero di uità prodotte, u idustria possa ridurre i costi

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea i Ecoomia e Fiaza Statistica 1 A.A. 2015/2016 (8 CFU, corrispodeti a 48 ore di lezioe frotale e 24 ore di esercitazioe) Prof. Luigi Augugliaro 1 / 21 Misura della dipedeza di u carattere

Dettagli

ESAME DI STATO DI LICEO SCIENTIFICO 2005 CORSO DI ORDINAMENTO Sessione ordinaria Tema di MATEMATICA - 23 giugno 2005

ESAME DI STATO DI LICEO SCIENTIFICO 2005 CORSO DI ORDINAMENTO Sessione ordinaria Tema di MATEMATICA - 23 giugno 2005 ESAME DI STATO DI LICEO SCIENTIFICO 005 CORSO DI ORDINAMENTO Sessioe ordiaria Tema di MATEMATICA - 3 giugo 005 Svolgimeto a cura del prof. Luigi Tomasi ([email protected]) RISPOSTE AI QUESITI DEL

Dettagli

STATISTICA 1 ESERCITAZIONE 5

STATISTICA 1 ESERCITAZIONE 5 STATISTICA ESERCITAZIONE 5 Dott. Giuseppe Padolfo 28 Ottobre 203 VARIABILITA IN TERMINI DI DISPERSIONE DA UN CENTRO Cetro Me o μ La dispersioe viee misurata come sitesi delle distaze tra le uità statistiche

Dettagli

Inferenza statistica. Popolazione. Camp. Statistiche campionarie basate sulle osservazioni del campione. Estrazione casuale. Parametro e statistica

Inferenza statistica. Popolazione. Camp. Statistiche campionarie basate sulle osservazioni del campione. Estrazione casuale. Parametro e statistica 6/0/0 Corso di Statistica per l impresa Prof. A. D Agostio Ifereza statistica Per fare ifereza statistica si utilizzao le iformazioi raccolte su u campioe per cooscere parametri icogiti della popolazioe

Dettagli

Richiami sulle potenze

Richiami sulle potenze Richiami sulle poteze Dopo le rette, le fuzioi più semplici soo le poteze: Distiguiamo tra: - poteze co espoete itero - poteze co espoete frazioario (razioale) - poteze co espoete reale = Domiio delle

Dettagli

STUDIO DEL LANCIO DI 3 DADI

STUDIO DEL LANCIO DI 3 DADI Leoardo Latella STUDIO DEL LANCIO DI 3 DADI Il calcolo delle probabilità studia gli eveti casuali probabili, cioè quegli eveti che possoo o o possoo verificarsi e che dipedoo uicamete dal caso. Tale studio

Dettagli

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno Uiversità degli Studi di Cassio, Ao accademico 004-005 Corso di Statistica, Prof.. uro Esercitazioe del 01/03/005 dott. Claudio Coversao Esercizio 1 Si cosideri il seguete campioe casuale semplice estratto

Dettagli

ORDINAMENTO 2010 SESSIONE STRAORDINARIA - QUESITI QUESITO 1

ORDINAMENTO 2010 SESSIONE STRAORDINARIA - QUESITI QUESITO 1 www.matefilia.it ORDINAMENTO 1 SESSIONE STRAORDINARIA - QUESITI QUESITO 1 Due osservatori si trovao ai lati opposti di u grattacielo, a livello del suolo. La cima dell edificio dista 16 metri dal primo

Dettagli

LE MISURE DI TENDENZA CENTRALE

LE MISURE DI TENDENZA CENTRALE STATISTICA DESCRITTIVA LE MISURE DI TENDENZA CENTRALE http://www.biostatistica.uich.itit OBIETTIVO Esempio: Nella tabella seguete soo riportati i valori del tasso glicemico rilevati su 0 pazieti: Idividuare

Dettagli

SERIE DI POTENZE Esercizi risolti. Esercizio 1 Determinare il raggio di convergenza e l insieme di convergenza della serie di potenze. x n.

SERIE DI POTENZE Esercizi risolti. Esercizio 1 Determinare il raggio di convergenza e l insieme di convergenza della serie di potenze. x n. SERIE DI POTENZE Esercizi risolti Esercizio x 2 + 2)2. Esercizio 2 + x 3 + 2 3. Esercizio 3 dove a è u umero reale positivo. Esercizio 4 x a, 2x ) 3 +. Esercizio 5 x! = x + x 2 + x 6 + x 24 + x 20 +....

Dettagli

Lezione III: Variabilità. Misure di dispersione o di variabilità. Prof. Enzo Ballone. Lezione 3a- Misure di dispersione o di variabilità

Lezione III: Variabilità. Misure di dispersione o di variabilità. Prof. Enzo Ballone. Lezione 3a- Misure di dispersione o di variabilità Lezioe III: Variabilità Cattedra di Biostatistica Dipartimeto di Scieze Biomediche, Uiversità degli Studi G. d Auzio di Chieti Pescara Prof. Ezo Balloe Lezioe a- Misure di dispersioe o di variabilità Misure

Dettagli

Serie di potenze / Esercizi svolti

Serie di potenze / Esercizi svolti MGuida, SRolado, 204 Serie di poteze / Esercizi svolti Si cosideri la serie di poteze (a) Determiare il raggio di covergeza 2 + x (b) Determiare l itervallo I di covergeza putuale (c) Dire se la serie

Dettagli