Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Documenti analoghi
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Statistica multivariata Donata Rodi 17/10/2016

Argomenti della lezione:

Regressione Lineare Semplice e Correlazione

Correlazione e regressione

Capitolo 12 La regressione lineare semplice

La regressione lineare semplice

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Metodologie Quantitative

Esercitazione del

Lezione 7 Corso di Statistica. Francesco Lagona

Indipendenza, Dipendenza e interdipendenza

Regressione lineare semplice

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Rappresentazioni grafiche di distribuzioni doppie

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Analisi della Regressione Lineare

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

STATISTICA A K (60 ore)

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Regressione & Correlazione

ESERCITAZIONI N. 3 corso di statistica

Corso in Statistica Medica

Statistica descrittiva: analisi di regressione

lezione 4 AA Paolo Brunori

Campo di applicazione

Matematica Lezione 22

ESERCITAZIONI N. 3 corso di statistica

Statistica13-23/11/2015

Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta.

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

LA REGRESSIONE LINEARE SEMPLICE

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

Cognome e nome Tempo disponibile: 75 minuti

1. variabili dicotomiche: 2 sole categorie A e B

Statistica. Alfonso Iodice D Enza

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Statistica. Alfonso Iodice D Enza

Analisi bivariata. Il caso di caratteri quantitativi

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Esercizio 2: voto e ore dedicate allo studio

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Statistica di base per l analisi socio-economica

Correlazione e regressione

Interpolazione e metodo dei minimi quadrati

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

STATISTICA. Regressione-2

Metodi statistici per le ricerche di mercato

1.1 Obiettivi della statistica Struttura del testo 2

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

REGRESSIONE E CORRELAZIONE

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Esercizi su Regressione e Connessione

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

STATISTICA. Esercitazione 5

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

Teoria e tecniche dei test. Concetti di base

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Statistica Inferenziale

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Dispensa di Statistica

Correlazione lineare e regressione

lezione 5 AA Paolo Brunori

Statistica 1 A.A. 2015/2016

Cognome e nome. Distribuzione Gaussiana; Media = 122,4 mmhg; Deviazione standard= 14,28 mmhg

Cognome e nome Tempo disponibile: 60 minuti

Tempo disponibile: 60 minuti

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza

Settimana 3. G. M. Marchetti. Marzo 2017

STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Statistica. Alfonso Iodice D Enza

7. STATISTICA DESCRITTIVA

Esercizi di statistica

Argomenti della lezione:

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

STATISTICA MULTIVARIATA SSD MAT/06

Transcript:

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 1

Campo di applicazione Analisi della relazione tra due variabili continue. Es: relazione tra altezza e peso Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 2

Campo di applicazione Le variabili sono associate? -> correlazione Come varia il valore di una variabile in conseguenza del variare di un altra variabile? -> regressione Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 3

Correlazione Dato un insieme di osservazioni definite da due variabili continue, valutiamo la forza dell associazione tra le due variabili disegnando il diagramma di dispersione e calcolando il coefficiente di correlazione. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 4

Correlazione Il diagramma di dispersione si disegna riportando i valori delle osservazioni su un sistema di assi cartesiani, in cui l asse x rappresenta una delle due variabili e l asse y l altra variabile. Il diagramma consente di collocare ogni osservazione nello spazio definito dai valori possibili delle due variabili. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 5

Relazione alla nascita tra circonferenza cranica e lunghezza 36,0 34,0 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20,0 19 24 29 34 39 44 49 lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 6

La forma della nuvola di punti così ottenuta consente una valutazione visiva del grado di associazione tra le due variabili. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 7

36,0 Relazione tra circonferenza cranica alla nascita ed età materna 34,0 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20,0 10 15 20 25 30 35 40 45 età materna Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 8

Relazione alla nascita tra circonferenza cranica e lunghezza 36,0 34,0 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20,0 19 24 29 34 39 44 49 lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 9

Il coefficiente di correlazione di Pearson (r) consente la valutazione formale del grado di associazione. L intervallo dei valori possibili di r è: -1 <= r <=1 Se r=1 o r=-1 tutti i punti giacciono su una retta Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 10

36,0 34,0 Relazione tra circonferenza cranica alla nascita ed età materna r = 0,15 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20,0 10 15 20 25 30 35 40 45 età materna Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 11

Relazione alla nascita tra circonferenza cranica e lunghezza 36,0 34,0 r = 0,72 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20,0 19 24 29 34 39 44 49 lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 12

Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 13 ( )( ) ( ) ( ) = = = = n i n i i i n i i i y y x x y y x x r 1 1 2 2 1 La formula del coefficiente di correlazione di Pearson (r)

Relazione tra concentrazione plasmatica i colesterolo e trigliceridi Colesterolo Trigliceridi (x) x y 1 3,45 6,24-2,459-0,493 2 3,5 6,18-2,409-0,553 3 2,95 5,2-2,959-1,533 4 3,77 6,11-2,139-0,623 5 3,67 6,36-2,239-0,373 6 5,31 5,67-0,599-1,063 7 5,1 5,48-0,809-1,253 8 7,85 5,67 1,941-1,063 9 8,79 9,4 2,881 2,667 10 12,3 8,4 6,391 1,667 medie: 5,669 6,471 (y) ( ) y i xi ( ) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 14

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi 10 9 8 7 6 trigliceridi 5 4 3 2 1 0 0 2 4 6 8 10 12 14 colesterolo Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 15

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi Colesterolo (x) Trigliceridi ( y) xi y i ( x) ( y y) ( x) (y) x i * ( x ) i x i 2 ( y y) i 2 3,45 6,24-2,459-0,493 1,212287 6,046681 0,243049 3,5 6,18-2,409-0,553 1,332177 5,803281 0,305809 2,95 5,2-2,959-1,533 4,536147 8,755681 2,350089 3,77 6,11-2,139-0,623 1,332597 4,575321 0,388129 3,67 6,36-2,239-0,373 0,835147 5,013121 0,139129 5,31 5,67-0,599-1,063 0,636737 0,358801 1,129969 5,1 5,48-0,809-1,253 1,013677 0,654481 1,570009 7,85 5,67 1,941-1,063-2,063283 3,767481 1,129969 8,79 9,4 2,881 2,667 7,683627 8,300161 7,112889 12,3 8,4 6,391 1,667 10,653797 40,844881 2,778889 Sommatorie: 26,54411 83,54389 16,46149 r= 0,715774547 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 16

Esercizi Correlazione Pag. 304 n. 1 Pag. 304 n. 5 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 17

Regressione Stima della variazione media di una variabile in conseguenza della variazione unitaria di un altra variabile Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 18

Variabile indipendente -> causa Variabile dipendente -> effetto Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 19

Variabile indipendente -> causa -> ascisse Variabile dipendente -> effetto -> ordinate Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 20

effetto y V. d i p e n d e n t e Var. indipendente x causa Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 21

Obiettivo dell analisi di regressione: Individuare la retta che meglio predice il valore di y (variabile dipendente), noto il valore di x (variabile indipendente). y=a+bx Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 22

y=a+bx a -> intercetta b -> pendenza Come stimiamo i valori dei due coefficienti? Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 23

Il valore atteso di x è la sua media y Media di x x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 24

Il valore atteso di y è la sua media Media di y x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 25

La retta che meglio predice y x passa per la media di x e di y y Media di x e media di y x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 26

Per un punto passano infinite rette! Quale retta scegliamo? Con quale criterio? y x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 27

y x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 28

y valore y_osservato valore y_predetto x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 29

Residuo (o scarto) = valore y_osservato valore y_predetto La retta migliore minimizza la somma dei quadrati dei residui y Metodo detto dei minimi quadrati valore y_osservato valore y_predetto x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 30

a = y bx ( )( ) x x y y ( ) x b = i 2 i x i Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 31

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi Colesterolo (x) Trigliceridi ( y) xi y i ( x) ( y y) ( x) (y) x i * ( x ) i x i 2 1 3,45 6,24-2,219-0,231 0,512589 4,923961 2 3,5 6,18-2,169-0,291 0,631179 4,704561 3 2,95 5,2-2,719-1,271 3,455849 7,392961 4 3,77 6,11-1,899-0,361 0,685539 3,606201 5 3,67 6,36-1,999-0,111 0,221889 3,996001 6 5,31 5,67-0,359-0,801 0,287559 0,128881 7 5,1 5,48-0,569-0,991 0,563879 0,323761 8 7,85 5,67 2,181-0,801-1,746981 4,756761 9 8,79 9,4 3,121 2,929 9,141409 9,740641 10 12,3 8,4 6,631 1,929 12,791199 43,970161 medie: 5,669 6,471 26,54411 83,54389 b= 0,31772653 a= 4,66980832 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 32

variazione del livello di trigliceridi con il livello di colesterolo 10 trigliceridi (y) 8 6 4 2 0 0 2 4 6 8 10 12 14 colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 33

variazione del livello di trigliceridi con il livello di colesterolo trigliceridi (y) 10 8 6 4 2 0 0 2 4 6 8 10 12 14 colesterolo (x) b = 0,32 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 34

variazione del livello di trigliceridi con il livello di colesterolo trigliceridi (y) 10 8 6 4 2 0 a=4,67 0 2 4 6 8 10 12 14 colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 35

variazione del livello di trigliceridi con il livello di colesterolo trigliceridi=4,67 + 0,32* colesterolo 10 trigliceridi (y) 8 6 4 2 0 0 2 4 6 8 10 12 14 colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 36

Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 37 Formule abbreviate ( )( ) ( )( ) ( ) ( ) = x x y x y x y i n i a i i i i i 2 2 2 ( ) ( )( ) ( ) ( ) = x x y x y x i n i n b i i i i 2 2 Queste formule sono più convenienti per il calcolo a mano Si basano sulle formule abbreviate per il calcolo della varianza

Requisiti dell analisi di regressione Y è una variabile casuale Omoscedasticità (omogeneità della varianza di y x) Distribuzione normale di y x Linearità della relazione tra x ed y Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 38

In questo esempio abbiamo dati campionati da una popolazione in cui le tre assunzioni sono soddisfatte Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 39

Variabilità della retta di regressione. y è una variabile casuale x di solito non è una variabile casuale. Il ricercatore può scegliere soggetti con i valori della x più adatti per lo studio. Pertanto siamo interessati a valutare la variabilità di y Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 40

Varianza intorno alla retta di regressione (stima campionaria) s ( ) y yˆ 2 i i = n 2 2 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 41

Residuo (o scarto) = valore y_osservato valore y_predetto Varianza = scarti ^ 2 / g.l. y valore y_osservato scarto valore y_predetto x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 42

s ( ) y yˆ 2 i i = n 2 2 y ˆ = a + i bx i Sostituisco: s 2 ( y a bx ) = i n 2 i 2 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 43

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi Colesterolo Triglicerid att(y) y-att(y) (y-att(y))^2 (x) i (y) 1 3,45 6,24 5,765965 0,474035 0,224709 2 3,5 6,18 5,781851 0,398149 0,158522 3 2,95 5,2 5,607102-0,4071 0,165732 4 3,77 6,11 5,867637 0,242363 0,05874 5 3,67 6,36 5,835865 0,524135 0,274718 6 5,31 5,67 6,356936-0,68694 0,471881 7 5,1 5,48 6,290214-0,81021 0,656446 8 7,85 5,67 7,163962-1,49396 2,231921 9 8,79 9,4 7,462624 1,937376 3,753424 10 12,3 8,4 8,577845-0,17784 0,031629 somma degli scarti^2 8,027722 b= 0,31772653 s(b)^2= 1,003465 a= 4,66980832 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 44

Omoscedasticità: la varianza di y è costante per tutto l intervallo x. E un requisito per la corretta applicazione della regressione lineare (v.oltre) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 45

Errore standard di b ES( b) = s 2 ( x x) 2 i Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 46

Colesterolo (x) Trigliceridi ( ) (y) x xi 2 att(y) y-att(y) (y-att(y))^2 1 3,45 6,24 4,923961 5,765965 0,474035 0,224709 2 3,5 6,18 4,704561 5,781851 0,398149 0,158522 3 2,95 5,2 7,392961 5,607102-0,4071 0,165732 4 3,77 6,11 3,606201 5,867637 0,242363 0,05874 5 3,67 6,36 3,996001 5,835865 0,524135 0,274718 6 5,31 5,67 0,128881 6,356936-0,68694 0,471881 7 5,1 5,48 0,323761 6,290214-0,81021 0,656446 8 7,85 5,67 4,756761 7,163962-1,49396 2,231921 9 8,79 9,4 9,740641 7,462624 1,937376 3,753424 10 12,3 8,4 43,970161 8,577845-0,17784 0,031629 83,54389 somma degli scarti^2 8,027722 b= 0,31772653 s(b)^2= 1,003465 a= 4,66980832 ES(b)= 0,109596 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 47

Errore standard di b ES( b) = s 2 ( x x) 2 i L errore standard di b si riduce, a parità di s, quando la variabilità di x è maggiore! Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 48

Intervallo di Confidenza e tests t per il coefficiente di regressione t = distanza tra il valore di b stimato (b) e quello previsto dall ipotesi nulla (ß, di solito H0: ß =0), in unità di errore standard di b (SE(b)) t = b β SE(b) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 49

Intervallo di Confidenza del coefficiente di regressione L intervallo di confidenza si calcola nel modo consueto (v. lezione precedente) t ha (n-2) gradi di libertà ed il valore è scelto in modo corrispondente all errore di I tipo, con test a 2 code CI = b ± t crit SE(b) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 50

Colesterolo (x) Trigliceridi ( ) (y) x xi 2 att(y) y-att(y) (y-att(y))^2 1 3,45 6,24 4,923961 5,765965 0,474035 0,224709 2 3,5 6,18 4,704561 5,781851 0,398149 0,158522 3 2,95 5,2 7,392961 5,607102-0,4071 0,165732 4 3,77 6,11 3,606201 5,867637 0,242363 0,05874 5 3,67 6,36 3,996001 5,835865 0,524135 0,274718 6 5,31 5,67 0,128881 6,356936-0,68694 0,471881 7 5,1 5,48 0,323761 6,290214-0,81021 0,656446 8 7,85 5,67 4,756761 7,163962-1,49396 2,231921 9 8,79 9,4 9,740641 7,462624 1,937376 3,753424 10 12,3 8,4 43,970161 8,577845-0,17784 0,031629 83,54389 somma degli scarti^2 8,027722 b= 0,31772653 s(b)^2= 1,003465 a= 4,66980832 ES(b)= 0,109596 IC(95%)_b= 0,064998-0,570455 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 51

8 6 4 2 variazione del livello di trigliceridi con il livello di colesterolo trigliceridi=4,67 + 0,32* colesterolo IC(95%)_b= 10 0,06-0,57 trigliceridi (y) 0 0 2 4 6 8 10 12 14 colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 52

Relazione alla nascita tra circonferenza cranica e lunghezza circonferenza cranica 36,0 34,0 32,0 30,0 28,0 26,0 24,0 a=8,02 b= 0,51 ES(b)=0,05021 (IC 95%_b: 0,41-0,61) y= 8,02 + 0,51x 22,0 20,0 18,0 19 22 25 28 31 34 37 40 43 46 lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 53

Valore di y predetto dalla retta di regressione data y=a+bx, dopo aver ricavato a e b possiamo predire il valore atteso di y, corrispondente ad un dato valore di x. Il calcolo si effettua sostituendo il valore di x nella formula, noti a e b e risolvendo l equazione. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 54

Valore di y predetto dalla retta di regressione Es. il valore di circonferenza cranica predetto per un bambino di lunghezza 41 cm è ŷ =8,02+0,513 * x ŷ ŷ =8,02+0,513 * 41 =29,05 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 55

Intervallo di confidenza dei valori predetti PI ( ) 2 x x i ( ) x x 1 = yˆ ± t s 1+ + gl, α 2 2 n i Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 56

Relazione alla nascita tra circonferenza cranica e lunghezza Es. il valore di circonferenza cranica predetto per un bambino di lunghezza 41 cm è ŷ =29,05 ŷ IC( )= 25,47-32,63 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 57

Intervallo di confidenza dei valori predetti PI ( ) 2 x x i ( ) x x 1 = yˆ ± t s 1+ + gl, α 2 2 n i La predizione ha un errore maggiore allontanandosi dalla media di x La predizione ha un errore minore con un ampia variabilità di x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 58

Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 59

14 12 10 8 6 4 atteso_y 2 0 0 2 4 6 8 10 12 14 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 60

Cautele nella predizione La predizione non è valida fuori dell intervallo osservato di x La predizione è più incerta agli estremi della distribuzione di x Per migliorare la precisione della predizione debbo aumentare la somma dei quadrati degli scarti (devianza) di x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 61

Outliers ed osservazioni influenti Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 62

Relazione alla nascita tra circonferenza cranica e lunghezza Ho due outliers, indicati come: 1 e 2 36,0 34,0 2 32,0 30,0 circonferenza cranica 28,0 26,0 24,0 22,0 1 20,0 18,0 19 22 25 28 31 34 37 40 43 46 lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 63

Relazione alla nascita tra circonferenza cranica e lunghezza Se escludo outlier 1 36,0 34,0 32,0 30,0 circonferenza cranica 28,0 26,0 24,0 22,0 1 20,0 18,0 19 22 25 28 31 34 37 40 43 46 lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 64

Relazione alla nascita tra circonferenza cranica e lunghezza 36,0 34,0 Se escludo outliers 1 e 2 2 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 1 20,0 18,0 19 22 25 28 31 34 37 40 43 46 lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 65

Relazione alla nascita tra circonferenza cranica e lunghezza Tutti i dati: a=8,02 b= 0,51 Escluso outlier 1: a=4,91 b=0,60 Esclusi outlier 1 e 2: a=4,46 b=0,61 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 66

Valutazione del modello R 2 : proporzione della varianza che è spiegata dal modello di regressione = coefficiente di correlazione ^2 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 67

variazione del livello di trigliceridi con il livello di colesterolo trigliceridi=4,67 + 0,32* colesterolo 10 r =0,716 R 2 =0,51 trigliceridi (y) 8 6 4 2 0 0 2 4 6 8 10 12 14 colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 68

Verifica dei modelli Omoscedasticità (omogeneità della varianza) Distribuzione normale degli errori Linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 69

Verifica dei modelli Omoscedasticità (omogeneità della varianza) Distribizione normale degli errori Linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 70

Omoscedasticità (omogeneità della varianza) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 71

Verifica delle assunzioni del modello La verifica delle assunzioni del modello viene condotta esaminando la distribuzione dei residui Se la varianza è costante per tutta la distribuzione della x,anche i residui saranno distribuiti in modo uniforme. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 72

Verifica delle assunzioni del modello Distribuzione uniforme dei residui Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 73

Distribuzione uniforme dei residui Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 74

Distribuzione non uniforme dei residui Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 75

Distribuzione non uniforme dei residui Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 76

Verifica dei modelli Omoscedasticità (omogeneità della varianza) Distribuzione normale degli errori Linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 77

Distribuzione normale dei residui (errori) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 78

Distribuzione non normale dei residui (errori) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 79

Distribuzione non normale dei residui (errori) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 80

Verifica dei modelli Omoscedasticità (omogeneità della varianza) Distribizione normale degli errori Linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 81

Perchè parliamo di regressione lineare? La variazione lineare è spesso una spiegazione adeguata Variazioni non lineari diventano tali dopo una trasformazione matematica di una delle variabili La variazione lineare è un punto di partenza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 82

Non-linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 83

Non-linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 84

Trasformazioni normalizzanti e linearizzanti Radice quadrata Logaritmo Inversa (meglio se ulteriormente moltiplicata per -1) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 85

Trasformazioni normalizzanti e linearizzanti Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 86

Trasformazioni normalizzanti e linearizzanti Dati trasformati Inversa negativa Log Radice Dati originali Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 87

Esercizi regressione Pag.326 n 1 Pag.326 n 3 Pag.326 n 4 Pag.326 n 6 Pag.326 n 10 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 88