Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare"

Transcript

1 Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 1

2 Campo di applicazione Analisi della relazione tra due variabili continue. Es: relazione tra altezza e peso Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 2

3 Campo di applicazione Le variabili sono associate? -> correlazione Come varia il valore di una variabile in conseguenza del variare di un altra variabile? -> regressione Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 3

4 Correlazione Dato un insieme di osservazioni definite da due variabili continue, valutiamo la forza dell associazione tra le due variabili disegnando il diagramma di dispersione e calcolando il coefficiente di correlazione. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 4

5 Correlazione Il diagramma di dispersione si disegna riportando i valori delle osservazioni su un sistema di assi cartesiani, in cui l asse x rappresenta una delle due variabili e l asse y l altra variabile. Il diagramma consente di collocare ogni osservazione nello spazio definito dai valori possibili delle due variabili. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 5

6 Relazione alla nascita tra circonferenza cranica e lunghezza 36,0 34,0 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20, lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 6

7 La forma della nuvola di punti così ottenuta consente una valutazione visiva del grado di associazione tra le due variabili. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 7

8 36,0 Relazione tra circonferenza cranica alla nascita ed età materna 34,0 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20, età materna Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 8

9 Relazione alla nascita tra circonferenza cranica e lunghezza 36,0 34,0 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20, lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 9

10 Il coefficiente di correlazione di Pearson (r) consente la valutazione formale del grado di associazione. L intervallo dei valori possibili di r è: -1 <= r <=1 Se r=1 o r=-1 tutti i punti giacciono su una retta Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 10

11 36,0 34,0 Relazione tra circonferenza cranica alla nascita ed età materna r = 0,15 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20, età materna Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 11

12 Relazione alla nascita tra circonferenza cranica e lunghezza 36,0 34,0 r = 0,72 32,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 20, lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 12

13 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 13 ( )( ) ( ) ( ) = = = = n i n i i i n i i i y y x x y y x x r La formula del coefficiente di correlazione di Pearson (r)

14 Relazione tra concentrazione plasmatica i colesterolo e trigliceridi Colesterolo Trigliceridi (x) x y 1 3,45 6,24-2,459-0, ,5 6,18-2,409-0, ,95 5,2-2,959-1, ,77 6,11-2,139-0, ,67 6,36-2,239-0, ,31 5,67-0,599-1, ,1 5,48-0,809-1, ,85 5,67 1,941-1, ,79 9,4 2,881 2, ,3 8,4 6,391 1,667 medie: 5,669 6,471 (y) ( ) y i xi ( ) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 14

15 Relazione tra concentrazione plasmatica di colesterolo e trigliceridi trigliceridi colesterolo Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 15

16 Relazione tra concentrazione plasmatica di colesterolo e trigliceridi Colesterolo (x) Trigliceridi ( y) xi y i ( x) ( y y) ( x) (y) x i * ( x ) i x i 2 ( y y) i 2 3,45 6,24-2,459-0,493 1, , , ,5 6,18-2,409-0,553 1, , , ,95 5,2-2,959-1,533 4, , , ,77 6,11-2,139-0,623 1, , , ,67 6,36-2,239-0,373 0, , , ,31 5,67-0,599-1,063 0, , , ,1 5,48-0,809-1,253 1, , , ,85 5,67 1,941-1,063-2, , , ,79 9,4 2,881 2,667 7, , , ,3 8,4 6,391 1,667 10, , , Sommatorie: 26, , ,46149 r= 0, Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 16

17 Esercizi Correlazione Pag. 304 n. 1 Pag. 304 n. 5 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 17

18 Regressione Stima della variazione media di una variabile in conseguenza della variazione unitaria di un altra variabile Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 18

19 Variabile indipendente -> causa Variabile dipendente -> effetto Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 19

20 Variabile indipendente -> causa -> ascisse Variabile dipendente -> effetto -> ordinate Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 20

21 effetto y V. d i p e n d e n t e Var. indipendente x causa Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 21

22 Obiettivo dell analisi di regressione: Individuare la retta che meglio predice il valore di y (variabile dipendente), noto il valore di x (variabile indipendente). y=a+bx Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 22

23 y=a+bx a -> intercetta b -> pendenza Come stimiamo i valori dei due coefficienti? Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 23

24 Il valore atteso di x è la sua media y Media di x x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 24

25 Il valore atteso di y è la sua media Media di y x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 25

26 La retta che meglio predice y x passa per la media di x e di y y Media di x e media di y x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 26

27 Per un punto passano infinite rette! Quale retta scegliamo? Con quale criterio? y x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 27

28 y x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 28

29 y valore y_osservato valore y_predetto x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 29

30 Residuo (o scarto) = valore y_osservato valore y_predetto La retta migliore minimizza la somma dei quadrati dei residui y Metodo detto dei minimi quadrati valore y_osservato valore y_predetto x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 30

31 a = y bx ( )( ) x x y y ( ) x b = i 2 i x i Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 31

32 Relazione tra concentrazione plasmatica di colesterolo e trigliceridi Colesterolo (x) Trigliceridi ( y) xi y i ( x) ( y y) ( x) (y) x i * ( x ) i x i 2 1 3,45 6,24-2,219-0,231 0, , ,5 6,18-2,169-0,291 0, , ,95 5,2-2,719-1,271 3, , ,77 6,11-1,899-0,361 0, , ,67 6,36-1,999-0,111 0, , ,31 5,67-0,359-0,801 0, , ,1 5,48-0,569-0,991 0, , ,85 5,67 2,181-0,801-1, , ,79 9,4 3,121 2,929 9, , ,3 8,4 6,631 1,929 12, , medie: 5,669 6,471 26, ,54389 b= 0, a= 4, Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 32

33 variazione del livello di trigliceridi con il livello di colesterolo 10 trigliceridi (y) colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 33

34 variazione del livello di trigliceridi con il livello di colesterolo trigliceridi (y) colesterolo (x) b = 0,32 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 34

35 variazione del livello di trigliceridi con il livello di colesterolo trigliceridi (y) a=4, colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 35

36 variazione del livello di trigliceridi con il livello di colesterolo trigliceridi=4,67 + 0,32* colesterolo 10 trigliceridi (y) colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 36

37 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 37 Formule abbreviate ( )( ) ( )( ) ( ) ( ) = x x y x y x y i n i a i i i i i ( ) ( )( ) ( ) ( ) = x x y x y x i n i n b i i i i 2 2 Queste formule sono più convenienti per il calcolo a mano Si basano sulle formule abbreviate per il calcolo della varianza

38 Requisiti dell analisi di regressione Y è una variabile casuale Omoscedasticità (omogeneità della varianza di y x) Distribuzione normale di y x Linearità della relazione tra x ed y Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 38

39 In questo esempio abbiamo dati campionati da una popolazione in cui le tre assunzioni sono soddisfatte Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 39

40 Variabilità della retta di regressione. y è una variabile casuale x di solito non è una variabile casuale. Il ricercatore può scegliere soggetti con i valori della x più adatti per lo studio. Pertanto siamo interessati a valutare la variabilità di y Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 40

41 Varianza intorno alla retta di regressione (stima campionaria) s ( ) y yˆ 2 i i = n 2 2 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 41

42 Residuo (o scarto) = valore y_osservato valore y_predetto Varianza = scarti ^ 2 / g.l. y valore y_osservato scarto valore y_predetto x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 42

43 s ( ) y yˆ 2 i i = n 2 2 y ˆ = a + i bx i Sostituisco: s 2 ( y a bx ) = i n 2 i 2 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 43

44 Relazione tra concentrazione plasmatica di colesterolo e trigliceridi Colesterolo Triglicerid att(y) y-att(y) (y-att(y))^2 (x) i (y) 1 3,45 6,24 5, , , ,5 6,18 5, , , ,95 5,2 5, ,4071 0, ,77 6,11 5, , , ,67 6,36 5, , , ,31 5,67 6, , , ,1 5,48 6, , , ,85 5,67 7, , , ,79 9,4 7, , , ,3 8,4 8, , , somma degli scarti^2 8, b= 0, s(b)^2= 1, a= 4, Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 44

45 Omoscedasticità: la varianza di y è costante per tutto l intervallo x. E un requisito per la corretta applicazione della regressione lineare (v.oltre) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 45

46 Errore standard di b ES( b) = s 2 ( x x) 2 i Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 46

47 Colesterolo (x) Trigliceridi ( ) (y) x xi 2 att(y) y-att(y) (y-att(y))^2 1 3,45 6,24 4, , , , ,5 6,18 4, , , , ,95 5,2 7, , ,4071 0, ,77 6,11 3, , , , ,67 6,36 3, , , , ,31 5,67 0, , , , ,1 5,48 0, , , , ,85 5,67 4, , , , ,79 9,4 9, , , , ,3 8,4 43, , , , ,54389 somma degli scarti^2 8, b= 0, s(b)^2= 1, a= 4, ES(b)= 0, Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 47

48 Errore standard di b ES( b) = s 2 ( x x) 2 i L errore standard di b si riduce, a parità di s, quando la variabilità di x è maggiore! Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 48

49 Intervallo di Confidenza e tests t per il coefficiente di regressione t = distanza tra il valore di b stimato (b) e quello previsto dall ipotesi nulla (ß, di solito H0: ß =0), in unità di errore standard di b (SE(b)) t = b β SE(b) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 49

50 Intervallo di Confidenza del coefficiente di regressione L intervallo di confidenza si calcola nel modo consueto (v. lezione precedente) t ha (n-2) gradi di libertà ed il valore è scelto in modo corrispondente all errore di I tipo, con test a 2 code CI = b ± t crit SE(b) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 50

51 Colesterolo (x) Trigliceridi ( ) (y) x xi 2 att(y) y-att(y) (y-att(y))^2 1 3,45 6,24 4, , , , ,5 6,18 4, , , , ,95 5,2 7, , ,4071 0, ,77 6,11 3, , , , ,67 6,36 3, , , , ,31 5,67 0, , , , ,1 5,48 0, , , , ,85 5,67 4, , , , ,79 9,4 9, , , , ,3 8,4 43, , , , ,54389 somma degli scarti^2 8, b= 0, s(b)^2= 1, a= 4, ES(b)= 0, IC(95%)_b= 0, , Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 51

52 variazione del livello di trigliceridi con il livello di colesterolo trigliceridi=4,67 + 0,32* colesterolo IC(95%)_b= 10 0,06-0,57 trigliceridi (y) colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 52

53 Relazione alla nascita tra circonferenza cranica e lunghezza circonferenza cranica 36,0 34,0 32,0 30,0 28,0 26,0 24,0 a=8,02 b= 0,51 ES(b)=0,05021 (IC 95%_b: 0,41-0,61) y= 8,02 + 0,51x 22,0 20,0 18, lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 53

54 Valore di y predetto dalla retta di regressione data y=a+bx, dopo aver ricavato a e b possiamo predire il valore atteso di y, corrispondente ad un dato valore di x. Il calcolo si effettua sostituendo il valore di x nella formula, noti a e b e risolvendo l equazione. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 54

55 Valore di y predetto dalla retta di regressione Es. il valore di circonferenza cranica predetto per un bambino di lunghezza 41 cm è ŷ =8,02+0,513 * x ŷ ŷ =8,02+0,513 * 41 =29,05 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 55

56 Intervallo di confidenza dei valori predetti PI ( ) 2 x x i ( ) x x 1 = yˆ ± t s 1+ + gl, α 2 2 n i Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 56

57 Relazione alla nascita tra circonferenza cranica e lunghezza Es. il valore di circonferenza cranica predetto per un bambino di lunghezza 41 cm è ŷ =29,05 ŷ IC( )= 25,47-32,63 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 57

58 Intervallo di confidenza dei valori predetti PI ( ) 2 x x i ( ) x x 1 = yˆ ± t s 1+ + gl, α 2 2 n i La predizione ha un errore maggiore allontanandosi dalla media di x La predizione ha un errore minore con un ampia variabilità di x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 58

59 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 59

60 atteso_y Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 60

61 Cautele nella predizione La predizione non è valida fuori dell intervallo osservato di x La predizione è più incerta agli estremi della distribuzione di x Per migliorare la precisione della predizione debbo aumentare la somma dei quadrati degli scarti (devianza) di x Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 61

62 Outliers ed osservazioni influenti Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 62

63 Relazione alla nascita tra circonferenza cranica e lunghezza Ho due outliers, indicati come: 1 e 2 36,0 34,0 2 32,0 30,0 circonferenza cranica 28,0 26,0 24,0 22,0 1 20,0 18, lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 63

64 Relazione alla nascita tra circonferenza cranica e lunghezza Se escludo outlier 1 36,0 34,0 32,0 30,0 circonferenza cranica 28,0 26,0 24,0 22,0 1 20,0 18, lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 64

65 Relazione alla nascita tra circonferenza cranica e lunghezza 36,0 34,0 Se escludo outliers 1 e ,0 circonferenza cranica 30,0 28,0 26,0 24,0 22,0 1 20,0 18, lunghezza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 65

66 Relazione alla nascita tra circonferenza cranica e lunghezza Tutti i dati: a=8,02 b= 0,51 Escluso outlier 1: a=4,91 b=0,60 Esclusi outlier 1 e 2: a=4,46 b=0,61 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 66

67 Valutazione del modello R 2 : proporzione della varianza che è spiegata dal modello di regressione = coefficiente di correlazione ^2 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 67

68 variazione del livello di trigliceridi con il livello di colesterolo trigliceridi=4,67 + 0,32* colesterolo 10 r =0,716 R 2 =0,51 trigliceridi (y) colesterolo (x) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 68

69 Verifica dei modelli Omoscedasticità (omogeneità della varianza) Distribuzione normale degli errori Linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 69

70 Verifica dei modelli Omoscedasticità (omogeneità della varianza) Distribizione normale degli errori Linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 70

71 Omoscedasticità (omogeneità della varianza) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 71

72 Verifica delle assunzioni del modello La verifica delle assunzioni del modello viene condotta esaminando la distribuzione dei residui Se la varianza è costante per tutta la distribuzione della x,anche i residui saranno distribuiti in modo uniforme. Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 72

73 Verifica delle assunzioni del modello Distribuzione uniforme dei residui Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 73

74 Distribuzione uniforme dei residui Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 74

75 Distribuzione non uniforme dei residui Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 75

76 Distribuzione non uniforme dei residui Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 76

77 Verifica dei modelli Omoscedasticità (omogeneità della varianza) Distribuzione normale degli errori Linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 77

78 Distribuzione normale dei residui (errori) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 78

79 Distribuzione non normale dei residui (errori) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 79

80 Distribuzione non normale dei residui (errori) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 80

81 Verifica dei modelli Omoscedasticità (omogeneità della varianza) Distribizione normale degli errori Linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 81

82 Perchè parliamo di regressione lineare? La variazione lineare è spesso una spiegazione adeguata Variazioni non lineari diventano tali dopo una trasformazione matematica di una delle variabili La variazione lineare è un punto di partenza Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 82

83 Non-linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 83

84 Non-linearità Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 84

85 Trasformazioni normalizzanti e linearizzanti Radice quadrata Logaritmo Inversa (meglio se ulteriormente moltiplicata per -1) Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 85

86 Trasformazioni normalizzanti e linearizzanti Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 86

87 Trasformazioni normalizzanti e linearizzanti Dati trasformati Inversa negativa Log Radice Dati originali Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 87

88 Esercizi regressione Pag.326 n 1 Pag.326 n 3 Pag.326 n 4 Pag.326 n 6 Pag.326 n 10 Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione e Regressione lineare semplice 88

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche Corso di Statistica Medica Correlazione Regressione Lineare Statistica Medica Correlazione e Regressione lineare

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

La regressione lineare semplice

La regressione lineare semplice La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Metodologie Quantitative

Metodologie Quantitative Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Lezione 7 Corso di Statistica. Francesco Lagona

Lezione 7 Corso di Statistica. Francesco Lagona Lezione 7 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 12 Outline 1 2 Rette di regressione e correlazione distribuzioni bivariate quantitative consideriamo

Dettagli

Indipendenza, Dipendenza e interdipendenza

Indipendenza, Dipendenza e interdipendenza Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero:

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Analisi della Regressione Lineare

Analisi della Regressione Lineare Analisi della Regressione Lineare Master in Tecnologie Bioinformatiche 29/09/06 Adriano Decarli 1 29/09/06 Adriano Decarli 2 29/09/06 Adriano Decarli 3 29/09/06 Adriano Decarli 4 29/09/06 Adriano Decarli

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

ESERCITAZIONI N. 3 corso di statistica

ESERCITAZIONI N. 3 corso di statistica ESERCITAZIONI N. 3corso di statistica p. 1/18 ESERCITAZIONI N. 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 3corso di statistica p. 2/18 Introduzione Media e Varianza Covarianza

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Campo di applicazione

Campo di applicazione Unverstà del Pemonte Orentale Corso d Laurea n Botecnologa Corso d Statstca Medca Correlazone Regressone Lneare Corso d laurea n botecnologa - Statstca Medca Correlazone e Regressone lneare semplce Campo

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

ESERCITAZIONI N. 3 corso di statistica

ESERCITAZIONI N. 3 corso di statistica ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza

Dettagli

Statistica13-23/11/2015

Statistica13-23/11/2015 Statistica13-23/11/2015 Voglio studiare due fattori dipendenti uno dall altro L esempio classico sono le rese di macellazione: il peso di un organo aumenta infatti all aumentare del peso dell animale (quale

Dettagli

Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta.

Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta. Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad Noviembre de

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

LA REGRESSIONE LINEARE SEMPLICE

LA REGRESSIONE LINEARE SEMPLICE LA REGRESSIONE LINEARE SEMPLICE Se due variabili X e Y sono tra loro correlate, e sono entrambe su scala a intervalli o rapporti equivalenti, la tecnica statistica della regressione lineare consente di

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Cognome e nome Tempo disponibile: 75 minuti

Cognome e nome Tempo disponibile: 75 minuti Corso di Laurea in Biotecnologia Statistica medica. A.A. 2010-2011 21 giugno 2011 Cognome e nome Tempo disponibile: 75 minuti 1. Immaginate di condurre uno studio sperimentale in cui si confronta l effetto

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),

Dettagli

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione. Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z, riferito

Dettagli

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Analisi bivariata. Il caso di caratteri quantitativi

Analisi bivariata. Il caso di caratteri quantitativi Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Esercizio 2: voto e ore dedicate allo studio

Esercizio 2: voto e ore dedicate allo studio La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna

Dettagli

Interpolazione e metodo dei minimi quadrati

Interpolazione e metodo dei minimi quadrati A. A. 017-018 Interpolazione e metodo dei minimi quadrati prof. ing. Antonio Comi Department of Enterprise Engineering Tor Vergata University of Rome Relazioni tra variabili Molto spesso si verifica che

Dettagli

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

STATISTICA. Regressione-2

STATISTICA. Regressione-2 STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

Esercizi su Regressione e Connessione

Esercizi su Regressione e Connessione Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75 00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei

Dettagli

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in

Dettagli

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Correlazione lineare e regressione

Correlazione lineare e regressione 7c e regressione Se i due caratteri sono entrambi quantitativi, X e Y, possiamo studiare la loro correlazione lineare. Prima di tutto cerchiamo di capire di cosa si tratta. Se elenchiamo le N osservazioni

Dettagli

lezione 5 AA Paolo Brunori

lezione 5 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - le stime OLS ci consentono di approssimare linearmente la relazione fra una variabile dipendente (Y) e una indipendente (X) - i parametri stimati su un

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

Cognome e nome. Distribuzione Gaussiana; Media = 122,4 mmhg; Deviazione standard= 14,28 mmhg

Cognome e nome. Distribuzione Gaussiana; Media = 122,4 mmhg; Deviazione standard= 14,28 mmhg Statistica medica. A.a. 2004-2005 15 Febbraio 2005 Tempo previsto 60 minuti Cognome e nome Avete consegnato l'esercitazione di Abilità Informatiche? _SI_ _NO_ LE SOLUZIONI SONO SCRITTE NELLE ULTIME PAGINE

Dettagli

Cognome e nome Tempo disponibile: 60 minuti

Cognome e nome Tempo disponibile: 60 minuti Corso di Laurea in Medicina e Chirurgia Statistica medica. A.A. 005-006 6 Marzo 006 Cognome e nome Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per

Dettagli

Tempo disponibile: 60 minuti

Tempo disponibile: 60 minuti Corso di Specialistica in Biotecnologie Statistica medica. A.A. 005-006 6 Marzo 006 Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per misurare l'effetto

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso

Dettagli

Settimana 3. G. M. Marchetti. Marzo 2017

Settimana 3. G. M. Marchetti. Marzo 2017 Settimana 3 G. M. Marchetti Marzo 2017 1 / 26 Prima parte Relazioni tra variabili e regressione lineare 2 / 26 Una legge fisica approssimata Il fisico scozzese Forbes 3 / 26 L esperimento di Forbes Sulla

Dettagli

STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA

STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA 6--008 Tempo disponibile 45 minuti. Usate solo questo foglio per le risposte. Nome Cognome Numero di matricola Corso e sede Esercizio. A

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51 Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli