6. Modelli statistici: analisi della regressione lineare

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "6. Modelli statistici: analisi della regressione lineare"

Transcript

1 BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.1

2 MODELLO STATISTICO Rappresentazione seplificata, analogica e necessaria della realtà Semplificazione della realtà: il modello di un bacino idrologico, di un aereoplano, del flusso finanziario di un Paese ottenuti riproducendo gli aspetti essenziali e eliminando quelli ritenuti superficiali. Analogia della realtà: il modello è una riproduzione della realtà Rappresentazione necessaria della realtà: anche se è semplificato il modello è necessario per capire la realtà tramite lo studio di relazioni semplici e di maggiore intellegibilità MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.2

3 La specificazione di un modello consiste nell esplicitare un legame tra i fenomeni di interesse: Y = f(x 1, X 2,,X p ) Dove Y è la variabile da spiegare, mentre X 1, X 2,,X p sono le variabili scelte per spiegare Y tramite la funzione f(.) Inoltre non è quasi mai plausibile ipotizzare un legame deterministico quindi dobbiamo aggiungere un errore: Y = f(x 1, X 2,,X p ) + ε dove ε è una variabile casuale e riassume la nostra ignoranza circa la vera relazione tra Y e X. Per questo motivo la chiameremo variabile errore. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.3

4 In alcuni contesti la specificazione della relazione funzionale risulta immediata dalla natura del problema: 1) Se Y è il peso ed X è l altezza di una persona adulta la prima relazione da specificare è quella proporzionale (maggiore il peso, maggiore l altezza e viceversa) Y=βX+ ε 2) Se Y è il peso di una mattonella rettangolare per la quale X 1 e X 2 sono rispettivamente la lunghezza e la larghezza, allora una relazione funzionale può essere specificata mediante Y=βX 1 X 2 + ε Entrambe le specificazioni evidenziano un parametro β che deve essere determinato per poter utilizzare il modello specificato MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.4

5 Modelli statistici Semplici (una X e una Y) Lineari Multipli (più di una X ma una Y) Non lineari Multivariati (più di una X e più di una Y) MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.5

6 Terminologia Y = f(x 1, X 2,,X p ) Y: variabile dipendente X 1,,X p : variabili esplicative ε: variabile casuale errore NOTA: il legame statistico implicato dal modello non è simmetrico. Sono le variabili esplicative a determinare la variabile dipendente e NON viceversa. X: precipitazione giornaliera di un bacino idrografico Y: livello del fiume che si origina dal bacino Relazione: X Y ma NON Y X X: dose di concime somministrato in un campo di grano Y: resa di grano in quel terreno Relazione: X Y ma NON Y X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.6

7 Modello di regressione lineare Il termine REGRESSIONE deriva dall applicazione svolta dal biologo Galton che nel 1886 esaminò altezze dei figli (Y) in funzione delle altezze dei genitori (X) in Inghilterra e notò una relazione funzionale tra le due variabili: più alti i genitori, più alti i figli e viceversa. Tuttavia ai genitori che si collocavano agli estremi (molto bassi o molto alti) non corrispondevano figli altrettanto estremi, ovvero Galton osservò che l altezza dei figli si spostava verso la media e quindi concluse che questo costituiva una regression towards mediocrity e la relazione funzionale fu chiamata modello di regressione. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.7

8 Oggi il termine regressione è divenuto significato di relazione funzionale tra variabili ottenuta con metodi statistici e la frase regredire Y su (X 1,,X p ) significa ricercare una relazione statistica del tipo: Y = f(x 1, X 2,,X p ) + ε Il modello di regressione semplice è specificato dalla relazione: y i = f(x i ;β) + ε i La funzione f(x i ;β) può essere di primo grado, ad esempio: y i = b 0 + b 1 x i + ε i Oppure di grado superiore al primo, ad esempio di secondo grado: y i = b 0 + b 1 x i + b 2 x i2 + ε i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.8

9 Y X = velocità di un autoveicolo Y = spazio di frenata X Modello di regressione lineare semplice y i = β 0 + β 1 x i + ε i Identifica una retta, nota come la retta di regressione: β 0 : intercetta, il valore di Y i quando x i =0 β 1 : pendenza, di quanto cambia Y i quando x i incrementa di un unità ε i : l errore che si commette nella spiegazione dellavariabile y i tramite una funzione lineare di x i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.9

10 Che relazione c è tra X e Y? Y Covariano positivamente Y X Covariano negativamente Y X Non covariano X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.10

11 La covarianza misura l attitudine a covariare di due caratteri X Y X-X Y-Y (X-X)(Y-Y) x =15 y =18 Cov(X,Y) = n Σ i=1 (x x )(y y ) n-1 Cov(X,Y) = = 9.5 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.11

12 Cov(X,Y) = n Σ i=1 (x x )(y y ) n-1 Cov(X,Y)> 0 Cov(X,Y)= 0 Cov(X,Y)< 0 Y Y Y X X X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.12

13 X Y Y X Cov(X,Y)=9.5 > 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.13

14 E utile costruire una misura STANDARDIZZATA che esprima quanto I due caratteri covariano COVARIANZA ρ = COEFFICIENTE DI CORRELAZIONE Cov(X,Y) sd(x). sd(y) Deviazione standard Deviazione standard Cov(X,Y)= - sd(x). sd(y) PERFETTA Correlazione NEGATIVA Cov(X,Y)=0 NON c è correlazione Cov(X,Y)= sd(x). sd(y) PERFETTA Correlazione POSITIVA MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.14

15 Modello di regressione lineare semplice y i = β 0 + β 1 x i + ε i Y Y 1 β 1 >0 β 1 <0 1 x x+1 X x x+1 X y i = β 0 + β 1 x i + ε i y i = β 0 - β 1 x i + ε i Y β 1 =0 1 x x+1 X y i = β 0 + ε i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.15

16 Y X Per un insieme di punti possono passare infinite rette! Come scegliere la retta migliore? Metodo dei Minimi Quadrati MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.16

17 Y = βˆ ˆ ŷ 0 + β1 x y i ˆε i ŷi X L idea dei minimi quadrati è quella di scegliere la retta che minimizza la somma degli scarti dalla retta di regressione Scarti: ε i = y i -ŷ i RSS=Σ i ε i2 = Σ i (y i -ŷ i ) 2 = Σ i (y i - β 0 β 1 x i ) 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.17

18 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE ANALISI DELLA REGRESSIONE LINEARE Si può dimostrare che i parametri che minimizzano la somma degli scarti dalla media al quadrato sono i seguenti: dove 1 ) )( ( Cov(X,Y) ; ) ( 1 1 ) ( ; 1 ; 1 n 1 i 1 2 = = = = = = n y y x x x x n X Var y n y x n x i i n i i i i x ˆ y ˆ Var(X) Cov(X, Y) x) (x y) x)(y (x ˆ 1 0 n 1 i 2 i n 1 i i i 1 β = β = = β = =

19 Coefficiente di correlazione? β 1 ρ = Cov(X,Y) sd(x). sd(y) β 1 = Cov(X,Y) Var(X) 1) Ricavo ρ da β 1 sd(x) ρ = β 1 sd(y) 2) Ricavo β da ρ 1 sd(y) β = ρ 1 sd(x) MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.19

20 Dalla popolazione di camelie estraiamo un campione di 15 foglie della varietà cordiforme sui quali misuriamo la variabile X (peso vivo) e Y (peso secco). Otteniamo i seguenti valori: X Trovare la retta di regressione dei minimi quadrati che spiega Y in funzione di X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.20 Y

21 Y X Dal campione si calcolano le seguenti quantità x = y = s 2 x = s2 y = n=15 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.21

22 Per ottenere i parametri della retta di regressione si devono usare le formule seguenti: β 1 = Cov(X,Y) Var(X) β 0 = y β 1 x Cov(X,Y) = ( ). ( ) + + ( ). ( ) 15-1 Cov(X,Y) = Var(X) = β 1 = / = β 0 = = MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.22

23 La retta di regressione che minimizza i quadrati degli scarti dalla media è la seguente: y = β 0 + β x 1 y = x Y X Per disegnarla mi servono due punti 1) Quando y = 0 0 = x x = / = ) Quando x = 10 y = y = = MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.23

24 6 5 4 Y X Punto 1 : x= , y=0 Punto 2 : x=10, y= MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.24

25 Come interpretare i due coefficienti del modello di regressione? y = β 0 + β x 1 Intercetta: valore che assume y quando x=0 punto nel quale la retta incorcia l asse delle y Pendenza: indica di quanto varia y al variare di un unità di x Il segno indica il verso dell inclinazione MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.25

26 Assunzioni del modello di regressione Nel ipotizzare un modello di regressione stiamo assumendo che: 1. I dati sperimentali siano un campione casuale estratto da una popolazione di unità x,y per i quali vige la relazione y i = β 0 + β 1 x i + ε i tenendo conto di eventuali cause accidentali MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.26

27 Assunzioni del modello di regressione 2. Fissato un valore di X abbiamo una popolazione di valori di Y distribuiti normalmente con media situata sulla retta di regressione Y β 0 +β 1 x 3 β 0 +β 1 x 2 β 0 +β 1 x 1 Normale per Y quando X=x 1 Normale per Y quando X=x 2 Normale per Y quando X=x 3 x 1 x 2 x 3 Y X=x 1 ~ N(β 0 +β 1 x 1,σ 2 ) Y X=x 2 ~ N(β 0 +β 1 x 2,σ 2 ) Y X=x 3 ~ N(β 0 +β 1 x 3,σ 2 ) X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.27

28 Assunzioni del modello di regressione Y X=x i ~ N(β 0 +β 1 x i, σ 2 ) 3. La varianza rimane la stessa indipendentemente da X Omoschedasticità Var(y i ) = σ 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.28

29 Assunzioni del modello di regressione y i = β 0 + β 1 x i + ε i Scarti (Residui): ε i = y i (β 0 +β 1 x i ) ε i ~ N(0,σ 2 ) Stessa variabilità di Y 0 0 ε i Assunzione rispettata ε i Assunzione violata MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.29

30 Siamo interessati a valutare l esistenza di una relazione tra peso vivo e peso secco nella popolazione delle camelie tramite un modello di regressione. UNIVERSO PARAMETRI CAMPIONE STIMATORI Dalla popolazione di camelie estraiamo un campione di 15 foglie della varietà cordiforme sui quali misuriamo il peso vivo e il peso secco. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.30

31 La retta di regressione dei minimi quadrati è la seguente: y = x Come valutiamo se la relazione tra le due variabili è significativa o no? CAMPIONE STIMATORI Facciamo INFERENZA sui parametri della retta di regressione. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.31

32 POPOLAZIONE BERSAGLIO Tutti i possibili campioni Β 0 ~ T(β 0,σ2 β 0 ) β 0 Media campionaria MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.32

33 POPOLAZIONE BERSAGLIO Tutti i possibili campioni Β 1 ~ T(β 1,σ2 β 1 ) β 1 Media campionaria MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.33

34 Usiamo β 0 e β 1 per stimare i veri valori dei parametri β 0 e β 1. β 0 T(β 0,σ2 β 0 ) Ipotesi nulla: H 0 : β 0 = 0 La retta di regressione passa per il punto di coordinate (0,0) Test del T di Student Dal campione: β 0 = y β 1 x Stima campionaria se(β 0 ) = s 1 n + (x) 2 Dev(x) Deviazione standard campionaria MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.34

35 Usiamo β 0 e β 1 per stimare i veri valori dei parametri β 0 e β 1. β 1 T(β 1,σ2 β 1 ) Ipotesi nulla: H 1 : β 1 = 0 La retta di regressione ha pendeza 0 Test del T di Student Dal campione: Cov(x,y) β = 1 Var(x) Stima campionaria se(β 1 ) = s Dev(x) Deviazione standard campionaria MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.35

36 L errore standard di entrambi i parametri è funzione di s s = (n-1) s 2 y (1 ρ2 xy ) n-2 I valori empirici per il test T di student sono β 1 β 0 t g = β 1-0 es(β 1 ) = β 1-0 s Dev(x) t g = β 0-0 es(β 0 ) s = 1 n β (x) 2 Dev(x) n-2 n-2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.36

37 P-Value: probabilità di ottenere un risultato campionario altrettanto o più estremo di quello osservato, se H 0 è vera P-value = Pr ( B 0 >β 0 sotto H 0 ) Più piccolo è il valore del p-value, 1) più estremo è il valore osservato 2) Più bassa l evidenza che i dati siano coerenti con la distribuzione sotto l ipotesi nulla P-value=0.25 P-value=0.03 β 0 = 0 β 0 β 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.37

38 3. 6. CONFRONTO ANALISI DELLA TRA REGRESSIONE MEDIE DI DUE LINEARE CAMPIONI INDIPENDENTI PROBLEMA: l ipotesi è bidirezionale H 0 : β 0 = 0 vs H 1: β 0 = 0 Unidirezionale P-value = Pr ( B 0 >β 0 sotto H 0 ) Bidirezionale 2*P-value P-value=0.06 P-value=0.03 P-value=0.03 -β 0 β 0 = 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.38 β 0

39 P-Value: probabilità di ottenere un risultato campionario altrettanto o più estremo di quello osservato, se H 0 è vera P-value = Pr ( B 1 >β 1 sotto H 0 ) Più piccolo è il valore del p-value, 1) più estremo è il valore osservato 2) Più bassa l evidenza che i dati siano coerenti con la distribuzione sotto l ipotesi nulla P-value=0.25 P-value=0.03 β 1 = 0 β 1 β 1 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.39

40 3. 6. CONFRONTO ANALISI DELLA TRA REGRESSIONE MEDIE DI DUE LINEARE CAMPIONI INDIPENDENTI PROBLEMA: l ipotesi è bidirezionale H 0 : β 1 = 0 vs H 1: β 1 = 0 Unidirezionale P-value = Pr ( B 1 >β 1 sotto H 0 ) Bidirezionale 2*P-value P-value=0.06 P-value=0.03 P-value=0.03 -β 1 β 1 = 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.40 β 1

41 Siamo interessati a valutare l esistenza di una relazione tra peso vivo e peso secco nella popolazione delle camelie tramite un modello di regressione. X Y Campione n=15 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.41

42 Dal campione otteniamo le seguenti informazioni Stimatore Misura di variabilità yi i y = n = βˆ βˆ xi i x = n = s y s Deviazione standard yi y) i = n 1 = Varianza 2 x ( 2 xi x) i = n 1 = Errore standard ( 2 2 ˆ 2 = y β1x 1 ( x) esβ = s + 0 n Dev = x = Cov( x, y) Errore standard = 2 s 2 s esβ = x 1 Dev x = = s = ( n 1) s n β) β) 1 = βˆ 0 2 es = 0.14 ˆ 1 = β1 2 es 1 = 6.69 = MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.42 t g t g 2 y (1 ρ xy )

43 P-value(β 0 ) = Pr ( B 0 >β 0 sotto H 0 ) 2*P-value(β 0 ) >2*0.4 che trovo sulle tavole Non ho sufficiente evidenza per rifiutare H 0 Concludo che β 0 non è significativamente diverso da 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.43

44 P-value(β 1 ) = Pr ( B 1 >β 1 sotto H 0 ) 2*P-value(β 1 ) < 2* Rifiuto H 0 Concludo che β 1 è significativamente diverso da 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.44

45 6 5 4 Y X Punto 1 : x= , y=0 Punto 2 : x=10, y= MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.45

46 Se concludo che β 1 =0 Il modello di regressione lineare non è adatto ad interpretare la relazione tra X e Y. C è un modo per valutare analiticamente la bontà di adattamento del modello? H 0 : il modello non si adatta ai dati MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.46

47 y i -y y i y x i Devianza totale: Dev TOT = Σ i (y i y) 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.47

48 X Y Campione n=15 y = Devianza totale = = ( ) 2 + ( ) ( ) 2 + ( ) 2 = = Σ (y i y ) 2 i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.48

49 Quanta parte della variabilità totale è residua? y i -y i y i y i = β 0 + β 1 x i y x i Devianza RESIDUA: Dev R = Σ i (y i y i ) 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.49

50 X Y Y y i = β 0 + β 1 x i = = Devianza residua = = ( ) 2 + ( ) ( ) 2 + ( ) 2 = = Σ (y i y i ) 2 i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.50

51 Quanta parte della variabilità totale è spiegata dal modello di regressione? y i - y y i y i = β 0 + β 1 x i y x i Devianza SPIEGATA dal modello : Dev S = Σ i (y i y) 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.51

52 X Y Y y i = β 0 + β 1 x i y = Devianza spiegata = = ( ) 2 + ( ) ( ) 2 + ( ) 2 = = Σ (y i y ) 2 i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.52

53 Fonti di variabilità devianza Gradi di libertà varianza Spiegata dal modello k-1 = Residua = n-k = Totale n-1=14 F 1, 13 = Varianza spiegata Varianza residua = = MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.53

54 Distribuzione F 1,13 Area di accettazione Area di rifiuto Valore tabulato Valore empirico rifiutiamo H 0 ovvero la relazione tra le due variabili è ben spiegata da un modello di regressione lineare p < 0.05 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.54

55 Esercizio di riepilogo Si vuole valutare la relazione tra peso alla nascita e settimane di gestazione in UK. A tal fine si estrae un campione di 26 bambini nati a University College Hospital di Londra, della stessa razza e dello stesso genere. I dati sono I seguenti: X: Y: Stimare i parametri della retta di regressione dei minimi quadrati. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.55

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

4. Confronto tra medie di tre o più campioni indipendenti

4. Confronto tra medie di tre o più campioni indipendenti BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

MINIMI QUADRATI. REGRESSIONE LINEARE

MINIMI QUADRATI. REGRESSIONE LINEARE MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Lezione n. 2 (a cura di Chiara Rossi)

Lezione n. 2 (a cura di Chiara Rossi) Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,

Dettagli

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE 1 Associazione tra variabili quantitative ASSOCIAZIONE FRA CARATTERI QUANTITATIVI: COVARIANZA E CORRELAZIONE 2 Associazione tra variabili quantitative Un esempio Prezzo medio per Nr. Albergo cliente (Euro)

Dettagli

La logica statistica della verifica (test) delle ipotesi

La logica statistica della verifica (test) delle ipotesi La logica statistica della verifica (test) delle ipotesi Come posso confrontare diverse ipotesi? Nella statistica inferenziale classica vengono sempre confrontate due ipotesi: l ipotesi nulla e l ipotesi

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità

Dettagli

1. Richiami di Statistica. Stefano Di Colli

1. Richiami di Statistica. Stefano Di Colli 1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Esercizio 1 Si consideri il seguente modello ad effetti fissi con variabili binarie: + 1 2 a) supponete che N=3. Si mostri che i regressori

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Elaborazione dei dati su PC Regressione Multipla

Elaborazione dei dati su PC Regressione Multipla 21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione

Dettagli

Soluzioni Esercizi elementari

Soluzioni Esercizi elementari Soluzioni sercizi elementari Capitolo. carattere: itolo di Studio, carattere qualitativo ordinato modalità: Diploma, Licenza media, Laurea, Licenza elementare unità statistiche: Individui. carattere: Fatturato,

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Regressione Lineare con un Singolo Regressore

Regressione Lineare con un Singolo Regressore Regressione Lineare con un Singolo Regressore Quali sono gli effetti dell introduzione di pene severe per gli automobilisti ubriachi? Quali sono gli effetti della riduzione della dimensione delle classi

Dettagli

Esercitazione n.2 Inferenza su medie

Esercitazione n.2 Inferenza su medie Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione

Dettagli

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette

Dettagli

Problema pratico: Test statistico = regola di decisione

Problema pratico: Test statistico = regola di decisione La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario

Dettagli

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

Verità ed esperienza: come la natura genera le osservazioni sperimentali

Verità ed esperienza: come la natura genera le osservazioni sperimentali Verità ed esperienza: come la natura genera le osservazioni sperimentali Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 10 gennaio 2012 Indice 1 Presupposti

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p

Dettagli

La categoria «ES» presenta (di solito) gli stessi comandi

La categoria «ES» presenta (di solito) gli stessi comandi Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:

Dettagli

Analisi delle relazioni tra due caratteri

Analisi delle relazioni tra due caratteri Analisi delle relazioni tra due caratteri Le misure di connessione misurano il grado di associazione tra due caratteri qualsiasi sotto il profilo statistico (e non causale in quanto non è compito della

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che VARIABILI ALATORI MULTIPL TORMI ASSOCIATI Fonti: Cicchitelli Dall Aglio Mood-Grabill. Moduli 6 9 0 del programma. VARIABILI ALATORI DOPPI Dopo aver trattato delle distribuzioni di probabilità di una variabile

Dettagli

Modello di regressione lineare

Modello di regressione lineare Modello di regressione lineare a cura di Giordano dott. Enrico enrico.giordano@meliorbanca.com Nel presente lavoro viene descritto in modo dettagliato (attraverso anche un impatto visivo), l analisi di

Dettagli

Elementi di Psicometria

Elementi di Psicometria Elementi di Psicometria 12-Correlazione vers. 1.1 (27 novembre 2012) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2011-2012 G. Rossi (Dip. Psicologia)

Dettagli

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per continue. Alessandro Valbonesi. SARRF di Scienze ambientali

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per continue. Alessandro Valbonesi. SARRF di Scienze ambientali LEZIONI DI STATISTCA APPLICATA Parte 2 Statistica inferenziale Variabili continue per continue Alessandro Valbonesi SARRF di Scienze ambientali Anno accademico 2010-11 CAPITOLO 7 - RELAZIONI TRA DUE O

Dettagli

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI Docente: Prof. Massimo Mariani 1 SOMMARIO Il rendimento di un attività finanziaria: i parametri rilevanti Rendimento totale, periodale e medio Il market

Dettagli

ANALISI DI CORRELAZIONE

ANALISI DI CORRELAZIONE ANALISI DI CORRELAZIONE Esempio: Dati raccolti da n = 129 studenti di Pavia (A.A. 21/2) Altezza (cm) Peso (Kg) Voto Algebra e Geometria Voto Fisica I Valutare la correlazione delle seguenti coppie: Peso

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o

Dettagli

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO Pasquale Iandolo Laboratorio analisi ASL 4 Chiavarese, Lavagna (GE) 42 Congresso Nazionale SIBioC Roma

Dettagli

ELEMENTI DI STATISTICA PER IDROLOGIA

ELEMENTI DI STATISTICA PER IDROLOGIA Carlo Gregoretti Corso di Idraulica ed Idrologia Elementi di statist. per Idrolog.-7//4 ELEMETI DI STATISTICA PER IDROLOGIA Introduzione Una variabile si dice casuale quando assume valori che dipendono

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

La Regressione Lineare

La Regressione Lineare La Regressione Lineare. Cos è l Analisi della Regressione Multipla? L analisi della regressione multipla è una tecnica statistica che può essere impiegata per analizzare la relazione tra una variabile

Dettagli

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia STATISTICA GIUSEPPE DE NICOLAO Dipartimento di Informatica e Sistemistica Università di Pavia SOMMARIO V.C. vettoriali Media e varianza campionarie Proprietà degli stimatori Intervalli di confidenza Statistica

Dettagli

Scheda n.5: variabili aleatorie e valori medi

Scheda n.5: variabili aleatorie e valori medi Scheda n.5: variabili aleatorie e valori medi October 26, 2008 1 Variabili aleatorie Per la definizione rigorosa di variabile aleatoria rimandiamo ai testi di probabilità; essa è non del tutto immediata

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Analisi statistica di dati biomedici Analysis of biologicalsignals II Parte Verifica delle ipotesi (a) Agostino Accardo (accardo@units.it) Master in Ingegneria Clinica LM in Neuroscienze 2013-2014 e segg.

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni

Dettagli

La distribuzione Gaussiana

La distribuzione Gaussiana Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

Appunti sulla regressione lineare semplice e multipla

Appunti sulla regressione lineare semplice e multipla Appunti sulla regressione lineare semplice e multipla Germano Rossi 9 aprile 004 vers. 0.3. Indice Indice 1 1 Appunti sulla regressione lineare semplice e multipla 1.1 Introduzione.......................................

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

STATISTICA (I MODULO INFERENZA STATISTICA) Esercitazione I 27/4/2007

STATISTICA (I MODULO INFERENZA STATISTICA) Esercitazione I 27/4/2007 Esercitazione I 7/4/007 In una scatola contenente 0 pezzi di un articolo elettronico risultano essere difettosi. Si estraggono a caso due pezzi, uno alla volta senza reimmissione. Quale è la probabilità

Dettagli

è decidere sulla verità o falsità

è decidere sulla verità o falsità I test di ipotesi I test di ipotesi Il test delle ipotesi consente di verificare se, e in quale misura, una determinata ipotesi (di carattere sociale, biologico, medico, economico, ecc.) è supportata dall

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. I valori stimati sono variabili aleatorie. Teorema del limite centrale

Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. I valori stimati sono variabili aleatorie. Teorema del limite centrale I risultati di un esperimento sono variabili aleatorie. Un esperimento non consente di esaminare ogni elemento di una popolazione o di effettuare tutte le misure possibili. campione , sx Stime Popolazion

Dettagli

Piacenza, 10 marzo 2014 La preparazione della tesi di Laurea Magistrale

Piacenza, 10 marzo 2014 La preparazione della tesi di Laurea Magistrale Piacenza, 0 marzo 204 La preparazione della tesi di Laurea Magistrale ma questa statistica a che cosa serve? non vedo l ora di cominciare a lavorare per la tesi. e dimenticarmi la statistica!! il mio relatore

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito Soluzioni della simulazione del 17/05/2011 Gianmarco Altoè Dipartimento di Psicologia Università di Cagliari, Anno Accademico 2010-2011 Leggere BENE le avvertenze prima

Dettagli

Esperimenti in vaso: disegni a randomizzazione completa

Esperimenti in vaso: disegni a randomizzazione completa Esperimenti in vaso: disegni a randomizzazione completa Andrea Onofri 10 marzo 2015 Indice 1 Disegno sperimentale 2 2 Analisi dei dati 3 2.1 Analisi della varianza (ANOVA).................. 4 2.2 Errore

Dettagli

Prefazione all edizione originale. Prefazione all edizione italiana

Prefazione all edizione originale. Prefazione all edizione italiana Indice Prefazione all edizione originale Prefazione all edizione italiana xiii xv 1 Il miglioramento della qualità nel moderno ambiente produttivo 1 1.1 Significato dei termini qualità e miglioramento

Dettagli

CBM 2012/2013 ANALISI DEI LEGAMI FRA VARIABILI STATISTICHE QUANTITATIVE

CBM 2012/2013 ANALISI DEI LEGAMI FRA VARIABILI STATISTICHE QUANTITATIVE ANALISI DEI LEGAMI FRA VARIABILI STATISTICHE QUANTITATIVE Quando si prendono in considerazione congiuntamente due o più variabili quantitative è possibile esaminare anche il tipo e l'intensità delle relazioni

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Indice Prefazione xiii 1 Probabilità

Indice Prefazione xiii 1 Probabilità Prefazione xiii 1 Probabilità 1 1.1 Origini del Calcolo delle Probabilità e della Statistica 1 1.2 Eventi, stato di conoscenza, probabilità 4 1.3 Calcolo Combinatorio 11 1.3.1 Disposizioni di n elementi

Dettagli

INDICE PREFAZIONE VII

INDICE PREFAZIONE VII INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione

Dettagli

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate Introduzione alle relazioni multivariate Associazione e causalità Associazione e causalità Nell analisi dei dati notevole importanza è rivestita dalle relazioni causali tra variabili Date due variabili

Dettagli

Elementi di Statistica descrittiva Parte I

Elementi di Statistica descrittiva Parte I Elementi di Statistica descrittiva Parte I Che cos è la statistica Metodo di studio di caratteri variabili, rilevabili su collettività. La statistica si occupa di caratteri (ossia aspetti osservabili)

Dettagli

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello

Dettagli

Statistica Medica. Verranno presi in esame:

Statistica Medica. Verranno presi in esame: Statistica Medica Premessa: il seguente testo cerca di riassumere e rendere in forma comprensibile ai non esperti in matematica e statistica le nozioni e le procedure necessarie a svolgere gli esercizi

Dettagli

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Laurea in Ingegneria Meccatronica A.A. 2010 2011 n-dimensionali Riepilogo. Gli esiti di un esperimento aleatorio

Dettagli

Anno Accademico 2014-2015. Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA

Anno Accademico 2014-2015. Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA Statistica, CLEA p. 1/68 Anno Accademico 2014-2015 Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA Monia Lupparelli monia.lupparelli@unibo.it http://www2.stat.unibo.it/lupparelli

Dettagli

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che

Dettagli

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano

Dettagli

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze

Dettagli

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corsi di Specialità Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea in biotecnologie

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Nome N. Matricola Ancona, 14 luglio 2015 1. Tre macchine producono gli stessi pezzi

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova

Dettagli

Il coefficiente di correlazione di Spearman per ranghi

Il coefficiente di correlazione di Spearman per ranghi Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 3 A. Sia una variabile casuale che si distribuisce secondo

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

obbligatorio - n. iscrizione sulla lista se non ve lo ricordate siete fritti; o no?

obbligatorio - n. iscrizione sulla lista se non ve lo ricordate siete fritti; o no? 08.07.2014 - appello ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista se non ve lo ricordate siete fritti; o no? il presente elaborato si compone di x (ics) pagine Cognome Nome matr.n.

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli