6. Modelli statistici: analisi della regressione lineare

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "6. Modelli statistici: analisi della regressione lineare"

Transcript

1 BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.1

2 MODELLO STATISTICO Rappresentazione seplificata, analogica e necessaria della realtà Semplificazione della realtà: il modello di un bacino idrologico, di un aereoplano, del flusso finanziario di un Paese ottenuti riproducendo gli aspetti essenziali e eliminando quelli ritenuti superficiali. Analogia della realtà: il modello è una riproduzione della realtà Rappresentazione necessaria della realtà: anche se è semplificato il modello è necessario per capire la realtà tramite lo studio di relazioni semplici e di maggiore intellegibilità MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.2

3 La specificazione di un modello consiste nell esplicitare un legame tra i fenomeni di interesse: Y = f(x 1, X 2,,X p ) Dove Y è la variabile da spiegare, mentre X 1, X 2,,X p sono le variabili scelte per spiegare Y tramite la funzione f(.) Inoltre non è quasi mai plausibile ipotizzare un legame deterministico quindi dobbiamo aggiungere un errore: Y = f(x 1, X 2,,X p ) + ε dove ε è una variabile casuale e riassume la nostra ignoranza circa la vera relazione tra Y e X. Per questo motivo la chiameremo variabile errore. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.3

4 In alcuni contesti la specificazione della relazione funzionale risulta immediata dalla natura del problema: 1) Se Y è il peso ed X è l altezza di una persona adulta la prima relazione da specificare è quella proporzionale (maggiore il peso, maggiore l altezza e viceversa) Y=βX+ ε 2) Se Y è il peso di una mattonella rettangolare per la quale X 1 e X 2 sono rispettivamente la lunghezza e la larghezza, allora una relazione funzionale può essere specificata mediante Y=βX 1 X 2 + ε Entrambe le specificazioni evidenziano un parametro β che deve essere determinato per poter utilizzare il modello specificato MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.4

5 Modelli statistici Semplici (una X e una Y) Lineari Multipli (più di una X ma una Y) Non lineari Multivariati (più di una X e più di una Y) MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.5

6 Terminologia Y = f(x 1, X 2,,X p ) Y: variabile dipendente X 1,,X p : variabili esplicative ε: variabile casuale errore NOTA: il legame statistico implicato dal modello non è simmetrico. Sono le variabili esplicative a determinare la variabile dipendente e NON viceversa. X: precipitazione giornaliera di un bacino idrografico Y: livello del fiume che si origina dal bacino Relazione: X Y ma NON Y X X: dose di concime somministrato in un campo di grano Y: resa di grano in quel terreno Relazione: X Y ma NON Y X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.6

7 Modello di regressione lineare Il termine REGRESSIONE deriva dall applicazione svolta dal biologo Galton che nel 1886 esaminò altezze dei figli (Y) in funzione delle altezze dei genitori (X) in Inghilterra e notò una relazione funzionale tra le due variabili: più alti i genitori, più alti i figli e viceversa. Tuttavia ai genitori che si collocavano agli estremi (molto bassi o molto alti) non corrispondevano figli altrettanto estremi, ovvero Galton osservò che l altezza dei figli si spostava verso la media e quindi concluse che questo costituiva una regression towards mediocrity e la relazione funzionale fu chiamata modello di regressione. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.7

8 Oggi il termine regressione è divenuto significato di relazione funzionale tra variabili ottenuta con metodi statistici e la frase regredire Y su (X 1,,X p ) significa ricercare una relazione statistica del tipo: Y = f(x 1, X 2,,X p ) + ε Il modello di regressione semplice è specificato dalla relazione: y i = f(x i ;β) + ε i La funzione f(x i ;β) può essere di primo grado, ad esempio: y i = b 0 + b 1 x i + ε i Oppure di grado superiore al primo, ad esempio di secondo grado: y i = b 0 + b 1 x i + b 2 x i2 + ε i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.8

9 Y X = velocità di un autoveicolo Y = spazio di frenata X Modello di regressione lineare semplice y i = β 0 + β 1 x i + ε i Identifica una retta, nota come la retta di regressione: β 0 : intercetta, il valore di Y i quando x i =0 β 1 : pendenza, di quanto cambia Y i quando x i incrementa di un unità ε i : l errore che si commette nella spiegazione dellavariabile y i tramite una funzione lineare di x i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.9

10 Che relazione c è tra X e Y? Y Covariano positivamente Y X Covariano negativamente Y X Non covariano X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.10

11 La covarianza misura l attitudine a covariare di due caratteri X Y X-X Y-Y (X-X)(Y-Y) x =15 y =18 Cov(X,Y) = n Σ i=1 (x x )(y y ) n-1 Cov(X,Y) = = 9.5 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.11

12 Cov(X,Y) = n Σ i=1 (x x )(y y ) n-1 Cov(X,Y)> 0 Cov(X,Y)= 0 Cov(X,Y)< 0 Y Y Y X X X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.12

13 X Y Y X Cov(X,Y)=9.5 > 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.13

14 E utile costruire una misura STANDARDIZZATA che esprima quanto I due caratteri covariano COVARIANZA ρ = COEFFICIENTE DI CORRELAZIONE Cov(X,Y) sd(x). sd(y) Deviazione standard Deviazione standard Cov(X,Y)= - sd(x). sd(y) PERFETTA Correlazione NEGATIVA Cov(X,Y)=0 NON c è correlazione Cov(X,Y)= sd(x). sd(y) PERFETTA Correlazione POSITIVA MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.14

15 Modello di regressione lineare semplice y i = β 0 + β 1 x i + ε i Y Y 1 β 1 >0 β 1 <0 1 x x+1 X x x+1 X y i = β 0 + β 1 x i + ε i y i = β 0 - β 1 x i + ε i Y β 1 =0 1 x x+1 X y i = β 0 + ε i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.15

16 Y X Per un insieme di punti possono passare infinite rette! Come scegliere la retta migliore? Metodo dei Minimi Quadrati MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.16

17 Y = βˆ ˆ ŷ 0 + β1 x y i ˆε i ŷi X L idea dei minimi quadrati è quella di scegliere la retta che minimizza la somma degli scarti dalla retta di regressione Scarti: ε i = y i -ŷ i RSS=Σ i ε i2 = Σ i (y i -ŷ i ) 2 = Σ i (y i - β 0 β 1 x i ) 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.17

18 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE ANALISI DELLA REGRESSIONE LINEARE Si può dimostrare che i parametri che minimizzano la somma degli scarti dalla media al quadrato sono i seguenti: dove 1 ) )( ( Cov(X,Y) ; ) ( 1 1 ) ( ; 1 ; 1 n 1 i 1 2 = = = = = = n y y x x x x n X Var y n y x n x i i n i i i i x ˆ y ˆ Var(X) Cov(X, Y) x) (x y) x)(y (x ˆ 1 0 n 1 i 2 i n 1 i i i 1 β = β = = β = =

19 Coefficiente di correlazione? β 1 ρ = Cov(X,Y) sd(x). sd(y) β 1 = Cov(X,Y) Var(X) 1) Ricavo ρ da β 1 sd(x) ρ = β 1 sd(y) 2) Ricavo β da ρ 1 sd(y) β = ρ 1 sd(x) MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.19

20 Dalla popolazione di camelie estraiamo un campione di 15 foglie della varietà cordiforme sui quali misuriamo la variabile X (peso vivo) e Y (peso secco). Otteniamo i seguenti valori: X Trovare la retta di regressione dei minimi quadrati che spiega Y in funzione di X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.20 Y

21 Y X Dal campione si calcolano le seguenti quantità x = y = s 2 x = s2 y = n=15 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.21

22 Per ottenere i parametri della retta di regressione si devono usare le formule seguenti: β 1 = Cov(X,Y) Var(X) β 0 = y β 1 x Cov(X,Y) = ( ). ( ) + + ( ). ( ) 15-1 Cov(X,Y) = Var(X) = β 1 = / = β 0 = = MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.22

23 La retta di regressione che minimizza i quadrati degli scarti dalla media è la seguente: y = β 0 + β x 1 y = x Y X Per disegnarla mi servono due punti 1) Quando y = 0 0 = x x = / = ) Quando x = 10 y = y = = MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.23

24 6 5 4 Y X Punto 1 : x= , y=0 Punto 2 : x=10, y= MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.24

25 Come interpretare i due coefficienti del modello di regressione? y = β 0 + β x 1 Intercetta: valore che assume y quando x=0 punto nel quale la retta incorcia l asse delle y Pendenza: indica di quanto varia y al variare di un unità di x Il segno indica il verso dell inclinazione MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.25

26 Assunzioni del modello di regressione Nel ipotizzare un modello di regressione stiamo assumendo che: 1. I dati sperimentali siano un campione casuale estratto da una popolazione di unità x,y per i quali vige la relazione y i = β 0 + β 1 x i + ε i tenendo conto di eventuali cause accidentali MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.26

27 Assunzioni del modello di regressione 2. Fissato un valore di X abbiamo una popolazione di valori di Y distribuiti normalmente con media situata sulla retta di regressione Y β 0 +β 1 x 3 β 0 +β 1 x 2 β 0 +β 1 x 1 Normale per Y quando X=x 1 Normale per Y quando X=x 2 Normale per Y quando X=x 3 x 1 x 2 x 3 Y X=x 1 ~ N(β 0 +β 1 x 1,σ 2 ) Y X=x 2 ~ N(β 0 +β 1 x 2,σ 2 ) Y X=x 3 ~ N(β 0 +β 1 x 3,σ 2 ) X MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.27

28 Assunzioni del modello di regressione Y X=x i ~ N(β 0 +β 1 x i, σ 2 ) 3. La varianza rimane la stessa indipendentemente da X Omoschedasticità Var(y i ) = σ 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.28

29 Assunzioni del modello di regressione y i = β 0 + β 1 x i + ε i Scarti (Residui): ε i = y i (β 0 +β 1 x i ) ε i ~ N(0,σ 2 ) Stessa variabilità di Y 0 0 ε i Assunzione rispettata ε i Assunzione violata MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.29

30 Siamo interessati a valutare l esistenza di una relazione tra peso vivo e peso secco nella popolazione delle camelie tramite un modello di regressione. UNIVERSO PARAMETRI CAMPIONE STIMATORI Dalla popolazione di camelie estraiamo un campione di 15 foglie della varietà cordiforme sui quali misuriamo il peso vivo e il peso secco. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.30

31 La retta di regressione dei minimi quadrati è la seguente: y = x Come valutiamo se la relazione tra le due variabili è significativa o no? CAMPIONE STIMATORI Facciamo INFERENZA sui parametri della retta di regressione. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.31

32 POPOLAZIONE BERSAGLIO Tutti i possibili campioni Β 0 ~ T(β 0,σ2 β 0 ) β 0 Media campionaria MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.32

33 POPOLAZIONE BERSAGLIO Tutti i possibili campioni Β 1 ~ T(β 1,σ2 β 1 ) β 1 Media campionaria MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.33

34 Usiamo β 0 e β 1 per stimare i veri valori dei parametri β 0 e β 1. β 0 T(β 0,σ2 β 0 ) Ipotesi nulla: H 0 : β 0 = 0 La retta di regressione passa per il punto di coordinate (0,0) Test del T di Student Dal campione: β 0 = y β 1 x Stima campionaria se(β 0 ) = s 1 n + (x) 2 Dev(x) Deviazione standard campionaria MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.34

35 Usiamo β 0 e β 1 per stimare i veri valori dei parametri β 0 e β 1. β 1 T(β 1,σ2 β 1 ) Ipotesi nulla: H 1 : β 1 = 0 La retta di regressione ha pendeza 0 Test del T di Student Dal campione: Cov(x,y) β = 1 Var(x) Stima campionaria se(β 1 ) = s Dev(x) Deviazione standard campionaria MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.35

36 L errore standard di entrambi i parametri è funzione di s s = (n-1) s 2 y (1 ρ2 xy ) n-2 I valori empirici per il test T di student sono β 1 β 0 t g = β 1-0 es(β 1 ) = β 1-0 s Dev(x) t g = β 0-0 es(β 0 ) s = 1 n β (x) 2 Dev(x) n-2 n-2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.36

37 P-Value: probabilità di ottenere un risultato campionario altrettanto o più estremo di quello osservato, se H 0 è vera P-value = Pr ( B 0 >β 0 sotto H 0 ) Più piccolo è il valore del p-value, 1) più estremo è il valore osservato 2) Più bassa l evidenza che i dati siano coerenti con la distribuzione sotto l ipotesi nulla P-value=0.25 P-value=0.03 β 0 = 0 β 0 β 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.37

38 3. 6. CONFRONTO ANALISI DELLA TRA REGRESSIONE MEDIE DI DUE LINEARE CAMPIONI INDIPENDENTI PROBLEMA: l ipotesi è bidirezionale H 0 : β 0 = 0 vs H 1: β 0 = 0 Unidirezionale P-value = Pr ( B 0 >β 0 sotto H 0 ) Bidirezionale 2*P-value P-value=0.06 P-value=0.03 P-value=0.03 -β 0 β 0 = 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.38 β 0

39 P-Value: probabilità di ottenere un risultato campionario altrettanto o più estremo di quello osservato, se H 0 è vera P-value = Pr ( B 1 >β 1 sotto H 0 ) Più piccolo è il valore del p-value, 1) più estremo è il valore osservato 2) Più bassa l evidenza che i dati siano coerenti con la distribuzione sotto l ipotesi nulla P-value=0.25 P-value=0.03 β 1 = 0 β 1 β 1 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.39

40 3. 6. CONFRONTO ANALISI DELLA TRA REGRESSIONE MEDIE DI DUE LINEARE CAMPIONI INDIPENDENTI PROBLEMA: l ipotesi è bidirezionale H 0 : β 1 = 0 vs H 1: β 1 = 0 Unidirezionale P-value = Pr ( B 1 >β 1 sotto H 0 ) Bidirezionale 2*P-value P-value=0.06 P-value=0.03 P-value=0.03 -β 1 β 1 = 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.40 β 1

41 Siamo interessati a valutare l esistenza di una relazione tra peso vivo e peso secco nella popolazione delle camelie tramite un modello di regressione. X Y Campione n=15 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.41

42 Dal campione otteniamo le seguenti informazioni Stimatore Misura di variabilità yi i y = n = βˆ βˆ xi i x = n = s y s Deviazione standard yi y) i = n 1 = Varianza 2 x ( 2 xi x) i = n 1 = Errore standard ( 2 2 ˆ 2 = y β1x 1 ( x) esβ = s + 0 n Dev = x = Cov( x, y) Errore standard = 2 s 2 s esβ = x 1 Dev x = = s = ( n 1) s n β) β) 1 = βˆ 0 2 es = 0.14 ˆ 1 = β1 2 es 1 = 6.69 = MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.42 t g t g 2 y (1 ρ xy )

43 P-value(β 0 ) = Pr ( B 0 >β 0 sotto H 0 ) 2*P-value(β 0 ) >2*0.4 che trovo sulle tavole Non ho sufficiente evidenza per rifiutare H 0 Concludo che β 0 non è significativamente diverso da 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.43

44 P-value(β 1 ) = Pr ( B 1 >β 1 sotto H 0 ) 2*P-value(β 1 ) < 2* Rifiuto H 0 Concludo che β 1 è significativamente diverso da 0 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.44

45 6 5 4 Y X Punto 1 : x= , y=0 Punto 2 : x=10, y= MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.45

46 Se concludo che β 1 =0 Il modello di regressione lineare non è adatto ad interpretare la relazione tra X e Y. C è un modo per valutare analiticamente la bontà di adattamento del modello? H 0 : il modello non si adatta ai dati MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.46

47 y i -y y i y x i Devianza totale: Dev TOT = Σ i (y i y) 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.47

48 X Y Campione n=15 y = Devianza totale = = ( ) 2 + ( ) ( ) 2 + ( ) 2 = = Σ (y i y ) 2 i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.48

49 Quanta parte della variabilità totale è residua? y i -y i y i y i = β 0 + β 1 x i y x i Devianza RESIDUA: Dev R = Σ i (y i y i ) 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.49

50 X Y Y y i = β 0 + β 1 x i = = Devianza residua = = ( ) 2 + ( ) ( ) 2 + ( ) 2 = = Σ (y i y i ) 2 i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.50

51 Quanta parte della variabilità totale è spiegata dal modello di regressione? y i - y y i y i = β 0 + β 1 x i y x i Devianza SPIEGATA dal modello : Dev S = Σ i (y i y) 2 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.51

52 X Y Y y i = β 0 + β 1 x i y = Devianza spiegata = = ( ) 2 + ( ) ( ) 2 + ( ) 2 = = Σ (y i y ) 2 i MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.52

53 Fonti di variabilità devianza Gradi di libertà varianza Spiegata dal modello k-1 = Residua = n-k = Totale n-1=14 F 1, 13 = Varianza spiegata Varianza residua = = MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.53

54 Distribuzione F 1,13 Area di accettazione Area di rifiuto Valore tabulato Valore empirico rifiutiamo H 0 ovvero la relazione tra le due variabili è ben spiegata da un modello di regressione lineare p < 0.05 MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.54

55 Esercizio di riepilogo Si vuole valutare la relazione tra peso alla nascita e settimane di gestazione in UK. A tal fine si estrae un campione di 26 bambini nati a University College Hospital di Londra, della stessa razza e dello stesso genere. I dati sono I seguenti: X: Y: Stimare i parametri della retta di regressione dei minimi quadrati. MARTA BLANGIARDO ANALISI DELLA REGRESSIONE LINEARE 6.55

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

4. Confronto tra medie di tre o più campioni indipendenti

4. Confronto tra medie di tre o più campioni indipendenti BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

MINIMI QUADRATI. REGRESSIONE LINEARE

MINIMI QUADRATI. REGRESSIONE LINEARE MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni

Dettagli

Lezione n. 2 (a cura di Chiara Rossi)

Lezione n. 2 (a cura di Chiara Rossi) Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o

Dettagli

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA) Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Analisi della varianza (ANOVA) Analisi della varianza Analisi della varianza (ANOVA) ANOVA ad

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione

Dettagli

ANALISI DI CORRELAZIONE

ANALISI DI CORRELAZIONE ANALISI DI CORRELAZIONE Esempio: Dati raccolti da n = 129 studenti di Pavia (A.A. 21/2) Altezza (cm) Peso (Kg) Voto Algebra e Geometria Voto Fisica I Valutare la correlazione delle seguenti coppie: Peso

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Esercitazione n.2 Inferenza su medie

Esercitazione n.2 Inferenza su medie Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione

Dettagli

La distribuzione Gaussiana

La distribuzione Gaussiana Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione

Dettagli

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui

Dettagli

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente:

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente: T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente: t = X i X j s 2 i (n i 1) + s 2 j (n j 1) n i + n j - 2 1

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE 1 Associazione tra variabili quantitative ASSOCIAZIONE FRA CARATTERI QUANTITATIVI: COVARIANZA E CORRELAZIONE 2 Associazione tra variabili quantitative Un esempio Prezzo medio per Nr. Albergo cliente (Euro)

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

La logica statistica della verifica (test) delle ipotesi

La logica statistica della verifica (test) delle ipotesi La logica statistica della verifica (test) delle ipotesi Come posso confrontare diverse ipotesi? Nella statistica inferenziale classica vengono sempre confrontate due ipotesi: l ipotesi nulla e l ipotesi

Dettagli

Soluzioni Esercizi elementari

Soluzioni Esercizi elementari Soluzioni sercizi elementari Capitolo. carattere: itolo di Studio, carattere qualitativo ordinato modalità: Diploma, Licenza media, Laurea, Licenza elementare unità statistiche: Individui. carattere: Fatturato,

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

Il coefficiente di correlazione di Spearman per ranghi

Il coefficiente di correlazione di Spearman per ranghi Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

(a cura di Francesca Godioli)

(a cura di Francesca Godioli) lezione n. 12 (a cura di Francesca Godioli) Ad ogni categoria della variabile qualitativa si può assegnare un valore numerico che viene chiamato SCORE. Passare dalla variabile qualitativa X2 a dei valori

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito Soluzioni della simulazione del 17/05/2011 Gianmarco Altoè Dipartimento di Psicologia Università di Cagliari, Anno Accademico 2010-2011 Leggere BENE le avvertenze prima

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Analisi di scenario File Nr. 10

Analisi di scenario File Nr. 10 1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica giorgio.calcagnini@uniurb.it http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html

Dettagli

1. Richiami di Statistica. Stefano Di Colli

1. Richiami di Statistica. Stefano Di Colli 1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città

Dettagli

Esempio. Approssimazione con il criterio dei minimi quadrati. Esempio. Esempio. Risultati sperimentali. Interpolazione con spline cubica.

Esempio. Approssimazione con il criterio dei minimi quadrati. Esempio. Esempio. Risultati sperimentali. Interpolazione con spline cubica. Esempio Risultati sperimentali Approssimazione con il criterio dei minimi quadrati Esempio Interpolazione con spline cubica. Esempio 1 Come procedere? La natura del fenomeno suggerisce che una buona approssimazione

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate Introduzione alle relazioni multivariate Associazione e causalità Associazione e causalità Nell analisi dei dati notevole importanza è rivestita dalle relazioni causali tra variabili Date due variabili

Dettagli

La categoria «ES» presenta (di solito) gli stessi comandi

La categoria «ES» presenta (di solito) gli stessi comandi Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:

Dettagli

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stima puntuale per la proporzione Da un lotto di arance se ne estraggono 400, e di queste 180

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Pro e contro delle RNA

Pro e contro delle RNA Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Regressione con Variabili Dummy Regressione con Variabili Dummy La

Dettagli

13. Campi vettoriali

13. Campi vettoriali 13. Campi vettoriali 1 Il campo di velocità di un fluido Il concetto di campo in fisica non è limitato ai fenomeni elettrici. In generale il valore di una grandezza fisica assegnato per ogni punto dello

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che

Dettagli

Regressione Lineare con un Singolo Regressore

Regressione Lineare con un Singolo Regressore Regressione Lineare con un Singolo Regressore Quali sono gli effetti dell introduzione di pene severe per gli automobilisti ubriachi? Quali sono gli effetti della riduzione della dimensione delle classi

Dettagli

INDICE PREFAZIONE VII

INDICE PREFAZIONE VII INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità

Dettagli

Nel seguito sono riportati due esercizi che si possono risolvere con la formula di Erlang e le relative risoluzioni.

Nel seguito sono riportati due esercizi che si possono risolvere con la formula di Erlang e le relative risoluzioni. Nel seguito sono riportati due esercizi che si possono risolvere con la formula di Erlang e le relative risoluzioni. Al fine di risolvere questo tipo di esercizi, si fa in genere riferimento a delle tabelle

Dettagli

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza. VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della

Dettagli

Analisi delle relazioni tra due caratteri

Analisi delle relazioni tra due caratteri Analisi delle relazioni tra due caratteri Le misure di connessione misurano il grado di associazione tra due caratteri qualsiasi sotto il profilo statistico (e non causale in quanto non è compito della

Dettagli

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizi test ipotesi Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se

Dettagli

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO Pasquale Iandolo Laboratorio analisi ASL 4 Chiavarese, Lavagna (GE) 42 Congresso Nazionale SIBioC Roma

Dettagli

Basi di matematica per il corso di micro

Basi di matematica per il corso di micro Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione

Dettagli

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 8 Marzo 007 Facoltà di Astronomia ESERCIZIO 1 La seguente tabella riporta la distribuzione congiunta della situazione lavorativa e dello

Dettagli

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Verifica di ipotesi e intervalli di confidenza nella regressione multipla Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo

Dettagli