Regressione lineare con un solo regressore

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Regressione lineare con un solo regressore"

Transcript

1 Regressione lineare con un solo regressore La regressione lineare è uno strumento che ci permette di stimare e di fare inferenza sui coefficienti incogniti di una retta. Lo scopo principale è di stimare l effetto causale misurato come effetto che l incremento una unità di X ha su Y coefficiente angolare. Per ora, restringiamo il problema e pensiamo a far passare una linea retta fra i dati di 2 variabili, Y e X, in cui X è l unico regressore.

2 Il problema di inferenza che ci poniamo è lo stesso di quello che ci si pone per le medie, differenze fra le medie etc. Inferenza sulla pendenza di una retta comprende: Stima: In che maniera dovremmo tracciare una linea attraverso i dati per stimarne la pendenza? (Minimi Quadrati Ordinari, Ordinary Least Square, OLS). Quali sono gli svantaggi e i vantaggi di OLS? Test di ipotesi: Come verificare se la pendenza è statisticamente zero? Intervallo di confidenza: Come costruire un intervallo di confidenza per tale pendenza? 2

3 La retta di regressione della popolazione: Voti = β 0 + β STR β = pendenza della retta di regressione della popolazione Voti = STR = di quanto cambia il voto quando STR cambia di una unità Perchè β 0 e β sono parametri della popolazione? Vorremmo conoscere è il vero valore della popolazione di β. Dato che non lo conosciamo β, lo stimiamo usando i dati 3

4 Notazione generale Y i = β 0 + β X i + u i, i =,, n X è la variabile indipendente o regressore Y è la variabile dependente β 0 = intercetta β = pendenza u i = l errore di regressione l errore di regressione contiene i fattori omessi, o gli errori di misurazione di Y. In genere, questi fattori omessi sono altri fattori, oltre alla variabile X, che influenzano Y. 4

5 La retta di regressione e il termine di errore 5

6 Le stime Ordinary Least Squares Come possiamo ottenere delle stime di β 0 e β dai dati? Considerando che Y è lo stimatore dei minimi quadrati di µ Y, la media campionaria Y è la soluzione di, n 2 m Yi m, i= min ( ) minimizza la somma degli errori al quadrato fra tutti i possibili stimatori m, dove m è uno stimatore di µ Y Analogamente, lo stimatore dei minimi quadrati di ( ordinary least squares o OLS ) dei parametri sconosciuti β 0 e β, è soluzione di n min [ Y ( b + b X )] b0, b i 0 i i= 2 6

7 Retta di regressione della popolazione: Voti = β 0 + β STR β = Voti STR 7

8 Lo stimatore OLS risolve : 0 n min [ Y ( b + b X )] b, b i 0 i i= Lo stimatore OLS minimizza le differenze fra i valori attuali Y i e valori predetti dalla retta di regressione, al quadrato. Dimostrazione(App. 4.2). I risultati di queste operazioni sono gli stimatori OLS di β 0 e β. 2 8

9 Applicazione: Voti STR Pendenza stimata = ˆ β = 2.28 Intercetta stimata = ˆ β 0 = Linea di regressione stimata: oti Vˆ = STR 9

10 Intercetta e coefficiente angolare Vˆ oti = STR interpretazione: I distretti con uno studente in più per insegnante in media ricevono voti di 2.28 punti più bassi. Cioè, Voti STR = 2.28 L intercetta (letteralmente) significa che, secondo le nostre stime i distretti senza studenti avrebbero un voto predetto di Questa interpretazione non ha senso. È estrapolata fuori dall intervallo dei dati e in questo caso non ha senso economicamente. Non sempre così! 0

11 Valori previsti e residui: Uno dei distretti nel campione è Antelope, CA, per cui STR = 9.33 e Voti = Valore predetto: Y ˆAntelope = = residui: u ˆAntelope = = 3.0

12 OLS : esempio di output - stata regress testscr str, robust Regression with robust standard errors Number of obs = 420 F(, 48) = 9.26 Prob > F = R-squared = Root MSE = Robust testscr Coef. Std. Err. t P> t [95% Conf. Interval] str _cons Vˆ oti= STR (discuteremo dopo del resto) 2

13 Misure di bontà della regressione Una domanda che sorge spontanea è: quanto è buona l approssimazione della retta di regressione o quanto riesce a spiegare i dati. Ci sono due statistiche di riferimento complementari che forniscono misure di adeguatezza: L R 2 della regressione misura la frazione della varianza di Y che è spiegata da X; è priva di unità di misura e può assumere valori che vanno da 0 (non c è approssimazione) a (approssimazione perfetta) Errore standard della regressione (SER) misura la grandezza dei residui di regressione in termini delle unità di Y 3

14 L R 2 è la frazione della varianza campionaria di Y i spiegata dalla regressione Y i = Y ˆi + u ˆi = previsioni OLS + residui OLS var (Y) campionaria = var( Y ˆi )campionaria + var( u ˆi )campionaria (???) Somma totale dei quadrati (TSS) = spiegata SS (ESS) + residua SS (RSS) TSS = ESS + RSS Definizione di R 2 : R 2 = ESS TSS = R 2 = 0 significa che ESS = 0 R 2 = significa che ESS = TSS 0 R 2 n i= n i= ( Yˆ Yˆ ) i ( Y Y ) i 2 2 4

15 Lo Standard Error della Regressione (SER) SER misura la distanza dalla media della distribuzione di u. SER è (circa) la deviazione standard campionaria dei residui OLS: SER = n ( uˆ ˆ i u) n 2 i= 2 = n n 2 i= uˆ 2 i (dato che û = n uˆ i = 0). n = i 5

16 SER = n n 2 i= Ha come unità di misura le stesse di u, e dunque di Y Misura in media quanto sono grandi i residui OLS (l errore medio fatto imponendo una certa retta di regressione) La radice della media degli errori al quadrato- root mean squared error (RMSE) è simile al SER: RMSE = uˆ n uˆ n = Misura la stessa cosa del SER l unica differenza è la divisione per /n invece che per /(n 2). Correzione gradi di libertà 2 parametri stimati. i 2 i 2 i 6

17 Vˆ oti= STR, R 2 =.05, SER = 8.6 Interpretazione: STR spiega solo una piccola parte della variazione nei voti. Ha senso questa conclusione? Possiamo dunque concludere che STR non è importante per trarre delle conclusioni di politica economica? 7

18 Le Assunzioni dei Minimi Quadrati Quali sono le proprietà dello stomatore OLS? Deve essere corretto e con una varianza piccola. Sotto quali condizioni ciò accade? Iniziamo facendo alcune assunzioni su come Y e X sono correlate e come i dati sono stati raccolti (schema campionario) 8

19 Assunzioni dei Minimi Quadrati Y i = β 0 + β X i + u i, i =,, n. u è una v.c., la distribuzione di u condizionata a X ha media zero: E(u X = x) = 0. Ciò implica che ˆ β è corretto (lo vediamo successivamente) 2. (X i,y i ), i =,,n, sono i.i.d. è vero se X, Y sono raccolte con un campionamento casuale semplice ci conduce alla distribuzione campionaria di ˆ β 0 e ˆ β 3. outliers di X e/o Y sono rari. Tecnicamente, X e Y hanno un momento di 4 ordine finito Outliers possono dare origine ad un valore di ˆ β privo di significato 9

20 Assunzione #: E(u X = x) = 0. Per ogni dato valore di X, la media di u è zero: Es: Voti i = β 0 + β STR i + u i, u i = altri fattori Cosa sono questi altri fattori? E(u X=x) = 0 è plausibile? 20

21 Consideriamo un esperimento ideale casuale e controllato: X casualmente assegnata (studenti casualmente assegnati a classi di diversa grandezza; pazienti casualmente assegnati a trattamenti medici). Un computer assegna X casualmente senza informazioni sugli individui. Poichè X è assegnata casualmente, tutte le altre caratteristiche inidividuali, u,sono indipendentemente distribuite rispetto a X Dunque, un esperimento ideale casuale e controllato, E(u X = x) = 0 (Assunzione # verificata) Negli esperimenti reali, o nel caso di dati osservati dobbiamo stare più attenti. 2

22 Assunzione #2: (X i,y i ), i =,,n sono i.i.d. Ciò si verifica automaticamente se le entità (individui, distretti) sono campionate con un campionamento casuale semplice: prima l entità è selezionata poi, per quella entità, X e Y sono osservate. Un caso in cui il campionamento è tipicamente non-i.i.d. si verifica con le serie storiche 22

23 Assunzione #3: E(X4) < and E(Y4) < Un grande outlier è un valore estremo di X o Y tecnicamente, se i valori di X e Y cadono all interno di un intervallo chiuso, allora hanno quarto momento finito. Un outlier molto grande può fortemente influenzare i risultati 23

24 Un altra ragione per cui è utile il diagramma a nuvola! 24

25 Distribuzione campionaria dello stimatore OLS Lo stimatore OLS è calcolato usando un campione di dati; un campione diverso darà origine a valori diversi di ˆ β. Questa è la ragione per cui si parla di incertezza campionaria di ˆ β. Dunque abbiamo bisogno di: quantificare l incertezza campionaria associata a ˆ β usare ˆ β per i test d ipotesi (es. H 0 : β = 0, H : β 0 ) costruire un intervallo di confidenza per β tutto ciò richiede la conoscenza della distribuzione campionaria dello stimatore OLS. In 2 passi Nozioni di probabilità Distribuzione dello stimatore OLS 25

26 Nozioni di probabilità Quello che concerne la probabilità può essere riassunto in 3 ipotesi. Popolazione Il gruppo di interesse (es: tutti i possibili distretti scolastici) Variabili casuali: Y, X (es: Voti, STR) Distribuzione congiunta di (Y, X) La funzione di regressione per la popolazione è lineare E(u X) = 0 (Assunzione #) X, Y hanno quarto momento finito (Assunzione #3) Dati raccolti da campionamento casuale semplice: {(X i, Y i )}, i =,, n, sono i.i.d. (Assunzione #2) 26

27 Come per Y, ˆ β ha una distribuzione campionaria. Cos è E( ˆ β )? (qual è il centro della distribuzione?) se E( ˆ β ) = β, OLS è corretto Cos è var( ˆ β )? (misura della incertezza campionaria) Qual è la distribuzione campionaria di ˆ β nei piccoli campioni? Può essere molto complicato Qual è la distribuzione campionaria di ˆ β nei grandi campioni? Relativamente semplice, ˆ β nei grandi campioni è normalmente distribuito. 27

28 L Appendice 4.3 dimostra che ˆ n i= β β = n i= ( X X ) u i ( X X ) i 2 i 28

29 29 Prova di correttezza E( ˆ β ) β = 2 ( ) ( ) n i i i n i i X X u E X X = = = 2 ( ),..., ( ) n i i i n n i i X X u E E X X X X = = = 0 poichè E(u i X i =x) = 0 da Assunzione # L Assunzione # implica che E( ˆ β ) = β Cioè, ˆ β è uno stimatore corretto di β. Per dettagli App. 4.3

30 var( ˆ var[( X i µ x ) ui ] β β ) =. 4 n σ X Riassumendo ˆ β è corretto: E( ˆ β ) = β, proprio come Y! var( ˆ β ) è inversamente proportionale a n, proprio come Y! 30

31 L esatta distribuzione campionaria è complicata dipende dalla distribuzione di (Y, X) ma quando n è grande c è una buona approssimazione: () Poiché var( ˆ β ) è proporzionale a /n e E( ˆ β ) = β ˆ β p β (2) quando n è grande, la distribuzione campionaria di ˆ β si approssima alla distribuzione normale (CLT) 3

32 Approssimazione a n-grande n vi = ˆ n i β β 2 σ X, dove v i = (X i X )u i Quando n è grande dal CLT deriva che approssimativamente come N(0, σ n). 2 v / n vi i n = si distribuisce così, per n grande, ˆ β si distribuisce approssimativamente ˆ β ~ N β σ 2 v, 4 nσ X, dove v i = (X i µ X )u i 32

33 Matematicamente var( ˆ var[( X i µ x ) ui ] β β ) = 4 n σ 2 dove σ X = var(x i ). La varianza di X appare al quadrato al denominatore quanto più cresce la distanza della media di X più diminuisce la varianza di β. X Intuitivamente Quanto più X varia, più c è informazione nei dati e questa informazione può essere utilizzata per approssimare meglio la retta di regressione 33

34 C è lo stesso numero di punti blu e neri quali punti forniscono una retta di regressione più accurata? 34

35 Riassunto sulla distribuzione di Se le Assunzioni sono verificate, allora La distribuzione campionaria esatta (con piccolo n) di ˆ β ha: E( ˆ β ) = β ( ˆ β corretto) var( ˆ var[( X i µ x ) ui ] β ) = (proporzionale) 4 n σ n. X A parte media e varianza la distribuzione campionaria esatta di ˆ β è complicata e dipende dalla distribuzione di (X,u) ˆ β p β ( ˆ β consistente) ˆ β E( ˆ β) Quando n è grande, var( ˆ β ) ~ N(0,) (CLT) ˆβ Tutto ciò richiama quanto già visto per Y. Ora possiamo andare avanti con test e intervalli di confidenza 35

36 Test d ipotesi e intervalli di confidenza Sommario Ora che conosciamo la distribuzione campionaria dello stimatore OLS, possiamo condurre test d ipotesi su β e costruire un intervalli di confidenza Inoltre daremo uno sguardo ai seguenti argomenti: Regressioni quando X è binaria (0/) eteroschedasticità e omoschedasticità Efficienza dello stimatore OLS Uso della statistica-t nel test di ipotesi 36

37 4 passi principali:. definire la popolazione oggetto di interesse 2. derivare la distribuzione campionaria dello stimatore 3. stimare la varianza della distribuzione campionaria (per il TLC è l unica cosa di cui abbiamo bisogno se n è grande) cioè trovare gli standard error (SE) dello stimatore usando solo i dati a disposizione 4. Usare ˆ β per ottenere una stima puntuale e il suo SE per test di ipotesi e intervallo di confidenza. 37

38 Oggetto di interesse: β in, Y i = β 0 + β X i + u i, i =,, n β = Y/ X, per un cambio in X (effetto causale) 38

39 Test d ipotesi e SE ˆβ L obiettivo è di testare un ipotesi, come β = 0 test di significativita usando i dati per cercare di concludere se l H 0 è vera o no. General setup Ipotesi nulla e alternativa a due-code: H 0 : β = β,0 vs. H : β β,0 β,0 il valore ipotizzato sotto la nulla. Ipotesi nulla e alternativa a una-coda: H 0 : β = β,0 vs. H : β < β,0 39

40 Approccio generale: construiamo una statistica t, calcoliamo il p- valore (o lo confrontiamo con il valore critico di N(0,)) In generale: t =(stima-valore ipotizzato)/se(stimatore) dove SE(stimatore) è la radice quadrata di uno stimatore della varianza dello stimatore. Per testare la media di Y: t = Per testare β, t = Y s Y µ / Y,0 n ˆ β β SE( ˆ β ),0 Dove SE( ˆ β ) = la radice quadrata di uno stimatore della varianza della distribuzione campionaria di ˆ β ed è calcolato dal software, 40

41 Riassunto: H 0 : β = β,0 vs H : β β,0, t-statistica t = ˆ β β SE( ˆ β ),0 = ˆ β β,0 σ 2 ˆβ ˆ Rifiutiamo al 5% se t >.96 Il p-valore è p = Pr[ t > t att ] = probabilità nelle code della distribuzione fuori da t att ; rifiutiamo al 5% se il p-valore è < 5%. Approssimazione valida per n grande. 4

42 Esempio: Retta di regressione stimata: Vˆ oti standard errors forniti dal software: = STR SE( ˆ β 0 ) = 0.4 SE( ˆ β ) = 0.52 statistica t per testare cheβ,0 = 0 = ˆ β β SE( ˆ β ),0 All % il valore critico è di 2.58, perciò Alternativamente abbiamo il p-valore = =

43 The p-valore è di (0 5 ) 43

44 Intervalli di confidenza per β Poichè la statistica t per β è N(0,) nei grandi campioni, costruire un intervallo di confidenza al 95% è la stessa cosa del caso della media campionaria: intervallo di confidenza al 95% per β = { ˆ β ±.96 SE( ˆ β )} 44

45 Retta di regressione stimata: Vˆ oti = STR SE( ˆ β 0 ) = 0.4 SE( ˆ β ) = % intervallo di confidenza di ˆ β : { ˆ β ±.96 SE( ˆ β )} = { 2.28 ± } = ( 3.30,.26) Le seguenti conclusioni sono identiche: L intervallo di confidenza al 95% non include lo zero; L ipotesi β = 0 è rifiutata al livello di significatività del 5% 45

46 Vˆ oti = STR, R 2 =.05, SER = 8.6 (0.4) (0.52) Questa espressione ci da molte informazioni: La retta stimata è Vˆ oti Lo SE( ˆ β 0 ) è 0.4 Lo SE( ˆ β ) è 0.52 = STR L R 2 è 0.05; lo standard error della regressione è

47 Come leggere un output regress testscr str, robust Regression with robust standard errors Number of obs = 420 F(, 48) = 9.26 Prob > F = R-squared = Root MSE = Robust testscr Coef. Std. Err. t P> t [95% Conf. Interval] str _cons so: Vˆ oti = STR,, R 2 =.05, SER = 8.6 (0.4) (0.52) t (β = 0) = 4.38, p-valore = (2-code) 95% 2-code intervallo conf. per β è ( 3.30,.26) 47

48 Sommario di inferenza su β 0 e β : Stima: Stime OLS di ˆ β 0 e ˆ β ˆ β 0 e ˆ β hanno approssimativamente distribuzione campionaria normale in grandi campioni Test: H 0 : β = β,0 v. β β,0 (β,0 è il valore di β sotto H 0 ) t = ( ˆ β β,0 )/SE( ˆ β ) p-valore = area sotto la normale standard fuori t att (n grande) Inervallo di confidenza: intervallo di confidenza al 95% per β è { ˆ β ±.96 SE( ˆ β )} questo è l insieme di valori di β per cui non si rifiuta l ipotesi nulla al 5%. Il 95% CI contiene il vero β nel 95% di tutti i campioni. 48

49 Regressione quando X è Binaria A volte il regressore è binario: X = se le classi sono piccolo, = 0 se non lo sono X = se donna, = 0 se uomo X = se trattato, = 0 se non lo è I regressori binari sono a volte chiamati variabili dummy. Fino ad ora, abbiamo chiamato β pendenza ma questo non ha senso se X è binaria Come interpretare il coefficiente se il regressore è binario? 49

50 Interpretazione Y i = β 0 + β X i + u i, dove X i = 0 o : quando X i = 0, Y i = β 0 + u i La media di Y i è β 0 cioè, E(Y i X i =0) = β 0 quando X i =, Y i = β 0 + β + u i la media di Y i è β 0 + β cioè, E(Y i X i =) = β 0 + β perciò β = E(Y i X i =) E(Y i X i =0) = differenza della popolazione fra medie di gruppo 50

51 sestr < Es D i = 0seSTR Regressione OLS Vˆ oti = D (.3) (.8) Grandezza Classe Voto medio(y ) Std. dev. (s Y ) N Piccola (STR < 20) Grande(STR 20) Differenza nelle medie: Ysmall Ylarge = = 7.4 Standard error: SE = s n 2 2 s l s s + = n l =

52 Sommario Y i = β 0 + β X i + u i β 0 = media di Y quando X = 0 β 0 + β = media Y quando X = β = differenza nelle medie di gruppo, X = meno X = 0 SE( ˆ β ) ha la solita interpretazione Statistica-t, intervallo di confidenza come al solito È semplicemente un altra maniera per fare un analisi di differenze fra medie 52

53 Eteroschedasticità e omoschedasticità Cosa sono? Conseguenze dell omoschedasticità Implicazioni per il calcolo degli standard errors Se var(u X=x) è costante cioè, la varianza della distribuzione di u condizionata a X non dipende da X allora u si dice omoschedastica. Altrimenti, u si dice eteroschedastica. 53

54 Es: etero/omoschedasticità nel caso di regressore binario) Standard error quando le varianze dei gruppi sono diverse: SE = s n 2 2 s l s + s n l Standard error quando le varianze dei gruppi sono uguali: dove SE = s 2 s p = p + n n s ( n ) s + ( n ) s l 2 2 s s l l n s + n l 2 (SW, Sez 3.6) s p = stima complessiva di σ 2 2 dove σ l = 2 σ s varianze dei gruppi uguali = omoschedasticità varianze dei gruppi diverse = eteroschedasticità 54

55 Omoschedasticità E(u X=x) = 0 (u soddisfa Assunzione #) La varianza di u NON dipende da x 55

56 Eteroschedasticità E(u X=x) = 0 (u soddisfa Assunzione #) La varianza di u DIPENDE da x: u è eteroschedastico. 56

57 Es: guadagno medio vs anni di istruzione Eteroschedastico o omoschedastico? 57

58 Eteroschedastico o omoschedastico? 58

59 u eteroschedastico?. Richiamiamo le 3 Assunzioni OLS:. E(u X = x) = 0 2. (X i,y i ), i =,,n, sono i.i.d. 3. grandi outliers sono rari Eteroschedasticità e omoschedasticità hanno a che fare con la var(u X=x). Poiché non abbiamo fatto alcuna assunzione esplicita sull omoschedasticità, abbiamo implicitamente assunto la presenza di eteroschedasticità. 59

60 Possiamo provare che lo stimatore OLS ha la varianza minore fra gli stimatori lineari in Y ( teorema Gauss-Markov) La formula per la varianza di ˆ β e degli standard error OLS è: 2 Se var(u i X i =x) = σ u, allora var( ˆ var[( X i µ x ) ui ] β ) = 2 2 n( σ ) X = E X u 2 2 [( i µ x ) i ] 2 2 n( σ X ) 2 σ u = 2 nσ X Nota: var( ˆ β ) è inversamente proporzionale a var(x): più variabilità in X significa più informazione su ˆ β 60

61 Di conseguenza gli standard error omoschedastici sono SE( ˆ β ) = n 2 uˆ i n 2 i= n n ( X i X ) n i= 2. 6

62 gli standard error omoschedastici sono validi solo se gli errori sono omoschedastici. Di solito conviene usare gli standard error eteroschedasticistandard error robusti perchè sono validi in tutti e due i casi. Il principale vantaggio degli standard error omoschedastici è la semplicità della formula. Il maggiore svantaggio è che sono validi solo con errori omoschedastici Dato che le due formule coincidono nel caso di omoschedasticità conviene sempre usare standard error robusti! 62

Regressione lineare semplice: inferenza

Regressione lineare semplice: inferenza Regressione lineare semplice: inferenza Eduardo Rossi 2 2 Università di Pavia (Italy) Marzo 2014 Rossi Regressione lineare semplice Econometria - 2014 1 / 60 Outline 1 Introduzione 2 Verifica di ipotesi

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Regressione con una variabile dipendente binaria

Regressione con una variabile dipendente binaria Regressione con una variabile dipendente binaria Fino ad ora abbiamo considerato solo variabili dipendenti countinue: Che succede se Y è binaria? Y = va al college, o no; X = anni di istruzione Y = fumatore,

Dettagli

Regressione Lineare con un Singolo Regressore

Regressione Lineare con un Singolo Regressore Regressione Lineare con un Singolo Regressore Quali sono gli effetti dell introduzione di pene severe per gli automobilisti ubriachi? Quali sono gli effetti della riduzione della dimensione delle classi

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Università degli Studi di Bari Dipartimento di Scienze Economiche e Metodi Matematici. Corso di Econometria

Università degli Studi di Bari Dipartimento di Scienze Economiche e Metodi Matematici. Corso di Econometria Università degli Studi di Bari Dipartimento di Scienze Economiche e Metodi Matematici Corso di Econometria Corsi di Laurea Magistrale in Economia degli Intermediari e dei Mercati Finanziari 8 CFU Statistica

Dettagli

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Funzioni di regressione non lineari

Funzioni di regressione non lineari Funzioni di regressione non lineari Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Regressione nonlineare Econometria - 2013 1 / 25 Sommario Funzioni di regressione non lineari - note

Dettagli

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI. Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

L indagine campionaria Lezione 3

L indagine campionaria Lezione 3 Anno accademico 2007/08 L indagine campionaria Lezione 3 Docente: prof. Maurizio Pisati Variabile casuale Una variabile casuale è una quantità discreta o continua il cui valore è determinato dal risultato

Dettagli

Regressioni con Panel Data

Regressioni con Panel Data Regressioni con Panel Data Un insieme di dati panel contiene osservazioni riguardanti più di un individuo, dove ogni entità è osservata in due o più periodi di tempo. Esempi ipotetici: Dati su 420 distretti

Dettagli

Proprietà della varianza

Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

CAPITOLO 11 ANALISI DI REGRESSIONE

CAPITOLO 11 ANALISI DI REGRESSIONE VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire

Dettagli

Gli errori nella verifica delle ipotesi

Gli errori nella verifica delle ipotesi Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E

Dettagli

Teorema del limite centrale TCL

Teorema del limite centrale TCL Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1 Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Analisi degli Errori di Misura. 08/04/2009 G.Sirri Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia

Dettagli

Test d ipotesi: confronto fra medie

Test d ipotesi: confronto fra medie Test d ipotesi: confronto fra medie Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona CONFRONTO FRA MEDIE 1) confronto fra una media campionaria e una media di popolazione

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016 Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Introduzione all Analisi della Varianza (ANOVA)

Introduzione all Analisi della Varianza (ANOVA) Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016 Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Stima Puntuale Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio In ciascuno dei casi seguenti determinare quale tra i due stimatori S e T per il parametro θ è distorto

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

obbligatorio - n. iscrizione sulla lista

obbligatorio - n. iscrizione sulla lista 02.09.2015 - appello di STATISTICA per studenti ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista il presente elaborato si compone di 5 (cinque) pagine se non ve lo ricordate siete fritti;

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

UNIVERSITÀ DEGLI STUDI DI PERUGIA

UNIVERSITÀ DEGLI STUDI DI PERUGIA SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale

Dettagli

Analisi della varianza: I contrasti e il metodo di Bonferroni

Analisi della varianza: I contrasti e il metodo di Bonferroni Analisi della varianza: I contrasti e il metodo di Bonferroni 1 Contrasti In molti problemi risulta importante stabilire, nel caso venga rifiutata l ipotesi nulla, di uguaglianza delle medie µ j delle

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima

Dettagli

Esercitazione 8 del corso di Statistica 2

Esercitazione 8 del corso di Statistica 2 Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione

Dettagli

STATISTICA. Esercizi vari

STATISTICA. Esercizi vari STATISTICA Esercizi vari Esercizio 5.6 p. 205 Variabile Coeff. Dev. std. Statistica t p-value Intercetta 23.384 1.592 14.691 0 Profondità -1.435 0.213-6.726 0 = 0.850 Esercizio 5.6 p. 205 Variabile Coeff.

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

Premessa: la dipendenza in media

Premessa: la dipendenza in media Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

Note sulla probabilità

Note sulla probabilità Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Il metodo della regressione

Il metodo della regressione Il metodo della regressione Il matching statistico Il matching statistico si basa sull idea di abbinare a ciascun soggetto trattato un soggetto non trattato tendenzialmenre equivalente, ovvero molto simile

Dettagli

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. 2008 PARTE I 1. Si consideri il seguente modello di regressione lineare su dati cross

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

Distribuzioni campionarie. Antonello Maruotti

Distribuzioni campionarie. Antonello Maruotti Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Test per la correlazione lineare

Test per la correlazione lineare 10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata; di : dado : normale Finora abbiamo visto test d ipotesi per testare ipotesi differenti, ma tutte concernenti il valore atteso di una o due popolazioni. In questo capitolo vediamo come testare 1 l ipotesi

Dettagli

È possibile trovare la popolazione di origine conoscendone un campione? o meglio. partendo dalla conoscenza di n, x e d.s.?

È possibile trovare la popolazione di origine conoscendone un campione? o meglio. partendo dalla conoscenza di n, x e d.s.? Statistica6-06/10/2015 È possibile trovare la popolazione di origine conoscendone un campione? o meglio. È possibile conoscere σ e μ partendo dalla conoscenza di n, x e d.s.? 1 A partire da un campione

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Dettagli

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Il modello di regressione

Il modello di regressione Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07 PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 006/07 Esercizio 1 Prova scritta del 16/1/006 In un ufficio postale lavorano due impiegati che svolgono lo stesso compito in maniera indipendente, sbrigando

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi: DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli