Verifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare
|
|
- Vito Boni
- 7 anni fa
- Visualizzazioni
Transcript
1 Verifica di ipotesi sui coefficienti di regressione Per il momento supponiamo di muoverci nel contesto del modello gaussiano. Vogliamo capire se alcune nostre congetture sui coefficienti di regressione siano fondate o meno Poiché operiamo in condizioni di incertezza, vogliamo limitare, per quanto possibile, le probabilità prendere delle decisioni sbagliate Verifica di ipotesi sul coefficiente angolare Sistema di ipotesi bilaterale: T = B1 β 1 tn 2 SB1 statistica test H0 : β1 = β 1 H1 : β1 β 1 ipotesi nulla ipotesi alternativa β1 è un valore noto che fissiamo noi, sulla base delle nostre esigenze. Fissiamo un valore α, 0 < α < 1, che chiameremo livello di significatività del test, e vogliamo che la probabilità di ritenere falsa H0 quando in realtà H0 è vera sia proprio pari ad α Valore osservato della statistica test: toss = b1 β 1 determinazione campionaria di T sb1 P( T > t n 2,1 α/2 ) = α
2 0 0 Quindi, se decidiamo di ritenere falsa H0 quando toss > t n 2,1 α/2, rischiamo di rifiutare H0 quando essa è vera con probabilità α Livello di significatività osservato (p-value): f(t) ˆα = P( T > toss quando è vera H0) se ˆα > α, allora toss < t n 2,1 α/2 e si accetta H0; se ˆα < α, allora toss > t n 2,1 α/2 e si rifiuta H0. Si vedano le Figure 10 e 11 α oss 2 α oss 2 t n, 1 α 2 t oss 0 t oss t n, 1 α 2 t Figura 10: Regola di decisione: quando si accetta H0 Verifica di ipotesi sul coefficiente angolare Sistema di ipotesi unilaterale: f(t) H0 : β1 = β1 ( β1 ) ipotesi nulla α oss 2 α oss 2 H1 : β1 > β 1 ipotesi alternativa t oss t n, 1 α 2 0 t n, 1 α 2 t oss β 1 è un valore noto che fissiamo noi, sulla base delle nostre esigenze. t Figura 11: Regola di decisione: quando si rifiuta H0
3 0 0 T = B1 β 1 tn 2 statistica test SB1 Valore osservato della statistica test: toss = b1 β 1 determinazione campionaria di T sb1 P(T > tn 2,1 α) = α Quindi, se decidiamo di ritenere falsa H0 quando toss > tn 2,1 α, rischiamo di rifiutare H0 quando essa è vera con probabilità α Livello di significatività osservato (p-value): ˆα = P(T > toss quando è vera H0) se ˆα > α, allora toss < tn 2,1 α e si accetta H0; se ˆα < α, allora toss > tn 2,1 α e si rifiuta H0. Si vedano le Figure 12 e 13 f(t) f(t) α oss α oss 0 t oss t n, 1 α 0 t n, 1 α t oss t t Figura 12: Regola di decisione: quando si accetta H0 Figura 13: Regola di decisione: quando si rifiuta H0
4 0 Verifica di ipotesi sul coefficiente angolare Sistema di ipotesi unilaterale: T = B1 β 1 tn 2 SB1 statistica test H0 : β1 = β1 ( β1 ) ipotesi nulla H1 : β1 < β 1 ipotesi alternativa β1 è un valore noto che fissiamo noi, sulla base delle nostre esigenze. Valore osservato della statistica test: toss = b1 β 1 determinazione campionaria di T sb1 P(T < tn 2,α) = α Quindi, se decidiamo di ritenere falsa H0 quando toss < tn 2,α, rischiamo di rifiutare H0 quando essa è vera con probabilità α Livello di significatività osservato (p-value): f(t) ˆα = P(T < toss quando è vera H0) α oss se ˆα > α, allora toss > tn 2,α e si accetta H0; se ˆα < α, allora toss < tn 2,α e si rifiuta H0. Si vedano le Figure 14 e 15 t n, α t oss 0 t Figura 14: Regola di decisione: quando si accetta H0
5 0 Verifica di ipotesi sull intercetta f(t) α oss Si ripetono gli stessi ragionamenti che valgono per il coefficiente angolare. Sistema di ipotesi bilaterale: H0 : β0 = β 0 H1 : β0 β 0 ipotesi nulla ipotesi alternativa β0 è un valore noto che fissiamo noi, sulla base delle nostre esigenze. t oss t n, α 0 Figura 15: Regola di decisione: quando si rifiuta H0 t T = B0 β 0 tn 2 statistica test SB0 Valore osservato della statistica test: toss = b0 β 0 determinazione campionaria di T sb0 Sistema di ipotesi unilaterale: Al livello di significatività α, rifiutiamo H0 quando toss > t n 2,1 α/2 o, equivalentemente, quando ˆα < α, con ˆα = P( T > toss quando è vera H0) H0 : β0 = β0 ( β0 ) ipotesi nulla H1 : β0 > β 0 ipotesi alternativa β0 è un valore noto che fissiamo noi, sulla base delle nostre esigenze. Al livello di significatività α, rifiutiamo H0 quando toss > tn 2,1 α o, equivalentemente, quando ˆα < α, con ˆα = P(T > toss quando è vera H0)
6 Sistema di ipotesi unilaterale: H0 : β0 = β0 ( β0 ) ipotesi nulla H1 : β0 < β 0 ipotesi alternativa β0 è un valore noto che fissiamo noi, sulla base delle nostre esigenze. Al livello di significatività α, rifiutiamo H0 quando toss < tn 2,α o, equivalentemente, quando ˆα < α, con ˆα = P(T < toss quando è vera H0) Riprendiamo il seguente output: > summary(simulati1.lm) Call: lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-09 x e Sulla colonna t value sono riportati i valori osservati delle statistiche test: Ti = Bi β i, i = 0, 1 SBi con βi = 0, ovvero toss,i = bi, i = 0, 1 sbi Sulla colonna Pr(> t ) sono riportati i valori del livello di significatività osservato per i sistemi di ipotesi H0 : βi = 0 H1 : βi 0, i = 0, 1 Supponiamo di voler saggiare, ad un livello di significatività α = 0.01, il seguente sistema di ipotesi: H0 : β1 0 H1 : βi > 0, i = 0, 1 Sappiamo che toss = Il valore di t98,0.99 si ottene con il comando > qt(0.99,98). Abbiamo quindi che t98,0.99 = Che conclusioni possiamo trarre? Che conclusioni si possono trarre?
7 esercizio Supponiamo di voler saggiare, ad un livello di significativitá α = 0.05, il sistema di ipotesi: H0 : β1 2 H1 : βi > 2, i = 0, 1 il valore toss si determina con il seguente comando: > toss = (coef(simulati.lm)[2] - 2)/ ottenendo toss = Utilizzando la funzione qt() si ottiene che t0.95,98 = A quali conclusioni siamo giunti? Utilizzando i dati contenuti in simulati1.txt, saggiare i seguenti sistemi di ipotesi: H0 : β0 0 contro H1 : β0 < 0, α = 0.003; H0 : β0 = 5 contro H1 : β0 5, α = 0.001; H0 : β0 1 contro H1 : β0 > 1, α = 0.05; Due risultati importanti Capital Asset Pricing Model (CAPM) Gli intervalli di confidenza e i test per la verifica di ipotesi che abbiamo costruito sopra, funzionano anche quando il modello non è gaussiano, purché sussistano le assunzioni di fondo del modello di regressione lineare semplice e n sia elevato. Il metodo di previsone che abbiamo considerato richiede invece che il modello sia gaussiano. R è il rendimento di un particolare titolo azionario, al quale siamo interessati RM è il rendimento di mercato (per esempio un indice di borsa) RF è il rendimento di titoli a rischio nullo (esempio: buoni del tesoro semestrali) Il modello: E(R RM) = βre(rm RF )
8 I dati Utilizziamo il file: venus.unive.it/stone/statcomp/capm.txt. Abbiamo 87 osservazioni mensili (Aprile Giugno 2002) su: Y = scostamento tra rendimento azioni ordinarie Microsoft Corporation e variazione dell indice Standard & Poor s (in termini percentuali) X = scostamento tra variazione dell indice Standard & Poor s e il rendimento degli U.S. Treasury bills a 30 giorni (in termini percentuali) Possiamo quindi ipotizzare un modello del tipo: Carichiamo i dati: > capm=read.table("capm.txt",header=t) > attach(capm) Cerchiamo di capire se tra Y e X si possa assumere l esistenza di una relazione lineare. Si veda la Figura 16, Yi = β0 + β1xi + εi, εi N(0, σ 2 ) Come interpretereste i parametri del modello? Y = rendimento Microsoft indice S & P 500 (in %) Stimiamo il modello che abbiamo definito in precedenza utilizzando solo 80 osservazioni (le rimanenti le utilizzeremo per valutare le capacità previsive del modello): > m0 = lm(y~x, subset=1:80) Vediamo l output del comando > summary(m0) X = indice S & P 500 U.S.T. 30 gg. (in %) Figura 16: Diagramma di dispersione di Y contro X
9 > summary(m0) Call: lm(formula = Y ~ X, subset = 1:80) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) X e-07 Residual standard error: 9.28 on 78 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 78 DF, p-value: 2.011e-07 L indice di determinazione lineare (R 2 ) è pari a : la capacità del modello di spiegare la variabilità di Y è limitata. Cerchiamo ora di capire se il comportamento dei residui possa darci qualche ulteriore informazione. Definiamo il vettore dei residui standardizzati con il seguente comando > st.res=resid(m0)/9.28 Quando n è sufficientemente elevato i residui del modello tendono ad avere una varianza uguale a quella dei disturbi, quindi si standardizzano dividendoli per la radice quadrata della stima di σ 2. Disegnamo il grafico dei residui standardizzati con il comando > plot(st.res,ylab="residui standadizzati)) (Figura 17) I residui oscillano intorno allo 0 in modo casuale (non si riscontrano comportamenti regolari o sistematici) Le loro oscillazioni intorno allo 0 hanno ampiezza approssimativamente costante (la varianza sembra stabile). Residui standardizzati Index Figura 17: Grafico dei residui standadizzati nel modello m0
10 Disegnamo ora (Figura 18) il diagramma di dispersione dei residui standardizzati contro la variabile esplicativa con il seguente comando: > plot(x[1:80],st.res,ylab="residui standardizzati", xlab="x") È importante che non esista alcuna relazione tra i residui e la variabile esplicativa. Se ciò non accadesse, esisterebbe una relazione tra regressore e variabilità residua e quindi il modello non riuscirebbe a cogliere compiutamente le relazioni esistenti tra X e Y Residui standardizzati X Figura 18: Diagramma di dispersione dei residui standardizzati contro X Histogram of st.res Cerchiamo ora di capire se i disturbi si distribuiscano approssimativamente come variabili casuali normali (in altri termini, vogliamo capire se il modello sia gaussiano). Disegnamo l istogramma dei residui standardizzati (Figura 19 con il comando > hist(st.res) L istogramma è ragionevolmente simmetrico intorno allo 0 e sembra riprodurre, in modo molto approssimativo, la funzione di densità di una normale standardizzata Frequency st.res Figura 19: Istogramma dei residui standardizzati
11 Quantile campionario di ordine p Supponiamo di disporre di n osservazioni sulla variabile quantitativa Y e di fissare un numero p, 0 < p < 1. Il numero yp tale che # osservazioni yp yp = = p n Esempio: i quartili (y0.25, y0.5 (mediana) e y0.75) Disegnamo il diagramma di dispersione dei quantili campionari dei residui standardizzati contro i quantili teorici, di ordine corrispondente, della normale standardizzata (Figura 20), con i comandi: > qqnorm(st.res) > qqline(st.res) Se i punti giacciono approssimativamente sulla bisettrice del primo e del terzo quadrante, allora possiamo assumere che i residui standardizzati siano gaussiani Sample Quantiles Normal Q Q Plot Theoretical Quantiles Figura 20: Grafico quantile-quantile dei residui standardizzati Se osserviamo l output del comando > summary(m0), ci rendiamo conto che, ad un livello di significatività pari a 0.05, l intercetta può essere posta uguale a 0. Perché? cosa significa questo? Stimiamo allora il modello con il comando Yi = βxi + εi, εi N(0, σ 2 ) > m1 = lm(y~x-1,subset=1:80) Vediamo ora l output del comando > summary(m1)
12 > summary(m1) Call: lm(formula = Y ~ X - 1, subset = 1:80) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) X e-08 Ripetendo l analisi grafica sui residui del nuovo modello mon si riscontrano particolari anomalie. Verificatelo. In Figura 21 la retta di regressione stimata è sovrapposta al diagramma di dispersione dei dati. Il grafico si costruisce con i seguenti comandi: plot(x[1:80],y[1:80],ylab = "Y = rendimento Microsoft - indice S & P 500 (in % "X = indice S & P U.S.T. 30 gg. (in %)") lines(sort(x[1:80]),fitted(m1)[order(x[1:80])]) Residual standard error: on 79 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 79 DF, p-value: 5.792e-08 Y = rendimento Microsoft indice S & P 500 (in %) Vogliamo ora prevedere, al livello di fiducia 0.95, il valore assunto da Y basandoci solo sul valore di X misurato sulle unità statistiche numerate 81,..., 87. a tal fine utilizziamo il seguenti comando: > previsioni=predict(m1,capm[81:87,], interval="prediction",level=0.95) X = indice S & P 500 U.S.T. 30 gg. (in %) Figura 21: Diagramma di dispersione di Y contro X e retta di regressione stimata attraverso il secondo modello
13 Possiamo visualizzare le previsioni (Figura 22) con i seguente comandi: > plot(81:87,y[81:87],ylim=range(y[81:87],previsioni), ylab="valori osservati e previsti", xlab = "Index") > points(81:87,previsioni[,1],pch=24,col="blue") > lines(81:87,previsioni[,2],col="red") > lines(81:87,previsioni[,3],col="red") I cerchi rappresentano le osservazioni sulla variabile Y I triangoli rappresentano le previsioni puntuali Le curve rosse uniscono gli estremi degli intervalli di previsione valori osservati e previsti Index Figura 22: Confronto tra previsioni e valori osservati della variabile risposta
Esercizio Dire quale variabile debba essere usata come regressore e quale sia la variabile risposta.
Esercizio 1 Il file elettr.txt contiene dei dati sui consumi in miliardi di kilowatt/ora (eleccons) e sul prodotto interno lordo in miliardi di dollari (gdp) su 30 paesi in un determinato anno. Il prodotto
DettagliFac-simile prova di esame
UNIVERSITÀ CA FOSCARI DI VENEZIA FACOLTÀ DI ECONOMIA Statistica Computazionale I Prof. Stefano Tonellato COGNOME.................................... NOME.................................... MATRICOLA....................................
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
Dettagli0.1 Percorrenza e Cilindrata
0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,
DettagliStatistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
- metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si
DettagliRegressione. Monica Marabelli. 15 Gennaio 2016
Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione
DettagliLABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente
DettagliEsercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.
Esercizio 8 La Swiss Economic Research della Union Bank of Switzerland conduce un controllo periodico dei livelli dei prezzi e dei salari nella principali città del mondo. Una delle variabili rilevate
DettagliLaboratorio di Statistica Aziendale Modello di regressione lineare multipla
Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare
DettagliLaboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )
Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 05-6) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola
DettagliAnova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011
Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare
Dettagli1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)
1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) Riprendiamo l esempio X = seq(-5,5,0.01) Y= dnorm(x) plot(x,y) Si poteva automatizzare la scelta delle X ponendo: X=rnorm(1000)
DettagliEsercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate
Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0
DettagliANALISI DELLA VARIANZA
ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliAnalisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura
Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliLABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE
LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare
DettagliSTATISTICA. Regressione-2
STATISTICA Regressione-2 Fare sempre il grafico! Fig. 5.12 pg 178, Statistica di S. Iacus Fare sempre il grafico! y 0 2 4 6 8 10 =-1 =+0.79 outlier o dato influente 0 2 4 6 8 10 x Inferenza Il modello
DettagliAntonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR
Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione
DettagliEsercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza
Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette
DettagliAnalisi di Regressione Multipla
Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di
Dettagli> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.
A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.
DettagliCarta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016
Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliModelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione
Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare
DettagliValidazione dei modelli. Strumenti quantitativi per la gestione
Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l5-validazione.html#(1) 1/27 Validazione dei modelli In questo esempio
DettagliLABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA
DettagliLaboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)
Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola
Dettagli> Ciliegi <- read.table("i:/modelli/cherry.dat", + col.names=c( diametro, altezza, volume ))
Laboratorio 2 Modello lineare semplice 2.1 Analisi dei dati CHERRY.DAT Riprendiamo l insieme di dati Ciliegi della precedente lezione. Se non era stato salvato, bisogna rileggerlo da file: > Ciliegi
DettagliLaboratorio di Probabilità e Statistica
Laboratorio di Probabilità e Statistica lezione 8 Massimo Guerriero Ettore Benedetti Consegna 1. Implementare delle funzioni che, accettando opportuni parametri in ingresso, risolvano le formule viste
DettagliEsercitazione finale - corso R base Francesco Vidoli Ottobre 2018
Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Passo 1: Leggere il file di input (il file si trova a questo indirizzo: https://fvidoli.weebly.com/uploads/2/3/0/8/ 23088460/dati_medici.csv),
DettagliMetodi statistici per la ricerca sociale ANOVA e ANCOVA in
Metodi statistici per la ricerca sociale ANOVA e ANCOVA in Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze mattei@disia.unifi.it LM 88
DettagliCorso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano
Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliLaboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT
Laboratorio 8 Regressione multipla 8.1 Analisi del dataset HOOK.DAT I dati contenuti nel file hook.dat, raccolti da Joseph Hooker sulle montagne dell Himalaya, riportano le temperature di ebollizione dell
DettagliRegressione lineare multipla
Scopo Vogliamo porre in relazione la variabile risposta, Y con k, k > 1, variabili esplicative (o regressori, o predittori, o covariate): X1, X2..., Xk. Funzione di regressione E(Y X1 = x1, X2 = x2,...,
DettagliStatistiche di sintesi
Esercizio 2 E stato condotto uno studio per valutare la variazione della pressione sistolica in funzione dell etá. I dati sono riportati nel file sbp.xls. Effettua un analisi di regressione e disegna gli
DettagliSTATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliSTATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
DettagliUniversità di Pavia Econometria Esercizi 4 Soluzioni
Università di Pavia Econometria 2008-2009 Esercizi 4 Soluzioni Maggio, 2009 Istruzioni: I commenti devono essere concisi! 1. Dato il modello di regressione lineare, con K regressori con E(ɛ) = 0 e E(ɛɛ
DettagliSTATISTICA. Regressione-3 L inferenza per il modello lineare semplice
STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione
DettagliPolitecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011
Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:
esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliEsercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017
Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
DettagliTest delle ipotesi. Le differenze che vengono riscontrate possono essere ovviamente ricondotte a due possibilità:
Test delle ipotesi Test delle ipotesi Nel cercare di costruire un legame tra dati osservati e ipotesi teoriche sulle caratteristiche dell intera popolazione si deve, in genere, prendere una decisione per
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliStatistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
DettagliECONOMETRIA: Laboratorio I
ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliLa verifica delle ipotesi
La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere
DettagliANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
DettagliRegressione semplice: come applicarla come interpretare i risultati
Regressione semplice: come applicarla come interpretare i risultati Questo materiale è utile ai fini dell esecuzione della regressione con software statistico. Questo materiale non è in alcun modo utile
Dettagli1. variabili dicotomiche: 2 sole categorie A e B
Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili
Dettagli> cement <- read.table("i:/modelli/cement.dat", col.names=c("tempo", "resist")) > attach(cement)
Laboratorio 6 Analisi dei residui 6.1 Analisi dei dati CEMENT.DAT I dati riportati nel file cement.dat si riferiscono ad uno studio sulla resistenza del cemento alla tensione. La resistenza dipende, tra
DettagliSoluzione degli esercizi di riepilogo sul controllo statistico di qualità e sull ANOVA.
Soluzione degli esercizi di riepilogo sul controllo statistico di qualità e sull ANOVA.. Si tratta di un ANOVA a due fattori senza repliche. Gli effetti sono fissi sia sulle righe che sulle colonne. Effettuiamo
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliUniversità di Pavia Econometria Esercizi 5
Università di Pavia Econometria 2007-2008 Esercizi 5 Maggio, 2008 1. Una regressione lineare multipla di y su una costante, x 2 e x 3 produce i seguenti risultati: ŷ t = 4 + 0.4x t2 + 0.9x t3 con X X =
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliSTATISTICA. Regressione-4 ovvero Macron!
STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio
DettagliQuiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione
Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Le domande 1-6 si riferiscono al seguente problema Un data set contiene i dati sui consumi di diversi tipi di automobili e alcune loro
DettagliIndice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliMicroeconometria Day # 3 L. Cembalo. Regressione con due variabili e metodo dei minimi quadrati
Microeconometria Day # 3 L. Cembalo Regressione con due variabili e metodo dei minimi quadrati SRF: sample regression function Il passaggio dalla regressione sulla popolazione a quella sul campione è cruciale
Dettagliβˆ (pendenza della retta) =
LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7 Maria Elena Bontempi e.bontempi@economia.unife.it V LEZIONE: OLS multivariato: effetti parziali, multicollinearità Scopo dell
DettagliSTATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliAnalisi della varianza a due fattori
Laboratorio 11 Analisi della varianza a due fattori 11.1 Analisi del dataset PENICILLIN.DAT I dati contenuti nel file penicillin.dat, si riferiscono ad un esperimento di produzione di penicillina tendente
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliRICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare
DettagliOggi ultima lezione in aula 23.04 non c è lezione, 24.04 fate il tutorato di fisica come al solito
Oggi ultima lezione in aula 23.04 non c è lezione, 24.04 fate il tutorato di fisica come al solito 30.04 fate il tutorato di fisica [che da questa data si sposta al mercoledì] 01.05 festività 08.05 da
DettagliIndice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12
Indice 1 Introduzione ai modelli lineari 2 2 Dataset 3 3 Il Modello 8 4 In pratica 12 41 Peso e percorrenza 12 1 Capitolo 1 Introduzione ai modelli lineari Quando si analizzano dei dati, spesso si vuole
DettagliRegressione lineare semplice. Strumenti quantitativi per la gestione
Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html#(1) 1/33 Regressione lineare (RL) La RL è uno degli
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliEsercitazione del 16 maggio 2014
Esercitazione del 16 maggio 2014 Conclusione dell esercizio sul consumo annuo di energia elettrica della lezione precedente. Avevamo un campione di n=101 abitazioni di metratura confrontabile e per ciascuna
DettagliAnalisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliRelazioni tra variabili (fenomeni) aziendali
Relazioni tra variabili (fenomeni) aziendali - giornate di assenza dal lavoro è collegato a qualifica professionale, anzianità, sesso, dei dipendenti? - incidenti sul lavoro sono collegati a orario di
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliLM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione
LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),
DettagliUn applicazione della modellistica ARCH-GARCH
Un applicazione della modellistica ARCH-GARCH Federico Andreis Tesina per l esame di Metodi Statistici per la Finanza e le Assicurazioni A.A. 2005/2006 Prof. Diego Zappa Il grafico della serie storica
DettagliModelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)
Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1 Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande,
DettagliValidazione dei modelli Strumenti quantitativi per la gestione
Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test
DettagliMetodi Quantitativi per Economia, Finanza e Management
Metodi Quantitativi per Economia, Finanza e Management Lezione n 9 Regressione lineare multipla: la valutazione del modello, multicollinearità, metodi automatici di selezione dei regressor, analisi di
DettagliBreve ripasso di statistica
Breve ripasso di statistica D.C. Harris, Elementi di chimica analitica, Zanichelli, 1999 Capitolo 4 1 Il protocollo analitico Campionamento: 1. estrazione del campione dal lotto 2. conservazione e trasporto
DettagliMetodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione
Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
DettagliESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliDAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI
DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html
DettagliSi assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato
Regressione Lineare Semplice Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato QUANTITA' DI ALIMENTO PRODUZIONE 2 10 2 9 1.5 5 1 2 1 3 1.5 4 2 7 2 9
DettagliRegressione lineare semplice
Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice
Dettagli