Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR"

Transcript

1 Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione STATISTICA Regressione, II

2 Bontà del modello = = = + + = ( 2) campione i.i.d ~(0, )

3 Osservazioni ripetute e bontà del modello Ripetizioni nei dati 7 " = 0 = +! errore casuale errore sistematico (bias) " (% &% & ) ' = + ( & ' modello corretto "! = 0 "! 0 modello non corretto La varianza in ciascun gruppo di osservazioni può essere usata per stimare l errore casuale

4 Errore casuale e bontà del modello * : buon fit ) =, -,, ( * ),. E una stima di comunque sia il modello, buono o no * 0 " (% &% & ) ' = + ( & ' ( * ),,- lack of fit se cadiamo oltre il quantile, la componente lack of fit domina 1 2 (.,.)

5 Errore casuale e bontà del modello = dati, con ripetizioni in 8 dei 13 distinti punti = 1.06 * ( * ),,- = 1.>? 11,10 = 2.94 ( * ),,, Spiegata dalla regress. Livello di X SS nel livello df Sum Sq. SS/df (Draper & Smith, p. 51) errore casuale Attorno alla retta 21(=23-2) = Lack of fit 11= =MS 6 Err. cas = ) Tot. corretto = 7.56B 1.>? 1,21 = 4.32 df tot

6 R 2 per misure ripetute (E & E*) ' & (E & E*) ' & = D maxd = !! D = 1!! = I.JJIK D = 0.40 cresce aggiungendo covariate df Sum Sq. SS/df Regress Residui = Lack of fit 11= =MS 6 Err. cas = ) Tot. corretto 22

7 I dati influenti = d = i

8 Tra parentesi la regressione con le sole medie è un altra cosa

9 Varie Test di Levene: è un test di uguaglianza delle varianze di gruppi diversi. Si può usare per il pure error stimato grazie alle ripetizioni nei dati. Si veda Draper & Smith p per alcuni commenti in merito. Test di Durbin-Watson: è un test di correlazione per dati che hanno un ordine naturale (temporale o spaziale, p.es.). E un test che confronta ogni residuo con quelli vicini nella sequenza (nel tempo o nello spazio, p.es.). L = ( ) 0 L 4, simmetrico attorno a 0 residui positivam. correlati L vicino a 0 residui negativam. correlati L vicino a 4 (4 L vicino a 0)

10 Integrazione alla bibliografia Applied Regression Analysis N.R. Draper & H. Smith Wiley Prescription for Working Statisticians A. Madansky Springer-Verlag

11 Il caso generale = +, +, O = 1,, = 1, 1, + P = QR+S Q T Q = 1 1 1,, =, 1, U V W,X V W,X V W,X Y Q T Q W = W U V X V Z Y V W,X Y V W,X V W,X U ], hat matrix [ = Q T Q W Q T P P\ = Q[ = Q Q T Q W Q T P

12 Il caso generale = +, + + ^^, +, O = 1,, = 1,, 1,, + _ = 2 U V W,X V Y,X Q T Q = V W,X V W,X Y V W,X V Y,X V Y,X V W,X V Y,X V Y,X Y [ = Q T Q W Q T P P\ = Q[ = Q Q T Q W Q T P perchè esista e sia ben definita le colonne non devono essere linearmente dipendenti (nel senso dell algebra lineare) tra di loro: no multicollinearità. Draper & Smith, cap. 16.

13 multicollinearità: un es. > d <- read.table("iq.txt", header = TRUE) > head(d) Gender FSIQ VIQ PIQ Weight Height > cor(weight,height) MRI_Count 1 Female [1] Male Male Suggerisce di mettere solo una delle due nel modello per la previsione di FSIQ Height Weight

14 Invarianti D = ( *) ( *) " = 0 abc = sono incorrelate: " = 0 per O n ~(0, ) abc( )de ^,2 abc( ) = (Q T Q) = ( 2) t-test & E & E* ' /^ h ijkjh i &lh ) & ' ~ 1(m, m W) F-test IC per media, per singolo valore, per intera retta

15 Il caso generale = +, + + ^^, +, O = 1,, = 1, 1, ^, ^, ^ + Fonte di variabilità Gradidi libertà (gl) SS (Sum of Squares) Mean Square (SS/gl) Retta di regressione Attorno alla retta _ (_+1) ( *) Totale 1 ( *) (E & E*) ' /^ & h ijkjh i &lh ) & ' 1-test di linearità 3 = = ^ = 0 ~ 1(_, _ 1)

16 La regressione multipla con R > d <- read.table("iq.txt", header = TRUE) > head(d) Gender FSIQ VIQ PIQ Weight Height MRI_Count 1 Female Male Male Male Female Female = +, +, +, O = 1,, > mod1<-lm(fsiq~height+mri_count)

17 La regressione multipla con R res Sample Quantiles Normal Q-Q Plot res Index Theoretical Quantiles prev1

18 Il caso generale 3 = = q = 0 (D D w )/ (1 D ) ( _ 1) = + qr, + + ^^, +, O = 1,, modello ridotto Fonte di variabilità Gradidi libertà (gl) SS (Sum of Squares) Mean Square (SS/gl) Retta di regressione ( *) =SSR Attorno alla retta =SSE Totale 1 ( *) rifiuto 3 se supero il quantile della 1(, _ 1) (sstsst u )/q ssv (^) ~ 1(, _ 1)

19 multicollinearità: un es. > d <- read.table("iq.txt", header = TRUE) > head(d) Gender FSIQ VIQ PIQ Weight Height > cor(weight,height) MRI_Count 1 Female [1] Male Male > mod1<-lm(fsiq~weight+height+mri_count) > modr<-lm(fsiq~height+mri_count) = 1 D = D w = Height La quantità di varianza spiegata è la stessa nei due modelli (D D w )/1 (1 D ) (40 3 1) = = 1.>? 1,36 = Weight

20 ANOVA > mod2<-lm(fsiq~height+mri_count) > summary(mod2) = 2 ( 2 yz{{.= 0) Call: lm(formula = FSIQ ~ Height + MRI_Count) _ = 4 Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 1.173e e Height e e * MRI_Count 2.139e e *** --- Signif. codes: 0 *** ** 0.01 * (sstsst u )/q ssv (^) (.0?.0 )/ (.0? ) (}}) Residual standard error: on 37 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 37 DF, p-value: ~ 1(, _ 1) =0.0966=1.>? 2,35 =0.376

21 ANOVA con R = +, + + ^^, +, O = 1,, = + qr, + + q ^, +, O = 1,, Script8.R > anova(mod1,mod2) Analysis of Variance Table mod1 Model 1: FSIQ ~ Gender + Weight + Height + MRI_Count Model 2: FSIQ ~ Height + MRI_Count mod2 Res.Df RSS Df Sum of Sq F Pr(>F) (1) ~ (2) ~ (_ B ) ~ 1(, _ 1) > sum((mod1$fitted)^2) [1] > sum((mod2$fitted)^2) [1] = 1 (_+1) = = = ~ 1(2,40 4 1) > 1-pf(0.0968,2,35) [1]

Metodi statistici per la ricerca sociale ANOVA e ANCOVA in

Metodi statistici per la ricerca sociale ANOVA e ANCOVA in Metodi statistici per la ricerca sociale ANOVA e ANCOVA in Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze mattei@disia.unifi.it LM 88

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare

Dettagli

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

STATISTICA. Regressione-2

STATISTICA. Regressione-2 STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante

Dettagli

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente

Dettagli

Statistiche di sintesi

Statistiche di sintesi Esercizio 2 E stato condotto uno studio per valutare la variazione della pressione sistolica in funzione dell etá. I dati sono riportati nel file sbp.xls. Effettua un analisi di regressione e disegna gli

Dettagli

Ancova: il modello lineare in generale

Ancova: il modello lineare in generale Ancova: il modello lineare in generale Massimo Borelli May 9, 2014 Massimo Borelli () Ancova: il modello lineare in generale May 9, 2014 1 / 18 Contenuti 1 L analisi della covarianza la notazione di Wilkinson

Dettagli

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico ) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 05-6) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Passo 1: Leggere il file di input (il file si trova a questo indirizzo: https://fvidoli.weebly.com/uploads/2/3/0/8/ 23088460/dati_medici.csv),

Dettagli

VARIETÀ. zona geografica A B C D

VARIETÀ. zona geografica A B C D Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore

Dettagli

Esercizio Dire quale variabile debba essere usata come regressore e quale sia la variabile risposta.

Esercizio Dire quale variabile debba essere usata come regressore e quale sia la variabile risposta. Esercizio 1 Il file elettr.txt contiene dei dati sui consumi in miliardi di kilowatt/ora (eleccons) e sul prodotto interno lordo in miliardi di dollari (gdp) su 30 paesi in un determinato anno. Il prodotto

Dettagli

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette

Dettagli

CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza

CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza Douglas C. Montgomery Progettazione e analisi degli esperimenti 006 McGraw-Hill CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza Metodi statistici e probabilistici per l ingegneria

Dettagli

Fac-simile prova di esame

Fac-simile prova di esame UNIVERSITÀ CA FOSCARI DI VENEZIA FACOLTÀ DI ECONOMIA Statistica Computazionale I Prof. Stefano Tonellato COGNOME.................................... NOME.................................... MATRICOLA....................................

Dettagli

CAPITOLO 5 Introduzione ai piani fattoriali

CAPITOLO 5 Introduzione ai piani fattoriali Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria

Dettagli

Regressione lineare multipla Strumenti quantitativi per la gestione

Regressione lineare multipla Strumenti quantitativi per la gestione Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data

Dettagli

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Le domande 1-6 si riferiscono al seguente problema Un data set contiene i dati sui consumi di diversi tipi di automobili e alcune loro

Dettagli

> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.

> d = alimentazione == benz > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2. A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

Esperimenti longitudinali e misure ripetute. Massimo Borelli. Motivazioni. Un esempio tipicamente biotec. Anova sbagliate Anova r.m.

Esperimenti longitudinali e misure ripetute. Massimo Borelli. Motivazioni. Un esempio tipicamente biotec. Anova sbagliate Anova r.m. May 14, 2014 Contenuti 1 2 il peso delle gemelle: 1 misura > alice = 73.6 > ellen = 73.8 Le gemelle hanno lo stesso peso? Alice è laureata in matematica Ellen è laureata in statistica il peso delle gemelle:

Dettagli

Analisi della varianza a due fattori

Analisi della varianza a due fattori Laboratorio 11 Analisi della varianza a due fattori 11.1 Analisi del dataset PENICILLIN.DAT I dati contenuti nel file penicillin.dat, si riferiscono ad un esperimento di produzione di penicillina tendente

Dettagli

Metodi Quantitativi per Economia, Finanza e Management

Metodi Quantitativi per Economia, Finanza e Management Metodi Quantitativi per Economia, Finanza e Management Lezione n 9 Regressione lineare multipla: la valutazione del modello, multicollinearità, metodi automatici di selezione dei regressor, analisi di

Dettagli

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull

Dettagli

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare

Dettagli

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) 1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) Riprendiamo l esempio X = seq(-5,5,0.01) Y= dnorm(x) plot(x,y) Si poteva automatizzare la scelta delle X ponendo: X=rnorm(1000)

Dettagli

Statistica 1- parte II

Statistica 1- parte II Statistica 1- parte II Esercitazione 5 Dott.ssa Antonella Costanzo 10/03/016 Esercizio 1. Analisi della varianza - ANOVA Per confrontare l efficacia di tre diete (A, B, C) si sono scelti 30 individui con

Dettagli

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza

Dettagli

Stima dei parametri di modelli lineari

Stima dei parametri di modelli lineari Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice La bontà della regressione Per fare un buon modello lineare serve: una correlazione alta, che dice che i dati stanno vicini alla retta

Dettagli

Regressione lineare semplice. Strumenti quantitativi per la gestione

Regressione lineare semplice. Strumenti quantitativi per la gestione Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html#(1) 1/33 Regressione lineare (RL) La RL è uno degli

Dettagli

ANALISI DELLA VARIANZA

ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di

Dettagli

Modelli non lineari. Strumenti quantitativi per la gestione

Modelli non lineari. Strumenti quantitativi per la gestione Modelli non lineari Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/7_gam.html#(5) 1/54 Metodi per affrontare problemi nonlineari Regressione

Dettagli

INTRODUZIONE A R Lezione 4

INTRODUZIONE A R Lezione 4 INTRODUZIONE A R Lezione 4 Silvia Bacci e Silvia Pandolfi 1 La regressione lineare 1.1 Regressioni lineare semplice Per applicare il metodo di regressione lineare scegliamo il dataset cars relativo alle

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice

Dettagli

STATISTICA. Regressione-1

STATISTICA. Regressione-1 STATISTICA Regressione-1 Obiettivo generale Y x Obiettivo generale Y previsione di y da x è possibile () x Obiettivo generale previsione di y da x non è possibile Y x Obiettivo generale Y Un modello per

Dettagli

REGRESSIONE MULTIPLA E CORRELAZIONE. Nicola Tedesco (Statistica Sociale) REGRESSIONE MULTIPLA E CORRELAZIONE 1 / 16

REGRESSIONE MULTIPLA E CORRELAZIONE. Nicola Tedesco (Statistica Sociale) REGRESSIONE MULTIPLA E CORRELAZIONE 1 / 16 REGRESSIONE MULTIPLA E CORRELAZIONE Nicola Tedesco (Statistica Sociale) REGRESSIONE MULTIPLA E CORRELAZIONE 1 / 16 y a b 1 x 1 (x 2 0) a b 2 x 2 (x 1 0) a a b 1 x 1 b 2 x 2 0 x 2 x 1 x 2 Plane x 1 Nicola

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Modelli non lineari Strumenti quantitativi per la gestione

Modelli non lineari Strumenti quantitativi per la gestione Modelli non lineari Strumenti quantitativi per la gestione Emanuele Taufer Metodi per affrontare problemi non lineari Regressione polinomiale Esempio: modellare i picchi di domanda di energia Fattori che

Dettagli

Parità del potere d'acquisto - è vera?

Parità del potere d'acquisto - è vera? Parità del potere d'acquisto - è vera? Il principio della parità del potere d'acquisto (PPP) aerma che nel lungo periodo i tassi di cambio tendono a riprodurre le dierenze nel tasso di inazione tra le

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

Validazione dei modelli. Strumenti quantitativi per la gestione

Validazione dei modelli. Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l5-validazione.html#(1) 1/27 Validazione dei modelli In questo esempio

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA

Dettagli

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud. Esercizio 8 La Swiss Economic Research della Union Bank of Switzerland conduce un controllo periodico dei livelli dei prezzi e dei salari nella principali città del mondo. Una delle variabili rilevate

Dettagli

Livello di esposizione. animale Basso Moderato Alto

Livello di esposizione. animale Basso Moderato Alto Esercizio -Esempio 1 (anova 2 vie con blocchi) I tassi respiratori (ispirazioni al minuto) sono stati misurati in otto animali usati per un esperimento, con tre livelli di esposizione al monossido di carbonio.

Dettagli

Modelli con predittori qualitativi e modelli con interazioni

Modelli con predittori qualitativi e modelli con interazioni Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

INTRODUZIONE AI MODELLI LINEARI

INTRODUZIONE AI MODELLI LINEARI INTRODUZIONE AI MODELLI LINEARI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html Indice 1

Dettagli

Metodi di regressione multivariata

Metodi di regressione multivariata Metodi di regressione multivariata Modellamento dei dati per risposte quantitative I metodi di regressione multivariata sono strumenti utilizzati per ricercare relazioni funzionali quantitative tra un

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

Validazione dei modelli Strumenti quantitativi per la gestione

Validazione dei modelli Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Università di Pavia Econometria Esercizi 5

Università di Pavia Econometria Esercizi 5 Università di Pavia Econometria 2007-2008 Esercizi 5 Maggio, 2008 1. Una regressione lineare multipla di y su una costante, x 2 e x 3 produce i seguenti risultati: ŷ t = 4 + 0.4x t2 + 0.9x t3 con X X =

Dettagli

stima per intervallo

stima per intervallo stima per intervallo intervalli di fiducia confidence interval una affermazione come questa: CI(95%): lim inf < µ < lim sup p = 0.95 che la media della popolazione sia compresa nell intervallo fra lim

Dettagli

Inferenza statistica Donata Rodi 04/10/2016

Inferenza statistica Donata Rodi 04/10/2016 Inferenza statistica Donata Rodi 04/10/2016 Popolazione Campionamento Campione Parametri Inferenza Statistiche µ, ϭ 2 descrittive Stima X, s 2 Quale test? Parametrico o no Scala di misura 1 gruppo 2 gruppi

Dettagli

Il BOOM degli ascolti dei programmi culinari. ha inciso sulle iscrizioni all istituto alberghiero???

Il BOOM degli ascolti dei programmi culinari. ha inciso sulle iscrizioni all istituto alberghiero??? Il BOOM degli ascolti dei programmi culinari ha inciso sulle iscrizioni all istituto alberghiero??? 60000 50000 40000 30000 20000 10000 0 2007 2008 2009 2010 2011 2012 2013 2014 gli ingredienti sono: Anno

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 3 LA REGRESSIONE LINEARE ES. STUDIO RELAZIONE ALTEZZA - PESO Soggetto Altezza Peso A 174 75 B 166 63 C 173 70 D 171 71 E 168 68 F 167 68 G 165

Dettagli

Modelli statistici: sessione 1

Modelli statistici: sessione 1 Modelli statistici: sessione 1 Francesco Lagona Università Roma Tre 1 R ed R Studio IDE R è un ambiente costituito da oggetti e librerie di comandi per la gestione e l analisi di dati statistici. R è disponibile

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Siete invitati a cambiare un po di parametri dell esercizio (es. aumentare Nrow; diminuire sig2; diminuire i coefficienti di X3 ed X4).

Siete invitati a cambiare un po di parametri dell esercizio (es. aumentare Nrow; diminuire sig2; diminuire i coefficienti di X3 ed X4). 1. ALLINEAMENTO DI FATTORI, ESEMPI SINTETICI Esercizio. Creare una tabella con dati sintetici in cui sia percepibile il fenomeno dell allineamento ed esaminare le sue conseguenze. Consideriamo il modello

Dettagli

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità 18 Febbraio 2016 1. La probabilità di errore nella trasmissione di una cifra binaria attraverso un certo canale di comunicazione

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione

Dettagli

Fallstudium 3 - Soluzioni Dr Giorgio Pioda 22 novembre 2018

Fallstudium 3 - Soluzioni Dr Giorgio Pioda 22 novembre 2018 Fallstudium 3 - Soluzioni Dr Giorgio Pioda 22 novembre 2018 Fallstudium 3 - Soluzioni Considerando i dati di misurazione della concentrazione di carbamazepina 1 nel sangue determinata con due apparecchi

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Es. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive

Es. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive Regressione Tale tecnica esamina e studia la relazione tra una o più variabili indipendenti e una variabile dipendente. L insieme dei parametri riassumono la relazione tra VD e VI, sotto le ipotesi che

Dettagli

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html

Dettagli

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE Università degli Studi di Padova Facoltà di Scienze MM.FF.NN. Corso di Laurea Magistrale: Biologia Sanitaria/Biologia Molecolare Insegnamento: Statistica Applicata Docente: Prof.ssa Alessandra R. Brazzale

Dettagli

1. Esistono differenze nella resistenza tra le varie marche?

1. Esistono differenze nella resistenza tra le varie marche? Laboratorio 10 Analisi della varianza 10.1 Analisi del dataset STURDY.DAT I dati riportati nel file sturdy.dat si riferiscono ad un esperimento effettuato per studiare la resistenza allo strappo di diverse

Dettagli

> cement <- read.table("i:/modelli/cement.dat", col.names=c("tempo", "resist")) > attach(cement)

> cement <- read.table(i:/modelli/cement.dat, col.names=c(tempo, resist)) > attach(cement) Laboratorio 6 Analisi dei residui 6.1 Analisi dei dati CEMENT.DAT I dati riportati nel file cement.dat si riferiscono ad uno studio sulla resistenza del cemento alla tensione. La resistenza dipende, tra

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Ancora sulla regressione multipla

Ancora sulla regressione multipla Laboratorio 9 Ancora sulla regressione multipla 9.1 Analisi del dataset HILLS.DAT I dati contenuti nel file hills.dat riguardano il record registrato in 35 corse campestri effettuate sulle montagne scozzesi,

Dettagli

Metodi Statistici per il Management

Metodi Statistici per il Management Metodi Statistici per il Management Statistica Multivariata I Simone Borra - Roberto Rocci Introduzione e obiettivi La statistica multivariata si occupa di analizzare e studiare in modo simultaneo un set

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche Corso di Statistica Medica Correlazione Regressione Lineare Statistica Medica Correlazione e Regressione lineare

Dettagli

prevedere y in funzione di x, per variabili linearmente associate

prevedere y in funzione di x, per variabili linearmente associate prevedere y in funzione di x, per variabili linearmente associate concetto di regressione idea di base se x e y sono associate, posso usare x per prevedere y (con una certa approssimazione) per farlo

Dettagli

ANOVA. ANalysis Of VAriance. Federico Plazzi. 1 Dicembre 2015

ANOVA. ANalysis Of VAriance. Federico Plazzi. 1 Dicembre 2015 ANOVA ANalysis Of VAriance Federico Plazzi 1 Dicembre 2015 A che cosa serve? A che cosa serve? Applicazione L ANOVA ha finalità simili al test t: confrontare campioni. Al contrario del test t, però, è

Dettagli

CAPITOLO 6 Il piano fattoriale 2 k

CAPITOLO 6 Il piano fattoriale 2 k Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 6 Il piano fattoriale 2 k Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile

Dettagli

STATISTICA. Regressione-2

STATISTICA. Regressione-2 STATISTICA Regressione-2 Fare sempre il grafico! Fig. 5.12 pg 178, Statistica di S. Iacus Fare sempre il grafico! y 0 2 4 6 8 10 =-1 =+0.79 outlier o dato influente 0 2 4 6 8 10 x Inferenza Il modello

Dettagli

OLS multivariato: effetti parziali, multicollinearità

OLS multivariato: effetti parziali, multicollinearità OLS multivariato: effetti parziali, multicollinearità CONCETTI DA RECUPERARE Per stimare questo modello utilizziamo le seguenti variabili esplicative educ, exper e tenure Primo passo da compiere sarà quello

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Regressione semplice: come applicarla come interpretare i risultati

Regressione semplice: come applicarla come interpretare i risultati Regressione semplice: come applicarla come interpretare i risultati Questo materiale è utile ai fini dell esecuzione della regressione con software statistico. Questo materiale non è in alcun modo utile

Dettagli

Introduzione alla Regressione Logistica

Introduzione alla Regressione Logistica Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti

Dettagli

Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato

Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato Regressione Lineare Semplice Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato QUANTITA' DI ALIMENTO PRODUZIONE 2 10 2 9 1.5 5 1 2 1 3 1.5 4 2 7 2 9

Dettagli

Word ha il vantaggio che possiamo salvare un po' di risultati, anche grafici

Word ha il vantaggio che possiamo salvare un po' di risultati, anche grafici INTRODUZIONE. TABELLE, CORRELAZIONE E PLOT Usare un foglio txt (o word o simile) di appoggio Word ha il vantaggio che possiamo salvare un po' di risultati, anche grafici Copiare su R il comando A

Dettagli

Laboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT

Laboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT Laboratorio 8 Regressione multipla 8.1 Analisi del dataset HOOK.DAT I dati contenuti nel file hook.dat, raccolti da Joseph Hooker sulle montagne dell Himalaya, riportano le temperature di ebollizione dell

Dettagli

Analisi della regressione

Analisi della regressione Analisi della regressione L analisi della regressioneè una tecnica statistica per modellare e investigare le relazioni tra due (o più) variabili. Nella tavola è riportata la % di purezza di ossigeno, rilasciata

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le

Dettagli

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini Laboratorio di R - 3 a lezione Prof. Mauro Gasparini 1. Verifica di ipotesi: il test t di Student In R è disponibile la funzione t.test che effettua il test t di Student ad un campione, a due campioni

Dettagli

Analisi Univariata e Multivariata degli indici ricavati dai dati rilevati tramite Multiplex

Analisi Univariata e Multivariata degli indici ricavati dai dati rilevati tramite Multiplex Sviluppo di reti probabilistiche di supporto alle decisioni in viticoltura ed enologia Analisi Univariata e Multivariata degli indici ricavati dai dati rilevati tramite Multiplex Federico M. Stefanini

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle

Dettagli

Statistica multivariata Donata Rodi 08/11/2016

Statistica multivariata Donata Rodi 08/11/2016 Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui

Dettagli