Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud."

Transcript

1 Esercizio 8 La Swiss Economic Research della Union Bank of Switzerland conduce un controllo periodico dei livelli dei prezzi e dei salari nella principali città del mondo. Una delle variabili rilevate è il prezzo dell hamburger Big Mac, Y (misurato in termini del logaritmo del numero di minuti-lavoro necessari per acquistare un Big Mac). Il Big Mac è un bene di consumo assai comune, le cui caratteristiche sono identiche in tutto il mondo e, quindi, ci si aspetta che il suo prezzo, in termini reali, sia identico ovunque. Ovviamente, questa affermazione non è vera e gli economisti utilizzano il cosiddetto indice di parità Big Mac per valutare l inefficenza del sistema di cambi valutari. Ci si pone l obbiettivo di costruire un modello di regressione lineare multipla che spieghi la variabilitá di Y in 57 città (l anno di riferimento è il 2000) utilizzando i seguenti predittori (tutte le variabili sono contenute nel file ubs.txt: ˆ X 1 : logaritmo naturale del salario reale medio. Il salario reale medio (ovvero il potere d acquisto del salario medio) di ogni città è commisurato, in termini percentuali, al salario reale medio di Zurigo. La variabile X 1 è quindi il logaritmo (naturale) di questa percentuale. ˆ X 2 : logaritmo naturale del numero di minuti-lavoro necesari per acquistare un Kg. di riso ˆ X 3 : logaritmo naturale del numero di giorni di vacanza remunerati nell arco dell anno ˆ X 4 : logaritmo naturale del numero di minuti-lavoro necesari per acquistare un Kg. di pane ˆ D 5 : variabile indicatrice = 1 se la città si trova in Asia, = 0 altrimenti ˆ D 6 : variabile indicatrice = 1 se la città si trova in Europa, Nord-America o Oceania, = 0 altrimenti Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud. 1. Disegnare i diagrammi di dispersione di Y contro X j, j = 1,..., 4 utilizzando simboli diversi per ciascuna area geografica di riferimento e proporre dei commenti adeguati. 2. Stimare un modello di regressione lineare multipla in cui le variabili esplicative siano costituite da X j, j = 1,..., 4, D 5 e D 6. Analizzare i residui del modello e commentare i risultati. 3. Generalizzare il modello da cui si è partiti nel punto 2., inserendo i seguenti otto termini di interazione:x j D s, j = 1,..., 4, s = 5, 6. e selezionare le variabili in modo adeguato. 4. Scrivere l equazione stimata del modello a cui si è pervenuti 5. Analizzare i residui del modello a cui si è giunti e commentare i risultati. 6. Un economista affermerebbe che, al crescere del salario reale e a parità di ogni altra condizione, il costo di un Big Mac diminuirebbe (per acquistare un Big Mac sarebbe necessario un minor numero di minuti-lavoro). Secondo il modello che abbiamo costruito, l economista avrebbe ragione? 7. L economista sostiene anche che, a parità di ogni altra condizione, all aumentare del numero di giorni di vacanza remunerati, il costo del Big Mac diminuisce (infatti, per acquistare un Big Mac sarebbe necessaria una quantitá inferiore di minuti-lavoro). Possiamo essere d accordo con l economista? 8. L economista sostiene inoltre che, se il costo del pane aumenta, allora, a parità di ogni altra condizione, aumenta anche il costo del Big Mac. Possiamo essere d accordo con lei/lui? Soluzione. 1. Per cancellare tutto ciò che è memorizzato in R, chiudere le finestre grafiche, caricare i dati e disegnare i grafici diamo i seguenti comandi: > rm(list = ls()) > graphics.off() > ubs = read.table("ubs.txt", header = T) > attach(ubs) > plot(x1, Y, type = "n") > points(x1[d5 == 1], Y[D5 == 1], col = "blue", pch = 19) > points(x1[d6 == 1], Y[D6 == 1], pch = 19) > points(x1[d5 == 0 & D6 == 0], Y[D5 == 0 & D6 == 0], col = "red", + pch = 19)

2 > legend(x = 1.5, y = 3, legend = c("asia", "Europa", "Africa e Sud America"), + pch = c(19, 19, 19), col = c("blue", "black", "red")) > plot(x2, Y, type = "n") > points(x2[d5 == 1], Y[D5 == 1], col = "blue", pch = 19) > points(x2[d6 == 1], Y[D6 == 1], pch = 19) > points(x2[d5 == 0 & D6 == 0], Y[D5 == 0 & D6 == 0], col = "red", + pch = 19) > legend(x = 3.5, y = 3, legend = c("asia", "Europa", "Africa e Sud America"), + pch = c(19, 19, 19), col = c("blue", "black", "red")) > plot(x3, Y, type = "n", ylim = c(2, 6.5)) > points(x3[d5 == 1], Y[D5 == 1], col = "blue", pch = 19) > points(x3[d6 == 1], Y[D6 == 1], pch = 19) > points(x3[d5 == 0 & D6 == 0], Y[D5 == 0 & D6 == 0], col = "red", + pch = 19) > legend(x = 2.4, y = 6.4, legend = c("asia", "Europa", "Africa e Sud America"), + pch = c(19, 19, 19), col = c("blue", "black", "red")) > plot(x4, Y, type = "n") > points(x4[d5 == 1], Y[D5 == 1], col = "blue", pch = 19) > points(x4[d6 == 1], Y[D6 == 1], pch = 19) > points(x4[d5 == 0 & D6 == 0], Y[D5 == 0 & D6 == 0], col = "red", + pch = 19) > legend(x = 2, y = 5, legend = c("asia", "Europa", "Africa e Sud America"), + pch = c(19, 19, 19), col = c("blue", "black", "red")) I quattro grafici richiesti sono rappresentati in Figura 1. Da questa figura si evince che: ˆ Il logaritmo del costo del Big Mac (Y) decresce al crescere del logaritmo del salario reale (X 1 ): al crescere del logaritmo del salario reale, il logaritmo della quantità di lavoro necessaria per comprare un Big Mac diminuisce. Questa relazione non sembra essere influenzata dalla zona geografica di appartenenza: i punti neri, rossi e blu possono essere interpolati da un unica retta. ˆ Il logaritmo del costo del Big Mac cresce al crescere del logaritmo del costo di un chilogrammo di riso (X 2 ) e al crescere del logaritmo del costo del pane (X 4 ). La relazione positiva tra Y e X 4 è ovvia ed intutitiva; non altrettanto possiamo dire della relazione tra Y e X 2. Come spesso avviene per i prezzi delle derrate alimentari, è facile verificare che esiste una correlazione positiva tra il prezzo del riso e quello del pane (e quindi tra i logaritmi dei due prezzi). Questa correlazione positiva implica anche che il logaritmi del prezzo del Big Mace sia correlato positivamente con il logaritmo del prezzo del riso. In realtà la variabile che influenza direttamente il logaritmo del costo del Big Mac è il logaritmo del prezzo del pane, non il logaritmo del prezzo del riso: questo è un esempio di ciò che tecnicamente si definisce correlazione spuria. ˆ Non sembra esistere alcuna relazione tra il costo del Big Mac e il logaritmo del numero di giorni di vacanza remunerati nell arco dell anno. 2. Dobbiamo stimare un modello del tipo Per far questo utilizziamo il comando Y i = β 0 + β 1 X 1,i + β 2,i X 2,i + β 3 X 3,i + β 4 X 4,i + β 5 D 5,i + β 6 D 6,i + ε i. (1) > ubs.0.lm = lm(y ~ X1 + X2 + X3 + X4 + D5 + D6) Disegnamo innanzitutto il grafico dei residui e il diagramma di dispersione dei residui (e i ) contro i valori stimati della funzione di regressione (ŷ i ) (si osservi come, utilizzando la funzione par(), si possano disegnare più grafici un una singola finestra grafica): > par(mfrow = c(2, 1)) > plot(resid(ubs.0.lm), ylab = "residui") > plot(fitted(ubs.0.lm), resid(ubs.0.lm), ylab = "residui", xlab = expression(hat(y)[i])) I due grafici sono riportati nella Figura 2:

3 Y Asia Europa Africa e Sud America Y Asia Europa Africa e Sud America X1 X2 Y Asia Europa Africa e Sud America Y Asia Europa Africa e Sud America X3 X4 Figura 1: Diagrammi di dispersione di Y contro X j, j = 1,..., 4. ˆ Nel primo grafico nella Figura 2 si osserva che i residui sembrano oscillare in modo casuale intorno allo zero, senza particolari regolarità e con una variabilità stabile; ˆ il secondo grafico rappresenta i residui contro i valori stimati della funzione di regressione. Questo grafico rappresenta una sintesi dei diagrammi di dispersione dei residui contro le variabili esplicative, essendo i termini ŷ i, i = 1,..., n delle combinazioni lineari dei regressori inclusi nel modello. Non emergono particolari relazioni tra le due variabili e questo depone a favore della bontà del modello stimato. Esaminiamo ora i diagrammi di dispersione dei residui contro i regressori quantitativi inclusi nel modello (Figura 3): > par(mfrow = c(2, 2)) > plot(x1, resid(ubs.0.lm), ylab = "residui") > plot(x2, resid(ubs.0.lm), ylab = "residui") > plot(x3, resid(ubs.0.lm), ylab = "residui") > plot(x4, resid(ubs.0.lm), ylab = "residui") Non appaiono evidenti forme di dipendenza tra i residui, che rappresentano la parte di variabilità delle variabile risposta non spiegabile dal modello, e i regressori, che rappresentano la parte di informazione campionaria che utilizziamo per spiegare il comportamento della variabile risposta. Cerchiamo ora di capire se il modello sia gaussiano, prendendo in considerazione il grafico quantile-quantile dei residui standardizzati (Figura 4):

4 residui Index residui y^i Figura 2: Grafico dei residui e diagramma di dispersione dei residui contro i valori stimati della funzione di regressione. > qqnorm(rstandard(ubs.0.lm)) > qqline(rstandard(ubs.0.lm)) (il comando rstandard(ubs.0.lm) fornisce i residui standardizzati del modello, ed il suo output è equivalente a quanto si otterrebbe dividendo il vettore dei residui (che si ottiene con il comando resid(ubs.0.lm)) per la radice quadrata della stima della varianza dei disturbi). Il grafico in Figura 4 è coerente con l assunzione di gaussianità del modello. Esaminiamo ora la sintesi dei risultati della stima del modello: > summary(ubs.0.lm) Call: lm(formula = Y ~ X1 + X2 + X3 + X4 + D5 + D6) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-09 *** X e-10 *** X

5 residui residui X1 X2 residui residui X3 X4 Figura 3: Diagrammi di dispersione dei residui contro i regressori quantitativi X X D D Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 50 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 6 and 50 DF, p-value: < 2.2e-16 Il coefficiente di determinazione lineare multipla assume un valore soddisfacente (0.8776) e così pure il coefficiente di determinazione lineare multipla corretto (0.8629). La radice quadrata della stima della varianza dei residui è pari a Poichè l analisi dei residui depone a favore dell attendibilità dei test che abbiamo studiato (le assunzioni su cui essi si basano sembrano valere), possiamo saggiare alcuni sistemi di ipotesi di particolare interesse. Il test congiunto sui coefficienti di regressione ci induce a ritenere che, ad un livello di significatività pari a 0.05, almeno uno di essi sia diverso da 0 (il livello di significatività osservato è inferiore a A questo punto dobbiamo chiederci se nel modello siano state incluse delle variabili ridondanti. I passi da seguire sono i seguenti: a) Per ogni j, 0 j 6, impostare il sistema di ipotesi: H 0 : β j = 0

6 Normal Q Q Plot Sample Quantiles Theoretical Quantiles Figura 4: grafico quantile-quantile dei residui standardizzati H 1 : β j 0 e controllare il livello di significatività osservato corrispondente al valore osservato della statistica test. b) Confrontare il livello di significatività osservato con il livello di significatività che abbiamo fissato. Assumiamo di avere fissato un livello di significatività pari a c) Poniamo uguale a zero quel coefficiente in corrispondenza del quale abbiamo riscontrato il più alto livello di significatività tra tutti quelli che eccedono il livello d) Ristimiamo il modello e ripetiamo i passi a)-d) fino a quando i livelli di significatività osservati, associati ai test indicati nel punto a), risultano tutti inferiori a Applicando questa procedura, giungiamo al modello finale: > ubs.2.lm = lm(y ~ X1 + X2 + D5 + D6) > summary(ubs.2.lm) Call: lm(formula = Y ~ X1 + X2 + D5 + D6) Residuals: Min 1Q Median 3Q Max Y i = β 0 + β 1 X 1,i + β 2 X 2,i + β 5 D 5,i + β 6 D 6,i + ε i : (2)

7 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** X e-12 *** X * D * D * --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 52 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 4 and 52 DF, p-value: < 2.2e-16 L equazione di regressione stimata è quindi: con s 2 = = ŷ i = x 1,i x 2,i d 5,i d 6,i 3. Per generalizzare il modello introdotto nell equazione (1), dobbiamo stimare il seguente modello: Y i = β 0 + β 1 X 1,i + β 2,i X 2,i + β 3 X 3,i + β 4 X 4,i + β 5 D 5,i + β 6 D 6,i + +β 7 X 1,i D 5,i + β 8 X 2,i D 5,i + β 9 X 3,i D 5,i + β 10 X 4,i D 5,i + (3) +β 11,i X 1,i D 6,i + β 12,i X 2,i D 6,i + β 13 X 3,i D 6,i + β 14 X 4,i D 6,i + ε i. Stimiamo il modello ed esaminiamo una sintesi dei risultati inferenziali con i seguenti comandi: > ubs.3.lm = lm(y ~ X1 + X2 + X3 + X4 + D5 + D6 + X1:D5 + X2:D5 + + X3:D5 + X4:D5 + X1:D6 + X2:D6 + X3:D6 + X4:D6) > summary(ubs.3.lm) Call: lm(formula = Y ~ X1 + X2 + X3 + X4 + D5 + D6 + X1:D5 + X2:D5 + X3:D5 + X4:D5 + X1:D6 + X2:D6 + X3:D6 + X4:D6) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) * X X X X * D D X1:D X2:D X3:D * X4:D * X1:D X2:D X3:D * X4:D Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

8 Residual standard error: on 42 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 14 and 42 DF, p-value: < 2.2e-16 Conducendo l analisi dei residui in modo analogo a quanto svolto nel punto precedente, possiamo ritenere di poter condurre dei test su diversi sistemi di ipotesi. In particolare, possiamo procedere alla selezione delle variabili, seguendo la procedura indicata nel punto 2. (continuiamo a fissare un livello di significatività pari a 0.05). Giungiamo quindi al modello finale: Le stime e la sintesi dei risultati si ottengono con i comandi: > ubs.15.lm = lm(y ~ X1 + X4) > summary(ubs.15.lm) Call: lm(formula = Y ~ X1 + X4) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** X e-15 *** X * --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 54 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 2 and 54 DF, p-value: < 2.2e-16 Y i = β 0 + β 1 X 1,i + β 4 X 4,i + ε i. (4) Ora siamo alle prese con un problema spinoso: partendo da due modelli diversi siamo giunti a due modelli finali diversi, descritti dalle equazioni (2) e (4). Quale dei due dobbiamo scegliere? Stiamo toccando un tema molto difficile, al quale non si possono dare risposte definitive: il tema della scelta di uno tra diversi modelli statistici. Cerchiamo di ragionare sul problema. a) Siamo pervenuti al modello (4) partendo da un modello più generale di quello costituito da (1). Possiamo quindi ritenere di avere sfruttato una maggiore quantità di informazione rispetto al percorso seguito per giungere a (2). b) Il modello (4) è più semplice (nel senso che contiene meno parametri e meno variabili) e, forse, più ragionevole del modello (2). In effetti, appare più sensato far dipendere il logaritmo del prezzo del Big Mac dal logaritmo del costo del pane (X 4 ) piuttosto che dal logaritmo del costo del riso (X 2 ) (si rifletta su quanto detto sopra a proposito della cosiddetta correlazione spuria). La dipendenza della variabile risposta dalle diverse aree geografiche potrebbe essere una complicazione superflua. In effetti, dall analisi grafica delle interazioni tra le variabili in gioco, non sembra che la regione di appartenenza giochi un ruolo fondamentale. Questa, tuttavia, è solo una considerazione di natura euristica. È forse più logico ritenere che le tre regioni geografiche si distinguano essenzialmente per il diverso ammontare e per il diverso modo di distribuirsi della ricchezza. L informazione riguardante questi aspetti è probabilmente fornita più dalle osservazioni sulla variabile X 1 (logaritmo del salario reale), che dalla regione di appartenenza. Nelle città asiatiche presenti nell insieme di dati esaminato, troviamo delle realtà molto variegate: in alcune città il livello del salario compete con quello europeo e nord-americano (Hong Kong e Tokio, ad esempio); in altre (Jakarta e Bombay, ad esempio) il livello di questa variabile è molto basso e simile a quello dei paesi africani e sud-americani. Si esamini l output dei seguenti comandi: > ubs[d5 == 1, 1:8][order(X1[D5 == 1]), ] > ubs[d6 == 1, 1:8][order(X1[D6 == 1]), ] > ubs[d5 == 0 & D6 == 0, 1:8][order(X1[D5 == 0 & D6 == 0]), ]

9 In altri termini, la suddivisione per regione di appartenenza, nel campione esaminato, non discrimina nettamente delle realtà economiche distinte e quindi non appare in grado di fornire particolari spiegazioni sul comportamento della variabile risposta. Alla luce di queste considerazioni, possiamo ritenere che il modello (4) sia da ritenersi più adeguato del modello (2) (si osservi, inoltre, che la perdita di termini di varianza spiegata è trascurabile). 4. L equazione stimata è: con s 2 = = ŷ i = x 1,i x 4,i 5. Si tratta di analizzare i residui del modello a cui si è giunti, in modo analogo a quanto fatto nel punto A questa domanda si risponde saggiando il sistema di ipotesi H 0 : β 1 0 H 1 : β 1 < 0. Fissiamo un livello di significatività Il valore osservato della statistica test è t oss = Accetteremo l ipotesi nulla se toss > t 54,0.05. Il valore del quantile cercato si ottiene con il comando: > qt(0.05, 54) [1] Poiché 10.8 < , ad un livello di significatività 0.05 riteniamo che il valore atteso del logaritmo del prezzo di un Big Mac diminuisca al crescere del logaritmo del salario reale e, quindi, che l economista abbia ragione. 7. In fase di selezione delle variabili, abbiamo visto che, ad un livello di significatività 0.05, il logaritmo del numero di giorni di vacanza remunerati nell arco dell anno (X 3 ) non sembra influire sul logaritmo del prezzo di un Big Mac, quindi, sulla base dell informazione campionaria di cui disponiamo, non siamo d accordo con l economista. 8. A questa domanda si risponde saggiando il sistema di ipotesi H 0 : β 4 0 H 1 : β 4 > 0. Fissiamo un livello di significatività Il valore osservato della statistica test è t oss = Accetteremo l ipotesi nulla se toss < t 54,0.95. Il valore del quantile cercato si ottiene con il comando: > qt(0.95, 54) [1] Poiché 2.07 > , ad un livello di significatività 0.05 riteniamo che il valore atteso del logaritmo del prezzo di un Big Mac cresca al crescere del logaritmo del prezzo del pane e, quindi, che l economista abbia ragione.

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono

Dettagli

Verifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare

Verifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare Verifica di ipotesi sui coefficienti di regressione Per il momento supponiamo di muoverci nel contesto del modello gaussiano. Vogliamo capire se alcune nostre congetture sui coefficienti di regressione

Dettagli

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini Laboratorio di R - 3 a lezione Prof. Mauro Gasparini 1. Verifica di ipotesi: il test t di Student In R è disponibile la funzione t.test che effettua il test t di Student ad un campione, a due campioni

Dettagli

CAPITOLO 11 ANALISI DI REGRESSIONE

CAPITOLO 11 ANALISI DI REGRESSIONE VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

> cement <- read.table("i:/modelli/cement.dat", col.names=c("tempo", "resist")) > attach(cement)

> cement <- read.table(i:/modelli/cement.dat, col.names=c(tempo, resist)) > attach(cement) Laboratorio 6 Analisi dei residui 6.1 Analisi dei dati CEMENT.DAT I dati riportati nel file cement.dat si riferiscono ad uno studio sulla resistenza del cemento alla tensione. La resistenza dipende, tra

Dettagli

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

Validazione dei modelli Strumenti quantitativi per la gestione

Validazione dei modelli Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

Tema d esame del 15/02/12

Tema d esame del 15/02/12 Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012 Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo

Dettagli

Analisi Multivariata dei Dati. Regressione Multipla

Analisi Multivariata dei Dati. Regressione Multipla Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si

Dettagli

Modelli con predittori qualitativi e modelli con interazioni

Modelli con predittori qualitativi e modelli con interazioni Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari

Dettagli

Il modello di regressione

Il modello di regressione Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti

Dettagli

Giorno n. clienti di attesa

Giorno n. clienti di attesa Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa

Dettagli

ANALISI DELLA VARIANZA

ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Esercizio 1 Efficacia di un disinfettante I dati della Tabella 1 mostrano i conteggi relativi alla presenza o meno

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.

> d = alimentazione == benz > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2. A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 3 LA REGRESSIONE LINEARE ES. STUDIO RELAZIONE ALTEZZA - PESO Soggetto Altezza Peso A 174 75 B 166 63 C 173 70 D 171 71 E 168 68 F 167 68 G 165

Dettagli

Test per la correlazione lineare

Test per la correlazione lineare 10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche

Dettagli

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE Università degli Studi di Padova Facoltà di Scienze MM.FF.NN. Corso di Laurea Magistrale: Biologia Sanitaria/Biologia Molecolare Insegnamento: Statistica Applicata Docente: Prof.ssa Alessandra R. Brazzale

Dettagli

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A) Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,

Dettagli

Il metodo della regressione

Il metodo della regressione Il metodo della regressione Consideriamo il coefficiente beta di una semplice regressione lineare, cosa significa? È una differenza tra valori attesi Anche nel caso classico di variabile esplicativa continua

Dettagli

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice

Dettagli

STATISTICA. Esercizi vari

STATISTICA. Esercizi vari STATISTICA Esercizi vari Esercizio 5.6 p. 205 Variabile Coeff. Dev. std. Statistica t p-value Intercetta 23.384 1.592 14.691 0 Profondità -1.435 0.213-6.726 0 = 0.850 Esercizio 5.6 p. 205 Variabile Coeff.

Dettagli

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,

Dettagli

Introduzione alla Regressione Logistica

Introduzione alla Regressione Logistica Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Università degli Studi di Padova Facoltà di Scienze Politiche

Università degli Studi di Padova Facoltà di Scienze Politiche Università degli Studi di Padova Facoltà di Scienze Politiche STATISTICA Nuovo ordinamento Scienze Sociologiche Prof.ssa A. Dalla Valle Vecchio ordinamento Prova del 27/6/2007 (A) Cognome e nome: N. matricola:

Dettagli

Esercizio 2: voto e ore dedicate allo studio

Esercizio 2: voto e ore dedicate allo studio La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede

Dettagli

ANALISI MULTIVARIATA

ANALISI MULTIVARIATA ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la

Dettagli

Biostatistica Laurea Magistrale in Biologia. Risultati dell esame del 4 Luglio 2016

Biostatistica Laurea Magistrale in Biologia. Risultati dell esame del 4 Luglio 2016 Biostatistica Laurea Magistrale in Biologia Risultati dell esame del 4 Luglio 2016 Matricola Voto 700993 insufficiente 704922 18 715340 insufficiente 735222 27 738239 25 739494 24 739781 18 739983 29 751833

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12

Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12 Indice 1 Introduzione ai modelli lineari 2 2 Dataset 3 3 Il Modello 8 4 In pratica 12 41 Peso e percorrenza 12 1 Capitolo 1 Introduzione ai modelli lineari Quando si analizzano dei dati, spesso si vuole

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non

Dettagli

Dati campionari:media, varianza, bruchi

Dati campionari:media, varianza, bruchi Dati campionari:media, varianza, bruchi Un entomologo sta studiando un bruco divoratore di foglie; esaminando 300 foglie ha trovato presenti dei bruchi, secondo i numeri riportati nella seguente tabella:

Dettagli

Descrizione per la costruzione del modello di regressione

Descrizione per la costruzione del modello di regressione Descrizione per la costruzione del modello di regressione Formulazione delle Ipotesi Ricerca delle variabili esplicative Dati Modello Stima dei parametri Verifica Modello IL MODELLO DI REGRESSIONE LINEARE

Dettagli

Il modello lineare misto

Il modello lineare misto Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 15 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con

Dettagli

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()

Dettagli

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica. Matematica con Elementi di Statistica a.a. 2015/16 Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Prova di recupero di Probabilità e Statistica - A * 21/04/2006

Prova di recupero di Probabilità e Statistica - A * 21/04/2006 Prova di recupero di Probabilità e Statistica - A * /04/006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore. Per conseguire la patente di guida, un

Dettagli

La matrice delle correlazioni è la seguente:

La matrice delle correlazioni è la seguente: Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Parità del potere d'acquisto - è vera?

Parità del potere d'acquisto - è vera? Parità del potere d'acquisto - è vera? Il principio della parità del potere d'acquisto (PPP) aerma che nel lungo periodo i tassi di cambio tendono a riprodurre le dierenze nel tasso di inazione tra le

Dettagli

Introduzione all Analisi della Varianza (ANOVA)

Introduzione all Analisi della Varianza (ANOVA) Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Stima dei parametri di modelli lineari

Stima dei parametri di modelli lineari Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle

Dettagli

Caratterizzazione dei consumi energetici (parte 3)

Caratterizzazione dei consumi energetici (parte 3) ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale

Dettagli

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa

Dettagli

Applicazioni statistiche e utilizzo del package statistico Spss - 7

Applicazioni statistiche e utilizzo del package statistico Spss - 7 Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html

Dettagli

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 4. STATISTICA DESCRITTIVA ESERCIZI Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200

Dettagli

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale

Dettagli

Metodi di regressione multivariata

Metodi di regressione multivariata Metodi di regressione multivariata Modellamento dei dati per risposte quantitative I metodi di regressione multivariata sono strumenti utilizzati per ricercare relazioni funzionali quantitative tra un

Dettagli

Variabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1

Variabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1 Modelli lineari Come motivazione di ciò che stiamo per fare, pensiamo ai dati indicatori_benessere.txt. Quando li abbiamo esaminati nella lezione 1 tramite la rappresentazione nel piano delle componenti

Dettagli

Principi di analisi causale Lezione 3

Principi di analisi causale Lezione 3 Anno accademico 2007/08 Principi di analisi causale Lezione 3 Docente: prof. Maurizio Pisati Approccio causale Nella maggior parte dei casi i ricercatori sociali utilizzano la regressione per stimare l

Dettagli

ESERCITAZIONE IV - Soluzioni

ESERCITAZIONE IV - Soluzioni umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare

Dettagli