0.1 Percorrenza e Cilindrata
|
|
- Carmelo Poletti
- 7 anni fa
- Visualizzazioni
Transcript
1 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs, che sembra esistere anche una forte relazione tra la percorrenza urbana e cilindrata, relazione che non sembra affatto di tipo lineare: > auto = read.table("auto.dat", header = TRUE) > attach(auto) > plot(cilindrata, percorr.urbana, xlab = "Cilindrata (litri)", + ylab = "Percorrenza Urbana (Km/litro)") Percorrenza Urbana (Km/litro) Cilindrata (litri) 1
2 Si ha infatti che la correlazione tra i due valori è molto alta (in modulo): > cor(percorr.urbana, cilindrata) [1] Sembra quindi che la percorrenza non sia una funzione lineare della cilindrata ma bensì una funzione polinomiale, o meglio se poniamo la cilindrata uguale a x e la percorrenza uguale a y si ha in formule: y = β 0 + β 1 x + β 2 x β p 1 x p 1. Ora questa è sempre una funzione lineare nei parametri e quindi possiamo applicare le tecniche introdotte nella sezione precedente. Poniamo, ad esempio, p = 4 e x i = x i per i = 1,..., 3 y = β 0 + β 1 x + β 2 x 2 + β 3 x 3 + ɛ. Aggiungiamo inoltre la componente che riguarda l alimentazione: y = β 0 + β 1 x + β 2 x 2 + β 3 x 3 + β 4 I A ɛ. Per creare il modello in R dobbiamo scrivere > rel = percorr.urbana ~ cilindrata + I(cilindrata^2) + I(cilindrata^3) + + alimentazione > fit = lm(rel) > fit Call: lm(formula = rel) Coefficients: (Intercept) cilindrata I(cilindrata^2) I(cilindrata^3) alimentazionediesel
3 Facciamo attenzione alla sintassi: nella formula le variabili esplicative sono separate da un + e la funzione I() serve per far capire ad R che il simbolo + non è, in questo caso, una somma algebrica; perl alimentazione non è necessaria in quanto le sue variabili non sono di tipo numerico. Come al solito possiamo trarre maggiori informazioni utilizzando la funzione summary: > s.fit = summary(fit) > s.fit Call: lm(formula = rel) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-14 *** cilindrata ** I(cilindrata^2) I(cilindrata^3) alimentazionediesel e-12 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: 1.79 on 198 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 4 and 198 DF, p-value: < 2.2e-16 3
4 Vediamo ora graficamente come il polinomio di terzo grado ottenuto si adatta ai dati: > x <- seq(1, 5.5, length = 200) > beta <- coef(fit) > plot(cilindrata, percorr.urbana, xlab = "Cilindrata (litri)", + ylab = "Percorrenza Urbana (Km/litro)", type = "n") > points(cilindrata[d], percorr.urbana[d], col = 2, pch = 2) > points(cilindrata[!d], percorr.urbana[!d], col = 3, pch = 3) > legend(4, 20, pch = c(2, 3), col = c(2, 3), legend = c("benzina", + "diesel")) > lines(x, beta[1] + beta[2] * x + beta[3] * x^2 + beta[4] * x^3, + col = 2) > lines(x, beta[1] + beta[5] + beta[2] * x + beta[3] * x^2 + beta[4] * + x^3, col = 3) 4
5 Percorrenza Urbana (Km/litro) benzina diesel Cilindrata (litri) La curva per le macchine a benzina sembra adattarsi abbastanza bene ai dati corrispondenti a macchine di grossa cilindrata, ma le macchine di bassa cilindrata (sotto il litro e mezzo) hanno una percorrenza molto più alta da quella prevista dalla retta. Per quanto riguarda le macchine diesel ogni previsione per le macchine sopra i 3 litri di cilindrata è piuttosto inverosimile. Il modello e le sue applicazioni hanno senso se sono valide le ipotesi di omoschedasticità sopracitate. Per verificarle dobbiamo studiare il comportamento dei residui. Guardando l istogramma, che da un idea della distribuzione di un campione, è possibile vedere che c è una certa asimmetria nei residui e soprattuto non sembrano verificate le ipotesi di normalità 5
6 > hist(fit$res, prob = T, nclass = 20, xlab = "residui", ylab = "frequenze relative", + main = "Istogramma dei Residui", col = 2) > curve(dnorm(x, mean = mean(fit$res), sd = sd(fit$res)), add = T, + col = "green") Istogramma dei Residui frequenze relative residui Ci sono anche altre diagnostiche grafiche che ci permettono di verificare le ipotesi sui residui. Possiamo per esempio vedere se la varianza è davvero la stessa per tutte le osservazioni, confrontando i valori della percorrenza sulla curva stimata con i residui corrispondenti. Dal grafico si vede che al crescere della percorrenza aumentano i residui, cosa per altro già osservata in precedenza. Si possono inoltre confrontare anche i quantili teorici di una normale con i quantili campionari dei residui standardizzati. Se questi avessero distribuzione normale dovrebbero distribuirsi precisamente su una 6
7 retta mentre nel nostro caso vediamo che questo comportamento è vero solo per la parte centrale ovvero solo per valori medi. > par(mfrow = c(1, 2)) > plot(fit, which = 1) > plot(fit, which = 2) Residuals vs Fitted Normal Q Q plot Residuals Standardized residuals Fitted values Theoretical Quantiles Un altro utile strumento di analisi è l ANOVA, ovvero l analisi della varianza. Questo strumento ci permette di suddivere la variabilità totale presente nel modello nelle sue compoenti: > anova(fit) 7
8 Analysis of Variance Table Response: percorr.urbana Df Sum Sq Mean Sq F value Pr(>F) cilindrata < 2.2e-16 *** I(cilindrata^2) e-07 *** I(cilindrata^3) alimentazione e-12 *** Residuals Signif. codes: 0 *** ** 0.01 * Osserviamo che il p-value della componente cubica è molto alto quindi non sembra molto significativa. Lo stesso risultato si può ottenere confranto il modello senza la componente cubica con quello appena costruito: > fit2 = lm(percorr.urbana ~ cilindrata + I(cilindrata^2) + alimentazione) > anova(fit2, fit) Analysis of Variance Table Model 1: percorr.urbana ~ cilindrata + I(cilindrata^2) + alimentazione Model 2: percorr.urbana ~ cilindrata + I(cilindrata^2) + I(cilindrata^3) + alimentazione Res.Df RSS Df Sum of Sq F Pr(>F) Inoltre il valore R 2 è praticamente lo stesso: > summary(fit)$r.sq 8
9 [1] > summary(fit2)$r.sq [1] Vediamo graficamente come si comporta il polinomio di secondo grado. Percorrenza Urbana (Km/litro) benzina diesel Cilindrata (litri) Vediamo che anche se la componente di terzo grado non era significativa la curva senza di essa ha un comportamento del tutto irreale. Non è infatti possibile che per cilindrate molto alte il comportamento della percorrenza migliori! 9
> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.
A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.
DettagliRegressione. Monica Marabelli. 15 Gennaio 2016
Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione
DettagliLABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE
LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare
DettagliAntonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR
Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliAnalisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura
Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono
DettagliLABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:
esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliEsercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.
Esercizio 8 La Swiss Economic Research della Union Bank of Switzerland conduce un controllo periodico dei livelli dei prezzi e dei salari nella principali città del mondo. Una delle variabili rilevate
DettagliIndice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12
Indice 1 Introduzione ai modelli lineari 2 2 Dataset 3 3 Il Modello 8 4 In pratica 12 41 Peso e percorrenza 12 1 Capitolo 1 Introduzione ai modelli lineari Quando si analizzano dei dati, spesso si vuole
DettagliStima dei parametri di modelli lineari
Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle
DettagliFac-simile prova di esame
UNIVERSITÀ CA FOSCARI DI VENEZIA FACOLTÀ DI ECONOMIA Statistica Computazionale I Prof. Stefano Tonellato COGNOME.................................... NOME.................................... MATRICOLA....................................
DettagliEsercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate
Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0
DettagliVARIETÀ. zona geografica A B C D
Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore
DettagliEsercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017
Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull
DettagliANALISI DELLA VARIANZA
ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
DettagliLaboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)
Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola
DettagliEsercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza
Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE
Università degli Studi di Padova Facoltà di Scienze MM.FF.NN. Corso di Laurea Magistrale: Biologia Sanitaria/Biologia Molecolare Insegnamento: Statistica Applicata Docente: Prof.ssa Alessandra R. Brazzale
DettagliLABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA
DettagliLivello di esposizione. animale Basso Moderato Alto
Esercizio -Esempio 1 (anova 2 vie con blocchi) I tassi respiratori (ispirazioni al minuto) sono stati misurati in otto animali usati per un esperimento, con tre livelli di esposizione al monossido di carbonio.
DettagliModelli non lineari. Strumenti quantitativi per la gestione
Modelli non lineari Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/7_gam.html#(5) 1/54 Metodi per affrontare problemi nonlineari Regressione
DettagliModelli non lineari Strumenti quantitativi per la gestione
Modelli non lineari Strumenti quantitativi per la gestione Emanuele Taufer Metodi per affrontare problemi non lineari Regressione polinomiale Esempio: modellare i picchi di domanda di energia Fattori che
Dettagli1. Esistono differenze nella resistenza tra le varie marche?
Laboratorio 10 Analisi della varianza 10.1 Analisi del dataset STURDY.DAT I dati riportati nel file sturdy.dat si riferiscono ad un esperimento effettuato per studiare la resistenza allo strappo di diverse
Dettagli> cement <- read.table("i:/modelli/cement.dat", col.names=c("tempo", "resist")) > attach(cement)
Laboratorio 6 Analisi dei residui 6.1 Analisi dei dati CEMENT.DAT I dati riportati nel file cement.dat si riferiscono ad uno studio sulla resistenza del cemento alla tensione. La resistenza dipende, tra
DettagliLaboratorio di R - 3 a lezione Prof. Mauro Gasparini
Laboratorio di R - 3 a lezione Prof. Mauro Gasparini 1. Verifica di ipotesi: il test t di Student In R è disponibile la funzione t.test che effettua il test t di Student ad un campione, a due campioni
DettagliVerifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare
Verifica di ipotesi sui coefficienti di regressione Per il momento supponiamo di muoverci nel contesto del modello gaussiano. Vogliamo capire se alcune nostre congetture sui coefficienti di regressione
DettagliCAPITOLO 5 Introduzione ai piani fattoriali
Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliRegressione lineare multipla Strumenti quantitativi per la gestione
Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data
DettagliValidazione dei modelli Strumenti quantitativi per la gestione
Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliEsercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo
Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate
DettagliParità del potere d'acquisto - è vera?
Parità del potere d'acquisto - è vera? Il principio della parità del potere d'acquisto (PPP) aerma che nel lungo periodo i tassi di cambio tendono a riprodurre le dierenze nel tasso di inazione tra le
DettagliModelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione
Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 8: 27-05-2004
esercitazione 8 p. 1/8 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 8: 27-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliRegressione lineare semplice
Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliIl BOOM degli ascolti dei programmi culinari. ha inciso sulle iscrizioni all istituto alberghiero???
Il BOOM degli ascolti dei programmi culinari ha inciso sulle iscrizioni all istituto alberghiero??? 60000 50000 40000 30000 20000 10000 0 2007 2008 2009 2010 2011 2012 2013 2014 gli ingredienti sono: Anno
DettagliCovarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
DettagliAnalisi della varianza (anova) a due vie: parcelle di diverse dimensioni
Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni Andrea Onofri 31 gennaio 2012 Indice 1 Motivazioni dei disegni a split-plot 1 2 Calcolo dell ANOVA a split-plot 4 2.1 SED, confronti
DettagliModelli con predittori qualitativi e modelli con interazioni
Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari
DettagliModelli che spiegano l attività fotosintetica alla luce di parametri fisiologici della vegetazione. Dr. Alessandro Ferrarini
Modelli che spiegano l attività fotosintetica alla luce di parametri fisiologici della vegetazione Dr. Alessandro Ferrarini variabile dipendente: NDVI (indice di attività fotosintetica) variabili indipendenti:
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliRICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare
DettagliEsercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:
Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200
DettagliDAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI
DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html
DettagliConfronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23
Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta
DettagliRegressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141
Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel
DettagliIntroduzione alla Regressione Logistica
Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti
DettagliEsercizi di ripasso. Monica Marabelli. 22 Gennaio 2016
Esercizi di ripasso Monica Marabelli 22 Gennaio 2016 Esercizio 1 Tre diverse diete sono state testate per valutare la loro efficacia nel determinare una diminuzione di peso. Verifica se almeno una delle
DettagliII ESERCITAZIONE ESERCIZIO
II ESERCITAZIONE ESERCIZIO 1 Quale percentuale di osservazioni sotto la curva normale standardizzata cade nell'intervallo compreso tra i valori z=-1 e z=+1? a) 66% circa b) 70,2% circa c) 68,2% circa d)
DettagliESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
DettagliRelazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un altra qualitativa o discreta.
Relazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un altra qualitativa o discreta. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada
DettagliInferenza statistica Donata Rodi 04/10/2016
Inferenza statistica Donata Rodi 04/10/2016 Popolazione Campionamento Campione Parametri Inferenza Statistiche µ, ϭ 2 descrittive Stima X, s 2 Quale test? Parametrico o no Scala di misura 1 gruppo 2 gruppi
DettagliProva scritta di Affidabilità dei sistemi e controllo statistico di qualità
Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità 18 Febbraio 2016 1. La probabilità di errore nella trasmissione di una cifra binaria attraverso un certo canale di comunicazione
DettagliIl modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
DettagliLaboratorio di Statistica Aziendale Modello di regressione lineare semplice
Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto michela.pasetto2@unibo.it Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa
DettagliESERCIZI 1) A fianco sono riportati i risultati di due rilevazioni quantitative su 10 elementi. Per questi dati si ha: 10
ESERCIZI 1) A fianco sono riportati i risultati di due rilevazioni quantitative su elementi. Per questi dati si ha: x i = 1 y i = 1 x y i = 1 i = 6514 i i = 1 i = 1 i = 281627 x y 2 i 2 i = 18629 = 62260
Dettagli> RSS <- c(rs,ss) Per avere un idea di come sono distribuiti i dati (simmetria, dispersione... ):
Laboratorio 7 Test t di Student 7.1 Analisi del dataset FRUITFLY.DAT I dati fruitfly.dat si riferiscono alla fecondità dei moschini della frutta, valutata come numero medio giornaliero di uova prodotte
DettagliL equivalente notazione si può esprimere in forma matriciale (o compatta) come segue: y=bx+
Eteroschedasticita Concetti teorici Poiché lo studio di molti modelli di regressione implica la conoscenza dei concetti di eteroschedasticità o varianza non costante degli errori è necessario svolgere
DettagliEsercizio 4 (Regressione multipla)
Esercizio (Regressione multipla) DATI Il data set employee.sav (o employee.xls; fonte SPSS) contiene 7 dati relativi agli impiegati di un azienda. Le variabili sono ID Employee Code BDATE Date of Birth
DettagliLABORATORIO DI PROBABILITA E STATISTICA
LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 3 LA REGRESSIONE LINEARE ES. STUDIO RELAZIONE ALTEZZA - PESO Soggetto Altezza Peso A 174 75 B 166 63 C 173 70 D 171 71 E 168 68 F 167 68 G 165
DettagliContrasti e confronti multipli
Contrasti e confronti multipli Andrea Onofri 25 gennaio 2012 Indice 1 Introduzione 1 2 I contrasti pianificati 2 Test di confronto multiplo 4 4 Limitazione delle MCP 5 5 Scegliere la MCP 7 Sommario Scopo
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliREGRESSIONE LINEARE SEMPLICE
REGRESSIONE LINEARE SEMPLICE Legacy Edition Copyright 25 ottobre 2012 Luca La Rocca luca.larocca@unimore.it UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Indice 2 Previsione di un carattere quantitativo
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliUniversità di Padova
Università di Padova Dipartimento di Tecnica e Gestione dei sistemi industriali Corso di Laurea Specialistica in Ingegneria Civile Elaborato di analisi statistica a.a. 5-6 Prof. L. Salmaso Dott. L. Corain
DettagliLezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliConfronto tra più di due campioni
Confronto tra più di due campioni La matrice dei dati Quando si esaminano più di due popolazioni, le informazioni sono u- sualmente organizzate sotto forma di matrice.,,, n ( ω ω ω ) 1 2 Pino, Maria,,Giacomo
DettagliStatistica economica
Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati
DettagliStatistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
- metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si
Dettagli> Ciliegi <- read.table("i:/modelli/cherry.dat", + col.names=c( diametro, altezza, volume ))
Laboratorio 2 Modello lineare semplice 2.1 Analisi dei dati CHERRY.DAT Riprendiamo l insieme di dati Ciliegi della precedente lezione. Se non era stato salvato, bisogna rileggerlo da file: > Ciliegi
DettagliProva scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)
Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliANOVA 2. Monica Marabelli. 15 Gennaio 2016
ANOVA 2 Monica Marabelli 15 Gennaio 2016 ANOVA a una via Nella scorsa esercitazione abbiamo visto che nell Analisi della Varianza (ANOVA) si considerano le medie di una variabile dipendente (quantitativa)
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliMODELLI LINEARI E NON LINEARI IN R
MODELLI LINEARI E NON LINEARI IN R Angelo M. Mineo Dipartimento di Scienze Statistiche e Matematiche S. Vianelli Università degli Studi di Palermo Copyright 2008 Angelo M. Mineo. All rights reserved. i
DettagliEsempio 1 (Regressione semplice, punti influenti, regressione multipla, multicollinearità)
Esempio (Regressione semplice, punti influenti, regressione multipla, multicollinearità) DATI Il data set cigarettes.sav (fonte http://www.amstat.org/publications/jse/jse_data_archive.html) contiene dati
DettagliUlteriori conoscenze di informatica Elementi di statistica Esercitazione3
Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##
DettagliRegressione lineare multipla
Scopo Vogliamo porre in relazione la variabile risposta, Y con k, k > 1, variabili esplicative (o regressori, o predittori, o covariate): X1, X2..., Xk. Funzione di regressione E(Y X1 = x1, X2 = x2,...,
DettagliAnalisi Univariata e Multivariata degli indici ricavati dai dati rilevati tramite Multiplex
Sviluppo di reti probabilistiche di supporto alle decisioni in viticoltura ed enologia Analisi Univariata e Multivariata degli indici ricavati dai dati rilevati tramite Multiplex Federico M. Stefanini
DettagliAnalisi della regressione
Analisi della regressione L analisi della regressioneè una tecnica statistica per modellare e investigare le relazioni tra due (o più) variabili. Nella tavola è riportata la % di purezza di ossigeno, rilasciata
DettagliCAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati
Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati Metodi statistici e probabilistici per l ingegneria Corso
DettagliFasi del modello di regressione
Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori
DettagliCorso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio
Corso di Laurea: Diritto per le Imprese e le istituzioni a.a. 2016-17 Statistica Statistica Descrittiva 3 Esercizi: 5, 6 Docente: Alessandra Durio 1 Contenuti I quantili nel caso dei dati raccolti in classi
Dettaglistima per intervallo
stima per intervallo intervalli di fiducia confidence interval una affermazione come questa: CI(95%): lim inf < µ < lim sup p = 0.95 che la media della popolazione sia compresa nell intervallo fra lim
DettagliRegressione multipla
Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione
DettagliMetodi di regressione multivariata
Metodi di regressione multivariata Modellamento dei dati per risposte quantitative I metodi di regressione multivariata sono strumenti utilizzati per ricercare relazioni funzionali quantitative tra un
DettagliLa previsione delle vendite dei lm
La previsione delle vendite dei lm L'industria cinematograca è un business con un alto prolo e un'elevata variabilità nei ricavi. Nel 2005, gli americani hanno speso 8.8 miliardi di dollari di biglietti
DettagliAnalisi della Varianza Fattoriale
Analisi della Varianza Fattoriale AMD Marcello Gallucci marcello.gallucci@unimib.it Ripasso dell ANOVA Lo studio degli effetti di una serie di variabili indipendenti nominale (gruppi) su un variabile dipendente
DettagliLaboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
DettagliRestrizioni lineari nel MRLM: esempi
Restrizioni lineari nel MRLM: esempi Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Restrizioni lineari: esempi Econometria - 2013 1 / 22 Funzione di produzione Cobb-Douglas Esempio GDP
DettagliLa multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.
Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3
DettagliMisure Ripetute. Partizione della Varianza. Marcello Gallucci
Misure Ripetute Partizione della Varianza Marcello Gallucci GLM l ANOVA a misure ripetute rappresenta un caso del modello lineare generale in cui la variabilità non è valutata tra gruppi ma tra misure
Dettagli