Statistiche di sintesi

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Statistiche di sintesi"

Transcript

1 Esercizio 2 E stato condotto uno studio per valutare la variazione della pressione sistolica in funzione dell etá. I dati sono riportati nel file sbp.xls. Effettua un analisi di regressione e disegna gli opportuni grafici.

2 Leggiamo i dati press <- read.table (file="sbp.csv", header=t, sep=",", dec=".") head(press) i age sbp

3 Statistiche di sintesi str(press) data.frame : 30 obs. of 3 variables: $ i : int $ age: int $ sbp: int summary(press) i Min. : st Qu. : 8.25 Median :15.50 Mean : rd Qu. :22.75 Max. :30.00 age Min. : st Qu. :36.75 Median :45.50 Mean : rd Qu. :56.00 Max. :69.00 sbp Min. : st Qu. : Median : Mean : rd Qu. : Max. : 220.0

4 Visualizziamo i dati graficamente dev.off() # Per chiudere l ultima finestra grafica aperta null device 1 plot(press$age, press$sbp)

5 Analisi di regressione fit2 <- lm(sbp~age, data=press) summary(fit2) Call: lm(formula = sbp ~ age, data = press) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-10 *** age e-05 *** Signif. codes: 0 `*** `** 0.01 `* 0.05 `. 0.1 ` 1 Residual standard error: on 28 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 28 DF, p-value: 7.867e-05

6 Analisi dell output L intercetta α = 98.7 Il coefficiente β = 0.9 corrisponde alla pendenza della retta. La regressione é significativa (P value = 7.87e-05). In questo modello, l etá spiega circa il 43% della variabilitá della pressione sistolica (R 2 ).

7 Rappresentazione grafica Disegniamo la retta di regressione su un grafico plot(press$age, press$sbp) lines(press$age,fitted(fit2),col="red")

8 Check del modello Disegniamo i grafici per valutare la bontá del modello par(mfrow=c(2,2)) plot(fit2)

9 Esercizio 3 (Tratto da Weintraub, 1962) E stato condotto uno studio per valutare il tasso di natalitá e di mortalitá infantile in relazione allo sviluppo economico negli anni 50. I dati sono nel file farm.csv. Effettua un analisi di regressione e disegna gli opportuni grafici.

10 Leggiamo i dati setwd("y:/statistica") dati <- read.table (file="farm.csv", header=t, sep=",", dec=".") head(dati) Nation Birth_rate Income farm_proportion infant_mort_rate 1 Venezuela Mexico Ecuador Colombia Ceylon Puerto Rico

11 Statistiche di sintesi str(dati) data.frame : 30 obs. of 5 variables: $ Nation : Factor w/ 30 levels "Argentina","Australia",..: $ Birth_rate : num $ Income : int $ farm_proportion : num $ infant_mort_rate: num summary(dati) Nation Argentina : 1 Australia : 1 Austria : 1 Belgium : 1 Canada : 1 Ceylon : 1 (Other) :24 Birth_rate Min. : st Qu. :18.15 Median :21.45 Mean : rd Qu. :27.40 Max. :46.40

12 Analisi del tasso di natalitá dev.off() null device 1 plot(dati$income, dati$birth_rate)

13 Analisi del tasso di natalitá mod1 <- lm(birth_rate~income, data=dati) summary(mod1) Call: lm(formula = Birth_rate ~ Income, data = dati) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-11 *** Income * Signif. codes: 0 `*** `** 0.01 `* 0.05 `. 0.1 ` 1 Residual standard error: 8.85 on 28 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 28 DF, p-value:

14 Analisi dell output L intercetta α = 30.2 Il coefficiente β = 0.01 La regressione é significativa per α = 0.05 (P value = ). In questo modello, la variabile esplicativa (le entrate del Paese) spiega circa il 17% della variabilitá del tasso di natalitá (R 2 ).

15 Rappresentazione grafica Disegniamo la retta di regressione su un grafico lines(dati$income,fitted(mod1),col="red")

16 Check del modello Disegniamo i grafici per valutare la bontá del modello par(mfrow=c(2,2)) plot(mod1)

17 Analisi del tasso di mortalitá dev.off() null device 1 plot(dati$income, dati$infant_mort_rate)

18 Analisi del tasso di mortalitá mod2 <- lm(infant_mort_rate~income, data=dati) summary(mod2) Call: lm(formula = infant_mort_rate ~ Income, data = dati) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-13 *** Income e-06 *** Signif. codes: 0 `*** `** 0.01 `* 0.05 `. 0.1 ` 1 Residual standard error: on 28 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 28 DF, p-value: 2.282e-06

19 Analisi dell output L intercetta α = 82.5 Il coefficiente β = 0.05 La regressione é significativa (P value = 2.28e-06). In questo modello, la variabile esplicativa (le entrate del Paese) spiega circa il 55% della variabilitá del tasso di mortalitá (R 2 ).

20 Rappresentazione grafica Disegniamo la retta di regressione su un grafico lines(dati$income,fitted(mod2),col="red")

21 Check del modello Disegniamo i grafici per valutare la bontá del modello par(mfrow=c(2,2)) plot(mod2)

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

Esercizi di ripasso. Monica Marabelli. 22 Gennaio 2016

Esercizi di ripasso. Monica Marabelli. 22 Gennaio 2016 Esercizi di ripasso Monica Marabelli 22 Gennaio 2016 Esercizio 1 Tre diverse diete sono state testate per valutare la loro efficacia nel determinare una diminuzione di peso. Verifica se almeno una delle

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare

Dettagli

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Passo 1: Leggere il file di input (il file si trova a questo indirizzo: https://fvidoli.weebly.com/uploads/2/3/0/8/ 23088460/dati_medici.csv),

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente

Dettagli

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0

Dettagli

ANOVA 2. Monica Marabelli. 15 Gennaio 2016

ANOVA 2. Monica Marabelli. 15 Gennaio 2016 ANOVA 2 Monica Marabelli 15 Gennaio 2016 ANOVA a una via Nella scorsa esercitazione abbiamo visto che nell Analisi della Varianza (ANOVA) si considerano le medie di una variabile dipendente (quantitativa)

Dettagli

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare

Dettagli

Validazione dei modelli Strumenti quantitativi per la gestione

Validazione dei modelli Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono

Dettagli

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare

Dettagli

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) 1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) Riprendiamo l esempio X = seq(-5,5,0.01) Y= dnorm(x) plot(x,y) Si poteva automatizzare la scelta delle X ponendo: X=rnorm(1000)

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE Università degli Studi di Padova Facoltà di Scienze MM.FF.NN. Corso di Laurea Magistrale: Biologia Sanitaria/Biologia Molecolare Insegnamento: Statistica Applicata Docente: Prof.ssa Alessandra R. Brazzale

Dettagli

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione

Dettagli

Regressione lineare semplice. Strumenti quantitativi per la gestione

Regressione lineare semplice. Strumenti quantitativi per la gestione Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html#(1) 1/33 Regressione lineare (RL) La RL è uno degli

Dettagli

Analisi della varianza a due fattori

Analisi della varianza a due fattori Laboratorio 11 Analisi della varianza a due fattori 11.1 Analisi del dataset PENICILLIN.DAT I dati contenuti nel file penicillin.dat, si riferiscono ad un esperimento di produzione di penicillina tendente

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice

Dettagli

INTRODUZIONE A R Lezione 4

INTRODUZIONE A R Lezione 4 INTRODUZIONE A R Lezione 4 Silvia Bacci e Silvia Pandolfi 1 La regressione lineare 1.1 Regressioni lineare semplice Per applicare il metodo di regressione lineare scegliamo il dataset cars relativo alle

Dettagli

> cement <- read.table("i:/modelli/cement.dat", col.names=c("tempo", "resist")) > attach(cement)

> cement <- read.table(i:/modelli/cement.dat, col.names=c(tempo, resist)) > attach(cement) Laboratorio 6 Analisi dei residui 6.1 Analisi dei dati CEMENT.DAT I dati riportati nel file cement.dat si riferiscono ad uno studio sulla resistenza del cemento alla tensione. La resistenza dipende, tra

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico ) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 05-6) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare

Dettagli

Regressione lineare multipla Strumenti quantitativi per la gestione

Regressione lineare multipla Strumenti quantitativi per la gestione Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA

Dettagli

Laboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT

Laboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT Laboratorio 8 Regressione multipla 8.1 Analisi del dataset HOOK.DAT I dati contenuti nel file hook.dat, raccolti da Joseph Hooker sulle montagne dell Himalaya, riportano le temperature di ebollizione dell

Dettagli

ANOVA 2. Silvia Parolo. January 16, 2015

ANOVA 2. Silvia Parolo. January 16, 2015 ANOVA 2 Silvia Parolo January 16, 2015 Verifica degli assunti normalità dei residui entro gruppi omoschedasticità dei residui entro gruppi indipendenza dei residui entro gruppi Esempio è stato condotto

Dettagli

Modelli con predittori qualitativi e modelli con interazioni

Modelli con predittori qualitativi e modelli con interazioni Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari

Dettagli

Fac-simile prova di esame

Fac-simile prova di esame UNIVERSITÀ CA FOSCARI DI VENEZIA FACOLTÀ DI ECONOMIA Statistica Computazionale I Prof. Stefano Tonellato COGNOME.................................... NOME.................................... MATRICOLA....................................

Dettagli

Modelli non lineari e cross validazione. Strumenti quantitativi per la gestione

Modelli non lineari e cross validazione. Strumenti quantitativi per la gestione Modelli non lineari e cross validazione Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l3-temperature_max.html#(24) 1/28 Metodi

Dettagli

> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.

> d = alimentazione == benz > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2. A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.

Dettagli

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 3 LA REGRESSIONE LINEARE ES. STUDIO RELAZIONE ALTEZZA - PESO Soggetto Altezza Peso A 174 75 B 166 63 C 173 70 D 171 71 E 168 68 F 167 68 G 165

Dettagli

Parità del potere d'acquisto - è vera?

Parità del potere d'acquisto - è vera? Parità del potere d'acquisto - è vera? Il principio della parità del potere d'acquisto (PPP) aerma che nel lungo periodo i tassi di cambio tendono a riprodurre le dierenze nel tasso di inazione tra le

Dettagli

VARIETÀ. zona geografica A B C D

VARIETÀ. zona geografica A B C D Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore

Dettagli

ESERCITAZIONE REGRESSIONE MULTIPLA

ESERCITAZIONE REGRESSIONE MULTIPLA ESERCITAZIONE REGRESSIONE MULTIPLA Dati delle Nazioni Unite del 2005 riferiti, per diverse nazioni, al tasso di feconditá (bambini per donna) (variabile Fert), alla percentuale di donne che usa contraccettivi

Dettagli

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette

Dettagli

Statistica 1- parte II

Statistica 1- parte II Statistica 1- parte II Esercitazione 5 Dott.ssa Antonella Costanzo 10/03/016 Esercizio 1. Analisi della varianza - ANOVA Per confrontare l efficacia di tre diete (A, B, C) si sono scelti 30 individui con

Dettagli

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini Laboratorio di R - 3 a lezione Prof. Mauro Gasparini 1. Verifica di ipotesi: il test t di Student In R è disponibile la funzione t.test che effettua il test t di Student ad un campione, a due campioni

Dettagli

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud. Esercizio 8 La Swiss Economic Research della Union Bank of Switzerland conduce un controllo periodico dei livelli dei prezzi e dei salari nella principali città del mondo. Una delle variabili rilevate

Dettagli

Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12

Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12 Indice 1 Introduzione ai modelli lineari 2 2 Dataset 3 3 Il Modello 8 4 In pratica 12 41 Peso e percorrenza 12 1 Capitolo 1 Introduzione ai modelli lineari Quando si analizzano dei dati, spesso si vuole

Dettagli

Analisi della regressione

Analisi della regressione Analisi della regressione L analisi della regressioneè una tecnica statistica per modellare e investigare le relazioni tra due (o più) variabili. Nella tavola è riportata la % di purezza di ossigeno, rilasciata

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html

Dettagli

Introduzione alla Regressione Logistica

Introduzione alla Regressione Logistica Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti

Dettagli

1. Esistono differenze nella resistenza tra le varie marche?

1. Esistono differenze nella resistenza tra le varie marche? Laboratorio 10 Analisi della varianza 10.1 Analisi del dataset STURDY.DAT I dati riportati nel file sturdy.dat si riferiscono ad un esperimento effettuato per studiare la resistenza allo strappo di diverse

Dettagli

Modelli statistici: sessione 1

Modelli statistici: sessione 1 Modelli statistici: sessione 1 Francesco Lagona Università Roma Tre 1 R ed R Studio IDE R è un ambiente costituito da oggetti e librerie di comandi per la gestione e l analisi di dati statistici. R è disponibile

Dettagli

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità 1. a) La funzione di affidabilità è: Soluzioni 28 Gennaio 2016 = = 4. b) La probabilità che il sistema si guasti tra 0.4 e 1.4

Dettagli

Esperimenti longitudinali e misure ripetute. Massimo Borelli. Motivazioni. Un esempio tipicamente biotec. Anova sbagliate Anova r.m.

Esperimenti longitudinali e misure ripetute. Massimo Borelli. Motivazioni. Un esempio tipicamente biotec. Anova sbagliate Anova r.m. May 14, 2014 Contenuti 1 2 il peso delle gemelle: 1 misura > alice = 73.6 > ellen = 73.8 Le gemelle hanno lo stesso peso? Alice è laureata in matematica Ellen è laureata in statistica il peso delle gemelle:

Dettagli

Esercitazione su outliers e osservazioni influenti

Esercitazione su outliers e osservazioni influenti Esercitazione su outliers e osservazioni influenti Quando si stima un modello di regressione è fondamentale identificare eventuali osservazioni influenti. Una osservazione si definisce influente se la

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Introduzione a R. Monica Marabelli. 30 Ottobre 2015

Introduzione a R. Monica Marabelli. 30 Ottobre 2015 Introduzione a R Monica Marabelli 30 Ottobre 2015 Cos é R? R é un programma utile per l analisi dei dati R puó essere utilizzato per: elaborare dati svolgere analisi statistiche effettuare rappresentazioni

Dettagli

Modelli non lineari. Strumenti quantitativi per la gestione

Modelli non lineari. Strumenti quantitativi per la gestione Modelli non lineari Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/7_gam.html#(5) 1/54 Metodi per affrontare problemi nonlineari Regressione

Dettagli

Modelli non lineari Strumenti quantitativi per la gestione

Modelli non lineari Strumenti quantitativi per la gestione Modelli non lineari Strumenti quantitativi per la gestione Emanuele Taufer Metodi per affrontare problemi non lineari Regressione polinomiale Esempio: modellare i picchi di domanda di energia Fattori che

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA VENDITE PC ESERCIZIO 1: La seguente tabella

Dettagli

prevedere y in funzione di x, per variabili linearmente associate

prevedere y in funzione di x, per variabili linearmente associate prevedere y in funzione di x, per variabili linearmente associate concetto di regressione idea di base se x e y sono associate, posso usare x per prevedere y (con una certa approssimazione) per farlo

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza

CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza Douglas C. Montgomery Progettazione e analisi degli esperimenti 006 McGraw-Hill CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza Metodi statistici e probabilistici per l ingegneria

Dettagli

INTRODUZIONE AI MODELLI LINEARI

INTRODUZIONE AI MODELLI LINEARI INTRODUZIONE AI MODELLI LINEARI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html Indice 1

Dettagli

Livello di esposizione. animale Basso Moderato Alto

Livello di esposizione. animale Basso Moderato Alto Esercizio -Esempio 1 (anova 2 vie con blocchi) I tassi respiratori (ispirazioni al minuto) sono stati misurati in otto animali usati per un esperimento, con tre livelli di esposizione al monossido di carbonio.

Dettagli

stima per intervallo

stima per intervallo stima per intervallo intervalli di fiducia confidence interval una affermazione come questa: CI(95%): lim inf < µ < lim sup p = 0.95 che la media della popolazione sia compresa nell intervallo fra lim

Dettagli

ESERCITAZIONE ANCOVA

ESERCITAZIONE ANCOVA ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono

Dettagli

STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno)

STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno) STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno) 1) ASSOCIAZIONE TRA DUE CARATTERI RISCHIO RELATIVO E ODDS RATIO In uno studio

Dettagli

AFFIDABILITA DEI SISTEMI E CONTROLLO STATISTICO DI QUALITA

AFFIDABILITA DEI SISTEMI E CONTROLLO STATISTICO DI QUALITA PROVA SCRITTA DI AFFIDABILITA DEI SISTEMI E CONTROLLO STATISTICO DI QUALITA 7 Marzo 2014 1.Si ha il seguente sistema di imballaggio di lattine di alluminio: C F A B D E G H A: Cupping (lamiera svolta e

Dettagli

R - base Emanuele Taufer

R - base Emanuele Taufer R - base Emanuele Taufer Contents Preliminari................................................. 1 Oggetti................................................... 1 Oggetti - 2.................................................

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I

Dettagli

INTRODUZIONE A R Lezione 2

INTRODUZIONE A R Lezione 2 INTRODUZIONE A R Lezione 2 Silvia Bacci e Silvia Pandolfi 1 Importare e esportare i dati Quando la mole di dati è sostanziosa l immissione da tastiera non è agevole. La situazione più comune è che i dati

Dettagli

I modelli lineari generalizzati: il modello di Poisson

I modelli lineari generalizzati: il modello di Poisson I modelli lineari generalizzati: il modello di Poisson Massimo Borelli May 13, 2014 Massimo Borelli () I modelli lineari generalizzati: il modello di Poisson May 13, 2014 1 / 15 Contenuti 1 Motivazioni

Dettagli

Test d ipotesi sulla media

Test d ipotesi sulla media Test d ipotesi sulla media Silvia Parolo 12 December 2014 Riassumendo l esercitazione precedente Nella lezione precedente abbiamo visto che la media campionaria può essere un buon stimatore del valore

Dettagli

ANALISI DELLA VARIANZA

ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di

Dettagli

A) COSTRUIRE LA FIGURA RELATIVA AL DIAGRAMMA DEL MODELLO (2 punti) B) CALCOLARE I GRADI DI LIBERTA' DEL MODELLO (2 punti)

A) COSTRUIRE LA FIGURA RELATIVA AL DIAGRAMMA DEL MODELLO (2 punti) B) CALCOLARE I GRADI DI LIBERTA' DEL MODELLO (2 punti) DATO IL SEGUENTE PROGRAMMA MPLUS TITLE: ESERCIZIO EX LISREL DATA: FILE IS EX34.DAT; TYPE IS CORRELATION; NOBSERVATION IS 145; VARIABLE: NAMES ARE X1-X6 Y1-Y3; MODEL: KSI1 BY X1-X3 ; KSI2 BY X4-X6 ; ETA1

Dettagli

Regressione lineare multipla

Regressione lineare multipla Scopo Vogliamo porre in relazione la variabile risposta, Y con k, k > 1, variabili esplicative (o regressori, o predittori, o covariate): X1, X2..., Xk. Funzione di regressione E(Y X1 = x1, X2 = x2,...,

Dettagli

UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE

UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE Corso di laurea triennale in Statistica e Gestione delle Imprese Tesi di laurea INFLAZIONE SALARIALE E DISOCCUPAZIONE: UNA VERIFICA EMPIRICA

Dettagli

Estratto dal Cap. 8 di: Statistics for Marketing and Consumer Research, M. Mazzocchi, ed. SAGE, 2008.

Estratto dal Cap. 8 di: Statistics for Marketing and Consumer Research, M. Mazzocchi, ed. SAGE, 2008. LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano BIVARIATE AND MULTIPLE REGRESSION Estratto dal Cap. 8 di: Statistics for Marketing and Consumer Research, M. Mazzocchi,

Dettagli

Introduzione a R. Silvia Parolo. 14 November 2014

Introduzione a R. Silvia Parolo. 14 November 2014 Introduzione a R Silvia Parolo 14 November 2014 Cos è R?? è un tool per l analisi di dati è anche un linguaggio di programmazione si può scaricare da http: // www. r-project. org/ primi passi in R R può

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

CAPITOLO 5 Introduzione ai piani fattoriali

CAPITOLO 5 Introduzione ai piani fattoriali Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria

Dettagli

Test d ipotesi sulla media

Test d ipotesi sulla media Test d ipotesi sulla media Monica Marabelli 4 Dicembre 2015 Riassumendo l esercitazione precedente Nella lezione precedente abbiamo visto che la media campionaria puó essere un buon stimatore del valore

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

CORSO EDAMI LE UNIVERSITÀ AMERICANE

CORSO EDAMI LE UNIVERSITÀ AMERICANE ORSO EMI LE UNIVERSITÀ MERINE Mario Romanazzi dicembre 06 Introduzione I dati di questo studio provengono dalla libreria del testo di riferimento del corso ata Mining for usiness Intelligence di G. Shmueli,

Dettagli

Il BOOM degli ascolti dei programmi culinari. ha inciso sulle iscrizioni all istituto alberghiero???

Il BOOM degli ascolti dei programmi culinari. ha inciso sulle iscrizioni all istituto alberghiero??? Il BOOM degli ascolti dei programmi culinari ha inciso sulle iscrizioni all istituto alberghiero??? 60000 50000 40000 30000 20000 10000 0 2007 2008 2009 2010 2011 2012 2013 2014 gli ingredienti sono: Anno

Dettagli

Esame Prototipo Statistica A-Di. Prof. M. Romanazzi

Esame Prototipo Statistica A-Di. Prof. M. Romanazzi 1 Università di Venezia Esame Prototipo Statistica A-Di Prof. M. Romanazzi Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di questa

Dettagli

Analisi discriminante in R. Strumenti quantitativi per la gestione

Analisi discriminante in R. Strumenti quantitativi per la gestione Analisi discriminante in R Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l4-lda.html#(1) 1/25 Default data Carichiamo il

Dettagli

In via preliminare, confrontiamo la distribuzione del peso del cuore nei due sessi.

In via preliminare, confrontiamo la distribuzione del peso del cuore nei due sessi. Laboratorio 12 Analisi della covarianza 12.1 Analisi del dataset CATS.DAT I dati contenuti nel file cats.dat presentano il peso del corpo ed il peso del cuore di alcuni gatti di sesso femminile (1) e maschile

Dettagli

Verifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare

Verifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare Verifica di ipotesi sui coefficienti di regressione Per il momento supponiamo di muoverci nel contesto del modello gaussiano. Vogliamo capire se alcune nostre congetture sui coefficienti di regressione

Dettagli

Stima dei parametri di modelli lineari

Stima dei parametri di modelli lineari Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141 Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel

Dettagli

Restrizioni lineari nel MRLM: esempi

Restrizioni lineari nel MRLM: esempi Restrizioni lineari nel MRLM: esempi Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Restrizioni lineari: esempi Econometria - 2013 1 / 22 Funzione di produzione Cobb-Douglas Esempio GDP

Dettagli

OLS multivariato: effetti parziali, multicollinearità

OLS multivariato: effetti parziali, multicollinearità OLS multivariato: effetti parziali, multicollinearità CONCETTI DA RECUPERARE Per stimare questo modello utilizziamo le seguenti variabili esplicative educ, exper e tenure Primo passo da compiere sarà quello

Dettagli

Prova scritta di Statistica Applicata alle Decisioni Aziendali Prof.ssa Conigliani -...

Prova scritta di Statistica Applicata alle Decisioni Aziendali Prof.ssa Conigliani -... Prova scritta di Statistica Applicata alle Decisioni Aziendali Prof.ssa Conigliani -... COGNOME:............................................................ NOME:.....................................................................

Dettagli

MODELLI RIDOTTI COME SI EFFETTUA IL TEST DI NULLITÀ DI UN SOTTOINSIEME DI COEFFICIENTI IN SAS

MODELLI RIDOTTI COME SI EFFETTUA IL TEST DI NULLITÀ DI UN SOTTOINSIEME DI COEFFICIENTI IN SAS MODELLI RIDOTTI COME SI EFFETTUA IL TEST DI NULLITÀ DI UN SOTTOINSIEME DI COEFFICIENTI IN SAS proc reg data=fitness; model Oxygen=Age Weight RunTime RunPulse RestPulse MaxPulse ; test Weight, RestPulse;

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 9 ESERCIZI DI RIPASSO FINALE (1 di 2) 1 - STATISTICA DESCRITTIVA

Dettagli

Simulazione della prova scritta di Statistica Applicata alle Decisioni Aziendali - Prof.ssa Conigliani

Simulazione della prova scritta di Statistica Applicata alle Decisioni Aziendali - Prof.ssa Conigliani Attenzione: da questi compiti sono stati rimossi gli esercizi che riguardano argomenti che dall a.a. 2015-2016 non sono piu in programma, come ad esempio il campionamento da popolazioni finite Simulazione

Dettagli