1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)

Documenti analoghi
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

LABORATORIO DI PROBABILITA E STATISTICA

Siete invitati a cambiare un po di parametri dell esercizio (es. aumentare Nrow; diminuire sig2; diminuire i coefficienti di X3 ed X4).

Word ha il vantaggio che possiamo salvare un po' di risultati, anche grafici

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018

Statistiche di sintesi

0.1 Percorrenza e Cilindrata

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

Regressione. Monica Marabelli. 15 Gennaio 2016

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

LABORATORIO DI PROBABILITA E STATISTICA

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Validazione dei modelli. Strumenti quantitativi per la gestione

Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area.

Regressione lineare semplice. Strumenti quantitativi per la gestione

LABORATORIO DI PROBABILITA E STATISTICA

Esercizio Dire quale variabile debba essere usata come regressore e quale sia la variabile risposta.

Regressione lineare semplice

Metodi statistici per la ricerca sociale ANOVA e ANCOVA in

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

Validazione dei modelli Strumenti quantitativi per la gestione

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione

Ancova: il modello lineare in generale

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

LABORATORIO DI PROBABILITA E STATISTICA

Modelli statistici: sessione 1

Laboratorio di Probabilità e Statistica

Ancora sulla regressione multipla

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )

Modelli con predittori qualitativi e modelli con interazioni

Laboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE

Modelli non lineari e cross validazione. Strumenti quantitativi per la gestione

Fallstudium 8 - Soluzioni Dr Giorgio Pioda 15 gennaio 2019

Analisi della varianza a due fattori

Fac-simile prova di esame

INTRODUZIONE AI MODELLI LINEARI

Introduzione alla Regressione Logistica

Scheda n. 13: modelli lineari

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] > sd(percorr.urbana[d]) [1] 2.

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

REGRESSIONE MULTIPLA E CORRELAZIONE. Nicola Tedesco (Statistica Sociale) REGRESSIONE MULTIPLA E CORRELAZIONE 1 / 16

ESERCITAZIONE REGRESSIONE MULTIPLA

Soluzione di alcuni esercizi di statistica con R

Analisi della regressione

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Esercitazione su outliers e osservazioni influenti

Ordinamento dati La funzione Ordina disponibile nel menù consente di ordinare la matrice dati in base alla variabile scelta

Verifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare

Anno 3 Equazione dell'ellisse

C I R C O N F E R E N Z A...

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

Parte I. Statistica descrittiva

Metodi e Modelli Matematici di Probabilità per la Gestione Prova scritta 15/12/2008 Compito A

Parità del potere d'acquisto - è vera?

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini

Università di Pavia Econometria Esercizi 5

Laboratorio di Probabilità e Statistica

> cement <- read.table("i:/modelli/cement.dat", col.names=c("tempo", "resist")) > attach(cement)

LABORATORIO DI PROBABILITA E STATISTICA

Statistica II Laurea magistrale in Ing. Gestionale a.a. 2012/13 Registro delle lezioni

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017

INTRODUZIONE A R Lezione 4

Esercitazione

1 Cambiamenti di riferimento nel piano

Statistica a breve termine: metodo delle onde apparenti

LABORATORIO DI PROBABILITA E STATISTICA

Esercizi di statistica

Capitolo 12 La regressione lineare semplice

12 gennaio Commenti esame di geometria - Ing. gestionale - a.a

Regressione lineare multipla Strumenti quantitativi per la gestione

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

Stima dei parametri di modelli lineari

1. GRAFICO DEI DUE R^2. Si riprenda l esercitazione del 19/10, relativa alla tabella IB. IB <- read.table ("clipboard", header=true)

Cambiamenti di riferimento nel piano

Esame Prototipo Statistica A-Di. Prof. M. Romanazzi

12) Metodo dei minimi quadrati e linea di tendenza

x + 2y = 3 3x + 4y = 7 ; v 2 = Determinare x ed y in modo tale che si abbia x v 1 + y v 2 = v 3. (c) Sia A la matrice ( 1

STATISTICA LAB. Analisi dei dati con R - Ex 2. Marta Nai Ruscone. LIUC - Università Carlo Cattaneo, Castellanza STATISTICA LAB

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Esperimenti longitudinali e misure ripetute. Massimo Borelli. Motivazioni. Un esempio tipicamente biotec. Anova sbagliate Anova r.m.

Statistica 1- parte II

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

I. Foglio di esercizi su vettori linearmente dipendenti e linearmente indipendenti. , v 2 = α v 1 + β v 2 + γ v 3. α v 1 + β v 2 + γ v 3 = 0. + γ.

Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Introduzione alla regressione multipla. Giovanni Battista Flebus Lezioni di psicometria

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti

Excel: parte II. Davide Sardina

Transcript:

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) Riprendiamo l esempio X = seq(-5,5,0.01) Y= dnorm(x) plot(x,y) Si poteva automatizzare la scelta delle X ponendo: X=rnorm(1000) Y= dnorm(x) plot(x,y) Aggiungiamo gli assi al grafico: lines(c(-5,5),c(0,0),lwd=2) lines(c(0,0),c(-0.1,0.5)) Analogamente, invece dei comandi: Z = rnorm(10000) hist(z,50,false) X = seq(-5,5,0.01) Y= dnorm(x,mean(z),sd(z)) lines(x,y,col ="red") si può automatizzare con: Z0 = rnorm(10000); Z=sort(Z0) hist(z,50,false) Y= dnorm(z,mean(z),sd(z)) lines(z,y,col ="red") Invece provare cosa succede senza il sort:

Z = rnorm(10000) hist(z,50,false) Y= dnorm(z,mean(z),sd(z)) lines(z,y,col ="red") 2. CARICAMENTO DI VETTORI E TABELLE Supponiamo di avere un vettore di numeri scritto su un foglio come questo: 1.67 1.78 1.78 1.84 1.82 1.80 e supponiamo di volerlo caricare in R. Si opera così: a) Scrivere (o copiare) su R il comando X <- scan("clipboard") senza dare d invio. b) Andare sul foglio dove c è il vettore, selezionarlo e fare copia c) Tornare col cursore su R e dare invio. Verificare con X invio che i dati sono stati copiati. Supponiamo di avere una tabella di numeri come questa: 1.67 61 04 0 1.78 62 26 0 1.78 72 05 0 1.84 75 2 0 1.82 76 12 0 1.80 72 2 0 1.95 91 3 0 1.81 80 9 0 1.80 70 9 0 1.86 77 6 0 1.68 65 9 0 1.84 64 8 0

1.72 62 1 0 1.76 65 26 0 1.82 74 4 0 1.86 86 3 0 1.84 75 14 0 1.73 65 19 0 1.72 57 25 1 1.62 56 2 1 1.70 59 3 1 1.61 46 15 1 1.70 64 22 1 1.60 63 26 1 1.61 60 16 1 1.60 55 28 1 1.65 50 12 1 a) Scrivere (o copiare) su R il comando A <- read.table ("clipboard") senza dare d invio. b) Andare sul foglio dove c è la tabella, selezionarla e fare copia c) Tornare col cursore su R e dare invio. NOTA PER UTENTI MAC: al sito http://stackoverflow.com/questions/9035674/r-function-to-copy-toclipboard-on-mac-osx si trova che sostituendo a "clipboard" la stringa pipe("pbpaste") si ottiene lo stesso risultato, sia col comando scan che col comando read.table. Es. X <- scan(pipe("pbpaste")), A <- read.table (pipe("pbpaste")). 3. REGRESSIONE LINEARE SEMPLICE Isoliamo con nomi facili le diverse colonne della matrice caricata sopra (in altri casi i nomi ci sono già nella tabella di partenza, qui no). Alt = A[,1] Peso = A[,2]

Data = A[,3] Sesso = A[,4] Ecco i comandi per visualizzare i punti nelle coordinate altezza-peso e la loro retta di regressione: plot(alt,peso) abline(lm(peso~alt),col="red") Quindi approssimativamente c è una regola che dice il peso data l altezza, con una banda di confidenza. Il comando abline aggiunge una retta ad un plot pre-esistente. La retta può essere specificata in più modi. Se i suoi coefficienti sono stati calcolati tramite una regressione lineare semplice, basta usare il comando come illustrato sopra. Se invece si conoscono intercetta s e coefficiente angolare m, il comando è abline(s,m)

La regressione lineare semplice è stata eseguita dal comando lm(peso~alt). Esaminiamolo più a fondo: poniamo REG = lm(peso~alt) Possiamo interrogare l esito del comando ad esempio chiedendo summary(reg) Ecco il risultato: > summary(reg) Call: lm(formula = Peso ~ Alt) Residuals: Min 1Q Median 3Q Max -11.5347-2.5751 0.2492 2.2628 10.1684 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -98.52 19.37-5.086 2.99e-05 *** Alt 94.60 11.07 8.543 6.95e-09 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 5.404 on 25 degrees of freedom Multiple R-squared: 0.7449, Adjusted R-squared: 0.7347 F-statistic: 72.98 on 1 and 25 DF, p-value: 6.95e-09 4. CORRELAZIONE Possiamo calcolare il coefficiente di correlazione tra altezza e peso col comando cor(alt,peso)

Il risultato è > cor(alt,peso) [1] 0.8630517 che è elevato. Si noti che il suo quadrato cor(alt,peso)^2 > cor(alt,peso)^2 [1] 0.7448583 Coincide col numero Multiple R-squared: 0.7449 del summary dela regressione. NOTE. i) Se non lo sappiamo già o non lo ritroviamo, come si trovano le istruzioni per tracciare una retta di regressione? Scrivendo su Google una frase ragionevole, tipo add regression line with R. Ecco cosa si impara: ii) abline(lm(y~x),col="red",lwd=1.5) ispessisce un po la retta, se piace di più. iii) lines(lm(y~x),col="red") non funziona. iv) Ci si può impratichire col comando abline, ad esempio eseguendo abline(h=45) abline(0, 1)