LABORATORIO DI PROBABILITA E STATISTICA

Documenti analoghi
LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

LABORATORIO DI PROBABILITA E STATISTICA

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

LABORATORIO DI PROBABILITA E STATISTICA

0.1 Percorrenza e Cilindrata

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate

Probabilità e Statistica Prova del 16/09/2016 Traccia A TEORIA Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

Probabilità e Statistica Prova del 29/07/2016 Traccia E TEORIA Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.

Validazione dei modelli Strumenti quantitativi per la gestione

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione

Introduzione alla Regressione Logistica

Modelli con predittori qualitativi e modelli con interazioni

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Fac-simile prova di esame

LABORATORIO DI PROBABILITA E STATISTICA

> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] > sd(percorr.urbana[d]) [1] 2.

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )

> cement <- read.table("i:/modelli/cement.dat", col.names=c("tempo", "resist")) > attach(cement)

Regressione lineare multipla Strumenti quantitativi per la gestione

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

Regressione lineare semplice

Esercizio 2: voto e ore dedicate allo studio

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica Peso e percorrenza... 12

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Case study. viene espressa in unità µmol per ora per grammo di peso secco.

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Parità del potere d'acquisto - è vera?

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Esercizi di statistica

Analisi della regressione

PROBABILITÀ ELEMENTARE

Verifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare

Test F per la significatività del modello

Modelli che spiegano l attività fotosintetica alla luce di parametri fisiologici della vegetazione. Dr. Alessandro Ferrarini

Regressione Lineare Semplice e Correlazione

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

STATISTICA A K (60 ore)

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini

Statistica multivariata Donata Rodi 17/10/2016

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Corso di Laurea in Amministrazione Aziendale Complex Learning. Statistica per l azienda (T) SECS-S/01 a. a. 2017/2018

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Stima dei parametri di modelli lineari

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Esame di Statistica A-Di Prof. M. Romanazzi

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

docente: J. Mortera/P. Vicard Nome

CAPITOLO 11 ANALISI DI REGRESSIONE

La previsione delle vendite dei lm

Modelli non lineari. Strumenti quantitativi per la gestione

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

CAPITOLO 5 Introduzione ai piani fattoriali

Il BOOM degli ascolti dei programmi culinari. ha inciso sulle iscrizioni all istituto alberghiero???

Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Statistica di base per l analisi socio-economica

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Analisi Multivariata dei Dati. Regressione Multipla

Regressione lineare semplice

> Ciliegi <- read.table("i:/modelli/cherry.dat", + col.names=c( diametro, altezza, volume ))

La regressione lineare. Rappresentazione analitica delle distribuzioni

ANALISI DELLA VARIANZA

Modelli non lineari Strumenti quantitativi per la gestione

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Esercitazione del

Multicollinearità. Strumenti quantitativi per la gestione

Regressione multipla

STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno)

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

1. Esistono differenze nella resistenza tra le varie marche?

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Il modello di regressione

REGRESSIONE LINEARE SEMPLICE

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

STATISTICA 1 ESERCITAZIONE 6

REGRESSIONE E CORRELAZIONE

UNIVERSITÀ di ROMA TOR VERGATA

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

Transcript:

UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI

REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente riporta i risultati di uno studio su 8 persone, per le quali si sono misurati il numero dedicate allo sport settimanalmente e il livello di colesterolo. Analizzare la relazione fra i due fenomeni utilizzando la regressione lineare, disegnando il grafico, calcolando i parametri della retta interpolante, i residui con grafico, il coefficiente di correlazione lineare e giudicandone la bontà di accostamento. N. ore sport sett. Livello colesterolo 1,5 205 10 157 8,5 168 7 174 1 220 3 192 5 180 2,5 204

ES. STUDIO RELAZIONE ORE DI SPORT - COLESTEROLO > sport=c(1.5, 10, 8.5, 7, 1, 3, 5, 2.5) > colesterolo=c(205, 157, 168, 174, 220, 192, 180, 204) > plot(sport, colesterolo) > rettasport=lm(colesterolo~sport) > abline(rettasport, col="blue") > segments(sport, fitted(rettasport), sport, colesterolo, lty=2) > title(main="regressione lineare fra Ore dedicate allo sport e colesterolo") Per scrivere la tilde ~ in Ubuntu premere: ALT GR + ì

ES. STUDIO RELAZIONE ORE DI SPORT - COLESTEROLO

ES. STUDIO RELAZIONE ORE DI SPORT - COLESTEROLO > summary (rettasport) Call: lm(formula = colesterolo ~ sport) Residuals: Min 1Q Median 3Q Max -6.6587-3.7565 0.7021 2.4978 9.0283 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 217.1282 3.6498 59.490 1.52e-09 *** sport -6.1565 0.6344-9.704 6.87e-05 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 5.656 on 6 degrees of freedom Multiple R-squared: 0.9401, Adjusted R-squared: 0.9301 F-statistic: 94.16 on 1 and 6 DF, p-value: 6.874e-05

residuals(rettasport) -5 0 5 ES. STUDIO RELAZIONE ORE DI SPORT - COLESTEROLO # I PARAMETRI TROVATI SONO a=217.1282 E b=-6.1565 QUINDI IL MODELLO TEORICO SARA : Y =217.1282-6.1565 *sport # EFFETTUIAMO L ANALISI DEI RESIDUI > plot(fitted(rettasport), residuals(rettasport)) > abline(0, 0) 160 170 180 190 200 210 fitted(rettasport) L analisi dei residui conferma che questi si distribuiscono in maniera uniforme e apparentemente casuale attorno all asse zero, quindi si può confermare l ipotesi di distribuzione casuale degli stessi, con media nulla e incorrelazione.

ES. STUDIO RELAZIONE ORE DI SPORT - COLESTEROLO # CALCOLIAMO IL COEFFICIENTE DI CORRELAZIONE LINEARE: > R=cor(sport, colesterolo) > R [1] -0.9695861 # POICHE R E MOLTO VICINO A -1 POSSIAMO AFFERMARE CHE C E UNA FORTE RELAZIONE LINEARE INDIRETTA FRA LE DUE VARIABILI # CALCOLIAMO IL COEFFICIENTE DI DETERMINAZIONE FACENDO IL QUADRATO DI R PER GIUDICARE LA BONTA DI ACCOSTAMENTO: > R2=R^2 > R2 [1] 0.9400972 # DATO CHE R2 E QUASI UGUALE A 1, DICIAMO CHE IL MODELLO TEORICO USATO SI ADATTA MOLTO BENE AI VALORI OSSERVATI

REGRESSIONE LINEARE: carotene - eritema ESERCIZIO 9: Una ricerca sulla relazione fra quantità assunta di un integratore a base di beta carotene e il rischio di subire un eritema solare ha dato i risultati presenti in tabella. Analizzare la relazione fra i due fenomeni utilizzando la regressione lineare, disegnando il grafico, calcolando i parametri della retta interpolante, i residui con grafico, il coefficiente di correlazione lineare e giudicandone la bontà di accostamento. Quantità beta Rischio eritema carotene 0 50 10 15 5 35 15 0

ES. STUDIO RELAZIONE carotene - eritema > carotene=c(0, 10, 5, 15) > eritema=c(50, 15, 35, 0) > plot(carotene, eritema) > rettascott=lm(eritema~carotene) > abline(rettascott, col="blue") > segments(carotene, fitted(rettascott), carotene, eritema, lty=2) > title(main="regressione lineare fra Assunzione di carotene e eritema")

ES. STUDIO RELAZIONE carotene - eritema

ES. STUDIO RELAZIONE carotene - eritema > summary (rettascott) Call: lm(formula = eritema ~ carotene) Residuals: 1 2 3 4-0.5-1.5 1.5 0.5 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 50.5000 1.3229 38.17 0.000686 *** carotene -3.4000 0.1414-24.04 0.001726 ** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 1.581 on 2 degrees of freedom Multiple R-squared: 0.9966, Adjusted R-squared: 0.9948 F-statistic: 578 on 1 and 2 DF, p-value: 0.001726

residuals(rettascott) -1.5-1.0-0.5 0.0 0.5 1.0 1.5 ES. STUDIO RELAZIONE carotene - eritema # I PARAMETRI TROVATI SONO a=50.5 E b=-3.4 QUINDI IL MODELLO TEORICO SARA : Y =50.5-3.4 *carotene # EFFETTUIAMO L ANALISI DEI RESIDUI > plot(fitted(rettascott), residuals(rettascott)) > abline(0, 0) 0 10 20 30 40 50 fitted(rettascott) L analisi dei residui conferma che questi si distribuiscono in maniera uniforme e apparentemente casuale attorno all asse zero, quindi si può confermare l ipotesi di distribuzione casuale degli stessi, con media nulla e incorrelazione.

ES. STUDIO RELAZIONE carotene - eritema # CALCOLIAMO IL COEFFICIENTE DI CORRELAZIONE LINEARE: > R=cor(carotene, eritema) > R [1] -1.1872454 # POICHE R E NEGATIVO, POSSIAMO AFFERMARE CHE C E UNA FORTE RELAZIONE LINEARE INDIRETTA FRA LE DUE VARIABILI

ES. STUDIO RELAZIONE carotene - eritema # CALCOLIAMO IL COEFFICIENTE DI CORRELAZIONE LINEARE: > R=cor(carotene, eritema) > R [1] -0.9982744 # POICHE R E MOLTO VICINO A -1 POSSIAMO AFFERMARE CHE C E UNA FORTE RELAZIONE LINEARE INDIRETTA FRA LE DUE VARIABILI

ES. STUDIO RELAZIONE carotene - eritema # CALCOLIAMO IL COEFFICIENTE DI DETERMINAZIONE FACENDO IL QUADRATO DI R PER GIUDICARE LA BONTA DI ACCOSTAMENTO: > R2=R^2 > R2 [1] 0.9965517 # DATO CHE R2 E QUASI UGUALE A 1, IL MODELLO TEORICO USATO SI ADATTA MOLTO BENE AI VALORI OSSERVATI

REGRESSIONE LINEARE: vitamina c - radicali ESERCIZIO 10: Una ricerca sulla relazione fra quantità assunta di un integratore a base di vitamina C e il livello di radicali liberi sulle pareti cellulari vascolari ha dato i risultati presenti in tabella. Analizzare la relazione fra i due fenomeni utilizzando la regressione lineare, disegnando il grafico, calcolando i parametri della retta interpolante, i residui con grafico, il coefficiente di correlazione lineare e giudicandone la bontà di accostamento. Quantità di vitamina C Livello radicali liberi 0 58 2 27 5 10 6 5

ES. STUDIO RELAZIONE vitamina c - radicali > vitaminac=c(0, 2, 5, 6) > radicali=c(58, 27, 10, 5) > plot(vitaminac, radicali) > rettavit=lm(radicali~vitaminac) > abline(rettavit, col="blue") > segments(vitaminac, fitted(rettavit), vitaminac, radicali, lty=2) > title(main="regressione lineare fra Assunzione di vitamina C e radicali")

ES. STUDIO RELAZIONE vitamina c - radicali

ES. STUDIO RELAZIONE vitamina c - radicali > summary (rettavit) Call: lm(formula = radicali ~ vitaminac) Residuals: 1 2 3 4 5.7143-8.4945-0.3077 3.0879 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 52.286 6.393 8.179 0.0146 * vitaminac -8.396 1.586-5.294 0.0339 * --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 7.564 on 2 degrees of freedom Multiple R-squared: 0.9334, Adjusted R-squared: 0.9001 F-statistic: 28.02 on 1 and 2 DF, p-value: 0.03388

residuals(rettavit) -8-6 -4-2 0 2 4 6 ES. STUDIO RELAZIONE vitamina c - radicali # I PARAMETRI TROVATI SONO a=52.286 E b=-8.396 QUINDI IL MODELLO TEORICO SARA : Y =52.286-8.396 *vitaminac # EFFETTUIAMO L ANALISI DEI RESIDUI > plot(fitted(rettavit), residuals(rettavit)) > abline(0, 0) 0 10 20 30 40 50 fitted(rettavit) L analisi dei residui conferma che questi si distribuiscono in maniera uniforme e apparentemente casuale attorno all asse zero, quindi si può confermare l ipotesi di distribuzione casuale degli stessi, con media nulla e incorrelazione.

ES. STUDIO RELAZIONE vitamina c - radicali # CALCOLIAMO IL COEFFICIENTE DI CORRELAZIONE LINEARE: > R=cor(vitaminac, radicali) > R [1] -0.96612 # POICHE R E MOLTO VICINO A -1 POSSIAMO AFFERMARE CHE C E UNA FORTE RELAZIONE LINEARE INDIRETTA FRA LE DUE VARIABILI # CALCOLIAMO IL COEFFICIENTE DI DETERMINAZIONE FACENDO IL QUADRATO DI R PER GIUDICARE LA BONTA DI ACCOSTAMENTO: > R2=R^2 > R2 [1] 0.9333879 # DATO CHE R2 E QUASI UGUALE A 1, DICIAMO CHE IL MODELLO TEORICO USATO SI ADATTA MOLTO BENE AI VALORI OSSERVATI