Grafici in R Strumenti quantitativi per la gestione

Documenti analoghi
Validazione dei modelli. Strumenti quantitativi per la gestione

Validazione dei modelli Strumenti quantitativi per la gestione

R - base Emanuele Taufer

Classificazione k-nn con R. Strumenti quantitativi per la gestione

Regressione. Monica Marabelli. 15 Gennaio 2016

INTRODUZIONE A R. Dott. Giuseppe Sgroi Dipartimento di Matematica e Informatica 29 Maggio 2019

Clustering gerarchico con R

Analisi esplorativa dei dati - Iris data set Emanuele Taufer

Rappresentazioni grafiche

Rappresentazioni grafiche

Introduzione al software R

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione

Regressione ridge e LASSO Strumenti quantitativi per la gestione

Alberi di decisione con R

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018

Analisi discriminante in R Strumenti quantitativi per la gestione

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione

Modelli con predittori qualitativi e modelli con interazioni

Analisi delle Componenti Principali con R

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)

R - Esercitazione 3. Lorenzo Di Biagio Venerdì 25 Ottobre Università Roma Tre

Statistiche di sintesi

Laboratorio di Statistica e Analisi Dati: Lezione 5

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Esplorazione grafica di dati multivariati. N. Del Buono

Parametri grafici in R

Statistica descrittiva bivariata Massimo Aria

Istruzioni per l analisi in componenti principali con R

INTRODUZIONE A R Lezione 3

STATISTICA PER LA DIGITAL ECONOMY 2017

Introduzione a R. Silvia Parolo. 14 November 2014

STATISTICA PER LA DIGITAL ECONOMY Marco Riani

Regressione logistica. Strumenti quantitativi per la gestione

Università degli Studi di Milano

Excel: parte II. Davide Sardina

Esercitazione n 2 Costruzione di grafici

Data frame. Università degli Studi di Milano

Introduzione a R. Monica Marabelli. 30 Ottobre 2015

Selezione del modello Strumenti quantitativi per la gestione

2- età frequenze tabella di frequenza con anche cumulate + diagrammi a bastoncini

Modulo III - Rappresentazione grafica

Esercitazione con R 9 Maggio 2006

Laboratorio 1 Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione

Laboratorio di Statistica e Analisi Dati: Lezione 6

STATISTICA PER LA DIGITAL ECONOMY Marco Riani

Prof. Marco Masseroli

Rappresentazioni grafiche di distribuzioni doppie

Laboratorio di Statistica e Analisi dei Dati

Tabelle di variabili categoriche e Test CHI-quadro

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

LAB LEZ. 1 STATISTICA DESCRITTIVA CON R

Bagging e Foreste Casuali con R

Capitolo 2 Analisi delle serie storiche. Analisi grafiche, numeriche e pattern tipici

Laboratorio di Calcolo Numerico Laboratorio 5: Scrittura su FILE. Soluzione di Equazioni non lineari

Regressione Lineare Semplice e Correlazione

Esplorazione grafica di dati multivariati. N. Del Buono

Lezione precedente. D. Fioredistella IEZZI

INTRODUZIONE A R Lezione 4

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Criteri di Valutazione della scheda (solo a carattere indicativo)

1.1 Iniziare e chiudere una sessione di R

Laboratorio di Calcolo Numerico

Radici. Ricominciare dalle proprie risorse GIUGNO 2010

Informazione, devianza e verosimiglianza con il linguaggio R

Cereal data- analisi con gli alberi di classificazione

We model for you. Proposta agli istituti di ricerca che operano in Italia Marzo 2013

Statistica multivariata Donata Rodi 21/11/2016

Rdppuseutazioni gnafiche

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice

Laboratorio di Probabilità e Statistica

Analisi bivariata. Il caso di caratteri quantitativi

Regressione lineare semplice. Strumenti quantitativi per la gestione

ESPLORAZIONE DEI DATI (parte 1) 1 / 21

Data Import e Probabilità. Renato Mainetti

Cosa sono gli Script (m-file) Script Semplici programmi. Fino ad ora, i comandi sono stati sempre digitati nella command window:

Analisi in componenti principali

Il proprietario di una catena di negozi vuole confrontare il reddito (in euro) dei suoi 5 negozi, riportato nella seguente tabella

Regressione logistica. Strumenti quantitativi per la gestione

L ambiente grafico di R

L ambiente grafico di R

Matlab: Script e Funzioni

STATISTICA. Esercizi

2005 AC Auction Results

Correlazione e regressione

R - Esercitazione 2. Andrea Fasulo 20 Ottobre Università Roma Tre

K-means clustering con R

Indice generale. Introduzione. Capitolo 1 Essere uno scienziato dei dati... 1

Data Import pulizia dati e Probabilità. Renato Mainetti

ANALISI DELLA VARIANZA

Laboratorio di ST1 Lezione 2

Elementi di Psicometria con Laboratorio di SPSS 1

L ambiente grafico di R

Q1 = /4 0 4 = Me = /2 4 = 3

Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area.

Introduzione all Analisi Esplorativa dei Dati mediante R 1

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi

Transcript:

Grafici in R Strumenti quantitativi per la gestione Emanuele Taufer Caricare il dataset da una libreria Plot Boxplot Istogramma Scatterplot matrice Disegnare linee aggiuntive Caricare il dataset da una libreria Carichiamo il file Auto dalla libreria ISLR (da installare) library(islr) data(auto) head(auto) mpg cylinders displacement horsepower weight acceleration year origin 1 18 8 307 130 3504 12.0 70 1 2 15 8 350 165 3693 11.5 70 1 3 18 8 318 150 3436 11.0 70 1 4 16 8 304 150 3433 12.0 70 1 5 17 8 302 140 3449 10.5 70 1 6 15 8 429 198 4341 10.0 70 1 name 1 chevrolet chevelle malibu 2 buick skylark 320 3 plymouth satellite 4 amc rebel sst 5 ford torino 6 ford galaxie 500 names e str ci danno informazioni sulle variabili contenute nel file names(auto) ## [1] "mpg" "cylinders" "displacement" "horsepower" ## [5] "weight" "acceleration" "year" "origin" ## [9] "name" str(auto) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 1/17

## 'data.frame': 392 obs. of 9 variables: ## $ mpg : num 18 15 18 16 17 15 14 14 14 15... ## $ cylinders : num 8 8 8 8 8 8 8 8 8 8... ## $ displacement: num 307 350 318 304 302 429 454 440 455 390... ## $ horsepower : num 130 165 150 150 140 198 220 215 225 190... ## $ weight : num 3504 3693 3436 3433 3449... ## $ acceleration: num 12 11.5 11 12 10.5 10 9 8.5 10 8.5... ## $ year : num 70 70 70 70 70 70 70 70 70 70... ## $ origin : num 1 1 1 1 1 1 1 1 1 1... ## $ name : Factor w/ 304 levels "amc ambassador brougham",..: 49 36 231 14 161 141 54 223 241 2... Plot Possiamo usare la funzione plot() per produrre uno scatterplot di variabili quantitative. Tuttavia, digitando semplicemente i nomi delle variabili si produrrà un messaggio d errore, perché R non sa dove cercare i dati. L istruzione corretta è plot(auto$cylinders, Auto$mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 2/17

In alternativa è possibile istruire R per cercare i dati nel file Auto con la funzione attach() attach(auto) plot(cylinders, mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 3/17

Boxplot La variabile cylinders è memorizzata come un vettore numerico, e quindi R la tratta come quantitativa. Tuttavia, poiché vi sono solo un piccolo numero di possibili valori per cylinders, può essere preferibile trattare la variabile cylinders come qualitativa. La funzione as.factor() converte le variabili quantitative in qualitative cylinders = as.factor (cylinders) Se la variabile tracciata sull asse x è categorica, allora la funzione plot() produrrà automaticamente un boxplot. Alcuni esempi, con diverse opzioni, di seguito. L opzione varwidth=true produce boxplot con largehzza proporzionale alla radice della dimensione del gruppo. plot(cylinders, mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 4/17

plot(cylinders, mpg, col="red") file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 5/17

plot(cylinders, mpg, col="red", varwidth=t) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 6/17

plot(cylinders, mpg, col="red", varwidth=t,horizontal=t) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 7/17

plot(cylinders, mpg, col="red", varwidth=t, xlab="cylinders", ylab="mpg") file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 8/17

Istogramma la funzione hist() produce istogrammi hist(mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 9/17

hist(mpg,col=2) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 10/17

hist(mpg,col=2,breaks=15) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 11/17

Scatterplot matrice La funzione pairs() produce scatter plot di tutte le variabili di un dataset pairs(auto) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 12/17

pairs(~ mpg + displacement + horsepower + weight + acceleration, Auto) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 13/17

Disegnare linee aggiuntive Linee aggiuntive possono essere inserite nel grafico con la funzione abline(a,b) dove a indica l intercetta, b la pendenza plot(horsepower,mpg) abline(40, 0.15) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 14/17

plot(horsepower,mpg) abline(v=150) abline(h=20) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 15/17

La retta ottenuta dalla funzione lm può essere tracciata richiamando l oggetto output di lm reg< lm(mpg~horsepower) plot(horsepower,mpg) abline(reg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 16/17

file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 17/17