Grafici in R Strumenti quantitativi per la gestione

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Grafici in R Strumenti quantitativi per la gestione"

Transcript

1 Grafici in R Strumenti quantitativi per la gestione Emanuele Taufer Caricare il dataset da una libreria Plot Boxplot Istogramma Scatterplot matrice Disegnare linee aggiuntive Caricare il dataset da una libreria Carichiamo il file Auto dalla libreria ISLR (da installare) library(islr) data(auto) head(auto) mpg cylinders displacement horsepower weight acceleration year origin name 1 chevrolet chevelle malibu 2 buick skylark plymouth satellite 4 amc rebel sst 5 ford torino 6 ford galaxie 500 names e str ci danno informazioni sulle variabili contenute nel file names(auto) ## [1] "mpg" "cylinders" "displacement" "horsepower" ## [5] "weight" "acceleration" "year" "origin" ## [9] "name" str(auto) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 1/17

2 ## 'data.frame': 392 obs. of 9 variables: ## $ mpg : num ## $ cylinders : num ## $ displacement: num ## $ horsepower : num ## $ weight : num ## $ acceleration: num ## $ year : num ## $ origin : num ## $ name : Factor w/ 304 levels "amc ambassador brougham",..: Plot Possiamo usare la funzione plot() per produrre uno scatterplot di variabili quantitative. Tuttavia, digitando semplicemente i nomi delle variabili si produrrà un messaggio d errore, perché R non sa dove cercare i dati. L istruzione corretta è plot(auto$cylinders, Auto$mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 2/17

3 In alternativa è possibile istruire R per cercare i dati nel file Auto con la funzione attach() attach(auto) plot(cylinders, mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 3/17

4 Boxplot La variabile cylinders è memorizzata come un vettore numerico, e quindi R la tratta come quantitativa. Tuttavia, poiché vi sono solo un piccolo numero di possibili valori per cylinders, può essere preferibile trattare la variabile cylinders come qualitativa. La funzione as.factor() converte le variabili quantitative in qualitative cylinders = as.factor (cylinders) Se la variabile tracciata sull asse x è categorica, allora la funzione plot() produrrà automaticamente un boxplot. Alcuni esempi, con diverse opzioni, di seguito. L opzione varwidth=true produce boxplot con largehzza proporzionale alla radice della dimensione del gruppo. plot(cylinders, mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 4/17

5 plot(cylinders, mpg, col="red") file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 5/17

6 plot(cylinders, mpg, col="red", varwidth=t) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 6/17

7 plot(cylinders, mpg, col="red", varwidth=t,horizontal=t) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 7/17

8 plot(cylinders, mpg, col="red", varwidth=t, xlab="cylinders", ylab="mpg") file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 8/17

9 Istogramma la funzione hist() produce istogrammi hist(mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 9/17

10 hist(mpg,col=2) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 10/17

11 hist(mpg,col=2,breaks=15) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 11/17

12 Scatterplot matrice La funzione pairs() produce scatter plot di tutte le variabili di un dataset pairs(auto) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 12/17

13 pairs(~ mpg + displacement + horsepower + weight + acceleration, Auto) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 13/17

14 Disegnare linee aggiuntive Linee aggiuntive possono essere inserite nel grafico con la funzione abline(a,b) dove a indica l intercetta, b la pendenza plot(horsepower,mpg) abline(40, 0.15) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 14/17

15 plot(horsepower,mpg) abline(v=150) abline(h=20) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 15/17

16 La retta ottenuta dalla funzione lm può essere tracciata richiamando l oggetto output di lm reg< lm(mpg~horsepower) plot(horsepower,mpg) abline(reg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 16/17

17 file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 17/17

Validazione dei modelli. Strumenti quantitativi per la gestione

Validazione dei modelli. Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l5-validazione.html#(1) 1/27 Validazione dei modelli In questo esempio

Dettagli

Validazione dei modelli Strumenti quantitativi per la gestione

Validazione dei modelli Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test

Dettagli

R - base Emanuele Taufer

R - base Emanuele Taufer R - base Emanuele Taufer Contents Preliminari................................................. 1 Oggetti................................................... 1 Oggetti - 2.................................................

Dettagli

Classificazione k-nn con R. Strumenti quantitativi per la gestione

Classificazione k-nn con R. Strumenti quantitativi per la gestione Classificazione k-nn con R Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l1-knn.html#(1) 1/16 Altezza e peso degli adulti Le statistiche sull

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

INTRODUZIONE A R. Dott. Giuseppe Sgroi Dipartimento di Matematica e Informatica 29 Maggio 2019

INTRODUZIONE A R. Dott. Giuseppe Sgroi Dipartimento di Matematica e Informatica 29 Maggio 2019 INTRODUZIONE A R Dott. Giuseppe Sgroi Dipartimento di Matematica e Informatica giuseppe.sgroi@unict.it 29 Maggio 2019 COS È R? R è un software OpenSource, che può essere definito come un sistema di analisi

Dettagli

Clustering gerarchico con R

Clustering gerarchico con R Clustering gerarchico con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l-10_cluster_h-clust.html#(1) 1/10 Clustering gerarchico in R La funzione di base per

Dettagli

Analisi esplorativa dei dati - Iris data set Emanuele Taufer

Analisi esplorativa dei dati - Iris data set Emanuele Taufer Analisi esplorativa dei dati - Iris data set Emanuele Taufer Contents Iris flower data............................................... 1 Iris Setosa.................................................. 1 Iris

Dettagli

Rappresentazioni grafiche

Rappresentazioni grafiche Rappresentazioni grafiche Domenico Vistocco vistocco@unicas.it Dipartimento di Scienze Economiche UNIVERSITÀ DI CASSINO Corso di Statistica Le elaborazioni e i grafici sono stati ottenuti con il software

Dettagli

Rappresentazioni grafiche

Rappresentazioni grafiche Rappresentazioni grafiche Domenico Vistocco vistocco@unicas.it Dipartimento di Scienze Economiche UNIVERSITÀ DI CASSINO Corso di Statistica Le elaborazioni e i grafici sono stati ottenuti con il software

Dettagli

Introduzione al software R

Introduzione al software R Introduzione al software R 1 1 Università di Napoli Federico II cristina.tortora@unina.it il software R Si tratta di un software molto flessibile che permette di compiere praticamente qualsiasi tipo di

Dettagli

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare

Dettagli

Regressione ridge e LASSO Strumenti quantitativi per la gestione

Regressione ridge e LASSO Strumenti quantitativi per la gestione Regressione ridge e LASSO Strumenti quantitativi per la gestione Emanuele Taufer Dati Credit.csv La funzione glmnet() La funzione model.matrix() Regressione ridge Output CV Ridge Output Regressione LASSO

Dettagli

Alberi di decisione con R

Alberi di decisione con R Alberi di decisione con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l8-alberi_di_decisione.html#(1) 1/14 Implementare gli alberi decisionali con R Per adattare

Dettagli

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Passo 1: Leggere il file di input (il file si trova a questo indirizzo: https://fvidoli.weebly.com/uploads/2/3/0/8/ 23088460/dati_medici.csv),

Dettagli

Analisi discriminante in R Strumenti quantitativi per la gestione

Analisi discriminante in R Strumenti quantitativi per la gestione Analisi discriminante in R Strumenti quantitativi per la gestione Emanuele Taufer Default data LDA con R Output Plot Previsione Tabella di classificazione Cambiare il criterio di classificazione Costruire

Dettagli

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Le domande 1-6 si riferiscono al seguente problema Un data set contiene i dati sui consumi di diversi tipi di automobili e alcune loro

Dettagli

Modelli con predittori qualitativi e modelli con interazioni

Modelli con predittori qualitativi e modelli con interazioni Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari

Dettagli

Analisi delle Componenti Principali con R

Analisi delle Componenti Principali con R Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi delle Componenti

Dettagli

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) 1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) Riprendiamo l esempio X = seq(-5,5,0.01) Y= dnorm(x) plot(x,y) Si poteva automatizzare la scelta delle X ponendo: X=rnorm(1000)

Dettagli

R - Esercitazione 3. Lorenzo Di Biagio Venerdì 25 Ottobre Università Roma Tre

R - Esercitazione 3. Lorenzo Di Biagio Venerdì 25 Ottobre Università Roma Tre R - Esercitazione 3 Lorenzo Di Biagio dibiagio@mat.uniroma3.it Università Roma Tre Venerdì 25 Ottobre 2013 Grafica (1) I comandi grafici in R si distinguono in alto e basso livello. I comandi di alto livello

Dettagli

Statistiche di sintesi

Statistiche di sintesi Esercizio 2 E stato condotto uno studio per valutare la variazione della pressione sistolica in funzione dell etá. I dati sono riportati nel file sbp.xls. Effettua un analisi di regressione e disegna gli

Dettagli

Laboratorio di Statistica e Analisi Dati: Lezione 5

Laboratorio di Statistica e Analisi Dati: Lezione 5 Laboratorio di Statistica e Analisi Dati: Lezione 5 Tommaso C. & Marco G. 23-25 Novembre 2016 News Faq su come interagire con le slide.html Aggiunto link alla pagina principale IDE Corretto il calendario

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Esplorazione grafica di dati multivariati. N. Del Buono

Esplorazione grafica di dati multivariati. N. Del Buono Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)

Dettagli

Parametri grafici in R

Parametri grafici in R Parametri grafici in R Corso di Bioinformatica Nicola Vitacolonna Corso di Laurea in Biotecnologie Grafici esplorativi vs grafici finali Durante l'esplorazione dei dati non è necessario preoccuparsi troppo

Dettagli

Statistica descrittiva bivariata Massimo Aria

Statistica descrittiva bivariata Massimo Aria Statistica descrittiva bivariata Massimo Aria TABELLE DI CONTINGENZA # importare il dataframe automobile (fonte UCI Machine Learning repository) df=read.table("http://www.massimoaria.com/laboratorio/automobile.csv",header=true,sep=";",dec=",")

Dettagli

Istruzioni per l analisi in componenti principali con R

Istruzioni per l analisi in componenti principali con R Istruzioni per l analisi in componenti principali con R Vi ricordo che in nero sono state inserite le note e in rosso le istruzioni da digitare sulla console di R Importare il dataset gelati

Dettagli

INTRODUZIONE A R Lezione 3

INTRODUZIONE A R Lezione 3 INTRODUZIONE A R Lezione 3 Silvia Bacci e Silvia Pandolfi 1 Creare grafici in R R consente di realizzare, con semplicità, grafici di qualità professionale. Questi sono poi esportabili come file in numerosi

Dettagli

STATISTICA PER LA DIGITAL ECONOMY 2017

STATISTICA PER LA DIGITAL ECONOMY 2017 STATISTICA PER LA DIGITAL ECONOMY 2017 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 11.00-13.00 (frontale) GIO 9.00-11.00 (frontale) VEN 11.00-13.00 (laboratorio) Ricevimento

Dettagli

Introduzione a R. Silvia Parolo. 14 November 2014

Introduzione a R. Silvia Parolo. 14 November 2014 Introduzione a R Silvia Parolo 14 November 2014 Cos è R?? è un tool per l analisi di dati è anche un linguaggio di programmazione si può scaricare da http: // www. r-project. org/ primi passi in R R può

Dettagli

STATISTICA PER LA DIGITAL ECONOMY Marco Riani

STATISTICA PER LA DIGITAL ECONOMY Marco Riani STATISTICA PER LA DIGITAL ECONOMY 2018 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 11.15-12.45 (frontale) GIO 9.15-10.45 (frontale) VEN 11.00-13.00 (laboratorio) Ricevimento

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I

Dettagli

Università degli Studi di Milano

Università degli Studi di Milano Università degli Studi di Milano Laurea Specialistica in Genomica Funzionale e Bioinformatica Corso di Linguaggi di Programmazione per la Bioinformatica Data frame Giorgio Valentini e mail: valentini@dsi.unimi.it

Dettagli

Excel: parte II. Davide Sardina

Excel: parte II. Davide Sardina Excel: parte II Davide Sardina davidestefano.sardina@unikore.it Università degli studi di Enna Kore Corso di Laurea in Scienze delle Attività Motorie e Sportive A.A. 2017/2018 Grafici in Excel I grafici

Dettagli

Esercitazione n 2 Costruzione di grafici

Esercitazione n 2 Costruzione di grafici Esercitazione n 2 Costruzione di grafici 1/31 I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e

Dettagli

Data frame. Università degli Studi di Milano

Data frame. Università degli Studi di Milano Università degli Studi di Milano Laurea Specialistica in Genomica Funzionale e Bioinformatica Corso di Linguaggi di Programmazione per la Bioinformatica Data frame Giorgio Valentini e mail: valentini@dsi.unimi.it

Dettagli

Introduzione a R. Monica Marabelli. 30 Ottobre 2015

Introduzione a R. Monica Marabelli. 30 Ottobre 2015 Introduzione a R Monica Marabelli 30 Ottobre 2015 Cos é R? R é un programma utile per l analisi dei dati R puó essere utilizzato per: elaborare dati svolgere analisi statistiche effettuare rappresentazioni

Dettagli

Selezione del modello Strumenti quantitativi per la gestione

Selezione del modello Strumenti quantitativi per la gestione Selezione del modello Strumenti quantitativi per la gestione Emanuele Taufer Migliorare il modello di regressione lineare (RL) Metodi Selezione Best subset Selezione stepwise Stepwise forward Stepwise

Dettagli

2- età frequenze tabella di frequenza con anche cumulate + diagrammi a bastoncini

2- età frequenze tabella di frequenza con anche cumulate + diagrammi a bastoncini Prima lezione Esempio di dati Indagine medica Id Sesso Età Razza Fumatore Pressione Sanguigna Presenza di calcio nel sangue 1 M 46 altro sì 90 10.04 2 M 45 asiatico sì 102 9.66 3 F 45 nero sì 91 9.94 4

Dettagli

Modulo III - Rappresentazione grafica

Modulo III - Rappresentazione grafica Modulo III - Rappresentazione grafica Elisabetta Ronchieri Università di Ferrara Dipartimento di Economia e Management e-mail: elisabetta.ronchieri@unife.it 24 Novembre 2016 Elisabetta Ronchieri Modulo

Dettagli

Esercitazione con R 9 Maggio 2006

Esercitazione con R 9 Maggio 2006 Esercitazione con R 9 Maggio 2006 Iniziamo con alcuni comandi standard di R che risulteranno utili nell analisi delle serie storiche. Help Vi sono vari comandi che si possono digitare per lanciare una

Dettagli

Laboratorio 1 Strumenti quantitativi per la gestione

Laboratorio 1 Strumenti quantitativi per la gestione Laboratorio 1 Strumenti quantitativi per la gestione Emanuele taufer Lab: Introduzione a R Comandi di base Lab: Introduzione a R Comandi di base R utilizza funzioni per eseguire le operazioni. Per eseguire

Dettagli

Multicollinearità. Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità

Dettagli

Laboratorio di Statistica e Analisi Dati: Lezione 6

Laboratorio di Statistica e Analisi Dati: Lezione 6 Laboratorio di Statistica e Analisi Dati: Lezione 6 Tommaso C. & Marco G. 30 Novembre - 2 Dicembre 2016 Esercizio1 1. Importare il dataset autos.csv 2. Visualizzare le struttura e le prime 6 righe 3. Modificare

Dettagli

STATISTICA PER LA DIGITAL ECONOMY Marco Riani

STATISTICA PER LA DIGITAL ECONOMY Marco Riani STATISTICA PER LA DIGITAL ECONOMY 2018 Marco Riani mriani@unipr.it http://www.riani.it Ponderazione delle unità Unità statistiche: con la stessa importanza con importanza diversa: ponderazione Vettore

Dettagli

Prof. Marco Masseroli

Prof. Marco Masseroli Facoltà di Ingegneria Industriale Laurea in Ingegneria Energetica, Meccanica e dei Trasporti Dipartimento di Elettronica e Informazione Informatica B Prof. Marco Masseroli Indice Laboratorio 4: Linguaggio

Dettagli

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

Laboratorio di Statistica e Analisi dei Dati

Laboratorio di Statistica e Analisi dei Dati Laboratorio di Statistica e Analisi dei Dati Nicolò Campolongo Università degli Studi di Milano nicolo.campolongo@unimi.it November 16, 2018 Nicolò Campolongo (UniMi) Lezione 3 November 16, 2018 1 / 17

Dettagli

Tabelle di variabili categoriche e Test CHI-quadro

Tabelle di variabili categoriche e Test CHI-quadro Tabelle di variabili categoriche e Test CHI-quadro Relazioni tra variabili categoriche Vogliamo un metodo per studiare eventuali relazioni tra variabili categoriche Per esempio vogliamo studiare come l

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto michela.pasetto2@unibo.it Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa

Dettagli

LAB LEZ. 1 STATISTICA DESCRITTIVA CON R

LAB LEZ. 1 STATISTICA DESCRITTIVA CON R LAB LEZ. 1 STATISTICA DESCRITTIVA CON R 1 2 L AMBIENTE DI SVILUPPO DI RStudio 1 3 4 2 1 FINESTRA PER CREARE E SALVARE FILE.R 2 CONSOLE DEI COMANDI 3 VARIABILI PRESENTI NELLA MEMORIA DEL PROGRAMMA E CRONOLOGIA

Dettagli

Bagging e Foreste Casuali con R

Bagging e Foreste Casuali con R Bagging e Foreste Casuali con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l8-bagging-fc.html#(10) 1/10 Bagging e Foreste casuali con R Utilizziamo ancora una

Dettagli

Capitolo 2 Analisi delle serie storiche. Analisi grafiche, numeriche e pattern tipici

Capitolo 2 Analisi delle serie storiche. Analisi grafiche, numeriche e pattern tipici Capitolo 2 Analisi delle serie storiche. Analisi grafiche, numeriche e pattern tipici 1 Una precisazione: dati cross section e serie storiche Dati cross section (trasversali): tutte le osservazioni si

Dettagli

Laboratorio di Calcolo Numerico Laboratorio 5: Scrittura su FILE. Soluzione di Equazioni non lineari

Laboratorio di Calcolo Numerico Laboratorio 5: Scrittura su FILE. Soluzione di Equazioni non lineari Laboratorio di Calcolo Numerico Laboratorio 5: Scrittura su FILE. Soluzione di Equazioni non lineari Claudia Zoccarato E-mail: claudia.zoccarato@unipd.it Dispense: Moodle Dipartimento ICEA 05 Aprile 2017

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Esplorazione grafica di dati multivariati. N. Del Buono

Esplorazione grafica di dati multivariati. N. Del Buono Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)

Dettagli

Lezione precedente. D. Fioredistella IEZZI

Lezione precedente. D. Fioredistella IEZZI Lezione precedente Installazione del software R Costanti e vettori: R lavora con valori, stringhe di caratteri, vettori e matrici, che vengono assegnati alle variabili con opportuni comandi. Ad esempio,

Dettagli

INTRODUZIONE A R Lezione 4

INTRODUZIONE A R Lezione 4 INTRODUZIONE A R Lezione 4 Silvia Bacci e Silvia Pandolfi 1 La regressione lineare 1.1 Regressioni lineare semplice Per applicare il metodo di regressione lineare scegliamo il dataset cars relativo alle

Dettagli

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()

Dettagli

Criteri di Valutazione della scheda (solo a carattere indicativo)

Criteri di Valutazione della scheda (solo a carattere indicativo) Criteri di Valutazione della scheda (solo a carattere indicativo) Previsioni - A Sono state fatte le previsioni e discussi i valori attesi insieme al ragionamento con cui sono stati calcolati? E stata

Dettagli

1.1 Iniziare e chiudere una sessione di R

1.1 Iniziare e chiudere una sessione di R Laboratorio 1 Introduzione a R 1.1 Iniziare e chiudere una sessione di R Per iniziare una sessione R fare un doppio click di mouse sulla icona di R. Per uscire da R, usa q(). Per salvare i dati rispondere

Dettagli

Laboratorio di Calcolo Numerico

Laboratorio di Calcolo Numerico Laboratorio di Calcolo Numerico Lezione 4 Padova, April 12nd 2016 F. Piazzon Department of Mathematics. Doctoral School in Mathematical Sciences, Applied Mathematics Area Outline Lab. 4-2 of 9 1 Matlab:

Dettagli

Radici. Ricominciare dalle proprie risorse GIUGNO 2010

Radici. Ricominciare dalle proprie risorse GIUGNO 2010 P E R I O D I C O D I I N F O R M A Z I O N E D E L L A M M I N I S T R A Z I O N E C O M U N A L E GIUGNO 2010 NUMERO 01 ANNO IL TRIMESTRALE DEL I Comune di Rio nell Elba Registrazione presso il Tribunale

Dettagli

Informazione, devianza e verosimiglianza con il linguaggio R

Informazione, devianza e verosimiglianza con il linguaggio R Informazione, devianza e verosimiglianza con il linguaggio R Partiamo dal dataset studenti: www = "https://goo.gl/rdrnff" Carichiamolo in R: studenti = read.table( www, header = TRUE ) attach(studenti)

Dettagli

Cereal data- analisi con gli alberi di classificazione

Cereal data- analisi con gli alberi di classificazione Cereal data- analisi con gli alberi di classificazione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l8-cereal-tree.html#(1) 1/32 Cereal.dat Per migliorare la commercializzazione

Dettagli

We model for you. Proposta agli istituti di ricerca che operano in Italia Marzo 2013

We model for you. Proposta agli istituti di ricerca che operano in Italia Marzo 2013 Servicing di elaborazione indagini Proposta agli istituti di ricerca che operano in Italia Marzo 2013 Servicing di elaborazione indagini Da alcuni anni GMR svolge un attività di servicing esterno ad alcuni

Dettagli

Statistica multivariata Donata Rodi 21/11/2016

Statistica multivariata Donata Rodi 21/11/2016 Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di

Dettagli

Rdppuseutazioni gnafiche

Rdppuseutazioni gnafiche Rdppuseutazioni gnafiche . Rappresentazioni grafiche Domenico Vistocco vistocco@unicas.it Dipartimento di Scienze Economiche UNIVERSITÀ DI CASSINO Corso di Statistica Le elaborazioni e i grafici sono stati

Dettagli

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Esercizio 1 Efficacia di un disinfettante I dati della Tabella 1 mostrano i conteggi relativi alla presenza o meno

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 9 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Analisi di regressione: Cambiamenti di scala Schema generale sull analisi

Dettagli

Analisi bivariata. Il caso di caratteri quantitativi

Analisi bivariata. Il caso di caratteri quantitativi Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma

Dettagli

Regressione lineare semplice. Strumenti quantitativi per la gestione

Regressione lineare semplice. Strumenti quantitativi per la gestione Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html#(1) 1/33 Regressione lineare (RL) La RL è uno degli

Dettagli

ESPLORAZIONE DEI DATI (parte 1) 1 / 21

ESPLORAZIONE DEI DATI (parte 1) 1 / 21 ESPLORAZIONE DEI DATI (parte 1) 1 / 21 Variabili 2 / 21 Una variabile è una caratteristica oggetto di osservazione in uno studio. Variabili 2 / 21 Una variabile è una caratteristica oggetto di osservazione

Dettagli

Data Import e Probabilità. Renato Mainetti

Data Import e Probabilità. Renato Mainetti Data Import e Probabilità Renato Mainetti Importare dati in Matlab: Abbiamo visto come sia possibile generare array e matrici di dati. Per ora abbiamo sempre inserito i dati manualmente o utilizzando metodi

Dettagli

Cosa sono gli Script (m-file) Script Semplici programmi. Fino ad ora, i comandi sono stati sempre digitati nella command window:

Cosa sono gli Script (m-file) Script Semplici programmi. Fino ad ora, i comandi sono stati sempre digitati nella command window: Script Semplici programmi Cosa sono gli Script (m-file) Fino ad ora, i comandi sono stati sempre digitati nella command window: Eseguiti premendo enter Modificati utilizzando le frecce o la command history

Dettagli

Analisi in componenti principali

Analisi in componenti principali Capitolo 2 Analisi in componenti principali 2.1 Introduzione L analisi in componenti principali è una tecnica di analisi multivariata tra le più diffuse. Viene utilizzata quando nel dataset osservato sono

Dettagli

Il proprietario di una catena di negozi vuole confrontare il reddito (in euro) dei suoi 5 negozi, riportato nella seguente tabella

Il proprietario di una catena di negozi vuole confrontare il reddito (in euro) dei suoi 5 negozi, riportato nella seguente tabella Primo esempio (es. 2.1) Il proprietario di una catena di negozi vuole confrontare il reddito (in euro) dei suoi 5 negozi, riportato nella seguente tabella Negozio Reddito Negozio 1 21.500,00 Negozio 2

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare

Dettagli

L ambiente grafico di R

L ambiente grafico di R L ambiente grafico di R Giorgio Valentini e mail: valentini@dsi.unimi.it DSI Dipartimento di Scienze dell Informazione Università degli Studi di Milano 1 Rappresentazioni grafiche in R Il linguaggio R

Dettagli

L ambiente grafico di R

L ambiente grafico di R L ambiente grafico di R Il linguaggio R è dotato di un ambiente grafico potente e versatile E semplice produrre grafici per l analisi esplorativa dei dati Si possono facilmente generare grafici di elevata

Dettagli

Matlab: Script e Funzioni

Matlab: Script e Funzioni Matlab: Script e Funzioni Informatica B Script Cos è uno script (m-file) q Uno script è un file di testo contenente una sequenza di comandi MATLAB non deve contenere caratteri di formattazione (solo testo

Dettagli

STATISTICA. Esercizi

STATISTICA. Esercizi STATISTICA Esercizi Esercizio 188 In vista di un referendum sulle energie rinnovabili si monitorano le opinioni in un campione casuale di 1600 soggetti nel mese di Agosto e in quelle di Ottobre, con i

Dettagli

2005 AC Auction Results

2005 AC Auction Results Day_# Year Make Model Reserve HIGHBID SOLD 1200 1969 Corvette $14,500.00 $10,750.00 FALSE 1201 1969 Mustang Coupe $8,500.00 $4,500.00 FALSE 1202 1983 Chevrolet Monte Carlo $8,500.00 $7,400.00 FALSE 1203

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna

Dettagli

R - Esercitazione 2. Andrea Fasulo 20 Ottobre Università Roma Tre

R - Esercitazione 2. Andrea Fasulo 20 Ottobre Università Roma Tre R - Esercitazione 2 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre 20 Ottobre 2017 det(), solve() : calcolano determinante e inverso di una matrice quadrata. t() genera la matrice trasposta.

Dettagli

K-means clustering con R

K-means clustering con R K-means clustering con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l-10_cluster_k-means.html#(1) 1/10 Introduzione K-means è un approccio semplice ed elegante

Dettagli

Indice generale. Introduzione. Capitolo 1 Essere uno scienziato dei dati... 1

Indice generale. Introduzione. Capitolo 1 Essere uno scienziato dei dati... 1 Introduzione...xi Argomenti trattati in questo libro... xi Dotazione software necessaria... xii A chi è rivolto questo libro... xii Convenzioni utilizzate... xiii Scarica i file degli esempi... xiii Capitolo

Dettagli

Data Import pulizia dati e Probabilità. Renato Mainetti

Data Import pulizia dati e Probabilità. Renato Mainetti Data Import pulizia dati e Probabilità Renato Mainetti Importare dati in Matlab: Abbiamo visto come sia possibile generare array e matrici di dati. Per ora abbiamo sempre inserito i dati manualmente o

Dettagli

ANALISI DELLA VARIANZA

ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di

Dettagli

Laboratorio di ST1 Lezione 2

Laboratorio di ST1 Lezione 2 Laboratorio di ST1 Lezione 2 Claudia Abundo Dipartimento di Matematica Università degli Studi Roma Tre Frequenze in R ESEMPIO Fiori preferiti da n=6 ragazze In R: fiori=c("rosa", "orchidea", "violetta",

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 6-Altre tecniche per descrivere insiemi di dati (vers. 1.0c, 27 marzo 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli

L ambiente grafico di R

L ambiente grafico di R Università degli Studi di Milano Laurea Specialistica in Genomica Funzionale e Bioinformatica Corso di Linguaggi di Programmazione per la Bioinformatica L ambiente grafico di R Giorgio Valentini e mail:

Dettagli

Q1 = /4 0 4 = Me = /2 4 = 3

Q1 = /4 0 4 = Me = /2 4 = 3 Soluzioni Esercizi Capitolo - versione on-line Esercizio.: Calcoliamo le densità di frequenza x i x i+1 n i N i a i l i F i 0 1 4 4 1 4/1=4 4/10 = 0.4 1 5 6 4 /4=0.5 6/10 = 0.6 5 10 4 10 5 4/5=0.8 10/10

Dettagli

Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area.

Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area. Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area. Soluzione. Ricordiamo che i comandi per ottenere (a livello simulativo) la distribuzione di COR sono (ad es.

Dettagli

Introduzione all Analisi Esplorativa dei Dati mediante R 1

Introduzione all Analisi Esplorativa dei Dati mediante R 1 Introduzione all Analisi Esplorativa dei Dati mediante R 1 Giovanna Menardi Giovanna.Menardi@econ.units.it A.A. 2008/2009 1 Materiale liberamente tratto da appunti a cura di M. Trevisani. Menardi Lezione

Dettagli

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi Esplorazione dei dati Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi Analisi mono e bivariata Si utilizzano indicatori sintetici che individuano, con un singolo valore, proprieta`

Dettagli