Grafici in R Strumenti quantitativi per la gestione
|
|
- Agnese Berardi
- 5 anni fa
- Visualizzazioni
Transcript
1 Grafici in R Strumenti quantitativi per la gestione Emanuele Taufer Caricare il dataset da una libreria Plot Boxplot Istogramma Scatterplot matrice Disegnare linee aggiuntive Caricare il dataset da una libreria Carichiamo il file Auto dalla libreria ISLR (da installare) library(islr) data(auto) head(auto) mpg cylinders displacement horsepower weight acceleration year origin name 1 chevrolet chevelle malibu 2 buick skylark plymouth satellite 4 amc rebel sst 5 ford torino 6 ford galaxie 500 names e str ci danno informazioni sulle variabili contenute nel file names(auto) ## [1] "mpg" "cylinders" "displacement" "horsepower" ## [5] "weight" "acceleration" "year" "origin" ## [9] "name" str(auto) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 1/17
2 ## 'data.frame': 392 obs. of 9 variables: ## $ mpg : num ## $ cylinders : num ## $ displacement: num ## $ horsepower : num ## $ weight : num ## $ acceleration: num ## $ year : num ## $ origin : num ## $ name : Factor w/ 304 levels "amc ambassador brougham",..: Plot Possiamo usare la funzione plot() per produrre uno scatterplot di variabili quantitative. Tuttavia, digitando semplicemente i nomi delle variabili si produrrà un messaggio d errore, perché R non sa dove cercare i dati. L istruzione corretta è plot(auto$cylinders, Auto$mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 2/17
3 In alternativa è possibile istruire R per cercare i dati nel file Auto con la funzione attach() attach(auto) plot(cylinders, mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 3/17
4 Boxplot La variabile cylinders è memorizzata come un vettore numerico, e quindi R la tratta come quantitativa. Tuttavia, poiché vi sono solo un piccolo numero di possibili valori per cylinders, può essere preferibile trattare la variabile cylinders come qualitativa. La funzione as.factor() converte le variabili quantitative in qualitative cylinders = as.factor (cylinders) Se la variabile tracciata sull asse x è categorica, allora la funzione plot() produrrà automaticamente un boxplot. Alcuni esempi, con diverse opzioni, di seguito. L opzione varwidth=true produce boxplot con largehzza proporzionale alla radice della dimensione del gruppo. plot(cylinders, mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 4/17
5 plot(cylinders, mpg, col="red") file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 5/17
6 plot(cylinders, mpg, col="red", varwidth=t) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 6/17
7 plot(cylinders, mpg, col="red", varwidth=t,horizontal=t) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 7/17
8 plot(cylinders, mpg, col="red", varwidth=t, xlab="cylinders", ylab="mpg") file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 8/17
9 Istogramma la funzione hist() produce istogrammi hist(mpg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 9/17
10 hist(mpg,col=2) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 10/17
11 hist(mpg,col=2,breaks=15) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 11/17
12 Scatterplot matrice La funzione pairs() produce scatter plot di tutte le variabili di un dataset pairs(auto) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 12/17
13 pairs(~ mpg + displacement + horsepower + weight + acceleration, Auto) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 13/17
14 Disegnare linee aggiuntive Linee aggiuntive possono essere inserite nel grafico con la funzione abline(a,b) dove a indica l intercetta, b la pendenza plot(horsepower,mpg) abline(40, 0.15) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 14/17
15 plot(horsepower,mpg) abline(v=150) abline(h=20) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 15/17
16 La retta ottenuta dalla funzione lm può essere tracciata richiamando l oggetto output di lm reg< lm(mpg~horsepower) plot(horsepower,mpg) abline(reg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 16/17
17 file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/lab_1_ _grafici.html 17/17
Validazione dei modelli. Strumenti quantitativi per la gestione
Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l5-validazione.html#(1) 1/27 Validazione dei modelli In questo esempio
DettagliValidazione dei modelli Strumenti quantitativi per la gestione
Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test
DettagliR - base Emanuele Taufer
R - base Emanuele Taufer Contents Preliminari................................................. 1 Oggetti................................................... 1 Oggetti - 2.................................................
DettagliClassificazione k-nn con R. Strumenti quantitativi per la gestione
Classificazione k-nn con R Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l1-knn.html#(1) 1/16 Altezza e peso degli adulti Le statistiche sull
DettagliRegressione. Monica Marabelli. 15 Gennaio 2016
Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione
DettagliINTRODUZIONE A R. Dott. Giuseppe Sgroi Dipartimento di Matematica e Informatica 29 Maggio 2019
INTRODUZIONE A R Dott. Giuseppe Sgroi Dipartimento di Matematica e Informatica giuseppe.sgroi@unict.it 29 Maggio 2019 COS È R? R è un software OpenSource, che può essere definito come un sistema di analisi
DettagliClustering gerarchico con R
Clustering gerarchico con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l-10_cluster_h-clust.html#(1) 1/10 Clustering gerarchico in R La funzione di base per
DettagliAnalisi esplorativa dei dati - Iris data set Emanuele Taufer
Analisi esplorativa dei dati - Iris data set Emanuele Taufer Contents Iris flower data............................................... 1 Iris Setosa.................................................. 1 Iris
DettagliRappresentazioni grafiche
Rappresentazioni grafiche Domenico Vistocco vistocco@unicas.it Dipartimento di Scienze Economiche UNIVERSITÀ DI CASSINO Corso di Statistica Le elaborazioni e i grafici sono stati ottenuti con il software
DettagliRappresentazioni grafiche
Rappresentazioni grafiche Domenico Vistocco vistocco@unicas.it Dipartimento di Scienze Economiche UNIVERSITÀ DI CASSINO Corso di Statistica Le elaborazioni e i grafici sono stati ottenuti con il software
DettagliIntroduzione al software R
Introduzione al software R 1 1 Università di Napoli Federico II cristina.tortora@unina.it il software R Si tratta di un software molto flessibile che permette di compiere praticamente qualsiasi tipo di
DettagliModelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione
Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare
DettagliRegressione ridge e LASSO Strumenti quantitativi per la gestione
Regressione ridge e LASSO Strumenti quantitativi per la gestione Emanuele Taufer Dati Credit.csv La funzione glmnet() La funzione model.matrix() Regressione ridge Output CV Ridge Output Regressione LASSO
DettagliAlberi di decisione con R
Alberi di decisione con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l8-alberi_di_decisione.html#(1) 1/14 Implementare gli alberi decisionali con R Per adattare
DettagliEsercitazione finale - corso R base Francesco Vidoli Ottobre 2018
Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Passo 1: Leggere il file di input (il file si trova a questo indirizzo: https://fvidoli.weebly.com/uploads/2/3/0/8/ 23088460/dati_medici.csv),
DettagliAnalisi discriminante in R Strumenti quantitativi per la gestione
Analisi discriminante in R Strumenti quantitativi per la gestione Emanuele Taufer Default data LDA con R Output Plot Previsione Tabella di classificazione Cambiare il criterio di classificazione Costruire
DettagliQuiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione
Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Le domande 1-6 si riferiscono al seguente problema Un data set contiene i dati sui consumi di diversi tipi di automobili e alcune loro
DettagliModelli con predittori qualitativi e modelli con interazioni
Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari
DettagliAnalisi delle Componenti Principali con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi delle Componenti
Dettagli1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)
1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) Riprendiamo l esempio X = seq(-5,5,0.01) Y= dnorm(x) plot(x,y) Si poteva automatizzare la scelta delle X ponendo: X=rnorm(1000)
DettagliR - Esercitazione 3. Lorenzo Di Biagio Venerdì 25 Ottobre Università Roma Tre
R - Esercitazione 3 Lorenzo Di Biagio dibiagio@mat.uniroma3.it Università Roma Tre Venerdì 25 Ottobre 2013 Grafica (1) I comandi grafici in R si distinguono in alto e basso livello. I comandi di alto livello
DettagliStatistiche di sintesi
Esercizio 2 E stato condotto uno studio per valutare la variazione della pressione sistolica in funzione dell etá. I dati sono riportati nel file sbp.xls. Effettua un analisi di regressione e disegna gli
DettagliLaboratorio di Statistica e Analisi Dati: Lezione 5
Laboratorio di Statistica e Analisi Dati: Lezione 5 Tommaso C. & Marco G. 23-25 Novembre 2016 News Faq su come interagire con le slide.html Aggiunto link alla pagina principale IDE Corretto il calendario
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliEsplorazione grafica di dati multivariati. N. Del Buono
Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)
DettagliParametri grafici in R
Parametri grafici in R Corso di Bioinformatica Nicola Vitacolonna Corso di Laurea in Biotecnologie Grafici esplorativi vs grafici finali Durante l'esplorazione dei dati non è necessario preoccuparsi troppo
DettagliStatistica descrittiva bivariata Massimo Aria
Statistica descrittiva bivariata Massimo Aria TABELLE DI CONTINGENZA # importare il dataframe automobile (fonte UCI Machine Learning repository) df=read.table("http://www.massimoaria.com/laboratorio/automobile.csv",header=true,sep=";",dec=",")
DettagliIstruzioni per l analisi in componenti principali con R
Istruzioni per l analisi in componenti principali con R Vi ricordo che in nero sono state inserite le note e in rosso le istruzioni da digitare sulla console di R Importare il dataset gelati
DettagliINTRODUZIONE A R Lezione 3
INTRODUZIONE A R Lezione 3 Silvia Bacci e Silvia Pandolfi 1 Creare grafici in R R consente di realizzare, con semplicità, grafici di qualità professionale. Questi sono poi esportabili come file in numerosi
DettagliSTATISTICA PER LA DIGITAL ECONOMY 2017
STATISTICA PER LA DIGITAL ECONOMY 2017 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 11.00-13.00 (frontale) GIO 9.00-11.00 (frontale) VEN 11.00-13.00 (laboratorio) Ricevimento
DettagliIntroduzione a R. Silvia Parolo. 14 November 2014
Introduzione a R Silvia Parolo 14 November 2014 Cos è R?? è un tool per l analisi di dati è anche un linguaggio di programmazione si può scaricare da http: // www. r-project. org/ primi passi in R R può
DettagliSTATISTICA PER LA DIGITAL ECONOMY Marco Riani
STATISTICA PER LA DIGITAL ECONOMY 2018 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 11.15-12.45 (frontale) GIO 9.15-10.45 (frontale) VEN 11.00-13.00 (laboratorio) Ricevimento
DettagliRegressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I
DettagliUniversità degli Studi di Milano
Università degli Studi di Milano Laurea Specialistica in Genomica Funzionale e Bioinformatica Corso di Linguaggi di Programmazione per la Bioinformatica Data frame Giorgio Valentini e mail: valentini@dsi.unimi.it
DettagliExcel: parte II. Davide Sardina
Excel: parte II Davide Sardina davidestefano.sardina@unikore.it Università degli studi di Enna Kore Corso di Laurea in Scienze delle Attività Motorie e Sportive A.A. 2017/2018 Grafici in Excel I grafici
DettagliEsercitazione n 2 Costruzione di grafici
Esercitazione n 2 Costruzione di grafici 1/31 I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e
DettagliData frame. Università degli Studi di Milano
Università degli Studi di Milano Laurea Specialistica in Genomica Funzionale e Bioinformatica Corso di Linguaggi di Programmazione per la Bioinformatica Data frame Giorgio Valentini e mail: valentini@dsi.unimi.it
DettagliIntroduzione a R. Monica Marabelli. 30 Ottobre 2015
Introduzione a R Monica Marabelli 30 Ottobre 2015 Cos é R? R é un programma utile per l analisi dei dati R puó essere utilizzato per: elaborare dati svolgere analisi statistiche effettuare rappresentazioni
DettagliSelezione del modello Strumenti quantitativi per la gestione
Selezione del modello Strumenti quantitativi per la gestione Emanuele Taufer Migliorare il modello di regressione lineare (RL) Metodi Selezione Best subset Selezione stepwise Stepwise forward Stepwise
Dettagli2- età frequenze tabella di frequenza con anche cumulate + diagrammi a bastoncini
Prima lezione Esempio di dati Indagine medica Id Sesso Età Razza Fumatore Pressione Sanguigna Presenza di calcio nel sangue 1 M 46 altro sì 90 10.04 2 M 45 asiatico sì 102 9.66 3 F 45 nero sì 91 9.94 4
DettagliModulo III - Rappresentazione grafica
Modulo III - Rappresentazione grafica Elisabetta Ronchieri Università di Ferrara Dipartimento di Economia e Management e-mail: elisabetta.ronchieri@unife.it 24 Novembre 2016 Elisabetta Ronchieri Modulo
DettagliEsercitazione con R 9 Maggio 2006
Esercitazione con R 9 Maggio 2006 Iniziamo con alcuni comandi standard di R che risulteranno utili nell analisi delle serie storiche. Help Vi sono vari comandi che si possono digitare per lanciare una
DettagliLaboratorio 1 Strumenti quantitativi per la gestione
Laboratorio 1 Strumenti quantitativi per la gestione Emanuele taufer Lab: Introduzione a R Comandi di base Lab: Introduzione a R Comandi di base R utilizza funzioni per eseguire le operazioni. Per eseguire
DettagliMulticollinearità. Strumenti quantitativi per la gestione
Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità
DettagliLaboratorio di Statistica e Analisi Dati: Lezione 6
Laboratorio di Statistica e Analisi Dati: Lezione 6 Tommaso C. & Marco G. 30 Novembre - 2 Dicembre 2016 Esercizio1 1. Importare il dataset autos.csv 2. Visualizzare le struttura e le prime 6 righe 3. Modificare
DettagliSTATISTICA PER LA DIGITAL ECONOMY Marco Riani
STATISTICA PER LA DIGITAL ECONOMY 2018 Marco Riani mriani@unipr.it http://www.riani.it Ponderazione delle unità Unità statistiche: con la stessa importanza con importanza diversa: ponderazione Vettore
DettagliProf. Marco Masseroli
Facoltà di Ingegneria Industriale Laurea in Ingegneria Energetica, Meccanica e dei Trasporti Dipartimento di Elettronica e Informazione Informatica B Prof. Marco Masseroli Indice Laboratorio 4: Linguaggio
DettagliRappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
DettagliLaboratorio di Statistica e Analisi dei Dati
Laboratorio di Statistica e Analisi dei Dati Nicolò Campolongo Università degli Studi di Milano nicolo.campolongo@unimi.it November 16, 2018 Nicolò Campolongo (UniMi) Lezione 3 November 16, 2018 1 / 17
DettagliTabelle di variabili categoriche e Test CHI-quadro
Tabelle di variabili categoriche e Test CHI-quadro Relazioni tra variabili categoriche Vogliamo un metodo per studiare eventuali relazioni tra variabili categoriche Per esempio vogliamo studiare come l
DettagliLaboratorio di Statistica Aziendale Modello di regressione lineare semplice
Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto michela.pasetto2@unibo.it Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa
DettagliLAB LEZ. 1 STATISTICA DESCRITTIVA CON R
LAB LEZ. 1 STATISTICA DESCRITTIVA CON R 1 2 L AMBIENTE DI SVILUPPO DI RStudio 1 3 4 2 1 FINESTRA PER CREARE E SALVARE FILE.R 2 CONSOLE DEI COMANDI 3 VARIABILI PRESENTI NELLA MEMORIA DEL PROGRAMMA E CRONOLOGIA
DettagliBagging e Foreste Casuali con R
Bagging e Foreste Casuali con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l8-bagging-fc.html#(10) 1/10 Bagging e Foreste casuali con R Utilizziamo ancora una
DettagliCapitolo 2 Analisi delle serie storiche. Analisi grafiche, numeriche e pattern tipici
Capitolo 2 Analisi delle serie storiche. Analisi grafiche, numeriche e pattern tipici 1 Una precisazione: dati cross section e serie storiche Dati cross section (trasversali): tutte le osservazioni si
DettagliLaboratorio di Calcolo Numerico Laboratorio 5: Scrittura su FILE. Soluzione di Equazioni non lineari
Laboratorio di Calcolo Numerico Laboratorio 5: Scrittura su FILE. Soluzione di Equazioni non lineari Claudia Zoccarato E-mail: claudia.zoccarato@unipd.it Dispense: Moodle Dipartimento ICEA 05 Aprile 2017
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliEsplorazione grafica di dati multivariati. N. Del Buono
Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)
DettagliLezione precedente. D. Fioredistella IEZZI
Lezione precedente Installazione del software R Costanti e vettori: R lavora con valori, stringhe di caratteri, vettori e matrici, che vengono assegnati alle variabili con opportuni comandi. Ad esempio,
DettagliINTRODUZIONE A R Lezione 4
INTRODUZIONE A R Lezione 4 Silvia Bacci e Silvia Pandolfi 1 La regressione lineare 1.1 Regressioni lineare semplice Per applicare il metodo di regressione lineare scegliamo il dataset cars relativo alle
DettagliCorso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica
Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()
DettagliCriteri di Valutazione della scheda (solo a carattere indicativo)
Criteri di Valutazione della scheda (solo a carattere indicativo) Previsioni - A Sono state fatte le previsioni e discussi i valori attesi insieme al ragionamento con cui sono stati calcolati? E stata
Dettagli1.1 Iniziare e chiudere una sessione di R
Laboratorio 1 Introduzione a R 1.1 Iniziare e chiudere una sessione di R Per iniziare una sessione R fare un doppio click di mouse sulla icona di R. Per uscire da R, usa q(). Per salvare i dati rispondere
DettagliLaboratorio di Calcolo Numerico
Laboratorio di Calcolo Numerico Lezione 4 Padova, April 12nd 2016 F. Piazzon Department of Mathematics. Doctoral School in Mathematical Sciences, Applied Mathematics Area Outline Lab. 4-2 of 9 1 Matlab:
DettagliRadici. Ricominciare dalle proprie risorse GIUGNO 2010
P E R I O D I C O D I I N F O R M A Z I O N E D E L L A M M I N I S T R A Z I O N E C O M U N A L E GIUGNO 2010 NUMERO 01 ANNO IL TRIMESTRALE DEL I Comune di Rio nell Elba Registrazione presso il Tribunale
DettagliInformazione, devianza e verosimiglianza con il linguaggio R
Informazione, devianza e verosimiglianza con il linguaggio R Partiamo dal dataset studenti: www = "https://goo.gl/rdrnff" Carichiamolo in R: studenti = read.table( www, header = TRUE ) attach(studenti)
DettagliCereal data- analisi con gli alberi di classificazione
Cereal data- analisi con gli alberi di classificazione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l8-cereal-tree.html#(1) 1/32 Cereal.dat Per migliorare la commercializzazione
DettagliWe model for you. Proposta agli istituti di ricerca che operano in Italia Marzo 2013
Servicing di elaborazione indagini Proposta agli istituti di ricerca che operano in Italia Marzo 2013 Servicing di elaborazione indagini Da alcuni anni GMR svolge un attività di servicing esterno ad alcuni
DettagliStatistica multivariata Donata Rodi 21/11/2016
Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di
DettagliRdppuseutazioni gnafiche
Rdppuseutazioni gnafiche . Rappresentazioni grafiche Domenico Vistocco vistocco@unicas.it Dipartimento di Scienze Economiche UNIVERSITÀ DI CASSINO Corso di Statistica Le elaborazioni e i grafici sono stati
DettagliCorso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice
Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Esercizio 1 Efficacia di un disinfettante I dati della Tabella 1 mostrano i conteggi relativi alla presenza o meno
DettagliLaboratorio di Probabilità e Statistica
Laboratorio di Probabilità e Statistica lezione 9 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Analisi di regressione: Cambiamenti di scala Schema generale sull analisi
DettagliAnalisi bivariata. Il caso di caratteri quantitativi
Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma
DettagliRegressione lineare semplice. Strumenti quantitativi per la gestione
Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html#(1) 1/33 Regressione lineare (RL) La RL è uno degli
DettagliESPLORAZIONE DEI DATI (parte 1) 1 / 21
ESPLORAZIONE DEI DATI (parte 1) 1 / 21 Variabili 2 / 21 Una variabile è una caratteristica oggetto di osservazione in uno studio. Variabili 2 / 21 Una variabile è una caratteristica oggetto di osservazione
DettagliData Import e Probabilità. Renato Mainetti
Data Import e Probabilità Renato Mainetti Importare dati in Matlab: Abbiamo visto come sia possibile generare array e matrici di dati. Per ora abbiamo sempre inserito i dati manualmente o utilizzando metodi
DettagliCosa sono gli Script (m-file) Script Semplici programmi. Fino ad ora, i comandi sono stati sempre digitati nella command window:
Script Semplici programmi Cosa sono gli Script (m-file) Fino ad ora, i comandi sono stati sempre digitati nella command window: Eseguiti premendo enter Modificati utilizzando le frecce o la command history
DettagliAnalisi in componenti principali
Capitolo 2 Analisi in componenti principali 2.1 Introduzione L analisi in componenti principali è una tecnica di analisi multivariata tra le più diffuse. Viene utilizzata quando nel dataset osservato sono
DettagliIl proprietario di una catena di negozi vuole confrontare il reddito (in euro) dei suoi 5 negozi, riportato nella seguente tabella
Primo esempio (es. 2.1) Il proprietario di una catena di negozi vuole confrontare il reddito (in euro) dei suoi 5 negozi, riportato nella seguente tabella Negozio Reddito Negozio 1 21.500,00 Negozio 2
DettagliRegressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare
DettagliL ambiente grafico di R
L ambiente grafico di R Giorgio Valentini e mail: valentini@dsi.unimi.it DSI Dipartimento di Scienze dell Informazione Università degli Studi di Milano 1 Rappresentazioni grafiche in R Il linguaggio R
DettagliL ambiente grafico di R
L ambiente grafico di R Il linguaggio R è dotato di un ambiente grafico potente e versatile E semplice produrre grafici per l analisi esplorativa dei dati Si possono facilmente generare grafici di elevata
DettagliMatlab: Script e Funzioni
Matlab: Script e Funzioni Informatica B Script Cos è uno script (m-file) q Uno script è un file di testo contenente una sequenza di comandi MATLAB non deve contenere caratteri di formattazione (solo testo
DettagliSTATISTICA. Esercizi
STATISTICA Esercizi Esercizio 188 In vista di un referendum sulle energie rinnovabili si monitorano le opinioni in un campione casuale di 1600 soggetti nel mese di Agosto e in quelle di Ottobre, con i
Dettagli2005 AC Auction Results
Day_# Year Make Model Reserve HIGHBID SOLD 1200 1969 Corvette $14,500.00 $10,750.00 FALSE 1201 1969 Mustang Coupe $8,500.00 $4,500.00 FALSE 1202 1983 Chevrolet Monte Carlo $8,500.00 $7,400.00 FALSE 1203
DettagliCorrelazione e regressione
Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna
DettagliR - Esercitazione 2. Andrea Fasulo 20 Ottobre Università Roma Tre
R - Esercitazione 2 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre 20 Ottobre 2017 det(), solve() : calcolano determinante e inverso di una matrice quadrata. t() genera la matrice trasposta.
DettagliK-means clustering con R
K-means clustering con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l-10_cluster_k-means.html#(1) 1/10 Introduzione K-means è un approccio semplice ed elegante
DettagliIndice generale. Introduzione. Capitolo 1 Essere uno scienziato dei dati... 1
Introduzione...xi Argomenti trattati in questo libro... xi Dotazione software necessaria... xii A chi è rivolto questo libro... xii Convenzioni utilizzate... xiii Scarica i file degli esempi... xiii Capitolo
DettagliData Import pulizia dati e Probabilità. Renato Mainetti
Data Import pulizia dati e Probabilità Renato Mainetti Importare dati in Matlab: Abbiamo visto come sia possibile generare array e matrici di dati. Per ora abbiamo sempre inserito i dati manualmente o
DettagliANALISI DELLA VARIANZA
ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di
DettagliLaboratorio di ST1 Lezione 2
Laboratorio di ST1 Lezione 2 Claudia Abundo Dipartimento di Matematica Università degli Studi Roma Tre Frequenze in R ESEMPIO Fiori preferiti da n=6 ragazze In R: fiori=c("rosa", "orchidea", "violetta",
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 6-Altre tecniche per descrivere insiemi di dati (vers. 1.0c, 27 marzo 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliL ambiente grafico di R
Università degli Studi di Milano Laurea Specialistica in Genomica Funzionale e Bioinformatica Corso di Linguaggi di Programmazione per la Bioinformatica L ambiente grafico di R Giorgio Valentini e mail:
DettagliQ1 = /4 0 4 = Me = /2 4 = 3
Soluzioni Esercizi Capitolo - versione on-line Esercizio.: Calcoliamo le densità di frequenza x i x i+1 n i N i a i l i F i 0 1 4 4 1 4/1=4 4/10 = 0.4 1 5 6 4 /4=0.5 6/10 = 0.6 5 10 4 10 5 4/5=0.8 10/10
DettagliEsercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area.
Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area. Soluzione. Ricordiamo che i comandi per ottenere (a livello simulativo) la distribuzione di COR sono (ad es.
DettagliIntroduzione all Analisi Esplorativa dei Dati mediante R 1
Introduzione all Analisi Esplorativa dei Dati mediante R 1 Giovanna Menardi Giovanna.Menardi@econ.units.it A.A. 2008/2009 1 Materiale liberamente tratto da appunti a cura di M. Trevisani. Menardi Lezione
DettagliEsplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi
Esplorazione dei dati Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi Analisi mono e bivariata Si utilizzano indicatori sintetici che individuano, con un singolo valore, proprieta`
Dettagli