Analisi delle CP. Dati USArrests

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Analisi delle CP. Dati USArrests"

Transcript

1 Analisi delle CP Dati USArrests Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 1/12

2 Dati USArrests Per ciascuno dei 50 stati degli USA, il set di dati contiene il numero di arresti per residenti per ognuno dei tre reati: Rapina (Assault), Omicidio (Murder) e Stupro (Rape). La variabile UrbanPop indica la percentuale di popolazione nelle aree urbane. data(usarrests) head(usarrests) Murder Assault UrbanPop Rape Alabama Alaska Arizona Arkansas California Colorado file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 2/12

3 Descrittive summary(usarrests) Murder Assault UrbanPop Rape Min. : Min. : 45.0 Min. :32.00 Min. : st Qu.: st Qu.: st Qu.: st Qu.:15.07 Median : Median :159.0 Median :66.00 Median :20.10 Mean : Mean :170.8 Mean :65.54 Mean : rd Qu.: rd Qu.: rd Qu.: rd Qu.:26.18 Max. : Max. :337.0 Max. :91.00 Max. :46.00 apply(usarrests,2,var) Murder Assault UrbanPop Rape file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 3/12

4 PCA La PCA (non PCR) può essere effettuata con la funzione prcomp() pr.out<-prcomp(usarrests,scale=true) names(pr.out) [1] "sdev" "rotation" "center" "scale" "x" rotation: la matrice dei pesi dei fattori x: la matrice dei punteggi fattoriali stdev: la deviazione standard di ciascun componente file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 4/12

5 Summary summary(pr.out) ## Importance of components: ## PC1 PC2 PC3 PC4 ## Standard deviation ## Proportion of Variance ## Cumulative Proportion file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 5/12

6 Pesi delle CP pr.out$rotation PC1 PC2 PC3 PC4 Murder Assault UrbanPop Rape PC1: pesi più elevati sulle tre variabili Murder, Assault e Rape. Potrebbe essere interpretata come misura del tasso generale di crimini violenti PC2: peso più elevato a UrbanPop. Livello di urbanizzazione. Le CP sono determinate univocamente a parte il segno del coefficiente (positivo o negativo) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 6/12

7 Punteggi fattoriali Osserviamo i punteggi delle CP 1 e 2 per i primi dieci stati (in ordine alfabetico) pr.out$x[1:10,1:2] PC1 PC2 Alabama Alaska Arizona Arkansas California Colorado Connecticut Delaware Florida Georgia file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 7/12

8 Biplot biplot(pr.out,scale=0) Grafico che riporta sia gli scores che i pesi dei fattori delle prime due CP file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 8/12

9 Personalizzare il biplot st<-c(1,2,10,18,24,33,40,42) biplot(pr.out$x[st,],pr.out$rotation[1:2,],expand=2, xlim =c(0,3),ylim =c(-3,0)) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 9/12

10 PVE Codice per calcolare la percentuale di varianza spiegata (PVE), semplice e cumulata pr.var =pr.out$sdev^2 pve=pr.var/sum(pr.var ) pve [1] cumsum(pve) [1] file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 10/12

11 Grafici par(mfrow=c(1,2)) plot(pve, xlab=" Principal Component ", ylab=" Proportion of Variance Explained ", ylim=c(0,1),type='b',pch=20,col="red",lwd=2) plot(cumsum (pve ), xlab=" Principal Component ", ylab =" Cumulative Proportion of Variance Explained ", ylim=c(0,1), type='b',pch=20,col="blue",lwd=2) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 11/12

12 Riferimenti bibliografici An Introduction to Statistical Learning, with applications in R. (Springer, 2013) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 12/12

L'analisi in componenti principali

L'analisi in componenti principali 26/07/2019 09:01 1/16 L'analisi in componenti principali L'analisi in componenti principali L analisi in componenti principali è una tecnica fattoriale di analisi multivariata dei dati. Una presentazione

Dettagli

L'analisi in componenti principali

L'analisi in componenti principali 20/08/2017 05:38 1/16 L'analisi in componenti principali L'analisi in componenti principali L analisi in componenti principali è una tecnica fattoriale di analisi multivariata dei dati. Una presentazione

Dettagli

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/6c_pca.html#(1) 1/25 Introduzione Gli approcci

Dettagli

Elementi di statistica

Elementi di statistica Elementi di statistica Summer School: Data journalism e visualizzazione grafica dei dati! Flavon - 30 Agosto 2011! La statistica! Chi vi sta parlando? 2 La statistica! Chi vi sta parlando?! Cos è la Statistica?

Dettagli

Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60 minuti

Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60 minuti 3 Luglio 2018 - Analisi Esplorativa Cognome:... Nome: Matricola:... Tipologia d esame: 12 CFU 15 CFU Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60

Dettagli

Alberi di decisione con R

Alberi di decisione con R Alberi di decisione con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l8-alberi_di_decisione.html#(1) 1/14 Implementare gli alberi decisionali con R Per adattare

Dettagli

Stati Uniti d'america

Stati Uniti d'america 6 Febbraio 2019 - Analisi Esplorativa Cognome:................................................... Nome:...................................................... Matricola:...................................................

Dettagli

Regressione K-Nearest Neighbors. Strumenti quantitativi per la gestione

Regressione K-Nearest Neighbors. Strumenti quantitativi per la gestione Regressione K-Nearest Neighbors Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 1/13 Regressione non parametrica

Dettagli

Regressione lineare semplice. Strumenti quantitativi per la gestione

Regressione lineare semplice. Strumenti quantitativi per la gestione Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html#(1) 1/33 Regressione lineare (RL) La RL è uno degli

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice

Dettagli

Regressione con componenti principali (PCR) Strumenti quantitativi per la gestione

Regressione con componenti principali (PCR) Strumenti quantitativi per la gestione Regressione con componenti principali (PCR) Strumenti quantitativi per la gestione Emanuele Taufer Dati Hitters Eliminare le righe con dati mancanti PCR Variabili nell oggetto creato da pcr() Coefficienti

Dettagli

Misure di dispersione (o di variabilità)

Misure di dispersione (o di variabilità) 08/04/014 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x 9 range31-74 x 9 range50-941

Dettagli

1/55. Statistica descrittiva

1/55. Statistica descrittiva 1/55 Statistica descrittiva Organizzare e rappresentare i dati I dati vanno raccolti, analizzati ed elaborati con le tecniche appropriate (organizzazione dei dati). I dati vanno poi interpretati e valutati

Dettagli

Analisi delle Componenti Principali con R

Analisi delle Componenti Principali con R Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi delle Componenti

Dettagli

Prova scritta di ASM - Modulo Analisi Esplorativa del

Prova scritta di ASM - Modulo Analisi Esplorativa del Cognome:... Nome:... Matricola:......... Prova scritta di ASM - Modulo Analisi Esplorativa del 14.02.2017 La durata della prova è di 90 minuti. Si svolgano gli esercizi A e B riportando il risultato dove

Dettagli

Analisi in Componenti Principali

Analisi in Componenti Principali Analisi in Componenti Principali 1/20 Analisi in Componenti Principali tecnica di riduzione e interpretazione dei dati spesso gioca un ruolo ausiliario rispetto ad altre tecniche (es. analisi fattoriale,

Dettagli

STATISTICA. I modelli probabilistici

STATISTICA. I modelli probabilistici STATISTICA I modelli probabilistici I modelli probabilistici Statistica-1b-probabilità I modelli probabilistici Numero di volte in cui esce T in lanci Numero di lanci prima che esca T Somma del punteggio

Dettagli

Analisi in Componenti Principali

Analisi in Componenti Principali Analisi in Componenti Principali 1/20 Analisi in Componenti Principali Analisi in Componenti Principali 1/20 Analisi in Componenti Principali tecnica di riduzione e interpretazione dei dati spesso gioca

Dettagli

Misure di dispersione (o di variabilità)

Misure di dispersione (o di variabilità) 14/1/01 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x = 9 range=31-7=4 x = 9 range=50-9=41

Dettagli

Laboratorio di ST1 - Lezione 7. Antonietta di Salvatore. Dipartimento di Matematica Universitá degli Studi Roma Tre

Laboratorio di ST1 - Lezione 7. Antonietta di Salvatore. Dipartimento di Matematica Universitá degli Studi Roma Tre Laboratorio di ST1 - Lezione 7 Antonietta di Salvatore Dipartimento di Matematica Universitá degli Studi Roma Tre Outline Statistica descrittiva e grafici Verifica di ipotesi e intervalli di confidenza

Dettagli

Istruzioni per l analisi in componenti principali con R

Istruzioni per l analisi in componenti principali con R Istruzioni per l analisi in componenti principali con R Vi ricordo che in nero sono state inserite le note e in rosso le istruzioni da digitare sulla console di R Importare il dataset gelati

Dettagli

Analisi in Componenti principali (ACP)

Analisi in Componenti principali (ACP) Analisi in Componenti principali (ACP) Stefano Cabras s.cabras@unica.it 12 aprile 2010 Sommario Il problema principale dell analisi multivariata è quello della riduzione della dimensionalità del problema.

Dettagli

e applicazioni al dominio del Contact Management Andrea Brunello Università degli Studi di Udine

e applicazioni al dominio del Contact Management Andrea Brunello Università degli Studi di Udine e applicazioni al dominio del Contact Management Parte V: combinazione di Università degli Studi di Udine In collaborazione con dott. Enrico Marzano, CIO Gap srl progetto Active Contact System 1/10 Contenuti

Dettagli

1. SOLUZIONE ESERCIZIO RIASSUNTIVO. n=1000. Z1 = rnorm(n); Z2 = rnorm(n); plot(z1,z2) X1 = 3*Z1; X2 = Z2; plot(x1,x2)

1. SOLUZIONE ESERCIZIO RIASSUNTIVO. n=1000. Z1 = rnorm(n); Z2 = rnorm(n); plot(z1,z2) X1 = 3*Z1; X2 = Z2; plot(x1,x2) 1. SOLUZIONE ESERCIZIO RIASSUNTIVO n=1000 Z1 = rnorm(n); Z2 = rnorm(n); plot(z1,z2) X1 = 3*Z1; X2 = Z2; plot(x1,x2) theta = pi/10 A = matrix(nrow=2,ncol=2) A[1,1]= cos(theta) A[1,2]= -sin(theta) A[2,1]=

Dettagli

Variabili presenti nella base dati

Variabili presenti nella base dati Analisi della partecipazione delle donne sposate nella forza lavoro negli Stati Uniti nel 1975 Si consideri la seguente base di dati (file: ww.xls) costituita da 753 osservazioni su donne statunitensi

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

Studio di osservazione, perché non viene imposto nessun trattamento alle unità campionarie

Studio di osservazione, perché non viene imposto nessun trattamento alle unità campionarie ALCUNI ESERCIZI ASSEGNATI (3 e 6 crediti) NELLA SESSIONE DI LUGLIO CON RELATIVE SOLUZIONI ATTENZIONE I VALORI OTTENUTI NEI CALCOLI (OTTENUTI CON UN SOFTWARE STATISTICO) POSSONO DIFFERIRE DI POCO DA QUELLI

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Lezione 2

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Lezione 2 Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Lezione Campionamento ed inferenza Popolazione: insieme di tutti i valori realizzati o possibili

Dettagli

Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione

Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione Metodi er la riduzione della dimensionalità Strumenti quantitativi er la gestione Emanuele Taufer Introduzione Combinazioni lineari Regressione lineare sulle variabili trasformate Dettaglio teorico Metodi

Dettagli

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica Statistica Descrittiva: Variabili numeriche Corso triennale biotecnologie - Statistica Medica Statistica descrittiva

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

STATISTICA DESCRITTIVA (variabili quantitative)

STATISTICA DESCRITTIVA (variabili quantitative) STATISTICA DESCRITTIVA (variabili quantitative) PRIMO ESEMPIO: Concentrazione di un elemento chimico in una roccia. File di lavoro di STATVIEW Cliccando sul tasto del pane control si ottiene il cosiddetto

Dettagli

Lezione 4 a - Misure di dispersione o di variabilità

Lezione 4 a - Misure di dispersione o di variabilità Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono

Dettagli

PCA: Applicazioni Analisi Esplorativa

PCA: Applicazioni Analisi Esplorativa PCA: Applicazioni Analisi Esplorativa Aldo Solari 1 / 34 1 Dati Marks 2 Dati Wine 3 Dati Face 4 Dati PES 2 / 34 Outline 1 Dati Marks 2 Dati Wine 3 Dati Face 4 Dati PES 3 / 34 Dati Marks Studente Mechanics

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

Statistica multivariata Donata Rodi 21/11/2016

Statistica multivariata Donata Rodi 21/11/2016 Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di

Dettagli

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Statistica Descrittiva Variabili numeriche Misure di tendenza centrale Media (aritmetica) Mediana Media

Dettagli

Livello di esposizione. animale Basso Moderato Alto

Livello di esposizione. animale Basso Moderato Alto Esercizio -Esempio 1 (anova 2 vie con blocchi) I tassi respiratori (ispirazioni al minuto) sono stati misurati in otto animali usati per un esperimento, con tre livelli di esposizione al monossido di carbonio.

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

SDE Marco Riani

SDE Marco Riani SDE 208 Marco Riani mriani@unipr.it http://www.riani.it RIDUZIONE DELLE DIMENSIONI (con riferimento alle variabili Analisi dei fattori Analisi delle componenti principali OBIETTIVI Date p variabili (correlate

Dettagli

Quanti valori posso trovare (in percentuale) che siano maggiori di 4?

Quanti valori posso trovare (in percentuale) che siano maggiori di 4? Esercitazione3-4 13/10/2015 POPOLAZIONE n infinito media 3,5 deviazione standard 0,15 Quanti valori posso trovare (in percentuale) che siano maggiori di 4? 1 da z= ( X μ) σ z= ( 4 3,5 ) 0, 15 n infinito

Dettagli

Metodi Matematici e Informatici per la biologia. Esercizi

Metodi Matematici e Informatici per la biologia. Esercizi Metodi Matematici e Informatici per la biologia Esercizi Esercizio 1 Il modo migliore per isolare gli effetti delle variabili nascoste sulla variabile di risposta è di effettuare uno studio di osservazione

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva Caso di 1 variabile: i dati si presentano in una tabella: Nome soggetto Alabama Dato 11.6.. Per riassumere i dati si costruisce una distribuzione delle frequenze. 1 Si determina

Dettagli

HR analyics. Analisi con le CP e analisi predittiva

HR analyics. Analisi con le CP e analisi predittiva HR analyics Analisi con le CP e analisi predittiva SQG file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l10-hr_predictive.html#(1) 1/24 Dati Human Resources (HR) In questa esercitazione viene analizzato

Dettagli

> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.

> d = alimentazione == benz > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2. A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

MEDIE DIVERSE, DEV st QUASI =, I grafico simm, II grafico asimm

MEDIE DIVERSE, DEV st QUASI =, I grafico simm, II grafico asimm Correzione 3 compito ESERCIZIO 1 Il grafico riporta le riduzioni di peso in 2 gruppi di pazienti trattati con una dieta a base di olio di pesce (II gruppo) e con una dieta standard (I gruppo). i) Commentate,

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

Analisi delle Componenti Principali

Analisi delle Componenti Principali Struttura e proprietà degli alimenti Analisi delle Componenti Principali Dott. Rossella Di Monaco Dipartimento di Scienza degli Alimenti CORSO di LAUREA MAGISTRALE in SCIENZE E TECNOLOGIE ALIMENTARI La

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I

Dettagli

6. Partial Least Squares (PLS)

6. Partial Least Squares (PLS) & C. Di Natale: (PLS) Partial Least Squares PLS toolbox di MATLAB 1 Da PCR a PLS approccio geometrico Nella PCR la soluzione del problema della regressione passa attraverso la decomposizione della matrice

Dettagli

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità 18 Febbraio 2016 1. La probabilità di errore nella trasmissione di una cifra binaria attraverso un certo canale di comunicazione

Dettagli

Statistiche di sintesi

Statistiche di sintesi Esercizio 2 E stato condotto uno studio per valutare la variazione della pressione sistolica in funzione dell etá. I dati sono riportati nel file sbp.xls. Effettua un analisi di regressione e disegna gli

Dettagli

ANALISI DEI DATI con EXCEL

ANALISI DEI DATI con EXCEL ANALISI DEI DATI con EXCEL Distribuzione della frequenza per variabili qualitative 1) conteggio del numero delle osservazioni della variabile (funzione CONTA.VALORI) 2) definizione delle CATEGORIE (tramite

Dettagli

Scale di Misurazione Lezione 2

Scale di Misurazione Lezione 2 Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile

Dettagli

Rappresentazione dei dati multivariati

Rappresentazione dei dati multivariati Rappresentazione dei dati multivariati Quando si hanno più di due varabili la posizione di ciascuna unità rispetto alle altre può essere rappresentata nel diagramma relativo alle prime due CP l importanza

Dettagli

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare

Dettagli

Statistica. Antonio Azzollini

Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2018/2019 Quartili e distribuzioni di frequenze Stanze Appartamenti

Dettagli

Strumenti quantitativi per la gestione. Introduzione al corso A.A

Strumenti quantitativi per la gestione. Introduzione al corso A.A Strumenti quantitativi per la gestione Introduzione al corso A.A. 2018-2019 Un esempio introduttivo: salari dei manager Y = Salario annuale (in dollari) x 1 = Anni di esperienza (Experience) x 2 = Anni

Dettagli

Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che:

Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: Cluster Analysis Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: le unità appartenenti ad uno di essi sono il più possibile omogenee i gruppi sono

Dettagli

Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO

Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria,

Dettagli

Strumenti quantitativi per la gestione (121210) A.a / 2019.

Strumenti quantitativi per la gestione (121210) A.a / 2019. LAUREA MAGISTRALE IN MANAGEMENT Dipartimento di Economia e Management Università degli Studi di Trento Strumenti quantitativi per la gestione (121210) A.a. 2018 / 2019. Docente: Prof. Emanuele Taufer 1.

Dettagli

MISURE DI DISPERSIONE

MISURE DI DISPERSIONE MISURE DI DISPERSIONE 78 MISURE DI DISPERSIONE Un insieme di dati numerici può essere sintetizzato da alcuni valori tipici, che indicano il grado di variabilità dei dati stessi. Grado di Variabilità o

Dettagli

Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO

Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria,

Dettagli

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008.

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. ESERCIZIO I Si è applicata l analisi delle componenti principali a 97 modelli di fotocamere digitali, considerando 7 variabili ed ottenendo

Dettagli

Analisi Multivariata Prova intermedia del 20 aprile 2011

Analisi Multivariata Prova intermedia del 20 aprile 2011 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.

Dettagli

Statistica con R. Jody Tubi. Email: jodytubi@outlook.it

Statistica con R. Jody Tubi. Email: jodytubi@outlook.it Statistica con R Jody Tubi. Email: jodytubi@outlook.it INTRODUZIONE. Accesso ai dati. La diffusione dei PC ha reso disponibile una quantità di dati immensa: le imprese private dispongo di dati su clienti

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2017/2018 Quartili e distribuzioni di frequenze Stanze Appartamenti

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

Distribuzione di Frequenza: Esempio

Distribuzione di Frequenza: Esempio Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Analisi discriminante in R Strumenti quantitativi per la gestione

Analisi discriminante in R Strumenti quantitativi per la gestione Analisi discriminante in R Strumenti quantitativi per la gestione Emanuele Taufer Default data LDA con R Output Plot Previsione Tabella di classificazione Cambiare il criterio di classificazione Costruire

Dettagli

Selezione del modello Strumenti quantitativi per la gestione

Selezione del modello Strumenti quantitativi per la gestione Selezione del modello Strumenti quantitativi per la gestione Emanuele Taufer Migliorare il modello di regressione lineare (RL) Metodi Selezione Best subset Selezione stepwise Stepwise forward Stepwise

Dettagli

LABORATORIO-MINITAB N. 2-3 VARIABILI QUANTITATIVE

LABORATORIO-MINITAB N. 2-3 VARIABILI QUANTITATIVE LABORATORIO-MINITAB N. 2-3 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile alla distrofia muscolare

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più

Dettagli

Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione

Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi

Dettagli

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio I

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio I COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio 2008 - I 1) Per un insieme di modelli di smartphone si sono costruiti i boxplot degli scostamenti standardizzati del prezzo e del peso ed

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare

Dettagli

Esercizi Biostatistica

Esercizi Biostatistica Esercizi Biostatistica Esercizio 1. Si supponga che la media e la deviazione standard del colesterolo in individui sani tra i 18 e i 25 anni valgano, rispettivamente, 150 e 25. Calcolare la probabilità

Dettagli

Indici di. tendenza centrale: posizione: variabilità e dispersione: -quantili -decili -percentili. -Media -Moda -Mediana

Indici di. tendenza centrale: posizione: variabilità e dispersione: -quantili -decili -percentili. -Media -Moda -Mediana Indici di posizione: -quantili -decili -percentili tendenza centrale: -Media -Moda -Mediana variabilità e dispersione: -Devianza - Varianza -Deviazione standard Indici di tendenza centrale Indici di tendenza

Dettagli

rpc = (capc + copc) + (s/100)rpc pca + pco = 100

rpc = (capc + copc) + (s/100)rpc pca + pco = 100 Analisi socio/economica dei Comuni della Diocesi di Cagliari Si consideri la seguente base di dati (file: comca.csv) costituita da osservazioni sui 66 comuni della diocesi di Cagliari caratterizzati dalle

Dettagli

Regressione ridge e LASSO Strumenti quantitativi per la gestione

Regressione ridge e LASSO Strumenti quantitativi per la gestione Regressione ridge e LASSO Strumenti quantitativi per la gestione Emanuele Taufer Dati Credit.csv La funzione glmnet() La funzione model.matrix() Regressione ridge Output CV Ridge Output Regressione LASSO

Dettagli

Tutorato 1 - Statistica descrittiva

Tutorato 1 - Statistica descrittiva Tutorato 1 - Statistica descrittiva 1) Il numero di nascite di 10 centri ospedalieri è la seguente serie: 81 84 73 83 87 80 79 79 74 82 a) Calcolare: la moda, la mediana, la media, la varianza, la deviazione

Dettagli

Esercizi di Statistica, con soluzioni

Esercizi di Statistica, con soluzioni Esercizi di Statistica, con soluzioni Considera 20 famiglie. Per ciascuna rileva il numero di componenti. Ecco i dati: 1 3 2 5 4 2 2 3 3 2 3 4 4 3 2 5 4 3 3 1 Costruisci la distribuzione di frequenza.

Dettagli

Esercitazioni. a. Discreta, quantitativa numerica; b. nominale; c. quantitativa rapporto; d. nominale; e. nominale

Esercitazioni. a. Discreta, quantitativa numerica; b. nominale; c. quantitativa rapporto; d. nominale; e. nominale Esercitazioni 1. Per ognuna delle seguenti variabili dire di che tipo di variabile si tratta e la scala di misura di riferimento: a. Numero di telefoni per famiglia. b. Tipo di telefono usato principalmente.

Dettagli

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata STATISTICA PSICOMETRICA a.a. 004/005 Corsi di laurea Scienze e tecniche neuropsicologiche Modulo Modulo Distribuzioni semplici di frequenza e loro rappresentazioni Operatori di tendenza centrale Operatori

Dettagli

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici

Dettagli

Relazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un altra qualitativa o discreta.

Relazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un altra qualitativa o discreta. Relazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un altra qualitativa o discreta. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada

Dettagli

Docente Prof. Paola Perchinunno - Tel

Docente Prof. Paola Perchinunno   - Tel Corso di Laurea: Scienze e Tecnologie Alimentari Corso: Modulo: STATISTICA (3 CFU) (2 CFU Lezioni + 1 CFU Esercitazioni) Docente Prof. Paola Perchinunno email: p.perchinunno@dss.uniba.it - Tel. 080 5045250

Dettagli

Uso elementare di R in Statistica G. Marchetti

Uso elementare di R in Statistica G. Marchetti Uso elementare di R in Statistica G. Marchetti Lezione 1 Introduzione R è un ambiente statistico di pubblico dominio. Il software è libero e può essere scaricato dal sito https: //cran.r-project.org/.

Dettagli

Compiti tematici dai capitoli 2,3,4

Compiti tematici dai capitoli 2,3,4 Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica

Dettagli

VARIETÀ. zona geografica A B C D

VARIETÀ. zona geografica A B C D Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore

Dettagli

Scopo dello studio. Metodi

Scopo dello studio. Metodi Ci si può fidare dei risultati dell analisi delle componenti principali? Ricci C, Milani S Istituto di Statistica Medica e Biometria G.A. Maccacaro Facoltà di Medicina e Chirurgia, Università degli Studi

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Statistica Descrittiva

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Statistica Descrittiva Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa 3 Corso di Statistica Medica Statistica Descrittiva 1 La statistica opera su variabili Il valore delle variabili è conosciuto

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Metodologie statistiche per l analisi del rischio ELEMENTI DI PROBABILITÀ PER L ANALISI DEL RISCHIO

Metodologie statistiche per l analisi del rischio ELEMENTI DI PROBABILITÀ PER L ANALISI DEL RISCHIO Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio ELEMENTI DI PROBABILITÀ PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria, Università

Dettagli

LA MATRICE DEGLI INDICATORI SOCIALI

LA MATRICE DEGLI INDICATORI SOCIALI LA MATRICE DEGLI INDICATORI SOCIALI CORSO DI METODI DI INDAGINE E VALUTAZIONE NELLE SCIENZE SOCIALI La sintesi degli indicatori X n, m x L x L x L L L L L xi 1 L xij L x L L L L L x L x L x 11 1 j 1m im

Dettagli