Analisi delle CP. Dati USArrests
|
|
- Ottaviano Barbieri
- 5 anni fa
- Visualizzazioni
Transcript
1 Analisi delle CP Dati USArrests Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 1/12
2 Dati USArrests Per ciascuno dei 50 stati degli USA, il set di dati contiene il numero di arresti per residenti per ognuno dei tre reati: Rapina (Assault), Omicidio (Murder) e Stupro (Rape). La variabile UrbanPop indica la percentuale di popolazione nelle aree urbane. data(usarrests) head(usarrests) Murder Assault UrbanPop Rape Alabama Alaska Arizona Arkansas California Colorado file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 2/12
3 Descrittive summary(usarrests) Murder Assault UrbanPop Rape Min. : Min. : 45.0 Min. :32.00 Min. : st Qu.: st Qu.: st Qu.: st Qu.:15.07 Median : Median :159.0 Median :66.00 Median :20.10 Mean : Mean :170.8 Mean :65.54 Mean : rd Qu.: rd Qu.: rd Qu.: rd Qu.:26.18 Max. : Max. :337.0 Max. :91.00 Max. :46.00 apply(usarrests,2,var) Murder Assault UrbanPop Rape file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 3/12
4 PCA La PCA (non PCR) può essere effettuata con la funzione prcomp() pr.out<-prcomp(usarrests,scale=true) names(pr.out) [1] "sdev" "rotation" "center" "scale" "x" rotation: la matrice dei pesi dei fattori x: la matrice dei punteggi fattoriali stdev: la deviazione standard di ciascun componente file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 4/12
5 Summary summary(pr.out) ## Importance of components: ## PC1 PC2 PC3 PC4 ## Standard deviation ## Proportion of Variance ## Cumulative Proportion file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 5/12
6 Pesi delle CP pr.out$rotation PC1 PC2 PC3 PC4 Murder Assault UrbanPop Rape PC1: pesi più elevati sulle tre variabili Murder, Assault e Rape. Potrebbe essere interpretata come misura del tasso generale di crimini violenti PC2: peso più elevato a UrbanPop. Livello di urbanizzazione. Le CP sono determinate univocamente a parte il segno del coefficiente (positivo o negativo) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 6/12
7 Punteggi fattoriali Osserviamo i punteggi delle CP 1 e 2 per i primi dieci stati (in ordine alfabetico) pr.out$x[1:10,1:2] PC1 PC2 Alabama Alaska Arizona Arkansas California Colorado Connecticut Delaware Florida Georgia file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 7/12
8 Biplot biplot(pr.out,scale=0) Grafico che riporta sia gli scores che i pesi dei fattori delle prime due CP file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 8/12
9 Personalizzare il biplot st<-c(1,2,10,18,24,33,40,42) biplot(pr.out$x[st,],pr.out$rotation[1:2,],expand=2, xlim =c(0,3),ylim =c(-3,0)) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 9/12
10 PVE Codice per calcolare la percentuale di varianza spiegata (PVE), semplice e cumulata pr.var =pr.out$sdev^2 pve=pr.var/sum(pr.var ) pve [1] cumsum(pve) [1] file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 10/12
11 Grafici par(mfrow=c(1,2)) plot(pve, xlab=" Principal Component ", ylab=" Proportion of Variance Explained ", ylim=c(0,1),type='b',pch=20,col="red",lwd=2) plot(cumsum (pve ), xlab=" Principal Component ", ylab =" Cumulative Proportion of Variance Explained ", ylim=c(0,1), type='b',pch=20,col="blue",lwd=2) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 11/12
12 Riferimenti bibliografici An Introduction to Statistical Learning, with applications in R. (Springer, 2013) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 12/12
L'analisi in componenti principali
26/07/2019 09:01 1/16 L'analisi in componenti principali L'analisi in componenti principali L analisi in componenti principali è una tecnica fattoriale di analisi multivariata dei dati. Una presentazione
L'analisi in componenti principali
20/08/2017 05:38 1/16 L'analisi in componenti principali L'analisi in componenti principali L analisi in componenti principali è una tecnica fattoriale di analisi multivariata dei dati. Una presentazione
Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione
Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/6c_pca.html#(1) 1/25 Introduzione Gli approcci
Elementi di statistica
Elementi di statistica Summer School: Data journalism e visualizzazione grafica dei dati! Flavon - 30 Agosto 2011! La statistica! Chi vi sta parlando? 2 La statistica! Chi vi sta parlando?! Cos è la Statistica?
Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60 minuti
3 Luglio 2018 - Analisi Esplorativa Cognome:... Nome: Matricola:... Tipologia d esame: 12 CFU 15 CFU Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60
Alberi di decisione con R
Alberi di decisione con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l8-alberi_di_decisione.html#(1) 1/14 Implementare gli alberi decisionali con R Per adattare
Stati Uniti d'america
6 Febbraio 2019 - Analisi Esplorativa Cognome:................................................... Nome:...................................................... Matricola:...................................................
Regressione K-Nearest Neighbors. Strumenti quantitativi per la gestione
Regressione K-Nearest Neighbors Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 1/13 Regressione non parametrica
Regressione lineare semplice. Strumenti quantitativi per la gestione
Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html#(1) 1/33 Regressione lineare (RL) La RL è uno degli
Regressione lineare semplice
Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice
Regressione con componenti principali (PCR) Strumenti quantitativi per la gestione
Regressione con componenti principali (PCR) Strumenti quantitativi per la gestione Emanuele Taufer Dati Hitters Eliminare le righe con dati mancanti PCR Variabili nell oggetto creato da pcr() Coefficienti
Misure di dispersione (o di variabilità)
08/04/014 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x 9 range31-74 x 9 range50-941
1/55. Statistica descrittiva
1/55 Statistica descrittiva Organizzare e rappresentare i dati I dati vanno raccolti, analizzati ed elaborati con le tecniche appropriate (organizzazione dei dati). I dati vanno poi interpretati e valutati
Analisi delle Componenti Principali con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi delle Componenti
Prova scritta di ASM - Modulo Analisi Esplorativa del
Cognome:... Nome:... Matricola:......... Prova scritta di ASM - Modulo Analisi Esplorativa del 14.02.2017 La durata della prova è di 90 minuti. Si svolgano gli esercizi A e B riportando il risultato dove
Analisi in Componenti Principali
Analisi in Componenti Principali 1/20 Analisi in Componenti Principali tecnica di riduzione e interpretazione dei dati spesso gioca un ruolo ausiliario rispetto ad altre tecniche (es. analisi fattoriale,
STATISTICA. I modelli probabilistici
STATISTICA I modelli probabilistici I modelli probabilistici Statistica-1b-probabilità I modelli probabilistici Numero di volte in cui esce T in lanci Numero di lanci prima che esca T Somma del punteggio
Analisi in Componenti Principali
Analisi in Componenti Principali 1/20 Analisi in Componenti Principali Analisi in Componenti Principali 1/20 Analisi in Componenti Principali tecnica di riduzione e interpretazione dei dati spesso gioca
Misure di dispersione (o di variabilità)
14/1/01 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x = 9 range=31-7=4 x = 9 range=50-9=41
Laboratorio di ST1 - Lezione 7. Antonietta di Salvatore. Dipartimento di Matematica Universitá degli Studi Roma Tre
Laboratorio di ST1 - Lezione 7 Antonietta di Salvatore Dipartimento di Matematica Universitá degli Studi Roma Tre Outline Statistica descrittiva e grafici Verifica di ipotesi e intervalli di confidenza
Istruzioni per l analisi in componenti principali con R
Istruzioni per l analisi in componenti principali con R Vi ricordo che in nero sono state inserite le note e in rosso le istruzioni da digitare sulla console di R Importare il dataset gelati
Analisi in Componenti principali (ACP)
Analisi in Componenti principali (ACP) Stefano Cabras s.cabras@unica.it 12 aprile 2010 Sommario Il problema principale dell analisi multivariata è quello della riduzione della dimensionalità del problema.
e applicazioni al dominio del Contact Management Andrea Brunello Università degli Studi di Udine
e applicazioni al dominio del Contact Management Parte V: combinazione di Università degli Studi di Udine In collaborazione con dott. Enrico Marzano, CIO Gap srl progetto Active Contact System 1/10 Contenuti
1. SOLUZIONE ESERCIZIO RIASSUNTIVO. n=1000. Z1 = rnorm(n); Z2 = rnorm(n); plot(z1,z2) X1 = 3*Z1; X2 = Z2; plot(x1,x2)
1. SOLUZIONE ESERCIZIO RIASSUNTIVO n=1000 Z1 = rnorm(n); Z2 = rnorm(n); plot(z1,z2) X1 = 3*Z1; X2 = Z2; plot(x1,x2) theta = pi/10 A = matrix(nrow=2,ncol=2) A[1,1]= cos(theta) A[1,2]= -sin(theta) A[2,1]=
Variabili presenti nella base dati
Analisi della partecipazione delle donne sposate nella forza lavoro negli Stati Uniti nel 1975 Si consideri la seguente base di dati (file: ww.xls) costituita da 753 osservazioni su donne statunitensi
Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)
Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:
Studio di osservazione, perché non viene imposto nessun trattamento alle unità campionarie
ALCUNI ESERCIZI ASSEGNATI (3 e 6 crediti) NELLA SESSIONE DI LUGLIO CON RELATIVE SOLUZIONI ATTENZIONE I VALORI OTTENUTI NEI CALCOLI (OTTENUTI CON UN SOFTWARE STATISTICO) POSSONO DIFFERIRE DI POCO DA QUELLI
Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Lezione 2
Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa Corso di Statistica Medica Lezione Campionamento ed inferenza Popolazione: insieme di tutti i valori realizzati o possibili
Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione
Metodi er la riduzione della dimensionalità Strumenti quantitativi er la gestione Emanuele Taufer Introduzione Combinazioni lineari Regressione lineare sulle variabili trasformate Dettaglio teorico Metodi
Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica Statistica Descrittiva: Variabili numeriche Corso triennale biotecnologie - Statistica Medica Statistica descrittiva
Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)
Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:
STATISTICA DESCRITTIVA (variabili quantitative)
STATISTICA DESCRITTIVA (variabili quantitative) PRIMO ESEMPIO: Concentrazione di un elemento chimico in una roccia. File di lavoro di STATVIEW Cliccando sul tasto del pane control si ottiene il cosiddetto
Lezione 4 a - Misure di dispersione o di variabilità
Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono
PCA: Applicazioni Analisi Esplorativa
PCA: Applicazioni Analisi Esplorativa Aldo Solari 1 / 34 1 Dati Marks 2 Dati Wine 3 Dati Face 4 Dati PES 2 / 34 Outline 1 Dati Marks 2 Dati Wine 3 Dati Face 4 Dati PES 3 / 34 Dati Marks Studente Mechanics
Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii
Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4
Statistica multivariata Donata Rodi 21/11/2016
Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di
Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Statistica Descrittiva Variabili numeriche Misure di tendenza centrale Media (aritmetica) Mediana Media
Livello di esposizione. animale Basso Moderato Alto
Esercizio -Esempio 1 (anova 2 vie con blocchi) I tassi respiratori (ispirazioni al minuto) sono stati misurati in otto animali usati per un esperimento, con tre livelli di esposizione al monossido di carbonio.
Istituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono
SDE Marco Riani
SDE 208 Marco Riani mriani@unipr.it http://www.riani.it RIDUZIONE DELLE DIMENSIONI (con riferimento alle variabili Analisi dei fattori Analisi delle componenti principali OBIETTIVI Date p variabili (correlate
Quanti valori posso trovare (in percentuale) che siano maggiori di 4?
Esercitazione3-4 13/10/2015 POPOLAZIONE n infinito media 3,5 deviazione standard 0,15 Quanti valori posso trovare (in percentuale) che siano maggiori di 4? 1 da z= ( X μ) σ z= ( 4 3,5 ) 0, 15 n infinito
Metodi Matematici e Informatici per la biologia. Esercizi
Metodi Matematici e Informatici per la biologia Esercizi Esercizio 1 Il modo migliore per isolare gli effetti delle variabili nascoste sulla variabile di risposta è di effettuare uno studio di osservazione
Statistica descrittiva
Statistica descrittiva Caso di 1 variabile: i dati si presentano in una tabella: Nome soggetto Alabama Dato 11.6.. Per riassumere i dati si costruisce una distribuzione delle frequenze. 1 Si determina
HR analyics. Analisi con le CP e analisi predittiva
HR analyics Analisi con le CP e analisi predittiva SQG file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l10-hr_predictive.html#(1) 1/24 Dati Human Resources (HR) In questa esercitazione viene analizzato
> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.
A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
MEDIE DIVERSE, DEV st QUASI =, I grafico simm, II grafico asimm
Correzione 3 compito ESERCIZIO 1 Il grafico riporta le riduzioni di peso in 2 gruppi di pazienti trattati con una dieta a base di olio di pesce (II gruppo) e con una dieta standard (I gruppo). i) Commentate,
Matematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
Analisi delle Componenti Principali
Struttura e proprietà degli alimenti Analisi delle Componenti Principali Dott. Rossella Di Monaco Dipartimento di Scienza degli Alimenti CORSO di LAUREA MAGISTRALE in SCIENZE E TECNOLOGIE ALIMENTARI La
Regressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I
6. Partial Least Squares (PLS)
& C. Di Natale: (PLS) Partial Least Squares PLS toolbox di MATLAB 1 Da PCR a PLS approccio geometrico Nella PCR la soluzione del problema della regressione passa attraverso la decomposizione della matrice
Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità
Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità 18 Febbraio 2016 1. La probabilità di errore nella trasmissione di una cifra binaria attraverso un certo canale di comunicazione
Statistiche di sintesi
Esercizio 2 E stato condotto uno studio per valutare la variazione della pressione sistolica in funzione dell etá. I dati sono riportati nel file sbp.xls. Effettua un analisi di regressione e disegna gli
ANALISI DEI DATI con EXCEL
ANALISI DEI DATI con EXCEL Distribuzione della frequenza per variabili qualitative 1) conteggio del numero delle osservazioni della variabile (funzione CONTA.VALORI) 2) definizione delle CATEGORIE (tramite
Scale di Misurazione Lezione 2
Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile
Rappresentazione dei dati multivariati
Rappresentazione dei dati multivariati Quando si hanno più di due varabili la posizione di ciascuna unità rispetto alle altre può essere rappresentata nel diagramma relativo alle prime due CP l importanza
Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011
Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare
Statistica. Antonio Azzollini
Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2018/2019 Quartili e distribuzioni di frequenze Stanze Appartamenti
Strumenti quantitativi per la gestione. Introduzione al corso A.A
Strumenti quantitativi per la gestione Introduzione al corso A.A. 2018-2019 Un esempio introduttivo: salari dei manager Y = Salario annuale (in dollari) x 1 = Anni di esperienza (Experience) x 2 = Anni
Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che:
Cluster Analysis Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: le unità appartenenti ad uno di essi sono il più possibile omogenee i gruppi sono
Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO
Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria,
Strumenti quantitativi per la gestione (121210) A.a / 2019.
LAUREA MAGISTRALE IN MANAGEMENT Dipartimento di Economia e Management Università degli Studi di Trento Strumenti quantitativi per la gestione (121210) A.a. 2018 / 2019. Docente: Prof. Emanuele Taufer 1.
MISURE DI DISPERSIONE
MISURE DI DISPERSIONE 78 MISURE DI DISPERSIONE Un insieme di dati numerici può essere sintetizzato da alcuni valori tipici, che indicano il grado di variabilità dei dati stessi. Grado di Variabilità o
Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO
Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria,
COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008.
COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. ESERCIZIO I Si è applicata l analisi delle componenti principali a 97 modelli di fotocamere digitali, considerando 7 variabili ed ottenendo
Analisi Multivariata Prova intermedia del 20 aprile 2011
Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.
Statistica con R. Jody Tubi. Email: jodytubi@outlook.it
Statistica con R Jody Tubi. Email: jodytubi@outlook.it INTRODUZIONE. Accesso ai dati. La diffusione dei PC ha reso disponibile una quantità di dati immensa: le imprese private dispongo di dati su clienti
0.1 Percorrenza e Cilindrata
0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,
Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini
Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2017/2018 Quartili e distribuzioni di frequenze Stanze Appartamenti
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
Distribuzione di Frequenza: Esempio
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
Analisi discriminante in R Strumenti quantitativi per la gestione
Analisi discriminante in R Strumenti quantitativi per la gestione Emanuele Taufer Default data LDA con R Output Plot Previsione Tabella di classificazione Cambiare il criterio di classificazione Costruire
Selezione del modello Strumenti quantitativi per la gestione
Selezione del modello Strumenti quantitativi per la gestione Emanuele Taufer Migliorare il modello di regressione lineare (RL) Metodi Selezione Best subset Selezione stepwise Stepwise forward Stepwise
LABORATORIO-MINITAB N. 2-3 VARIABILI QUANTITATIVE
LABORATORIO-MINITAB N. 2-3 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile alla distrofia muscolare
Argomenti della lezione:
Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più
Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione
Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi
COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio I
COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio 2008 - I 1) Per un insieme di modelli di smartphone si sono costruiti i boxplot degli scostamenti standardizzati del prezzo e del peso ed
Laboratorio di Statistica Aziendale Modello di regressione lineare multipla
Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare
Esercizi Biostatistica
Esercizi Biostatistica Esercizio 1. Si supponga che la media e la deviazione standard del colesterolo in individui sani tra i 18 e i 25 anni valgano, rispettivamente, 150 e 25. Calcolare la probabilità
Indici di. tendenza centrale: posizione: variabilità e dispersione: -quantili -decili -percentili. -Media -Moda -Mediana
Indici di posizione: -quantili -decili -percentili tendenza centrale: -Media -Moda -Mediana variabilità e dispersione: -Devianza - Varianza -Deviazione standard Indici di tendenza centrale Indici di tendenza
rpc = (capc + copc) + (s/100)rpc pca + pco = 100
Analisi socio/economica dei Comuni della Diocesi di Cagliari Si consideri la seguente base di dati (file: comca.csv) costituita da osservazioni sui 66 comuni della diocesi di Cagliari caratterizzati dalle
Regressione ridge e LASSO Strumenti quantitativi per la gestione
Regressione ridge e LASSO Strumenti quantitativi per la gestione Emanuele Taufer Dati Credit.csv La funzione glmnet() La funzione model.matrix() Regressione ridge Output CV Ridge Output Regressione LASSO
Tutorato 1 - Statistica descrittiva
Tutorato 1 - Statistica descrittiva 1) Il numero di nascite di 10 centri ospedalieri è la seguente serie: 81 84 73 83 87 80 79 79 74 82 a) Calcolare: la moda, la mediana, la media, la varianza, la deviazione
Esercizi di Statistica, con soluzioni
Esercizi di Statistica, con soluzioni Considera 20 famiglie. Per ciascuna rileva il numero di componenti. Ecco i dati: 1 3 2 5 4 2 2 3 3 2 3 4 4 3 2 5 4 3 3 1 Costruisci la distribuzione di frequenza.
Esercitazioni. a. Discreta, quantitativa numerica; b. nominale; c. quantitativa rapporto; d. nominale; e. nominale
Esercitazioni 1. Per ognuna delle seguenti variabili dire di che tipo di variabile si tratta e la scala di misura di riferimento: a. Numero di telefoni per famiglia. b. Tipo di telefono usato principalmente.
STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata
STATISTICA PSICOMETRICA a.a. 004/005 Corsi di laurea Scienze e tecniche neuropsicologiche Modulo Modulo Distribuzioni semplici di frequenza e loro rappresentazioni Operatori di tendenza centrale Operatori
Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)
Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici
Relazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un altra qualitativa o discreta.
Relazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un altra qualitativa o discreta. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada
Docente Prof. Paola Perchinunno - Tel
Corso di Laurea: Scienze e Tecnologie Alimentari Corso: Modulo: STATISTICA (3 CFU) (2 CFU Lezioni + 1 CFU Esercitazioni) Docente Prof. Paola Perchinunno email: p.perchinunno@dss.uniba.it - Tel. 080 5045250
Uso elementare di R in Statistica G. Marchetti
Uso elementare di R in Statistica G. Marchetti Lezione 1 Introduzione R è un ambiente statistico di pubblico dominio. Il software è libero e può essere scaricato dal sito https: //cran.r-project.org/.
Compiti tematici dai capitoli 2,3,4
Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica
VARIETÀ. zona geografica A B C D
Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore
Scopo dello studio. Metodi
Ci si può fidare dei risultati dell analisi delle componenti principali? Ricci C, Milani S Istituto di Statistica Medica e Biometria G.A. Maccacaro Facoltà di Medicina e Chirurgia, Università degli Studi
Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Statistica Descrittiva
Università del Piemonte Orientale Corso di laurea in medicina e chirurgia aa 3 Corso di Statistica Medica Statistica Descrittiva 1 La statistica opera su variabili Il valore delle variabili è conosciuto
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
Metodologie statistiche per l analisi del rischio ELEMENTI DI PROBABILITÀ PER L ANALISI DEL RISCHIO
Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio ELEMENTI DI PROBABILITÀ PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria, Università
LA MATRICE DEGLI INDICATORI SOCIALI
LA MATRICE DEGLI INDICATORI SOCIALI CORSO DI METODI DI INDAGINE E VALUTAZIONE NELLE SCIENZE SOCIALI La sintesi degli indicatori X n, m x L x L x L L L L L xi 1 L xij L x L L L L L x L x L x 11 1 j 1m im