L'analisi in componenti principali
|
|
- Geraldo Testa
- 6 anni fa
- Visualizzazioni
Transcript
1 20/08/ :38 1/16 L'analisi in componenti principali L'analisi in componenti principali L analisi in componenti principali è una tecnica fattoriale di analisi multivariata dei dati. Una presentazione dettagliata della tecnica è disponibile su Wikipedia. Testi in italiano, con esempi in campo sociologico sono (fra gli altri): Bolasco, S. (1999). Analisi multidimensionale dei dati. Metodi, strategie e criteri d interpretazione. Roma: Carocci. Franco, G. D. (2005). EDS: esplorare, descrivere e sintetizzare i dati. Guida pratica all analisi dei dati nella ricerca sociale. Milano: FrancoAngeli. Cannavò, L., & Frudà, L. (2007). Ricerca sociale. Dall analisi esplorativa al data mining. Roma: Carocci. La funzione prcomp prcomp(x, retx = TRUE, center = TRUE, scale. = FALSE, tol = NULL,...) Per mostrare i comandi e gli output, utilizziamo il Datasets di esempio USArrests. Come prima cosa, andrebbe sempre controllata la linearità delle relazioni fra le variabili contenute nel dataset, ad esempio con uno Scatterplot (grafico a dispersione). > plot(usarrests) Utilizziamo la funzione prcomp, con l opzione scale=true, ovvero normalizzando le variabili MetRef -
2 Last update: r:analisi_multivariata:analisi_in_componenti_principali 02/06/ :06 (varianza = 1). > PCA <- prcomp(usarrests, scale = TRUE) > print(pca) Standard deviations: [1] Rotation: PC1 PC2 PC3 PC4 Murder Assault UrbanPop Rape L output prodotto con print(pca) consiste nelle deviazioni standard delle componenti e nella matrice di rotazione (con i variable loadings) > summary(pca) Importance of components: PC1 PC2 PC3 PC4 Standard deviation Proportion of Variance Cumulative Proportion Il comando summary() in questo caso restituisce una serie di valori che consentono di valutare la rilevanza relativa di ciascuna componente, ovvero: la deviazione standard di ciascuna componente; la proporzione di varianza spiegata, e le proporzioni cumulate. Per scegliere di utilizzare solo alcune variabili e non altre: > prcomp(~murder + Assault + Rape, data = USArrests, + scale = TRUE) Standard deviations: [1] Rotation: PC1 PC2 PC3 Murder Assault Rape Output L oggetto (output) PCA creato dall analisi in componenti principali contiene i seguenti valori: sdev = deviazioni standard delle componenti principali rotation = la matrice di rotazione con i variable loadings (consente di interpretare i fattori, in base al peso che hanno le variabili nel definirli) Printed on 20/08/ :38
3 20/08/ :38 3/16 L'analisi in componenti principali x = le coordinate fattoriali dei casi (se retx=true, come di default) center = il valore corrispondente all attuale origine dell asse, per ciascuna variabile (se center=true, come di default) scale = come center, ma per la varianza di ciascuna variabile (se scale=true) Ciascuno dei valori contenuti nell output può infatti essere visualizzato chiamando, ad es., per ottenere le coordinate fattoriali: > PCA$x PC1 PC2 PC3 PC4 Alabama Alaska Arizona Arkansas La matrice delle correlazioni fra i nuovi valori e i vecchi si ottiene con il comando cor() applicato alle due matrici. > cor.pca=cor(usarrests, PCA$x) > cor.pca PC1 PC2 PC3 PC4 Murder Assault UrbanPop Rape Grafici La funzione plot() restituisce un grafico come questo: > plot(pca) MetRef -
4 Last update: r:analisi_multivariata:analisi_in_componenti_principali 02/06/ :06 mentre la funzione screeplot() rappresenta graficamente i fattori in questo modo: > screeplot(pca,type=c("lines")) aiutandoci a stabilire in numero di componenti principali da tenere in considerazione per rappresentare il fenomeno. La funzione biplot() fornisce invece una rappresentazione sintetica dei casi sul piano fattoriale, utilizzando la matrice PCA$x, che può eventualmente essere esportata per includere le coordinate fattoriali come variabili nella matrice originaria: > biplot(pca) Printed on 20/08/ :38
5 20/08/ :38 5/16 L'analisi in componenti principali Script prcomp-ex.r plot(usarrests) PCA<-prcomp(USArrests, scale = TRUE) print(pca) summary(pca) plot(pca) biplot(pca) PCA$x cor.pca=cor(usarrests, PCA$x) cor.pca La funzione princomp e RCommander La funzione princomp, calcola l ACP con la risoluzione matriciale, ovvero calcolando gli autovalori delle matrice delle correlazioni o delle covarianze (e non della matrice originaria). princomp(x, cor = FALSE, scores = TRUE, covmat = NULL, subset = rep(true, nrow(as.matrix(x))),...) MetRef -
6 Last update: r:analisi_multivariata:analisi_in_componenti_principali 02/06/ :06 Nella console di R > PCA1 <- princomp(usarrests, cor = TRUE) > print(pca1) Call: princomp(x = USArrests, cor = TRUE) Standard deviations: variables and 50 observations. L output prodotto con print(pca1) non contiene la matrice delle componenti (variable loadings), che può essere però chiamata con il comando: > loadings(pca1) Loadings: Murder Assault UrbanPop Rape SS loadings Proportion Var Cumulative Var oppure anche con > PCA1$loadings In questo caso, i pesi fattoriali (variable loadings) si riferiscono agli autovalori della matrice delle correlazioni. Il comando summary(): > summary(pca1) Importance of components: Standard deviation Proportion of Variance Cumulative Proportion Anche i comandi plot() screeplot() e biplot() restituiscono grafici corrispondenti. L oggetto (output) PCA1 è però diverso, in quanto diverso è il metodo di calcolo delle componenti. Printed on 20/08/ :38
7 20/08/ :38 7/16 L'analisi in componenti principali Esso quindi contiene: sdev = deviazioni standard delle componenti principali loadings (anziché rotation) = la matrice con i variable loadings scores (anziché x) = le coordinate fattoriali dei casi (può essere omessa, con retx=false) center = il valore corrispondente all attuale origine dell asse, per ciascuna variabile (la media) scale = il fattore di scala delle variabili Quindi, per ottenere le coordinate fattoriali, il comando sarà: > PCA1$scores Alabama Alaska Arizona Arkansas Ed è con la matrice PCA1$scores che si potrà anche calcolare la matrice delle correlazioni variabili-componenti: > cor.pca1=cor(usarrests, PCA1$scores) > cor.pca1 Murder Assault UrbanPop Rape Infine, volendo ruotare gli autovalori [o alcuni di essi] con il metodo varimax o promax: > varimax(pca1$loadings[,1:2]) oppure > promax(pca1$loadings[,1:2]) restituisce direttamente i valori degli autovalori ruotati. Per scegliere di utilizzare alcune variabili e non altre: > princomp(~murder + Assault + UrbanPop, data = USArrests, na.action = na.exclude, + cor = TRUE) Call: princomp(formula = ~Murder + Assault + UrbanPop, data = USArrests, na.action = na.exclude, cor = TRUE) Standard deviations: Comp.1 Comp.2 Comp MetRef -
8 Last update: r:analisi_multivariata:analisi_in_componenti_principali 02/06/ :06 3 variables and 50 observations. Script princomp-ex.r PCA1<-princomp(USArrests, cor = TRUE) print(pca1) loadings(pca1) summary(pca1) PCA1$scores plot(pca1) biplot(pca1) PCA1$scores cor.pca1=cor(usarrests, PCA1$scores) cor.pca1 varimax(pca1$loadings[,1:2]) promax(pca1$loadings[,1:2]) In RCommander Utilizzando lo stesso esempio di prima, possiamo vedere come viene utilizzata in RCommander. Come prima cosa, carichiamo il dataset USArrests (Dati / Dati presenti nei pacchetti / Leggi i dati da un pacchetto caricato scrivere il nome del dataset). Poi selezioniamo la funzione Analisi delle componenti principali, nel Menu Statistiche / Analisi dimensionale. Infine selezioniamo le opzioni dalla finestra di dialogo: Printed on 20/08/ :38
9 20/08/ :38 9/16 L'analisi in componenti principali Rcmdr>.PC <- princomp(~assault+murder+rape+urbanpop, cor=true, data=usarrests) L output automatico di RCommander è composto da: La matrice dei component loadings Rcmdr> unclass(loadings(.pc)) # component loadings Assault Murder Rape UrbanPop La varianza delle componenti, ovvero la deviazione standard al quadrato (sd^2) Rcmdr>.PC$sd^2 # component variances La funzione summary(), che corrisponde a quella vista sopra Rcmdr> summary(.pc) # proportions of variance Importance of components: Standard deviation Proportion of Variance Cumulative Proportion E infine, se lo si è selezionato, il grafico delle componenti Rcmdr> screeplot(.pc) MetRef -
10 Last update: r:analisi_multivariata:analisi_in_componenti_principali 02/06/ :06 Attenzione: RCommander elimina l oggetto contenente gli output alla fine della procedura: Rcmdr> remove(.pc) La funzione PCA in FactoMineR L analisi in componenti principali in FactoMineR adotta un approccio ancora diverso. Come in princomp, le componenti vengono estratte dalla matrice delle correlazioni; diversamente che negli altri casi, però, l analisi delle variabili e dei casi, nonché l interpretazione dei fattori, viene condotta in base all associazione variabili-componenti o individui-componenti. In questo modo, è possibile rappresentare sui piani fattoriali le variabili eventualmente escluse dall analisi (supplementari, o illustrative), anche categoriali, e non solo quantitative. Le misure di associazione e di qualità della rappresentazione utilizzate sono infatti oltre alle correlazioni fra variabili attive e componenti i coseni quadri e i valori test, che possono essere calcolati anche per le modalità delle variabili categoriali. FactoMineR ha un plugin per RCommander, che fornisce una interfaccia a menu per l esecuzione dei comandi. Lo script utilizzato in questo esempio è disponibile all indirizzo In primo luogo, carichiamo la libreria necessaria, e il dataset di esempio: > library(factominer) > data(decathlon) Eseguiamo poi il comando, indicando le variabili supplementari quantitative (quanti.sup) e quelle qualitative (quali.sup). Le altre variabili contenute nel dataset saranno automaticamente utilizzate come attive ovvero per il calcolo delle componenti. Questo significa che il file deve contenere tutte Printed on 20/08/ :38
11 20/08/ :38 11/16 L'analisi in componenti principali e solo le variabili necessarie all analisi. > res <- PCA(decathlon, quanti.sup = 11:12, quali.sup = 13) L output produce anche il grafico dei casi che corrisponde al comamdo plot(res, choix= ind, axes=1:2) e quello delle variabili che corrisponde al comamdo plot(res, choix= var, axes=1:2) Possiamo omettere i grafici con l opzione graph = FALSE. Gli oggetti contenuti in res sono: > res **Results for the Principal Component Analysis (PCA)** The analysis was performed on 41 individuals, described by 13 variables *The results are available in the following objects: MetRef -
12 Last update: r:analisi_multivariata:analisi_in_componenti_principali 02/06/ :06 name description 1 "$eig" "eigenvalues" 2 "$var" "results for the variables" 3 "$var$coord" "coord. for the variables" 4 "$var$cor" "correlations variables - dimensions" 5 "$var$cos2" "cos2 for the variables" 6 "$var$contrib" "contributions of the variables" 7 "$ind" "results for the individuals" 8 "$ind$coord" "coord. for the individuals" 9 "$ind$cos2" "cos2 for the individuals" 10 "$ind$contrib" "contributions of the individuals" 11 "$quanti.sup" "results for the supplementary quantitative variables" 12 "$quanti.sup$coord" "coord. for the supplementary quantitative variables" 13 "$quanti.sup$cor" "correlations suppl. quantitative variables - dimensions" 14 "$quali.sup" "results for the supplementary categorical variables" 15 "$quali.sup$coord" "coord. for the supplementary categories" 16 "$quali.sup$v.test" "v-test of the supplementary categories" 17 "$call" "summary statistics" 18 "$call$centre" "mean of the variables" 19 "$call$ecart.type" "standard error of the variables" 20 "$call$row.w" "weights for the individuals" 21 "$call$col.w" "weights for the variables" Anche in questo caso, possiamo utilizzare i singoli oggetti contenuti in res per approfondire l analisi. Autovalori Autovalori e varianza spiegata (% e %cum): > res$eig eigenvalue percentage of variance comp comp comp comp comp comp comp comp comp comp cumulative percentage of variance comp comp comp comp Printed on 20/08/ :38
13 20/08/ :38 13/16 L'analisi in componenti principali comp comp comp comp comp comp Grafico degli autovalori: > barplot(res$eig[, 1]) Variabili Medie e deviazioni standard (scarto tipo) delle variabili attive: > round(cbind(res$call$centre, res$call$ecart.type), + 2) [,1] [,2] 100m Long.jump Shot.put High.jump m m.hurdle Discus Pole.vault Javeline m (cbind serve ad unire i dataframe, round serve ad arrotondare i decimali) Coordinate fattoriali delle prime quattro componenti: > res$var$coord[, 1:4] Dim.1 Dim.2 Dim.3 Dim.4 MetRef -
14 Last update: r:analisi_multivariata:analisi_in_componenti_principali 02/06/ :06 100m Long.jump Shot.put High.jump m m.hurdle Discus Pole.vault Javeline m Correlazioni delle variabili con le prime quattro componenti: > res$var$cor[, 1:4] Dim.1 Dim.2 Dim.3 Dim.4 100m Long.jump Shot.put High.jump m m.hurdle Discus Pole.vault Javeline m Casi Coordinate, contributi e coseni quadri: > round(cbind(res$ind$coord[, 1:4], res$ind$contrib[, + 1:4], res$ind$cos2[, 1:4]), 2) Dim.1 Dim.2 Dim.3 Dim.4 Dim.1 Dim.2 Dim.3 Dim.4 SEBRLE CLAY KARPOV BERNARD YURKOV Dim.1 Dim.2 Dim.3 Dim.4 SEBRLE CLAY KARPOV BERNARD YURKOV Caratterizzazione degli assi (prime 3 componenti): Printed on 20/08/ :38
15 20/08/ :38 15/16 L'analisi in componenti principali > dimdesc(res) $Dim.1 $Dim.1$quanti correlation p.value Points e+00 Long.jump e-08 Shot.put e-05 High.jump e-05 Discus e-04 Rank e m e m.hurdle e m e-09 $Dim.2 $Dim.2$quanti correlation p.value Discus e-05 Shot.put e m e m e-03 High.jump e-02 Javeline e-02 Long.jump e-02 $Dim.3 $Dim.3$quanti correlation p.value 1500m e-09 Pole.vault e-07 Javeline e-02 Infine, FactoMineR include una funzione che consente di esportare l intero output in un file csv: > write.infile(res,file="my_factominer_results.csv") Script FM-PCA-ex.R data(decathlon) res <- PCA(decathlon,quanti.sup=11:12,quali.sup=13) res res$eig barplot(res$eig[,1]) round(cbind(res$call$centre,res$call$ecart.type),2) res$var$coord[,1:4] MetRef -
16 Last update: r:analisi_multivariata:analisi_in_componenti_principali 02/06/ :06 res$var$cor[,1:4] round(cbind(res$ind$coord[,1:4],res$ind$contrib[,1:4],res$ind$cos2[,1:4 ]),2) dimdesc(res) write.infile(res,file="my_factominer_results.csv") Analisi multivariata, Comandi From: - MetRef Permanent link: Last update: 02/06/ :06 Printed on 20/08/ :38
Istruzioni per l analisi in componenti principali con R
Istruzioni per l analisi in componenti principali con R Vi ricordo che in nero sono state inserite le note e in rosso le istruzioni da digitare sulla console di R Importare il dataset gelati
DettagliAnalisi delle Componenti Principali con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi delle Componenti
DettagliAnalisi dei Fattori. Francesca Marta Lilja Di Lascio Dip.to di Scienze Statistiche P. Fortunati Università di Bologna
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Analisi dei Fattori Francesca Marta Lilja
DettagliAnalisi in Componenti Principali
Analisi in Componenti Principali 1/20 Analisi in Componenti Principali tecnica di riduzione e interpretazione dei dati spesso gioca un ruolo ausiliario rispetto ad altre tecniche (es. analisi fattoriale,
DettagliLa matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
DettagliAnalisi in componenti principali
Capitolo 2 Analisi in componenti principali 2.1 Introduzione L analisi in componenti principali è una tecnica di analisi multivariata tra le più diffuse. Viene utilizzata quando nel dataset osservato sono
DettagliStatistica multivariata Donata Rodi 21/11/2016
Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di
DettagliANALISI DELLE CORRISPONDENZE MULTIPLE (ACM)
ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM) Questa procedura è stata introdotta negli anni 70, ad opera della scuola francese di analisi dei dati (Benzecri). Inizialmente fu proposta per analizzare tabelle
DettagliEsplorazione grafica di dati multivariati. N. Del Buono
Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)
DettagliStatistica descrittiva con R
Statistica descrittiva con R Silvia Parolo 21 Novembre 2014 Sintesi dei dati Le votazioni in matematica di 20 studenti della Yale University sono state le seguenti: 68 84 75 82 68 90 62 88 76 93 73 79
DettagliAnalisi Fattoriale con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi Fattoriale
DettagliDall Analisi Fattoriale alla Regressione Lineare
Dall Analisi Fattoriale alla Regressione Lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 10 Consegna Lavoro di gruppo La scadenza per la consegna del lavoro di gruppo è fissata
DettagliStatistica descrittiva con R
Statistica descrittiva con R Monica Marabelli 6 Novembre 2015 Sintesi dei dati Le votazioni in matematica di 20 studenti della Yale University sono state le seguenti: 68 84 75 82 68 90 62 88 76 93 73 79
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI
DettagliANALISI MULTIDIMENSIONALE DEI DATI (AMD)
ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Analisi Multidimensionale dei Dati (AMD) è una famiglia di tecniche il cui obiettivo principale è la visualizzazione, la classificazione e l interpretazione della
DettagliTECNICHE DI POSIZIONAMENTO
TECNICHE DI POSIZIONAMENTO Discriminant analysis: definizione di n (generalmente 2) funzioni lineari discriminanti, basate su valutazioni quantitative di attributi, utilizzate per posizionare oggetti (marche,
DettagliPrincipal Component Analysis
Principal Component Analysis Alessandro Rezzani Abstract L articolo descrive una delle tecniche di riduzione della dimensionalità del data set: il metodo dell analisi delle componenti principali (Principal
DettagliLABORATORIO-MINITAB N. 2-3 VARIABILI QUANTITATIVE
LABORATORIO-MINITAB N. 2-3 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile alla distrofia muscolare
DettagliCapitolo 1. Analisi Discriminante. 1.1 Introduzione. 1.2 Un analisi discriminante Descrizione del dataset
Capitolo 1 Analisi Discriminante 1.1 Introduzione L analisi discriminante viene condotta per definire una modalità di assegnazione dei casi a differenti gruppi, in funzione di una serie di variabili fra
DettagliAnalisi delle Componenti Principali
Struttura e proprietà degli alimenti Analisi delle Componenti Principali Dott. Rossella Di Monaco Dipartimento di Scienza degli Alimenti CORSO di LAUREA MAGISTRALE in SCIENZE E TECNOLOGIE ALIMENTARI La
DettagliL A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
DettagliL analisi fattoriale
L analisi fattoriale Scopo dell analisi fattoriale e quello di identificare alcune variabili latenti (fattori) in grado di spiegare i legami, le interrelazioni e le dipendenze tra le variabili statistiche
DettagliAnalisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
DettagliRENATO LEONI. Esempi numerici riguardanti l'analisi della correlazione canonica
RENATO LEONI Esempi numerici riguardanti l'analisi della correlazione canonica UNIVERSITÀ DI FIRENZE DIPARTIMENTO DI STATISTICA "G. PARENTI" FIRENZE, 27 Questo lavoro è destinato a un uso personale e ne
DettagliStrumenti informatici Calcolare il coefficiente di correlazione di Pearson con Excel e SPSS
Strumenti informatici 7.3 - Calcolare il coefficiente di correlazione di Pearson con Excel e SPSS Il coefficiente di correlazione di Pearson può essere calcolato con la funzione di Excel =CORRELAZIONE(Matrice1;Matrice2),
DettagliAnalisi in Componenti Principali (ACP)
Analisi in Componenti Principali (ACP) Metodi di analisi fattoriale Obiettivo: individuazione di variabili di sintesi = dimensioni = variabili latenti = variabili non osservate Approccio: Ordinamenti tra
DettagliEsercitazione. 8 maggio 2012
Esercitazione 8 maggio 2012 Mi sento orgoglioso quando il mio paese ottiene buoni risultati sportivi a livello internazionale Gli intervistati possono scegliere una di queste risposte: 1 -Del tutto d'accordo
DettagliAnalisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
DettagliMetodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione
Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/6c_pca.html#(1) 1/25 Introduzione Gli approcci
DettagliSTATISTICA LAB. Analisi dei dati con R - Ex 2. Marta Nai Ruscone. LIUC - Università Carlo Cattaneo, Castellanza STATISTICA LAB
Analisi dei dati con R - Ex 2 Marta Nai Ruscone LIUC - Università Carlo Cattaneo, Castellanza Funzioni Una funzione è un insieme di comandi elementari. In R sono disponibili un gran numero di funzioni
Dettagli14 - UTILITY Edita Nuovo File
14 - UTILITY 14.1 - Edita Nuovo File E un piccolo editore di testi, da utilizzare internamente a DISCAV. I comandi e le caratteristiche sono quelli in Standard Windows. Edita nuovo significa che il programma
DettagliTRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative
TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi
DettagliStrumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS
Strumenti informatici 5.2 - Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS Sia Excel che SPSS consentono di realizzare in modo abbastanza rapido il test sulle medie
DettagliEsempio2: il settore elettrotecnico italiano
Esempio2: il settore elettrotecnico italiano Fonte: Graduatoria delle Principali Società Italiane, Mediobanca 2004. Osservazioni: 30 aziende operanti nel settore Elettronico Variabili considerate: 7 variabili
DettagliANALISI DEI DATI con EXCEL
ANALISI DEI DATI con EXCEL Distribuzione della frequenza per variabili qualitative 1) conteggio del numero delle osservazioni della variabile (funzione CONTA.VALORI) 2) definizione delle CATEGORIE (tramite
DettagliAnalisi delle componenti principali
Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste
DettagliApplicazioni statistiche e utilizzo del package statistico Spss - 7
Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno
DettagliStatistica multivariata 27/09/2016. D.Rodi, 2016
Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche
DettagliLab. 2 - Excel. Prof. De Michele e Farina
Lab. 2 - Excel Prof. De Michele e Farina 1 Utilizzo avanzato di un foglio elettronico: - Utilizzo di funzioni Regressioni lineari Istogrammi 2 La funzione somma restituisce la somma dei valori dei propri
DettagliPrincipal Component Analysis (PCA)
Principal Component Analysis (PCA) Come evidenziare l informazione contenuta nei dati S. Marsili-Libelli: Calibrazione di Modelli Dinamici pag. Perche PCA? E un semplice metodo non-parametrico per estrarre
DettagliP S I C O M T R I A Marcello Gallucci. Analisi Fattoriale. Esempi. Milano-Bicocca. Lezione: 20
Analisi Fattoriale Esempi P S I C O M T R I A Marcello Gallucci Milano-Bicocca Lezione: 20 Esempio Descrizione della ricerca Un ricercatore intende stabilire se una manipolazione sperimentale basata sulla
DettagliP S I C O M E T R I A. L'ultima lezione. Marcello Gallucci. Milano-Bicocca
L'ultima lezione Marcello Gallucci P S I C O M E T R I A Milano-Bicocca Come si svolge l'esame L'esame si svolge con l'ausilio del computer ed il software SPSS. Il testo dell'esame descrive una ricerca
DettagliExcel. È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti:
Excel È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti: Calcolare per ogni classe della distribuzione: (a) le frequenze relative; Sia data la distribuzione degli studenti
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 6-Altre tecniche per descrivere insiemi di dati (vers. 1.0c, 27 marzo 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:
esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliStatistica multivariata Donata Rodi 08/11/2016
Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui
DettagliRappresentazioni grafiche
Rappresentazioni grafiche Domenico Vistocco vistocco@unicas.it Dipartimento di Scienze Economiche UNIVERSITÀ DI CASSINO Corso di Statistica Le elaborazioni e i grafici sono stati ottenuti con il software
DettagliIntroduzione all Analisi Esplorativa dei Dati mediante R 1
Introduzione all Analisi Esplorativa dei Dati mediante R 1 Giovanna Menardi Giovanna.Menardi@econ.units.it A.A. 2008/2009 1 Materiale liberamente tratto da appunti a cura di M. Trevisani. Menardi Lezione
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliAlgebra lineare con R
Università di Napoli Federico II cristina.tortora@unina.it Standardizzare una variabile Standardizzazione Data una variabile X distribuita secondo una media µ e una varianza σ 2 la standardizzazione permette
DettagliStatistica per le ricerche di mercato
Università degli studi della Tuscia Dipartimento di Economia e Impresa Statistica per le ricerche di mercato a.a. 2014/15 Prof.ssa Tiziana Laureti 01. Introduzione al corso 1 Statistica per le ricerche
DettagliScale di Misurazione Lezione 2
Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile
DettagliProbablità, Statistica e Processi Stocastici
Probablità, Statistica e Processi Stocastici Franco Flandoli, Università di Pisa Riepilogo su PCA (affi ancare scheda R) Si parte da n variabili aleatorie X 1,..., X n. In pratica, si parte da una tabella
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliApprofondimento 6.1. Rappresentare graficamente la media campionaria e il suo intervallo di fiducia e le distribuzioni di probabilità con Excel
1 Approfondimento 6.1 Rappresentare graficamente la media campionaria e il suo intervallo di fiducia e le distribuzioni di probabilità con Excel Per rappresentare graficamente le medie campionarie di solito
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliAnno scolastico 2015/2016 PROGRAMMA SVOLTO. Docente: Catini Romina. Materie: Matematica. Classe : 4 L Indirizzo Scientifico Scienze Applicate
Anno scolastico 2015/2016 PROGRAMMA SVOLTO Docente: Catini Romina Materie: Matematica Classe : 4 L Indirizzo Scientifico Scienze Applicate UNITA DIDATTICA FORMATIVA 1: Statistica Rilevazione dei dati Rappresentazioni
DettagliLaboratorio con DERIVE
Laboratorio con Algebra 1 Capitolo 1, p. 2 Capitolo 2, p. 3 Capitolo 3, p. 5 Capitolo 4, p. 6 Capitolo 5, p. 7 Capitolo 6, p. 9 Capitolo 7, p. 10 Capitolo 8, p. 11 Capitolo 9, p. 12 Capitolo 10, p. 13
DettagliScheda n. 10: PCA - parte seconda
Scheda n. 10: PCA - parte seconda November 25, 2008 1 Il piano principale Con il comando: > biplot(pca) si ottiene un immagine del piano principale, con la proiezione dei dati e dei vecchi assi (le vecchie
DettagliEsempi di carte di controllo e Minitab
Esempi di carte di controllo e Minitab (Paola Vicard) Questa è una piccola guida alla costruzione delle principali carte di controllo con Minitab. Per una presentazione complessiva si veda il testo Il
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta
DettagliFacoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A
MODALITÀ A Riportare sul foglio nome, cognome, numero di matricola e modalità del testo d esame. Problema 1 (8 PUNTI) Su un collettivo di 10 clienti iscritti al programma frequent flyer di una nota compagnia
DettagliRealizzare una tabella per Statistics explorer
Promozione e diffusione della cultura statistica La statistica e le nuove tecnologie a supporto della didattica Realizzare una tabella per Statistics explorer Dai dati di I.Stat verso rappresentazioni
DettagliRICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali)
RICERCHE DI MERCATO 5.6 Analisi Fattoriale (Componenti Principali) Prof. L. Neri Dip. di Economia Politica Premessa Come evidenziato in precedenza l approccio di segmentazione per omogeneità prevede la
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliMicrosoft Excel VI parte: Frequenze & Grafici
Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti patti@di.unito.it Microsoft Excel VI parte: Frequenze & Grafici 1 Sommario Calcolo di frequenze sui valori
DettagliAnalisi Discriminante Canonica con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi Discriminante
DettagliESERCIZIO 1. Di seguito vengono presentati i risultati di un analisi fattoriale effettuata con il metodo di estrazione dei fattori principali (PAF).
ESERCIZIO. Di seguito vengono presentati i risultati di un analisi fattoriale effettuata con il metodo di estrazione dei fattori principali (PAF). Test KMO e di Bartlett Misura di adeguatezza campionaria
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliGRAFICO DI PARETO. variabile rispetto a cui si vuole ordinare (ossia nel nostro esempio
Si consideri il data set nel file Pareto.xls. GRAFICO DI PARETO Vediamo come costruire il grafico di Pareto con Excel. Questo grafico non costituisce un output standard pertanto sarà necessario compiere
DettagliLaboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
DettagliWe model for you. Proposta agli istituti di ricerca che operano in Italia Marzo 2013
Servicing di elaborazione indagini Proposta agli istituti di ricerca che operano in Italia Marzo 2013 Servicing di elaborazione indagini Da alcuni anni GMR svolge un attività di servicing esterno ad alcuni
DettagliIl Modello della Analisi Fattoriale Esplorativa e i Metodi di Classificazione Automatica (Analisi di Raggruppamento)
Il Modello della Analisi Fattoriale Esplorativa e i Metodi di Classificazione Automatica (Analisi di Raggruppamento) Se all interno di un insieme di informazioni articolato in una matrice di dati X si
DettagliSettimana 2. G. M. Marchetti. 4 Marzo 2017
Settimana 2 G. M. Marchetti 4 Marzo 2017 1 / 54 Mediana Un indice di posizione alternativo alla media e molto usato è la mediana È basato sull ordinamento dei dati La mediana è il valore Me tale che la
DettagliProva scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012
Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo
DettagliLABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE
LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliApplicazioni sulle caratteristiche bidimensionali
Applicazioni sulle caratteristiche bidimensionali 89 Applicazioni sulle caratteristiche bidimensionali 5.1 Richiamo di alcune operazioni di analisi statistica in MINITAB In questo paragrafo sono riportati
DettagliCORSO DI INFORMATICA. CL3 - Biotecnologie
CORSO DI INFORMATICA CL3 - Biotecnologie Formattazione dei numeri Convertire in numeri i numeri memorizzati come testo Può capitare che occasionalmente i numeri vengano formattati e memorizzati nelle celle
DettagliLA RAPPRESENTAZIONE E LA SINTESI DEI DATI
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LA RAPPRESENTAZIONE E LA SINTESI
DettagliEsempio 1 (Regressione semplice, punti influenti, regressione multipla, multicollinearità)
Esempio (Regressione semplice, punti influenti, regressione multipla, multicollinearità) DATI Il data set cigarettes.sav (fonte http://www.amstat.org/publications/jse/jse_data_archive.html) contiene dati
DettagliEsercizio 4 (Regressione multipla)
Esercizio (Regressione multipla) DATI Il data set employee.sav (o employee.xls; fonte SPSS) contiene 7 dati relativi agli impiegati di un azienda. Le variabili sono ID Employee Code BDATE Date of Birth
DettagliLezione precedente. D. Fioredistella IEZZI
Lezione precedente Installazione del software R Costanti e vettori: R lavora con valori, stringhe di caratteri, vettori e matrici, che vengono assegnati alle variabili con opportuni comandi. Ad esempio,
DettagliDistribuzioni univariate in MINITAB
Distribuzioni univariate in MINITAB 97 Distribuzioni univariate in MINITAB 6.1 Uso delle distribuzioni univariate in MINITAB MINITAB può essere usato come calcolatore di tavole. MINITAB può, infatti, calcolare
DettagliESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
DettagliL analisi delle corrispondenze semplici (AC) e multiple (ACM)
L analisi delle corrispondenze semplici (AC) e multiple (ACM) La CA costituisce uno dei più noti ed efficaci strumenti per il trattamento multidimensionale di dati qualitativi Obiettivi: Rappresentazione
DettagliEsercitazione n 2. Costruzione di grafici
Esercitazione n 2 Costruzione di grafici I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e del fenomeno
Dettagli7 - Calibrazione di una mappa in formato raster per n punti
7 - Calibrazione di una mappa in formato raster per n punti 7.1 - Calibrazione con rototraslazione in coordinate assolute Passiamo ora ad un elaborazione diversa della nostra mappa RASTER; procediamo infatti
DettagliProbabilità e Statistica Prova del 29/07/2016 Traccia E TEORIA Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.
Prova del 29/07/2016 Traccia E TEORIA ESERCIZIO 1 X f(x) 4 24 0 20 9 18 5 38 Sulla distribuzione di valori presentata in tabella, calcolare: (a) la media aritmetica, la media armonica e la media geometrica;
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliL analisi fattoriale viene effettuata per studiare, riassumere e semplificare le relazioni in un insieme di variabili
Analisi fattoriale L analisi fattoriale viene effettuata per studiare, riassumere e semplificare le relazioni in un insieme di variabili Ciò permette di individuare uno o più fattori o dimensioni latenti
DettagliEsercizi di MatLab. Sommario Esercizi di introduzione a MatLab per il corso di Calcolo Numerico e Laboratorio, A.A
Esercizi di MatLab Sommario Esercizi di introduzione a MatLab per il corso di Calcolo Numerico e Laboratorio, AA 2017 2018 Gli esercizi sono divisi in due gruppi: fondamentali ed avanzati I primi sono
DettagliRegressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141
Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel
DettagliLAB LEZ. 1 STATISTICA DESCRITTIVA CON R
LAB LEZ. 1 STATISTICA DESCRITTIVA CON R 1 2 L AMBIENTE DI SVILUPPO DI RStudio 1 3 4 2 1 FINESTRA PER GLI SCRIPT E PER VISUALIZZARE I DATI 2 CONSOLE DEI COMANDI 3 VARIABILI PRESENTI NELLA MEMORIA DEL PROGRAMMA
DettagliStatistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
DettagliUna Breve Introduzione a E-views
1 Dipartimento di Economia Politica e Metodi Quantitativi Università di Pavia 25 Febbraio 2008 Outline Specificazione ARIMA 1 Specificazione ARIMA 2 3 Per specificare una modello ARIMA è necessario differenziare
DettagliAnalisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca
Analisi Fattoriale Concetti introduttivi A M D Marcello Gallucci Milano-Bicocca Scopi generali L Analisi Fattoriale (e varianti) si propone di estrarre un numero limitato di fattori (variabili latenti
DettagliCovarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
Dettagli