L analisi fattoriale



Documenti analoghi
RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali)

Il concetto di valore medio in generale

LA CORRELAZIONE LINEARE

Dimensione di uno Spazio vettoriale

Elementi di Psicometria con Laboratorio di SPSS 1

Tecniche di analisi multivariata

4 3 4 = 4 x x x 10 0 aaa

Analisi fattoriale. esplorativa vers Germano Rossi 1 germano.rossi@unimib.it. 1 Dipartimento di Psicologia, Università di Milano-Bicocca

LEZIONE 23. Esempio Si consideri la matrice (si veda l Esempio ) A =

Misure finanziarie del rendimento: il Van

Misure finanziarie del rendimento: il Van

Scelte in condizioni di rischio e incertezza

Scheda n. 10: PCA - parte seconda

Elementi di Psicometria con Laboratorio di SPSS 1

Lezione n. 2 (a cura di Chiara Rossi)

Metodi statistici per le ricerche di mercato

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Capitolo 13: L offerta dell impresa e il surplus del produttore

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Capitolo 12 La regressione lineare semplice

ESERCIZI DI MATEMATICA FINANZIARIA DIPARTIMENTO DI ECONOMIA E MANAGEMENT UNIFE A.A. 2015/ Esercizi: lezione 24/11/2015

La distribuzione Normale. La distribuzione Normale

Esempi di funzione. Scheda Tre

(prezzo di chiusura del Venerdi' - prezzo di chiusura del Venerdi' precedente)/(prezzo di chiusura del Venerdi' precedente)

Parte 2. Determinante e matrice inversa

E naturale chiedersi alcune cose sulla media campionaria x n

La Minimizzazione dei costi

ANALISI DEI DATI PER IL MARKETING 2014

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Misure finanziarie del rendimento: il Van

Grandezze scalari e vettoriali

(a cura di Francesca Godioli)

GEOMETRIA DELLE MASSE

Corso di Matematica per la Chimica

Lineamenti di econometria 2

Relazioni statistiche: regressione e correlazione

RISCHIO E CAPITAL BUDGETING

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Matematica in laboratorio

Diagonalizzazione di matrici e applicazioni lineari

FUNZIONI / ESERCIZI SVOLTI

Calcolo del Valore Attuale Netto (VAN)

Statistica. Lezione 6

Excel Terza parte. Excel 2003

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

studi e analisi finanziarie La Duration

Corso di Macroeconomia. Il modello IS-LM. Appunti

Sia data la rete di fig. 1 costituita da tre resistori,,, e da due generatori indipendenti ideali di corrente ed. Fig. 1

Autovalori e Autovettori

~ Copyright Ripetizionando - All rights reserved ~ STUDIO DI FUNZIONE

UNA LEZIONE SUI NUMERI PRIMI: NASCE LA RITABELLA

4. Operazioni elementari per righe e colonne

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

LE FUNZIONI A DUE VARIABILI

Misure della dispersione o della variabilità

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE

b. Che cosa succede alla frazione di reddito nazionale che viene risparmiata?

Calcolo delle Probabilità

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n Test t. Test t. t-test test e confronto tra medie chi quadrato

Luigi Piroddi

Consideriamo due polinomi

Prova di autovalutazione Prof. Roberta Siciliano

Guida all uso di Java Diagrammi ER

Opinioni enti e imprese con accordi di stage / tirocinio

IL PROBLEMA DELLE SCORTE

DATI NORMATIVI PER LA SOMMINISTRAZIONE DELLE PROVE PAC-SI A BAMBINI DI INIZIO SCUOLA PRIMARIA 1

Anno 4 Grafico di funzione

G3. Asintoti e continuità

Lezione 9: Cambio di base

STATISTICA IX lezione

Principal Component Analysis

IL RISCHIO D IMPRESA ED IL RISCHIO FINANZIARIO. LA RELAZIONE RISCHIO-RENDIMENTO ED IL COSTO DEL CAPITALE.

I.I.S. Primo Levi Badia Polesine A.S

Metodi Statistici di Analisi dei Dati Ambientali

Capitolo 10 Z Elasticità della domanda

Domande a scelta multipla 1

Ricerca Operativa Esercizi sul metodo del simplesso. Luigi De Giovanni, Laura Brentegani

Economia del Lavoro 2010

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione

Elementi di Psicometria con Laboratorio di SPSS 1

Master della filiera cereagricola. Impresa e mercati. Facoltà di Agraria Università di Teramo. Giovanni Di Bartolomeo Stefano Papa

Esempio. Approssimazione con il criterio dei minimi quadrati. Esempio. Esempio. Risultati sperimentali. Interpolazione con spline cubica.

Analisi e diagramma di Pareto

LEZIONE n. 5 (a cura di Antonio Di Marco)

Documentazione esterna al software matematico sviluppato con MatLab

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Capitolo 3. L applicazione Java Diagrammi ER. 3.1 La finestra iniziale, il menu e la barra pulsanti

Domanda e Offerta - Elasticità Dott. ssa Sabrina Pedrini

Strumenti di indagine per la valutazione psicologica

[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Dott.ssa Caterina Gurrieri

MATEMATICA p = 4/6 = 2/3; q = 1-2/3 = 1/3. La risposta corretta è quindi la E).

Capitolo 5. La produzione e i costi

Transcript:

L analisi fattoriale Scopo dell analisi fattoriale e quello di identificare alcune variabili latenti (fattori) in grado di spiegare i legami, le interrelazioni e le dipendenze tra le variabili statistiche osservate x 1,x 2,. x k. Per esempio immaginiamo di avere i punteggi (o voti) in diverse materie scolastiche( x j, j=1,,9) : italiano, inglese, latino, filosofia, storia, matematica, fisica, chimica, geografia astronomica. Potremmo supporre che il rendimento scolastico sia legato a due fattori: attitudine scientifica e attitudine umanistica; ovvero che vi siano due fattori non osservabili (f h, h=1,2) che determinano i legami e le inter relazioni tra le x j. Si assume anche che vi siano dei fattori specifici (u j ): attitudini in una certa materia. In termini piu generali supponiamo sia: X j = µ j + λ j1 f 1 + + λ jm f m + u j j = 1,2,,k f 1,, f m sono i fattori comuni (m<k), u j sono i fattori specifici, λ jh,h = 1,,m sono dei parametri incogniti (pesi fattoriali). In sostanza il modello di analisi fattoriale postula che le variabili osservabili x j (j=1,,k) siano il risultato dell azione di m (m<k) fattori comuni f 1,,f m inosservabili e di fattori specifici u j (j=1,,k) anch essi non osservabili e di natura residuale. Usualmente le ipotesi che si fanno sono: I fattori comuni oltre ad avere valore atteso nullo, sono tra loro incorrelati ed hanno varianza unitaria. I fattori specifici oltre ad avere valore atteso nullo sono incorrelati ed hanno varianza pari a ψ j. I fattori comuni sono incorrelati con i fattori specifici h = 1,,m j=1,,k. Da tutto cio discende che: var(x j ) = Σ h λ 2 jh + ψ j = c j + ψ j (dove si e posto Σ h λ 2 jh = c j, in genere denominata comunalità),

cov(x j,x t ) = Σ h λ jh λ th La struttura di dipendenza lineare tra le variabili osservate e interamente dovuta ai fattori comuni. Stima dei λ jh (factor loadings o pesi fattoriali o, nel linguaggio dell output di spss: components) Si standardizzano le x j e si lavora sulla matrice di correlazione R (che sarebbe la matrice delle varianze delle x j standardizzate). Se vogliamo tanti fattori quante variabili (m=k) si estraggono gli autovalori ed i corrispondenti autovettori di R. Gli m vettori dei pesi fattoriali saranno dati (a meno di un coefficiente di proporzionalità) dagli m autovettori della matrice R. Ciascun component λ h contiene le correlazioni tra il fattore comune f h e le k variabili x. In altri termini il generico elemento λ jh di λ h e il coefficiente di correlazione tra x j e f h. Questo equivale esattamente a fare un analisi delle componenti principali delle variabili x j e a prendere come output non gli autovettori bensi le correlazioni tra la h-esima componente principale e le diverse variabili x j, j=1,,k. Se vogliamo un numero di fattori m <k, dobbiamo ipotizzare che nel modello esistano anche i fattori specifici. Pertanto la matrice dei dati da cui estraiamo gli autovalori ed i corrispondenti autovettori sarà la matrice di correlazione ridotta, ovvero: R 0 = R-Ψ 0. Ψ 0 e la matrice (diagonale) che contiene le stime iniziale delle varianze dei fattori specifici. Essendo dopo la standardizzazione - var(x j ) = c j + ψ j = 1, la matrice di correlazione ridotta e una matrice di correlazione che contiene sulla diagonale principale non piu tutti 1 bensi le stime preliminari (c j0 )delle comunalità. A differenza di R, R 0 non e una matrice definita semi-positiva, ed alcuni suoi autovalori potranno essere negativi. Sia p il numero di autovalori positivi. Possiamo porre m=p. Possiamo ricavarci λ jh, e tramite Σ h λ 2 jh = c j una nuova stima della comunalità e

quindi degli elementi diagonali della matrice ridotta (R 1 adesso). Estrarre gli autovalori positivi (o anche solo quelli >1) e trovare m fattori comuni. Di solito la stima preliminare della comunalità c j (e quindi direttamente della matrice ridotta) viene fornita o dal quadrato del coefficiente di correlazione multipla della j- esima variabile con tutte le altre, o dal piu grande dei coefficienti di correlazione tra la j-esima variabile e ciascuna delle altre. Cosi come avviene nell analisi delle componenti principali, per scegliere il numero m di fattori comuni da utilizzare per l analisi ci si basa sugli autovalori della matrice di correlazione (o di quella ridotta). Il rapporto tra l autovalore associato all h-esimo fattore comune (= somma dei quadrati dei loadings, ovvero = Σ j λ 2 jh ) e la traccia della matrice di correlazione ci indica la quota della variabilità complessiva spiegata dall h-esimo fattore. Interpretazione Per l interpretazione dei fattori comuni f h ci si basa sui λ jh, j=1,..,k. La situazione ideale e quella per cui j vi sono pochi λ jh elevati (in valore assoluto) e tanti λ jh prossimi allo zero. Tuttavia poiche le soluzioni dell analisi fattoriale sono univocamente determinate a meno di una trasformazione ortogonale e possibile ruotare i fattori con lo scopo di cercare le soluzioni che si prestino meglio ad una interpretazione. Esempio (dovuto a K. Wuensch ) Immaginiamo di essere interessati a cosa influenza il comportamento dei consumatori quando acquistano una birra. Chiediamo a 200 consumatori di dare un voto da 0 a 100 quanto considera importanti le seguenti qualità al fine di decidere di acquistare una confezione da 6: (basso) COST, (alta) SIZE (cioe

volume), (alta percentuale di) ALCOHOL, REPUTATION, COLOR, AROMA, (buon) TASTE. Sulla riga dei comandi, click Analyze, Data Reduction, Factor. Inserisci le 7 variabili. Click Descriptives and then check Initial Solution, Coefficients, Click Continue. Click Extraction and then select Correlation Matrix, Unrotated Factor Solution, Scree Plot, and Eigenvalues Over 1. Click Continue.

Click Rotation. Select Varimax and Rotated Solution. Click Continue. Click Options. Select Exclude Cases Listwise and Sorted By Size. Click Continue. Click OK, and SPSS completes the Principle Components Analysis.

La matrice di correlazione e : COST SIZE ALCOHOL REPUTAT COLOR AROMA TASTE COST 1.00.83.77 -.41.02 -.05 -.06 SIZE.83 1.00.90 -.39.18.10.03 ALCOHOL.77.90 1.00 -.46.07.04.01 REPUTAT -.41 -.39 -.46 1.00 -.37 -.44 -.44 COLOR.02.18.07 -.37 1.00.91.90 AROMA -.05.10.04 -.44.91 1.00.87 TASTE -.06.03.01 -.44.90.87 1.00 Iniziamo a fare le componenti principali, ovvero estraiamo m=7 fattori. Gli autovalori e le proporzioni di varianza spiegata dalle 7 componenti: Component 1 2 3 4 5 6 7 Initial Eigenvalues % of Cumulative Total Variance % 3.313 47.327 47.327 2.616 37.369 84.696.575 8.209 92.905.240 3.427 96.332.134 1.921 98.252 9.E-02 1.221 99.473 4.E-02.527 100.000 Extraction Method: Principal Component Analysis. Quante componenti tenere? - solo quelle con autovalore maggiore di 1 - tante da avere una % di varianza spiagata almeno pari a 80% - guardare scree plot per trovare il punto a destra del quale la pendenza decresce poco.

Nel nostro caso 3.5 Scree Plot 3.0 2.5 2.0 1.5 1.0 Eigenvalue.5 0.0 1 2 3 4 5 6 7 Component Number lo scree plot indicherebbe come migliore scelta quella di 2 o 3 componenti; la varianza spiegata tende ad individuarne 2, che sono anche i soli due autovalori superiori all unità. Le prime due componenti sono riportate nella tabella, menrte nel grafico si ha il cerchio delle correlazioni. Entrambi questi output servono ad interpretare i fattori estratti. COLOR AROMA REPUTAT TASTE COST ALCOHOL SIZE Component Matrix a Component 1 2.760 -.576.736 -.614 -.735 -.071.710 -.646.550.734.632.699.667.675 Extraction Method: Principal Component Analysis. a. 2 components extracted. Si puo notare che quasi tutte le variabili hanno un coefficiente elevato (in valore assoluto) sulla prima componente. Tutti positivi tranne che per la reputazione. La seconda componente e piu interessante: ha tre coefficienti alti e positivi e tre coefficienti alti e negativi. La prima componente sembra riflettere considerazioni riguardanti spesa e qualità contrapposte a reputazione. La seconda sembra contrapporre spesa/economicità a qualità. Effettuando una rotazione varimax:

Rotated Component Matrix a TASTE AROMA COLOR SIZE ALCOHOL COST REPUTAT Component 1 2.960 -.028.958 1.E-02.952 6.E-02 7.E-02.947 2.E-02.942 -.061.916 -.512 -.533 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations. Component 1 2 Total Variance Explained Rotation Sums of Squared Loadings % of Cumulative Total Variance % 3.017 43.101 43.101 2.912 41.595 84.696 Extraction Method: Principal Component Analysis. COST SIZE ALCOHOL REPUTAT COLOR AROMA TASTE Communalities Initial Extraction 1.000.842 1.000.901 1.000.889 1.000.546 1.000.910 1.000.918 1.000.922 Extraction Method: Principal Component Analysis. Possiamo anche andare a calcolare la SSL per ciascuna variabile, ovvero: Σ h λ 2 jh = c j, la cosi detta comunalità della j-esima variabile = R 2 della variabile prevista attraverso le componenti. Con i dati sulla birra risulta: COST,.84; SIZE,.90; ALCOHOL,.89; REPUTAT,.55; COLOR,.91; AROMA,.92; and TASTE,.92.

Si potrebbe usare un altro metodo, quello dell asse principale. Si parte da una matrice di correlazione ridotta, con le comunalità al posto degli 1 sulla diagonale principale. COST SIZE ALCOHOL REPUTAT COLOR AROMA TASTE Communalities Initial Extraction.738.745.912.914.866.866.499.385.922.892.857.896.881.902 Extraction Method: Principal Axis Factoring. Per fare una analisi fattoriale con il metodo principal axis iterato SPSS stima preliminarmente le comunalità tramite R 2 s, di ciascuna variabile e poi procede all analisi. Si itera l estrazione di componenti e la stima delle comunalità finche non si raggiunge la convergenza. Factor 1 2 Total Variance Explained Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Total % of Variance Cumulative % Total % of Variance Cumulative % 3.123 44.620 44.620 2.879 41.131 41.131 2.478 35.396 80.016 2.722 38.885 80.016 Extraction Method: Principal Axis Factoring.

TASTE AROMA COLOR SIZE ALCOHOL COST REPUTAT Rotated Factor Matrix a Factor 1 2.950-2.17E-02.946 2.106E-02.942 6.771E-02 7.337E-02.953 2.974E-02.930-4.64E-02.862 -.431 -.447 Extraction Method: Principal Axis Factoring. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations. Questo risultato e assai simile a quello ottenuto con il metodo delle componenti principali. Per quanto riguarda le rotazioni anche qui si puo scegliere. Tra le rotazioni ortogonali oltre a VARIMAX c e anche QUARTIMAX e EQUAMAX. Ortogonalità significa che le componenti (= fattori comuni) restano incorrelate tra loro, e gli assi ortogonali.