Analisi Fattoriale con R
|
|
|
- Rebecca Falcone
- 9 anni fa
- Visualizzazioni
Transcript
1 Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi Fattoriale con R Francesca Marta Lilja Di Lascio [email protected] Facoltà di Scienze Statistiche Università di Bologna 1
2 Outlines 1. Idea base e obiettivo dell analisi fattoriale 2. Preparazione del proprio ambiente di lavoro e del dataset 3. La funzione factanal 4. Analisi dei fattori 4.1 Stima del modello (3/3) 4.2 Proprietà del modello fattoriale 4.3 Rotazione degli assi fattoriali (2/2) 4.4 Calcolo dei punteggi fattoriali 4.5 Calcolo della matrice di correlazione riprodotta 4.6 Calcolo delle comunalità 4.7 Interpretazione dei risultati ottenuti e valutazione della bontà del modello 5. Nota sulla selezione del numero di fattori 2
3 1. Idea base e obiettivo dell analisi fattoriale L analisi dei fattori è uno dei metodi di analisi multivariata che permette di ridurre un elevato numero di variabili correlate ad un piccolo numero di variabili non correlate e latenti. Gli aspetti dell analisi fattoriale hanno radici negli studi eseguiti in ambito psicologico da Spearman nel L idea base consiste nel supporre che la relazione tra le variabili osservate, X i, con i = 1,2,..., p, dipenda da fattori comuni a tutte le variabili, f k, con k = 1,2,..., m, e da fattori specifici a ciascuna di esse, u i, con i = 1,2,..., p, cioè X i = λ i1 f λ ik f k λ im f m + u i dove p è il numero delle variabili rilevate, m il numero di fattori latenti e i coefficienti λ ik sono i pesi fattoriali. In generale, il modello fattoriale presenta la seguente formulazione X = Λf + u + µ in cui Λ è la matrice di dimensione (p m) dei pesi fattoriali (costanti), f è il vettore (m 1) dei fattori comuni (aleatori), u è il vettore (p 1) dei fattori specifici (aleatori) e µ è il vettore delle medie della variabili osservate. 3
4 2. Preparazione del workspace e dei dati Copiare il file candidati.txt dalla rete alla cartella c://temp (o ad una sua sottocartella, ad es. AnFat ) Aprire la console di R e cambiare directory di lavoro direttamente dalla console di R digitando: setwd("c://temp//anfat"); check digitando getwd() Il file candidati.txt contiene i punteggi rilevati su 48 candidati relativi a 15 caratteristiche ritenute importanti per il datore di lavoro per la scelta tra i candidati. Tali punteggi assumono valori compresi tra 0 e 10. Caricare il file di dati: dati <- read.table("candidati.txt", sep=",", dec=".", header=t) Guardare come è fatto il dataset: dim(dati); dati[1:5,]; summary(dati) L obiettivo è riprodurre e sintetizzare le informazioni contenute in queste 15 variabili mediante un insieme di variabili latenti di dimensione inferiore a 15. 4
5 3. La funzione factanal Il comando factanal effettua la stima di un modello fattoriale con il metodo della massima verosimiglianza. Consente di ricevere in input sia la matrice dei dati sia la matrice di varianza e covarianza. L analisi viene comunque effettuata con riferimento a variabili standardizzate. La funzione factanal prevede diversi argomenti tra cui molti opzionali factanal(x, factors, data=null, covmat=null, n.obs=na, subset, start=null, scores=c("none", "regression", "Bartlett"), rotation=c("varimax", "none")) Per il momento ci si concentra sui seguenti argomenti: x: può essere una formula oppure una matrice di dati; factors: il numero di fattori da stimare; data: un data frame solo se il primo argomento x è una formula. 5
6 4.1 Stima del modello (1/3) Digitare: g <- factanal(~., factors=4, dati) g o, equivalentemente, g1 <- factanal(dati, factors=4) g1 Verificare la coincidenza tra i due output: g e g1. Digitare: summary(g) per vedere l elenco degli oggetti calcolati. Si noti che l output della funzione è una lista. Usare il simbolo $ per estrarre oggetti da g; es.: g$factors 6
7 4.1 Stima del modello (2/3) uniquenesses è il vettore delle specificità: g$uniquenesses loadings è la matrice dei pesi fattoriali, in cui ogni colonna riporta i pesi di ciascun fattore: g$loadings STATISTIC, PVAL e dof contengono i risultati del test chi quadrato di adeguamento al campione e, rispettivamente, il valore della statistica test, il p value ad esso associato e il numero di gradi di libertà: g$statistic; g$pval; g$dof correlation è la matrice di correlazione di partenza: g$correlation criteria contiene informazioni sul processo di stima basato sulla massima verosimiglianza: g$method; g$criteria factors indica il numero dei fattori: g$factors n.obs indica il numero delle osservazioni: g$n.obs 7
8 4.1 Stima del modello (3/3) Argomenti opzionali del comando factanal possono essere: covmat: la matrice di covarianza (o correlazione) se non si dispone dei dati; n.obs: il numero di unità statistiche (se è stata inserita la matrice di varianza e covarianza); subset: un sottoinsieme dei casi da usare, se x è una matrice o una formula; start: NULL o una matrice di valori iniziali (in colonna) per il calcolo delle uniquenesses. Provare a digitare: g2 <- factanal(factors=4, covmat=cov(dati), n.obs=48) g2 Analizzare l output confrontandolo con gli altri precedentemente generati (g e g1). 8
9 4.2 Proprietà del modello fattoriale Il modello fattoriale è equivariante rispetto a cambiamenti di scala delle X. Tale proprietà permette, quindi, di lavorare indifferentemente sulle variabili osservate o sulle sue standardizzate, quindi con la matrice di var-cov o con la matrice di correlazione, rispettivamente. Infatti, digitando il seguente codice: dati2 <- scale(dati,t,t) prova1 <- factanal(dati2, factors=4) round(prova1$loadings[,1:4],2)==round(g$loadings[,1:4],2) round(prova1$uniqueness,2)==round(g$uniqueness,2) è possibile osservare che i risultati che si ottengono sono equivalenti. È ovvio che applicare l analisi fattoriale a dati2 (var. standardizzate) o a partire dalla matrice di correlazione delle X porta agli stessi risultati: prova2 <- factanal(factors=4, covmat=cor(dati), n.obs=48) round(prova2$loadings[,1:4],2)==round(g$loadings[,1:4],2) round(prova2$uniqueness,2)==round(g$uniqueness,2) 9
10 4.3 Rotazione degli assi fattoriali (1/2) Un importante argomento opzionale è: rotation che permette di scegliere il tipo di rotazione da effettuare. La rotazione dei fattori consente di scegliere, tra le possibili trasformazioni della matrice dei pesi fattoriali, quella che facilita l interpretazione dei fattori comuni in termini delle variabili (si chiama rotatione la procedura che consente di selezionare una tra le molteplici soluzioni possibili). La scelta viene fatta in base al principio per cui l identificazione dei fattori risulta semplificata se ciascuno di essi è fortemente correlato con un numero limitato di variabili (ed è poco correlato con le altre). In R è possibile non eseguire alcuna rotazione digitando none o specificare il nome di una funzione da usare per ruotare gli assi tra varimax a promax. 10
11 4.3 Rotazione degli assi fattoriali (2/2) Di default è la varimax (Kaiser, 1958), una rotazione che massimizza un indice basato sulla somma della varianza dei quadrati dei pesi fattoriali normalizzati entro ciascuna colonna della matrice dei pesi fattoriali (soddisfando il vincolo per cui i fattori risultano tra loro incorrelati). Il metodo Varimax è quello più comunemente accettato poichè pone maggiore enfasi nella semplificazione della struttura dei fattori in termini delle variabili. La matrice Λ è semplificata amplificando le correlazioni più alte di ciascun fattore e riducendo quelle più basse, agevolandone l interpretazione. Interpretare i pesi fattoriali ruotati con il metodo Varimax e confrontarli con quelli che si ottengono senza eseguire alcuna rotazione: g$loadings[,1:4] g3 <- factanal(dati, 4, rotation="none") g3$loadings[,1:4] Osservare come i valori dei pesi fattoriali siano cambiati. 11
12 4.4 Calcolo dei punteggi fattoriali Un ultimo argomento opzionale del comando factanal è: scores che consente di produrre i punteggi fattoriali, cioè i punteggi che i singoli individui hanno sui fattori identificati dall analisi. Di default è none, alternativamente si può digitare regression o Bartlett. Il metodo di Thomson ( regression ) stima i punteggi fattoriali in base all approccio della regressione multipla che impiega le correlazioni tra le variabili e le correlazioni delle variabili con il fattore. Ricalcolare g introducendo anche l opzione scores e richiamare i punteggi: g4 <- factanal(dati, factors=4, scores="regression") fs <- g4$scores Si noti che (usando una Varimax per default) i punteggi fattoriali risultano incorrelati: fs <- cbind(g4$scores[,1], g4$scores[,2], g4$scores[,3], g4$scores[,4]) cor(fs) 12
13 4.5 Calcolo della matrice di correlazione riprodotta La matrice ˆR = ˆΛˆΛ + ˆΨ contiene le correlazioni riprodotte dai fattori comuni. Nel caso in esame la matrice ˆΛ ha dimensioni 15 4 e la matrice diagonale ˆΨ ha dimensioni La matrice R ˆR è la matrice delle differenze tra le correlazioni campionarie e quelle riprodotte; tanto più piccoli sono gli elementi di R ˆR, tanto meglio i fattori comuni riproducono la matrice osservata. Calcolare le correlazioni riprodotte dal modello fattoriale g4 digitando; LL <- (g4$loadings[,1:4])%*%t(g4$loadings[,1:4]) RR <- LL + diag(g4$uniqueness) Calcolare gli scarti tra le correlazioni campionarie e quelle riprodotte utilizzando il metodo della massima verosimiglianza: round(g4$cor-rr,3) 13
14 4.6 Calcolo delle comunalità Ciascuna variabile manifesta ha un unità di varianza. La specificità (uniqueness) indica la proporzione della varianza della variabile considerata che non viene spiegata dalla soluzione fattoriale. Le comunalità si trovano calcolando il complemento a uno delle specificità: 1-factanal(dati,4,scores="regression")$uniquenesses o, equivalentemente, per il modello già trovato: 1-g4$uniquenesses Le comunalità permettono di valutare - in che misura il modello stimato riesce a render conto della variabilità di ogni singola variabile osservata e, quindi, costituiscono uno strumento per la diagnostica della bontà del modello usato e stimato. 14
15 4.7 Interpretazione dei risultati ottenuti Dire qual è la percentuale di variabilità spiegata dal modello stimato: g4$loadings (guardare le righe Cumulative Var e Proportion Var ) Dare un interpretazione ai fattori estratti a partire dalla matrice dei pesi fattoriali ruotata: g4$loadings[,1:4] Dire in che misura il modello stimato riesce a render conto della variabilità di ogni singola variabile osservata: 1-g4$uniquenesses Dire in che misura il modello riesce a riprodurre le correlazioni tra le variabili osservate ( analisi fattoriale confermativa ): round(g4$cor-rr,3); round(g4$cor-ll,3) (matr. di correlaz. residua) Valutare se il numero di fattori scelto è appropriato (ricordando il principio di parsimonia): g4$statistic; g4$pval 15
16 5. Nota sulla selezione del numero di fattori Se si può ipotizzare la normalità distributiva (multivariata) di X e si sono stimati i pesi fattoriali con il metodo della massima verosimiglianza (come nel nostro caso), allora è possibile controllare ipotesi sulla significatività del modello fattoriale adottato attraverso la seguente statistica test (con la correzione di Bartlett): { 2p + 11 W = n 2m } {log ˆΛˆΛ + ˆΨ log S } χ 2 {(p m) (p+m)} 2 che saggia l ipotesi nulla H 0 : Σ = ΛΛ + Ψ con Λ(p m) a rango pieno. L idea base è quella di trovare il valore di m (ponendo m = 1 e successivamente uguale a 2,3,...) tale che il test risulti NON significativo. Digitare: f1 <- factanal(dati, factors=4, scores="regression") f2 <- factanal(dati, factors=5, scores="regression") e scegliere il miglior numero di fattori digitando quanto segue (α = 0.01) e ricordando il principio di parsimonia: f1$pval>0.01 f2$pval>0.01 La scelta del numero dei fattori da selezionare rientra nella cosiddetta analisi fattoriale esplorativa. 16
Analisi dei Fattori. Francesca Marta Lilja Di Lascio Dip.to di Scienze Statistiche P. Fortunati Università di Bologna
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Analisi dei Fattori Francesca Marta Lilja
Analisi delle Componenti Principali con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi delle Componenti
Analisi Discriminante Canonica con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi Discriminante
Differenze tra metodi di estrazione
Lezione 11 Argomenti della lezione: L analisi fattoriale: il processo di estrazione dei fattori Metodi di estrazione dei fattori Metodi per stabilire il numero di fattori Metodi di Estrazione dei Fattori
Analisi delle Serie Storiche con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi delle Serie
Analisi delle componenti principali
Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste
Analisi delle Serie Storiche con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi delle Serie
Analisi della correlazione canonica
Analisi della correlazione canonica Su un collettivo di unità statistiche si osservano due gruppi di k ed m variabili L analisi della correlazione canonica ha per obiettivo lo studio delle relazioni di
Psicometria. 9-Analisi fattoriale confermativa vers. 1.0
Psicometria 9-Analisi fattoriale confermativa vers. 1.0 Germano Rossi 1 [email protected] Giovanni Battista Flebus 1 [email protected] 1 Dipartimento di Psicologia, Università di
La matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
Contenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
Statistical Process Control
Statistical Process Control ESERCIZI II Esercizio 1. Una ditta che produce schermi a cristalli liquidi deve tenere in controllo il numero di pixel non funzionanti. Vengono ispezionati venti schermi alla
STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:
esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia [email protected] http://www.lucamonno.it
UNIVERSITÀ DEGLI STUDI DI PERUGIA
SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale
6. ANALISI FATTORIALE
6. ANALISI FATTORIALE 6.1 Introduzione L analisi fattoriale (AF) si è sviluppata nell ambito della ricerca sulla misura di capacità attitudinali all inizio del 1900. Spearman effettua molti test su campioni
Dall Analisi Fattoriale alla Regressione Lineare
Dall Analisi Fattoriale alla Regressione Lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 10 Consegna Lavoro di gruppo La scadenza per la consegna del lavoro di gruppo è fissata
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
Statistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: [email protected] 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
Analisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
Caratterizzazione dei consumi energetici (parte 3)
ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo [email protected] Definizioni di base Una popolazione è l insieme
ESERCIZIO 1. Di seguito vengono presentati i risultati di un analisi fattoriale effettuata con il metodo di estrazione dei fattori principali (PAF).
ESERCIZIO. Di seguito vengono presentati i risultati di un analisi fattoriale effettuata con il metodo di estrazione dei fattori principali (PAF). Test KMO e di Bartlett Misura di adeguatezza campionaria
Statistica multivariata Donata Rodi 21/11/2016
Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo [email protected] Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
Analisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca
Analisi Fattoriale Concetti introduttivi A M D Marcello Gallucci Milano-Bicocca Scopi generali L Analisi Fattoriale (e varianti) si propone di estrarre un numero limitato di fattori (variabili latenti
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
STATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
Il modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
Analisi in componenti principali
Capitolo 2 Analisi in componenti principali 2.1 Introduzione L analisi in componenti principali è una tecnica di analisi multivariata tra le più diffuse. Viene utilizzata quando nel dataset osservato sono
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
Analisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
Statistica multivariata 27/09/2016. D.Rodi, 2016
Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche
Algebra lineare con R
Università di Napoli Federico II [email protected] Standardizzare una variabile Standardizzazione Data una variabile X distribuita secondo una media µ e una varianza σ 2 la standardizzazione permette
Analisi in Componenti Principali (ACP)
Analisi in Componenti Principali (ACP) Metodi di analisi fattoriale Obiettivo: individuazione di variabili di sintesi = dimensioni = variabili latenti = variabili non osservate Approccio: Ordinamenti tra
Ulteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
Analisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.
Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z, riferito
standardizzazione dei punteggi di un test
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la
Analisi della correlazione canonica
Capitolo 8 Analisi della correlazione canonica Si supponga che su un collettivo di unità statistiche si siano osservati due gruppi di k ed m variabili corrispondenti ad altrettanti aspetti di un fenomeno
Istruzioni per l analisi in componenti principali con R
Istruzioni per l analisi in componenti principali con R Vi ricordo che in nero sono state inserite le note e in rosso le istruzioni da digitare sulla console di R Importare il dataset gelati
Analisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
Strumenti informatici Calcolare il coefficiente di correlazione di Pearson con Excel e SPSS
Strumenti informatici 7.3 - Calcolare il coefficiente di correlazione di Pearson con Excel e SPSS Il coefficiente di correlazione di Pearson può essere calcolato con la funzione di Excel =CORRELAZIONE(Matrice1;Matrice2),
Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
Analisi delle Serie Storiche con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Analisi delle Serie Storiche con R Francesca
Esercizi svolti. delle matrici
Esercizi svolti. astratti. Si dica se l insieme delle coppie reali (x, y) soddisfacenti alla relazione x + y è un sottospazio vettoriale di R La risposta è sì, perchè l unica coppia reale che soddisfa
PROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
Cognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
Test F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
Analisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 CDF empirica
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
ESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative
TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi
Dispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.
ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks
Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
Esercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
ESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti.
ESERCIZIO. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con fattori tra i soggetti. Variabile dipendente: PERF Sorgente Modello corretto Intercept SEX_96
La regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
Statistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi
Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi Esercizio 1 Data la variabile casuale X con funzione di densità f(x) = 2x, per 0 x 1; f(x) = 0 per x [0, 1], determinare: a) P( - 0,5 < X< 0,7) b)
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
Test delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
STATISTICA AZIENDALE Modulo Controllo di Qualità
STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
Esame di Istituzioni di Matematica II del 18 gennaio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola
Esame di Istituzioni di Matematica II del 8 gennaio 00 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Es. Es. Es. 3 Es. 4 Somma Voto finale Attenzione: si
Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili
