Università di Bologna Facoltà di Scienze statistiche. Analisi fattoriale. Alessandro Lubisco

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Università di Bologna Facoltà di Scienze statistiche. Analisi fattoriale. Alessandro Lubisco"

Transcript

1 Università di Bologna Facoltà di Scienze statistiche Analisi fattoriale Alessandro Lubisco

2

3 INDICE Indice... i Analisi Fattoriale... 1 Aspetti introduttivi... 1 Introduzione ai modelli a variabili latenti... 4 Esempi di problemi con variabili latenti e manifeste... 5 Modelli a variabili latenti... 6 Il modello lineare a un fattore... 8 Il modello fattoriale... 1 Specificazione del modello fattoriale Comunalità e specificità Proprietà del modello fattoriale... Equivarianza rispetto a cambiamenti di scala... Identificazione del modello... 4 Invarianza del modello rispetto a rotazioni ortogonali della matrice Λ... 4 Stima dei parametri del modello... 7 Metodi di stima... 8 Metodo delle componenti principali... 9 Metodo dei fattori principali... 3 Ripercorriamo il metodo dei fattori principali Il metodo della massima verosimiglianza Rotazione degli assi fattoriali Rotazione VARIMAX (aiser, 1958) Rotazione QUARTIMAX Rotazione EQUAMAX Rotazioni oblique Prima di interpretare i fattori Esempio di valutazione dei pesi fattoriali Determinazione dei punteggi fattoriali Una prima interpretazione I pesi fattoriali Le comunalità Adeguatezza del modello e scelta del numero di fattori Percentuale di varianza spiegata da fattori Matrice di correlazione riprodotta Test sulla bontà di adattamento Riassumendo: Scopi e procedure dell analisi fattoriale Passo 1: Selezione delle variabili Passo : Calcolo ed esame della matrice di correlazione tra le variabili Passo 3: Estrazione dei fattori non ruotati Passo 4: Rotazione dei fattori Passo 5: Interpretazione della matrice dei fattori ruotati Analisi fattoriale e analisi delle componenti principali Errori comuni nell uso dell analisi fattoriale... 6

4

5 ANALISI FATTORIALE ASPETTI INTRODUTTIVI Gli aspetti caratteristici dell analisi fattoriale si fondano sulle origini del metodo, che si è sviluppato all inizio del secolo scorso ad opera di Spearman, nell ambito della ricerca psicometrica sulle misure delle capacità psicoattitudinali. In un lavoro del 1904, Spearman riporta le correlazioni osservate tra i risultati (voti) conseguiti da un gruppo di studenti in tre diverse materie: lettere (X 1 ), francese (X ), inglese (X 3 ). R = 1 0,83 1 0,78 0,67 1 Egli si chiede se le correlazioni osservate non possano essere spiegate dalla relazione delle tre variabili con un unica variabile latente f che può essere pensata come, per esempio, l intelligenza o la predisposizione allo studio in determinate materie. Se esiste una variabile f in grado di render conto delle correlazioni tra ciascuna coppia di variabili, allora significa che la correlazione residua tra le variabili osservate, una volta che si è eliminato l effetto di f su ciascuna di esse, deve essere non significativamente diversa da zero, ovvero le variabili osservate devono essere linearmente indipendenti condizionatamente ai valori di f. L analisi dei fattori è un metodo di analisi multivariata volto a spiegare le correlazioni fra un insieme di p variabili osservate attraverso un insieme di m variabili non osservate. Si ricorda che la correlazione r ii tra due variabili X i e X i può risultare dalla loro associazione con una terza variabile esterna f k ed è misurabile attraverso la correlazione parziale r ii ;k. Essa misura, infatti, l associazione tra X i e X i quando f k è resa costante ed è quindi la correlazione residua tra X i e X i dopo che si è eliminato l effetto lineare di f k su ciascuna di esse.

6 Analisi fattoriale Esprimiamo le relazioni lineari di X i e X i con la variabile esterna f k (per comodità usiamo le variabili scarto) x x i i' x i x i' = b i = b ( fk fk ) + ei ei = xi xi bi( fk fk ) ( f f ) + e e = x x b ( f f ) i' k La correlazione tra i residui è data da: r ii';k = k ( ei ei )( ei' ei' ) ( ei ei ) ( ei' ei' ) Dal momento che le medie dei residui e i ed segue che: r ii';k = ( ei )( ei' ) ( ei ) ( ei' ) Sostituendo si ottiene: r ii';k = che si semplifica in: i' ( fk fk bi( xi xi ))( fk fk bi' ( xi' xi' )) ( fk fk bi( xi xi )) ( fk fk bi' ( xi' xi' )) i' i' i' i' k k e i' sono pari a zero ne r ii';k = r ii' 1 r r ik ik r i'k 1 r i' k Tale coefficiente misura la correlazione rimanente tra X i e X i dopo aver corretto entrambe le variabili dell effetto lineare di f k su di esse. Qualora X i e X i non fossero influenzate da f k allora r ii';k r ii' in quanto r ik = 0 e r i'k = 0. Poste certe condizioni sulla variabile f non osservata è facile verificare che un modello, il quale ipotizzi una relazione lineare di ciascuna delle variabili osservate con f, sia in grado di spiegare la correlazione tra le X. Se f spiega le correlazioni, allora le variabili osservate possono essere espresse in funzione di f nel modo seguente:

7 A. Lubisco 3 dove: X 1 = λ 1 f + u 1 X = λ f + u X 3 = λ 3 f + u 3 - f è un fattore latente comune a tutte le variabili, che rappresenta l abilità generale di uno studente; - i λ i sono detti pesi fattoriali; - gli u i sono i fattori specifici di ogni singola variabile. Il fattore specifico può avere in questo contesto una duplice interpretazione: o l abilità individuale in ogni singola disciplina dipende anche in una certa misura dall abilità specifica in tale disciplina; o inoltre, la presenza del fattore specifico è legata anche al fatto che la prova o l esame è solo una misura approssimata dell abilità generale dello studente e perciò affetta da errore.

8 4 Analisi fattoriale INTRODUZIONE AI MODELLI A VARIABILI LATENTI L analisi fattoriale appartiene a una famiglia di metodi che utilizza le cosiddette variabili latenti. Spesso, in particolar modo nelle scienze sociali, non si è in grado di misurare le grandezze di interesse. Esempi di tali concetti sono l intelligenza, l orientamento politico, lo stato socio-economico. Sebbene nelle scienze sociali si trattino tali grandezze al pari di qualunque altra variabile, queste si differenziano perché non possono essere osservate ed è per questo motivo che sono dette latenti. In alcuni casi, un concetto può essere rappresentato da un unica variabile latente, ma spesso essi sono di natura multidimensionale e per questo motivo possono coinvolgere più di una variabile latente. Queste variabili latenti sono talvolta chiamate fattori. Tra i metodi a variabili latenti, l analisi fattoriale è il più antico e il più usato. C è uno stretto legame tra l analisi fattoriale (Factor Analysis FA) e l analisi delle componenti principali (Principal Components Analysis PCA). Infatti, è usuale vedere la PCA come un metodo della FA (il software statistico SPSS tratta entrambi i metodi nella stessa procedura). E necessario, però, porre l accento sulla profonda diversità tra i due metodi. Questo per diverse ragioni: - La PCA è un metodo descrittivo che ha l obiettivo di riassumere una matrice di dati in maniera tale da esprimere la sua struttura in un numero ridotto di dimensioni. La FA è una tecnica basata su un modello che richiede siano fatte assunzioni riguardo le distribuzioni congiunte in popolazione delle variabili coinvolte. Ciò consente di fare inferenza riguardo alla popolazione e di fare riferimento a concetti quali bontà di adattamento, significatività e precisione delle stime. - La seconda ragione per enfatizzare la distinzione tra PCA e FA sta nel fatto che, mentre l analisi in componenti principali è un metodo per individuare una particolare trasformazione delle variabili osservate (una combinazione lineare), nella FA sono invece le variabili osservate a essere espresse come combinazione lineare di fattori latenti. Per questo motivo, la FA si inserisce nell'ambito

9 A. Lubisco 5 dei modelli a variabili latenti, dei quali verranno esaminati più avanti altri esempi. Tradizionalmente l unità di questa famiglia di metodi a variabili latenti è sempre stata oscurata dall uso di notazioni differenti e dalle diverse culture scientifiche da cui hanno avuto origine oltre che dai diversi campi di utilizzo. - Nella PCA si cerca di spiegare con poche componenti una grande parte della varianza delle variabili osservate. Nella FA, invece, si prendono in considerazione le covarianze, o le correlazioni, tra le variabili. Nella pratica, ci sono alcuni data set per i quali il modello fattoriale non fornisce un adeguato adattamento. Quindi, l analisi fattoriale presenta alcuni aspetti soggettivi tali per cui tra statistici ci sono opinioni contrastanti sulla sua validità. Talvolta, si individua un numero ridotto di fattori e tali fattori sono di facile interpretazione. Per altri dati, invece, non sono chiari né il numero dei fattori, né la loro interpretazione. Esempi di problemi con variabili latenti e manifeste i) Esiste un grande interesse nella misurazione dell intelligenza. Essa è concepita come un importante caratteristica dell'individuo posseduta in una certa misura, grande o piccola che sia. Tuttavia non si tratta di qualche cosa simile al peso o all età per i quali ci sono già degli strumenti di misura. L intelligenza è un costrutto, cioè è un concetto che troviamo utile e ricco di significato ma che non esiste, almeno non nel senso delle caratteristiche tangibili che ha, per esempio, il peso. È possibile tuttavia includerlo in un modello matematico e trattarlo come qualunque altra variabile. L intelligenza è un buon esempio di variabile latente. Le variabili indicatore sono quantità che si presume siano influenzate dalla variabile latente. Nel caso dello studio sull'intelligenza sono, usualmente, i punteggi ottenuti nei test scelti perché si ritiene che persone più intelligenti abbiano risultati migliori. Alcuni quesiti (item) potrebbero riguardare il linguaggio o la matematica, altri invece potrebbero sondare l abilità nel riconoscere particolari strutture. Se gli item richiedono tutti la medesima abilità mentale, ci si aspetta che i punteggi negli item siano correlati positivamente. Il problema è vedere se questa correlazione può essere rappresentata da un unica variabile latente e, se è così, determinare

10 6 Analisi fattoriale dove posizionare gli individui nella scala di questa variabile. ii) La misura dell orientamento politico è simile a quello dell'intelligenza. Descriviamo gli individui come tendenzialmente di destra o di sinistra, oppure più a destra/sinistra di altri. Implicitamente, in questo linguaggio c è l idea che esista una scala lungo la quale gli individui possano essere posizionati andando dall estrema sinistra all estrema destra. Questa è una scala latente e se si desidera costruire una simile scala saranno necessari opportuni indicatori. Questi possono essere determinati, per esempio, da un indagine in cui viene chiesto quali sono gli atteggiamenti riguardo ad alcune questioni politiche quali la sanità privata, l educazione privata e i sindacati. iii) Per misurare una variabile latente come lo stato socio-economico di una famiglia, è possibile, analogamente, raccogliere informazioni riguardo a reddito, occupazione e livello di istruzione dei membri della famiglia. In ciascuno di questi esempi si è utilizzato un criterio personale di comprensione della variabile latente di interesse per identificare alcune variabili manifeste che, si crede, rivelino qualche cosa riguardo la sottostante variabile latente. In effetti, si è partiti da una variabile latente per poi cercare le variabili manifeste che potessero fungere da indicatori perché già in possesso di un idea su quale potesse essere la variabile latente. Talvolta si procede nella direzione opposta. Per esempio, se si dispone di un indagine multiscopo, si può supporre che il grande numero di dimensioni manifeste, rappresentato dalle diverse decine di domande del questionario, possa essere ridotto a un numero più piccolo di dimensioni, senza che ciò comporti la perdita di informazioni essenziali. Questo secondo approccio è quello seguito usando la PCA. Modelli a variabili latenti I modelli a variabili latenti sono strettamente collegati al modello di regressione. Può essere perciò utile descrivere l idea base dell'analisi fattoriale in termini di analisi di regressione. Un modello di regressione esprime la relazione tra una variabile dipendente e una o più variabili indipendenti o regressori. Nell analisi fattoriale, la relazione di regressione è tra una variabile manifesta e le variabili latenti. In entrambi i casi vengono fatte assunzioni ri-

11 A. Lubisco 7 guardo la distribuzione dei residui o termini di errore in maniera da poter fare inferenza. Il problema essenziale che deve risolvere l'analisi fattoriale è quello di ottenere informazioni sulle variabili latenti, note le manifeste. Dal momento che non è possibile osservare le variabili latenti, è possibile conoscere qualche cosa di questa relazione solo indirettamente. Molte variabili manifeste dipendono spesso dalle medesime variabili latenti e questa dipendenza genera delle correlazioni tra di loro. In effetti, l esistenza di una correlazione tra due indicatori può essere considerata come l evidenza di una sorgente di influenza comune. L obiettivo dell analisi a variabili latenti è di determinare se la dipendenza tra le variabili osservate possa essere spiegata da un piccolo numero di variabili latenti. Come già osservato, i modelli a variabili latenti possono essere impiegati sia in un momento esplorativo per identificare le variabili latenti sottostanti un gruppo di item, sia in un approccio confermativo per verificare se un gruppo di item, costruito per misurare particolari concetti, sia effettivamente in grado di spiegare tale struttura. Ci sono vari tipi di modelli a variabili latenti. Questi modelli si distinguono per il livello di misura delle variabili osservate e per le assunzioni fatte a proposito del livello di misura delle variabili latenti. La seguente tabella mostra una classificazione dei modelli a variabili latenti. Variabili osservate Variabili latenti Metriche Categoriche Metriche Analisi fattoriale Latent trait analysis Categoriche Latent profile analysis Latent class analysis Questa tabella non esaurisce le possibilità perché, per esempio, le variabili manifeste possono essere un mix tra variabili metriche e categoriche. L analisi fattoriale, il primo dei metodi a variabili latenti di cui ci si occupa, è una tecnica appropriata quando tutte le variabili osservate sono su una scala metrica. Il modello fattoriale che è alla base del metodo assume che anche le variabili latenti siano metriche.

12 8 Analisi fattoriale IL MODELLO LINEARE A UN FATTORE Il più semplice modello fattoriale è quello che comprende un solo fattore. Charles Spearman, che inventò l analisi fattoriale, introdusse questo modello nello studio dell intelligenza umana. Si introdurrà il modello tramite un esempio che consentirà di mostrare che quello fattoriale può essere pensato come un sistema di equazioni di regressione nel quale alcune variabili (le variabili latenti) non sono osservate. L analisi fattoriale si pone l obiettivo di spiegare le correlazioni tra un gruppo di variabili manifeste. Queste correlazioni sono spesso spurie, nel senso che non sono dovute all esistenza di un legame causale diretto tra le variabili considerate. Esse talvolta esistono in quanto le variabili in questione hanno una dipendenza comune con una o più altre variabili. Per esempio, il fatto che la lunghezza dei piedi dei bambini sia correlata positivamente con l abilità nello scrivere non significa che dei piedi grandi aiutino i bambini a scrivere meglio. La correlazione è, piuttosto, una conseguenza accidentale del fatto che entrambe le caratteristiche sono correlate con l età: maggiore è l età, più grandi sono i piedi e migliore è l abilità nello scrivere. Quando ci si trova in situazioni analoghe è importante investigare per vedere se è possibile ottenere una spiegazione della correlazione attraverso la comune dipendenza con una o più altre variabili. In alcuni casi ci può essere un candidato ovvio al ruolo di altra variabile. Si supponga, per esempio, che si stia conducendo uno studio sulle spese settimanali fatte da un campione di famiglie su una grande varietà di prodotti: cibo, viaggi, divertimento, vestiti, Si supponga, inoltre, di trovare una correlazione positiva tra un paio di acquisti. Non sarebbe credibile affermare che un alta spesa in vestiti sia causa di alte spese in viaggi. È più plausibile supporre che spese alte di questi prodotti siano una conseguenza del disporre di un alto reddito. Per investigare questa ipotesi si dovrebbero ottenere ulteriori informazioni circa il reddito delle famiglie. Ciò permetterebbe di vede-

13 A. Lubisco 9 re se l ammontare di spesa per ciascun prodotto sia correlato al reddito complessivo, e, se così, se la relazione sia in grado di spiegare la correlazione tra le varie spese. Come si può effettuare questa verifica empiricamente? Una maniera potrebbe essere quella di specificare come ciascuna spesa possa essere legata al reddito. Per avere un idea preliminare su come fare ciò, si può, per esempio, specificare la relazione tra la spesa per il cibo e il reddito. Si supponga che si trovi una relazione pressoché lineare e che si ottenga un risultato analogo per ogni altro item. Si possono perciò scrivere semplici regressioni della forma: C i = α i + β i I + e i (i = 1,, ) dove C i rappresenta la spesa per l i-esimo item, I è il reddito della famiglia, α i e β i rispettivamente l intercetta e la pendenza della retta di regressione ed e i il residuo, specifico per C i con media zero, indipendente da I, che spieghi la variazione residua lungo la retta. Se si trova che questo modello ha un buon adattamento per tutti gli item di spesa, e che i residui e i sono incorrelati tra loro, allora si sarà dimostrato che il reddito è l unico elemento distinguibile determinante per la spesa. Per una quantità specifica di reddito, la spesa per l item i si comporterà come una variabile casuale con media α i + β i I e deviazione standard data dalla deviazione standard di e i. Dal momento che i residui sono indipendenti, tutte le correlazioni tra le variabili osservate vengono rimosse. Infatti considerando gli item i-esimo e j-esimo la correlazione tra C i e C j per un dato reddito I è data da E[(C i E(C i ))(C j E(C j )) I] = = E[(α i + β i I + e i (α i + β i I))(α j + β j I + e j (α j + β j I)) I] = = E[(e i e j ) I] = 0 Se tutto ciò accadesse, si verificherebbe che le reciproche correlazioni tra le spese per i vari articoli sarebbero spiegate dalla comune dipendenza dal reddito. Inoltre, i coefficienti di regressione β i spiegherebbero quanto intensamente ciascun item dipenda dal reddito. In forma generale, nell ambito del modello a un fattore, se si sup-

14 10 Analisi fattoriale pone che p variabili manifeste x 1, x,, x p dipendano per ipotesi da un unico fattore o variabile latente f, la maniera più semplice di esprimere la relazione di ciascuna x su f è tramite il modello lineare x i = λ i f + u i (i = 1,,, p) f è il fattore comune dal momento che è comune a tutte le x i. I residui u i sono i fattori specifici in quanto riferiti ciascuno alla corrispondente x i. Nel modello a un fattore si fanno le stesse ipotesi del modello di regressione: - indipendenza dei fattori specifici u i da f - distribuzione normale, media nulla e deviazione standard σ i degli u i. - si suppone inoltre gli u i siano indipendenti tra di loro per cui le x i sono condizionatamente indipendenti, dato f. Si possono perciò fare delle considerazioni per ciò che riguarda la distribuzione delle x i e in particolare sulle covarianze e correlazioni. Dal momento che f è una variabile non osservata, possiamo sceglierla con le caratteristiche che fanno più comodo, senza che questo influisca sulla forma dell equazione di regressione: f avrà media 0 e deviazione standard unitaria. Ne consegue, disponendo di questo modello, che le covarianze avranno la seguente semplice forma: Cov(x i, x j ) = λ i λ j (i, j = 1,, p; i j) È importante osservare che la covarianza è il prodotto di due numeri, uno dipendente da i e l altro da j. Da ciò è possibile determinare qualche cosa a proposito dei coefficienti di regressione del modello. Per esempio Cov(x 1, x ) Cov(x, x 3 ) / Cov(x 1, x 3 ) = λ è una relazione che serve a determinare λ dalle covarianze. In realtà, è possibile costruire altre espressioni simili a questa per determinare λ. Per esempio, se si sostituiscono gli indici 1 e 3 con qualunque altra coppia di numeri nell intervallo da 1 a p, il risultato sarà il medesimo, cioè λ. Se il modello fosse corretto e conoscessimo le reali covarianze, Cov(x i, x j ), allora le diverse equazioni re-

15 A. Lubisco 11 stituirebbero il medesimo valore del coefficiente di regressione, λ. Dal momento che analizzando dati reali si dispone solamente di stime delle covarianze (indicate con cov(x i, x j ) con la c minuscola), non si avranno identiche stime λˆ i di λ i, anche se il modello è corretto. Tuttavia, se tutte le stime di λ i fossero simili, questo potrebbe suggerire che il modello abbia un buon adattamento. Agli inizi, i modelli fattoriali venivano stimati con metodi molto simili a questo, noiosi da applicare e non facilmente estendibili al caso di più fattori. È però grazie a questo metodo che è possibile determinare i parametri del modello partendo dalle covarianze tra le variabili osservate senza conoscere i valori relativi ai fattori. Nella maggior parte dei casi pratici non ci sono variabili pronte all uso, come il reddito dell esempio precedente (anche se ci fosse, potrebbe essere impraticabile raccogliere l informazione in quanto la domanda potrebbe essere troppo intrusiva). In assenza di simili variabili, ci si deve chiedere se esista qualche variabile latente che possa avere il medesimo ruolo. Che la variabile latente sia o meno una variabile reale, ma comunque non osservabile, o un costrutto, ci si trova davanti alla stessa domanda fondamentale: c è un modo per stimare il modello di regressione appena visto senza conoscere i valori del reddito I? Questo è il problema che l analisi fattoriale si propone di risolvere. Si vedrà che l insieme delle correlazioni non contiene sufficiente informazione per permettere la stima delle relazioni di regressione e quindi di determinare l esistenza di fattori comuni.

16 1 Analisi fattoriale IL MODELLO FATTORIALE Il modello a un fattore può facilmente essere esteso al caso di un numero arbitrario di fattori. Semplicemente si sostituisce l'equazione di regressione con un equazione di regressione multipla. Come già anticipato, l analisi dei fattori, nell aspetto metodologico più generale, si propone di spiegare le correlazioni fra un insieme di p variabili osservate attraverso un numero più esiguo di variabili non osservate (fattori o variabili latenti) tra loro linearmente indipendenti. Le p variabili osservate verranno rappresentate come combinazioni lineari di un numero ridotto m (con m<p) di variabili casuali, chiamate fattori. I fattori sono costrutti sottostanti o variabili latenti che generano le variabili originarie (le variabili osservate). Alla pari delle variabili originarie, i fattori variano da individuo a individuo, ma contrariamente ad esse, i fattori non possono essere misurati o osservati. L esistenza stessa di queste variabili ipotetiche è una questione aperta. Se le p variabili originarie sono almeno moderatamente correlate, la dimensione di base del sistema è inferiore a p. L obiettivo dell'analisi fattoriale è di ridurre la ridondanza di informazione (espressa dalla presenza di correlazione) tra le variabili usando un numero inferiore a p di fattori. Si supponga che la struttura della matrice di correlazione delle variabili osservate sia tale per cui, per un sottoinsieme di variabili, ci sia alta correlazione tra loro stesse e bassa correlazione con tutte le altre. Allora, potrebbe esserci un singolo fattore sottostante che ha dato luogo a quel sottoinsieme di variabili. Se le altre variabili possono essere analogamente raggruppate in sottoinsiemi in base ad analoghe strutture di correlazione, ne segue che un piccolo gruppo di fattori può rappresentare questi gruppi di variabili. In tal caso, le strutture individuabili all interno della matrice di correlazione corrisponderanno direttamente ai fattori. Per esempio, si consideri la seguente matrice di correlazione:

17 A. Lubisco 13 1,00 0,90 0,05 0,05 0,05 0,90 1,00 0,05 0,05 0,05 0,05 0,05 1,00 0,90 0,90 0,05 0,05 0,90 1,00 0,90 0,05 0,05 0,90 0,90 1,00 In questo caso, le variabili 1 e corrispondono a un fattore e le variabili 3, 4 e 5 a un altro fattore. In altri casi, nei quali la matrice non ha strutture di correlazione così semplici, l analisi fattoriale è ancora in grado di partizionare le variabili in gruppi. L idea che sta alla base del metodo è, quindi, che la correlazione tra due variabili X i e X j possa essere spiegata dalla relazione lineare di entrambe con un insieme di m variabili f 1, f f m. Poiché la correlazione parziale tra X i e X j dati f 1, f,, f m, che indichiamo con r ij;1 m rappresenta la correlazione residua tra X i e X j non spiegata dalla loro relazione lineare con tali variabili, si dice che l insieme f 1, f,, f m consente di spiegare in modo adeguato la correlazione osservata tra X i e X j se la correlazione parziale r ij;1 m è prossima a zero, o più precisamente se l ipotesi nulla di una correlazione parziale in popolazione uguale a zero (H 0 : ρ ij;1 m ) non può essere rifiutata. Date p variabili, se un insieme di m variabili f 1, f,, f m spiega completamente i valori al di fuori della diagonale principale della matrice di correlazione R tra le p variabili osservate, la correlazione parziale degli elementi della matrice dei dati, per assegnati valori di f 1, f,, f m deve essere non significativamente diversa da zero. Le variabili X i e X j devono, quindi, essere condizionatamente incorrelate dati i valori di f 1, f,, f m (dove m<p). Questa proprietà di indipendenza locale è condizione necessaria perché l insieme di variabili f 1, f,, f m offra una spiegazione adeguata dei valori di R. Il problema così posto è indeterminato perché le variabili f 1, f,, f m non sono osservabili. Una possibile via per risolverlo è quella di imporre alcune condizioni che limitano il campo a relazioni di tipo lineare tra le variabili osservate e le variabili latenti e imporre inoltre alcune condizioni sulle

18 14 Analisi fattoriale variabili latenti stesse. Quindi, il primo passo dell analisi consiste nella formulazione di un modello appropriato. Nella formulazione più immediata, l analisi fattoriale ipotizza che ciascuna variabile osservata X i dipenda in parte da m fattori comuni a tutte le variabili, f k k = 1,, m, in parte da un fattore specifico u i. Ipotizzando una relazione lineare tra le variabili osservate e i fattori, si definisce un sistema di equazioni del tipo: X 1 = μ 1 + λ 11 f λ 1k f k + + λ 1m f m + u 1 X i = μ i + λ i1 f λ ik f k + + λ im f m + u i X p = μ p + λ p1 f λ pk f k + + λ pm f m + u p dove μ i è la media della variabile X i. La determinazione dei coefficienti λ ik, detti pesi fattoriali, consente di valutare l influenza di ciascun fattore espressa in termini di apporto relativo alla variabilità complessiva del sistema, così da individuare quali tra essi possano ritenersi statisticamente rilevanti. Questo modello somiglia solo in apparenza a quello di regressione multipla. Nel contesto della regressione, infatti, gli f k sono noti, mentre nel caso ora in esame tutti gli elementi a destra dell uguale sono quantità incognite, non direttamente misurabili o osservabili. Sotto certe condizioni è facile verificare che un modello di questo tipo è in grado di spiegare le correlazioni osservate. Si tratta comunque di un modello ed è sempre necessario verificare se tale modello sia in grado di dare una spiegazione adeguata di quanto osservato. La semplicità e l agilità degli sviluppi formali che conseguono l introduzione di alcune ipotesi, cioè a) indipendenza lineare dei fattori b) linearità delle relazioni pur non trovando frequenti riscontri nel contesto fenomenico, ne giustificano la scelta, almeno nella prima fase della ricerca.

19 A. Lubisco 15 Specificazione del modello fattoriale Sia X un vettore aleatorio (di dimensioni px1) con media μ e varianze-covarianze Σ; si definisce modello fattoriale la relazione lineare X = μ + Λf + u dove Λ (pxm) è una matrice di costanti (SONO I PESI FATTORIALI) e f (mx1) e u (px1) sono vettori aleatori. + λ λ λ λ λ λ λ λ λ + μ μ μ = p h 1 m k 1 pm pk p1 hm hk h1 1m 1k 11 p h 1 p h 1 u u u f f f X X X M M M M L L M O M M L L M M O M L L M M M M I vincoli che più frequentemente si impongono sulle componenti del modello sono i seguenti: 1) Le variabili f, i fattori comuni, hanno media zero, varianza unitaria e sono tra loro linearmente indipendenti (equivale a incorrelati) cioè: a) E(f)=0 nullità delle medie aritmetiche dei fattori comuni b) E(ff )=I unitarietà delle varianze dei fattori comuni e incorrelazione a coppie ) Le variabili u, i fattori specifici o specificità, hanno media zero, varianza ψ ii e sono tra loro incorrelate (significa che la correlazione tra le variabili originarie è spiegata completamente dai fattori comuni) cioè a) E(u)=0 nullità delle medie aritmetiche dei fattori specifici b) E(uu )=Ψ (dove Ψ=diag(ψ 11,, ψ pp )) incorrelazione a coppie relativamente ai fattori specifici ψ ψ ψ Ψ = pp hh L L M O M M L L M M O M L L

20 16 Analisi fattoriale N.B. Non ci sono ipotesi sulle varianze, per cui si ha una matrice diagonale in cui tutti gli elementi al di fuori della diagonale principale sono nulli e quelli su di essa non necessariamente uguali. Inoltre, i fattori specifici sono linearmente non correlati anche con i fattori comuni, cioè c) E(fu )=0 incorrelazione a coppie fra i fattori specifici e i fattori comuni 3) Talvolta vengono introdotte anche le seguenti ipotesi: a) I fattori comuni f hanno distribuzione normale multivariata b) I fattori specifici u hanno distribuzione normale multivariata Le ipotesi 3a e 3b implicano che anche le X i abbiano distribuzione normale multivariata e portano al modello fattoriale lineare normale. Le ipotesi b e c implicano che le correlazioni tra le X i siano completamente spiegate dai fattori. E bene sottolineare il diverso significato dell ipotesi di incorrelazione dei fattori comuni e dei fattori specifici. Per assicurare che i fattori comuni siano in grado di spiegare completamente le correlazioni tra le variabili osservate sono determinanti due ipotesi: i) che i fattori specifici siano incorrelati tra loro E(uu )=Ψ (dove Ψ=diag(ψ 11,, ψ pp )) [ipotesi b] ii) che i fattori specifici siano incorrelati con i fattori comuni E(fu )=0 [ipotesi c] Diversamente l ipotesi E(ff )=I [ipotesi 1b], non è fondamentale. Infatti la matrice di varianze-covarianze tra i fattori potrebbe essere una qualunque matrice Σ f simmetrica e definita positiva e, in quanto simmetrica, per la scomposizione di Cholesky esisterà sempre una matrice triangolare inferiore L tale che Σ f = LL. Si dimostra che il vettore f * = L -1 f ha ancora media nulla e matrice di varianze-covarianze uguale alla matrice identità; infatti: E(f * f * ) = E(L -1 ff (L ) -1 ) = L -1 E(ff )(L ) -1 = L -1 Σ f (L ) -1 = L -1 LL (L ) -1 = I

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali)

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali) RICERCHE DI MERCATO 5.6 Analisi Fattoriale (Componenti Principali) Prof. L. Neri Dip. di Economia Politica Premessa Come evidenziato in precedenza l approccio di segmentazione per omogeneità prevede la

Dettagli

L analisi fattoriale

L analisi fattoriale L analisi fattoriale Scopo dell analisi fattoriale e quello di identificare alcune variabili latenti (fattori) in grado di spiegare i legami, le interrelazioni e le dipendenze tra le variabili statistiche

Dettagli

Analisi fattoriale. esplorativa vers. 1.0. Germano Rossi 1 germano.rossi@unimib.it. 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Analisi fattoriale. esplorativa vers. 1.0. Germano Rossi 1 germano.rossi@unimib.it. 1 Dipartimento di Psicologia, Università di Milano-Bicocca Analisi fattoriale esplorativa vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2009 Rossi (Dip. Psicologia) Analisi fattoriale 2009 1 / 47 Prima

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE

LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE FLAVIO ANGELINI Sommario Queste note hanno lo scopo di indicare a studenti di Economia interessati alla finanza quantitativa i concetti essenziali

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

Appunti di Statistica Descrittiva

Appunti di Statistica Descrittiva Appunti di Statistica Descrittiva 30 dicembre 009 1 La tabella a doppia entrata Per studiare dei fenomeni con caratteristiche statistiche si utilizza l espediente della tabella a doppia entrata Per esempio

Dettagli

Analisi discriminante

Analisi discriminante Capitolo 6 Analisi discriminante L analisi statistica multivariata comprende un corpo di metodologie statistiche che permettono di analizzare simultaneamente misurazioni riguardanti diverse caratteristiche

Dettagli

CURRICOLO MATEMATICA

CURRICOLO MATEMATICA 1 CURRICOLO MATEMATICA Competenza 1 al termine della scuola dell Infanzia 2 NUMERI Raggruppare, ordinare, contare, misurare oggetti, grandezze ed eventi direttamente esperibili. Utilizzare calendari settimanali

Dettagli

Appunti: Teoria Dei Test

Appunti: Teoria Dei Test Appunti: Teoria Dei Test Fulvio De Santis, Luca Tardella e Isabella Verdinelli Corsi di Laurea A + E + D + G + R 1. Introduzione. Il test d ipotesi è un area dell inferenza statistica in cui si valuta

Dettagli

La Regressione Lineare

La Regressione Lineare La Regressione Lineare. Cos è l Analisi della Regressione Multipla? L analisi della regressione multipla è una tecnica statistica che può essere impiegata per analizzare la relazione tra una variabile

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità

Dettagli

PARTE TERZA. STATISTICA DESCRITTIVA MULTIDIMENSIONALE (Analisi delle Relazioni)

PARTE TERZA. STATISTICA DESCRITTIVA MULTIDIMENSIONALE (Analisi delle Relazioni) PARTE TERZA STATISTICA DESCRITTIVA MULTIDIMESIOALE (Analisi delle Relazioni) La notazione matriciale 3 III.. LA OTAZIOE MATRICIALE III... L analisi statistica dei fenomeni multivariati L intrinseca complessità

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte Competenza chiave europea: MATEMATICA Scuola Primaria DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte TAB. A TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE al termine della Scuola Primaria

Dettagli

MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA

MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA L alunno si muove con sicurezza nel calcolo scritto e mentale con i numeri naturali e sa valutare l opportunità di

Dettagli

5.4 Solo titoli rischiosi

5.4 Solo titoli rischiosi 56 Capitolo 5. Teoria matematica del portafoglio finanziario II: analisi media-varianza 5.4 Solo titoli rischiosi Suppongo che sul mercato siano presenti n titoli rischiosi i cui rendimenti aleatori sono

Dettagli

4. Matrici e Minimi Quadrati

4. Matrici e Minimi Quadrati & C. Di Natale: Matrici e sistemi di equazioni di lineari Formulazione matriciale del metodo dei minimi quadrati Regressione polinomiale Regressione non lineare Cross-validazione e overfitting Regressione

Dettagli

= E(X t+k X t+k t ) 2 + 2E [( X t+k X t+k t + E

= E(X t+k X t+k t ) 2 + 2E [( X t+k X t+k t + E 1. Previsione per modelli ARM A Questo capitolo è dedicato alla teoria della previsione lineare per processi stocastici puramente non deterministici, cioè per processi che ammettono una rappresentazione

Dettagli

Metodi iterativi per sistemi lineari

Metodi iterativi per sistemi lineari Metodi iterativi per sistemi lineari Dario A. Bini, Università di Pisa 30 ottobre 2013 Sommario Questo modulo didattico contiene risultati relativi ai metodi iterativi per risolvere sistemi di equazioni

Dettagli

Capitolo 5: Preferenze

Capitolo 5: Preferenze Capitolo 5: Preferenze 5.1: Introduzione Le preferenze individuali alla base dell analisi dei capitoli 3 e 4 vengono rappresentate graficamente da curve di indifferenza parallele in direzione verticale

Dettagli

CURRICOLO MATEMATICA ABILITA COMPETENZE

CURRICOLO MATEMATICA ABILITA COMPETENZE CURRICOLO MATEMATICA 1) Operare con i numeri nel calcolo aritmetico e algebrico, scritto e mentale, anche con riferimento a contesti reali. Per riconoscere e risolvere problemi di vario genere, individuando

Dettagli

0. Piano cartesiano 1

0. Piano cartesiano 1 0. Piano cartesiano Per piano cartesiano si intende un piano dotato di due assi (che per ragioni pratiche possiamo scegliere ortogonali). Il punto in comune ai due assi è detto origine, e funziona da origine

Dettagli

Da una a più variabili: derivate

Da una a più variabili: derivate Da una a più variabili: derivate ( ) 5 gennaio 2011 Scopo di questo articolo è di evidenziare le analogie e le differenze, relativamente al calcolo differenziale, fra le funzioni di una variabile reale

Dettagli

A.1 Rappresentazione geometrica dei segnali

A.1 Rappresentazione geometrica dei segnali Appendice A Rappresentazione dei segnali A.1 Rappresentazione geometrica dei segnali Scomporre una generica forma d onda s(t) in somma di opportune funzioni base è operazione assai comune, particolarmente

Dettagli

Metodi diretti per la soluzione di sistemi lineari

Metodi diretti per la soluzione di sistemi lineari Metodi diretti per la soluzione di sistemi lineari N Del Buono 1 Introduzione Consideriamo un sistema di n equazioni in n incognite a 11 x 1 + a 12 x 2 + a 13 x 3 + + a 1n x n = b 1, a 21 x 1 + a 22 x

Dettagli

Fondamenti di Automatica

Fondamenti di Automatica Fondamenti di Automatica Analisi dei sistemi dinamici Dott. Ing. Marcello Bonfè Dipartimento di Ingegneria - Università di Ferrara Tel. +39 0532 974839 E-mail: marcello.bonfe@unife.it pag. 1 Analisi dei

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta

Dettagli

Il concetto di correlazione

Il concetto di correlazione SESTA UNITA Il concetto di correlazione Fino a questo momento ci siamo interessati alle varie statistiche che ci consentono di descrivere la distribuzione dei punteggi di una data variabile e di collegare

Dettagli

MATEMATICA Competenza chiave europea: COMPETENZA MATEMATICA E COMPETENZE DI BASE IN SCIENZA E TECNOLOGIA Competenza specifica: MATEMATICA

MATEMATICA Competenza chiave europea: COMPETENZA MATEMATICA E COMPETENZE DI BASE IN SCIENZA E TECNOLOGIA Competenza specifica: MATEMATICA MATEMATICA Competenza chiave europea: COMPETENZA MATEMATICA E COMPETENZE DI BASE IN SCIENZA E TECNOLOGIA Competenza specifica: MATEMATICA Le conoscenze matematiche contribuiscono alla formazione culturale

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

Geometria analitica di base (prima parte)

Geometria analitica di base (prima parte) SAPERE Al termine di questo capitolo, avrai appreso: come fissare un sistema di riferimento cartesiano ortogonale il significato di equazione di una retta il significato di coefficiente angolare di una

Dettagli

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA Francesco Bottacin Padova, 24 febbraio 2012 Capitolo 1 Algebra Lineare 1.1 Spazi e sottospazi vettoriali Esercizio 1.1. Sia U il sottospazio di R 4 generato dai

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

Parte 3. Rango e teorema di Rouché-Capelli

Parte 3. Rango e teorema di Rouché-Capelli Parte 3. Rango e teorema di Rouché-Capelli A. Savo Appunti del Corso di Geometria 203-4 Indice delle sezioni Rango di una matrice, 2 Teorema degli orlati, 3 3 Calcolo con l algoritmo di Gauss, 6 4 Matrici

Dettagli

Capitolo 9: PROPAGAZIONE DEGLI ERRORI

Capitolo 9: PROPAGAZIONE DEGLI ERRORI Capitolo 9: PROPAGAZIOE DEGLI ERRORI 9.1 Propagazione degli errori massimi ella maggior parte dei casi le grandezze fisiche vengono misurate per via indiretta. Il valore della grandezza viene cioè dedotto

Dettagli

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Esercizio 1 Si consideri il seguente modello ad effetti fissi con variabili binarie: + 1 2 a) supponete che N=3. Si mostri che i regressori

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

Algoritmo euclideo, massimo comun divisore ed equazioni diofantee

Algoritmo euclideo, massimo comun divisore ed equazioni diofantee Algoritmo euclideo, massimo comun divisore ed equazioni diofantee Se a e b sono numeri interi, si dice che a divide b, in simboli: a b, se e solo se esiste c Z tale che b = ac. Si può subito notare che:

Dettagli

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys.

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys. METODO DEI MINIMI QUADRATI GIUSEPPE GIUDICE Sommario Il metodo dei minimi quadrati è trattato in tutti i testi di statistica e di elaborazione dei dati sperimentali, ma non sempre col rigore necessario

Dettagli

9 Metodi diretti per la risoluzione di sistemi lineari: fattorizzazione P A = LU

9 Metodi diretti per la risoluzione di sistemi lineari: fattorizzazione P A = LU 9 Metodi diretti per la risoluzione di sistemi lineari: fattorizzazione P A LU 9.1 Il metodo di Gauss Come si è visto nella sezione 3.3, per la risoluzione di un sistema lineare si può considerare al posto

Dettagli

Corso di Analisi Numerica - AN1. Parte 2: metodi diretti per sistemi lineari. Roberto Ferretti

Corso di Analisi Numerica - AN1. Parte 2: metodi diretti per sistemi lineari. Roberto Ferretti Corso di Analisi Numerica - AN1 Parte 2: metodi diretti per sistemi lineari Roberto Ferretti Richiami sulle norme e sui sistemi lineari Il Metodo di Eliminazione di Gauss Il Metodo di Eliminazione con

Dettagli

COMPETENZE SPECIFICHE

COMPETENZE SPECIFICHE COMPETENZE IN MATEMATICA DISCIPLINA DI RIFERIMENTO: MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE FISSATI DALLE INDICAZIONI NAZIONALI PER IL CURRICOLO 2012. MATEMATICA TRAGUARDI ALLA FINE DELLA

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

FONDAMENTI DI PSICOMETRIA - 8 CFU

FONDAMENTI DI PSICOMETRIA - 8 CFU Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso

Dettagli

Accuratezza di uno strumento

Accuratezza di uno strumento Accuratezza di uno strumento Come abbiamo già accennato la volta scora, il risultato della misurazione di una grandezza fisica, qualsiasi sia lo strumento utilizzato, non è mai un valore numerico X univocamente

Dettagli

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE 1. EQUAZIONI Definizione: un equazione è un uguaglianza tra due espressioni letterali (cioè in cui compaiono numeri, lettere

Dettagli

Istituto Comprensivo Caposele (Av) Curricolo verticale d istituto a.sc. 2013-2014

Istituto Comprensivo Caposele (Av) Curricolo verticale d istituto a.sc. 2013-2014 CURRICOLO DI MATEMATICA SCUOLA PRIMARIA CLASSE PRIMA 1. Contare oggetti o eventi, a voce e mentalmente, in senso progressivo e regressivo e per salti di due, tre, 2. Leggere e scrivere i numeri naturali

Dettagli

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

TRAGUARDI FORMATIVI NELLA PRE-DISCIPLINA MATEMATICA

TRAGUARDI FORMATIVI NELLA PRE-DISCIPLINA MATEMATICA Fo.Svi.Co International s.a.s. Formazione Sviluppo Competenze (per la competitività in campo internazionale) SEDE LEGALE Corso Magenta, 83 20 123 Milano SEDE OPERATIVA 00100 ROMA, via Arduino, 46 SEDE

Dettagli

Scuola Primaria Conta oggetti o eventi, a voce e a mente, in senso progressivo e regressivo e per salti di due, tre ;

Scuola Primaria Conta oggetti o eventi, a voce e a mente, in senso progressivo e regressivo e per salti di due, tre ; Primo anno Secondo anno Terzo anno Primo anno MATEMATICA Scuola dell Infanzia Scuola Primaria Conta oggetti o eventi, a voce e a mente, in senso progressivo e regressivo e per salti di due, tre ; legge

Dettagli

60 indicazioni nazionali per la scuola dell infanzia e del primo ciclo. matematica

60 indicazioni nazionali per la scuola dell infanzia e del primo ciclo. matematica 60 indicazioni nazionali per la scuola dell infanzia e del primo ciclo matematica Le conoscenze matematiche contribuiscono alla formazione culturale delle persone e delle comunità, sviluppando le capacità

Dettagli

Analisi fattoriale 1

Analisi fattoriale 1 Analisi fattoriale Analisi fattoriale: a che serve? L analisi fattoriale permette di rappresentare un set di variabili tramite un insieme più compatto di nuove variate fra loro indipendenti. Da tante variabili

Dettagli

2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione

2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione Capitolo 2 MATRICI Fra tutte le applicazioni su uno spazio vettoriale interessa esaminare quelle che mantengono la struttura di spazio vettoriale e che, per questo, vengono dette lineari La loro importanza

Dettagli

Metodi Numerici per Equazioni Ellittiche

Metodi Numerici per Equazioni Ellittiche Metodi Numerici per Equazioni Ellittiche Vediamo ora di descrivere una tecnica per la risoluzione numerica della più semplice equazione ellittica lineare, l Equazione di Laplace: u xx + u yy = 0, (x, y)

Dettagli

Compito di SISTEMI E MODELLI. 19 Febbraio 2015

Compito di SISTEMI E MODELLI. 19 Febbraio 2015 Compito di SISTEMI E MODELLI 9 Febbraio 5 Non é ammessa la consultazione di libri o quaderni. Le risposte vanno giustificate. Saranno rilevanti per la valutazione anche l ordine e la chiarezza di esposizione.

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2003 Sessione straordinaria

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2003 Sessione straordinaria ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 3 Sessione straordinaria Il candidato risolva uno dei due problemi e 5 dei quesiti in cui si articola il questionario. PROBLEMA È assegnata

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Alessandro Rezzani Abstract L articolo descrive una delle tecniche di riduzione della dimensionalità del data set: il metodo dell analisi delle componenti principali (Principal

Dettagli

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI statistica, Università Cattaneo-Liuc, AA 006-007, lezione del 08.05.07 IDICE (lezione 08.05.07 PROBABILITA, VALORE ATTESO E VARIAZA DELLE QUATITÁ ALEATORIE E LORO RELAZIOE CO I DATI OSSERVATI 3.1 Valore

Dettagli

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA SECONDARIA DI PRIMO GRADO. L alunno ha rafforzato un atteggiamento positivo rispetto

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 39 Introduzione Come si è detto,

Dettagli

MINIMI QUADRATI. REGRESSIONE LINEARE

MINIMI QUADRATI. REGRESSIONE LINEARE MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione

Dettagli

Regressione Lineare con un Singolo Regressore

Regressione Lineare con un Singolo Regressore Regressione Lineare con un Singolo Regressore Quali sono gli effetti dell introduzione di pene severe per gli automobilisti ubriachi? Quali sono gli effetti della riduzione della dimensione delle classi

Dettagli

Capitolo 20: Scelta Intertemporale

Capitolo 20: Scelta Intertemporale Capitolo 20: Scelta Intertemporale 20.1: Introduzione Gli elementi di teoria economica trattati finora possono essere applicati a vari contesti. Tra questi, due rivestono particolare importanza: la scelta

Dettagli

IPOTESI di CURRICOLO MATEMATICA SCUOLA PRIMARIA E SECONDARIA DI PRIMO GRADO con riferimento alle Indicazioni Nazionali 2012

IPOTESI di CURRICOLO MATEMATICA SCUOLA PRIMARIA E SECONDARIA DI PRIMO GRADO con riferimento alle Indicazioni Nazionali 2012 IPOTESI di CURRICOLO MATEMATICA SCUOLA PRIMARIA E SECONDARIA DI PRIMO GRADO con riferimento alle Indicazioni Nazionali 2012 6 IC PADOVA COMPETENZE SPECIFICHE Numeri conoscere e padroneggiare i contenuti

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

Tecniche di analisi multivariata

Tecniche di analisi multivariata Tecniche di analisi multivariata Metodi che fanno riferimento ad un modello distributivo assunto per le osservazioni e alla base degli sviluppi inferenziali - tecniche collegate allo studio della dipendenza

Dettagli

Inferenza statistica. Inferenza statistica

Inferenza statistica. Inferenza statistica Spesso l informazione a disposizione deriva da un osservazione parziale del fenomeno studiato. In questo caso lo studio di un fenomeno mira solitamente a trarre, sulla base di ciò che si è osservato, considerazioni

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Introduzione Livelli di significatività Verifica di ipotesi sulla media di una popolazione normale Verifica di ipotesi sulla varianza di una popolazione normale Verifica di ipotesi

Dettagli

Obiettivi Specifici di apprendimento MATEMATICA. CURRICOLO VERTICALE DI ISTITUTO (dalla Cl. I Sc.Primaria alla Cl. III Sc.Second. 1 gr.

Obiettivi Specifici di apprendimento MATEMATICA. CURRICOLO VERTICALE DI ISTITUTO (dalla Cl. I Sc.Primaria alla Cl. III Sc.Second. 1 gr. Classe I Sc.Primaria Obiettivi Specifici di apprendimento MATEMATICA CURRICOLO VERTICALE DI ISTITUTO (Cl. I Sc.Primaria Cl. III Sc.Second. 1 gr.) NUMERO - Confrontare e ordinare raggruppamenti di oggetti

Dettagli

PRIMO ISTITUTO COMPRENSIVO di PALAZZOLO S/O via Zanardelli n.34 Anno scolastico 2014/2015

PRIMO ISTITUTO COMPRENSIVO di PALAZZOLO S/O via Zanardelli n.34 Anno scolastico 2014/2015 PRIMO ISTITUTO COMPRENSIVO di PALAZZOLO S/O via Zanardelli n.34 Anno scolastico 2014/2015 CURRICOLI DISCIPLINARI SCUOLA DELL INFANZIA e PRIMO CICLO di ISTRUZIONE Percorso delle singole discipline sulla

Dettagli

Design of Experiments

Design of Experiments Design of Experiments Luigi Amedeo Bianchi 1 Introduzione Cominciamo spiegando cosa intendiamo con esperimento, ossia l investigare un processo cambiando i dati in ingresso, osservando i cambiamenti che

Dettagli

Elaborazione delle Immagini Digitali

Elaborazione delle Immagini Digitali Elaborazione delle Immagini Digitali Parte I Prof. Edoardo Ardizzone A.A. 2-22 La trasformata di Hotelling o di Karhunen-Loeve KLT discreta Questa trasformata detta anche analisi delle componenti principali

Dettagli

Capitolo I STRUTTURE ALGEBRICHE ELEMENTARI

Capitolo I STRUTTURE ALGEBRICHE ELEMENTARI Capitolo I STRUTTURE ALGEBRICHE ELEMENTARI In matematica, per semplificare la stesura di un testo, si fa ricorso ad un linguaggio specifico. In questo capitolo vengono fornite in maniera sintetica le nozioni

Dettagli

Concetti introduttivi

Concetti introduttivi Indice 1 Concetti introduttivi 3 1.1 Studi sperimentali e studi osservazionali..................... 3 1.2 Concetti iniziali: indipendenza fra eventi..................... 6 1.3 Indipendenza fra variabili

Dettagli

Matematica B - a.a 2006/07 p. 1

Matematica B - a.a 2006/07 p. 1 Matematica B - a.a 2006/07 p. 1 Definizione 1. Un sistema lineare di m equazioni in n incognite, in forma normale, è del tipo a 11 x 1 + + a 1n x n = b 1 a 21 x 1 + + a 2n x n = b 2 (1) = a m1 x 1 + +

Dettagli

APPLICAZIONI LINEARI. B si definisce surriettiva. 9 quando ogni elemento di. B risulta IMMAGINE di. almeno un elemento di A.

APPLICAZIONI LINEARI. B si definisce surriettiva. 9 quando ogni elemento di. B risulta IMMAGINE di. almeno un elemento di A. APPLICAZIONI LINEARI Siano V e W due spazi vettoriali, di dimensione m ed n sullo stesso campo di scalari R. Una APPLICAZIONE ƒ : V W viene definita APPLICAZIONE LINEARE od OMOMORFISMO se risulta, per

Dettagli

1. L analisi statistica

1. L analisi statistica 1. L analisi statistica Di cosa parleremo La statistica è una scienza, strumentale ad altre, concernente la determinazione dei metodi scientifici da seguire per raccogliere, elaborare e valutare i dati

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

CIRCUITI INTELLIGENTI Parte 5: PCA e ICA

CIRCUITI INTELLIGENTI Parte 5: PCA e ICA Ing. Simone SCARDAPANE Circuiti e Algoritmi per l Elaborazione dei Segnali Anno Accademico 2012/2013 Indice della Lezione 1. Analisi delle Componenti Principali 2. Auto-Associatori 3. Analisi delle Componenti

Dettagli

PROPRIETÀ DEI CIRCUITI DI RESISTORI

PROPRIETÀ DEI CIRCUITI DI RESISTORI CAPITOLO 5 PROPRIETÀ DEI CIRCUITI DI RESISTORI Nel presente Capitolo, verrà introdotto il concetto di equivalenza tra bipoli statici e verranno enunciati e dimostrati alcuni teoremi (proprietà) generali

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

LE FIBRE DI UNA APPLICAZIONE LINEARE

LE FIBRE DI UNA APPLICAZIONE LINEARE LE FIBRE DI UNA APPLICAZIONE LINEARE Sia f:a B una funzione tra due insiemi. Se y appartiene all immagine di f si chiama fibra di f sopra y l insieme f -1 y) ossia l insieme di tutte le controimmagini

Dettagli

CURRICOLO VERTICALE DI MATEMATICA

CURRICOLO VERTICALE DI MATEMATICA CURRICOLO VERTICALE DI MATEMATICA Traguardo per lo sviluppo delle competenze Sviluppa un atteggiamento positivo rispetto alla matematica, attraverso esperienze significative, che gli hanno fatto intuire

Dettagli

servono per andare a studiare l'argomento che prendiamo in considerazione in questo momento cioè la scelta politica. Quindi si presuppone,

servono per andare a studiare l'argomento che prendiamo in considerazione in questo momento cioè la scelta politica. Quindi si presuppone, ANALISI FATTORIALE I calcoli che vengono fatti con l'analisi fattoriale servono soprattutto per validare dei questionari quindi è così troviamo una struttura esterna per andare a vedere gli item, cioè

Dettagli

Corso di Geometria e Algebra Lineare - Sezione di Metodi Numerici

Corso di Geometria e Algebra Lineare - Sezione di Metodi Numerici Corso di Geometria e Algebra Lineare - Sezione di Metodi Numerici C. Vergara 3. Metodo della fattorizzazione LU per la risoluzione di un sistema lineare Errori di arrotondamento. Prima di affrontare la

Dettagli

6. Modelli statistici: analisi della regressione lineare

6. Modelli statistici: analisi della regressione lineare BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

La scelta di portafoglio

La scelta di portafoglio La scelta di portafoglio 1 La scelta di portafoglio La scelta di portafoglio: il modo in cui un individuo decide di allocare la propria ricchezza tra più titoli Il mercato dei titoli è un istituzione che

Dettagli

INFANZIA PRIMARIA SECONDARIA

INFANZIA PRIMARIA SECONDARIA INFANZIA PRIMARIA SECONDARIA MATEMATICA - TRAGUARDI DI SVILUPPO DELLE COMPETENZE Raggruppa e ordina secondo criteri diversi. Confronta e valuta quantità. Utilizza semplici simboli per registrare. Compie

Dettagli

Percorsi di matematica per il ripasso e il recupero

Percorsi di matematica per il ripasso e il recupero Giacomo Pagina Giovanna Patri Percorsi di matematica per il ripasso e il recupero 2 per la Scuola secondaria di secondo grado UNITÀ CAMPIONE Edizioni del Quadrifoglio à t i n U 1 Sistemi di primo grado

Dettagli

Metodi di previsione

Metodi di previsione Metodi di previsione Giovanni Righini Università degli Studi di Milano Corso di Logistica I metodi di previsione I metodi di previsione sono usati per ricavare informazioni a sostegno dei processi decisionali

Dettagli

SOMMARIO. 13.1 I radicali pag. 3. 13.2 I radicali aritmetici pag. 5. 13.3 Moltiplicazione e divisione fra radicali aritmetici pag.

SOMMARIO. 13.1 I radicali pag. 3. 13.2 I radicali aritmetici pag. 5. 13.3 Moltiplicazione e divisione fra radicali aritmetici pag. SOMMARIO CAPITOLO : I RADICALI. I radicali pag.. I radicali aritmetici pag.. Moltiplicazione e divisione fra radicali aritmetici pag.. Potenza di un radicale aritmetico pag.. Trasporto di un fattore esterno

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

FONDAMENTI DI AUTOMATICA / CONTROLLI AUTOMATICI

FONDAMENTI DI AUTOMATICA / CONTROLLI AUTOMATICI FONDAMENTI DI AUTOMATICA / CONTROLLI AUTOMATICI Guida alla soluzione degli esercizi d esame Dott. Ing. Marcello Bonfè Esercizi sulla scomposizione di modelli nello spazio degli stati: Gli esercizi nei

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli