Università di Bologna Facoltà di Scienze statistiche. Analisi fattoriale. Alessandro Lubisco

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Università di Bologna Facoltà di Scienze statistiche. Analisi fattoriale. Alessandro Lubisco"

Transcript

1 Università di Bologna Facoltà di Scienze statistiche Analisi fattoriale Alessandro Lubisco

2

3 INDICE Indice... i Analisi Fattoriale... 1 Aspetti introduttivi... 1 Introduzione ai modelli a variabili latenti... 4 Esempi di problemi con variabili latenti e manifeste... 5 Modelli a variabili latenti... 6 Il modello lineare a un fattore... 8 Il modello fattoriale... 1 Specificazione del modello fattoriale Comunalità e specificità Proprietà del modello fattoriale... Equivarianza rispetto a cambiamenti di scala... Identificazione del modello... 4 Invarianza del modello rispetto a rotazioni ortogonali della matrice Λ... 4 Stima dei parametri del modello... 7 Metodi di stima... 8 Metodo delle componenti principali... 9 Metodo dei fattori principali... 3 Ripercorriamo il metodo dei fattori principali Il metodo della massima verosimiglianza Rotazione degli assi fattoriali Rotazione VARIMAX (aiser, 1958) Rotazione QUARTIMAX Rotazione EQUAMAX Rotazioni oblique Prima di interpretare i fattori Esempio di valutazione dei pesi fattoriali Determinazione dei punteggi fattoriali Una prima interpretazione I pesi fattoriali Le comunalità Adeguatezza del modello e scelta del numero di fattori Percentuale di varianza spiegata da fattori Matrice di correlazione riprodotta Test sulla bontà di adattamento Riassumendo: Scopi e procedure dell analisi fattoriale Passo 1: Selezione delle variabili Passo : Calcolo ed esame della matrice di correlazione tra le variabili Passo 3: Estrazione dei fattori non ruotati Passo 4: Rotazione dei fattori Passo 5: Interpretazione della matrice dei fattori ruotati Analisi fattoriale e analisi delle componenti principali Errori comuni nell uso dell analisi fattoriale... 6

4

5 ANALISI FATTORIALE ASPETTI INTRODUTTIVI Gli aspetti caratteristici dell analisi fattoriale si fondano sulle origini del metodo, che si è sviluppato all inizio del secolo scorso ad opera di Spearman, nell ambito della ricerca psicometrica sulle misure delle capacità psicoattitudinali. In un lavoro del 1904, Spearman riporta le correlazioni osservate tra i risultati (voti) conseguiti da un gruppo di studenti in tre diverse materie: lettere (X 1 ), francese (X ), inglese (X 3 ). R = 1 0,83 1 0,78 0,67 1 Egli si chiede se le correlazioni osservate non possano essere spiegate dalla relazione delle tre variabili con un unica variabile latente f che può essere pensata come, per esempio, l intelligenza o la predisposizione allo studio in determinate materie. Se esiste una variabile f in grado di render conto delle correlazioni tra ciascuna coppia di variabili, allora significa che la correlazione residua tra le variabili osservate, una volta che si è eliminato l effetto di f su ciascuna di esse, deve essere non significativamente diversa da zero, ovvero le variabili osservate devono essere linearmente indipendenti condizionatamente ai valori di f. L analisi dei fattori è un metodo di analisi multivariata volto a spiegare le correlazioni fra un insieme di p variabili osservate attraverso un insieme di m variabili non osservate. Si ricorda che la correlazione r ii tra due variabili X i e X i può risultare dalla loro associazione con una terza variabile esterna f k ed è misurabile attraverso la correlazione parziale r ii ;k. Essa misura, infatti, l associazione tra X i e X i quando f k è resa costante ed è quindi la correlazione residua tra X i e X i dopo che si è eliminato l effetto lineare di f k su ciascuna di esse.

6 Analisi fattoriale Esprimiamo le relazioni lineari di X i e X i con la variabile esterna f k (per comodità usiamo le variabili scarto) x x i i' x i x i' = b i = b ( fk fk ) + ei ei = xi xi bi( fk fk ) ( f f ) + e e = x x b ( f f ) i' k La correlazione tra i residui è data da: r ii';k = k ( ei ei )( ei' ei' ) ( ei ei ) ( ei' ei' ) Dal momento che le medie dei residui e i ed segue che: r ii';k = ( ei )( ei' ) ( ei ) ( ei' ) Sostituendo si ottiene: r ii';k = che si semplifica in: i' ( fk fk bi( xi xi ))( fk fk bi' ( xi' xi' )) ( fk fk bi( xi xi )) ( fk fk bi' ( xi' xi' )) i' i' i' i' k k e i' sono pari a zero ne r ii';k = r ii' 1 r r ik ik r i'k 1 r i' k Tale coefficiente misura la correlazione rimanente tra X i e X i dopo aver corretto entrambe le variabili dell effetto lineare di f k su di esse. Qualora X i e X i non fossero influenzate da f k allora r ii';k r ii' in quanto r ik = 0 e r i'k = 0. Poste certe condizioni sulla variabile f non osservata è facile verificare che un modello, il quale ipotizzi una relazione lineare di ciascuna delle variabili osservate con f, sia in grado di spiegare la correlazione tra le X. Se f spiega le correlazioni, allora le variabili osservate possono essere espresse in funzione di f nel modo seguente:

7 A. Lubisco 3 dove: X 1 = λ 1 f + u 1 X = λ f + u X 3 = λ 3 f + u 3 - f è un fattore latente comune a tutte le variabili, che rappresenta l abilità generale di uno studente; - i λ i sono detti pesi fattoriali; - gli u i sono i fattori specifici di ogni singola variabile. Il fattore specifico può avere in questo contesto una duplice interpretazione: o l abilità individuale in ogni singola disciplina dipende anche in una certa misura dall abilità specifica in tale disciplina; o inoltre, la presenza del fattore specifico è legata anche al fatto che la prova o l esame è solo una misura approssimata dell abilità generale dello studente e perciò affetta da errore.

8 4 Analisi fattoriale INTRODUZIONE AI MODELLI A VARIABILI LATENTI L analisi fattoriale appartiene a una famiglia di metodi che utilizza le cosiddette variabili latenti. Spesso, in particolar modo nelle scienze sociali, non si è in grado di misurare le grandezze di interesse. Esempi di tali concetti sono l intelligenza, l orientamento politico, lo stato socio-economico. Sebbene nelle scienze sociali si trattino tali grandezze al pari di qualunque altra variabile, queste si differenziano perché non possono essere osservate ed è per questo motivo che sono dette latenti. In alcuni casi, un concetto può essere rappresentato da un unica variabile latente, ma spesso essi sono di natura multidimensionale e per questo motivo possono coinvolgere più di una variabile latente. Queste variabili latenti sono talvolta chiamate fattori. Tra i metodi a variabili latenti, l analisi fattoriale è il più antico e il più usato. C è uno stretto legame tra l analisi fattoriale (Factor Analysis FA) e l analisi delle componenti principali (Principal Components Analysis PCA). Infatti, è usuale vedere la PCA come un metodo della FA (il software statistico SPSS tratta entrambi i metodi nella stessa procedura). E necessario, però, porre l accento sulla profonda diversità tra i due metodi. Questo per diverse ragioni: - La PCA è un metodo descrittivo che ha l obiettivo di riassumere una matrice di dati in maniera tale da esprimere la sua struttura in un numero ridotto di dimensioni. La FA è una tecnica basata su un modello che richiede siano fatte assunzioni riguardo le distribuzioni congiunte in popolazione delle variabili coinvolte. Ciò consente di fare inferenza riguardo alla popolazione e di fare riferimento a concetti quali bontà di adattamento, significatività e precisione delle stime. - La seconda ragione per enfatizzare la distinzione tra PCA e FA sta nel fatto che, mentre l analisi in componenti principali è un metodo per individuare una particolare trasformazione delle variabili osservate (una combinazione lineare), nella FA sono invece le variabili osservate a essere espresse come combinazione lineare di fattori latenti. Per questo motivo, la FA si inserisce nell'ambito

9 A. Lubisco 5 dei modelli a variabili latenti, dei quali verranno esaminati più avanti altri esempi. Tradizionalmente l unità di questa famiglia di metodi a variabili latenti è sempre stata oscurata dall uso di notazioni differenti e dalle diverse culture scientifiche da cui hanno avuto origine oltre che dai diversi campi di utilizzo. - Nella PCA si cerca di spiegare con poche componenti una grande parte della varianza delle variabili osservate. Nella FA, invece, si prendono in considerazione le covarianze, o le correlazioni, tra le variabili. Nella pratica, ci sono alcuni data set per i quali il modello fattoriale non fornisce un adeguato adattamento. Quindi, l analisi fattoriale presenta alcuni aspetti soggettivi tali per cui tra statistici ci sono opinioni contrastanti sulla sua validità. Talvolta, si individua un numero ridotto di fattori e tali fattori sono di facile interpretazione. Per altri dati, invece, non sono chiari né il numero dei fattori, né la loro interpretazione. Esempi di problemi con variabili latenti e manifeste i) Esiste un grande interesse nella misurazione dell intelligenza. Essa è concepita come un importante caratteristica dell'individuo posseduta in una certa misura, grande o piccola che sia. Tuttavia non si tratta di qualche cosa simile al peso o all età per i quali ci sono già degli strumenti di misura. L intelligenza è un costrutto, cioè è un concetto che troviamo utile e ricco di significato ma che non esiste, almeno non nel senso delle caratteristiche tangibili che ha, per esempio, il peso. È possibile tuttavia includerlo in un modello matematico e trattarlo come qualunque altra variabile. L intelligenza è un buon esempio di variabile latente. Le variabili indicatore sono quantità che si presume siano influenzate dalla variabile latente. Nel caso dello studio sull'intelligenza sono, usualmente, i punteggi ottenuti nei test scelti perché si ritiene che persone più intelligenti abbiano risultati migliori. Alcuni quesiti (item) potrebbero riguardare il linguaggio o la matematica, altri invece potrebbero sondare l abilità nel riconoscere particolari strutture. Se gli item richiedono tutti la medesima abilità mentale, ci si aspetta che i punteggi negli item siano correlati positivamente. Il problema è vedere se questa correlazione può essere rappresentata da un unica variabile latente e, se è così, determinare

10 6 Analisi fattoriale dove posizionare gli individui nella scala di questa variabile. ii) La misura dell orientamento politico è simile a quello dell'intelligenza. Descriviamo gli individui come tendenzialmente di destra o di sinistra, oppure più a destra/sinistra di altri. Implicitamente, in questo linguaggio c è l idea che esista una scala lungo la quale gli individui possano essere posizionati andando dall estrema sinistra all estrema destra. Questa è una scala latente e se si desidera costruire una simile scala saranno necessari opportuni indicatori. Questi possono essere determinati, per esempio, da un indagine in cui viene chiesto quali sono gli atteggiamenti riguardo ad alcune questioni politiche quali la sanità privata, l educazione privata e i sindacati. iii) Per misurare una variabile latente come lo stato socio-economico di una famiglia, è possibile, analogamente, raccogliere informazioni riguardo a reddito, occupazione e livello di istruzione dei membri della famiglia. In ciascuno di questi esempi si è utilizzato un criterio personale di comprensione della variabile latente di interesse per identificare alcune variabili manifeste che, si crede, rivelino qualche cosa riguardo la sottostante variabile latente. In effetti, si è partiti da una variabile latente per poi cercare le variabili manifeste che potessero fungere da indicatori perché già in possesso di un idea su quale potesse essere la variabile latente. Talvolta si procede nella direzione opposta. Per esempio, se si dispone di un indagine multiscopo, si può supporre che il grande numero di dimensioni manifeste, rappresentato dalle diverse decine di domande del questionario, possa essere ridotto a un numero più piccolo di dimensioni, senza che ciò comporti la perdita di informazioni essenziali. Questo secondo approccio è quello seguito usando la PCA. Modelli a variabili latenti I modelli a variabili latenti sono strettamente collegati al modello di regressione. Può essere perciò utile descrivere l idea base dell'analisi fattoriale in termini di analisi di regressione. Un modello di regressione esprime la relazione tra una variabile dipendente e una o più variabili indipendenti o regressori. Nell analisi fattoriale, la relazione di regressione è tra una variabile manifesta e le variabili latenti. In entrambi i casi vengono fatte assunzioni ri-

11 A. Lubisco 7 guardo la distribuzione dei residui o termini di errore in maniera da poter fare inferenza. Il problema essenziale che deve risolvere l'analisi fattoriale è quello di ottenere informazioni sulle variabili latenti, note le manifeste. Dal momento che non è possibile osservare le variabili latenti, è possibile conoscere qualche cosa di questa relazione solo indirettamente. Molte variabili manifeste dipendono spesso dalle medesime variabili latenti e questa dipendenza genera delle correlazioni tra di loro. In effetti, l esistenza di una correlazione tra due indicatori può essere considerata come l evidenza di una sorgente di influenza comune. L obiettivo dell analisi a variabili latenti è di determinare se la dipendenza tra le variabili osservate possa essere spiegata da un piccolo numero di variabili latenti. Come già osservato, i modelli a variabili latenti possono essere impiegati sia in un momento esplorativo per identificare le variabili latenti sottostanti un gruppo di item, sia in un approccio confermativo per verificare se un gruppo di item, costruito per misurare particolari concetti, sia effettivamente in grado di spiegare tale struttura. Ci sono vari tipi di modelli a variabili latenti. Questi modelli si distinguono per il livello di misura delle variabili osservate e per le assunzioni fatte a proposito del livello di misura delle variabili latenti. La seguente tabella mostra una classificazione dei modelli a variabili latenti. Variabili osservate Variabili latenti Metriche Categoriche Metriche Analisi fattoriale Latent trait analysis Categoriche Latent profile analysis Latent class analysis Questa tabella non esaurisce le possibilità perché, per esempio, le variabili manifeste possono essere un mix tra variabili metriche e categoriche. L analisi fattoriale, il primo dei metodi a variabili latenti di cui ci si occupa, è una tecnica appropriata quando tutte le variabili osservate sono su una scala metrica. Il modello fattoriale che è alla base del metodo assume che anche le variabili latenti siano metriche.

12 8 Analisi fattoriale IL MODELLO LINEARE A UN FATTORE Il più semplice modello fattoriale è quello che comprende un solo fattore. Charles Spearman, che inventò l analisi fattoriale, introdusse questo modello nello studio dell intelligenza umana. Si introdurrà il modello tramite un esempio che consentirà di mostrare che quello fattoriale può essere pensato come un sistema di equazioni di regressione nel quale alcune variabili (le variabili latenti) non sono osservate. L analisi fattoriale si pone l obiettivo di spiegare le correlazioni tra un gruppo di variabili manifeste. Queste correlazioni sono spesso spurie, nel senso che non sono dovute all esistenza di un legame causale diretto tra le variabili considerate. Esse talvolta esistono in quanto le variabili in questione hanno una dipendenza comune con una o più altre variabili. Per esempio, il fatto che la lunghezza dei piedi dei bambini sia correlata positivamente con l abilità nello scrivere non significa che dei piedi grandi aiutino i bambini a scrivere meglio. La correlazione è, piuttosto, una conseguenza accidentale del fatto che entrambe le caratteristiche sono correlate con l età: maggiore è l età, più grandi sono i piedi e migliore è l abilità nello scrivere. Quando ci si trova in situazioni analoghe è importante investigare per vedere se è possibile ottenere una spiegazione della correlazione attraverso la comune dipendenza con una o più altre variabili. In alcuni casi ci può essere un candidato ovvio al ruolo di altra variabile. Si supponga, per esempio, che si stia conducendo uno studio sulle spese settimanali fatte da un campione di famiglie su una grande varietà di prodotti: cibo, viaggi, divertimento, vestiti, Si supponga, inoltre, di trovare una correlazione positiva tra un paio di acquisti. Non sarebbe credibile affermare che un alta spesa in vestiti sia causa di alte spese in viaggi. È più plausibile supporre che spese alte di questi prodotti siano una conseguenza del disporre di un alto reddito. Per investigare questa ipotesi si dovrebbero ottenere ulteriori informazioni circa il reddito delle famiglie. Ciò permetterebbe di vede-

13 A. Lubisco 9 re se l ammontare di spesa per ciascun prodotto sia correlato al reddito complessivo, e, se così, se la relazione sia in grado di spiegare la correlazione tra le varie spese. Come si può effettuare questa verifica empiricamente? Una maniera potrebbe essere quella di specificare come ciascuna spesa possa essere legata al reddito. Per avere un idea preliminare su come fare ciò, si può, per esempio, specificare la relazione tra la spesa per il cibo e il reddito. Si supponga che si trovi una relazione pressoché lineare e che si ottenga un risultato analogo per ogni altro item. Si possono perciò scrivere semplici regressioni della forma: C i = α i + β i I + e i (i = 1,, ) dove C i rappresenta la spesa per l i-esimo item, I è il reddito della famiglia, α i e β i rispettivamente l intercetta e la pendenza della retta di regressione ed e i il residuo, specifico per C i con media zero, indipendente da I, che spieghi la variazione residua lungo la retta. Se si trova che questo modello ha un buon adattamento per tutti gli item di spesa, e che i residui e i sono incorrelati tra loro, allora si sarà dimostrato che il reddito è l unico elemento distinguibile determinante per la spesa. Per una quantità specifica di reddito, la spesa per l item i si comporterà come una variabile casuale con media α i + β i I e deviazione standard data dalla deviazione standard di e i. Dal momento che i residui sono indipendenti, tutte le correlazioni tra le variabili osservate vengono rimosse. Infatti considerando gli item i-esimo e j-esimo la correlazione tra C i e C j per un dato reddito I è data da E[(C i E(C i ))(C j E(C j )) I] = = E[(α i + β i I + e i (α i + β i I))(α j + β j I + e j (α j + β j I)) I] = = E[(e i e j ) I] = 0 Se tutto ciò accadesse, si verificherebbe che le reciproche correlazioni tra le spese per i vari articoli sarebbero spiegate dalla comune dipendenza dal reddito. Inoltre, i coefficienti di regressione β i spiegherebbero quanto intensamente ciascun item dipenda dal reddito. In forma generale, nell ambito del modello a un fattore, se si sup-

14 10 Analisi fattoriale pone che p variabili manifeste x 1, x,, x p dipendano per ipotesi da un unico fattore o variabile latente f, la maniera più semplice di esprimere la relazione di ciascuna x su f è tramite il modello lineare x i = λ i f + u i (i = 1,,, p) f è il fattore comune dal momento che è comune a tutte le x i. I residui u i sono i fattori specifici in quanto riferiti ciascuno alla corrispondente x i. Nel modello a un fattore si fanno le stesse ipotesi del modello di regressione: - indipendenza dei fattori specifici u i da f - distribuzione normale, media nulla e deviazione standard σ i degli u i. - si suppone inoltre gli u i siano indipendenti tra di loro per cui le x i sono condizionatamente indipendenti, dato f. Si possono perciò fare delle considerazioni per ciò che riguarda la distribuzione delle x i e in particolare sulle covarianze e correlazioni. Dal momento che f è una variabile non osservata, possiamo sceglierla con le caratteristiche che fanno più comodo, senza che questo influisca sulla forma dell equazione di regressione: f avrà media 0 e deviazione standard unitaria. Ne consegue, disponendo di questo modello, che le covarianze avranno la seguente semplice forma: Cov(x i, x j ) = λ i λ j (i, j = 1,, p; i j) È importante osservare che la covarianza è il prodotto di due numeri, uno dipendente da i e l altro da j. Da ciò è possibile determinare qualche cosa a proposito dei coefficienti di regressione del modello. Per esempio Cov(x 1, x ) Cov(x, x 3 ) / Cov(x 1, x 3 ) = λ è una relazione che serve a determinare λ dalle covarianze. In realtà, è possibile costruire altre espressioni simili a questa per determinare λ. Per esempio, se si sostituiscono gli indici 1 e 3 con qualunque altra coppia di numeri nell intervallo da 1 a p, il risultato sarà il medesimo, cioè λ. Se il modello fosse corretto e conoscessimo le reali covarianze, Cov(x i, x j ), allora le diverse equazioni re-

15 A. Lubisco 11 stituirebbero il medesimo valore del coefficiente di regressione, λ. Dal momento che analizzando dati reali si dispone solamente di stime delle covarianze (indicate con cov(x i, x j ) con la c minuscola), non si avranno identiche stime λˆ i di λ i, anche se il modello è corretto. Tuttavia, se tutte le stime di λ i fossero simili, questo potrebbe suggerire che il modello abbia un buon adattamento. Agli inizi, i modelli fattoriali venivano stimati con metodi molto simili a questo, noiosi da applicare e non facilmente estendibili al caso di più fattori. È però grazie a questo metodo che è possibile determinare i parametri del modello partendo dalle covarianze tra le variabili osservate senza conoscere i valori relativi ai fattori. Nella maggior parte dei casi pratici non ci sono variabili pronte all uso, come il reddito dell esempio precedente (anche se ci fosse, potrebbe essere impraticabile raccogliere l informazione in quanto la domanda potrebbe essere troppo intrusiva). In assenza di simili variabili, ci si deve chiedere se esista qualche variabile latente che possa avere il medesimo ruolo. Che la variabile latente sia o meno una variabile reale, ma comunque non osservabile, o un costrutto, ci si trova davanti alla stessa domanda fondamentale: c è un modo per stimare il modello di regressione appena visto senza conoscere i valori del reddito I? Questo è il problema che l analisi fattoriale si propone di risolvere. Si vedrà che l insieme delle correlazioni non contiene sufficiente informazione per permettere la stima delle relazioni di regressione e quindi di determinare l esistenza di fattori comuni.

16 1 Analisi fattoriale IL MODELLO FATTORIALE Il modello a un fattore può facilmente essere esteso al caso di un numero arbitrario di fattori. Semplicemente si sostituisce l'equazione di regressione con un equazione di regressione multipla. Come già anticipato, l analisi dei fattori, nell aspetto metodologico più generale, si propone di spiegare le correlazioni fra un insieme di p variabili osservate attraverso un numero più esiguo di variabili non osservate (fattori o variabili latenti) tra loro linearmente indipendenti. Le p variabili osservate verranno rappresentate come combinazioni lineari di un numero ridotto m (con m<p) di variabili casuali, chiamate fattori. I fattori sono costrutti sottostanti o variabili latenti che generano le variabili originarie (le variabili osservate). Alla pari delle variabili originarie, i fattori variano da individuo a individuo, ma contrariamente ad esse, i fattori non possono essere misurati o osservati. L esistenza stessa di queste variabili ipotetiche è una questione aperta. Se le p variabili originarie sono almeno moderatamente correlate, la dimensione di base del sistema è inferiore a p. L obiettivo dell'analisi fattoriale è di ridurre la ridondanza di informazione (espressa dalla presenza di correlazione) tra le variabili usando un numero inferiore a p di fattori. Si supponga che la struttura della matrice di correlazione delle variabili osservate sia tale per cui, per un sottoinsieme di variabili, ci sia alta correlazione tra loro stesse e bassa correlazione con tutte le altre. Allora, potrebbe esserci un singolo fattore sottostante che ha dato luogo a quel sottoinsieme di variabili. Se le altre variabili possono essere analogamente raggruppate in sottoinsiemi in base ad analoghe strutture di correlazione, ne segue che un piccolo gruppo di fattori può rappresentare questi gruppi di variabili. In tal caso, le strutture individuabili all interno della matrice di correlazione corrisponderanno direttamente ai fattori. Per esempio, si consideri la seguente matrice di correlazione:

17 A. Lubisco 13 1,00 0,90 0,05 0,05 0,05 0,90 1,00 0,05 0,05 0,05 0,05 0,05 1,00 0,90 0,90 0,05 0,05 0,90 1,00 0,90 0,05 0,05 0,90 0,90 1,00 In questo caso, le variabili 1 e corrispondono a un fattore e le variabili 3, 4 e 5 a un altro fattore. In altri casi, nei quali la matrice non ha strutture di correlazione così semplici, l analisi fattoriale è ancora in grado di partizionare le variabili in gruppi. L idea che sta alla base del metodo è, quindi, che la correlazione tra due variabili X i e X j possa essere spiegata dalla relazione lineare di entrambe con un insieme di m variabili f 1, f f m. Poiché la correlazione parziale tra X i e X j dati f 1, f,, f m, che indichiamo con r ij;1 m rappresenta la correlazione residua tra X i e X j non spiegata dalla loro relazione lineare con tali variabili, si dice che l insieme f 1, f,, f m consente di spiegare in modo adeguato la correlazione osservata tra X i e X j se la correlazione parziale r ij;1 m è prossima a zero, o più precisamente se l ipotesi nulla di una correlazione parziale in popolazione uguale a zero (H 0 : ρ ij;1 m ) non può essere rifiutata. Date p variabili, se un insieme di m variabili f 1, f,, f m spiega completamente i valori al di fuori della diagonale principale della matrice di correlazione R tra le p variabili osservate, la correlazione parziale degli elementi della matrice dei dati, per assegnati valori di f 1, f,, f m deve essere non significativamente diversa da zero. Le variabili X i e X j devono, quindi, essere condizionatamente incorrelate dati i valori di f 1, f,, f m (dove m<p). Questa proprietà di indipendenza locale è condizione necessaria perché l insieme di variabili f 1, f,, f m offra una spiegazione adeguata dei valori di R. Il problema così posto è indeterminato perché le variabili f 1, f,, f m non sono osservabili. Una possibile via per risolverlo è quella di imporre alcune condizioni che limitano il campo a relazioni di tipo lineare tra le variabili osservate e le variabili latenti e imporre inoltre alcune condizioni sulle

18 14 Analisi fattoriale variabili latenti stesse. Quindi, il primo passo dell analisi consiste nella formulazione di un modello appropriato. Nella formulazione più immediata, l analisi fattoriale ipotizza che ciascuna variabile osservata X i dipenda in parte da m fattori comuni a tutte le variabili, f k k = 1,, m, in parte da un fattore specifico u i. Ipotizzando una relazione lineare tra le variabili osservate e i fattori, si definisce un sistema di equazioni del tipo: X 1 = μ 1 + λ 11 f λ 1k f k + + λ 1m f m + u 1 X i = μ i + λ i1 f λ ik f k + + λ im f m + u i X p = μ p + λ p1 f λ pk f k + + λ pm f m + u p dove μ i è la media della variabile X i. La determinazione dei coefficienti λ ik, detti pesi fattoriali, consente di valutare l influenza di ciascun fattore espressa in termini di apporto relativo alla variabilità complessiva del sistema, così da individuare quali tra essi possano ritenersi statisticamente rilevanti. Questo modello somiglia solo in apparenza a quello di regressione multipla. Nel contesto della regressione, infatti, gli f k sono noti, mentre nel caso ora in esame tutti gli elementi a destra dell uguale sono quantità incognite, non direttamente misurabili o osservabili. Sotto certe condizioni è facile verificare che un modello di questo tipo è in grado di spiegare le correlazioni osservate. Si tratta comunque di un modello ed è sempre necessario verificare se tale modello sia in grado di dare una spiegazione adeguata di quanto osservato. La semplicità e l agilità degli sviluppi formali che conseguono l introduzione di alcune ipotesi, cioè a) indipendenza lineare dei fattori b) linearità delle relazioni pur non trovando frequenti riscontri nel contesto fenomenico, ne giustificano la scelta, almeno nella prima fase della ricerca.

19 A. Lubisco 15 Specificazione del modello fattoriale Sia X un vettore aleatorio (di dimensioni px1) con media μ e varianze-covarianze Σ; si definisce modello fattoriale la relazione lineare X = μ + Λf + u dove Λ (pxm) è una matrice di costanti (SONO I PESI FATTORIALI) e f (mx1) e u (px1) sono vettori aleatori. + λ λ λ λ λ λ λ λ λ + μ μ μ = p h 1 m k 1 pm pk p1 hm hk h1 1m 1k 11 p h 1 p h 1 u u u f f f X X X M M M M L L M O M M L L M M O M L L M M M M I vincoli che più frequentemente si impongono sulle componenti del modello sono i seguenti: 1) Le variabili f, i fattori comuni, hanno media zero, varianza unitaria e sono tra loro linearmente indipendenti (equivale a incorrelati) cioè: a) E(f)=0 nullità delle medie aritmetiche dei fattori comuni b) E(ff )=I unitarietà delle varianze dei fattori comuni e incorrelazione a coppie ) Le variabili u, i fattori specifici o specificità, hanno media zero, varianza ψ ii e sono tra loro incorrelate (significa che la correlazione tra le variabili originarie è spiegata completamente dai fattori comuni) cioè a) E(u)=0 nullità delle medie aritmetiche dei fattori specifici b) E(uu )=Ψ (dove Ψ=diag(ψ 11,, ψ pp )) incorrelazione a coppie relativamente ai fattori specifici ψ ψ ψ Ψ = pp hh L L M O M M L L M M O M L L

20 16 Analisi fattoriale N.B. Non ci sono ipotesi sulle varianze, per cui si ha una matrice diagonale in cui tutti gli elementi al di fuori della diagonale principale sono nulli e quelli su di essa non necessariamente uguali. Inoltre, i fattori specifici sono linearmente non correlati anche con i fattori comuni, cioè c) E(fu )=0 incorrelazione a coppie fra i fattori specifici e i fattori comuni 3) Talvolta vengono introdotte anche le seguenti ipotesi: a) I fattori comuni f hanno distribuzione normale multivariata b) I fattori specifici u hanno distribuzione normale multivariata Le ipotesi 3a e 3b implicano che anche le X i abbiano distribuzione normale multivariata e portano al modello fattoriale lineare normale. Le ipotesi b e c implicano che le correlazioni tra le X i siano completamente spiegate dai fattori. E bene sottolineare il diverso significato dell ipotesi di incorrelazione dei fattori comuni e dei fattori specifici. Per assicurare che i fattori comuni siano in grado di spiegare completamente le correlazioni tra le variabili osservate sono determinanti due ipotesi: i) che i fattori specifici siano incorrelati tra loro E(uu )=Ψ (dove Ψ=diag(ψ 11,, ψ pp )) [ipotesi b] ii) che i fattori specifici siano incorrelati con i fattori comuni E(fu )=0 [ipotesi c] Diversamente l ipotesi E(ff )=I [ipotesi 1b], non è fondamentale. Infatti la matrice di varianze-covarianze tra i fattori potrebbe essere una qualunque matrice Σ f simmetrica e definita positiva e, in quanto simmetrica, per la scomposizione di Cholesky esisterà sempre una matrice triangolare inferiore L tale che Σ f = LL. Si dimostra che il vettore f * = L -1 f ha ancora media nulla e matrice di varianze-covarianze uguale alla matrice identità; infatti: E(f * f * ) = E(L -1 ff (L ) -1 ) = L -1 E(ff )(L ) -1 = L -1 Σ f (L ) -1 = L -1 LL (L ) -1 = I

L analisi fattoriale

L analisi fattoriale L analisi fattoriale Scopo dell analisi fattoriale e quello di identificare alcune variabili latenti (fattori) in grado di spiegare i legami, le interrelazioni e le dipendenze tra le variabili statistiche

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

0. Piano cartesiano 1

0. Piano cartesiano 1 0. Piano cartesiano Per piano cartesiano si intende un piano dotato di due assi (che per ragioni pratiche possiamo scegliere ortogonali). Il punto in comune ai due assi è detto origine, e funziona da origine

Dettagli

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte Competenza chiave europea: MATEMATICA Scuola Primaria DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte TAB. A TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE al termine della Scuola Primaria

Dettagli

5.4 Solo titoli rischiosi

5.4 Solo titoli rischiosi 56 Capitolo 5. Teoria matematica del portafoglio finanziario II: analisi media-varianza 5.4 Solo titoli rischiosi Suppongo che sul mercato siano presenti n titoli rischiosi i cui rendimenti aleatori sono

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali)

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali) RICERCHE DI MERCATO 5.6 Analisi Fattoriale (Componenti Principali) Prof. L. Neri Dip. di Economia Politica Premessa Come evidenziato in precedenza l approccio di segmentazione per omogeneità prevede la

Dettagli

CURRICOLO MATEMATICA ABILITA COMPETENZE

CURRICOLO MATEMATICA ABILITA COMPETENZE CURRICOLO MATEMATICA 1) Operare con i numeri nel calcolo aritmetico e algebrico, scritto e mentale, anche con riferimento a contesti reali. Per riconoscere e risolvere problemi di vario genere, individuando

Dettagli

Parte 3. Rango e teorema di Rouché-Capelli

Parte 3. Rango e teorema di Rouché-Capelli Parte 3. Rango e teorema di Rouché-Capelli A. Savo Appunti del Corso di Geometria 203-4 Indice delle sezioni Rango di una matrice, 2 Teorema degli orlati, 3 3 Calcolo con l algoritmo di Gauss, 6 4 Matrici

Dettagli

Analisi discriminante

Analisi discriminante Capitolo 6 Analisi discriminante L analisi statistica multivariata comprende un corpo di metodologie statistiche che permettono di analizzare simultaneamente misurazioni riguardanti diverse caratteristiche

Dettagli

PARTE TERZA. STATISTICA DESCRITTIVA MULTIDIMENSIONALE (Analisi delle Relazioni)

PARTE TERZA. STATISTICA DESCRITTIVA MULTIDIMENSIONALE (Analisi delle Relazioni) PARTE TERZA STATISTICA DESCRITTIVA MULTIDIMESIOALE (Analisi delle Relazioni) La notazione matriciale 3 III.. LA OTAZIOE MATRICIALE III... L analisi statistica dei fenomeni multivariati L intrinseca complessità

Dettagli

Appunti di Statistica Descrittiva

Appunti di Statistica Descrittiva Appunti di Statistica Descrittiva 30 dicembre 009 1 La tabella a doppia entrata Per studiare dei fenomeni con caratteristiche statistiche si utilizza l espediente della tabella a doppia entrata Per esempio

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA Francesco Bottacin Padova, 24 febbraio 2012 Capitolo 1 Algebra Lineare 1.1 Spazi e sottospazi vettoriali Esercizio 1.1. Sia U il sottospazio di R 4 generato dai

Dettagli

6. Modelli statistici: analisi della regressione lineare

6. Modelli statistici: analisi della regressione lineare BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Scuola Primaria Conta oggetti o eventi, a voce e a mente, in senso progressivo e regressivo e per salti di due, tre ;

Scuola Primaria Conta oggetti o eventi, a voce e a mente, in senso progressivo e regressivo e per salti di due, tre ; Primo anno Secondo anno Terzo anno Primo anno MATEMATICA Scuola dell Infanzia Scuola Primaria Conta oggetti o eventi, a voce e a mente, in senso progressivo e regressivo e per salti di due, tre ; legge

Dettagli

LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE

LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE FLAVIO ANGELINI Sommario Queste note hanno lo scopo di indicare a studenti di Economia interessati alla finanza quantitativa i concetti essenziali

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

SOMMARIO. 13.1 I radicali pag. 3. 13.2 I radicali aritmetici pag. 5. 13.3 Moltiplicazione e divisione fra radicali aritmetici pag.

SOMMARIO. 13.1 I radicali pag. 3. 13.2 I radicali aritmetici pag. 5. 13.3 Moltiplicazione e divisione fra radicali aritmetici pag. SOMMARIO CAPITOLO : I RADICALI. I radicali pag.. I radicali aritmetici pag.. Moltiplicazione e divisione fra radicali aritmetici pag.. Potenza di un radicale aritmetico pag.. Trasporto di un fattore esterno

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Introduzione Livelli di significatività Verifica di ipotesi sulla media di una popolazione normale Verifica di ipotesi sulla varianza di una popolazione normale Verifica di ipotesi

Dettagli

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Esercizio 1 Si consideri il seguente modello ad effetti fissi con variabili binarie: + 1 2 a) supponete che N=3. Si mostri che i regressori

Dettagli

Capitolo 20: Scelta Intertemporale

Capitolo 20: Scelta Intertemporale Capitolo 20: Scelta Intertemporale 20.1: Introduzione Gli elementi di teoria economica trattati finora possono essere applicati a vari contesti. Tra questi, due rivestono particolare importanza: la scelta

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità

Dettagli

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE 1 Associazione tra variabili quantitative ASSOCIAZIONE FRA CARATTERI QUANTITATIVI: COVARIANZA E CORRELAZIONE 2 Associazione tra variabili quantitative Un esempio Prezzo medio per Nr. Albergo cliente (Euro)

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

Gli OLS come statistica descrittiva

Gli OLS come statistica descrittiva Gli OLS come statistica descrittiva Cos è una statistica descrittiva? È una funzione dei dati che fornisce una sintesi su un particolare aspetto dei dati che a noi interessa; naturalmente, è auspicabile

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

La Regressione Lineare

La Regressione Lineare La Regressione Lineare. Cos è l Analisi della Regressione Multipla? L analisi della regressione multipla è una tecnica statistica che può essere impiegata per analizzare la relazione tra una variabile

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione

2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione Capitolo 2 MATRICI Fra tutte le applicazioni su uno spazio vettoriale interessa esaminare quelle che mantengono la struttura di spazio vettoriale e che, per questo, vengono dette lineari La loro importanza

Dettagli

9 Metodi diretti per la risoluzione di sistemi lineari: fattorizzazione P A = LU

9 Metodi diretti per la risoluzione di sistemi lineari: fattorizzazione P A = LU 9 Metodi diretti per la risoluzione di sistemi lineari: fattorizzazione P A LU 9.1 Il metodo di Gauss Come si è visto nella sezione 3.3, per la risoluzione di un sistema lineare si può considerare al posto

Dettagli

Analisi fattoriale. esplorativa vers. 1.0. Germano Rossi 1 germano.rossi@unimib.it. 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Analisi fattoriale. esplorativa vers. 1.0. Germano Rossi 1 germano.rossi@unimib.it. 1 Dipartimento di Psicologia, Università di Milano-Bicocca Analisi fattoriale esplorativa vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2009 Rossi (Dip. Psicologia) Analisi fattoriale 2009 1 / 47 Prima

Dettagli

Il concetto di correlazione

Il concetto di correlazione SESTA UNITA Il concetto di correlazione Fino a questo momento ci siamo interessati alle varie statistiche che ci consentono di descrivere la distribuzione dei punteggi di una data variabile e di collegare

Dettagli

Funzioni in due variabili Raccolta di FAQ by Andrea Prevete

Funzioni in due variabili Raccolta di FAQ by Andrea Prevete Funzioni in due variabili Raccolta di FAQ by Andrea Prevete 1) Cosa intendiamo, esattamente, quando parliamo di funzione reale di due variabili reali? Quando esiste una relazione fra tre variabili reali

Dettagli

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA SECONDARIA DI PRIMO GRADO. L alunno ha rafforzato un atteggiamento positivo rispetto

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI statistica, Università Cattaneo-Liuc, AA 006-007, lezione del 08.05.07 IDICE (lezione 08.05.07 PROBABILITA, VALORE ATTESO E VARIAZA DELLE QUATITÁ ALEATORIE E LORO RELAZIOE CO I DATI OSSERVATI 3.1 Valore

Dettagli

CURRICOLO MATEMATICA

CURRICOLO MATEMATICA 1 CURRICOLO MATEMATICA Competenza 1 al termine della scuola dell Infanzia 2 NUMERI Raggruppare, ordinare, contare, misurare oggetti, grandezze ed eventi direttamente esperibili. Utilizzare calendari settimanali

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Appunti: Teoria Dei Test

Appunti: Teoria Dei Test Appunti: Teoria Dei Test Fulvio De Santis, Luca Tardella e Isabella Verdinelli Corsi di Laurea A + E + D + G + R 1. Introduzione. Il test d ipotesi è un area dell inferenza statistica in cui si valuta

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2003 Sessione straordinaria

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2003 Sessione straordinaria ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 3 Sessione straordinaria Il candidato risolva uno dei due problemi e 5 dei quesiti in cui si articola il questionario. PROBLEMA È assegnata

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Elementi di Psicometria

Elementi di Psicometria Elementi di Psicometria 12-Correlazione vers. 1.1 (27 novembre 2012) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2011-2012 G. Rossi (Dip. Psicologia)

Dettagli

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che VARIABILI ALATORI MULTIPL TORMI ASSOCIATI Fonti: Cicchitelli Dall Aglio Mood-Grabill. Moduli 6 9 0 del programma. VARIABILI ALATORI DOPPI Dopo aver trattato delle distribuzioni di probabilità di una variabile

Dettagli

Premesse alla statistica

Premesse alla statistica Premesse alla statistica Versione 22.10.08 Premesse alla statistica 1 Insiemi e successioni I dati di origine sperimentale si presentano spesso non come singoli valori, ma come insiemi di valori. Richiamiamo

Dettagli

SISTEMA DI RAPPRESENTAZIONE BINARIA DEI NUMERI E. Giordani

SISTEMA DI RAPPRESENTAZIONE BINARIA DEI NUMERI E. Giordani SISTEMA DI RAPPRESENTAZIONE BINARIA DEI NUMERI E. Giordani LEMS- Laboratorio Elettronico per la Musica Sperimentale Conservatorio di Musica G. Rossini- Pesaro,QWURGX]LRQH Tutti i FDOFRODWRUL HOHWWURQLFL

Dettagli

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

COMPETENZE SPECIFICHE

COMPETENZE SPECIFICHE COMPETENZE IN MATEMATICA DISCIPLINA DI RIFERIMENTO: MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE FISSATI DALLE INDICAZIONI NAZIONALI PER IL CURRICOLO 2012. MATEMATICA TRAGUARDI ALLA FINE DELLA

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Scheda n.5: variabili aleatorie e valori medi

Scheda n.5: variabili aleatorie e valori medi Scheda n.5: variabili aleatorie e valori medi October 26, 2008 1 Variabili aleatorie Per la definizione rigorosa di variabile aleatoria rimandiamo ai testi di probabilità; essa è non del tutto immediata

Dettagli

Da una a più variabili: derivate

Da una a più variabili: derivate Da una a più variabili: derivate ( ) 5 gennaio 2011 Scopo di questo articolo è di evidenziare le analogie e le differenze, relativamente al calcolo differenziale, fra le funzioni di una variabile reale

Dettagli

MATEMATICA SCUOLE DELL INFANZIA

MATEMATICA SCUOLE DELL INFANZIA MATEMATICA SCUOLE DELL INFANZIA CAMPO DI ESPERIENZA: LA CONOSCENZA DEL MONDO (ordine, misura, spazio, tempo, natura) È l'ambito relativo all'esplorazione, scoperta e prima sistematizzazione delle conoscenze

Dettagli

Elaborazione dati in Analisi Sensoriale

Elaborazione dati in Analisi Sensoriale Elaborazione dati in Analisi Sensoriale Si è parlato di interpretazione corretta dei risultati ottenuti; a questo concorrono due fattori: affidabilità e validità. Se i test fossero stati ripetuti con lo

Dettagli

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Verifica di ipotesi e intervalli di confidenza nella regressione multipla Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo

Dettagli

1. L analisi statistica

1. L analisi statistica 1. L analisi statistica Di cosa parleremo La statistica è una scienza, strumentale ad altre, concernente la determinazione dei metodi scientifici da seguire per raccogliere, elaborare e valutare i dati

Dettagli

LE FIBRE DI UNA APPLICAZIONE LINEARE

LE FIBRE DI UNA APPLICAZIONE LINEARE LE FIBRE DI UNA APPLICAZIONE LINEARE Sia f:a B una funzione tra due insiemi. Se y appartiene all immagine di f si chiama fibra di f sopra y l insieme f -1 y) ossia l insieme di tutte le controimmagini

Dettagli

Il risultato di un analisi chimica è un informazione costituita da: un numero un incertezza un unità di misura

Il risultato di un analisi chimica è un informazione costituita da: un numero un incertezza un unità di misura Il risultato di un analisi chimica è un informazione costituita da: un numero un incertezza un unità di misura Conversione del risultato in informazione utile È necessario fare alcune considerazioni sul

Dettagli

MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA

MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA L alunno si muove con sicurezza nel calcolo scritto e mentale con i numeri naturali e sa valutare l opportunità di

Dettagli

MINIMI QUADRATI. REGRESSIONE LINEARE

MINIMI QUADRATI. REGRESSIONE LINEARE MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione

Dettagli

Metodi iterativi per sistemi lineari

Metodi iterativi per sistemi lineari Metodi iterativi per sistemi lineari Dario A. Bini, Università di Pisa 30 ottobre 2013 Sommario Questo modulo didattico contiene risultati relativi ai metodi iterativi per risolvere sistemi di equazioni

Dettagli

IPOTESI di CURRICOLO MATEMATICA SCUOLA PRIMARIA E SECONDARIA DI PRIMO GRADO con riferimento alle Indicazioni Nazionali 2012

IPOTESI di CURRICOLO MATEMATICA SCUOLA PRIMARIA E SECONDARIA DI PRIMO GRADO con riferimento alle Indicazioni Nazionali 2012 IPOTESI di CURRICOLO MATEMATICA SCUOLA PRIMARIA E SECONDARIA DI PRIMO GRADO con riferimento alle Indicazioni Nazionali 2012 6 IC PADOVA COMPETENZE SPECIFICHE Numeri conoscere e padroneggiare i contenuti

Dettagli

LEZIONE 14. a 1,1 v 1 + a 1,2 v 2 + a 1,3 v 3 + + a 1,n 1 v n 1 + a 1,n v n = w 1

LEZIONE 14. a 1,1 v 1 + a 1,2 v 2 + a 1,3 v 3 + + a 1,n 1 v n 1 + a 1,n v n = w 1 LEZIONE 14 141 Dimensione di uno spazio vettoriale Abbiamo visto come l esistenza di una base in uno spazio vettoriale V su k = R, C, permetta di sostituire a V, che può essere complicato da trattare,

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione

Dettagli

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI Indice 1 Le frazioni algebriche 1.1 Il minimo comune multiplo e il Massimo Comun Divisore fra polinomi........ 1. Le frazioni algebriche....................................

Dettagli

Percorsi di matematica per il ripasso e il recupero

Percorsi di matematica per il ripasso e il recupero Giacomo Pagina Giovanna Patri Percorsi di matematica per il ripasso e il recupero 2 per la Scuola secondaria di secondo grado UNITÀ CAMPIONE Edizioni del Quadrifoglio à t i n U 1 Sistemi di primo grado

Dettagli

1. Calcolare la probabilità che estratte a caso ed assieme tre carte da un mazzo di 40, fra di esse vi sia un solo asso, di qualunque seme.

1. Calcolare la probabilità che estratte a caso ed assieme tre carte da un mazzo di 40, fra di esse vi sia un solo asso, di qualunque seme. Esercizi difficili sul calcolo delle probabilità. Calcolare la probabilità che estratte a caso ed assieme tre carte da un mazzo di, fra di esse vi sia un solo asso, di qualunque seme. Le parole a caso

Dettagli

MATEMATICA Competenza chiave europea: COMPETENZA MATEMATICA E COMPETENZE DI BASE IN SCIENZA E TECNOLOGIA Competenza specifica: MATEMATICA

MATEMATICA Competenza chiave europea: COMPETENZA MATEMATICA E COMPETENZE DI BASE IN SCIENZA E TECNOLOGIA Competenza specifica: MATEMATICA MATEMATICA Competenza chiave europea: COMPETENZA MATEMATICA E COMPETENZE DI BASE IN SCIENZA E TECNOLOGIA Competenza specifica: MATEMATICA Le conoscenze matematiche contribuiscono alla formazione culturale

Dettagli

Compito di SISTEMI E MODELLI. 19 Febbraio 2015

Compito di SISTEMI E MODELLI. 19 Febbraio 2015 Compito di SISTEMI E MODELLI 9 Febbraio 5 Non é ammessa la consultazione di libri o quaderni. Le risposte vanno giustificate. Saranno rilevanti per la valutazione anche l ordine e la chiarezza di esposizione.

Dettagli

Metodi Numerici per Equazioni Ellittiche

Metodi Numerici per Equazioni Ellittiche Metodi Numerici per Equazioni Ellittiche Vediamo ora di descrivere una tecnica per la risoluzione numerica della più semplice equazione ellittica lineare, l Equazione di Laplace: u xx + u yy = 0, (x, y)

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Introduzione. Margine di ampiezza... 2 Margine di fase... 5 Osservazione... 6 Margini di stabilità e diagrammi di Bode... 6

Introduzione. Margine di ampiezza... 2 Margine di fase... 5 Osservazione... 6 Margini di stabilità e diagrammi di Bode... 6 ppunti di Controlli utomatici Capitolo 7 parte II Margini di stabilità Introduzione... Margine di ampiezza... Margine di fase... 5 Osservazione... 6 Margini di stabilità e diagrammi di ode... 6 Introduzione

Dettagli

Capitolo 23: Scelta in condizioni di incertezza

Capitolo 23: Scelta in condizioni di incertezza Capitolo 23: Scelta in condizioni di incertezza 23.1: Introduzione In questo capitolo studiamo la scelta ottima del consumatore in condizioni di incertezza, vale a dire in situazioni tali che il consumatore

Dettagli

09 - Funzioni reali di due variabili reali

09 - Funzioni reali di due variabili reali Università degli Studi di Palermo Facoltà di Economia CdS Sviluppo Economico e Cooperazione Internazionale Appunti del corso di Matematica 09 - Funzioni reali di due variabili reali Anno Accademico 2013/2014

Dettagli

Lezione n. 2 (a cura di Chiara Rossi)

Lezione n. 2 (a cura di Chiara Rossi) Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

Capitolo II Le reti elettriche

Capitolo II Le reti elettriche Capitolo II Le reti elettriche Fino ad ora abbiamo immaginato di disporre di due soli bipoli da collegare attraverso i loro morsetti; supponiamo ora, invece, di disporre di l bipoli e di collegarli tra

Dettagli

SCUOLA PRIMARIA Anno Scolastico 2014/2015 CURRICOLO DI MATEMATICA OBIETTIVI DI APPRENDIMENTO AL TERMINE DELLA CLASSE TERZA DELLA SCUOLA PRIMARIA

SCUOLA PRIMARIA Anno Scolastico 2014/2015 CURRICOLO DI MATEMATICA OBIETTIVI DI APPRENDIMENTO AL TERMINE DELLA CLASSE TERZA DELLA SCUOLA PRIMARIA Ministero dell Istruzione, dell Università e della Ricerca Istituto Comprensivo Statale di Calolziocorte Via F. Nullo,6 23801 CALOLZIOCORTE (LC) e.mail: lcic823002@istruzione.it - Tel: 0341/642405/630636

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI Docente: Prof. Massimo Mariani 1 SOMMARIO Il rendimento di un attività finanziaria: i parametri rilevanti Rendimento totale, periodale e medio Il market

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Corso di Analisi Numerica - AN1. Parte 2: metodi diretti per sistemi lineari. Roberto Ferretti

Corso di Analisi Numerica - AN1. Parte 2: metodi diretti per sistemi lineari. Roberto Ferretti Corso di Analisi Numerica - AN1 Parte 2: metodi diretti per sistemi lineari Roberto Ferretti Richiami sulle norme e sui sistemi lineari Il Metodo di Eliminazione di Gauss Il Metodo di Eliminazione con

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 39 Introduzione Come si è detto,

Dettagli

Modelli di Ottimizzazione

Modelli di Ottimizzazione Capitolo 2 Modelli di Ottimizzazione 2.1 Introduzione In questo capitolo ci occuperemo più nel dettaglio di quei particolari modelli matematici noti come Modelli di Ottimizzazione che rivestono un ruolo

Dettagli

Fondamenti di Automatica

Fondamenti di Automatica Fondamenti di Automatica Analisi dei sistemi dinamici Dott. Ing. Marcello Bonfè Dipartimento di Ingegneria - Università di Ferrara Tel. +39 0532 974839 E-mail: marcello.bonfe@unife.it pag. 1 Analisi dei

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 L4, Corso Integrato di Psicometria - Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Rev. 18/04/2011 Inferenza statistica Formulazione

Dettagli

L espressione torna invece sempre vera (quindi la soluzione originale) se cambiamo contemporaneamente il verso: 1 < 0.

L espressione torna invece sempre vera (quindi la soluzione originale) se cambiamo contemporaneamente il verso: 1 < 0. EQUAZIONI E DISEQUAZIONI Le uguaglianze fra espressioni numeriche si chiamano equazioni. Cercare le soluzioni dell equazione vuol dire cercare quelle combinazioni delle lettere che vi compaiono che la

Dettagli

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Alessandro Rezzani Abstract L articolo descrive una delle tecniche di riduzione della dimensionalità del data set: il metodo dell analisi delle componenti principali (Principal

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

FONDAMENTI DI PSICOMETRIA - 8 CFU

FONDAMENTI DI PSICOMETRIA - 8 CFU Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria).

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria). Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria). Aprile 20 Indice Serie numeriche. Serie convergenti, divergenti, indeterminate.....................

Dettagli