Alfonso Iodice D Enza
|
|
|
- Luca Buono
- 7 anni fa
- Просмотров:
Транскрипт
1 Strumenti quantitativi per l economia e la finanza I Alfonso Iodice D Enza [email protected] Università degli studi di Cassino e del Lazio Meridionale () Statistica 1 / 58
2 Outline () Statistica 2 / 58
3 Analisi Delle Analisi multidimensionale di qualitativi L rappresenta uno strumento per lo studio delle relazioni tra p caratteri statistici qualitativi, ognuno caratterizzato da m j modalità (j=1,...,p). Un applicazione molto comune per l ACM consiste nell utilizzo di tale metodo per visualizzare i risultati di una indagine via questionario (domande in forma chiusa). () Statistica 3 / 58
4 Analisi Delle La Si considerino i seguenti risultati di un indagine riguardante gli sbocchi occupazionali di un campione di 389 laureati a cui sono state sottoposte 12 domande in forma chiusa. Si riporta un esempio delle prime 5 righe ed 8 colonne della matrice di Genere Residenza Voto.di.laurea Età.attuale 1 maschio altre province voti tra 96 e 105 tra 26 e 30 anni 2 femmina altre province voti tra 96 e 105 oltre 30 anni 3 maschio Napoli voti tra 96 e 105 tra 26 e 30 anni 4 maschio provincia di Napoli voti tra 96 e 105 tra 26 e 30 anni 5 maschio altre province voti minori di 96 tra 26 e 30 anni Diploma Voto.di.diploma Frequenza.ai.corsi Materia.della.tesi.di.laurea 1 maturità scientifica voto tra 43 e 48 meno del 30% materie economiche 2 maturità scientifica voto tra 36 e 42 meno del 30% altre materie 3 maturità classica voto tra 43 e 48 tra il 30% ed il 50% materie economiche 4 maturità scientifica voto tra 49 e 54 tra il 30% ed il 50% materie giuridiche 5 maturit scientifica voto tra 36 e 42 tra il 30% ed il 50% materie giuridiche () Statistica 4 / 58
5 Tabelle di Tabella in codifica ridotta Un tipo di codifica di relativi a n unità statistiche su cui sono osservate p variabili qualitative consiste nella costruzione della tabella di codifica ridotta R. n righe corrispondenti alle unità p colonne quante sono le variabili il generico elemento r ij della matrice R è tale che r ij numero della modalità () Statistica 5 / 58
6 Tabelle di Tabella in codifica ridotta Genere Residenza Voto.di.laurea Età.attuale Diploma Voto.di.diploma Frequenza.ai.corsi Materia.della.tesi.di.laurea () Statistica 6 / 58
7 Tabelle di Tabella in codifica disgiuntiva completa Un tipo di codifica di relativi a n unità statistiche su cui sono osservate p variabili qualitative consiste nella costruzione della tabella di codifica disgiuntiva completa Z. n righe corrispondenti alle unità s colonne quante sono le modalità delle p variabili il generico elemento z ij della matrice Z è tale che z ij = 1 se l unità i è caratterizzata dalla modalità associata alla colonna j; z ij = 0 altrimenti () Statistica 7 / 58
8 Tabelle di Tabella in codifica disgiuntiva completa maschio femmina Napoli provincia di Napoli altre province voti minori di 96 voti tra 96 e 105 voti tra 106 e 110 voto 110 e lode () Statistica 8 / 58
9 Tabelle di Tabella di Burt Ottenuta la tabella in codifica disgiuntiva completa Z è si ricava la tabella di Burt B = Z T Z una tabella a blocchidi dimensioni s s blocchi diagonali: ciascun blocco diagonale è una matrice diagonale i cui valori rappresentano le frequenze delle modalità della variabile cui il blocco è associato. blocchi extra-diagonali: ciascun blocco extra-diagonale rappresenta una tabella a doppia entrata che incrocia due delle p variabili considerate Tabella D Si definisce inoltre D la matrice diagonale i cui elementi corrispondono agli elementi diagonali della tabella di Burt. () Statistica 9 / 58
10 Tabelle di Tabella di Burt () Statistica 10 / 58
11 Tabelle di Tabella di Burt () Statistica 11 / 58
12 Tabelle di Tabella di Burt () Statistica 12 / 58
13 Tabelle di Matrice diagonale D () Statistica 13 / 58
14 Tabelle di È possibile formalizzare il problema in maniera analoga al caso di due variabili, per fare questo occorre definire opportunamente le matrici F, D n, D s. Tabella F,D n, D s F = 1 n p Z dove n p rappresenta il totale di tabella della matrice Z: la somma degli elementi di ciascuna delle n righe è infatti uguale a p. Matrice diagonale dei marginali di riga della matrice F D n = 1 n In dove I n rappresenta la matrice identità di dimensioni n n. Matrice diagonale dei marginali di colonna della matrice F D s = 1 n p D () Statistica 14 / 58
15 Tabelle di Matrice F maschio femmina Napoli provincia di Napoli altre province voti tra 96 e 105 voti tra 106 e 110 voto 110 e lode () Statistica 15 / 58
16 Tabelle di Matrice F minore di 26 anni tra 26 e 30 anni oltre 30 anni maturità classica maturità scientifica diploma tecnico altri diplomi () Statistica 16 / 58
17 Tabelle di Matrice F voto tra 36 e 42 voto tra 43 e 48 voto tra 49 e 54 voto tra 55 e solo per esami meno del 30% tra il 30% ed il 50% oltre il 50% () Statistica 17 / 58
18 Le tabelle dei profili A questo punto è possibile ottenere le tabelle dei profili riga e colonna in maniera del tutto analoga al caso delle semplici. In questo caso bisogna tenere conto che i profili riga fanno riferimento agli individui, mentre i profili colonna fanno riferimento alle modalità delle p variabili. profili riga: si ottiengono dividendo ciascun elemento di F per il rispettivo marginale (totale) di riga D 1 n F profili colonna: si ottiengono dividendo ciascun elemento di F per il rispettivo marginale (totale) di colonna, FD 1 s () Statistica 18 / 58
19 : soluzione in R s Analogamente al caso La soluzione nello spazio degli individui Ricorrendo al metodo dei moltiplicatori di Lagrange, si perviene alla seguente formalizzazione F T D 1 n FD 1 s u = λu La soluzione si ottiene diagonalizzando la seguente matrice (nello spazio delle modalità) che può essere espressa come segue ( S = F T D 1 Z n FD 1 s = n p S = F T D 1 n FD 1 s ) T } {{ } F T = 1 p ZT ZD 1 = 1 p BD n In }{{} D 1 n ( ) Z n p D 1 = n p }{{}}{{} D 1 F s () Statistica 19 / 58
20 : soluzione in R n Analogamente al caso La soluzione nello spazio delle modalità Ricorrendo al metodo dei moltiplicatori di Lagrange, si perviene alla seguente formalizzazione F T D 1 s FD 1 n v = λv La soluzione si ottiene diagonalizzando la seguente matrice (nello spazio delle modalità) S = F T D 1 s FD 1 n () Statistica 20 / 58
21 : soluzione in R n Spazio modalità il versore dell asse principale è La proiezione di un vettore sull asse di versore u secondo la distanza del chi-quadro si ottiene moltiplicando il vettore per il fattore principale u D 1 s u le coordinate principali dei profili riga sono date dal prodotto dalla profili e il fattore principale ĉ = D 1 n }{{ F D 1 s }}{{ u } matrice profili riga fattore principale Spazio individui asse principale fattore principale v coordinata principale ĉ = D 1 s D 1 n v FT D 1 n v () Statistica 21 / 58
22 Autovalori La matrice Z identifica s punti nello spazio R n. Tuttavia ognuno dei p blocchi che compongono Z è caratterizzato da un autovalore banale, analogamente a quanto accade nel caso. Il numero di autovalori Il numero di autovalori non nulli è s 1 + (s 2 1) + (s 3 1) (s p 1) = s p + 1 Nell analisi centrata (baricentro Della nube traslato nell origine degli assi) il numero di autovalori non nulli s p Dunque, la percentuale di variabilità spiegata è data da λ α s p j=1 λα () Statistica 22 / 58
23 Autovalori La percentuale di variabilità spiegata λ α s p j=1 λα Rappresenta una misura pessimistica del potere esplicativo della sintesi ottenuta. motivo: la codifica disgiuntiva completa impone una sfericità artificiale della nube dei punti. correzione autovalori Benzècri per λ > 1 p ( ) λ p 2 ( = λ 1 ) 2 p 1 p () Statistica 23 / 58
24 Per ottenere una soluzione della MCA, in maniera del tutto analoga a quanto detto per la CA, E possibile analizzare la tabella dei residui. tabella delle contingenze La tabella delle frequenze relative (F) ottenuta a partire da Z maschio femmina Napoli provincia di Napoli altre province () Statistica 24 / 58
25 vettori dei marginali (totali) di riga x vettore dei marginali (totali) di colonna x maschio femmina Napoli provincia di Napoli altre province () Statistica 25 / 58
26 Per ottenere una soluzione della CA è possibile analizzare la tabella dei residui. centratura la centratura della matrice F si ottiene sottraendo a ciascun valore il prodotto dei marginali di riga e di colonna ad esso corrispondenti, formalmente f ij f i. f.j. Da un punto di vista algebrico questo corrisponde a F ns T = maschio femmina Napoli provincia di Napoli altre province () Statistica 26 / 58
27 Per ottenere una soluzione della MCA è possibile analizzare la tabella dei residui. standardizzazione dopo aver effettuato la centratura della matrice F si procede alla standardizzazione, formalmente f ij f i. f.j. Da un punto di vista algebrico questo corrisponde a fi. f.j S = D 1/2 n (F ns T )D 1/2 s = S = Dn 1/2 (F ns T )Ds 1/2 = maschio femmina Napoli provincia di Napoli altre province () Statistica 27 / 58
28 Ottenuta la tabella S dei residui, per ottenere la soluzione si effettua la decomposizione in valori singolari, (SVD) decomposizione in valori singolari SV D(S) = UD α V T dove U e l autovettore di sinistra e rappresenta lo spazio delle righe, V e l autovettore di destra e rappresenta lo spazio delle colonne, D α è la matrice diagonale dei valori singolari, che sono la radice quadrata degli autovalori. () Statistica 28 / 58
29 Ottenuta la tabella S dei residui, per ottenere la soluzione si effettua la decomposizione in valori singolari, (SVD) valori singolari vettori singolari D α= vettori singolari U V () Statistica 29 / 58
30 Calcolo delle coordinate dei profili riga e colonna coordinate delle righe standard coords = D 1/2 n U principal coords = D 1/2 n UD α coordinate delle colonne standard coords = D 1/2 s V principal coords = D 1/2 s VD α () Statistica 30 / 58
31 Autovalori () Statistica 31 / 58
32 analisi MCA Coordinate modalità () Statistica 32 / 58
33 analisi MCA Contributi modalità () Statistica 33 / 58
34 analisi MCA Qualità della rappresentazione delle modalità () Statistica 34 / 58
35 analisi MCA Rappresentazione delle modalità () Statistica 35 / 58
36 analisi MCA Rappresentazione delle modalità () Statistica 36 / 58
37 analisi MCA Rappresentazione delle modalità () Statistica 37 / 58
38 analisi MCA Rappresentazione delle modalità () Statistica 38 / 58
39 analisi MCA Rappresentazione delle modalità () Statistica 39 / 58
40 analisi MCA Rappresentazione delle modalità () Statistica 40 / 58
41 analisi MCA Rappresentazione delle modalità () Statistica 41 / 58
42 analisi MCA Rappresentazione delle modalità () Statistica 42 / 58
43 analisi MCA Rappresentazione delle modalità () Statistica 43 / 58
44 analisi MCA Rappresentazione delle modalità () Statistica 44 / 58
45 analisi MCA Rappresentazione delle modalità () Statistica 45 / 58
46 analisi MCA Rappresentazione delle modalità () Statistica 46 / 58
47 analisi MCA Rappresentazione delle modalità () Statistica 47 / 58
48 analisi MCA Rappresentazione delle modalità () Statistica 48 / 58
49 Altra applicazione Il data set è estratto dal sondaggio ISSP del 1993, si riferisce a rispondenti della Germania. Il numero di attributi considerati è p = 7, il numero di unità statistiche è n = 871. Ci sono quattro affermazioni rispetto alle quali si richiede agli intervistati di dare un giudizio. Ci sono inoltre tre attributi di tipo demografico come genere, età and titolo di studio. Le affermazioni A Crediamo troppo nella scienza e troppo poco in fede e sentimenti. B In generale, la scienza moderna comporta più problemi che vantaggi. C Ogni intervento dell uomo sulla natura non fa altro che peggiorare le cose. D La scienza ci aiuterà a risolvere i problemi ambientali determinando pochi cambiamenti nel nostro stile di vita. Modalità degli attributi A-D 1. condivido fortemente, 2. condivido abbastanza, 3. indifferente, 4. non condivido, 5. non condivido affatto. genere Due modalità. età Sei modalità. titolo di studio Sei modalità. () Statistica 49 / 58
50 analisi MCA Rappresentazione delle modalità () Statistica 50 / 58
51 analisi MCA Rappresentazione delle modalità () Statistica 51 / 58
52 analisi MCA Rappresentazione delle modalità () Statistica 52 / 58
53 analisi MCA Rappresentazione delle modalità () Statistica 53 / 58
54 analisi MCA Rappresentazione delle modalità () Statistica 54 / 58
55 analisi MCA Rappresentazione delle modalità () Statistica 55 / 58
56 analisi MCA Rappresentazione delle modalità () Statistica 56 / 58
57 analisi MCA Rappresentazione delle modalità () Statistica 57 / 58
58 analisi MCA Rappresentazione delle modalità () Statistica 58 / 58
Analisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
Analisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
Richiami di algebra delle matrici a valori reali
Richiami di algebra delle matrici a valori reali Vettore v n = v 1 v 2. v n Vettore trasposto v n = (v 1, v 2,..., v n ) v n = (v 1, v 2,..., v n ) A. Pollice - Statistica Multivariata Vettore nullo o
ANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani [email protected] http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI
Analisi in Componenti Principali (ACP)
Analisi in Componenti Principali (ACP) Metodi di analisi fattoriale Obiettivo: individuazione di variabili di sintesi = dimensioni = variabili latenti = variabili non osservate Approccio: Ordinamenti tra
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
Risposta in vibrazioni libere di un sistema lineare viscoso a più gradi di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1
Risposta in vibrazioni libere di un sistema lineare viscoso a più gradi di libertà Prof. Adolfo Santini - Dinamica delle Strutture 1 Vibrazioni libere non smorzate 1/6 Le equazioni del moto di un sistema
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
ANALISI MULTIDIMENSIONALE DEI DATI (AMD)
ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Analisi Multidimensionale dei Dati (AMD) è una famiglia di tecniche il cui obiettivo principale è la visualizzazione, la classificazione e l interpretazione della
La matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 26 Outline 1 2 3 4 () Statistica 2 / 26 Misura del legame Data una variabile doppia (X, Y ), la misura
Varianza totale e generalizzata Analisi Esplorativa
Varianza totale e generalizzata Analisi Esplorativa Aldo Solari 1 / 49 1 Varianza totale 2 Varianza generalizzata 3 Appendice 2 / 49 Variabilità Nel caso p = 1, la variabilità (o dispersione) presente
Capitolo 8 Forme quadratiche e loro applicazioni Esercizi svolti Tutorato di geometria e algebra lineare. Marco Robutti
Capitolo 8 Forme quadratiche e loro applicazioni Esercizi svolti Tutorato di geometria e algebra lineare Marco Robutti 5 Ottobre 2017 1 Introduzione Gli esercizi di questo capitolo riguardano i seguenti
Statistica. Alfonso Iodice D Enza
Statistica Il e Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 21 Outline Il e 1 2 3 Il 4 e 5 () Statistica 2 / 21 Il e Due distribuzioni aventi stessa posizione
Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 39 Outline 1 2 3 4 5 6 7 8 () Statistica 2 / 39 La distribuzione unitaria semplice di un carattere
Elementi di Algebra Lineare. Spazio Vettoriale (lineare)
Elementi di Algebra Lineare Spazio Vettoriale (lineare) Uno spazio vettoriale su un corpo F è una quadrupla (X, F, +, ) costituita da: un insieme di elementi X, detti vettori, un corpo F, i cui elementi
Anno 4 Matrice inversa
Anno 4 Matrice inversa 1 Introduzione In questa lezione parleremo della matrice inversa di una matrice quadrata: definizione metodo per individuarla Al termine della lezione sarai in grado di: descrivere
Caso di A non regolare
Caso di A non regolare December 2, 2 Una matrice A è regolare quando è quadrata e in corrispondenza di ogni autovalore di molteplicità algebrica m si ha una caduta di rango pari proprio a m Ovvero: rk
ALGEBRA LINEARE PARTE II
DIEM sez. Matematica Finanziaria Marina Resta Università degli studi di Genova Dicembre 005 Indice PREMESSA INVERSA DI UNA MATRICE DETERMINANTE. DETERMINANTE DI MATRICI ELEMENTARI................. MATRICI
Analisi della correlazione canonica
Capitolo 8 Analisi della correlazione canonica Si supponga che su un collettivo di unità statistiche si siano osservati due gruppi di k ed m variabili corrispondenti ad altrettanti aspetti di un fenomeno
ESAMI A.A ANDREA RATTO
ESAMI AA 2014-15 ANDREA RATTO Sommario In questo file presentiamo le prove d esame relative al Corso di Geometria e Algebra per Ingegneria Ambientale e Civile (aa2014-15) Si noti che, durante tutte le
Le matrici. Sia K un campo con elemento neutro dell addizione 0 ed elemento neutro della moltiplicazione 1.
Le matrici Sia K un campo con elemento neutro dell addizione 0 ed elemento neutro della moltiplicazione 1. Siano m, n N\{0}. Una matrice m n a coefficienti in K è una tabella di m n elementi di K disposti
( ) TEORIA DELLE MATRICI. A. Scimone a.s pag 1
. Scimone a.s 1997 98 pag 1 TEORI DELLE MTRICI Dato un campo K, definiamo matrice ad elementi in K di tipo (m, n) un insieme di numeri ordinati secondo righe e colonne in una tabella rettangolare del tipo
Diagonalizzabilità di endomorfismi
Capitolo 16 Diagonalizzabilità di endomorfismi 16.1 Introduzione Nei capitoli precedenti abbiamo definito gli endomorfismi su uno spazio vettoriale E. Abbiamo visto che, dato un endomorfismo η di E, se
ALGEBRA C. MALVENUTO
ALGEBRA CANALE A-L ESAME SECONDA PARTE SECONDO ESONERO 27 GENNAIO 22 C. MALVENUTO Istruzioni. Completare subito la parte inferiore di questa pagina con il proprio nome, cognome e firma. Scrivere solamente
Autovalori e autovettori, matrici simmetriche e forme quadratiche (cenni) (prof. M. Salvetti)
Autovalori e autovettori, matrici simmetriche e forme quadratiche (cenni) (prof. M. Salvetti) April 14, 2011 (alcune note non complete sugli argomenti trattati: eventuali completamenti saranno aggiunti)
Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara
Sistemi lineari Lorenzo Pareschi Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara http://utenti.unife.it/lorenzo.pareschi/ [email protected] Lorenzo Pareschi (Univ. Ferrara)
1 Il polinomio minimo.
Abstract Il polinomio minimo, così come il polinomio caratterisico, è un importante invariante per le matrici quadrate. La forma canonica di Jordan è un approssimazione della diagonalizzazione, e viene
TEORIA DEI SISTEMI ANALISI DEI SISTEMI LTI
TEORIA DEI SISTEMI Laurea Specialistica in Ingegneria Meccatronica Laurea Specialistica in Ingegneria Gestionale Indirizzo Gestione Industriale TEORIA DEI SISTEMI ANALISI DEI SISTEMI LTI Ing. Cristian
ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM)
ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM) Questa procedura è stata introdotta negli anni 70, ad opera della scuola francese di analisi dei dati (Benzecri). Inizialmente fu proposta per analizzare tabelle
Formulario sui Prodotti Hermitiani Marcello Mamino Pisa, 24 v 2010
Formulario sui Prodotti Hermitiani Marcello Mamino Pisa, 24 v 2010 In quetsa dispensa: V è uno spazio vettoriale di dimensione d sul campo complesso C generato dai vettori v 1,..., v d. Le variabili m,
Analisi bivariata. Il caso di caratteri qualitativi
Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano
Soluzione facsimile 1 d esame di geometria - Ingegneria gestionale - a.a ISTRUZIONI
Soluzione facsimile 1 d esame di geometria - Ingegneria gestionale - a.a. 003-004 COGNOME......................................... NOME......................................... N. MATRICOLA................
Statistica. Alfonso Iodice D Enza
Il e Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 19 Outline Il e 1 2 3 Il 4 e 5 () Statistica 2 / 19 Il e Due distribuzioni aventi stessa posizione
L analisi delle corrispondenze semplici (AC) e multiple (ACM)
L analisi delle corrispondenze semplici (AC) e multiple (ACM) La CA costituisce uno dei più noti ed efficaci strumenti per il trattamento multidimensionale di dati qualitativi Obiettivi: Rappresentazione
