Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012
|
|
- Felice Costantini
- 5 anni fa
- Visualizzazioni
Transcript
1 Analisi Multivariata Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 La Tabella 1 contiene la classificazione in base alla qualifica e all abitudine al fumo di 193 dirigenti e impiegati di una grande azienda americana (data set disponibile nel package CA di R, e salvalto in EXCEL nel file smoke.xls). Table 1: Data set smoking. Staff group Smoking class TOT none light medium heavy Senior managers SM Junior managers JM Senior employees SE Junior employees JE Secretaries SC TOTALE Costruire la matrice delle frequenze relative P. 2. Costruire la matrice dei profili riga R, il profilo medio di riga e le masse di riga r. Commentare il risultato ottenuto. 3. Le due variabili sono indipendenti? Motivare la risposta sulla base dell analisi della matrice dei profili riga. 4. Costruire la matrice dei profili colonna C, il profilo medio di colonna e le masse di colonna c. Commentare il risultato ottenuto. 5. Qual è la relazione tra le masse di riga e il profilo medio di colonna? 6. Quale ruolo svolgono le masse di riga nell analisi delle corrispondenze? 7. Scrivere l espressione della distanza chi-quadrato tra due generici profili riga e calcolare la distanza chi-quadrato tra i primi due profili riga. 8. Calcolare la distanza chi-quadrato tra ciascun profilo riga e il profilo medio di riga. Come possiamo interpretare queste distanze? 1
2 9. Calcolare il grado di associazione tra Staff group e Smoking class utilizzando un indice opportuno. 10. Costruire la matrice degli scarti standardizzati S. 11. Calcolare la varianza totale della matrice degli scarti standardizzati. 12. Che relazione c è tra la varianza totale di S e l indice χ 2? 13. Definire e calcolare l inerzia totale. Il valore ottenuto è alto o basso? Motivare la risposta. 14. Che relazione c è tra l inerzia totale e l indice χ 2? 15. Che relazione c è tra l inerzia totale e le distanze dei profili riga (o colonna) dal profilo medio? 16. Costruire le matrici diagonali delle masse di riga D r e delle masse di colonna D c. 17. Verificare che vale S = D 1/2 r (P rc )D 1/2 c = UΓV dove U sono gli autovettori di SS, V gli autovettori di S S e Γ è la matrice diagonale dei valori singolari. 18. Qual è la dimensione (righe e colonne) di Γ? Motivare la risposta. 19. Che relazione c è tra gli elementi di Γ e gli autovalori di SS? 20. Calcolare le coordinate di riga F e di colonna G secondo i primi due assi principali F = D 1/2 r UΓ, G = D 1/2 c VΓ 21. Qual è la varianza di ciascun asse principale? 22. Scrivere la relazione che lega le coordinate di riga e di colonna (formule di transizione). Come possiamo interpretare questa relazione? 23. Valutare la bontà della rappresentazione con m = 2 assi principali in termini di inerzia totale spiegata, contributi e coseni al quadrato. 24. Rappresentare i profili riga e i profili colonna in un biplot in base ai primi due assi principali e commentare. 2
3 Soluzione I calcoli per ottenere i risultati riportati di seguito sono stati ottenuti con SAS (si veda smoke.sas). Fino al punto QQ, i calcoli possono essere effettuati anche con una calcolatrice da tasca o con un foglio elettronico (si veda smoke.xls). 1. La matrice P delle frequenze relative si otttiene dividendo le frequenze n ij, i = 1,..., 5, j = 1,..., 4, per il totale N = 5 4 i=1 j=1 n ij = 193. Nell ultima riga della matrice P sono riportate le frequenze marginali relative per abitudine al fumo f.j, cioè le masse di colonna, mentre nell ultima colonna sono riportate le frequenze relative marginali per qualifica f i. cioè le masse di riga. Table 2: Matrice P delle frequenze relative none light medium heavy TOT (r) SM JM SE JE SC TOT (c) La matrice dei profili riga R si ottiene dividendo le frequenze della matrice P per i totali di riga f i. = 4 j=1 n ij/n = 4 j=1 f ij. Gli elementi di R sono dunque le frequenze relative condizionate f j i = f ij /f i. = n ij /n i.. Il profilo medio di riga, è riportato nell ultima riga della matrice dei profili riga, e coincide con le frequenze marginali di colonna (ultima riga matrice P). Infine, le masse di riga r, che coincidono con le frequenze marginali relative di riga, sono riportate nell ultima colonna della matrice P. Si osservi che la somma degli elementi f j i = f ij /f i. di ogni profilo riga soddisfa il vincolo di somma unitaria, cioè vale c j=1 f j i = 1. 3
4 Table 3: Matrice dei profili riga R none light medium heavy SM JM SE JE SC profilo medio (c) Il profilo più frequente è quello relativo ai Junior Employees, mentre none e medium sono le due modalità di abitudine al fumo più frequenti. 3. Le due variabili NON sono indipendenti: infatti i profili riga sono diversi tra loro e diversi dal profilo medio. 4. La matrice dei profili colonna C si ottiene dividendo le frequenze della matrice P per i totali di colonna f.j = r i=1 f ij. Gli elementi di C sono dunque le frequenze relative condizionate f i j = f ij /f.j = n ij /n.j. Table 4: Matrice C dei profili colonna none light medium heavy profilo medio SM JM SE JE SC Nell ultima colonna è riporato il profilo medio di colonna, mentre le masse di colonna c sono riporate nell ultima riga della matrice P. Si osservi che la somma degli elementi di ogni profilo colonna soddisfa il vincolo di somma unitaria: r i=1 f j i = Le masse di riga coincidono con il profilo medio di colonna. 4
5 6. Le masse di riga sono utilizzate nell analisi delle corrispondenze per assegnare un peso ai diversi profili di riga: i profili con una massa maggiore hanno un ruolo più rilevante nell amalisi. 7. La distanza chi-quadrato tra due generici profili riga i e i è definita dalla distanza euclidea standardizzata 1, nella quale i valori del profilo medio servono per la standardizzazione, in quanto le frequenze con valore medio più elevato tendono ad avere una variabilità maggiore. d(i, i ) = 4 (f i j f i j) 2 (1) f.j j=1 La distanza chi-quadrato tra i primi due profili riga è pari a d(i, i ) = , ottenuta come d(i, i ( ) ) = 2 + ( )2 + ( )2 + ( ) Per calcolare la distanza chi-quadrato tra ciascun profilo riga i, e il profilo medio di riga i, dobbiamo considerare d(i, i) = 4 (f i j f j ) 2 j=1 Le distanze ottenute sono le seguenti f.j prof ilo d(i, i) SM 0.22 JM 0.36 SE 0.38 JE 0.24 SC 0.22 Queste distanze valgono 0 quando il profilo riga considerato è uguale al profilo medio. Se tutte le distanze dal profilo medio sono zero le due variabili sono indipendenti. In generale, queste distanze possono essere interpretate come scostamento al quadrato dal profilo medio e quindi la loro media (ponderata per le masse di riga) rappresenta una misura di variabilità presente nella tabella e coincide con l inerzia. 5
6 9. Per calcolare il grado di associazione tra Staff group e Smoking class possiamo utilizzare l indice chi-quadrato e l indice di contingenza Φ 2, che si ottiene dividendo l indice chi-quadrato per N. Entrambi gli indici sono pari a zero quando le due variabili sono indipendenti. Il valore massimo dell indice di contingenza è pari a min[(i 1), (J 1)], e quindi pari a 3 nel nostro caso. χ 2 = , Φ 2 = χ 2 /N = La matrice S si ottiene calcolando gli scarti standardizzati:. s ij = f ij f i. f.j fi. f.j Table 5: Matrice S degli scarti standardizzati none light medium heavy SM JM SE JE SC La varianza totale di S è la traccia della matrice S S, e coincide con somma degli scarti standardizzati elevati al quadrato: V ART OT (S) = tr(s S) = i s 2 ij = j 12. La varianza totale di S coincide con l indice Φ 2, si ha pertanto V ART OT (S) = χ 2 /N 13. L inerzia totale è la somma degli autovalori della martice S S. L inerzia è zero in caso di indipendenza, mentre il valore massimo che può assumere è pari a 3 (min[(r 1), (c 1)]). Il valore ottenuto in questo caso è 0.085, non molto alto. 6
7 14. L inerzia totale è pari a Φ 2 quindi inerzia = χ 2 /N. 15. L inerzia totale si può ottenere come media ponderata - con pesi pari alla massa di riga - delle distanze chi-quadrato dei profili riga dal profilo medio (o come media ponderata con pesi pari alle masse di colonna dei profili colonna dal profilo medio di colonna). In simboli inerzia = r f i. d 2 (i, i) = i=1 r f i. i=1 j=1 c (f i j f.j ) 2 f.j 16. Le matrici diagonali delle masse di riga D r e delle masse di colonna D c contengono lungo la diagonale principale gli elementi delle masse di riga e di colonna rispettivamente. Table 6: Matrice masse colonna D c Table 7: Matrice masse riga D r Calcoliamo U, gli autovettori di SS, V gli autovettori di S S e Γ, la matrice diagonale dei valori singolari utilizzando SAS (o R o Stata) e verifichiamo che vale S = D 1/2 r (P rc )D 1/2 c = UΓV 7
8 Ricordiamo λ k = γ 2 k, k = 1, 2, 3 (rango di SS è 3), quindi gli ultimi due autovalori di SS (e di S S) sono nulli, pertanto consideriamo solo i primi tre autovettori sia di U che di V. Table 8: Matrice valori singolari Γ Table 9: Matrice autovettori U Table 10: Matrice autovettori V Γ è una matrice diagonale, la cui dimensione è pari al min[(r 1), (c 1)], quindi nel nostro caso Γ è una matrice Gli autovalori di SS sono uguali al quadrato dei valori singolari di Γ: λ k = γ k, k = 1,..., Le coordinate di riga F e di colonna G secondo i primi due assi principali sono: F = D 1/2 r UΓ, G = D 1/2 c VΓ 8
9 Table 11: Analisi dei profili riga Coordinate Contributi parziali Coseni quadrati Qualità Dim1 Dim2 Dim1 Dim2 Dim1 Dim2 SM JM SE JE SC Table 12: Analisi dei profili colonna Coordinate Contributi parziali Coseni quadrati Qualità Dim1 Dim2 Dim1 Dim2 Dim1 Dim2 none light medium heavy Ciascun asse principale ha varianza pari al quadrato del corrispondente valore singolare, nel nostro esempio: V ar(y (r) 1 ) = V ar(y (c) 1 ) = λ 1 = γ1 2 = e V ar(y (r) 2 ) = V ar(y (c) 2 ) = λ 2 = γ2 2 = Le coordinate di riga possono essere ottenute dalle coordinate di colonna e viceversa attraverso le seguenti formule di transizione: F = RGΓ 1 G = CFΓ 1 Quindi, le coordinate dei punti colonna sono delle medie ponderate dei punti riga (e viceversa). Per esempio, y (c) 1 = (1/γ 1 )Cy (r) 1. Le formule di transizione si interpretano dicendo che, a meno del fattore moltiplicativo 1/γ k, la coordinata di una modalità j di un carattere è 9
10 la media ponderata delle coordinate delle modalità dell altro carattere con pesi uguali alle frequenze relative condizionate di j. Poichè i punteggi di riga e di colonna hanno la stessa varianza, possono essere rappresentati nel biplot. Le formule di transizione possono essere utilizzate per interpretare le distanze tra i punti riga (o tra i punti colonna) (si veda libro di testo alle pagine ). 23. Bontà della rappresentazione con m = 2 assi principali. L inerzia totale spiegata è molto alta e pari al 99.51%. Si ha infatti (γ1 2 + γ2)/ 2 3 k=1 γ2 k ) = ( )/ = I coseni al quadrato individuano gli assi principali importanti per un dato profilo (riga o colonna) e variano tra 0 e 1, la loro formula è cos 2 (j, y (c) h ) = cos 2 (i, y (r) h ) = ( y (c) jh ) 2 K k=1 (y (c) jk ( y (r) ih ) 2 K k=1 (y (r) ik ) 2 = ) 2 = ( y (c) jh ) 2 d 2 (j, j) ( y (c) jh ) 2 d 2 (i, i) dove d 2 (j, j) = r i=1 (1/f i.)(fi j f i. ) 2 è la distanza tra il profilo colonna j e il profilo colonna medio (che coincide con il vettore delle masse di riga r), d 2 (i, i) = c j=1 (1/f.j)(fj i f.j ) 2 è la distanza tra il profilo riga i e il profilo riga medio (che coincide con il vettore delle masse di colonna c). Se cos 2 (c j, y (c) h ) 1 l asse h è importante per il profilo j. La qualità della rappresentazione di ciascun profilo nello spazio ridotto m = 2 è quindi tanto migliore quanto più la somma dei coseni al quadrato per quel profilo è vicina a 1 (ricordare che per m = K, dove K è il rango di S la qualità è perfetta, e la somma dei coseni al quadrato è pari a 1). Analogo discorso vale per i coseni riferiti ai profili riga. Con riferimento all analisi dei profili riga, dalla Tabella 11 vediamo che risultano ben rappresentati tutti i profili (la qualità, che si ottiene sommando per riga i coseni al quadrato, è vicina a uno per tutti), 10
11 con impiegati (JE e SE) e segretari (SC) meglio rappresentati lungo la prima dimensione e i manger lungo la seconda. I contributi aiutano ad individuare i profili importanti nella determinazione dell asse, la loro formula è riportata a pag. 285 del testo di Zani e Cerioli. In generale, un contributo è ritenuto importante se il suo valore è maggiore di 1/r per le righe, o maggiore di 1/c per le colonne. Nel nostro caso, con riferimento all analisi dei profili riga, un contributo è rilevante se > 1/5 = 0.2, quindi dalla Tabella 11 vediamo che la prima dimensione è determinata principalmente dai profili degli impiegati (JE e SE), mentre la seconda è determinata soprattutto dai profili dei manager (JM e SM). Figure 1: Biplot 24. La Figura 1 rappresenta i punti riga e i punti colonna in base alle coordinate dei primi due assi principali. Osserviamo che il personale di 11
12 segreteria (SE) si trova a sinistra rispetto al primo asse, perchè presenta una proporzione più elevata della media di non fumatori, mentre gli impiegati e i manager junior (JE e JM) si trovano all estremo destro, perchè presentano una proorzione più elevata della media di fumatori (livelli medium e heavy), con i manager junior che tendono maggiormente a fumare molto. Dettagli esempi testo di Zani e Cerioli Le coordinate di riga F e di colonna G secondo i primi due assi principali sono: F = D 1/2 r UΓ, G = D 1/2 c VΓ Consideriamo i vettori che definiscono le coordinate di riga F = [y (r) 1,..., y (r) K ] (analogo discorso vale le colonne). Il vettore relativo alla h-ma dimensione è dunque y (r) h = D 1/2 r u h γ h (2) dove u h è l h-ma colonna di U. Negli esempi del testo di Zani e Cerioli sono riportati i valori delle coordinate standardizzate 1 : ỹ (r) h = D 1/2 r u h γh (3) E possibile risalire dai valori delle coordinate standardizzate (3) che compaiono nelle tabelle pubblicate sul libro ai valori delle coordinate (2) applicando la seguente trasformazione: y (r) ih = γ h ỹ (r) ih γh Questa trasformazione è utile, per esempio, per ottenere i coseni al quadrato che appaiono nelle tabelle del libro, per il calcolo a mano dei quali è necessario utilizzare i valori delle coordinate (2). 1 Si tratta di un particolare tipo di standardizzazione utile in certi casi, per dettagli si veda van der Heijden, P. G. M. e de Leeuw, J. (1985), Correspondence Analysis Used Complementary to Loglinear Analysis, Psychometrika, 50,
Analisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI
DettagliAnalisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
DettagliSDE Marco Riani
SDE 018 Marco Riani mriani@uniprit http://wwwrianiit ANALISI DELLE CORRISPONDENZE Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI per una matrice di dati quantitativi L
DettagliAnalisi Multivariata Prova intermedia del 20 aprile 2011
Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.
DettagliRappresentazione dei dati multivariati
Rappresentazione dei dati multivariati Quando si hanno più di due varabili la posizione di ciascuna unità rispetto alle altre può essere rappresentata nel diagramma relativo alle prime due CP l importanza
DettagliLa dipendenza. Antonello Maruotti
La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno
Dettagli= elemento che compare nella seconda riga e quinta colonna = -4 In generale una matrice A di m righe e n colonne si denota con
Definizione di matrice Una matrice (di numeri reali) è una tabella di m x n numeri disposti su m righe e n colonne. I numeri che compaiono nella tabella si dicono elementi della matrice. La loro individuazione
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliCorso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
DettagliAnalisi congiunta di più fenomeni
Analisi congiunta di più fenomeni Dati relativi al disastro del Titanic: Morti Sopravvissuti Classe Sesso Età 1 a Uomini Bambini 0 5 Adulti 118 57 Donne Bambini 0 1 Adulti 4 140 2 a Uomini Bambini 0 11
DettagliL analisi dell associazione o connessione tra due caratteri statistici
L analisi dell associazione o connessione tra due caratteri statistici Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università
DettagliAlfonso Iodice D Enza
Strumenti quantitativi per l economia e la finanza I Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale () Statistica 1 / 58 Outline 1 2 3 4 5 () Statistica
Dettagli3. Vettori, Spazi Vettoriali e Matrici
3. Vettori, Spazi Vettoriali e Matrici Vettori e Spazi Vettoriali Operazioni tra vettori Basi Trasformazioni ed Operatori Operazioni tra Matrici Autovalori ed autovettori Forme quadratiche, quadriche e
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliESAME DI GEOMETRIA E ALGEBRA INGEGNERIA INFORMATICA (PROF. ACCASCINA) PROVA SCRITTA DEL 4 LUGLIO 2000 Tempo assegnato: 2 ore e 30 minuti
ESAME DI GEOMETRIA E ALGEBRA INGEGNERIA INFORMATICA (PROF ACCASCINA) PROVA SCRITTA DEL 4 LUGLIO 000 Tempo assegnato: ore e 30 minuti PRIMO ESERCIZIO [7 punti] 1 Dimostrare che, per ogni naturale n, ciascuna
Dettagli3. Vettori, Spazi Vettoriali e Matrici
3. Vettori, Spazi Vettoriali e Matrici Vettori e Spazi Vettoriali Operazioni tra vettori Basi Trasformazioni ed Operatori Operazioni tra Matrici Autovalori ed autovettori Forme quadratiche, quadriche e
DettagliESERCIZI STATISTICA DESCRITTIVA
ESERCIZI STATISTICA DESCRITTIVA Frequenze assolute e relative Titolo di studio Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliArgomento 12 Matrici
Argomento 2 Matrici 2 Vettori di R n eoperazioni I Vettore di R n : x =(x i ) i=n =(x i ) n i=,conx i R componenti di x I R n = spazio dei vettori reali a n componenti = spazio vettoriale reale n-dimensionale
DettagliComputazione per l interazione naturale: fondamenti probabilistici (2)
Computazione per l interazione naturale: fondamenti probabilistici (2) Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@di.unimi.it
DettagliSTATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA
STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di
DettagliDistribuzioni secondo due caratteri. Rappresentazioni e prime sintesi
Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni
DettagliSistemi II. Sistemi II. Elisabetta Colombo
Corso di Approfondimenti di Matematica per Biotecnologie, Anno Accademico 2011-2012, http://users.mat.unimi.it/users/colombo/programmabio.html 1 2 3 con R.C.+ o 1.10 Rango massimo e determinante con R.C.+
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliProva finale del 6 giugno 2011
Prova finale del 6 giugno 2011 Esercizio A, da svolgere con carta e penna Si consideri la seguente matrice dei dati relativa a 3 unità statistiche e 3 variabili, X 1 e X 2 quantitative, X 3 dicotomica.
DettagliStatistica (parte II) Esercitazione 4
Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliSPAZI EUCLIDEI, APPLICAZIONI SIMMETRICHE, FORME QUADRATICHE
SPAZI EUCLIDEI, APPLICAZIONI SIMMETRICHE, FORME QUADRATICHE. Esercizi Esercizio. In R calcolare il modulo dei vettori,, ),,, ) ed il loro angolo. Esercizio. Calcolare una base ortonormale del sottospazio
DettagliSequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:
Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza
DettagliAnalisi della correlazione canonica
Analisi della correlazione canonica Su un collettivo di unità statistiche si osservano due gruppi di k ed m variabili L analisi della correlazione canonica ha per obiettivo lo studio delle relazioni di
DettagliAnalisi delle componenti principali
Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste
DettagliStatistica Sociale - modulo A
Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it in Excel in Excel e un evento (soggetto, entita, accadimento, caratteristica) osservato e registrato che si differenzia dall evento stesso,
DettagliANALISI MULTIDIMENSIONALE DEI DATI (AMD)
ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Analisi Multidimensionale dei Dati (AMD) è una famiglia di tecniche il cui obiettivo principale è la visualizzazione, la classificazione e l interpretazione della
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliStatistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.
DettagliCOGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008.
COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. ESERCIZIO I Si è applicata l analisi delle componenti principali a 97 modelli di fotocamere digitali, considerando 7 variabili ed ottenendo
DettagliSequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:
Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliAnalisi Multivariata Prova finale del 3 giugno 2010
Analisi Multivariata Prova finale del 3 giugno 2010 Esercizi da svolgere con carta e penna Esercizio A A1 Descrivere brevemente qual è l obiettivo principale dell analisi fattoriale. A2 Scrivere il modello
DettagliAnalisi statistica e matematico-finanziaria II. Alfonso Iodice D Enza Università degli studi di Cassino e del Lazio Meridionale
delle sui delle Analisi statistica e matematico-finanziaria II Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale sulle particolari ali dei dati Outline
DettagliCorso di Geometria Ing. Informatica e Automatica Test 1: soluzioni
Corso di Geometria Ing. Informatica e Automatica Test : soluzioni k Esercizio Data la matrice A = k dipendente dal parametro k, si consideri il k sistema lineare omogeneo AX =, con X = x x. Determinare
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliAnalisi della correlazione canonica
Capitolo 8 Analisi della correlazione canonica Si supponga che su un collettivo di unità statistiche si siano osservati due gruppi di k ed m variabili corrispondenti ad altrettanti aspetti di un fenomeno
DettagliSTATISTICA 1 ESERCITAZIONE 6
STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere
DettagliEsercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
DettagliLa matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
DettagliDispense Associazione PRELIMINARY DRAFT
Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di
DettagliSoluzione: La matrice M cercata è quella formata dagli autovettori di A. Il polinomio caratteristico di A è: p t (A) = (t 1)(t 3) 0 4 V 1 = Ker
Compito di Algebra Lineare - Ingegneria Biomedica 4 luglio 7 IMPORTANTE: Non si possono consultare libri e appunti. Non si possono usare calcolatrici, computer o altri dispositivi elettronici. Non si può
DettagliRisposta in vibrazioni libere di un sistema lineare viscoso a più gradi di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1
Risposta in vibrazioni libere di un sistema lineare viscoso a più gradi di libertà Prof. Adolfo Santini - Dinamica delle Strutture 1 Vibrazioni libere non smorzate 1/6 Le equazioni del moto di un sistema
DettagliDeterminante. Elisabetta Colombo. Determinante. Corso di Approfondimenti di Matematica per Biotecnologie, Anno Accademico ,
Corso di Approfondimenti di Matematica per Biotecnologie, Anno Accademico 2011-2012, 1 n=2 2 3 con le 4 n=2 n=2 con le Ad ogni matrice quadrata A = (a ij ) j=1...n i=1...n di ordine n si può associare
DettagliLeLing12: Ancora sui determinanti.
LeLing2: Ancora sui determinanti. Ārgomenti svolti: Sviluppi di Laplace. Prodotto vettoriale e generalizzazioni. Rango e determinante: i minori. Il polinomio caratteristico. Ēsercizi consigliati: Geoling
DettagliAnalisi dei dati corso integrato - Algebra lineare, e a b c 0. le soluzioni del sistema lineare omogeneo x d e f 2. a b c.
Analisi dei dati corso integrato - Algebra lineare 4.3.8 e 5.3.8-1 1. Nella lezione precedente abbiamo definito lo spazio nullo e lo spazio delle colonne di una matrice; ora definiamo lo spazio delle righe
Dettaglimisura. Adesso, ad un arbitrario punto P dello spazio associamo una terna di numeri reali x
4. Geometria di R 3. Questo paragrafo è molto simile al paragrafo : tratta infatti delle proprietà geometriche elementari dello spazio R 3. Per assegnare delle coordinate nello spazio, fissiamo innanzitutto
Dettaglimisura. Adesso, ad un arbitrario punto P dello spazio associamo una terna di numeri reali x
4. Geometria di R 3. Questo paragrafo è molto simile al paragrafo : tratta infatti delle proprietà geometriche elementari dello spazio R 3. Per assegnare delle coordinate nello spazio, fissiamo innanzitutto
DettagliMatrici delle differenze finite
Capitolo 8 Matrici delle differenze finite Si riportano in questo capitolo alcuni risultati e proprietà delle matrici delle differenze finite ovvero delle matrici che intervengono nel metodo delle differenze
DettagliAlgebra lineare con R
Università di Napoli Federico II cristina.tortora@unina.it Standardizzare una variabile Standardizzazione Data una variabile X distribuita secondo una media µ e una varianza σ 2 la standardizzazione permette
DettagliAnalisi dei dati per la comunicazione
Analisi dei dati per la comunicazione La costruzione e l uso di misure relative semplici e complesse Prof.ssa Isabella Mingo A.A. 2014-2015 La costruzione di indici complessi: fasi In definitiva, la costruzione
DettagliAnno 4 Matrice inversa
Anno 4 Matrice inversa 1 Introduzione In questa lezione parleremo della matrice inversa di una matrice quadrata: definizione metodo per individuarla Al termine della lezione sarai in grado di: descrivere
DettagliTEORIA DEI SISTEMI ANALISI DEI SISTEMI LTI
TEORIA DEI SISTEMI Laurea Specialistica in Ingegneria Meccatronica Laurea Specialistica in Ingegneria Gestionale Indirizzo Gestione Industriale TEORIA DEI SISTEMI ANALISI DEI SISTEMI LTI Ing. Cristian
DettagliI. Foglio di esercizi su vettori linearmente dipendenti e linearmente indipendenti. , v 2 = α v 1 + β v 2 + γ v 3. α v 1 + β v 2 + γ v 3 = 0. + γ.
ESERCIZI SVOLTI DI ALGEBRA LINEARE (Sono svolti alcune degli esercizi proposti nei fogli di esercizi su vettori linearmente dipendenti e vettori linearmente indipendenti e su sistemi lineari ) I. Foglio
DettagliVettori e Matrici. Corso di Calcolo Numerico. 24 Aprile 2018
Vettori e Matrici 24 Aprile 2018 Richiami In MATLAB, ogni variabile ha una struttura di tipo vettoriale o array. Un array è un insieme di valori ordinati, cioè memorizza più dati all interno di una struttura
DettagliCorso di Laurea in Scienza dei Materiali PROVA SCRITTA DI GEOMETRIA DEL 27/09/2016 SOLUZIONE DEGLI ESERCIZI PROPOSTI
Corso di Laurea in Scienza dei Materiali PROVA SCRITTA DI GEOMETRIA DEL 7/9/6 SOLUZIONE DEGLI ESERCIZI PROPOSTI Esercizio. Si consideri la quadrica affine C d equazione cartesiana xy + yz z + 4x =. ()
Dettagli1. Si scriva una function Matlab che implementa il seguente metodo di punto fisso
Domanda 1 1. Si scriva una function Matlab che implementa il seguente metodo di punto fisso x n+1 = x n f(x n), n = 0, 1, 2,... K dove x 0 è il punto iniziale, f(x) = x 3 cos(x) e K è una costante assegnata.
DettagliFonti e strumenti statistici per la comunicazione
Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
Dettagli1 Esercizi di ripasso 4
Esercizi di ripasso 4. Determinare k in modo che il piano kx + 2y 6z + = 0 sia parallelo al piano x + y z + = 0. Soluzione. La condizione di parallelismo richiede che ( ) k 2 6 rg = Ne segue che k = e
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di forma, distribuzioni doppie di frequenza e studio del legame tra variabili Il seguente data set
DettagliMatrici. Prof. Walter Pugliese
Matrici Prof. Walter Pugliese Le matrici Una matrice è un insieme di numeri reali organizzati in righe e colonne. Se n è il numero delle righe e m e il numero delle colonne si dice che la matrice è di
DettagliEsercitazione 6 - Soluzione
Anno Accademico 28-29 Corso di Algebra Lineare e Calcolo Numerico per Ingegneria Meccanica Esercitazione 6 - Soluzione Immagine, nucleo. Teorema di Rouché-Capelli. Esercizio Sia L : R 3 R 3 l applicazione
DettagliA m n B n p = P m p. 0 1 a b c d. a b. 0 a 0 c Il risultato e lo stesso solo nel caso in cui c = 0 e a = d.
Matematica II, 220404 Il prodotto di matrici e un operazione parziale che prende in entrata una matrice A ed una matrice B, tali che il numero delle colonne di A sia uguale al numero delle righe di B,
DettagliESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.
ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks
Dettagli20 gennaio Soluzione esame di geometria - 12 crediti Ingegneria gestionale - a.a COGNOME... NOME... N. MATRICOLA...
0 gennaio 010 - Soluzione esame di geometria - 1 crediti Ingegneria gestionale - a.a. 009-010 COGNOME.......................... NOME.......................... N. MATRICOLA............. La prova dura ore.
DettagliAnalisi in Componenti Principali (ACP)
Analisi in Componenti Principali (ACP) Metodi di analisi fattoriale Obiettivo: individuazione di variabili di sintesi = dimensioni = variabili latenti = variabili non osservate Approccio: Ordinamenti tra
DettagliProdotto scalare e prodotto vettoriale. Elisabetta Colombo
Corso di Approfondimenti di Matematica Biotecnologie, Anno Accademico 2010-2011, http://users.mat.unimi.it/users/colombo/programmabio.html Vettori Vettori 1 2 3 4 di di Ricordiamo il in R n Dati a = (a
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 19 Analisi dell associazione
Dettaglimisura. Adesso, ad un arbitrario punto P dello spazio associamo una terna di numeri reali x
4. Geometria di R 3. Questo paragrafo è molto simile al paragrafo : tratta infatti delle proprietà geometriche elementari dello spazio R 3. Per assegnare delle coordinate nello spazio, fissiamo innanzitutto
DettagliCorso di Geometria BIAR, BSIR Esercizi 3: soluzioni
Corso di Geometria - BIAR, BSIR Esercizi : soluzioni Rango e teorema di Rouché-Capelli Esercizio. Calcolare il rango di ciascuna delle seguenti matrici: ( ) ( ) ( ) A =, A =, A =, A 4 = ( ). a a a Soluzione.
Dettaglix n i sima pos. x, y = x T y = x i y i R. i=1
1 Elementi di Algebra Lineare In questo capitolo introduttivo al corso di Calcolo Numerico per la laurea triennale in Informatica, saranno presentate una serie di definizioni e proprietà di matrici e dei
Dettagli6 dicembre Soluzione esame di geometria - Ing. gestionale - a.a COGNOME... NOME... N. MATRICOLA... ISTRUZIONI
COGNOME.......................... NOME.......................... N. MATRICOLA............. La prova dura ore. ISTRUZIONI Ti sono stati consegnati tre fogli, stampati fronte e retro. Come prima cosa scrivi
DettagliUn quaternione è un numero complesso con quattro componenti anziché due. Si scrive così :
Un quaternione è un numero complesso con quattro componenti anziché due. Si scrive così : Q = q r + q i i + q j j + q k k ove le quantità q sono numeri reali e i, j e k sono tre unità immaginarie. Quando
DettagliUniversità degli Studi di Bergamo Matematica II (5 e 7,5 crediti) 5 luglio 2013 Tema A
Università degli Studi di Bergamo Matematica II (5 e 7,5 crediti) 5 luglio 2013 Tema A Tempo a disposizione: 1 ora e mezza. Calcolatrici, libri e appunti non sono ammessi. Ogni esercizio va iniziato all
DettagliDistribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03
Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03 ESERCIZIO 1 Tra le famiglie del Comune di Vigata sono stati rilevati congiuntamente la PROFESSIONE DEL CA- POFAMIGLIA () e l AMMONTARE
DettagliA titolo di esempio proponiamo la risoluzione del sistema sia con il metodo della matrice inversa sia con il metodo di Cramer.
) Trovare le soluzioni del seguente sistema lineare: x+ y+ z = 3x y + z = 0 x + 5y 4z = 5 Osserviamo in primo luogo che il sistema dato è un sistema quadrato di tre equazioni in tre incognite, precisamente
DettagliEsercitazioni del corso: STATISTICA
A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ
DettagliANALISI STATISTICHE BIVARIATE. Tabelle di contingenza
ANALISI STATISTICHE BIVARIATE Tabelle di contingenza 1 Analisi Statistica Bivariata Generalmente, lo studio quantitativo di un fenomeno di interesse si svolge rilevando contemporaneamente più caratteri
DettagliApplicazioni lineari tra spazi euclidei. Cambi di base.
pplicazioni lineari tra spazi euclidei. Cambi di base. Esercizio. Data la seguente applicazione lineare f : R R : f(x, y, z) = (x z, x + y, y + z), scrivere la matrice B, rappresentativa di f rispetto
DettagliStatistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 6 home - indice In base agli arrotondamenti effettuati nei calcoli,
DettagliDistribuzione normale multidimensionale
Capitolo 2 Distribuzione normale multidimensionale La funzione di densità normale undimensionale ha la forma seguente Anderson, 1984 fx ce 1 2 Ax b2 ce 1 2 x bax b La costante di normalizzazione c è data
DettagliGeometria e Topologia I (U1-4) 2006-mag-10 61
Geometria e Topologia I (U1-4) 2006-mag-10 61 (15.9) Teorema. Consideriamo il piano affine. Se A A 2 (K) è un punto e r una retta che non passa per A, allora esiste unica la retta per A che non interseca
DettagliDipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini
Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2017/2018 Distribuzione condizionata Un grafico a mosaico è una rappresentazione
Dettagli1 L analisi delle corrispondenze
L analisi delle corrispondenze L analisi delle corrispondenze si effettua su un campione di osservazioni su due variabili qualitative V e V 2 I dati quindi sono il numero di osservazioni tali che V = i
DettagliUNIVERSITÀ DEGLI STUDI DI TERAMO FACOLTÀ DI SCIENZE POLITICHE CORSO DI LAUREA IN ECONOMIA BANCARIA FINANZIARIA ED ASSICURATIVA
UNIVERSITÀ DEGLI STUDI DI TERAMO FACOLTÀ DI SCIENZE POLITICHE CORSO DI LAUREA IN ECONOMIA BANCARIA FINANZIARIA ED ASSICURATIVA II Parziale - Compito C 3/5/25 A. A. 24 25 ) Risolvere il seguente sistema
DettagliSistemi sovradeterminati
Sistemi sovradeterminati Sia A una matrice m n ove m > n sia b R m trovare una soluzione del sistema sovradeterminato Ax = b significa cercare di esprimere un vettore di R m come combinazione lineare di
DettagliFormulario sui Prodotti Hermitiani Marcello Mamino Pisa, 24 v 2010
Formulario sui Prodotti Hermitiani Marcello Mamino Pisa, 24 v 2010 In quetsa dispensa: V è uno spazio vettoriale di dimensione d sul campo complesso C generato dai vettori v 1,..., v d. Le variabili m,
Dettagli, è Det(A) = a 11 a 22 a 12 a 21. ( il determinante della matrice che si ottiene da A. la 1 a riga e la 2 a colonna di A
G Parmeggiani, 2/12/2013 Algebra Lineare 1 A, corso di laurea SGI, aa 2013/2014 Nota 4: Calcolo di determinanti Sia A una matrice quadrata di ordine n Il determinante di A è un numero che dipende da A
DettagliVETTORI E MATRICI. Ing. Nicola Cappuccio 2014 U.F.5 ELEMENTI SCIENTIFICI ED ELETTRONICI APPLICATI AI SISTEMI DI TELECOMUNICAZIONI
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 I VETTRORI E MATRICI (RICHIAMI) Ad ogni matrice quadrata a coefficienti reali è possibile associare un numero reale, detto determinante, calcolato
DettagliRichiami di Algebra Lineare
Appendice A Richiami di Algebra Lineare In questo capitolo sono presentati alcuni concetti di algebra lineare L algebra lineare è quella branca della matematica che si occupa dello studio di vettori, spazi
DettagliIstituzioni di Statistica 1 Esercizi su tabelle di contingenza
Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Esercizio 1 Per stimare la percentuale di fumatori nella popolazione italiana adulta viene intervistato un campione di 60 donne e uno di 40
Dettagli