SDE Marco Riani
|
|
- Flavio Bonelli
- 5 anni fa
- Visualizzazioni
Transcript
1 SDE 018 Marco Riani
2 ANALISI DELLE CORRISPONDENZE Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI per una matrice di dati quantitativi L ANALISI DELLE CORRISPONDENZE per una tabella di contingenza
3 RIEPILOGO DELLE CP Matrice nxp, con variabili tutte quantitative OBIETTIVO: Date p variabili (correlate) si vogliono ottenere k (k<<p) indicatori di sintesi (le CP) ortogonali (non correlati) VALIDITA DEL MODELLO: la quota (percentuale) di varianza totale spiegata deve essere elevata (>095 p soglia minima di accettabilità)
4 RAPPRESENTAZIONE CONGIUNTA DI VARIABILI E UNITA : IL BIPLOT Nel caso di CP estratte: Rappresentazione nel piano cartesiano dei p vettori (recce) corrispondenti alle variabili Rappresentazione nel piano cartesiano degli n punti corrispondenti ai punteggi (scores) delle unità
5 SCOPI DELL ANALISI DELLE CORRISPONDENZE Studio congiunto di righe e colonne d una tabella di contingenza r x c con variabili nominali o ordinali (con numero di righe e colonne elevato) Condizione necessaria: esistenza di associazione signiicativa tra le variabili Relazioni tra trasormazioni delle righe e della colonne della tabella: proili riga e proili colonna
6 Esempio Analisi della tabella di contingenza tra proessione e tipo di acquisto prevalente per un campione di clienti di un centro commerciale (ile corrispxlsx)
7
8 MASSE E PROFILI Masse = requenze relative marginali: i = n i / n (r= vettore che contiene le masse di riga) j = n j / n (c= vettore che contiene le masse di colonna) Proilo della riga i-esima: vettore di ij / i matrice dei proili riga (ProileRows) Proilo della colonna j-esima: vettore di ij / j matrice dei proili colonna (ProileCols)
9 V File di Excel Nella matrice dei proili riga le masse di colonna ( j ) sono interpretabili come «il proilo medio di riga» r i= 1 ij i i = j = 1,, In termini matriciali = ProileRows *c j c
10 V File di Excel Nella matrice dei proili colonna le masse di riga ( i ) sono interpretabili come «il proilo medio di colonna» i c = ij j = 1,, c j j= 1 j
11 PROFILI COLONNA La massa dei proili colonna indica che la maggior parte degli acquisti eettuati nel centro commerciale dal campione in esame, viene eettuata quotidianamente, con una percentuale del 415%, mentre il tipo di acquisto che pesa meno è rierito agli acquisti in occasione di ricorrenze, che mostra una massa pari all 85%
12 Proili riga e colonna L analisi dei proili riga può essere considerata come lo studio di r punti in uno spazio a c-1 dimensioni L analisi dei proili colonna può essere visto come lo studio di c punti in uno spazio a r-1 dimensioni
13 Matrici Dr e Dc DD rr = matrice diagonale di dimensione rr rr contenente le masse di riga rr ii lungo la diagonale principale DD cc = matrice diagonale di dimensione c cc contenente le masse di colonna cc ii lungo la diagonale principale
14 Output ACP Analogamente a quanto prodotto dall analisi in componenti principali, l analisi delle corrispondenze ornisce: autovalori, che sono il quadrato di valori singolari (la cui somma è chiamata inerzia ); percentuale di varianza spiegata (detta percentuale di inerzia spiegata ); actor loadings (correlazione tra i proili di riga e colonna con gli assi principali); scores dei proili di riga e colonna sugli assi principali; comunalità (percentuale di inerzia spiegata dai proili riga e proili colonna)
15 PRINCIPI FONDAMENTALI L operazione di centratura non a altro che rimuovere i centroidi delle righe e delle colonne e deve essere interpretata alla stregua dell operazione di calcolo degli scostamenti dalla media aritmetica per un insieme di variabili quantitative ij i Le requenze relative marginali di riga (colonna) possono essere interpretate come i centroidi (proili medi) di colonna (riga) j
16 PRINCIPI FONDAMENTALI Centratura e normalizzazione della tabella di contingenza di dimensioni r x c (p 74): S = [ ] s ij = ij i i j j S = D 1/ ( P rc' ) D 1/ r c
17 Relazione tra la matrice S e l indice Χ /nn S = [ ] s ij = ij i i j j χ = r c i= 1 j= 1 ( * n n ) ij n * ij ij r c χ = n i= 1 j= 1 ( * ) ij * ij ij Dato che * = i j i j La somma dei quadrati degli elementi della matrice S =Χ /nn
18 INERZIA V = min φ [( r 1),( c 1) ] 0 1
19 Il massimo valore che può assumere l inerzia è dato da min(r-1,c-1) Nella nostra tabella 13 x 4 che stiamo analizzando, il valore massimo possibile dell inerzia è uguale a 3
20 DISTANZA TRA PROFILI Per studiare le relazioni congiunte tra proili riga e colonna è necessario introdurre una distanza tra le due nuvole di punti La distanza euclidea tra i proili riga (colonna) non è soddisacente poiché attribuisce un peso uguale a tutte le colonne (righe) d E ( i, i * ) c n = n ij n j = 1 i i i n * * j
21 Metrica (distanza) del chi-quadrato Si vuole invece attribuire un peso rilevante alle colonne in cui vi è una grande distanza tra due punti riga, anche se il totale di colonna è piccolo Tra due proili riga: ormula (76) d χ ( i, i * ) c = n n n n ij n j = 1 j i i i n * * j
22 Metrica (distanza) del chi-quadrato Tra due proili colonna: ormula (77), ), ( 1 * * * = = j ij j ij i r i n n n n n n j j d χ
23 Distanza dal proilo medio (di riga) Distanza (con la metrica del chi-quadrato) di ogni proilo di riga dal proilo medio (ponderato) di riga misura di quanto i proili individuali si scostano dal proilo medio 1 1 ), ( = = = = = = j i ij j c j i j i i ij j c j i ij i ij j c j n n n n n n i i d χ
24 Nel nostro esempio i proili riga che si discostano di più dalla media sono Imprenditore commerciante e studente
25 Distanza dal proilo medio (di riga) Una media ponderata di scostamenti al quadrato dalla media, rappresenta ondamentalmente la varianza totale della tabella di contingenza inerzia r = (massa di riga i ) i= 1 [ ] r [ ] χ d ( i, i) = d ( i, i) i = χ χ i= 1 n Inerzia totale = misura del grado di dispersione attorno al proilo medio
26 Distanza dal proilo medio (di colonna) Tutto quello che abbiamo visto prima per le righe vale anche per le colonne V Implementazione ile Excel Inerzia totale = misura del grado di dispersione attorno al proilo medio
27 Obiettivo dell analisi S = [ ] s ij = ij i i j j S 1/ 1/ = D ( P rc' ) D r c l nostro obiettivo è cercare la matrice X che rende minima la somma dei quadrati della matrice S-X, in simboli min X S - X
28 Obiettivo dell analisi Dato che la somma dei quadrati della matrice S (inerzia totale), può essere scritta in unzione della matrice di corrispondenza P come media ponderata nelle metriche deinite da unzioni delle matrici D r e D c occorre generalizzare la scomposizione in valori singolari al caso in cui le righe e le colonne della matrice presentino un diverso peso
29 Passi della procedura Svd di D -1/ (P rc' ) D -1/ = r c S S k = γ υ h= 1 h h v ' h, Coordinate di riga y = D ( r ) 1/ h r γ u Coordinate di colonna y = D h ( c ) 1/ h c h γ h v h
30 BONTA DELL ANALISI Contributo della i-esima componente all inerzia totale: (λ i / inerzia) 100 Le prime due componenti devono spiegare una percentuale elevata dell inerzia
31 INTERPRETAZIONE DEL RIASSUNTO DEI PROFILI RIGA Masse (di riga) Punteggio (scores) dei proili (saranno rappresentati nel biplot) Contributo di ogni riga all inerzia totale Contributo del punto all inerzia della dimensione (servono per interpretare gli assi) PUNTI DOMINANTI Contributo della dimensione all inerzia del punto = quota di spiegazione dell inerzia del punto passando dallo spazio originario a R
32 Varianza ponderata della dimensione h-esima coincide con l autovalore h-esimo = inerzia della dimensione h-esima λ h = r i= 1 ( ( r) ) ( ( c) ) ih i = y jh j y j= 1 c Il contributo di ogni punto (riga) all inerzia della dimensione h-esima è dato da ( r) ( y ih ) i I contributi più alti vengono λh chiamati punti dominanti
33 Varianza ponderata della dimensione h-esima coincide con l autovalore h-esimo = inerzia della dimensione h-esima y ( r ) = D 1/ h r γ h u h
34 Contributo dei punti all inerzia delle dimensioni analizzate Totale dei contributi delle dimensioni all inerzia del punto (=distanza al quadrato del punto dal proilo medio) comunalità ( ( r) ) yih = cos ω d i
35 Contributo dei punti all inerzia delle dimensioni analizzate ( ( r) ) yih = cos ω d i Contributo per una dimensione alto l angolo tra il vettore del punto e l asse è piccolo il punto è situato nella direzione dell asse alta correlazione con la dimensione
36 Interpretazione degli assi Contributo colonna j- Contributo colonna esima all'asse 1 j-esima all'asse Last minute Giornaliero Ricorrenze Settimanale Asse orizzontale: dimensione associata ad un tipo di acquisto non pianiicato Asse verticale: acquisti con cadenza ragionata
37 ESEMPI DI ANALISI DELLE CORRISPONDENZE
38
39 Il oglio "dati" contiene le risposte da un questionario riguardante la marca di dentiricio utilizzata dai rispondenti appartenenti a 4 regioni italiane Un campione casuale di 1576 individui ha risposto alla seguente domanda Quale tipo di dentiricio utilizzi (DENTIFRICIO)? Marca commerciale (A) Marca industriale (B) Il primo che mi capita è indierente (C) 1) Calcolare la tabella di contingenza tra le variabili DENTIFRICIO (righe) e REGIONE (colonne) ) Calcolare la tabella delle requenze teoriche nell'ipotesi di indipendenza tra le variabili: "tipo di dentiricio utilizzato" e "regione di residenza" 3) Calcolare il valore del test chi quadrato ed il relativo p-value Commentare il risultato ottenuto Qual è il valore del test chi quadrato che ci attendiamo nell'ipotesi di indipendenza stocastica dei due enomeni 4) Calcolare i proili riga 5) Qual è il proilo riga che si discosta maggiormente dal proilo medio? 6) Eettuare la scomposizione in valori singolari della matrice S 7) Discutere la quota di varianza spiegata dalle prime due dimensioni latenti 8) Trovare le coordinate dei punti riga e colonna da rappresentare nel graico 9) Discutere il primo asse principale dei punti riga 10) Rappresentare simultaneamente gli scores dei punti riga e dei punti colonna e commentare il tipo di dentiricio utilizzato prevalentemente dai residenti in Liguria
40 Dati di partenza e tabella di contingenza
41 Graico delle corrispondenze I liguri utilizzano prevalentemente dentiricio di marca commerciale
42 Esempio da CORBELLINI A, RIANI M, DONATINI A (008) Multivariate Data Analysis Techniques to Detect Early Warnings o Elderly Frailty STATISTICA APPLICATA vol 0, pp PDF Campione di 374 anziani della provincia di Parma Obiettivo: analizzare le relazione tra la variazione dello stato di salute e il grado di «isolamento» dell anziano
43 Tabella di contingenza di partenza Improved Stable Slightly worse Serious deteriorat ion RowTotal Absent Low Medium High ColTotal
44 Analisi preliminare
45
46 Asymmetric correspondence analysis: proile coordinates plot
47
48
ANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI
DettagliEsercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012
Analisi Multivariata Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 La Tabella 1 contiene la classificazione in base alla qualifica e all abitudine al fumo di 193 dirigenti e impiegati di
DettagliSDE Marco Riani
SDE 208 Marco Riani mriani@unipr.it http://www.riani.it RIDUZIONE DELLE DIMENSIONI (con riferimento alle variabili Analisi dei fattori Analisi delle componenti principali OBIETTIVI Date p variabili (correlate
DettagliAnalisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
DettagliAnalisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
DettagliRappresentazione dei dati multivariati
Rappresentazione dei dati multivariati Quando si hanno più di due varabili la posizione di ciascuna unità rispetto alle altre può essere rappresentata nel diagramma relativo alle prime due CP l importanza
DettagliCOGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008.
COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. ESERCIZIO I Si è applicata l analisi delle componenti principali a 97 modelli di fotocamere digitali, considerando 7 variabili ed ottenendo
DettagliANALISI DELLE CORRISPONDENZE MULTIPLE (ACM)
ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM) Questa procedura è stata introdotta negli anni 70, ad opera della scuola francese di analisi dei dati (Benzecri). Inizialmente fu proposta per analizzare tabelle
DettagliAlfonso Iodice D Enza
Strumenti quantitativi per l economia e la finanza I Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale () Statistica 1 / 58 Outline 1 2 3 4 5 () Statistica
DettagliANALISI MULTIDIMENSIONALE DEI DATI (AMD)
ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Analisi Multidimensionale dei Dati (AMD) è una famiglia di tecniche il cui obiettivo principale è la visualizzazione, la classificazione e l interpretazione della
DettagliANALISI DEI DATI PER IL MARKETING Marco Riani
ANALISI DEI DATI PER IL MARKETING 2016 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta (trasposta
DettagliStatistica per l Impresa
Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale L analisi delle componenti principali 14 maggio 2018 Introduzione L Obiettivo dell ACP L Analisi delle Componenti Principali
DettagliAnalisi in Componenti Principali (ACP)
Analisi in Componenti Principali (ACP) Metodi di analisi fattoriale Obiettivo: individuazione di variabili di sintesi = dimensioni = variabili latenti = variabili non osservate Approccio: Ordinamenti tra
DettagliFondamenti e metodi analisi empirica nelle scienze sociali
CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.
DettagliAnalisi in componenti principali
Capitolo 2 Analisi in componenti principali 2.1 Introduzione L analisi in componenti principali è una tecnica di analisi multivariata tra le più diffuse. Viene utilizzata quando nel dataset osservato sono
DettagliProva scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012
Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliAnalisi Multivariata Prova intermedia del 20 aprile 2011
Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.
DettagliSDE Marco Riani
SDE 2018 Marco Riani mriani@unipr.it http://www.riani.it RAPPRESENTAZIONI GRAFICHE Nella comunicazione una figura vale più di cento numeri e di mille parole! SCOPI DELLE RAPPRESENTAZIONI GRAFICHE NELLE
Dettagli3. Vettori, Spazi Vettoriali e Matrici
3. Vettori, Spazi Vettoriali e Matrici Vettori e Spazi Vettoriali Operazioni tra vettori Basi Trasformazioni ed Operatori Operazioni tra Matrici Autovalori ed autovettori Forme quadratiche, quadriche e
DettagliC.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018.
AMBIENTE STATISTICO SOFTWARE PER L ANALISI STATISTICA DI DATI PROVENIENTI DAL MONITORAGGIO AMBIENTALE Release 4.0 20/03/2018 Manuale d uso Ambiente Statistico è un software sviluppato nell ambito del Progetto
Dettaglimercato semplici e multiple A.A. 2013/14 Prof.ssa Tiziana Laureti
Statistica per le ricerche di mercato A.A. 2013/14 Prof.ssa Tiziana Laureti 16. Il posizionamento Analisi delle corrisponde semplici e multiple 1 Il posizionamento del prodotto come decisione strategica
DettagliEsercitazioni del corso: RELAZIONI TRA VARIABILI
A. A. 009 010 Esercitazioni del corso: RELAZIONI TRA VARIABILI Isabella Romeo: i.romeo@campus.unimib.it ommario Esercitazione 1: Tabelle a doppia entrata Distribuzioni marginali e condizionate Indipendenza
DettagliEsplorazione grafica di dati multivariati. N. Del Buono
Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra
DettagliStatistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
DettagliStatistica multivariata
Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire le relazioni
DettagliLa statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
DettagliProbablità, Statistica e Processi Stocastici
Probablità, Statistica e Processi Stocastici Franco Flandoli, Università di Pisa Matrice di covarianza Dato un vettore aleatorio (anche non gaussiano) X = (X 1,..., X n ), chiamiamo sua media il vettore
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta
Dettagli3. Vettori, Spazi Vettoriali e Matrici
3. Vettori, Spazi Vettoriali e Matrici Vettori e Spazi Vettoriali Operazioni tra vettori Basi Trasformazioni ed Operatori Operazioni tra Matrici Autovalori ed autovettori Forme quadratiche, quadriche e
Dettagli1 L analisi delle corrispondenze
L analisi delle corrispondenze L analisi delle corrispondenze si effettua su un campione di osservazioni su due variabili qualitative V e V 2 I dati quindi sono il numero di osservazioni tali che V = i
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta
DettagliAnalisi della correlazione canonica
Capitolo 8 Analisi della correlazione canonica Si supponga che su un collettivo di unità statistiche si siano osservati due gruppi di k ed m variabili corrispondenti ad altrettanti aspetti di un fenomeno
DettagliL analisi dell associazione o connessione tra due caratteri statistici
L analisi dell associazione o connessione tra due caratteri statistici Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università
DettagliSequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:
Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza
DettagliRelazioni Statistiche
Relazioni Statistiche L analisi congiunta di due o più caratteri è utile per studiare le relazioni tra di essi. Analisi dell associazione Indipendenza Interdipendenza Dipendenza Tipi di relazioni tra caratteri
DettagliTECNICHE DI POSIZIONAMENTO
TECNICHE DI POSIZIONAMENTO Discriminant analysis: definizione di n (generalmente 2) funzioni lineari discriminanti, basate su valutazioni quantitative di attributi, utilizzate per posizionare oggetti (marche,
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliAnalisi delle Componenti Principali
Struttura e proprietà degli alimenti Analisi delle Componenti Principali Dott. Rossella Di Monaco Dipartimento di Scienza degli Alimenti CORSO di LAUREA MAGISTRALE in SCIENZE E TECNOLOGIE ALIMENTARI La
DettagliSequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:
Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza
DettagliEsercitazioni del corso: STATISTICA
A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliREGISTRO DELLE LEZIONI*
UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI* dell' INSEGNAMENTO o MODULO UFFICIALE Nome:
DettagliStatistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
DettagliAnalisi Multivariata Prova finale del 3 giugno 2010
Analisi Multivariata Prova finale del 3 giugno 2010 Esercizi da svolgere con carta e penna Esercizio A A1 Descrivere brevemente qual è l obiettivo principale dell analisi fattoriale. A2 Scrivere il modello
DettagliVettore (o matrice) casuale (o aleatorio): vettore (o matrice) i cui elementi sono variabili aleatorie
Variabili (vettori e matrici) casuali Variabile casuale (o aleatoria): Variabile che può assumere un insieme di valori ognuno con una certa probabilità La variabile aleatoria rappresenta la popolazione
DettagliAnalisi della varianza
1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliAnalisi delle componenti principali
Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliLa matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
DettagliIl Modello della Analisi Fattoriale Esplorativa e i Metodi di Classificazione Automatica (Analisi di Raggruppamento)
Il Modello della Analisi Fattoriale Esplorativa e i Metodi di Classificazione Automatica (Analisi di Raggruppamento) Se all interno di un insieme di informazioni articolato in una matrice di dati X si
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati
DettagliDispense Associazione PRELIMINARY DRAFT
Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di
Dettaglimateriale didattico II incontro
Piano Nazionale Lauree Scientifiche (PLS 016-017) Statistica Laboratorio di Statistica Le relazioni tra variabili. L indipendenza prof.ssa Angela Maria D'Uggento angelamaria.duggento@uniba.it materiale
DettagliSTATISTICA 1 ESERCITAZIONE 6
STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere
DettagliProva finale del 6 giugno 2011
Prova finale del 6 giugno 2011 Esercizio A, da svolgere con carta e penna Si consideri la seguente matrice dei dati relativa a 3 unità statistiche e 3 variabili, X 1 e X 2 quantitative, X 3 dicotomica.
DettagliCOGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio I
COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio 2008 - I 1) Per un insieme di modelli di smartphone si sono costruiti i boxplot degli scostamenti standardizzati del prezzo e del peso ed
DettagliLa dipendenza. Antonello Maruotti
La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.
ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks
DettagliRichiami di algebra delle matrici a valori reali
Richiami di algebra delle matrici a valori reali Vettore v n = v 1 v 2. v n Vettore trasposto v n = (v 1, v 2,..., v n ) v n = (v 1, v 2,..., v n ) A. Pollice - Statistica Multivariata Vettore nullo o
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliGeneralità sulle funzioni di tre variabili
Integrale upericiale onsideriamo la unzione t,, z Generalità sulle unzioni di tre variabili A i tratta di una unzione di tre variabili,, z in quanto ad ogni terna di valori assegnati ad,, z corrisponde
DettagliAnalisi Fattoriale Analisi Esplorativa
Analisi Fattoriale Analisi Esplorativa Aldo Solari 1 / 31 Introduzione Nelle scienze sociali, in particolare in psicologia, spesso è problematico misurare le variabili di interesse direttamente. Ad esempio:
DettagliSTATISTICA (I MODULO - STATISTICA DESCRITTIVA) Esercitazione I 23/02/2007
Esercitazione I 23/02/2007 La seguente tabella contiene i dati inerenti le imprese di ristorazione di un dato comune: Unità X 1 X 2 X 3 X 4 X 5 X 6 Unità X 1 X 2 X 3 X 4 X 5 X 6 1 1600 20 4 52 3 3 26 141
DettagliAlfonso Iodice D Enza
Strumenti quantitativi per l economia e la finanza I Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale ali dei Il coefficiente () Statistica 1 / 50 Outline
DettagliAnalisi Fattoriale. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 7
Analisi Fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 7 Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: 1 2 3 4 Riepilogo teorico
DettagliStatistica multivariata Donata Rodi 21/11/2016
Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di
DettagliFacoltà di Medicina e Chirurgia
Facoltà di Medicina e Chirurgia METODOLOGIE STATISTICHE UTILIZZATE PER L ANALISI DELLA SODDISFAZIONE DEGLI STUDENTI FREQUENTANTI A.A. 2011-2012 NUCLEO DI VALUTAZIONE DI ATENEO MILANO PIACENZA - CREMONA
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliAnalisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca
Analisi Fattoriale Concetti introduttivi A M D Marcello Gallucci Milano-Bicocca Scopi generali L Analisi Fattoriale (e varianti) si propone di estrarre un numero limitato di fattori (variabili latenti
DettagliVETTORI E MATRICI. Ing. Nicola Cappuccio 2014 U.F.5 ELEMENTI SCIENTIFICI ED ELETTRONICI APPLICATI AI SISTEMI DI TELECOMUNICAZIONI
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 I VETTRORI E MATRICI (RICHIAMI) Ad ogni matrice quadrata a coefficienti reali è possibile associare un numero reale, detto determinante, calcolato
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliDifferenze tra metodi di estrazione
Lezione 11 Argomenti della lezione: L analisi fattoriale: il processo di estrazione dei fattori Metodi di estrazione dei fattori Metodi per stabilire il numero di fattori Metodi di Estrazione dei Fattori
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliLa variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le
DettagliProf. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione
Consentono di descrivere la variabilità all interno della distribuzione di requenza tramite un unico valore che ne sintetizza le caratteristiche CAMPO DI VARIAZIONE DIFFERENZA INTERQUARTILE SCOSTAMENTO
DettagliDestagionalizzazione, detrendizzazione delle serie storiche
DATA MINING PER IL MARKETING (63 ore) Marco Riani mriani@unipr.it Sito web del corso http://www.riani.it/dmm Destagionalizzazione, detrendizzazione delle serie storiche 1 Serie storica della vendita di
DettagliMetodologie Quantitative. Analisi Fattoriale
Metodologie Quantitative Analisi Fattoriale La soluzione fattoriale ed il modello ACP M Q Marco Perugini Milano-Bicocca 1 Correlazioni e Varianze Ricordate che la correlazione (al quadrato) indica la varianza
DettagliL A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
DettagliVettori e geometria analitica in R 3 1 / 25
Vettori e geometria analitica in R 3 1 / 25 Sistemi di riferimento in R 3 e vettori 2 / 25 In fisica, grandezze fondamentali come forze, velocità, campi elettrici e magnetici vengono convenientemente descritte
DettagliAnalisi statistica e matematico-finanziaria II. Alfonso Iodice D Enza Università degli studi di Cassino e del Lazio Meridionale
delle sui delle Analisi statistica e matematico-finanziaria II Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale sulle particolari ali dei dati Outline
DettagliI TEST STATISTICI. dott.ssa Gabriella Agrusti
I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire
DettagliFonti e strumenti statistici per la comunicazione
Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto
DettagliCriteri di Valutazione della scheda (solo a carattere indicativo)
Criteri di Valutazione della scheda (solo a carattere indicativo) Previsioni - A Sono state fatte le previsioni e discussi i valori attesi insieme al ragionamento con cui sono stati calcolati? E stata
DettagliQuale tabella testuale? Quali unità statistiche?
Quale tabella testuale? T = f ij f i. f.j f.. Quali unità statistiche? Quali sono le unità della statistica testuale? Una volta definiti i caratteri delimitatori (spazi, virgole, ecc.) si definisce occorrenza
DettagliPsicometria con Laboratorio di SPSS 1
Psicometria con Laboratorio di SPSS 1 1-Panoramica delle tecniche: Spiegazione intuitiva vers. 1.1 (vers. 1.1, 14 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliLa trasformazione di camera
La trasformazione di camera 1 Introduzione Per rappresentare un oggetto tridimensionale nello spazio (scena) in un piano bidimensionale (spazio delle immagini, quale il monitor o un foglio) è necessario
DettagliAnalisi dell associazione tra due caratteri
Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra
DettagliStatistica (parte II) Esercitazione 4
Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti
DettagliStatistica Sociale - modulo A
Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it in Excel in Excel e un evento (soggetto, entita, accadimento, caratteristica) osservato e registrato che si differenzia dall evento stesso,
DettagliSTATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006
STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 La seguente tabella contiene i dati inerenti le unità del settore della ristorazione in un dato comune: Unità X 1 X 2 X 3 X 4 X
DettagliEsercizi di Complementi di Matematica (L-Z) a.a. 2015/2016
Esercizi di Complementi di Matematica (L-Z) a.a. 2015/2016 Prodotti scalari e forme bilineari simmetriche (1) Sia F : R 2 R 2 R un applicazione definita da F (x, y) = x 1 y 1 + 3x 1 y 2 5x 2 y 1 + 2x 2
Dettagli