SDE Marco Riani

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "SDE Marco Riani"

Transcript

1 SDE 018 Marco Riani

2 ANALISI DELLE CORRISPONDENZE Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI per una matrice di dati quantitativi L ANALISI DELLE CORRISPONDENZE per una tabella di contingenza

3 RIEPILOGO DELLE CP Matrice nxp, con variabili tutte quantitative OBIETTIVO: Date p variabili (correlate) si vogliono ottenere k (k<<p) indicatori di sintesi (le CP) ortogonali (non correlati) VALIDITA DEL MODELLO: la quota (percentuale) di varianza totale spiegata deve essere elevata (>095 p soglia minima di accettabilità)

4 RAPPRESENTAZIONE CONGIUNTA DI VARIABILI E UNITA : IL BIPLOT Nel caso di CP estratte: Rappresentazione nel piano cartesiano dei p vettori (recce) corrispondenti alle variabili Rappresentazione nel piano cartesiano degli n punti corrispondenti ai punteggi (scores) delle unità

5 SCOPI DELL ANALISI DELLE CORRISPONDENZE Studio congiunto di righe e colonne d una tabella di contingenza r x c con variabili nominali o ordinali (con numero di righe e colonne elevato) Condizione necessaria: esistenza di associazione signiicativa tra le variabili Relazioni tra trasormazioni delle righe e della colonne della tabella: proili riga e proili colonna

6 Esempio Analisi della tabella di contingenza tra proessione e tipo di acquisto prevalente per un campione di clienti di un centro commerciale (ile corrispxlsx)

7

8 MASSE E PROFILI Masse = requenze relative marginali: i = n i / n (r= vettore che contiene le masse di riga) j = n j / n (c= vettore che contiene le masse di colonna) Proilo della riga i-esima: vettore di ij / i matrice dei proili riga (ProileRows) Proilo della colonna j-esima: vettore di ij / j matrice dei proili colonna (ProileCols)

9 V File di Excel Nella matrice dei proili riga le masse di colonna ( j ) sono interpretabili come «il proilo medio di riga» r i= 1 ij i i = j = 1,, In termini matriciali = ProileRows *c j c

10 V File di Excel Nella matrice dei proili colonna le masse di riga ( i ) sono interpretabili come «il proilo medio di colonna» i c = ij j = 1,, c j j= 1 j

11 PROFILI COLONNA La massa dei proili colonna indica che la maggior parte degli acquisti eettuati nel centro commerciale dal campione in esame, viene eettuata quotidianamente, con una percentuale del 415%, mentre il tipo di acquisto che pesa meno è rierito agli acquisti in occasione di ricorrenze, che mostra una massa pari all 85%

12 Proili riga e colonna L analisi dei proili riga può essere considerata come lo studio di r punti in uno spazio a c-1 dimensioni L analisi dei proili colonna può essere visto come lo studio di c punti in uno spazio a r-1 dimensioni

13 Matrici Dr e Dc DD rr = matrice diagonale di dimensione rr rr contenente le masse di riga rr ii lungo la diagonale principale DD cc = matrice diagonale di dimensione c cc contenente le masse di colonna cc ii lungo la diagonale principale

14 Output ACP Analogamente a quanto prodotto dall analisi in componenti principali, l analisi delle corrispondenze ornisce: autovalori, che sono il quadrato di valori singolari (la cui somma è chiamata inerzia ); percentuale di varianza spiegata (detta percentuale di inerzia spiegata ); actor loadings (correlazione tra i proili di riga e colonna con gli assi principali); scores dei proili di riga e colonna sugli assi principali; comunalità (percentuale di inerzia spiegata dai proili riga e proili colonna)

15 PRINCIPI FONDAMENTALI L operazione di centratura non a altro che rimuovere i centroidi delle righe e delle colonne e deve essere interpretata alla stregua dell operazione di calcolo degli scostamenti dalla media aritmetica per un insieme di variabili quantitative ij i Le requenze relative marginali di riga (colonna) possono essere interpretate come i centroidi (proili medi) di colonna (riga) j

16 PRINCIPI FONDAMENTALI Centratura e normalizzazione della tabella di contingenza di dimensioni r x c (p 74): S = [ ] s ij = ij i i j j S = D 1/ ( P rc' ) D 1/ r c

17 Relazione tra la matrice S e l indice Χ /nn S = [ ] s ij = ij i i j j χ = r c i= 1 j= 1 ( * n n ) ij n * ij ij r c χ = n i= 1 j= 1 ( * ) ij * ij ij Dato che * = i j i j La somma dei quadrati degli elementi della matrice S =Χ /nn

18 INERZIA V = min φ [( r 1),( c 1) ] 0 1

19 Il massimo valore che può assumere l inerzia è dato da min(r-1,c-1) Nella nostra tabella 13 x 4 che stiamo analizzando, il valore massimo possibile dell inerzia è uguale a 3

20 DISTANZA TRA PROFILI Per studiare le relazioni congiunte tra proili riga e colonna è necessario introdurre una distanza tra le due nuvole di punti La distanza euclidea tra i proili riga (colonna) non è soddisacente poiché attribuisce un peso uguale a tutte le colonne (righe) d E ( i, i * ) c n = n ij n j = 1 i i i n * * j

21 Metrica (distanza) del chi-quadrato Si vuole invece attribuire un peso rilevante alle colonne in cui vi è una grande distanza tra due punti riga, anche se il totale di colonna è piccolo Tra due proili riga: ormula (76) d χ ( i, i * ) c = n n n n ij n j = 1 j i i i n * * j

22 Metrica (distanza) del chi-quadrato Tra due proili colonna: ormula (77), ), ( 1 * * * = = j ij j ij i r i n n n n n n j j d χ

23 Distanza dal proilo medio (di riga) Distanza (con la metrica del chi-quadrato) di ogni proilo di riga dal proilo medio (ponderato) di riga misura di quanto i proili individuali si scostano dal proilo medio 1 1 ), ( = = = = = = j i ij j c j i j i i ij j c j i ij i ij j c j n n n n n n i i d χ

24 Nel nostro esempio i proili riga che si discostano di più dalla media sono Imprenditore commerciante e studente

25 Distanza dal proilo medio (di riga) Una media ponderata di scostamenti al quadrato dalla media, rappresenta ondamentalmente la varianza totale della tabella di contingenza inerzia r = (massa di riga i ) i= 1 [ ] r [ ] χ d ( i, i) = d ( i, i) i = χ χ i= 1 n Inerzia totale = misura del grado di dispersione attorno al proilo medio

26 Distanza dal proilo medio (di colonna) Tutto quello che abbiamo visto prima per le righe vale anche per le colonne V Implementazione ile Excel Inerzia totale = misura del grado di dispersione attorno al proilo medio

27 Obiettivo dell analisi S = [ ] s ij = ij i i j j S 1/ 1/ = D ( P rc' ) D r c l nostro obiettivo è cercare la matrice X che rende minima la somma dei quadrati della matrice S-X, in simboli min X S - X

28 Obiettivo dell analisi Dato che la somma dei quadrati della matrice S (inerzia totale), può essere scritta in unzione della matrice di corrispondenza P come media ponderata nelle metriche deinite da unzioni delle matrici D r e D c occorre generalizzare la scomposizione in valori singolari al caso in cui le righe e le colonne della matrice presentino un diverso peso

29 Passi della procedura Svd di D -1/ (P rc' ) D -1/ = r c S S k = γ υ h= 1 h h v ' h, Coordinate di riga y = D ( r ) 1/ h r γ u Coordinate di colonna y = D h ( c ) 1/ h c h γ h v h

30 BONTA DELL ANALISI Contributo della i-esima componente all inerzia totale: (λ i / inerzia) 100 Le prime due componenti devono spiegare una percentuale elevata dell inerzia

31 INTERPRETAZIONE DEL RIASSUNTO DEI PROFILI RIGA Masse (di riga) Punteggio (scores) dei proili (saranno rappresentati nel biplot) Contributo di ogni riga all inerzia totale Contributo del punto all inerzia della dimensione (servono per interpretare gli assi) PUNTI DOMINANTI Contributo della dimensione all inerzia del punto = quota di spiegazione dell inerzia del punto passando dallo spazio originario a R

32 Varianza ponderata della dimensione h-esima coincide con l autovalore h-esimo = inerzia della dimensione h-esima λ h = r i= 1 ( ( r) ) ( ( c) ) ih i = y jh j y j= 1 c Il contributo di ogni punto (riga) all inerzia della dimensione h-esima è dato da ( r) ( y ih ) i I contributi più alti vengono λh chiamati punti dominanti

33 Varianza ponderata della dimensione h-esima coincide con l autovalore h-esimo = inerzia della dimensione h-esima y ( r ) = D 1/ h r γ h u h

34 Contributo dei punti all inerzia delle dimensioni analizzate Totale dei contributi delle dimensioni all inerzia del punto (=distanza al quadrato del punto dal proilo medio) comunalità ( ( r) ) yih = cos ω d i

35 Contributo dei punti all inerzia delle dimensioni analizzate ( ( r) ) yih = cos ω d i Contributo per una dimensione alto l angolo tra il vettore del punto e l asse è piccolo il punto è situato nella direzione dell asse alta correlazione con la dimensione

36 Interpretazione degli assi Contributo colonna j- Contributo colonna esima all'asse 1 j-esima all'asse Last minute Giornaliero Ricorrenze Settimanale Asse orizzontale: dimensione associata ad un tipo di acquisto non pianiicato Asse verticale: acquisti con cadenza ragionata

37 ESEMPI DI ANALISI DELLE CORRISPONDENZE

38

39 Il oglio "dati" contiene le risposte da un questionario riguardante la marca di dentiricio utilizzata dai rispondenti appartenenti a 4 regioni italiane Un campione casuale di 1576 individui ha risposto alla seguente domanda Quale tipo di dentiricio utilizzi (DENTIFRICIO)? Marca commerciale (A) Marca industriale (B) Il primo che mi capita è indierente (C) 1) Calcolare la tabella di contingenza tra le variabili DENTIFRICIO (righe) e REGIONE (colonne) ) Calcolare la tabella delle requenze teoriche nell'ipotesi di indipendenza tra le variabili: "tipo di dentiricio utilizzato" e "regione di residenza" 3) Calcolare il valore del test chi quadrato ed il relativo p-value Commentare il risultato ottenuto Qual è il valore del test chi quadrato che ci attendiamo nell'ipotesi di indipendenza stocastica dei due enomeni 4) Calcolare i proili riga 5) Qual è il proilo riga che si discosta maggiormente dal proilo medio? 6) Eettuare la scomposizione in valori singolari della matrice S 7) Discutere la quota di varianza spiegata dalle prime due dimensioni latenti 8) Trovare le coordinate dei punti riga e colonna da rappresentare nel graico 9) Discutere il primo asse principale dei punti riga 10) Rappresentare simultaneamente gli scores dei punti riga e dei punti colonna e commentare il tipo di dentiricio utilizzato prevalentemente dai residenti in Liguria

40 Dati di partenza e tabella di contingenza

41 Graico delle corrispondenze I liguri utilizzano prevalentemente dentiricio di marca commerciale

42 Esempio da CORBELLINI A, RIANI M, DONATINI A (008) Multivariate Data Analysis Techniques to Detect Early Warnings o Elderly Frailty STATISTICA APPLICATA vol 0, pp PDF Campione di 374 anziani della provincia di Parma Obiettivo: analizzare le relazione tra la variazione dello stato di salute e il grado di «isolamento» dell anziano

43 Tabella di contingenza di partenza Improved Stable Slightly worse Serious deteriorat ion RowTotal Absent Low Medium High ColTotal

44 Analisi preliminare

45

46 Asymmetric correspondence analysis: proile coordinates plot

47

48

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI

Dettagli

Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012

Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 Analisi Multivariata Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 La Tabella 1 contiene la classificazione in base alla qualifica e all abitudine al fumo di 193 dirigenti e impiegati di

Dettagli

SDE Marco Riani

SDE Marco Riani SDE 208 Marco Riani mriani@unipr.it http://www.riani.it RIDUZIONE DELLE DIMENSIONI (con riferimento alle variabili Analisi dei fattori Analisi delle componenti principali OBIETTIVI Date p variabili (correlate

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

Rappresentazione dei dati multivariati

Rappresentazione dei dati multivariati Rappresentazione dei dati multivariati Quando si hanno più di due varabili la posizione di ciascuna unità rispetto alle altre può essere rappresentata nel diagramma relativo alle prime due CP l importanza

Dettagli

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008.

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. ESERCIZIO I Si è applicata l analisi delle componenti principali a 97 modelli di fotocamere digitali, considerando 7 variabili ed ottenendo

Dettagli

ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM)

ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM) ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM) Questa procedura è stata introdotta negli anni 70, ad opera della scuola francese di analisi dei dati (Benzecri). Inizialmente fu proposta per analizzare tabelle

Dettagli

Alfonso Iodice D Enza

Alfonso Iodice D Enza Strumenti quantitativi per l economia e la finanza I Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale () Statistica 1 / 58 Outline 1 2 3 4 5 () Statistica

Dettagli

ANALISI MULTIDIMENSIONALE DEI DATI (AMD)

ANALISI MULTIDIMENSIONALE DEI DATI (AMD) ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Analisi Multidimensionale dei Dati (AMD) è una famiglia di tecniche il cui obiettivo principale è la visualizzazione, la classificazione e l interpretazione della

Dettagli

ANALISI DEI DATI PER IL MARKETING Marco Riani

ANALISI DEI DATI PER IL MARKETING Marco Riani ANALISI DEI DATI PER IL MARKETING 2016 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta (trasposta

Dettagli

Statistica per l Impresa

Statistica per l Impresa Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale L analisi delle componenti principali 14 maggio 2018 Introduzione L Obiettivo dell ACP L Analisi delle Componenti Principali

Dettagli

Analisi in Componenti Principali (ACP)

Analisi in Componenti Principali (ACP) Analisi in Componenti Principali (ACP) Metodi di analisi fattoriale Obiettivo: individuazione di variabili di sintesi = dimensioni = variabili latenti = variabili non osservate Approccio: Ordinamenti tra

Dettagli

Fondamenti e metodi analisi empirica nelle scienze sociali

Fondamenti e metodi analisi empirica nelle scienze sociali CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.

Dettagli

Analisi in componenti principali

Analisi in componenti principali Capitolo 2 Analisi in componenti principali 2.1 Introduzione L analisi in componenti principali è una tecnica di analisi multivariata tra le più diffuse. Viene utilizzata quando nel dataset osservato sono

Dettagli

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012 Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Analisi Multivariata Prova intermedia del 20 aprile 2011

Analisi Multivariata Prova intermedia del 20 aprile 2011 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.

Dettagli

SDE Marco Riani

SDE Marco Riani SDE 2018 Marco Riani mriani@unipr.it http://www.riani.it RAPPRESENTAZIONI GRAFICHE Nella comunicazione una figura vale più di cento numeri e di mille parole! SCOPI DELLE RAPPRESENTAZIONI GRAFICHE NELLE

Dettagli

3. Vettori, Spazi Vettoriali e Matrici

3. Vettori, Spazi Vettoriali e Matrici 3. Vettori, Spazi Vettoriali e Matrici Vettori e Spazi Vettoriali Operazioni tra vettori Basi Trasformazioni ed Operatori Operazioni tra Matrici Autovalori ed autovettori Forme quadratiche, quadriche e

Dettagli

C.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018.

C.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018. AMBIENTE STATISTICO SOFTWARE PER L ANALISI STATISTICA DI DATI PROVENIENTI DAL MONITORAGGIO AMBIENTALE Release 4.0 20/03/2018 Manuale d uso Ambiente Statistico è un software sviluppato nell ambito del Progetto

Dettagli

mercato semplici e multiple A.A. 2013/14 Prof.ssa Tiziana Laureti

mercato semplici e multiple A.A. 2013/14 Prof.ssa Tiziana Laureti Statistica per le ricerche di mercato A.A. 2013/14 Prof.ssa Tiziana Laureti 16. Il posizionamento Analisi delle corrisponde semplici e multiple 1 Il posizionamento del prodotto come decisione strategica

Dettagli

Esercitazioni del corso: RELAZIONI TRA VARIABILI

Esercitazioni del corso: RELAZIONI TRA VARIABILI A. A. 009 010 Esercitazioni del corso: RELAZIONI TRA VARIABILI Isabella Romeo: i.romeo@campus.unimib.it ommario Esercitazione 1: Tabelle a doppia entrata Distribuzioni marginali e condizionate Indipendenza

Dettagli

Esplorazione grafica di dati multivariati. N. Del Buono

Esplorazione grafica di dati multivariati. N. Del Buono Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra

Dettagli

Statistica multivariata

Statistica multivariata Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire

Dettagli

Statistica multivariata

Statistica multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire le relazioni

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

Probablità, Statistica e Processi Stocastici

Probablità, Statistica e Processi Stocastici Probablità, Statistica e Processi Stocastici Franco Flandoli, Università di Pisa Matrice di covarianza Dato un vettore aleatorio (anche non gaussiano) X = (X 1,..., X n ), chiamiamo sua media il vettore

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta

Dettagli

3. Vettori, Spazi Vettoriali e Matrici

3. Vettori, Spazi Vettoriali e Matrici 3. Vettori, Spazi Vettoriali e Matrici Vettori e Spazi Vettoriali Operazioni tra vettori Basi Trasformazioni ed Operatori Operazioni tra Matrici Autovalori ed autovettori Forme quadratiche, quadriche e

Dettagli

1 L analisi delle corrispondenze

1 L analisi delle corrispondenze L analisi delle corrispondenze L analisi delle corrispondenze si effettua su un campione di osservazioni su due variabili qualitative V e V 2 I dati quindi sono il numero di osservazioni tali che V = i

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta

Dettagli

Analisi della correlazione canonica

Analisi della correlazione canonica Capitolo 8 Analisi della correlazione canonica Si supponga che su un collettivo di unità statistiche si siano osservati due gruppi di k ed m variabili corrispondenti ad altrettanti aspetti di un fenomeno

Dettagli

L analisi dell associazione o connessione tra due caratteri statistici

L analisi dell associazione o connessione tra due caratteri statistici L analisi dell associazione o connessione tra due caratteri statistici Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

Relazioni Statistiche

Relazioni Statistiche Relazioni Statistiche L analisi congiunta di due o più caratteri è utile per studiare le relazioni tra di essi. Analisi dell associazione Indipendenza Interdipendenza Dipendenza Tipi di relazioni tra caratteri

Dettagli

TECNICHE DI POSIZIONAMENTO

TECNICHE DI POSIZIONAMENTO TECNICHE DI POSIZIONAMENTO Discriminant analysis: definizione di n (generalmente 2) funzioni lineari discriminanti, basate su valutazioni quantitative di attributi, utilizzate per posizionare oggetti (marche,

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

Analisi delle Componenti Principali

Analisi delle Componenti Principali Struttura e proprietà degli alimenti Analisi delle Componenti Principali Dott. Rossella Di Monaco Dipartimento di Scienza degli Alimenti CORSO di LAUREA MAGISTRALE in SCIENZE E TECNOLOGIE ALIMENTARI La

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

Esercitazioni del corso: STATISTICA

Esercitazioni del corso: STATISTICA A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

REGISTRO DELLE LEZIONI*

REGISTRO DELLE LEZIONI* UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI* dell' INSEGNAMENTO o MODULO UFFICIALE Nome:

Dettagli

Statistica multivariata

Statistica multivariata Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire

Dettagli

Analisi Multivariata Prova finale del 3 giugno 2010

Analisi Multivariata Prova finale del 3 giugno 2010 Analisi Multivariata Prova finale del 3 giugno 2010 Esercizi da svolgere con carta e penna Esercizio A A1 Descrivere brevemente qual è l obiettivo principale dell analisi fattoriale. A2 Scrivere il modello

Dettagli

Vettore (o matrice) casuale (o aleatorio): vettore (o matrice) i cui elementi sono variabili aleatorie

Vettore (o matrice) casuale (o aleatorio): vettore (o matrice) i cui elementi sono variabili aleatorie Variabili (vettori e matrici) casuali Variabile casuale (o aleatoria): Variabile che può assumere un insieme di valori ognuno con una certa probabilità La variabile aleatoria rappresenta la popolazione

Dettagli

Analisi della varianza

Analisi della varianza 1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Analisi delle componenti principali

Analisi delle componenti principali Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

La matrice delle correlazioni è la seguente:

La matrice delle correlazioni è la seguente: Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA

Dettagli

Il Modello della Analisi Fattoriale Esplorativa e i Metodi di Classificazione Automatica (Analisi di Raggruppamento)

Il Modello della Analisi Fattoriale Esplorativa e i Metodi di Classificazione Automatica (Analisi di Raggruppamento) Il Modello della Analisi Fattoriale Esplorativa e i Metodi di Classificazione Automatica (Analisi di Raggruppamento) Se all interno di un insieme di informazioni articolato in una matrice di dati X si

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati

Dettagli

Dispense Associazione PRELIMINARY DRAFT

Dispense Associazione PRELIMINARY DRAFT Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di

Dettagli

materiale didattico II incontro

materiale didattico II incontro Piano Nazionale Lauree Scientifiche (PLS 016-017) Statistica Laboratorio di Statistica Le relazioni tra variabili. L indipendenza prof.ssa Angela Maria D'Uggento angelamaria.duggento@uniba.it materiale

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

Prova finale del 6 giugno 2011

Prova finale del 6 giugno 2011 Prova finale del 6 giugno 2011 Esercizio A, da svolgere con carta e penna Si consideri la seguente matrice dei dati relativa a 3 unità statistiche e 3 variabili, X 1 e X 2 quantitative, X 3 dicotomica.

Dettagli

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio I

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio I COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING febbraio 2008 - I 1) Per un insieme di modelli di smartphone si sono costruiti i boxplot degli scostamenti standardizzati del prezzo e del peso ed

Dettagli

La dipendenza. Antonello Maruotti

La dipendenza. Antonello Maruotti La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks

Dettagli

Richiami di algebra delle matrici a valori reali

Richiami di algebra delle matrici a valori reali Richiami di algebra delle matrici a valori reali Vettore v n = v 1 v 2. v n Vettore trasposto v n = (v 1, v 2,..., v n ) v n = (v 1, v 2,..., v n ) A. Pollice - Statistica Multivariata Vettore nullo o

Dettagli

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella

Dettagli

Generalità sulle funzioni di tre variabili

Generalità sulle funzioni di tre variabili Integrale upericiale onsideriamo la unzione t,, z Generalità sulle unzioni di tre variabili A i tratta di una unzione di tre variabili,, z in quanto ad ogni terna di valori assegnati ad,, z corrisponde

Dettagli

Analisi Fattoriale Analisi Esplorativa

Analisi Fattoriale Analisi Esplorativa Analisi Fattoriale Analisi Esplorativa Aldo Solari 1 / 31 Introduzione Nelle scienze sociali, in particolare in psicologia, spesso è problematico misurare le variabili di interesse direttamente. Ad esempio:

Dettagli

STATISTICA (I MODULO - STATISTICA DESCRITTIVA) Esercitazione I 23/02/2007

STATISTICA (I MODULO - STATISTICA DESCRITTIVA) Esercitazione I 23/02/2007 Esercitazione I 23/02/2007 La seguente tabella contiene i dati inerenti le imprese di ristorazione di un dato comune: Unità X 1 X 2 X 3 X 4 X 5 X 6 Unità X 1 X 2 X 3 X 4 X 5 X 6 1 1600 20 4 52 3 3 26 141

Dettagli

Alfonso Iodice D Enza

Alfonso Iodice D Enza Strumenti quantitativi per l economia e la finanza I Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale ali dei Il coefficiente () Statistica 1 / 50 Outline

Dettagli

Analisi Fattoriale. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 7

Analisi Fattoriale. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 7 Analisi Fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 7 Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: 1 2 3 4 Riepilogo teorico

Dettagli

Statistica multivariata Donata Rodi 21/11/2016

Statistica multivariata Donata Rodi 21/11/2016 Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di

Dettagli

Facoltà di Medicina e Chirurgia

Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia METODOLOGIE STATISTICHE UTILIZZATE PER L ANALISI DELLA SODDISFAZIONE DEGLI STUDENTI FREQUENTANTI A.A. 2011-2012 NUCLEO DI VALUTAZIONE DI ATENEO MILANO PIACENZA - CREMONA

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Analisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca

Analisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca Analisi Fattoriale Concetti introduttivi A M D Marcello Gallucci Milano-Bicocca Scopi generali L Analisi Fattoriale (e varianti) si propone di estrarre un numero limitato di fattori (variabili latenti

Dettagli

VETTORI E MATRICI. Ing. Nicola Cappuccio 2014 U.F.5 ELEMENTI SCIENTIFICI ED ELETTRONICI APPLICATI AI SISTEMI DI TELECOMUNICAZIONI

VETTORI E MATRICI. Ing. Nicola Cappuccio 2014 U.F.5 ELEMENTI SCIENTIFICI ED ELETTRONICI APPLICATI AI SISTEMI DI TELECOMUNICAZIONI 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 I VETTRORI E MATRICI (RICHIAMI) Ad ogni matrice quadrata a coefficienti reali è possibile associare un numero reale, detto determinante, calcolato

Dettagli

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.

Dettagli

Differenze tra metodi di estrazione

Differenze tra metodi di estrazione Lezione 11 Argomenti della lezione: L analisi fattoriale: il processo di estrazione dei fattori Metodi di estrazione dei fattori Metodi per stabilire il numero di fattori Metodi di Estrazione dei Fattori

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le

Dettagli

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione Consentono di descrivere la variabilità all interno della distribuzione di requenza tramite un unico valore che ne sintetizza le caratteristiche CAMPO DI VARIAZIONE DIFFERENZA INTERQUARTILE SCOSTAMENTO

Dettagli

Destagionalizzazione, detrendizzazione delle serie storiche

Destagionalizzazione, detrendizzazione delle serie storiche DATA MINING PER IL MARKETING (63 ore) Marco Riani mriani@unipr.it Sito web del corso http://www.riani.it/dmm Destagionalizzazione, detrendizzazione delle serie storiche 1 Serie storica della vendita di

Dettagli

Metodologie Quantitative. Analisi Fattoriale

Metodologie Quantitative. Analisi Fattoriale Metodologie Quantitative Analisi Fattoriale La soluzione fattoriale ed il modello ACP M Q Marco Perugini Milano-Bicocca 1 Correlazioni e Varianze Ricordate che la correlazione (al quadrato) indica la varianza

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

Vettori e geometria analitica in R 3 1 / 25

Vettori e geometria analitica in R 3 1 / 25 Vettori e geometria analitica in R 3 1 / 25 Sistemi di riferimento in R 3 e vettori 2 / 25 In fisica, grandezze fondamentali come forze, velocità, campi elettrici e magnetici vengono convenientemente descritte

Dettagli

Analisi statistica e matematico-finanziaria II. Alfonso Iodice D Enza Università degli studi di Cassino e del Lazio Meridionale

Analisi statistica e matematico-finanziaria II. Alfonso Iodice D Enza Università degli studi di Cassino e del Lazio Meridionale delle sui delle Analisi statistica e matematico-finanziaria II Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale sulle particolari ali dei dati Outline

Dettagli

I TEST STATISTICI. dott.ssa Gabriella Agrusti

I TEST STATISTICI. dott.ssa Gabriella Agrusti I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto

Dettagli

Criteri di Valutazione della scheda (solo a carattere indicativo)

Criteri di Valutazione della scheda (solo a carattere indicativo) Criteri di Valutazione della scheda (solo a carattere indicativo) Previsioni - A Sono state fatte le previsioni e discussi i valori attesi insieme al ragionamento con cui sono stati calcolati? E stata

Dettagli

Quale tabella testuale? Quali unità statistiche?

Quale tabella testuale? Quali unità statistiche? Quale tabella testuale? T = f ij f i. f.j f.. Quali unità statistiche? Quali sono le unità della statistica testuale? Una volta definiti i caratteri delimitatori (spazi, virgole, ecc.) si definisce occorrenza

Dettagli

Psicometria con Laboratorio di SPSS 1

Psicometria con Laboratorio di SPSS 1 Psicometria con Laboratorio di SPSS 1 1-Panoramica delle tecniche: Spiegazione intuitiva vers. 1.1 (vers. 1.1, 14 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli

La trasformazione di camera

La trasformazione di camera La trasformazione di camera 1 Introduzione Per rappresentare un oggetto tridimensionale nello spazio (scena) in un piano bidimensionale (spazio delle immagini, quale il monitor o un foglio) è necessario

Dettagli

Analisi dell associazione tra due caratteri

Analisi dell associazione tra due caratteri Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra

Dettagli

Statistica (parte II) Esercitazione 4

Statistica (parte II) Esercitazione 4 Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti

Dettagli

Statistica Sociale - modulo A

Statistica Sociale - modulo A Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it in Excel in Excel e un evento (soggetto, entita, accadimento, caratteristica) osservato e registrato che si differenzia dall evento stesso,

Dettagli

STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006

STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 La seguente tabella contiene i dati inerenti le unità del settore della ristorazione in un dato comune: Unità X 1 X 2 X 3 X 4 X

Dettagli

Esercizi di Complementi di Matematica (L-Z) a.a. 2015/2016

Esercizi di Complementi di Matematica (L-Z) a.a. 2015/2016 Esercizi di Complementi di Matematica (L-Z) a.a. 2015/2016 Prodotti scalari e forme bilineari simmetriche (1) Sia F : R 2 R 2 R un applicazione definita da F (x, y) = x 1 y 1 + 3x 1 y 2 5x 2 y 1 + 2x 2

Dettagli