STATISTICA MULTIVARIATA SSD MAT/06
|
|
- Renato Pastore
- 6 anni fa
- Visualizzazioni
Transcript
1 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2017/2018 I semestre STATISTICA MULTIVARIATA SSD MAT/06 analisi dell interdipendenza LEZION 7 - PCA: introduzione Docente: Valentina MINI valentina.mini@unife.it RICEVIMENTO: su appuntamento previa mail
2 LEZIONE DATA ORARIO DURATA AULA ARGOMENTO 1 25/09/ H LAB 8 Overview: introduzione al corso, alla materia e al software R 2 09/10/ H LAB 8 Vettori e matrici 3 13/10/201710,30-12,30 2 H LAB 8 Regressione lineare: teoria e impostazione pratica 4 16/01/ H LAB 8 Questioni di analisi e applicazione della regressione lineare R 5 23/10/ H LAB 8 Regressione multivariata: teoria e pratica 6 27/10/201710,30-12,30 2 H LAB 8 Questioni di analisi e applicazione della regressione multivariata R Analisi dell'interdipendenza 7 30/10/ H LAB 8 PCA: introduzione 8 06/11/ H LAB 8 PCA: analisi e applicazioni R 9 10/11/201710,30-12,30 2 H LAB 8 Exploratory factor analysis R 10 13/11/ H LAB 8 Confirmatory factor analysis 11 20/11/ H LAB 8 Cluster analysis: introduzione 12 24/11/201710,30-12,30 2 H LAB 8 Cluster analisi: analisi e applicazioni R Test di permutazione combinata 13 27/11/ H LAB 8 Test di permutazione combinata: teoria e applicazioni in R (prof. Bonnini) 14 04/12/ H LAB 8 Test di permutazione combinata: teoria e applicazioni in R (prof. Bonnini) Analisi di dipendenza 15 11/12/ H LAB 8 Analisi dell'interdipendenza: overview 16 15/12/201710,30-12,30 2 H LAB 8 Conclusione ed esercitazioni
3 Contenuti delle lezioni su ACP TERMINARE LA DISCUSSIONE PRATICA DELL ANALISI REGRESSIONE MULTIVARIATA: Conclusione dell analisi della regressione lineare multivariata in R utilizzando il database torte Fare insieme il primo esercizio del database Passito METODI DI ANALISI DELL INTERDIPENDENZA: LA ACP Introduzione I fattori 1) Rappresentazione grafica dei fattori 2) Rappresentazione matematica dei fattori 3) Valori fattoriali (factor scores) a) Metodo di regressione b) Altri metodi c) Utilizzo dei valori fattoriali
4 Contenuti della lezione su ACP Trovare i fattori 1) Scelta del metodo 2) Comunalità 3) Analisi fattoriale VS analisi per componenti principali
5 Contenuti della lezione su ACP Procedimento pratico Esempio di ricerca: Considerazioni iniziali: Dimensione del campione Screening dei dati Condurre l analisi (R ) Interpretare i risultati Analisi preliminare Estrazione fattoriale Ruotare i fattori per migliorare l interpretazione Rotazione ortogonale (o Varimax) Rotazione obliqua Valori fattoriali Postilla: possibilità di usare analisi fattoriale per validare un questionario
6 Contenuti della lezione su ACP Esercizi in R Eseguire una analisi per componenti principali utilizzando i seguenti database: Passito abitudini alimentari centro commerciale
7 BOX: ANOVA Origini concettuali dell analisi della varianza (ANOVA) Verifica delle ipotesi su due campioni C gruppi e ANOVA Definizione e formalizzazione Interpretazione Applicazione in R
8 UTILIZZO DI DATABASE ESTERNO Label Description Coding ID Personal ID of the interviewed Increasing integer number AgeClass Age of the person Age (years) AGE_CLASS Age class of the person 1-6 SEX Sex of the person M or F PROV Province where the interviewed lives Province code LIKE_WINE How much do you like drinking wine? Integrer number from 1 to 7 FREQ_HOME How often do you drink wine at home with meals? Integrer number from 1 to 5 FREQ_BAR How often do you drink wine in bars/pubs? Integrer number from 1 to 5 FREQ_REST How often do you drink wine at restaurants with meals? Integrer number from 1 to 5 KNOW_PAS Do you know the wine Passito? Integrer number from 1 to 7 FREQ_PAS How often do you drink Passito? Integrer number from 1 to 5 FREQ_P_HOL How often do you drink Passito on holidays and celebrations? Integrer number from 1 to 5 FREQ_P_ALO How often do you drink Passito when you are alone? Integrer number from 1 to 5 FREQ_P_MEA How often do you drink Passito at the end of meals? Integrer number from 1 to 5 FREQ_P_OFF How often do you drink Passito offered by someone? Integrer number from 1 to 5 HOW_MUCH How much wine do you drink in one year? Integrer number from 1 to 4 LIKE_PAS How much do you like drinking Passito? Integrer number from 1 to 7 LIKE_AROMA How much do you like aroma and smell of Passito? Integrer number from 1 to 7 LIKE_SWEET How much do you like the sweetness of Passito? Integrer number from 1 to 7 LIKE_ALCOHOL How much do you like the alcohol content of Passito? Integrer number from 1 to 7 LIKE_TASTE How much do you like the intensity of taste of Passito? Integrer number from 1 to 7 PRICE How much could you pay for one bottle of Passito? (0.5 litre) Integrer number from 1 to 5
9 INTRODUZIONE
10 introduzione Spesso fenomeni non direttamente misurabili variabile latente Es. burnout : non misurabile direttamente (molti aspetti), Tuttavia possiamo misurarne molti aspetti (motivazione, livello di stress ) Domanda centrale: tutte queste variabili ci guidano verso lo stesso fenomeno/variabile di interesse? PCA: analisi per componenti principali (ACP) Analisi fattoriale che ci porta ad identificare gruppi di variabili 3 utilizzi principali: 1- capire struttura di un set di variabili 2- costruire un questionario per comprendere/cogliere una variabile sottesa (latente) 3- ridurre dataset a dimensione più gestibile, mantenendo la maggior parte delle informazioni iniziali
11 introduzione Anche nota come trasformazione di Hotelling e espansione di Karhunen-Loeve È tra i più storici e comuni metodi di analisi statistica multivariata Proposta da Pearson nel 1901 e successivamente (indipendentemente) da Hotelling nel 1933 Un metodo effettivo per la rappresentazione di dati multivariati in uno spazio a dimensioni ridotte (parsimonious summarization of data), per semplificare l analisi statistica Metodo utile per analisi esplorative o modelli di previsione
12 introduzione Ruolo chiave nell analisi: I FATTORI Cosa sono i fattori? Come li identifichiamo? Cosa raccontano sulla possibile relazione tra variabili misurate?
13 I FATTORI
14 I fattori Es. questionario su consumi alimentari Risposte La correlazione tra ogni coppia di variabili (domande/risposte) può essere organizzata in una matrice di correlazione R= matrice di correlazione tra variabili (costruita con i coefficienti di correlazione)
15 Elementi su diagonale di matrice R =1 (ogni variabile è perfettamente correlata con se stessa) Elementi al di fuori della diagonale = coefficienti di correlazione tra coppie di variabili
16 I fattori Possibili aree con alti coefficienti di correlazione: Gruppo di variabili che sta misurando aspetti diversi della stessa dimensione/fenomeno sotteso Tale fenomeno/dimensione sottesa è definito FATTORE (variabile latente) Riduzione di database da gruppi di variabili correlate tra loro a un set più piccolo ci permette di avere una minore dimensione, (usare il minor numero di concetti esplorativi) pur mantenendo la massima quantità di varianza comune.
17 I fattori ESEMPI COMUNI: psicologia studi personalità (Eysenck,1953); economia = se produttività, profitto e forza lavoro riducibili ad una dimensione di crescita dell impresa. Es. Studio sulla popolarità di una persona coefficienti di correlazione per ogni coppia di variabili e si crea una matrice R Obiettivo = misurare popolarità delle persone attraverso varie caratteristiche social skills selfish (egoismo) interest (interesse per gli altri) talk1 (tempo impiegato in una conversazione a parlare di altri) talk2 (tempo impiegato in una conversazione a parlare di sé)
18 I fattori Emergono chiaramente due cluster (dimensione comune) Generalmente nell analisi fattoriale (e anche in PCA): - cerchiamo di ridurre questa matrice R - guardando a quali variabili sembrano raggrupparsi -ma non sono correlate con variabili fuori dal gruppo Nell esempio: 2 cluster = 1) fattore: socialità 2) fattore considerazione
19 RAPPRESENTAZIONE GRAFICA DEI FATTORI
20 Rappresentazione grafica dei fattori Fattori: entità statistiche che possono essere visualizzate come assi di classificazione sui quali le variabili misurate possono essere rappresentate Se fattori come assi di un grafico possiamo rappresentare le variabili su questi assi Coordinate delle variabili = forza della relazione tra ogni variabile e il fattore rappresentato
21 Rappresentazione grafica dei fattori
22 Rappresentazione grafica dei fattori Note alla figura : per ogni fattore la linea degli assi va da -1 a +1 = limiti dei coefficienti di correlazione La posizione di ogni variabile dipende dalla sua correlazione con i due fattori Cerchi = variabili correlate con medesimo fattore e bassa corr. con l altro fattore La figura rappresenta ciò che avevamo visto in matrice R Variabili = relate molto bene solo con un fattore (non sempre così) Variabili con alte coordinate su stesso asse: stanno misurando diversi aspetti di stessa dimensione Le coordinate di una variabile su un fattore sono note come peso fattoriale (factor loading)
23 Rappresentazione grafica dei fattori PESO FATTORIALE = correlazione di Pearson tra un fattore e una variabile info contenute nel coefficiente di correlazione se eleviamo al 2 il peso fattoriale misura dell importanza di una particolare variabile per un fattore
24 RAPPRESENTAZIONE MATEMATICA DEI FATTORI
25 Rappresentazione matematica dei fattori FATTORI = assi = linee Riconducibili matematicamente ad una linea retta Descritti da equazione che richiama il modello lineare Yi=b1x1+b2x2+.+bnxn+Ei Lo applichiamo allo scenario di descrizione di un fattore Fattorei=b1*variabile1+b2*variabile2+.+bn*variabilen+Ei Si noti che: -Non c è intercetta (b0), in quanto intercetta degli assi è 0 -bs rappresenta il peso fattoriale
26 Rappresentazione matematica dei fattori ESEMPIO 2 fattori: socialità e considerazione equazione descrive ogni fattore in termini delle variabili misurate:
27 Rappresentazione matematica dei fattori NOTE: -Le equazioni sono identiche nella forma (tutte variabili in entrambe) -La differenza dei valori di b = importanza relativa di ogni variabile su fattori -Possibile sostituire ogni b con coordinate dal grafico (ovvero peso fattoriale) -Le equazioni risultanti sono:
28 Rappresentazione matematica dei fattori Coefficienti = Pearson correlation Coefficiente correlazione al quadrato = R² quanta della variabilità di una variabile è spiegata da un altra NOTE: 1. Per ogni fattore (2): alcune variabili valore alto Vs altre (importanza della variabile sul fattore) 2. Grafico ed equazioni rappresentano la stessa situazione 3. In mondo ideale: per ogni fattore le variabili hanno valore bs molto alto rispetto ad un fattore e molto basso rispetto agli altri
29 Rappresentazione matematica dei fattori 4- i pesi fattoriali individuati possono essere organizzati in una matrice: - colonne = fattori - righe = peso di ogni variabile per un fattore (es. : 2 fattori; 6 righe) Matrice = A
30 Rappresentazione matematica dei fattori -Relazioniamo matrice A con equazioni fattoriali - definizione di A = (in PCA) matrice dei componenti o (in analisi fattoriale) matrice dei fattori -ASSUNZIONI alla base della matrice A: -I fattori algebrici rappresentano le dimensioni del mondo reale - la natura dei fattori ci permette di capire quali variabili hanno più importanza rispetto ad ogni fattore
31 Rappresentazione matematica dei fattori BOX APPROFONDIMENTO SUI PESI FATTORIALI matrice di struttura VS matrice di disposizione Fino a qui pesi fattoriali indicati come: sia coefficienti di correlazione, sia coefficienti di regressione. Entrambi concetti = relazione tra una variabile e un modello lineare concetto chiave: il peso fattoriale da informazioni su contributo relativo che una variabile ha su un fattore Interpretazione di peso fattoriale = rappresenta entrambi (coeff.corr e coef.regg) 2 distinzioni: Rotazione ORTOGONALE (fattori indipendenti; peso corr e reg) OBLIQUA (reg =pattern matrix; corr = structure matrix)
32 I VALORI FATTORIALI
33 I valori fattoriali es. descrivere una persona
34 I valori fattoriali Descrizione di un fattore: - b = in termini di variabili che hanno un peso su di esso - in termini di media ponderata per ogni caso (es. per descrivere una persona e confrontarla con altre) Punto critico = molto sensibile alla scala di misura delle variabili (se domande diverse con scale diverse non paragonabili) Metodo molto elementare vediamo metodi più sofisticati
35 I valori fattoriali: metodo di regressione Diverse tecniche per definire il punteggio fattoriale - equazione - bs coefficiente di valore fattoriale calcolato con metodo di regressione: - il peso fattoriale è aggiustato per considerare l iniziale correlazione tra variabili - la differenza nelle scale di misura è neutralizzata
36 I valori fattoriali: metodo di regressione METODO: -B = matrice dei coefficienti di valore fattoriale = R-¹ * A dove: R-¹ = inversa di matrice di correlazione A = matrice dei pesi fattoriali Concetto = dividiamo i pesi fattoriali per i coefficienti di correlazione B = matrice risultante (relazione tra ogni variabile e ogni fattore, considerando la relazione originaria tra coppie di variabili) B rappresenta una misura della relazione unica tra variabili e fattori
37 Es I valori fattoriali: metodo di regressione - Le matrici riportano stesso tipo informazioni date dai pesi fattoriali e dai coefficienti di punteggio - Cambia il peso (perché consideriamo la relazione tra variabili)
38 I valori fattoriali: metodo di regressione I valori ottenuti da B possono essere inseriti nelle equazioni : Es Con tali equazioni è possibile descrivere una persona rispetto alla domanda di ricerca iniziale. -Tale tecnica per ottenere valori fattoriali ha come risultato valori con : media = 0 ; varianza = (score scorei)^2 -Punto debole = i valori possono essere correlati con più fattori
39 I valori fattoriali: altri metodi Per ovviare alla correlazione possibile nel metodo di regressione Diversi aggiustamenti 2 i principali : 1) metodo Barlett (fattori; punteggi fattoriali multicollinearità) 2) metodo Anderson-Rubin (punteggi fattoriali non correlati e standardizzati. Media = 0; std=1) quale metodo utilizzare? Tabachnick e Fidell (2011) - se necessità di non correlazione = A.R. - altrimenti regressione (per interpretazione)
40 I valori fattoriali: utilizzo Definizione = Il valore fattoriale è un punteggio composito per ogni individuo su un particolare fattore (o dimensione) UTILIZZI: -Riduzione del database - condurre analisi con fattori (non con variabili originarie) -Risolvere la collinearità per la regressione multipla
41 INDIVIDUARE I FATTORI
42 Individuare i fattori Punto situazione: 1. Concetto di fattore 2. Sua rappresentazione grafica 3. Sua rappresentazione algebrica 4. Costruzione di un valore/punteggio composito che rappresenta la performance di un caso (individuo) in un singolo fattore COME INDIVIDUARE I FATTORI?
43 Individuare i fattori: scelta del metodo Tinsley & Tinsley (1987): 2 elementi cruciali nella scelta del metodo a) Se vogliamo generalizzare o no b) Esplorazione dati o conferma ipotesi (es. confirmatory factor analysis : Pedhazur e Shmelkin 1991, cap.23) Risultati al campione (metodi descrittivi) Generalizzazione (metodi inferenziali) Esplorare dati Confermare ipotesi PCA base Confirmatory factor analysis PCA -ripetute analisi su diversi campioni rivelano stessa struttura fattoriale, oppure -Casi selezionati casualmente e variabili rappresentano la popolazione di variabili di interesse (solo var. misurate) (es. Max. Likelihood method Harman, 1976; Kaiser Method su dipendenza dei fattori). Confirmatory factor analysis Scelta del metodo dipende dall obiettivo
44 Individuare i fattori: le comunalità Definizione di comunalità: Logica della comunalità: Nella matrice R è possibile calcolare il valore della variabilità (ovvero la varianza) per ogni variabile.
45 Individuare i fattori: le comunalità Logica della comunalità: Varianza per ogni variabile La varianza totale di ogni variabile ha due componenti: una parte è specifica di quella variabile (varianza unica, con una componente di errore definita varianza random) una parte è condivisa con le altre variabili (varianza comune) La proporzione di varianza comune presente in una variabile è nota come COMUNALITA Varia da 1 a 0: - 0 = variabile che non condivide varianza con altre variabili - 1 = variabile che non ha varianza unica Noi siamo interessati a trovare dimensioni comuni sottostanti nei dati raccolti = = siamo interessati alla varianza in comune (comunalità)
46 Individuare i fattori: le comunalità Prima di eseguire la PCA dovremmo conoscere la varianza in comune empasse Risoluzione del problema: 2 opzioni - assumiamo che tutta VARIANZA sia varianza comune (comunalità =1) - stimiamo la comunalità per ogni variabile Possiamo usare le informazioni contenute in R² per ogni variabile Es. Multipla lm usando selfish come Y e tutte le altre variabili come Xi R² associato è una misura di comunalità di selfish. Si ripete per tutte le variabili. Da qui procediamo con L ESTRAZIONE FATTORIALE
47 BOX DI APPROFONDIMENTO 1. ANALISI DELLA VARIANZA IN PRATICA : ANOVA spiegazione alla lavagna del significato pratica in R e discussione dei risultati
48 ANOVA = analisi di varianza Es. in analisi di regressione Nell output di regressione vediamo R² (la % di variabilità in Y spiegata da Xi) e R (la correlazione semplice tra due variabili) Chiediamo a output.regressione di riportare ANOVA (ovvero l analisi della varianza) Vengono riportati: SST, SSR e SSE Proviamo in R per interpretare i risultati ANOVA indica se il modello ha un buon grado di significatività nel predire la variabile Y MANOVA = quando osserviamo modelli con risposte multiple Quando le Xi variano insieme per spiegare la medesima Y = ANCOVA Pratica di analisi di varianza in R
49 Letture consigliate Field, A. (2002) Discovering statistics using SPSS (2 ed.) Sage publication. Chap 15. Lattin, J. Et al. (2005) Analyzing Multivariate Data. Chap 4.
STATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZION 13 Analisi della interdipendenza e della dipendenza : overview Docente:
DettagliL A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
DettagliStatistica multivariata Donata Rodi 21/11/2016
Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di
DettagliSTATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica
DettagliPsicometria con Laboratorio di SPSS 1
Psicometria con Laboratorio di SPSS 1 1-Panoramica delle tecniche: Spiegazione intuitiva vers. 1.1 (vers. 1.1, 14 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliAnalisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca
Analisi Fattoriale Concetti introduttivi A M D Marcello Gallucci Milano-Bicocca Scopi generali L Analisi Fattoriale (e varianti) si propone di estrarre un numero limitato di fattori (variabili latenti
Dettagliviii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
DettagliStatistica multivariata 27/09/2016. D.Rodi, 2016
Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche
Dettagli6) Analisi Fattoriale
Esempio: abbiamo sottoposto un questionario con 23 items su scala Likert a 5 punti che vuole misurare l atteggiamento verso SPSS. Quello che dobbiamo fare sarà: 1) Controllare i dati: il campione è abbastanza
DettagliMetodologie Quantitative. Analisi Fattoriale
Metodologie Quantitative Analisi Fattoriale La soluzione fattoriale ed il modello ACP M Q Marco Perugini Milano-Bicocca 1 Correlazioni e Varianze Ricordate che la correlazione (al quadrato) indica la varianza
DettagliTeoria e tecniche dei test DIMENSIONALITA DI UN TEST DIMENSIONALITA DI UN TEST (2) 03/04/2012. Lezione 7 DIMENSIONALITA e ATTENDIBILITA
Teoria e tecniche dei test Lezione 7 DIMENSIONALITA e ATTENDIBILITA DIMENSIONALITA DI UN TEST Una domanda cruciale da porsi nella fase di messa a punto di un test riguarda la sua dimensionalità. La tecnica
DettagliINDICE PARTE METODOLOGICA
INDICE PARTE METODOLOGICA 1. Il processo di ricerca 1.1.Individuazione di un problema e formulazione delle ipotesi 1.2.Individuazione e definizione operativa delle variabili 1.2.1. Le variabili definite
DettagliAnalisi Multivariata dei Dati. Regressione Multipla
Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da
DettagliP S I C O M T R I A Marcello Gallucci. Analisi Fattoriale. Esempi. Milano-Bicocca. Lezione: 20
Analisi Fattoriale Esempi P S I C O M T R I A Marcello Gallucci Milano-Bicocca Lezione: 20 Esempio Descrizione della ricerca Un ricercatore intende stabilire se una manipolazione sperimentale basata sulla
DettagliArgomenti della lezione:
Lezione 12 L analisi fattoriale: il processo di rotazione dei fattori, l interpretazione della soluzione Argomenti della lezione: Metodi di rotazione dei fattori Interpretazione della soluzione Assunzioni
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliREGISTRO DELLE LEZIONI*
UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI* dell' INSEGNAMENTO o MODULO UFFICIALE Nome:
DettagliPsicometria con Laboratorio di SPSS 2
Psicometria con Laboratorio di SPSS 2 Esempio di fattoriale esplorativa (v. 1.1, 12 aprile 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18
DettagliAnalisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
DettagliStatistica per le ricerche di mercato
Università degli studi della Tuscia Dipartimento di Economia e Impresa Statistica per le ricerche di mercato a.a. 2012/13 Dr. Luca Secondi 01. Introduzione al corso 1 Statistica per le ricerche di mercato
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
DettagliRELAZIONE FINALE DEL DOCENTE. Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 3PTVE A. S. 2015/2016
RELAZIONE FINALE DEL DOCENTE Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 3PTVE A. S. 2015/2016 In relazione alla programmazione curricolare sono stati conseguiti, in termini di livello medio,
DettagliPsicometria con Laboratorio di SPSS 2
Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 08-Anova con covariata (vers. 1.2, 6 dicembre 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18
DettagliLA MATRICE DEGLI INDICATORI SOCIALI
LA MATRICE DEGLI INDICATORI SOCIALI CORSO DI METODI DI INDAGINE E VALUTAZIONE NELLE SCIENZE SOCIALI La sintesi degli indicatori X n, m x L x L x L L L L L xi 1 L xij L x L L L L L x L x L x 11 1 j 1m im
DettagliStatistica multivariata Donata Rodi 08/11/2016
Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui
DettagliCorrelazione e regressione
Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna
DettagliEsplorazione grafica di dati multivariati. N. Del Buono
Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 11-Anova con covariata (v. 1.3, 5 dicembre 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2018-19
Dettagli62 CAPITOLO 3. STATISTICA DESCRITTIVA
62 CAPITOLO 3. STATISTICA DESCRITTIVA Raccogliamo su una popolazione di n individui i dati relativi a m caratteri (variabili) e riportiamoli in una matrice, dove le righe (n) sono relative ad individui
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.2, 20 marzo 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2016-17
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI
DettagliIl modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
DettagliAnalisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliIntroduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) Marcello Gallucci P S I C O M E T R I A marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa
DettagliAnalisi in componenti principali
Capitolo 2 Analisi in componenti principali 2.1 Introduzione L analisi in componenti principali è una tecnica di analisi multivariata tra le più diffuse. Viene utilizzata quando nel dataset osservato sono
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.0, 3 dicembre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2015-16
DettagliFacoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B
Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliIl Modello della Analisi Fattoriale Esplorativa e i Metodi di Classificazione Automatica (Analisi di Raggruppamento)
Il Modello della Analisi Fattoriale Esplorativa e i Metodi di Classificazione Automatica (Analisi di Raggruppamento) Se all interno di un insieme di informazioni articolato in una matrice di dati X si
DettagliAnalisi multivariata (DPRS)
Analisi multivariata (DPRS) 8b-Esempio di fattoriale esplorativa vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 Rossi (Dip. Psicologia)
DettagliRisultati di apprendimento attesi della disciplina MATEMATICA
Risultati di apprendimento attesi della disciplina LICEO SCIENTIFICO SECONDO BIENNIO E QUINTO ANNO DISCIPLINA DI RIFERIMENTO COMPETENZE IN ESITO (secondo biennio e quinto anno) M5 Comprendere il linguaggio
DettagliPresentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii
Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4
DettagliANALISI DELLE CORRISPONDENZE MULTIPLE (ACM)
ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM) Questa procedura è stata introdotta negli anni 70, ad opera della scuola francese di analisi dei dati (Benzecri). Inizialmente fu proposta per analizzare tabelle
DettagliIl modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
DettagliSDE Marco Riani
SDE 208 Marco Riani mriani@unipr.it http://www.riani.it RIDUZIONE DELLE DIMENSIONI (con riferimento alle variabili Analisi dei fattori Analisi delle componenti principali OBIETTIVI Date p variabili (correlate
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliAnalisi fattoriale. introduzione vers Germano Rossi 1 1 Dipartimento di Psicologia, Università di Milano-Bicocca
Analisi fattoriale introduzione vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2009 Rossi (Dip. Psicologia) Analisi fattoriale 2009 1 / 28
DettagliESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE
ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di
DettagliAnalisi Fattoriale. La soluzione fattoriale ed il modello ACP Scelta del numero dei fattori
Analisi Fattoriale La soluzione fattoriale ed il modello ACP Scelta del numero dei fattori A M D Marcello Gallucci Milano-Bicocca 1 Lezione: 1 XVI X I passaggi fondamentali 1) Scelta del modello fattoriale
DettagliStatistica per le ricerche di mercato
Università degli studi della Tuscia Dipartimento di Economia e Impresa Statistica per le ricerche di mercato a.a. 2014/15 Prof.ssa Tiziana Laureti 01. Introduzione al corso 1 Statistica per le ricerche
DettagliCurricolo Verticale Scuola Secondaria di I Grado I. C. S. Via Libertà San Donato Milanese (MI) CLASSE PRIMA
CLASSE PRIMA TRAGUARDI per lo sviluppo delle competenze OBIETTIVI CONTENUTI al termine della classe 3 a Comprendere il significato logico dei numeri nell insieme N e rappresentarli sulla retta orientata.
DettagliRappresentazione dei dati multivariati
Rappresentazione dei dati multivariati Quando si hanno più di due varabili la posizione di ciascuna unità rispetto alle altre può essere rappresentata nel diagramma relativo alle prime due CP l importanza
DettagliScopo dello studio. Metodi
Ci si può fidare dei risultati dell analisi delle componenti principali? Ricci C, Milani S Istituto di Statistica Medica e Biometria G.A. Maccacaro Facoltà di Medicina e Chirurgia, Università degli Studi
DettagliStatistica descrittiva: analisi di regressione
Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
Dettaglix1 + 2x 2 + 3x 3 = 0 nelle tre incognite x 1, x 2, x 3. Possiamo risolvere l equazione ricavando l incognita x 1 x 1 = 2x 2 3x 3 2r 1 3r 2 x 2 x 3
Matematica II -..9 Spazio delle soluzioni di un sistema lineare omogeneo.. Consideriamo l equazione lineare omogenea nelle tre incognite x, x, x 3. x + x + 3x 3 = Possiamo risolvere l equazione ricavando
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliMisure Ripetute. Partizione della Varianza. Marcello Gallucci
Misure Ripetute Partizione della Varianza Marcello Gallucci GLM l ANOVA a misure ripetute rappresenta un caso del modello lineare generale in cui la variabilità non è valutata tra gruppi ma tra misure
DettagliMetodi Multivariati: Analisi delle Componeti Principali (PCA)
Metodi Multivariati: Analisi delle Componeti Principali (PCA) Il modello PCA come approssimazione delle informazioni contenute in una matrice di dati in cui più oggetti (es. campioni) sono spiegati da
DettagliAnalisi Fattoriale Analisi Esplorativa
Analisi Fattoriale Analisi Esplorativa Aldo Solari 1 / 31 Introduzione Nelle scienze sociali, in particolare in psicologia, spesso è problematico misurare le variabili di interesse direttamente. Ad esempio:
DettagliElementi di Psicometria
Elementi di Psicometria Analisi fattoriale: Spiegazione intuitiva (April 28, 2010) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2009-2010 G. Rossi
DettagliSimulazione d esame Marco Perugini Milano-Bicocca
Simulazione d esame M Q Marco Perugini Milano-Bicocca 1 Prova simulata d esame (23 Novembre- Prof.ssa Zogmaister) 1. Potete comunicare tra di voi 2. Potete consultare i lucidi 3. Non usare telefonini,
DettagliAnalisi Multivariata Prova intermedia del 20 aprile 2011
Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.
DettagliMetodologie Quantitative. Analisi Fattoriale
Metodologie Quantitatie Analisi Fattoriale Concetti introduttii e passi chiae M Q Marco Perugini Milano-Bicocca Matrici: moltiplicazione 3 3 3 4 Solo se il numero di colonne della prima matrice è uguale
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliTECNICHE DI POSIZIONAMENTO
TECNICHE DI POSIZIONAMENTO Discriminant analysis: definizione di n (generalmente 2) funzioni lineari discriminanti, basate su valutazioni quantitative di attributi, utilizzate per posizionare oggetti (marche,
Dettaglis a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value
Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza
Dettaglimatematica classe terza Liceo scientifico
LICEO SCIENTIFICO STATALE LEONARDO DA VINCI Anno scolastico 2013/2014 LE COMPETENZE ESSENZIALI CONSIDERATE ACCETTABILI PER LA SUFFICIENZA Si precisa che gli obiettivi indicati sono da raggiungere in relazione
DettagliREGISTRO DELLE LEZIONI
UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI dell INSEGNAMENTO o MODULO UFFICIALE Nome:
DettagliPROGRAMMAZIONE DIDATTICA DIPARTIMENTO
ISTITUTO ISTRUZIONE SUPERIORE "CORRIDONI - CAMPANA" 60027 OSIMO (AN) Cod. Mecc. ANIS00900Q - Cod. Fisc. 80005690427 PROGRAMMAZIONE DIPARTIMENTO DISCIPLINA MATEMATICA CLASSI 4 SCIENTIFICO SEZ. A, B, C DOCENTI:
DettagliMicroeconomia Esercitazioni a.a. 2018/2019
Microeconomia Esercitazioni a.a. 2018/2019 CDL SPOSI (O-Z) STINT (A-Z) PROF. GIUSEPPE PIGNATARO TUTOR ALESSANDRA PORFIDO 1 Tutor Contatti Alessandra.porfido2@unibo.it Ricevimento Da definire, per il momento
DettagliAnalisi dei Fattori. Francesca Marta Lilja Di Lascio Dip.to di Scienze Statistiche P. Fortunati Università di Bologna
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Analisi dei Fattori Francesca Marta Lilja
DettagliAnalisi avanzate della regressione: la moderazione (Cap. 5 )
Analisi avanzate della regressione: la moderazione (Cap. 5 ) AMD Marcello Gallucci marcello.gallucci@unimib.it Lezione: V Struttura delle relazioni Le relazioni possibili diventano più interessanti strutturalmente
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 07-Coefficienti di correlazione vers. 1.0 (29 ottobre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliLABORATORI DI STATISTICA SOCIALE
Università degli Studi di Bergamo Dipartimento di Scienze Umane e Sociali Corso di Laurea in Scienze Psicologiche LABORATORI DI STATISTICA SOCIALE Lezione V Prof. Andrea Greco Dott.ssa Roberta Adorni Dott.
DettagliI TEST STATISTICI. dott.ssa Gabriella Agrusti
I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire
DettagliConfronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23
Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta
DettagliPiano formativo del Corso Intensivo (Summer School) in: INTRODUZIONE ALL ANALISI DEI DATI CON R
Piano formativo del Corso Intensivo (Summer School) in: INTRODUZIONE ALL ANALISI DEI DATI CON R Dipartimento DI PSICOLOGIA DEI PROCESSI DI SVILUPPO E SOCIALIZZAZIONE Tipologia del Corso Denominazione Dipartimento
DettagliIntroduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello
DettagliAnalisi delle componenti principali
Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste
DettagliANOVA. ANalysis Of VAriance. Federico Plazzi. 1 Dicembre 2015
ANOVA ANalysis Of VAriance Federico Plazzi 1 Dicembre 2015 A che cosa serve? A che cosa serve? Applicazione L ANOVA ha finalità simili al test t: confrontare campioni. Al contrario del test t, però, è
Dettaglia a 1n A = a n1... a nn a 11 x a 1n x n = b 1 a n1 x a nn x n = b n ] sono determinati. 2- La matrice A = [ a ij
Recupero. 2, Determinanti. 1. Determinanti Consideriamo una matrice A = a 11... a 1n.. a n1... a nn quadrata di ordine n ad elementi in R. Sappiamo che sono equivalenti la affermazioni 1- tutti i sistemi
DettagliC.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018.
AMBIENTE STATISTICO SOFTWARE PER L ANALISI STATISTICA DI DATI PROVENIENTI DAL MONITORAGGIO AMBIENTALE Release 4.0 20/03/2018 Manuale d uso Ambiente Statistico è un software sviluppato nell ambito del Progetto
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliDall Analisi Fattoriale alla Regressione Lineare
Dall Analisi Fattoriale alla Regressione Lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 10 Consegna Lavoro di gruppo La scadenza per la consegna del lavoro di gruppo è fissata
DettagliREGISTRO DELLE LEZIONI
UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI dell INSEGNAMENTO o MODULO UFFICIALE Nome:
DettagliAnalisi Multivariata Prova finale del 3 giugno 2010
Analisi Multivariata Prova finale del 3 giugno 2010 Esercizi da svolgere con carta e penna Esercizio A A1 Descrivere brevemente qual è l obiettivo principale dell analisi fattoriale. A2 Scrivere il modello
DettagliCORSO INTEGRATO DI STATISTICA E INFORMATICA MEDICA
CORSO INTEGRATO DI STATISTICA E INFORMATICA MEDICA Settore Scientifico-Disciplinare: MED/01 Statistica Medica; INF/01 Informatica CFU Tot.: 5 Coordinatore: Prof. Dario Bruzzese Dip.: Sanità Pubblica.,
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
Dettagli8. ANALISI DELLA COVARIANZA (ANCOVA)
8. ANALISI DELLA COVARIANZA (ANCOVA) L analisi della covarianza è un metodo statistico che risulta dalla combinazione dell analisi di regressione con l analisi della varianza. È utile quando all analisi
DettagliPROGRAMMAZIONE MATEMATICA classe seconda economico/turistico:
PROGRAMMAZIONE MATEMATICA classe seconda economico/turistico: UDA n. 0 Statistica descrittiva (ripasso da attuare in un qualsiasi momento dell a.s.) Prerequisiti Padronanza del calcolo nei vari insiemi
Dettagli