Analisi Multivariata Prova finale del 3 giugno 2010

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Analisi Multivariata Prova finale del 3 giugno 2010"

Transcript

1 Analisi Multivariata Prova finale del 3 giugno 2010 Esercizi da svolgere con carta e penna Esercizio A A1 Descrivere brevemente qual è l obiettivo principale dell analisi fattoriale. A2 Scrivere il modello fattoriale ortogonale e le ipotesi di base ad esso relative. A3 Scrivere la struttura della matrice di covarianza derivante dal modello fattoriale ortogonale. A4 Illustrare brevemente il problema della non unicità della scomposizione della matrice di covarianza derivante dal modello fattoriale. A5 Derivare la formula che esprime la correlazione tra le variabili originali e i fattori latenti. A6 Scrivere l espressione dei factor loadings derivati dal metodo di stima delle componenti principali. A7 Spiegare brevemente il problema dell identificazione del modello fattoriale e il vincolo che è necessario imporre per ottenere le stime di massima verosimiglianza. Esercizio B Si consideri la seguente matrice dei dati relativa a quattro unità statistiche, due variabili quantitative X 1 e X 2, e due variabili dicotomiche X 3 e X B1 Calcolare la distanza tra le 4 unità in base alle variabili X 1 e X 2 utilizzando come indice di distanza: (i) la distanza euclidea, e (ii) la distanza euclidea standardizzata. Confrontare i risultati ottenuti e spiegare brevemente le differenze esistenti tra i due indici di distanza. B2 Considerando le sole variabili X 3 e X 4 utilizzare un indice di similarità per valutare quali sono le due unità statistiche più vicine, valutando in egual modo i confronti 1-1 e

2 B3 Se doveste valutare la distanza tra le quattro unità utilizzando tutte e quattro le variabili, quale indice di distanza o di similarità utilizzereste? Scrivere la formula dell indice prescelto e motivare la risposta fornita. B4 In generale, quali proprietà deve soddisfare un indice di distanza? Esercizi da svolgere con il computer Esercizio C Il file bostonh.xls contiene i dati raccolti dall U.S Census Service sulla situazione abitativa nell area di Boston. L archivio contiene 506 osservazioni relative alle sezioni di censimento dell area metropolitana di Boston. Le variabili registrate nell archivio sono riportate nella tabella seguente. Escludere dalle analisi richieste la variabile CHAS. variabile descrizione CRIM tasso di criminalità pro-capite per città ZN proporzione di zone residenziali di area superiore a 25,000 sq.ft. INDUS proporzione di acri non destinati al commercio CHAS Charles River (= 1 se area in riva al fiume; 0 altrimenti) NOX concentrazione di ossido di azoto (parti per 10 milioni) RM numero medio di stanze per abitazione AGE proporzione di unità abitative occupate costruite prima del 1940 DIS distanza ponderata rispetto a 5 centri lavorativi in Boston RAD indice di accessibilità all autostrada TAX tassa di proprietà per $10,000 PTRATIO rapporto docente/studenti per città B 1000(Bk 0.63) 2 dove Bk è la proporzione di popolazione afro-americana LSTAT % di popolazione disagiata MEDV valore mediano delle abitazioni occupate in proprietà in migliaia di dollari C1 Procedere all analisi fattoriale dei dati standardizzati utilizzando il metodo delle componenti principali per scegliere il numero di fattori che consente il miglior adattamento del modello. Motivare la risposta. C2 Stimare il modello con il metodo della massima verosimiglianza, utilizzando il numero di fattori scelto al passo precedente. I punti seguenti fanno riferimento al modello stimato con il metodo della massima verosimiglianza. C3 Calcolare le stime delle varianze specifiche e delle comunalità. C4 Calcolare la proporzione di varianza totale spiegata dai fattori comuni. C5 Ruotare i fattori utilizzando il criterio VARIMAX per trovare una soluzione con una struttura semplice dei fattori. 2

3 C6 Provare a fornire un interpretazione dei fattori ruotati. C7 Calcolare i punteggi fattoriali relativi alla soluzione scelta e rappresentare graficamente le unità statistiche nel piano fattoriale generato dai primi 2 fattori. C8 Calcolare la matrice delle correlazioni residue. C9 Come è possibile valutare la bontà di adattamento del modello? Esercizio D Utilizzando i dati dell esercizio precedente: D1 raggruppare le sezioni di censimento utilizzando il metodo del legame singolo e il metodo del legame completo; D2 costruire i due dendrogrammi e commentare i risultati ottenuti con i due metodi; D3 in quanti gruppi suddividereste le sezioni di censimento? Motivare la risposta. D4 Descrivere le caratteristiche dei gruppi individuati: n. di osservazioni per gruppo, valori medi e deviazioni standard di ciascuna variabile. In che cosa si differenziano maggiormente i gruppi individuati? D5 Utilizzando il metodo K-means raggruppare le osservazioni in K = 2, 3, 4 gruppi e confrontare i risultati con quelli ottenuti con i due metodi gerarchici. 3

4 Soluzione Esercizio A Durante l esame NON sarà possibile consultare libro di testo, dispense e lucidi per rispondere a queste domande. In fase di preparazione controllare le risposte fornite con quanto reperito sul libro di testo e/o sulle dispese e i lucidi. Esercizio B Per questo esercizio i conti possono essere svolti (o controllati) utilizzando SAS (si veda compito sas), purchè nel compito si riportino in dettaglio i commenti e i risultati come di seguito descritto. B1 (i) Date due unità statistiche i e i, e considerando le sole variabili X 1 e X 2, la distanza euclidea è pari a d(i, i ) = (X 1i X 1i ) 2 + (X 2i X 2i ) 2. Calcoliamo la distanza euclidea tra le 4 unità statistiche, e otteniamo la seguente matrice delle distanze (ii) La distanza euclidea standardizzata si ottiene pesando ciascun termine della sommatoria per il reciproco della varianza della variabile corrispondente, oppure calcolando la distanza euclidea tra le variabili standardizzate. Dato che gli elementi (X ji X ji ) 2, j = 1, 2, sono già stati calcolati, risulta più conveniente adottare la formula della distanza euclidea ponderata, con pesi pari al reciproco delle varianze. Calcoliamo la varianza di X 1 e X 2, σ 2 1 = 3.33 e σ 2 2 = 8.66, e otteniamo d(i, i ) = 1 (X σ1 2 1i X 1i ) (X σ2 2 2i X 2i ) 2 Otteniamo quindi la matrice delle distanze euclidee standardizzate L importanza di ogni variabile nella determinazione della distanza è proporzionale alla varianza. Per eliminare l effetto di questa ponderazione implicita possiamo standardizzare le variabili. La standardizzazione elimina l effetto dell unità di misura, pertanto le distanze standardizzate sono numeri puri. 4

5 I due indici forniscono risultati diversi, sia in termini di valori che di ordinamento. B2 Considerando le sole variabili X 3 e X 4 possiamo utilizzare come indice di similarità l indice di Gower s(i, i ) = j c ii j/ j w ii j dove j è l indice riferito alla variabile, quindi j=3,4 nel caso che si sta considerando. Se si pone w ii j = 1 sempre e c ii j = 1 per le coppie conconcordanti, cioè per (1, 1) e (0, 0), e c ii j = 0 per le coppie discordanti, cioè per (1, 0) e (0, 1), si ottiene l indice di Sokal e Michener che valuta in egual modo le coppie (1, 1) e (0, 0): s(i, i ) = [c ii 1 + c ii 2]/2 La matrice di similarità che si ottiene utilizzando questo indice è: B3 Per valutare la distanza tra le quattro unità utilizzando tutte e quattro le variabili, si può utilizzare l indice di similarità di Gower prima definito s(i, i ) = 4 c ii j/ j=1 4 j=1 w ii j con j = 1, 2, 3, 4 e w ii j = 1. Il valore da utilizzare per c ii j corrsiponde a quanto definito in [B2] per le variabili qualitative X 3 e X 4, mentre per le variabili quantitative X 1 e X 2 si pone c ii j = 1 x ij x i j /R j, con R j campo di variazione della variabile X j, j = 1, 2: s(i, i ) = 4 c ii j/4 j=1 B4 Le proprietà che devono essere soddisfatte da un indice di distanza sono le seguenti d(i, i ) 0 non negatività d(i, i ) = d(i, i) simmetria d(i, i ) = 0 sse i e i hanno lo stesso valore per tutte le X d(i, i ) > d(i, i ) i più vicina a i 5

6 Esercizi da svolgere con il computer Esercizio C Si veda il programma SAS compito sas. Nel compito vanno riportati i risultati e, soprattutto, i commenti richiesti. Esercizio D Si veda il programma SAS compito sas. Nel compito vanno riportati i risultati e, soprattutto, i commenti richiesti. 6

Prova finale del 6 giugno 2011

Prova finale del 6 giugno 2011 Prova finale del 6 giugno 2011 Esercizio A, da svolgere con carta e penna Si consideri la seguente matrice dei dati relativa a 3 unità statistiche e 3 variabili, X 1 e X 2 quantitative, X 3 dicotomica.

Dettagli

Analisi Multivariata Prova intermedia del 20 aprile 2011

Analisi Multivariata Prova intermedia del 20 aprile 2011 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.

Dettagli

Prova scritta - fila A Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 70 minuti

Prova scritta - fila A Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 70 minuti 17 Aprile 2019 - Analisi Esplorativa Cognome:................................................... Nome:...................................................... Matricola:...................................................

Dettagli

Esercitazione 1. 6 Marzo 2019

Esercitazione 1. 6 Marzo 2019 Esercitazione 1 6 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze;

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; EsercitazioneII In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; la correlazione; la regressione; introduzione alla probabilità. 1 Esercizio 1 Gli stipendi

Dettagli

Esercitazione Marzo 2019

Esercitazione Marzo 2019 Esercitazione 13 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)

Dettagli

Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60 minuti

Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60 minuti 3 Luglio 2018 - Analisi Esplorativa Cognome:... Nome: Matricola:... Tipologia d esame: 12 CFU 15 CFU Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Tema d esame del 15/02/12

Tema d esame del 15/02/12 Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi

Dettagli

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003 19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25

Dettagli

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 Cognome docente: P. Vicard Nome Al termine di ogni esercizio è lasciato lo spazio per scrivere la soluzione (corredata degli opportuni passaggi). La

Dettagli

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi

Dettagli

Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012

Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 Analisi Multivariata Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 La Tabella 1 contiene la classificazione in base alla qualifica e all abitudine al fumo di 193 dirigenti e impiegati di

Dettagli

Rappresentazione dei dati multivariati

Rappresentazione dei dati multivariati Rappresentazione dei dati multivariati Quando si hanno più di due varabili la posizione di ciascuna unità rispetto alle altre può essere rappresentata nel diagramma relativo alle prime due CP l importanza

Dettagli

Destagionalizzazione, detrendizzazione delle serie storiche

Destagionalizzazione, detrendizzazione delle serie storiche DATA MINING PER IL MARKETING (63 ore) Marco Riani mriani@unipr.it Sito web del corso http://www.riani.it/dmm Destagionalizzazione, detrendizzazione delle serie storiche 1 Serie storica della vendita di

Dettagli

Analisi in Componenti Principali

Analisi in Componenti Principali Analisi in Componenti Principali 1/20 Analisi in Componenti Principali tecnica di riduzione e interpretazione dei dati spesso gioca un ruolo ausiliario rispetto ad altre tecniche (es. analisi fattoriale,

Dettagli

Analisi dei Fattori. Francesca Marta Lilja Di Lascio Dip.to di Scienze Statistiche P. Fortunati Università di Bologna

Analisi dei Fattori. Francesca Marta Lilja Di Lascio Dip.to di Scienze Statistiche P. Fortunati Università di Bologna Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Analisi dei Fattori Francesca Marta Lilja

Dettagli

Analisi in Componenti Principali

Analisi in Componenti Principali Analisi in Componenti Principali 1/20 Analisi in Componenti Principali Analisi in Componenti Principali 1/20 Analisi in Componenti Principali tecnica di riduzione e interpretazione dei dati spesso gioca

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Indici di variabilità

Indici di variabilità Indici di variabilità 1. Prendendo in considerazione il numero di addetti per classi e le aziende: Addetti Aziende 0-5 195 5-10 225 10-25 360 25-40 180 40-100 40 - determinare la varianza e lo scarto quadratico

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

62 CAPITOLO 3. STATISTICA DESCRITTIVA

62 CAPITOLO 3. STATISTICA DESCRITTIVA 62 CAPITOLO 3. STATISTICA DESCRITTIVA Raccogliamo su una popolazione di n individui i dati relativi a m caratteri (variabili) e riportiamoli in una matrice, dove le righe (n) sono relative ad individui

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

9.3 Il metodo dei minimi quadrati in formalismo matriciale

9.3 Il metodo dei minimi quadrati in formalismo matriciale 9.3. IL METODO DEI MINIMI QUADRATI IN FORMALISMO MATRICIALE 121 9.3 Il metodo dei minimi quadrati in formalismo matriciale Per applicare il MMQ a funzioni polinomiali, ovvero a dipendenze di una grandezza

Dettagli

ESAME. 9 Gennaio 2017 COMPITO A

ESAME. 9 Gennaio 2017 COMPITO A ESAME 9 Gennaio 2017 COMPITO A Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

STATISTICA (I MODULO - STATISTICA DESCRITTIVA) Esercitazione I 23/02/2007

STATISTICA (I MODULO - STATISTICA DESCRITTIVA) Esercitazione I 23/02/2007 Esercitazione I 23/02/2007 La seguente tabella contiene i dati inerenti le imprese di ristorazione di un dato comune: Unità X 1 X 2 X 3 X 4 X 5 X 6 Unità X 1 X 2 X 3 X 4 X 5 X 6 1 1600 20 4 52 3 3 26 141

Dettagli

Analisi dei dati per la comunicazione

Analisi dei dati per la comunicazione Analisi dei dati per la comunicazione La costruzione e l uso di misure relative semplici e complesse Prof.ssa Isabella Mingo A.A. 2014-2015 La costruzione di indici complessi: fasi In definitiva, la costruzione

Dettagli

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1. STATISTICA Esonero 8 novembre 2014 Soluzione Quesito 1. Si consideri la seguente distribuzione unitaria dei salari degli impiegati di una compagnia (migliaia di euro): 3 4 6 4 3 10 4 8 9 2 a) calcolare

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. La variabile casuale normale Da un analisi di bilancio è emerso che, durante i giorni feriali

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

Differenze tra metodi di estrazione

Differenze tra metodi di estrazione Lezione 11 Argomenti della lezione: L analisi fattoriale: il processo di estrazione dei fattori Metodi di estrazione dei fattori Metodi per stabilire il numero di fattori Metodi di Estrazione dei Fattori

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 8 Massimo Guerriero Ettore Benedetti Consegna 1. Implementare delle funzioni che, accettando opportuni parametri in ingresso, risolvano le formule viste

Dettagli

STATISTICA A K (63 ore)

STATISTICA A K (63 ore) STATISTICA A K (63 ore) Marco Riani mriani@unipr.it http://www.riani.it Es. Distribuzione di frequenze della spesa effettuata in una settimana dai titolari della carta fedeltà di un supermercato CLASSI

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Analisi Fattoriale Analisi Esplorativa

Analisi Fattoriale Analisi Esplorativa Analisi Fattoriale Analisi Esplorativa Aldo Solari 1 / 31 Introduzione Nelle scienze sociali, in particolare in psicologia, spesso è problematico misurare le variabili di interesse direttamente. Ad esempio:

Dettagli

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo I due semplici esercizi seguenti hanno l obiettivo di consolidare le nostre nozioni in tema di

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006

STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 La seguente tabella contiene i dati inerenti le unità del settore della ristorazione in un dato comune: Unità X 1 X 2 X 3 X 4 X

Dettagli

Numeri Indici Esercitazione n 05

Numeri Indici Esercitazione n 05 Numeri Indici Esercitazione n 05 ESERCIZIO 1 Nella seguente tabella sono riportati il valore monetario (prezzo per quantità) di quattro merci nel mercato ortofrutticolo all ingrosso italiano nel 1991 e

Dettagli

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1. STATISTICA Esonero 8 novembre 2014 Soluzione Quesito 1. Si consideri la seguente distribuzione unitaria dei salari degli impiegati di una compagnia (migliaia di euro): 2 3 5 3 2 9 3 7 8 1 a) calcolare

Dettagli

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),

Dettagli

ESERCIZI DI RIEPILOGO 1

ESERCIZI DI RIEPILOGO 1 ESERCIZI DI RIEPILOGO 1 ESERCIZIO 1 La tabella seguente contiene la distribuzione di frequenza della variabile X = età (misurata in anni) per un campione casuale di bambini: x i 4.6 8 3.2 3 5.4 6 2.6 2

Dettagli

Statistica multivariata 27/09/2016. D.Rodi, 2016

Statistica multivariata 27/09/2016. D.Rodi, 2016 Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche

Dettagli

Richiami di statistica e loro applicazione al trattamento di osservazioni topografiche e geodetiche

Richiami di statistica e loro applicazione al trattamento di osservazioni topografiche e geodetiche Richiami di statistica e loro applicazione al trattamento di osservazioni topografiche e geodetiche Ludovico Biagi Politecnico di Milano, DIIAR ludovico.biagi@polimi.it (materiale didattico preparato in

Dettagli

Analisi esplorativa di dati multidimensionali

Analisi esplorativa di dati multidimensionali io e Luigi Fabbris Analisi esplorativa di dati multidimensionali 'CENTRO " G. ASTENGO» cleup editore INVENTARIO 2B6 c., INDICE DEI CONTENUTI -~ Cap. 1 L'analisi dei dati nella ricerca sociale pag. I 1.1.

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Misure di diversità tra unità statistiche. Loredana Cerbara

Misure di diversità tra unità statistiche. Loredana Cerbara Misure di diversità tra unità statistiche Loredana Cerbara LA DISTANZA IN STATISTICA In statistica la distanza ha un significato diverso da quello che si può intuire in altre discipline, dove, peraltro,

Dettagli

Identificazione dei Modelli e Analisi dei Dati

Identificazione dei Modelli e Analisi dei Dati Identificazione dei Modelli e Analisi dei Dati Prof. G. De Nicolao Prova scritta - 18 Giugno 2013 Cognome Nome Matricola Firma Compilare a penna questo foglio all inizio della prova. Durante lo svolgimento

Dettagli

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/6c_pca.html#(1) 1/25 Introduzione Gli approcci

Dettagli

Statistica multivariata Donata Rodi 21/11/2016

Statistica multivariata Donata Rodi 21/11/2016 Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di

Dettagli

IDENTIFICAZIONE DEI MODELLI E ANALISI DEI DATI 1 (Prof. S. Bittanti) Ingegneria Informatica 5 CFU. Appello 23 Luglio 2014 Cognome Nome Matricola

IDENTIFICAZIONE DEI MODELLI E ANALISI DEI DATI 1 (Prof. S. Bittanti) Ingegneria Informatica 5 CFU. Appello 23 Luglio 2014 Cognome Nome Matricola IDENTIFICAZIONE DEI MODELLI E ANALISI DEI DATI 1 (Prof. S. Bittanti) Ingegneria Informatica 5 CFU. Appello 23 Luglio 201 Cognome Nome Matricola............ Verificare che il fascicolo sia costituito da

Dettagli

Si estrae casualmente usando uno schema di campionamento con ripetizione un campione di n=2 misurazioni.

Si estrae casualmente usando uno schema di campionamento con ripetizione un campione di n=2 misurazioni. ESERCIZIO 1 Si consideri la popolazione consistente di N=4 studenti (A, B, C, D) del corso di Statistica Avanzata. Il voto conseguito dagli studenti alla fine del corso è riportato nella seguente tabella:

Dettagli

Prova scritta di ASM - Modulo Analisi Esplorativa del

Prova scritta di ASM - Modulo Analisi Esplorativa del Cognome:... Nome:... Matricola:......... Prova scritta di ASM - Modulo Analisi Esplorativa del 14.02.2017 La durata della prova è di 90 minuti. Si svolgano gli esercizi A e B riportando il risultato dove

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Variabilità e Concentrazione Esercitazione n 02

Variabilità e Concentrazione Esercitazione n 02 Variabilità e Concentrazione Esercitazione n 02 ESERCIZIO 1 Nella tabella di seguito sono riportati i dati relativi al tempo necessario a 8 studenti per svolgere un test di valutazione (in ore): Tempo

Dettagli

Distribuzioni Statistiche e Medie Esercitazione n 01

Distribuzioni Statistiche e Medie Esercitazione n 01 Distribuzioni Statistiche e Medie Esercitazione n 01 ESERCIZIO 1 In una clinica pediatrica si è registrato, nell'ultima settimana, il peso alla nascita dei neonati (in kg): Peso (in Kg) 2,7 1,8 4,6 2,9

Dettagli

Metodi Statistici per il Marketing. #06 Elementi di statistica inferenziale e di teoria dei campioni

Metodi Statistici per il Marketing. #06 Elementi di statistica inferenziale e di teoria dei campioni Corso di Metodi Statistici per il Marketing LUISS A.A. 2017-2018 #06 Elementi di statistica inferenziale e di teoria dei campioni 22 Marzo 2018 Alessio Guandalini (Docente: P. D Urso) #06 Elementi di statistica

Dettagli

Scheda n. 13: modelli lineari

Scheda n. 13: modelli lineari Scheda n. 13: modelli lineari December 4, 2008 1 Combinazioni affini di variabili aleatorie La teoria che stiamo per esporre vuole descrivere relazioni matematiche tra variabili aleatorie: in tali relazioni

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

Analisi economica NUTS (regioni) Europee

Analisi economica NUTS (regioni) Europee Analisi economica NUTS (regioni) Europee Con riferimento al dataset fornito: 1. Calcolare la distribuzione di frequenze assolute, relative e percentuali delle microaree NUTS per le cinque classi di popolazione

Dettagli

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Indicatori [1/4] Gli indicatori: sintetizzano le caratteristiche di un fenomeno colgono aspetti e problemi del fenomeno che non hanno una immediata

Dettagli

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018 Esperimentazioni di Fisica 1 Prova in itinere del 1 giugno 018 Esp-1 Prova in Itinere n. - - Page of 6 1/06/018 1. (1 Punti) Quesito L incertezza da associare alle misurazioni eseguite con un certo strumento

Dettagli

ECONOMETRIA: Laboratorio I

ECONOMETRIA: Laboratorio I ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una

Dettagli

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008.

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. ESERCIZIO I Si è applicata l analisi delle componenti principali a 97 modelli di fotocamere digitali, considerando 7 variabili ed ottenendo

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

Psicometria con Laboratorio di SPSS 2

Psicometria con Laboratorio di SPSS 2 Psicometria con Laboratorio di SPSS 2 Esempio di fattoriale esplorativa (v. 1.1, 12 aprile 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. La variabile Uniforme Continua Data una scheda telefonica da 5 euro di cui non si sa se sia

Dettagli

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 4. STATISTICA DESCRITTIVA ESERCIZI Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144

Dettagli

Università degli Studi di Padova Facoltà di Scienze Politiche. Laurea: Scienze Sociologiche Laurea: Vecchio Ordinamento

Università degli Studi di Padova Facoltà di Scienze Politiche. Laurea: Scienze Sociologiche Laurea: Vecchio Ordinamento Università degli Studi di Padova Facoltà di Scienze Politiche STATISTICA PER LE SCIENZE SOCIALI Prova scritta del 12/02/2008 Laurea: Scienze Sociologiche Laurea: Vecchio Ordinamento (pd120208.tex) Cognome

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Metodologie Quantitative. Analisi Fattoriale

Metodologie Quantitative. Analisi Fattoriale Metodologie Quantitative Analisi Fattoriale La soluzione fattoriale ed il modello ACP M Q Marco Perugini Milano-Bicocca 1 Correlazioni e Varianze Ricordate che la correlazione (al quadrato) indica la varianza

Dettagli

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di

Dettagli

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A MODALITÀ A Riportare sul foglio nome, cognome, numero di matricola e modalità del testo d esame. Problema 1 (8 PUNTI) Su un collettivo di 10 clienti iscritti al programma frequent flyer di una nota compagnia

Dettagli

Statistica Un Esempio

Statistica Un Esempio Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe

Dettagli

Teoria e tecniche dei test DIMENSIONALITA DI UN TEST DIMENSIONALITA DI UN TEST (2) 03/04/2012. Lezione 7 DIMENSIONALITA e ATTENDIBILITA

Teoria e tecniche dei test DIMENSIONALITA DI UN TEST DIMENSIONALITA DI UN TEST (2) 03/04/2012. Lezione 7 DIMENSIONALITA e ATTENDIBILITA Teoria e tecniche dei test Lezione 7 DIMENSIONALITA e ATTENDIBILITA DIMENSIONALITA DI UN TEST Una domanda cruciale da porsi nella fase di messa a punto di un test riguarda la sua dimensionalità. La tecnica

Dettagli

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/02/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra

Dettagli

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,

Dettagli

LE REGOLE PER IL RILASCIO DEI RISULTATI DELLE ELABORAZIONI

LE REGOLE PER IL RILASCIO DEI RISULTATI DELLE ELABORAZIONI Giugno 2019 LE REGOLE PER IL RILASCIO DEI RISULTATI DELLE ELABORAZIONI Estratto da: Il Laboratorio per l Analisi dei Dati ELEmentari (ADELE) Guida all utenza Per qualsiasi comunicazione o richiesta di

Dettagli

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco Esercitazione del corso di Statistica Prof. Domenico Vistocco Alfonso Iodice D Enza May 30, 007 1 Esercizio Si consideri una popolazione caratterizzata dai numeri, 3, 6, 8, 11. Si considerino tutti i possibili

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica parte 1 Massimo Guerriero Ettore Benedetti Indice Esercizi Presentazione dei dati Misure di sintesi numerica Probabilità Distribuzioni teoriche di probabilità Distribuzione

Dettagli

Q1 = /4 0 4 = Me = /2 4 = 3

Q1 = /4 0 4 = Me = /2 4 = 3 Soluzioni Esercizi Capitolo - versione on-line Esercizio.: Calcoliamo le densità di frequenza x i x i+1 n i N i a i l i F i 0 1 4 4 1 4/1=4 4/10 = 0.4 1 5 6 4 /4=0.5 6/10 = 0.6 5 10 4 10 5 4/5=0.8 10/10

Dettagli

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA AZIENDALE Modulo Controllo di Qualità STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la

Dettagli

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università

Dettagli