Analisi delle componenti principali

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Analisi delle componenti principali"

Transcript

1 Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste nell individuare delle combinazioni lineari delle variabili osservate, che siano incorrelate tra loro ed abbiano varianza massima La versione attuale della teoria delle componenti principali è dovuta ad H. Hotelling (1933) A. Pollice - Statistica Multivariata

2 Dell universo campionario k-dimensionale X si osservino n osservazioni indipendenti X = x 11. x 1k. x n1 x nk Media e varianza campionarie X = X u n /n, S = (X u n X ) (X u n X )/n

3 Si vuole determinare il vettore a 1 tale che abbia varianza massima e 1 = Xa 1 Var(e 1 ) = a 1 Sa 1

4 Problema di massimo vincolato { maxa1 a 1 Sa 1 a 1 a 1 = 1 Funzione lagrangiana (a 1, λ) = a 1 Sa 1 λ(a 1 a 1 1) Sistema per la soluzione del problema di massimo vincolato a 1 (a 1, λ) = 2Sa 1 2λa 1 = o λ (a 1, λ) = a 1 a 1 1 = 0

5 a 1 corrisponde all autovettore di norma unitaria associato ad un autovalore λ della matrice S La varianza che si vuole massimizzare è data da Var(e 1 ) = a 1 Sa 1 = λa 1 a 1 = λ La prima componente principale e 1 = Xa 1 è definita dall autovettore a 1 associato al più grande degli autovalori di S, indicato con λ 1

6 Seconda componente principale e 2 = Xa 2 Si aggiunge la condizione di incorrelazione con e 1 : problema di massimo vincolato max a2 a 2 Sa 2 a 2 a 2 = 1 a 2 Sa 1 = 0 Funzione lagrangiana (a 2, λ, ν) = a 2 Sa 2 λ(a 2 a 2 1) νa 2 Sa 1

7 Sistema per la soluzione del problema di massimo vincolato a 2 (a 2, λ, ν) = 2Sa 2 2λa 2 νsa 1 = o λ (a 2, λ, ν) = a 2 a 2 1 = 0 ν (a 2, λ, ν) = a 2 Sa 1 = 0 Con qualche passaggio algebrico la prima equazione del sistema si riduce all equazione caratteristica Sa 2 = λa 2 a 2 è l autovettore di norma unitaria associato ad uno degli autovalori della matrice S

8 Var(e 2 ) = a 2 Sa 2 = λa 2 a 2 = λ implica che l autovalore che definisce la seconda componente principale coincide con il secondo più grande autovalore di S indicato con λ 2 E possibile definire un numero di componenti principali pari al rango k della matrice S e 1 = Xa 1,..., e k = Xa k

9 Varianze delle componenti principali Var(e 1 ) = λ 1 Var(e k ) = λ k La somma delle varianze delle componenti principali è uguale alla somma delle varianze campionarie delle variabili originarie. k j=1 Var(e j ) = tr(s) = k j=1 Var(X j )

10 Assunzione di normalità della popolazione X abbia distribuzione normale k-dimensionale con E(X) = µ e Cov(X) = Σ la matrice di varianze e covarianze campionarie S coincide con lo stimatore di massima verosimiglianza di Σ proprietà di invarianza degli stimatori di massima verosimiglianza: ˆθ è stimatore di massima verosimiglianza di θ e φ è una trasformazione biunivoca, allora φ(ˆθ) è stimatore di massima verosimiglianza di φ(θ)

11 una trasformazione biunivoca di S è data da { Sa1 = λ 1 a 1 a 1 a 1 = 1 λ 1 ed a 1 sono stimatori di massima verosimiglianza dei parametri λ 1 ed ã 1, definiti dalla stessa trasformazione biunivoca di Σ { Σã1 = λ 1 ã 1 ã 1ã1 = 1 Nel caso in cui la matrice Σ abbia degli autovalori uguali, gli stimatori di massima verosimiglianza degli autovalori multipli sono dati dalle medie aritmetiche dei corrispondenti autovalori campionari

12 Distribuzione campionaria asintotica di autovalori e autovettori X abbia distribuzione N k (µ, Σ) e Σ sia dotata di k autovalori distinti lim n λ j N λ j, 2 λ 2 j n j = 1,..., k gli autovalori λ 1,..., λ k sono asintoticamente indipendenti

13 lim n a j N k ã j, λ j k h( j)=1 λ h ( λ j λ h ) 2ãhã h j = 1,..., k

14 Problemi applicativi Unità di misura: un cambiamento di scala nei dati modifica la matrice di varianze e covarianze campionarie con i suoi autovalori e autovettori l ACP è influenzata dalla dimensione dei dati e dalle unità di misura in cui sono espressi

15 Variabili standardizzate: la matrice di varianze e covarianze campionarie di Y = (Y 1,..., Y k ) coincide con la matrice R dei coefficienti di correlazione campionari di X = (X 1,..., X k ) Y 1 = X 1 u n X 1 S1 2,..., Y k = X k u n X k Sk 2 L ACP viene condotta calcolando gli autovalori e autovettori della matrice R

16 Interpretazione delle componenti principali La j-esima componente principale ha la forma e j = a 1j X a kj X k a hj è il peso della variabile X h nella determinazione della componente j-esima La covarianza campionaria tra la j-esima componente principale e la h-esima variabile X h è Cov(e j, X h ) = = λ j a hj

17 Il coefficiente di correlazione campionario tra e j e X h misura la quota della variabilità di X h spiegata dalla j-esima componente principale r ej X h = Cov(e j, X h ) Var(e j )Sh 2 = a hj λ j S 2 h Essendo le e j incorrelate, la quota di variabilità di X h spiegata da un insieme G di componenti principali è misurata dalla somma r ej X h j G

18 Scelta del numero di componenti principali I q = λ λ q λ λ k L indice misura la quota di varianza totale spiegata dalle prime q componenti principali: il numero ottimale di componenti q è il più piccolo valore per cui I q > I, dove I è la frazione della varianza totale che si vuole sia spiegata dalle componenti principali (spesso I 0, 9) Si escludono le componenti associate ad autovalori inferiori alla media aritmetica degli autovalori di S

19 Scree graph vengono rappresentati i punti (j, λ j ) per j = 1,..., k uniti da segmenti: Si sceglie il valore di q tale che l andamento del grafico sia decrescente a sinistra di q e pressoché costante o debolmente decrescente alla sua destra Se con γ si indica un numero piccolo a piacere si può verificare il sistema di ipotesi H 0 : λ q λ k = γ λ λ k H 1 : λ q λ k > γ λ λ k tramite la statistica test asintoticamente normale U = λ q λ k λ λ k

20 Test di isotropia { H0 : λ q+1 = = λ k = λ H 1 : gli autovalori sono diversi Nell applicazione di questo test si comincia considerando q = 0 e si procede aumentando q sinchè H 0 non viene accettata La funzione test è costruita tramite il criterio del rapporto di verosimiglianze generalizzato 2 ln ( L( X, ˆΣ ) L( X, S) ) = = n (k q) ln λ k j=q+1 ln λ j e si distribuisce asintoticamente come una χ 2 con m = (k q + 2)(k q 1)/2 gradi di libertà.

Analisi delle componenti principali

Analisi delle componenti principali Capitolo 7 Analisi delle componenti principali Lo studio di posizione, dispersione ed interdipendenze relative a k variabili osservate su n individui richiede il calcolo di k medie, k varianze e k(k 1)/

Dettagli

Analisi della correlazione canonica

Analisi della correlazione canonica Analisi della correlazione canonica Su un collettivo di unità statistiche si osservano due gruppi di k ed m variabili L analisi della correlazione canonica ha per obiettivo lo studio delle relazioni di

Dettagli

Analisi della correlazione canonica

Analisi della correlazione canonica Capitolo 8 Analisi della correlazione canonica Si supponga che su un collettivo di unità statistiche si siano osservati due gruppi di k ed m variabili corrispondenti ad altrettanti aspetti di un fenomeno

Dettagli

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate Introduzione Notazione Modello additivo Verifica d ipotesi Sia X una variabile q-dimensionale, a valori reali, non degenere, osservata in k tempi diversi (τ 1, τ 2,..., τ k ), sulle stesse n unità statistiche

Dettagli

Analisi in Componenti Principali (ACP)

Analisi in Componenti Principali (ACP) Analisi in Componenti Principali (ACP) Metodi di analisi fattoriale Obiettivo: individuazione di variabili di sintesi = dimensioni = variabili latenti = variabili non osservate Approccio: Ordinamenti tra

Dettagli

Inferenza sui parametri della normale multidimensionale

Inferenza sui parametri della normale multidimensionale Capitolo 3 Inferenza sui parametri della normale multidimensionale Un campione casuale semplice k-dimensionale di numerosità n è rappresentato da X 1 X 11. X 1k,..., X n X n1. X nk dove i vettori aleatori

Dettagli

Statistica per l Impresa

Statistica per l Impresa Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale L analisi delle componenti principali 14 maggio 2018 Introduzione L Obiettivo dell ACP L Analisi delle Componenti Principali

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello

Dettagli

Modelli lineari generalizzati

Modelli lineari generalizzati Modelli lineari generalizzati Estensione del modello lineare generale Servono allo studio della dipendenza in media di una variabile risposta da una o più variabili antecedenti Vengono attenuate alcune

Dettagli

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c.

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c. Stima dei parametri Sia il carattere X rappresentato da una variabile casuale (v.c.) che si distribuisce secondo la funzione di probabilità f(x). Per investigare su tale carattere si estrae un campione

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte Cap.1: Probabilità 1. Esperimento aleatorio (definizione informale): è un esperimento che a priori può avere diversi esiti possibili

Dettagli

Analisi Multivariata Prova intermedia del 20 aprile 2011

Analisi Multivariata Prova intermedia del 20 aprile 2011 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.

Dettagli

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

L Analisi in Componenti Principali (S. Terzi)

L Analisi in Componenti Principali (S. Terzi) L Analisi in Componenti Principali (S. Terzi) Data una matrice dei dati riferiti ad n individui e k variabili quantitative, si sintetizzano i dati nel senso di pervenire ad una riduzione delle colonne

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Distribuzione normale multidimensionale

Distribuzione normale multidimensionale Capitolo 2 Distribuzione normale multidimensionale La funzione di densità normale undimensionale ha la forma seguente Anderson, 1984 fx ce 1 2 Ax b2 ce 1 2 x bax b La costante di normalizzazione c è data

Dettagli

Rappresentazione dei dati multivariati

Rappresentazione dei dati multivariati Rappresentazione dei dati multivariati Quando si hanno più di due varabili la posizione di ciascuna unità rispetto alle altre può essere rappresentata nel diagramma relativo alle prime due CP l importanza

Dettagli

Vettore (o matrice) casuale (o aleatorio): vettore (o matrice) i cui elementi sono variabili aleatorie

Vettore (o matrice) casuale (o aleatorio): vettore (o matrice) i cui elementi sono variabili aleatorie Variabili (vettori e matrici) casuali Variabile casuale (o aleatoria): Variabile che può assumere un insieme di valori ognuno con una certa probabilità La variabile aleatoria rappresenta la popolazione

Dettagli

62 CAPITOLO 3. STATISTICA DESCRITTIVA

62 CAPITOLO 3. STATISTICA DESCRITTIVA 62 CAPITOLO 3. STATISTICA DESCRITTIVA Raccogliamo su una popolazione di n individui i dati relativi a m caratteri (variabili) e riportiamoli in una matrice, dove le righe (n) sono relative ad individui

Dettagli

Statistica Applicata all edilizia: Stime e stimatori

Statistica Applicata all edilizia: Stime e stimatori Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica

Dettagli

Varianza totale e generalizzata Analisi Esplorativa

Varianza totale e generalizzata Analisi Esplorativa Varianza totale e generalizzata Analisi Esplorativa Aldo Solari 1 / 49 1 Varianza totale 2 Varianza generalizzata 3 Appendice 2 / 49 Variabilità Nel caso p = 1, la variabilità (o dispersione) presente

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

ANALISI MULTIDIMENSIONALE DEI DATI (AMD)

ANALISI MULTIDIMENSIONALE DEI DATI (AMD) ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Analisi Multidimensionale dei Dati (AMD) è una famiglia di tecniche il cui obiettivo principale è la visualizzazione, la classificazione e l interpretazione della

Dettagli

Differenze tra metodi di estrazione

Differenze tra metodi di estrazione Lezione 11 Argomenti della lezione: L analisi fattoriale: il processo di estrazione dei fattori Metodi di estrazione dei fattori Metodi per stabilire il numero di fattori Metodi di Estrazione dei Fattori

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell ' Lezione 2 Argomenti della lezione: La statistica inferenziale: concetti di base Campionamento Stima Distribuzione campionaria Popolazione (o universo) Insieme di tutti gli elementi cui si rivolge il ricercatore

Dettagli

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Lezione 1 - Mercoledì 27 Settembre 2017 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Analisi statistica e matematico-finanziaria II. Alfonso Iodice D Enza Università degli studi di Cassino e del Lazio Meridionale

Analisi statistica e matematico-finanziaria II. Alfonso Iodice D Enza Università degli studi di Cassino e del Lazio Meridionale delle sui delle Analisi statistica e matematico-finanziaria II Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale sulle particolari ali dei dati Outline

Dettagli

questa variabile corrisponde alla somma ponderata delle variabili originarie in cui i pesi sono costituiti dai coefficienti a ij

questa variabile corrisponde alla somma ponderata delle variabili originarie in cui i pesi sono costituiti dai coefficienti a ij 5. COMPONENTI PRINCIPALI 5.1 Introduzione L analisi in componenti principali (CP) si pone l obiettivo di determinare quelle trasformazioni lineari delle h variabili originarie X i (i = 1, 2,, h), linearmente

Dettagli

ECONOMETRIA: Laboratorio I

ECONOMETRIA: Laboratorio I ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una

Dettagli

Analisi Statistica Multivariata Modulo Modelli Statistici

Analisi Statistica Multivariata Modulo Modelli Statistici Analisi Statistica Multivariata Modulo Modelli Statistici Gianna Monti 8 novembre 013 1 Approfondimenti 1 1.1 Esercizi Esercizio 1 Galton e il suo allievo Karl Pearson condussero alcuni studi in merito

Dettagli

STATISTICA (modulo II - Inferenza Statistica) Soluzione Esercitazione I

STATISTICA (modulo II - Inferenza Statistica) Soluzione Esercitazione I Soluzione Esercitazione I Esercizio A. Si indichi con A i l evento la banca i decide di aprire uno sportello per il quale Pr(A i = 0.5 (e dunque Pr(A i = 0.5 per i =, 2, 3. Lo spazio degli eventi dato

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Esercitazione su Filtraggio Adattativo (17 Giugno 2008)

Esercitazione su Filtraggio Adattativo (17 Giugno 2008) Esercitazione su Filtraggio Adattativo 17 Giugno 008) D. Donno Esercizio 1: Stima adattativa in rumore colorato Una sequenza disturbante x n è ottenuta filtrando un processo bianco u n con un filtro FIR

Dettagli

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa L ipotesi che si vuole testare: H 0 (ipotesi nulla)

Dettagli

Calcolo delle Probabilità e Statistica Matematica previsioni 2003/04

Calcolo delle Probabilità e Statistica Matematica previsioni 2003/04 Calcolo delle Probabilità e Statistica Matematica previsioni 2003/04 LU 1/3 Esempi di vita reale : calcolo delle probabilità, statistica descrittiva e statistica inferenziale. Lancio dado/moneta: definizione

Dettagli

Statistica multivariata Donata Rodi 08/11/2016

Statistica multivariata Donata Rodi 08/11/2016 Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui

Dettagli

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Professor Paolo Vitale Anno Accademico 2017-8 UdA, Scuola d Economia Domanda 1 [6 punti]. (a) La multi-collineartità

Dettagli

Variabili casuali multidimensionali

Variabili casuali multidimensionali Variabili casuali multidimensionali Variabili casuali multidimensionali: k-ple ordinate di variabili casuali unidimensionali definite sullo stesso spazio di probabilità X = (X 1,..., X k ) Funzione di

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Esercizi possibili di probabilità e statistica Notazioni: U(a, b) è la distribuzione di probabilità uniforma nell intervallo (a,

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /

Dettagli

Analisi Fattoriale Analisi Esplorativa

Analisi Fattoriale Analisi Esplorativa Analisi Fattoriale Analisi Esplorativa Aldo Solari 1 / 31 Introduzione Nelle scienze sociali, in particolare in psicologia, spesso è problematico misurare le variabili di interesse direttamente. Ad esempio:

Dettagli

Alfonso Iodice D Enza

Alfonso Iodice D Enza Strumenti quantitativi per l economia e la finanza I Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale ali dei Il coefficiente () Statistica 1 / 50 Outline

Dettagli

Esercizio di modellistica a tempo discreto

Esercizio di modellistica a tempo discreto Esercizio di modellistica a tempo discreto Si consideri un corso di laurea triennale, e si indichi con k =,, 2,... l anno accademico dall attivazione del corso. Si indichi con x i (k) il numero di studenti

Dettagli

Compito di SISTEMI E MODELLI 24/01/18: PARTE 1

Compito di SISTEMI E MODELLI 24/01/18: PARTE 1 Compito di SISTEMI E MODELLI 4//8: PARTE Non è ammesso l uso di libri, quaderni o calcolatrici programmabili. Le risposte vanno giustificate. Saranno rilevanti per la valutazione anche l ordine e la chiarezza

Dettagli

SDE Marco Riani

SDE Marco Riani SDE 208 Marco Riani mriani@unipr.it http://www.riani.it RIDUZIONE DELLE DIMENSIONI (con riferimento alle variabili Analisi dei fattori Analisi delle componenti principali OBIETTIVI Date p variabili (correlate

Dettagli

Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A

Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A Università di Siena Teoria della Stima Lucidi del corso di A.A. 2002-2003 Università di Siena 1 Indice Approcci al problema della stima Stima parametrica Stima bayesiana Proprietà degli stimatori Stime

Dettagli

Analisi fattoriale. Capitolo 9

Analisi fattoriale. Capitolo 9 Capitolo 9 Analisi fattoriale In generale la correlazione tra due variabili aleatorie X 1 e X 2 può risultare dall associazione di entrambe con una terza variabile F. A tale proposito si è già introdotto

Dettagli

Statistica inferenziale

Statistica inferenziale Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Statistica inferenziale 6/5/2005 Relazione tra dati Possono esistere in uno studio connessioni tra dati differenti che possono legare caratteristiche:

Dettagli

(5 sin x + 4 cos x)dx [9]

(5 sin x + 4 cos x)dx [9] FACOLTÀ DI SCIENZE MM. FF. NN. CORSO DI LAUREA IN SCIENZE NATURALI II Modulo di Matematica con elementi di statistica. Esercitazioni A.A. 009.00. Tutor: Mauro Soro, p.soro@tin.it Integrali definiti Risolvere

Dettagli

Richiami di algebra delle matrici a valori reali

Richiami di algebra delle matrici a valori reali Richiami di algebra delle matrici a valori reali Vettore v n = v 1 v 2. v n Vettore trasposto v n = (v 1, v 2,..., v n ) v n = (v 1, v 2,..., v n ) A. Pollice - Statistica Multivariata Vettore nullo o

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone

Dettagli

Compiti tematici dai capitoli 2,3,4

Compiti tematici dai capitoli 2,3,4 Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Approssimazione normale della Poisson (TLC) In un determinato tratto di strada il numero di incidenti

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018 Esperimentazioni di Fisica 1 Prova in itinere del 1 giugno 018 Esp-1 Prova in Itinere n. - - Page of 6 1/06/018 1. (1 Punti) Quesito L incertezza da associare alle misurazioni eseguite con un certo strumento

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

Elementi di statistica per l econometria

Elementi di statistica per l econometria Indice Prefazione i 1 Teoria della probabilità 1 1.1 Definizioni di base............................. 2 1.2 Probabilità................................. 7 1.2.1 Teoria classica...........................

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza di Variabili Aleatorie Sistema di Variabili

Dettagli

II Esonero - Testo B

II Esonero - Testo B Dip. di Ingegneria, Univ. Roma Tre Prof. E. Scoppola, Dott.M. Quattropani Probabilità e Statistica, 2017-18, I semestre 29 Gennaio 2018 II Esonero - Testo B Cognome Nome Matricola Esercizio 1. (20%) Si

Dettagli

CONTROLLI AUTOMATICI LS Ingegneria Informatica. Analisi modale

CONTROLLI AUTOMATICI LS Ingegneria Informatica. Analisi modale CONTROLLI AUTOMATICI LS Ingegneria Informatica Analisi modale Prof. Claudio Melchiorri DEIS-Università di Bologna Tel. 5 9334 e-mail: claudio.melchiorri@unibo.it http://www-lar.deis.unibo.it/~cmelchiorri

Dettagli

Algebra lineare con R

Algebra lineare con R Università di Napoli Federico II cristina.tortora@unina.it Standardizzare una variabile Standardizzazione Data una variabile X distribuita secondo una media µ e una varianza σ 2 la standardizzazione permette

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Variabili casuali multidimensionali

Variabili casuali multidimensionali Capitolo 1 Variabili casuali multidimensionali Definizione 1.1 Le variabili casuali multidimensionali sono k-ple ordinate di variabili casuali unidimensionali definite sullo stesso spazio di probabilità.

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

Università di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti

Università di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti Università di Siena Corso di STATISTICA Parte seconda: Teoria della stima Andrea Garulli, Antonello Giannitrapani, Simone Paoletti Master E 2 C Centro per lo Studio dei Sistemi Complessi Università di

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

DATA MINING PER IL MARKETING (63 ore)

DATA MINING PER IL MARKETING (63 ore) DATA MINING PER IL MARKETING (63 ore) Marco Riani mriani@unipr.it Sito web del corso http://www.riani.it/dmm Studio della distribuzione di ˆ E( ˆ) var( ˆ) 2 ( X ' X ) 1 Teorema di Gauss Markov (efficienza

Dettagli

Tecniche di sondaggio

Tecniche di sondaggio SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con

Dettagli

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/6c_pca.html#(1) 1/25 Introduzione Gli approcci

Dettagli

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo Statistica 2 Esercitazioni Dott. L 1 1 Dipartimento di Scienze Statistiche e Matematiche S. Vianelli, Università di Palermo ricevimento: lunedì ore 15-17 mercoledì ore 15-17 e-mail: luigi.augugliaro@unipa.it

Dettagli

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte Metodi Quantitativi per Economia, Finanza e Management Lezione n 4 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla

Dettagli

Metodi di analisi statistica multivariata

Metodi di analisi statistica multivariata Metodi di analisi statistica multivariata lzo V

Dettagli

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 5-19/11/2009: A. Matricola: Corso:

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 5-19/11/2009: A. Matricola: Corso: Facoltà di Economia Statistica Esame 5-19/11/2009: A Cognome, Nome: Matricola: Corso: Problema 1. In un indagine di mercato tre tipologie di consumatori, A, B e C hanno espresso un giudizio di gradimento,

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Identificazione dei Modelli e Analisi dei Dati

Identificazione dei Modelli e Analisi dei Dati Identificazione dei Modelli e Analisi dei Dati Prof. G. De Nicolao Prova scritta - 18 Giugno 2013 Cognome Nome Matricola Firma Compilare a penna questo foglio all inizio della prova. Durante lo svolgimento

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

UNIVERSITÀ DEGLI STUDI DI PERUGIA

UNIVERSITÀ DEGLI STUDI DI PERUGIA SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale

Dettagli

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017 Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 9 Argomenti della lezione: La regressione multipla: Approcci analitici Regressione standard Regressione gerarchica Regressione statistica Strategie Analitiche per la regressione Tre principali

Dettagli

0 a a determinare la forma di Jordan e la matrice di cambio da base, al variare di a si discuta la stabilità di F al variare di a

0 a a determinare la forma di Jordan e la matrice di cambio da base, al variare di a si discuta la stabilità di F al variare di a Compito di SISTEMI E MODELLI 09/02/8: PARTE on è ammesso l uso di libri, quaderni o calcolatrici programmabili. Le risposte vanno giustificate. Saranno rilevanti per la valutazione anche l ordine e la

Dettagli

Richiami di probabilità e statistica

Richiami di probabilità e statistica Richiami di probabilità e statistica Una variabile casuale (o aleatoria) X codifica gli eventi con entità numeriche x ed è caratterizzata dalla funzione di distribuzione di probabilità P(x) : P(x)=Pr ob[x

Dettagli

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Approssimazione numerica

Approssimazione numerica Approssimazione numerica Laboratorio di programmazione e calcolo (Chimica e Tecnologie chimiche) Pierluigi Amodio Dipartimento di Matematica Università di Bari Approssimazione numerica p.1/10 Problema

Dettagli

DISTRIBUZIONE ESPONENZIALE Nella forma più usuale la distribuzione esponenziale assume la forma: Le relazioni teoriche dei momenti sono:

DISTRIBUZIONE ESPONENZIALE Nella forma più usuale la distribuzione esponenziale assume la forma: Le relazioni teoriche dei momenti sono: DISTRIBUZIONE ESPONENZIALE Nella forma più usuale la distribuzione esponenziale assume la forma: Le relazioni teoriche dei momenti sono: DISTRIBUZIONE ESPONENZIALE a 2 parametri (con soglia) Se esiste

Dettagli

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2017/2018. Giovanni Lafratta

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2017/2018. Giovanni Lafratta Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2017/2018 Giovanni Lafratta ii Indice 1 Spazi, Disegni e Strategie Campionarie 1 2 Campionamento casuale

Dettagli

Analisi Multivariata Corso di laurea in Statistica

Analisi Multivariata Corso di laurea in Statistica Analisi Multivariata Corso di laurea in Statistica Carla Rampichini 1 Distribuzione Normale multivariata L utilizzo di computer sempre più potenti consente oggi di considerare distribuzioni campionare

Dettagli

I appello di calcolo delle probabilità e statistica

I appello di calcolo delle probabilità e statistica I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale

Dettagli