Principal Component Analysis (PCA)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Principal Component Analysis (PCA)"

Transcript

1 Principal Component Analysis (PCA) Come evidenziare l informazione contenuta nei dati S. Marsili-Libelli: Calibrazione di Modelli Dinamici pag.

2 Perche PCA? E un semplice metodo non-parametrico per estrarre informazione rilevante da un insieme di dati confuso (ridondante + rumoroso). Riesce a eliminare la ridondanza dell informazione nei dati, rappresentata dall autocorrelazione Geometricamente l obiettivo della PCA è presentare i dati nel riferimento che evidenza maggiormente la loro struttura (Cambio di riferimento) pag.

3 Correlazione e ridondanza di informazione Consideriamo una serie di dati bidimensionali, come in figura x x Calcolando R per questi dati si ha Matrice di covarianza σ ρ C ρ σ Matrice di correlazione R : r i, j C C i,i i, j C j, j. R La correlazione fra x e x è circa del %. Ciò significa che il % dell informazione di x è contenuta anche in x Ridondanza pag. 3

4 Standardizzazione dei dati Generalmente si preferisce svolgere la PCA su dati standardizzati Media nulla Varianza unitaria E σ ( x) ( x) x I dati standardizzati si ottengono come x x σ Ovviamente per i dati standardizzati la matrice di Covarianza coincide con la matrice di correlazione C R ( x) C( z) z ( x) R( z) C( z) pag. 4

5 Esempio di dati correlati Consideriamo il sistema di due variabili dipendenti (a parte il rumore ε) x( k) ε ( k) ε k, ε k x k.4 x k ε k ( ) ( ) ( ) x z 4 ( ) ( ) x x pag. 5

6 Matrici di covarianza e correlazione Dati originali (x) C x.96.4 Dati standardizzati (z).4.5 R x C z R z Autovettori di C x Autovalori di C x Autovettori di R x,r z Autovalori di R x,r z W C λ.7 λ.4 W r λ.8 λ.98 pag. 6

7 Riassumendo: su quali dati lavoriamo. Dataset X Eliminazione del valor medio x i X X i,..., p i i Standardizzazione x i * X i X σ i i Calcolo della matrice di covarianza C x x n p p C R Calcolo della matrice di correlazione R i, j C C i,i i, j C i, j,..., p j, j pag. 7

8 Nota sulla standardizzazione La PCA viene normalmente eseguita sulla matrice di Covarianza I dati sono depurati dalla media (PCA su dati a media nulla) Se le componenti dei dati hanno ordini di grandezza molto diversi si può ricorrere alla standardizzazione PCA su dati a media nulla e varianza unitaria La matrice di Covarianza coincide con quella di Correlazione C R Le PCA eseguite su C o su R sono radicalmente diverse perché i rispettivi autovalori e autovalori sono diversi e non ottenibili mediante trasformazione ortonormale Infatti la standardizzazione non è una trasformazione ortogonale Conclusione: Se le componenti di x sono molto diverse è conveniente la PCA su R, tenendo comunque presente che essa sarà diversa da quella ottenuta su C pag. 8

9 Rappresentazione grafica della covarianza n Dato un insieme di dati X R si calcola la matrice di covarianza C C x n X X Si calcolano gli autovettori e gli autovalori λ Fra di essi valgono le relazioni di similitudine C W L W L W C W x x W [ ] con L λ λ x x x + x x Mediante autovalori ed autovettori si può scrivere l equazione parametrica dell ellisse che racchiude il 95% dei dati..96 λ.96 ϕ pag. 9 x cosϕ λ sinϕ Gli autovettori danno le direzioni degli assi dell ellisse e gli autovettori la loro lunghezza (,π )

10 Direzioni principali in funzione della covarianza ν Massima varianza { x,x} { v,v } riferimento originale riferimento che massimizza la var ianza ( autovalori Minima varianza ) ν.96 σ.96 σ x.96 σ.96 σ Guardando in questa direzione si ha la massima risoluzione su v x Guardando in questa direzione si ha la massima risoluzione su v pag.

11 Probabilità congiunta e outliers L ellisse di covarianza indica la regione di 95% di confidenza della distribuzione congiunta delle due variabili. I campioni esterni sono outliers. Perciò permette di evitare le false accettazioni di campioni che sarebbero entro la fascia di confidenza se si considera ciascuna variabile separatamente. x Si vede che il punto rosso è fuori solo se si considera la regione di confidenza bidimensionale - x pag.

12 PCA migliore visualizzazione Il cambio di riferimento può essere visto come un cambio di punto di vista che massimizza l informazione visibile nei dati x x z z pag.

13 Vantaggi della PCA Le PCA forniscono una spiegazione alternativa della variabilità osservata con il pregio di descrivere il fenomeno oggetto di studio mediante dimensioni fra loro non correlate e ordinate in termini della loro importanza nella spiegazione Questo permette (con maggiore o minore successo nei vari casi) di : interpretare il fenomeno attraverso il nuovo significato assunto dalle componenti principali che non sono state scartate ridurre il numero di variabili da considerare, scartando le ultime componenti principali, che contribuiscono poco alla variabilità osservata pag. 3

14 Covarianza fra i dati x x ε.995x Alta covarianza +.5ε ε, ε x x Bassa covarianza ε.5x +.95ε ε, ε x x x x pag. 4

15 Rappresentazione grafica della correlazione Si può ricavare la matrice di correlazione normalizzando le varianze o calcolando la matrice di covarianza sui dati standardizzati R i, j C C j, j Si ha la matrice simmetrica che nel caso x è del tipo Con autovettori e autovalori W R r i,i i, j C r λ + r λ r x x L equazione dell ellisse di correlazione, centrata nell origine è - - λ λ ( r,) λ ( ),r cosϕ λ sinϕ pag. 5

16 Rappresentazione grafica della correlazione x λ λ (,.6) x λ λ (,.3) R.6 x W.77 λ.4 r λ.6 + r Uguali autovettori R.3 x W.77 λ.7 r λ.3 + r pag. 6

17 Esempi di ellissi di correlazione Correlazione Ridondanza di informazione bassa media alta. R W λ r.75 λ + r.5..5 R W λ r.5 λ + r.5. R W λ r.5 λ + r.75 pag. 7

18 Obiettivi della PCA L obiettivo primario della PCA è determinare la base di riferimento più significativa per rappresentare i dati e filtrare il rumore nella speranza che questa nuova base filtri il rumore e riveli strutture prima invisibili PCA è una trasformazione lineare dei dati che:. Minimizza la ridondanza misurata dalla covarianza. Massimizza l informazione, misurata dalla varianza. Le Principal Components (PC) sono nuove variabili che hanno le seguenti proprietà:. Ogni PC è una combinazione lineare delle variabili originali. Le PC sono fra di loro ortogonali, ovvero sono mutuamente incorrelate, sopprimendo l informazione ridondante pag. 8

19 Idea base della PCA Dataset: insieme di n misure ciascuna composta da p attributi x p attributi x x... xp x x... x p n misure x R xn xn... xnp n p L intuizione di PCA è di trovare una combinazione lineare delle m coordinate dei dati in modo da esprimerli in un nuovo riferimento tale che: Ogni variabile (attributo) sia indipendente da tutti gli altri L insieme degli attributi sia ordinato secondo la loro importanza relativa pag. 9

20 Caratteristiche della PCA PCA è una trasformazione lineare ortonormale dei dati X al fine di ottenere due risultati: Feature Selection: classificare le caratteristiche importanti dei dati X, secondo la loro importanza PCA evidenzia il contenuto informativo mediante una trasformazione lineare delle coordinate di riferimento dei dati (attributi dei dati) Dimension Reduction: quantificare la perdita di informazione derivante dall eventuale riduzione della dimensionalità dei dati X. PCA quantifica la percentuale di informazione nelle varie componente ordinate per importanza, in modo da conoscere la perdita di informazione per ciascuna componente esclusa dalla riduzione pag.

21 Risultato fondamentale della PCA Se l obiettivo primario è l eliminazione della ridondanza Se la ridondanza è espressa dalle correlazioni Allora la PCA consiste nella diagonalizzazione della matrice di covarianza PCA consiste dunque in una trasformazione lineare dalle variabili originali ad altre che esprimono la stessa informazione ma sono fra loro incorrelate (Componenti Principali) La trasformazione cercata è la similitudine W fra la matrice di correlazione e la matrice diagonale degli autovalori, tale che L Z diag X W ( σ, σ σ ),..., p W C W W è : W W pag.

22 PCA come ricerca delle direzioni privilegiate z z Z W X x x z z x x x + x z + x + x x z + x x Direzione di massima varianza di x, escluso x x z i p j x j ji Direzione di massima varianza di x PCA consiste dunque nella ricerca di direzioni privilegiate che massimizzano la variazioni dei dati ed eliminano le correlazioni pag.

23 PCA in sintesi C Dataset X Matrice di covarianza n W... p ( X X ) ( X X )... p λ > λ >... > p p... pp λ p Matrice degli autovettori ordinata secondo autovalori decrescenti La matrice W formata dagli autovettori ordinati per autovalori decrescenti indicano le direzioni di massima varianza. La similitudine fra C e L è data da W. Nota che essendo ortonormale W W - C W L W L W C W La matrice L (diagonale) degli riporta i valori delle varianze nel nuovo riferimento PCA ( L diag σ, σ σ ),..., La trasformazione dei dati X nelle componenti principali Z è Z X W X p Z W pag. 3

24 Ogni pesce può essere definito dalle sue misure di lunghezza ed larghezza Un semplice esempio breadth length Riportando in grafico i dati degli individui del branco di pesci, si ottiene Domanda: Esiste una relazione fra le due misure? Domanda : Esiste un singolo parametro per definire la taglia di ciascun pesce? pag. 4

25 PCA sui dati dei pesci Scegliamo dei nuovi assi centrati nell insieme dei dati Poi ruotiamo gli assi per disporli lungo la direzione principale dei dati Possiamo allora definire una nuova variabile: size length + breadth Ma dato che length e breadth non sono ugualmente importanti (vedi grafico) esse dovranno essere pesate diversamente, perciò size v length + v breadth I pesi v e v sono gli autovettori della matrice di correlazione Risultato: si è ottenuta una riduzione della dimensione dei dati pag. 5

26 Cosa si perde nella riduzione Dato che length e breadth sono chiaramente molto correlate, la matrice di correlazione è molto allungata e dunque gli autovalori sono molto diversi. Supponiamo che essi valgano λ.75 e λ.5 nel riferimento originale l ellisse sarà Dopo la rotazione dovuta al cambio di riferimento sarà data dall orientamento degli autovettori e dalla grandezza degli autovalori Se si ritiene solamente la variabile size si conserva solamente 87.5% della variabilità originale. Infatti λ λ + λ % breadth breadth length size length size pag. 6

27 PCA in Matlab Le funzioni PCA sono contenute nella Statistics oolbox Si può effettuare la PCA partendo dai dati (X) o dalla matrice di covarianza (C) dai dati: [W,score,L] princomp(x) W è la matrice degli autovettori, detta matrice dei Loadings E ordinata per autovalori decrescenti Scores sono le osservazioni Z trasformate delle X nel riferimento PCA L sono gli autovalori, ordinati in ordine decrescente dalla matrice di covarianza: [W,L,expl] pcacov(c) W è la matrice degli autovettori E ordinata per autovalori decrescenti L sono gli autovalori, ordinati in ordine decrescente expl è un vettore che contiene la percentuale di varianza spiegata da ciascuna componente principale (la somma fa ) pag. 7

28 Un esempio: Employee Satisfaction Un sondaggio fra 947 impiegati di una grande azienda ha rilevato i seguenti parametri di soddisfazione Lavoro (SJ) Formazione (SJ) Condizioni di lavoro (SWC) Assicurazione medica (SMC) Assicurazione Dentistica (SDC) Il sondaggio ha prodotto la seguente matrice di correlazione..45 R pag. 8

29 Un esempio: Employee Satisfaction Si ricava la matrice delle PCA ordinata per autovalori decrescenti W Verifica: la somma dei quadrati degli elementi di ciascuna colonna somma a L La prima PC spiega il 47.3% della varianza totale λ 5 i i [ ] λ.473 pag. 9

30 Varianza spiegata e scree plot perc. var. expl. cum.var.expl. Perc. Variance eigenvalues scree plot grafico degli autovalori ordinati in senso decrescente λ i eigenvalues pag. 3

31 Un esempio: Employee Satisfaction La prima PC z si ottiene come z.44 SJ SJ SWC SMC +.4 SDC essendo i pesi tutti positivi e dello stesso ordine, z si può interpretare come un indice di soddisfazione generale La seconda PC z è z.443 SJ +.9 SJ +.38 SWC.53 SMC.586 SDC dato che le prime tre variabili sono associate positivamente a fattori di soddisfazione del lavoro, mentre gli ultimi due sono associati all assistenza medica e sono negativi, z può essere vista come un contrasto fra la soddisfazione del lavoro e l insoddisfazione dell assistenza medica. pag. 3

32 Il Biplot come visualizzazione dei contributi Per visualizzare in che misura ogni variabile originaria contribuisce alle PC, si plottano le componenti dei loadings delle prime colonne della matrice W, corrispondenti alle prime PC, le più importanti PC Si possono anche avere biplot tridimensionali La sintassi del comando Matlab è biplot(coefs,..., 'Scores', scores, 'ObsLabels', obslabs) dove coefs sono le prime o 3 colonne di W, Scores sono i dati trasformati (se presenti) e ObsLabels sono le etichette che identificano ciascuna variabile SDC SMC SJ SJ SWC PC pag. 3

33 Analisi di un episodio di torbidità FUin [NU] FUout [NU] [ C] Q p [l/sec] Floc. [ppm] Q [m 3 /sec] ime (h) Superamento della soglia di pag. 33

34 Biplot come zone di influenza delle PC PC Plant flo emp. FUout FU in Floc dos River flo PC In questo caso si nota che le componenti FUin e Floc dos contribuiscono fortemente a PC e quasi niente a PC. Al contrario Plant flo e emp sono molto rappresentate in PC e PC3 PC PC PC3 PC Biplot indica quanto ciascuna variabile contribuisca a ciascuna PC. Si ottiene plottando i loadings (componenti degli autovettori) nel piano di due PC si ha un idea di Il Biplot più comune è quello PC/PC Plant flo emp. FUout FUin Floc dos River flo PC pag. 34

35 PCA con Covarianza o Correlazione? Le PCA ottenute nei due casi sono molto diverse e non facilmente riconducibili l una all altra perché i loro autovalori e autovettori non sono legati da una semplice relazione Covarianza Riflette le reali proporzioni fra variabili E sensibile alle unità di misura, enfatizzando l importanza delle variabili più grandi Correlazione Indipendenti dalle unità di misura operando su dati standardizzati I risultati di diverse analisi sono comparabili Esempio: Supponendo di effettuare una PCA su misure di lunghezza (x ) e peso (x ), a seconda che x sia espresso in cm (a) o in mm (b), mentre x è sempre espresso in grammi, si ha nei due casi una PCA molto diversa. Nel secondo caso la dominanza di x è totale 8 44 C a C b z z ( a ) ( b ).77 x.998 x +.77 x +.55 x pag. 35

36 Come ridurre l ordine della PCA Ci si basa sulla quantità di varianza spiegata: si trattengono le componenti che forniscono una varianza totale spiegata fra il 7% e il 9% Ovviamente si arrotonda all intero più vicino Alternativamente (o insieme) si taglia all autovalore un po inferiore ad Nel caso di matrice di correlazione si taglia.5 intorno a λ.7 Nel caso di matrice di covarianza si taglia intorno a circa.7 della media degli autovalori Perc. Variance eigenvalues.7 λ j p j eigenvalues λ λ min.7 λ j. 7 p j pag. 36

37 Esempio di dati correlati Dati di qualità dell acqua del fiume Arno Centralina di Rosano 5-7 Settembre 4 DO % DO% ph empo (h) Le tre variabili seguono tutte il ritmo circadiano, pilotato dalla luce solare. La correlazione fra di esse è evidente. L ossigeno disciolto è il più pronto, seguito dalla temperatura a h e dal ph a 3 h di ritardo. L aumento del ph è dovuto al consumo di CO a seguito della fotosintesi ph ( C) pag. 37

38 Correlazioni e autovalori ph Perc. Variance.5 DO% ph 3 DO% 3 eigenvalues 3 eigenvalues La forte correlazione fra le prime due cariabili, fa sì che PC spieghi circa 83% della variabilità totale. Analogamente il primo autovalore è dominante rispetto agli altri due. pag. 38

39 Meglio l analisi di correlazione PC C PC dati λ λ.66 λ ph PC DO% PC L analisi di covarianza tende ad enfatizzare le dipendenze fra le variabili ed a mantenere solo la prima. L analisi di correlazione evidenzia il legame delle tre, pur mantenendo il carattere dominante di DO% PC λ.567 λ.359 λ PC -.5. R PC R ph DO%.5 PC pag. 39

40 Biplot proiettato sulle tre PC (cov) ph.5.5 PC 3 PC 3 DO% PC PC.5 PC ph DO% PC pag. 4

41 PC Biplot proiettato sulle tre PC (corr) DO% PC.8 PC PC PC ph DO% ph PC pag. 4

42 est di consistenza Le componenti principali non avendo un significato immediato devono essere spiegate con statistiche di sintesi: Hotelling s Z L Z X W L W coglie la variazione delle componenti all interno del modello di riferimento (spazio delle PC) Statistica Q Q X misura la variazione non considerata dal modello (spazio ortogonale alle PC) ( I WW ) X X pag. 4

43 La statistica Hotelling E un estensione multivariabile della statistica Student t. Data una matrice di misure X R n p e W la loro matrice di covarianza, la statistica Hotelling è data da X Inoltre, volendola usare come limite di accettabilità (hypothesis testing) si può definire un valore limite di in funzione della statistica F di cui rappresenta una realizzazione lim Dove n è il numero di misure e p le variabili di ciascuna misura, mentre α è il limite di confidenza fissato (generalmente α.5, corrispondente ad una confidenza del 95%) W X ( n ) α p n p F n p,p pag. 43

44 Andamento della statistica F Esempio: Il valore limite di al 95% per un campione di n 8 misure di p 8 variabili ciascuna è 8 α.95 x finv(.95,8,8-8) x 3.77 F 6 4 Ciò significa che si può osservare per puro caso un valore di F superiore a solamente nel 5% dei casi In questo caso il lim sarebbe ( 8 ) n-p 8 lim p pag. 44

45 Applicazione del ai dati di qualità L indice Hotelling s è lo stesso sia per i dati originali che per quelli standardizzati Ovviamente l indice per ogni dato è inferiore a lim perché sono gli stessi dati usati per determinare le PC Dati standard. Dati tal quali lim Misure pag. 45

46 Riduzione della dimensionalità Se alcune PC non sono molto importanti (vedi scree plot) si può ridurre la dimensionalità dell analisi trattenendo solamente le prime a < p PC La matrice di trasformazione è la sotto matrice di W che ritiene i primi a autovettori W... p a... p La trasformazione PCA ridotta diviene a a pa p a p p pp n a Za X Wa R ovvero i dati X vengono proiettati nelle prime a componenti di Z W a... p... p a a... pa R n a pag. 46

47 Decomposizione parziale La PCA ridotta contiene solo le prime due componenti (vedi scree plot) che comunque spiegano 83% della variabilità totale. Perc. Variance.5 X 3 eigenvalues x x a x x a x eigenvalues a Misure pag. 47

48 Ricostruzione da PCA ridotta La ricostruzione delle variabili originali dalla PCA ridotta contiene ovviamente degli errori Se la mappa inversa completa era nel caso ridotto sarà Z W La matrice E contiene gli errori di ricostruzione X X Z W X Z W + a a a a a E n X Z a W a a + E p a p p n modello ridotto residui Matlab: [residuals,reconstructed]pcares(x,a); pag. 48

49 Ricostruzione da PCA completa Ricostruzione con a 3 X Z W DO% stand ph stand stand pag. 49

50 Ricostruzione da PCA ridotta Ricostruzione con a X Z W + a a E DO% stand ph stand. stand pag. 5

51 Ricostruzione da PCA ridotta Ricostruzione con a X Z W + a a E DO% stand ph stand. stand pag. 5

52 pag. 5 La statistica Q Valuta l importanza delle PC escluse dall analisi Ha significato solo quando si esegue una riduzione (a < p) Il valore limite della statistica Q per il quantile c α -α èdato da ( ) 3 o p a i 3 3 p a i p a i i h o o o lim 3 h h h c h Q i i o ϑ ϑ ϑ λ ϑ λ ϑ λ ϑ ϑ ϑ ϑ ϑ ϑ α

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta

Dettagli

Elaborazione delle Immagini Digitali

Elaborazione delle Immagini Digitali Elaborazione delle Immagini Digitali Parte I Prof. Edoardo Ardizzone A.A. 2-22 La trasformata di Hotelling o di Karhunen-Loeve KLT discreta Questa trasformata detta anche analisi delle componenti principali

Dettagli

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali)

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali) RICERCHE DI MERCATO 5.6 Analisi Fattoriale (Componenti Principali) Prof. L. Neri Dip. di Economia Politica Premessa Come evidenziato in precedenza l approccio di segmentazione per omogeneità prevede la

Dettagli

L analisi fattoriale

L analisi fattoriale L analisi fattoriale Scopo dell analisi fattoriale e quello di identificare alcune variabili latenti (fattori) in grado di spiegare i legami, le interrelazioni e le dipendenze tra le variabili statistiche

Dettagli

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Alessandro Rezzani Abstract L articolo descrive una delle tecniche di riduzione della dimensionalità del data set: il metodo dell analisi delle componenti principali (Principal

Dettagli

CIRCUITI INTELLIGENTI Parte 5: PCA e ICA

CIRCUITI INTELLIGENTI Parte 5: PCA e ICA Ing. Simone SCARDAPANE Circuiti e Algoritmi per l Elaborazione dei Segnali Anno Accademico 2012/2013 Indice della Lezione 1. Analisi delle Componenti Principali 2. Auto-Associatori 3. Analisi delle Componenti

Dettagli

LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE

LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE FLAVIO ANGELINI Sommario Queste note hanno lo scopo di indicare a studenti di Economia interessati alla finanza quantitativa i concetti essenziali

Dettagli

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D) ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI () Una immagine (digitale) permette di percepire solo una rappresentazione 2D del mondo La visione 3D si pone lo scopo di percepire il mondo per come è in 3 dimensioni

Dettagli

Statistica II, Laurea magistrale in Ing. Gestionale, a.a. 20010/11 Esempi di domande e dissertazioni

Statistica II, Laurea magistrale in Ing. Gestionale, a.a. 20010/11 Esempi di domande e dissertazioni Statistica II, Laurea magistrale in Ing. Gestionale, a.a. 20010/11 Esempi di domande e dissertazioni Note. Si pensi di poter rispondere alle seguenti domande avendo l ausilio di: 1) un foglio con l elenco

Dettagli

Federico Lastaria. Analisi e Geometria 2. Matrici simmetriche. Il teorema spettrale. 1/24

Federico Lastaria. Analisi e Geometria 2. Matrici simmetriche. Il teorema spettrale. 1/24 Contenuto Endomorfismi auto-aggiunti. Matrici simmetriche. Il teorema spettrale Gli autovalori di una matrice simmetrica sono tutti reali. (Dimostrazione fatta usando i numeri complessi). Dimostrazione

Dettagli

La statistica multivariata

La statistica multivariata Cenni di Statistica Multivariata Dr Corrado Costa La statistica multivariata La statistica multivariata è quella parte della statistica in cui l'oggetto dell'analisi è per sua natura formato da almeno

Dettagli

4. Matrici e Minimi Quadrati

4. Matrici e Minimi Quadrati & C. Di Natale: Matrici e sistemi di equazioni di lineari Formulazione matriciale del metodo dei minimi quadrati Regressione polinomiale Regressione non lineare Cross-validazione e overfitting Regressione

Dettagli

Metodi Statistici di Analisi dei Dati Ambientali

Metodi Statistici di Analisi dei Dati Ambientali Metodi Statistici di Analisi dei Dati Ambientali Arianna Azzellino Politecnico di Milano D.I.I.A.R. Dipartimento di Ingegneria Idraulica, Ambientale, Rilevamento e Infrastrutture Viarie Problematica La

Dettagli

Analisi discriminante

Analisi discriminante Capitolo 6 Analisi discriminante L analisi statistica multivariata comprende un corpo di metodologie statistiche che permettono di analizzare simultaneamente misurazioni riguardanti diverse caratteristiche

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stima puntuale per la proporzione Da un lotto di arance se ne estraggono 400, e di queste 180

Dettagli

Lezione n. 2 (a cura di Chiara Rossi)

Lezione n. 2 (a cura di Chiara Rossi) Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,

Dettagli

Università degli studi di Padova

Università degli studi di Padova Università degli studi di Padova Facoltà di scienze statistiche corso di laurea in statistica e tecnologie informatiche tesi di laurea Studio del comportamento di visita a due siti web. relatore: dott.

Dettagli

A.1 Rappresentazione geometrica dei segnali

A.1 Rappresentazione geometrica dei segnali Appendice A Rappresentazione dei segnali A.1 Rappresentazione geometrica dei segnali Scomporre una generica forma d onda s(t) in somma di opportune funzioni base è operazione assai comune, particolarmente

Dettagli

Universita degli Studi di Roma Tor Vergata Facolta di Ingegneria Elettronica

Universita degli Studi di Roma Tor Vergata Facolta di Ingegneria Elettronica Universita degli Studi di Roma Tor Vergata Facolta di Ingegneria Elettronica Terzo Appello del corso di Geometria e Algebra II Parte - Docente F. Flamini, Roma, 7/09/2007 SVOLGIMENTO COMPITO III APPELLO

Dettagli

RICHIAMI SULLE MATRICI. Una matrice di m righe e n colonne è rappresentata come

RICHIAMI SULLE MATRICI. Una matrice di m righe e n colonne è rappresentata come RICHIAMI SULLE MATRICI Una matrice di m righe e n colonne è rappresentata come A = a 11 a 12... a 1n a 21 a 22... a 2n............ a m1 a m2... a mn dove m ed n sono le dimensioni di A. La matrice A può

Dettagli

Autovalori e Autovettori

Autovalori e Autovettori Daniela Lera Università degli Studi di Cagliari Dipartimento di Matematica e Informatica A.A. 2008-2009 Autovalori e Autovettori Definizione Siano A C nxn, λ C, e x C n, x 0, tali che Ax = λx. (1) Allora

Dettagli

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D) ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI () Calcolo delle corrispondenze Affrontiamo il problema centrale della visione stereo, cioè la ricerca automatica di punti corrispondenti tra immagini Chiamiamo

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

Appunti di Statistica Descrittiva

Appunti di Statistica Descrittiva Appunti di Statistica Descrittiva 30 dicembre 009 1 La tabella a doppia entrata Per studiare dei fenomeni con caratteristiche statistiche si utilizza l espediente della tabella a doppia entrata Per esempio

Dettagli

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che VARIABILI ALATORI MULTIPL TORMI ASSOCIATI Fonti: Cicchitelli Dall Aglio Mood-Grabill. Moduli 6 9 0 del programma. VARIABILI ALATORI DOPPI Dopo aver trattato delle distribuzioni di probabilità di una variabile

Dettagli

Cenni di statistica descrittiva

Cenni di statistica descrittiva Cenni di statistica descrittiva La statistica descrittiva è la disciplina nella quale si studiano le metodologie di cui si serve uno sperimentatore per raccogliere, rappresentare ed elaborare dei dati

Dettagli

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2003 Sessione straordinaria

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2003 Sessione straordinaria ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 3 Sessione straordinaria Il candidato risolva uno dei due problemi e 5 dei quesiti in cui si articola il questionario. PROBLEMA È assegnata

Dettagli

INSEGNAMENTO DI ANALISI DI DATI BIOLOGICI LM IN BIOINGEGNERIA - A.A.2013/2014 HOMEWORK 3

INSEGNAMENTO DI ANALISI DI DATI BIOLOGICI LM IN BIOINGEGNERIA - A.A.2013/2014 HOMEWORK 3 INSEGNAMENTO DI ANALISI DI DATI BIOLOGICI LM IN BIOINGEGNERIA - A.A.2013/2014 HOMEWORK 3 COGNOME: Montanino NOME: Annaclaudia MATRICOLA: 1056715 DATA: 13 gennaio 2014 email: annaclaudia.montanino@studenti.unipd.it

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Rappresentazione dati e visualizzazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona

Dettagli

Algebra Lineare e Geometria

Algebra Lineare e Geometria Algebra Lineare e Geometria Corso di Laurea in Ingegneria Elettronica A.A. 2013-2014 Prova d esame del 16/06/2014. 1) a) Determinare la matrice associata all applicazione lineare T : R 3 R 4 definita da

Dettagli

Dai dati al modello teorico

Dai dati al modello teorico Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere

Dettagli

Analisi 2. Argomenti. Raffaele D. Facendola

Analisi 2. Argomenti. Raffaele D. Facendola Analisi 2 Argomenti Successioni di funzioni Definizione Convergenza puntuale Proprietà della convergenza puntuale Convergenza uniforme Continuità e limitatezza Teorema della continuità del limite Teorema

Dettagli

Design of Experiments

Design of Experiments Design of Experiments Luigi Amedeo Bianchi 1 Introduzione Cominciamo spiegando cosa intendiamo con esperimento, ossia l investigare un processo cambiando i dati in ingresso, osservando i cambiamenti che

Dettagli

Elaborazione dati in Analisi Sensoriale

Elaborazione dati in Analisi Sensoriale Elaborazione dati in Analisi Sensoriale Si è parlato di interpretazione corretta dei risultati ottenuti; a questo concorrono due fattori: affidabilità e validità. Se i test fossero stati ripetuti con lo

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Università degli Studi di Roma Tor Vergata. Corso di Laurea in Ingegneria Meccanica

Università degli Studi di Roma Tor Vergata. Corso di Laurea in Ingegneria Meccanica Università degli Studi di Roma Tor Vergata. Corso di Laurea in Ingegneria Meccanica Esame di Geometria (Prof. F. Tovena) Argomenti: Proprietà di nucleo e immagine di una applicazione lineare. dim V = dim

Dettagli

5. L Analisi delle Componenti Principali (PCA)

5. L Analisi delle Componenti Principali (PCA) . L Analisi delle Componenti Principali (PCA) Analisi della Varianza PCA e diagonalizzazione della matrice di covarianza Scores e Loadings Sviluppo di matrici e residui Applicazioni all analisi delle immagini

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

Esplorazione dei dati

Esplorazione dei dati Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione

Dettagli

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza. VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della

Dettagli

Esercizi su Autovalori e Autovettori

Esercizi su Autovalori e Autovettori Esercizi su Autovalori e Autovettori Esercizio n.1 5 A = 5, 5 5 5 Esercizio n.6 A =, Esercizio n.2 4 2 9 A = 2 1 8, 4 2 9 Esercizio n.7 6 3 3 A = 6 3 6, 3 3 6 Esercizio n.3 A = 4 6 6 2 2, 6 6 2 Esercizio

Dettagli

COMPITO B - ANALISI DEI DATI PER IL MARKETING OTTOBRE 2009

COMPITO B - ANALISI DEI DATI PER IL MARKETING OTTOBRE 2009 COGNOME E NOME COMPITO B - ANALISI DEI DATI PER IL MARKETING OTTOBRE 2009 Esercizio I MATR. Si è effettuata un indagine di customer satisfaction su un campione di 100 acquirenti d un modello di auto, chiedendo

Dettagli

Accuratezza di uno strumento

Accuratezza di uno strumento Accuratezza di uno strumento Come abbiamo già accennato la volta scora, il risultato della misurazione di una grandezza fisica, qualsiasi sia lo strumento utilizzato, non è mai un valore numerico X univocamente

Dettagli

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Laurea in Ingegneria Meccatronica A.A. 2010 2011 n-dimensionali Riepilogo. Gli esiti di un esperimento aleatorio

Dettagli

8 - Analisi della deformazione

8 - Analisi della deformazione 8 - Analisi della deformazione ü [A.a. - : ultima revisione 6 ottobre ] Esercizio n. Si supponga di voler conoscere sperimentalmente lo stato di deformazione in un punto M di un solido. A tal fine, si

Dettagli

Massimi e minimi vincolati di funzioni in due variabili

Massimi e minimi vincolati di funzioni in due variabili Massimi e minimi vincolati di funzioni in due variabili I risultati principali della teoria dell ottimizzazione, il Teorema di Fermat in due variabili e il Test dell hessiana, si applicano esclusivamente

Dettagli

PARTE TERZA. STATISTICA DESCRITTIVA MULTIDIMENSIONALE (Analisi delle Relazioni)

PARTE TERZA. STATISTICA DESCRITTIVA MULTIDIMENSIONALE (Analisi delle Relazioni) PARTE TERZA STATISTICA DESCRITTIVA MULTIDIMESIOALE (Analisi delle Relazioni) La notazione matriciale 3 III.. LA OTAZIOE MATRICIALE III... L analisi statistica dei fenomeni multivariati L intrinseca complessità

Dettagli

CURRICOLO MATEMATICA

CURRICOLO MATEMATICA 1 CURRICOLO MATEMATICA Competenza 1 al termine della scuola dell Infanzia 2 NUMERI Raggruppare, ordinare, contare, misurare oggetti, grandezze ed eventi direttamente esperibili. Utilizzare calendari settimanali

Dettagli

Corso Matlab : Sesta lezione (Esercitazione, 25/10/13) Samuela Persia, Ing. PhD.

Corso Matlab : Sesta lezione (Esercitazione, 25/10/13) Samuela Persia, Ing. PhD. Advanced level Corso Matlab : Sesta lezione (Esercitazione, 25/10/13) Samuela Persia, Ing. PhD. Sommario Toolbox finance Analisi dei portafogli Analisi grafica Determinate Date Toolbox statistics Analisi

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

(V) (FX) Z 6 è un campo rispetto alle usuali operazioni di somma e prodotto.

(V) (FX) Z 6 è un campo rispetto alle usuali operazioni di somma e prodotto. 29 giugno 2009 - PROVA D ESAME - Geometria e Algebra T NOME: MATRICOLA: a=, b=, c= Sostituire ai parametri a, b, c rispettivamente la terzultima, penultima e ultima cifra del proprio numero di matricola

Dettagli

LEZIONE 23. Esempio 23.1.3. Si consideri la matrice (si veda l Esempio 22.2.5) A = 1 2 2 3 3 0

LEZIONE 23. Esempio 23.1.3. Si consideri la matrice (si veda l Esempio 22.2.5) A = 1 2 2 3 3 0 LEZIONE 23 231 Diagonalizzazione di matrici Abbiamo visto nella precedente lezione che, in generale, non è immediato che, data una matrice A k n,n con k = R, C, esista sempre una base costituita da suoi

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

ANALISI DEI DATI BIOLOGICI

ANALISI DEI DATI BIOLOGICI ANALISI DI DATI BIOLOGICI RAPPRSNTAR L COMUNITA tramite descrizioni grafiche e relazioni tra gli organismi presenti nei vari campioni. DISCRIMINAR dei siti sulla base della loro composizione biologica.

Dettagli

Valori caratteristici di distribuzioni

Valori caratteristici di distribuzioni Capitolo 3 Valori caratteristici di distribuzioni 3. Valori attesi di variabili e vettori aleatori In molti casi è possibile descrivere adeguatamente una distribuzione di probabilità con pochi valori di

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

EVOLUZIONE STUDIO DI SETTORE TG42U

EVOLUZIONE STUDIO DI SETTORE TG42U ALLEGATO 5 NOTA TECNICA E METODOLOGICA EVOLUZIONE STUDIO DI SETTORE TG42U NOTA TECNICA E METODOLOGICA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L evoluzione dello Studio di Settore ha il fine di

Dettagli

(prezzo di chiusura del Venerdi' - prezzo di chiusura del Venerdi' precedente)/(prezzo di chiusura del Venerdi' precedente)

(prezzo di chiusura del Venerdi' - prezzo di chiusura del Venerdi' precedente)/(prezzo di chiusura del Venerdi' precedente) Vediamo ora alcuni esempi. Esempio1 (titoli) Consideriamo alcuni dati riguardanti il tasso settimanale di ritorno di cinque titoli della borsa di New York, registrati da Gennaio 1975 a Dicembre 1976. Il

Dettagli

LE FIBRE DI UNA APPLICAZIONE LINEARE

LE FIBRE DI UNA APPLICAZIONE LINEARE LE FIBRE DI UNA APPLICAZIONE LINEARE Sia f:a B una funzione tra due insiemi. Se y appartiene all immagine di f si chiama fibra di f sopra y l insieme f -1 y) ossia l insieme di tutte le controimmagini

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

GEOMETRIA I Corso di Geometria I (seconda parte)

GEOMETRIA I Corso di Geometria I (seconda parte) Corso di Geometria I (seconda parte) anno acc. 2009/2010 Cambiamento del sistema di riferimento in E 3 Consideriamo in E 3 due sistemi di riferimento ortonormali R e R, ed un punto P (x, y, z) in R. Lo

Dettagli

Scheda n. 10: PCA - parte seconda

Scheda n. 10: PCA - parte seconda Scheda n. 10: PCA - parte seconda November 25, 2008 1 Il piano principale Con il comando: > biplot(pca) si ottiene un immagine del piano principale, con la proiezione dei dati e dei vecchi assi (le vecchie

Dettagli

Laboratorio di fisica per PAS Proposito di questo modulo: Fornire ai docenti gli strumenti teorici e pratici per affrontare esperimenti di laboratorio dal punto di vista quantitativo. Effettuare alcune

Dettagli

ASSE MATEMATICO. Competenze Abilità Conoscenze

ASSE MATEMATICO. Competenze Abilità Conoscenze Competenze di base a conclusione del I Biennio Confrontare ed analizzare figure geometriche del piano e dello spazio individuando invarianti e relazioni. Analizzare, correlare e rappresentare dati. Valutare

Dettagli

Modellazione e Analisi di Reti Elettriche

Modellazione e Analisi di Reti Elettriche Modellazione e Analisi di eti Elettriche Modellazione e Analisi di eti Elettriche Davide Giglio Introduzione alle eti Elettriche e reti elettriche costituite da resistori, condensatori e induttori (bipoli),

Dettagli

Tecniche di analisi multivariata

Tecniche di analisi multivariata Tecniche di analisi multivariata Metodi che fanno riferimento ad un modello distributivo assunto per le osservazioni e alla base degli sviluppi inferenziali - tecniche collegate allo studio della dipendenza

Dettagli

CONI, CILINDRI, SUPERFICI DI ROTAZIONE

CONI, CILINDRI, SUPERFICI DI ROTAZIONE CONI, CILINDRI, SUPERFICI DI ROTAZIONE. Esercizi x + z = Esercizio. Data la curva x, calcolare l equazione del cilindro avente γ y = 0 come direttrice e con generatrici parallele al vettore v = (, 0, ).

Dettagli

Entropia. Motivazione. ? Quant è l informazione portata dalla sequenza? Abbiamo una sequenza S di N simboli (campioni audio, pixel, caratteri,...

Entropia. Motivazione. ? Quant è l informazione portata dalla sequenza? Abbiamo una sequenza S di N simboli (campioni audio, pixel, caratteri,... Entropia Motivazione Abbiamo una sequenza S di N simboli (campioni audio, pixel, caratteri,... ) s,s 2,s 3,... ognuno dei quali appartiene ad un alfabeto A di M elementi.? Quant è l informazione portata

Dettagli

Istituto Comprensivo Caposele (Av) Curricolo verticale d istituto a.sc. 2013-2014

Istituto Comprensivo Caposele (Av) Curricolo verticale d istituto a.sc. 2013-2014 CURRICOLO DI MATEMATICA SCUOLA PRIMARIA CLASSE PRIMA 1. Contare oggetti o eventi, a voce e mentalmente, in senso progressivo e regressivo e per salti di due, tre, 2. Leggere e scrivere i numeri naturali

Dettagli

estratto da Competenze assi culturali Raccolta delle rubriche di competenza formulate secondo i livelli EFQ a cura USP Treviso Asse matematico

estratto da Competenze assi culturali Raccolta delle rubriche di competenza formulate secondo i livelli EFQ a cura USP Treviso Asse matematico Competenza matematica n. BIENNIO, BIENNIO Utilizzare le tecniche e le procedure del calcolo aritmetico ed algebrico, rappresentandole anche sotto forma grafica BIENNIO BIENNIO Operare sui dati comprendendone

Dettagli

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI Docente: Prof. Massimo Mariani 1 SOMMARIO Il rendimento di un attività finanziaria: i parametri rilevanti Rendimento totale, periodale e medio Il market

Dettagli

Confronto di metodologie statistiche per l analisi di risultati di Customer Satisfaction

Confronto di metodologie statistiche per l analisi di risultati di Customer Satisfaction Confronto di metodologie statistiche per l analisi di risultati di Customer Satisfaction S. Gorla: Citroën Italia S.p.A. e Consigliere di giunta AicqCN; E. Belluco: statistico, PG. Della Role: master Black

Dettagli

Università di Bologna Facoltà di Scienze statistiche. Analisi fattoriale. Alessandro Lubisco

Università di Bologna Facoltà di Scienze statistiche. Analisi fattoriale. Alessandro Lubisco Università di Bologna Facoltà di Scienze statistiche Analisi fattoriale Alessandro Lubisco INDICE Indice... i Analisi Fattoriale... 1 Aspetti introduttivi... 1 Introduzione ai modelli a variabili latenti...

Dettagli

Analisi dei gruppi (Cluster analysis)

Analisi dei gruppi (Cluster analysis) Capitolo 10 Analisi dei gruppi (Cluster analysis) Partendo da un collettivo multidimensionale, l analisi dei gruppi mira ad assegnarne le unità a categorie non definite a priori, formando dei gruppi di

Dettagli

Corso di Calcolo delle Probabilità e Statistica. Esercizi su variabili aleatorie discrete

Corso di Calcolo delle Probabilità e Statistica. Esercizi su variabili aleatorie discrete Corso di Calcolo delle Probabilità e Statistica Esercizi su variabili aleatorie discrete Es.1 Da un urna con 10 pallina bianche e 15 palline nere, si eseguono estrazioni con reimbussolamento fino all estrazione

Dettagli

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA Francesco Bottacin Padova, 24 febbraio 2012 Capitolo 1 Algebra Lineare 1.1 Spazi e sottospazi vettoriali Esercizio 1.1. Sia U il sottospazio di R 4 generato dai

Dettagli

Scheda n.5: variabili aleatorie e valori medi

Scheda n.5: variabili aleatorie e valori medi Scheda n.5: variabili aleatorie e valori medi October 26, 2008 1 Variabili aleatorie Per la definizione rigorosa di variabile aleatoria rimandiamo ai testi di probabilità; essa è non del tutto immediata

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

5.4 Solo titoli rischiosi

5.4 Solo titoli rischiosi 56 Capitolo 5. Teoria matematica del portafoglio finanziario II: analisi media-varianza 5.4 Solo titoli rischiosi Suppongo che sul mercato siano presenti n titoli rischiosi i cui rendimenti aleatori sono

Dettagli

Servizio Nazionale di Valutazione a.s. 2014/15 Guida alla lettura Prova di Matematica Classe seconda Scuola primaria

Servizio Nazionale di Valutazione a.s. 2014/15 Guida alla lettura Prova di Matematica Classe seconda Scuola primaria Servizio Nazionale di Valutazione a.s. 2014/15 Guida alla lettura Prova di Matematica Classe seconda Scuola primaria I quesiti sono distribuiti negli ambiti secondo la tabella seguente Ambito Numero di

Dettagli

Processo di rendering

Processo di rendering Processo di rendering Trasformazioni di vista Trasformazioni di vista Il processo di visione in tre dimensioni Le trasformazioni di proiezione 2 Rendering nello spazio 2D Il processo di rendering (visualizzazione)

Dettagli

CURRICOLO di MATEMATICA Scuola Primaria

CURRICOLO di MATEMATICA Scuola Primaria CURRICOLO di MATEMATICA Scuola Primaria MATEMATICA CLASSE I Indicatori Competenze Contenuti e processi NUMERI Contare oggetti o eventi con la voce in senso progressivo e regressivo Riconoscere e utilizzare

Dettagli

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte Competenza chiave europea: MATEMATICA Scuola Primaria DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte TAB. A TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE al termine della Scuola Primaria

Dettagli

Analisi fattoriale. esplorativa vers. 1.0. Germano Rossi 1 germano.rossi@unimib.it. 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Analisi fattoriale. esplorativa vers. 1.0. Germano Rossi 1 germano.rossi@unimib.it. 1 Dipartimento di Psicologia, Università di Milano-Bicocca Analisi fattoriale esplorativa vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2009 Rossi (Dip. Psicologia) Analisi fattoriale 2009 1 / 47 Prima

Dettagli

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione

Dettagli

4. Proiezioni del piano e dello spazio

4. Proiezioni del piano e dello spazio 4. Proiezioni del piano e dello spazio La visualizzazione di oggetti tridimensionali richiede di ottenere una vista piana dell'oggetto. Questo avviene mediante una sequenza di operazioni. Innanzitutto,

Dettagli

Prefazione all edizione originale. Prefazione all edizione italiana

Prefazione all edizione originale. Prefazione all edizione italiana Indice Prefazione all edizione originale Prefazione all edizione italiana xiii xv 1 Il miglioramento della qualità nel moderno ambiente produttivo 1 1.1 Significato dei termini qualità e miglioramento

Dettagli

La categoria «ES» presenta (di solito) gli stessi comandi

La categoria «ES» presenta (di solito) gli stessi comandi Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:

Dettagli

Analisi statistica degli errori

Analisi statistica degli errori Analisi statistica degli errori I valori numerici di misure ripetute risultano ogni volta diversi l operazione di misura può essere considerata un evento casuale a cui è associata una variabile casuale

Dettagli

FONDAMENTI DI PSICOMETRIA - 8 CFU

FONDAMENTI DI PSICOMETRIA - 8 CFU Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso

Dettagli

I quesiti sono distribuiti negli ambiti secondo la tabella seguente

I quesiti sono distribuiti negli ambiti secondo la tabella seguente Servizio Nazionale di Valutazione a.s. 2010/11 Guida alla lettura Prova di Matematica Classe seconda Scuola secondaria di II grado (a cura di Giorgio Bolondi, Rossella Garuti, Aurelia Orlandoni, Domingo

Dettagli

UNIVERSITÀ DEGLI STUDI DI PADOVA

UNIVERSITÀ DEGLI STUDI DI PADOVA UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI INGEGNERIA DIPARTIMENTO DI PRINCIPI E IMPIANTI DI INGEGNERIA CHIMICA I. Sorgato TESI DI LAUREA IN INGEGNERIA CHIMICA METODOLOGIE PER LA SELEZIONE DELLE VARIABILI

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

STUDIO DI SETTORE SG42U

STUDIO DI SETTORE SG42U ALLEGATO 2 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SG42U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

Ai fini economici i costi di un impresa sono distinti principalmente in due gruppi: costi fissi e costi variabili. Vale ovviamente la relazione:

Ai fini economici i costi di un impresa sono distinti principalmente in due gruppi: costi fissi e costi variabili. Vale ovviamente la relazione: 1 Lastoriadiun impresa Il Signor Isacco, che ormai conosciamo per il suo consumo di caviale, decide di intraprendere l attività di produttore di caviale! (Vuole essere sicuro della qualità del caviale

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

Tecniche di DM: Link analysis e Association discovery

Tecniche di DM: Link analysis e Association discovery Tecniche di DM: Link analysis e Association discovery Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Architettura di un generico algoritmo di DM. 2 2 Regole di associazione:

Dettagli