CIRCUITI INTELLIGENTI Parte 5: PCA e ICA
|
|
- Patrizia Franchi
- 8 anni fa
- Visualizzazioni
Transcript
1 Ing. Simone SCARDAPANE Circuiti e Algoritmi per l Elaborazione dei Segnali Anno Accademico 2012/2013
2 Indice della Lezione 1. Analisi delle Componenti Principali 2. Auto-Associatori 3. Analisi delle Componenti Indipendenti 2
3 Estrazione delle Features Finora abbiamo visto varie tipologie di reti neurali e di algoritmi di apprendimento. Le performance di un sistema di classificazione e/o filtraggio adattativo dipendono però dalle feature che sono state scelte precedentemente: y M x N Feature extraction Classification In questa lezione vedremo due algoritmi molto noti per questo compito: Principal Component Analysis (PCA) ed Independent Component Analysis. 3
4 Caratteristiche Desiderate Uno step di feature extraction mappa uno spazio N-dimensionale, detto input space, in uno spazio M-dimensionale, detto output space, con in generale M N. Quali sono tipicamente le caratteristiche richieste a tale algoritmo? 1. Deve preservare quanto più possibile il «contenuto informativo originale» dei nostri dati. 2. L output space deve comporsi di feature il più possibili decorrelate fra loro. 3. Deve cercare di scegliere un M il più piccolo possibile. PCA ed ICA trovano trasformazioni lineari ottime nel senso descritto da questi tre punti sotto diverse assunzioni. 4
5 PCA La PCA, anche nota come Trasformata di Karuhunen-Loève o Trasformata di Hotteling, cerca una trasformazione y = Wx tale che: 1. La prima direzione dello spazio di output (prima componente principale) abbia la massima varianza possibile (fra tutte le possibili trasformazioni lineari). 2. La seconda componente principale abbia la massima varianza possibile fra tutte le direzioni ortogonali alla prima componente principale. 3. E così via 5
6 Normalizzazione Consideriamo uno spazio di input x R N, di cui conosciamo Q esempi x Q i i=1. Supponiamo che lo spazio di input sia interamente caratterizzato dalla densità di probabilità p x x, x R N. Per semplicità supponiamo inoltre che E x = 0. In pratica questo si può ottenere calcolando la media empirica x = 1 Q medio ai valori osservati: z = x x Q i=1 x i e sottraendo il valor La matrice di covarianza è data quindi da R xx = E{xx T }. Ai fini pratici può essere approssimata come: R xx = 1 Q T x Q 1 i x i i=1 6
7 Definizione di PCA Consideriamo la matrice dei dati X = x 1,, x Q T. La prima componente principale deve soddisfare: w 1 = arg max w =1 Var{wT X} Sottraiamo ora la prima componente principale dai nostri dati: X = X w 1 w 1 T X La seconda componente principale deve quindi soddisfare: E così via iterativamente. w 2 = arg max w =1 Var{wT X} 7
8 Componenti Principali Si dimostra che la trasformazione cercata corrisponde ad una diagonalizzazione della matrice di covarianza. Consideriamo gli N autovalori di R xx : R xx w k = λ k w k, k = 1,2,, N Ordiniamo gli autovalori in ordine decrescente λ 1 λ 2 λ N. Inoltre per le caratteristiche di R xx ogni autovettore è normalizzato, ovvero: w k 2 = 1, k = 1,2,, N Costruiamo la matrice W = w 1,, w N T. Questa è esattamente la matrice che diagonalizza la covarianza: R yy = WR xx W T 8
9 Formule di Analisi e Sintesi La trasformazione cercata è quindi (formula di analisi): y = W T x Per l ortogonalità diw(formula disintesi): La decomposizione: x = Wy R xx = W T R yy W viene detta eigendecomposition della matrice R xx e può essere calcolata efficientemente. 9
10 Eigendecomposition Il metodo più semplice per cercare gli autovalori è risolvere il polinomio caratteristico: (R xx λ k I N )w k = 0 Se w k 0, la matrice (R xx λ k I N ) è singolare, ovvero dobbiamo risolvere: det(r xx λ k I N ) = 0 Un altra possibilità è il metodo della potenza. Dato un vettore casuale v, la sequenza: 2 v R xx v R xx v, R xx 2 v, R xx 3 v R xx 3 v R xx Converge quasi sicuramente all autovettore associato all autovalore maggiore (se non è nullo). Questa tecnica è a base di molti metodi più avanzati (algoritmo QR ). 10
11 Matrice di Correlazione La PCA è fortemente dipendente da un fattore di scala: direzioni con ordini di grandezza diverse possono influire diversamente sulla determinazione delle componenti principali. In questo caso in generale si preferisce lavorare su dati standardizzati. Si calcola quindi la varianza empirica dei dati σ e si normalizzano i dati come: z = x x σ Trovare i componenti principali di z equivale a diagonalizzare la matrice di correlazione dix: R ij = C ij C ii C jj In generale le componenti principali saranno differenti. 11
12 Riduzione di Dimensionalità La varianza totale delle N componenti principali è data dalla somma degli autovalori di R xx : N i=1 σ i 2 = N i=1 λ i Supponendo di volere mantenere al massimo una frazione p della varianza, si scelgono le sole K principali componenti tali che K λ i = p. La trasformazione y = W K T x esegue quindi una riduzione di dimensionalità da N a K. Incorriamo in un errore dato da: i=1 e = N i=k+1 w i y i 12
13 Ripasso di Teoria dell Informazione Siano X e Y due variabili casuali (supposte discrete) con associate funzioni di probabilità P X = x = P(x) e P Y = y = P(y). L entropia di X si definisce come: H X = P x log P x x X L entropia cumulativa di X ed Y è data da: H X, Y = x X,y Y P x, y log P x, y L entropia condizionale di X dato Y: H X Y = H X, Y H(Y) 13
14 Contenuto Informativo Rimane da discutere l effettivo valore a livello informativo della PCA. Supponiamo che x = s + r, dove s è il segnale desiderato e r del rumore. Se assumiamo che s N(μ s, Σ) e r N(μ r, I), dove I è la matrice identità Allora la trasformazione y = Wx massimizza la mutua informazione fra s ed y: I s; y = H s H(s y) Risultati simili valgono anche sotto assunzioni meno stringenti (che portano ad una massimizzazione di upper bounds sulla mutua informazione). 14
15 Autoencoder La tecnica della PCA è strettamente legata ad una tipologia di rete neurale detta autoencoder: x 1 x 1 x 2 x 2 x N x N x N x N y M 15
16 Autoencoder /2 Un autoencoder viene allenato a riprodurre in output ciò che riceve in input. Dopo l allenamento, il layer nascosto può essere visto come una trasformazione dell input. Sia N la dimensione dell input e M il numero di nodi nel layer nascosto. Se M < N, l autoencoder esegue una compressione dell informazione contenuta nel segnale in ingresso. Se i neuroni nel layer nascosto sono lineari, ovvero y = Wx, al termine dell allenamento i rispettivi pesi determinano una base alternativa per lo spazio determinato dai primi M componenti principali di X. In generale, le due basi saranno diverse: in particolare, i vettori ottenuti tramite autoencoder non sono vincolati ad essere ortogonali. Nel caso di neuroni non lineari, l autoencoder esegue una versione non lineare e multimodalle della PCA. 16
17 Independent Component Analysis L utilità della PCA per classificazione risiede nell assunzione che le direzioni di massima varianza nell input siano quelle massimamente informative a livello di output. Questa assunzione in certi contesti potrebbe non risultare corretta o, comunque, non ottimale: ad esempio nel caso di misture di processi altamente non-gaussiani. L Independent Component Analysis (ICA) cerca invece una trasformazione lineare che massimizzi l indipendenza statistica in uscita, ovvero rimuove le dipendenze statistiche di ogni ordine. Le applicazioni delle ICA sono molteplici e includono l analisi e la compressione dei dati, la stima Bayesiana, la localizzazione di sorgenti, la separazione e deconvoluzione cieca (o blind) di sorgenti. 17
18 PCA vs ICA La PCA cerca una trasformazione tramite matrice diagonale, mentre nella ICA le basi dello spazio possono essere non ortogonali. La ICA elimina dipendenze statistiche di ordine superiore al secondo, diversamente dalla PCA. Le componenti in uscita dalla PCA sono decorrelate fra loro: E y 1 n y 2 n = E y 1 n E y 2 n = 0 Mentre le componenti in uscita dalla ICA rispettano la condizione più forte di indipendenza (coincidente alla decorrelazione solo nel caso di misture di Gaussiane): p y 1 n, y 2 n = p y 1 n p(y 2 n ) La PCA permette una compressione dei dati che non avviene nell ICA. Inoltre, la PCA permette un ordinamento a livello di importanza delle componenti in uscita (dato dai relativi autovalori). 18
19 Definizione di ICA Consideriamo M sorgenti s[n] ed N segnali ricevuti x[n], legati dalla relazione: x n = As[n] Dove A R N M (con N M) viene detta matrice di mistura. Note T realizzazioni di x[n], si desidera stimare tale matrice insieme alle sorgenti s[n]. Le assunzioni di base sono che le sorgenti: 1. Siano tutte indipendenti. 2. Al massimo una sia Gaussiana. 3. Non ci sia rumore (può essere rilassata in algoritmi più avanzati). 4. La media delle osservazioni sia nulla. La seconda assunzione dipende dal fatto che misture lineari di variabili Gaussiane linearmente indipendenti restano linearmente indipendenti. 19
20 Ambiguità della ICA Nella definizione della ICA esistono due tipi di ambiguità: 1. Non è possibile recuperare la varianza reale delle sorgenti originarie. Sia Λ una matrice diagonale, abbiamo che: x n = WΛ 1 Λs[n] Da cui deriva anche che il segno delle sorgenti originarie non è recuperabile. 2. Similmente, l ordine delle sorgenti non può essere stabilito. Sia P una matrice di permutazione, abbiamo che: x n = WP 1 Ps[n] Fortunatamente queste limitazioni raramente sono problematiche nelle applicazioni pratiche. 20
21 Whitening Una tecnica di pre-processamente utile nel caso della ICA è «sbiancare» le osservazioni, ovvero trasformarle linearmente in modo che siano decorrelate ed abbiamo varianza unitaria. Consideriamo nuovamente la eigendecomposition XX T = WDW T. Si dimostra che la trasformazione cercata è data da: Otteniamo quindi: x = WD 1 2W T x x = WD 1 2W T As = As La buona notizia è che ora A è ortogonale. 21
22 Infomax Infomax è un algoritmo per il calcolo della ICA che si basa sul principio di minimizzazione della mutua informazione: 1. Si inizializza W 0 casualmente. 2. W t+1 = W t + η t I f S S T W t 3. Si ripete il passo (2) fino a convergenza. Dove abbiamo che: t è il generico passo temporale. η t specifica il passo degli aggiornamenti (tipicamente decrescente con t). f(s) è una funzione nonlineare dipendente dalla distribuzione, ad esempio: f Y = tanh Y 22
23 Grazie per l attenzione. Domande? 23
Esempio. Approssimazione con il criterio dei minimi quadrati. Esempio. Esempio. Risultati sperimentali. Interpolazione con spline cubica.
Esempio Risultati sperimentali Approssimazione con il criterio dei minimi quadrati Esempio Interpolazione con spline cubica. Esempio 1 Come procedere? La natura del fenomeno suggerisce che una buona approssimazione
DettagliRegressione non lineare con un modello neurale feedforward
Reti Neurali Artificiali per lo studio del mercato Università degli studi di Brescia - Dipartimento di metodi quantitativi Marco Sandri (sandri.marco@gmail.com) Regressione non lineare con un modello neurale
DettagliPro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
DettagliTecniche di analisi multivariata
Tecniche di analisi multivariata Metodi che fanno riferimento ad un modello distributivo assunto per le osservazioni e alla base degli sviluppi inferenziali - tecniche collegate allo studio della dipendenza
DettagliVC-dimension: Esempio
VC-dimension: Esempio Quale è la VC-dimension di. y b = 0 f() = 1 f() = 1 iperpiano 20? VC-dimension: Esempio Quale è la VC-dimension di? banale. Vediamo cosa succede con 2 punti: 21 VC-dimension: Esempio
DettagliStatistica inferenziale
Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo
DettagliComputational Game Theory
Computational Game Theory Vincenzo Bonifaci 24 maggio 2012 5 Regret Minimization Consideriamo uno scenario in cui un agente deve selezionare, più volte nel tempo, una decisione tra un insieme di N disponibili:
DettagliCapitolo 4: Ottimizzazione non lineare non vincolata parte II. E. Amaldi DEIB, Politecnico di Milano
Capitolo 4: Ottimizzazione non lineare non vincolata parte II E. Amaldi DEIB, Politecnico di Milano 4.3 Algoritmi iterativi e convergenza Programma non lineare (PNL): min f(x) s.v. g i (x) 0 1 i m x S
DettagliAutomazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it
Automazione Industriale (scheduling+mms) scheduling+mms adacher@dia.uniroma3.it Introduzione Sistemi e Modelli Lo studio e l analisi di sistemi tramite una rappresentazione astratta o una sua formalizzazione
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliSVM. Veronica Piccialli. Roma 11 gennaio 2010. Università degli Studi di Roma Tor Vergata 1 / 14
SVM Veronica Piccialli Roma 11 gennaio 2010 Università degli Studi di Roma Tor Vergata 1 / 14 SVM Le Support Vector Machines (SVM) sono una classe di macchine di che derivano da concetti riguardanti la
DettagliTecniche di riconoscimento statistico
On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 4 Reti neurali per la classificazione Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com
Dettagli1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
DettagliPROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -
DettagliMetodi Stocastici per la Finanza
Metodi Stocastici per la Finanza Tiziano Vargiolu vargiolu@math.unipd.it 1 1 Università degli Studi di Padova Anno Accademico 2011-2012 Lezione 6 Indice 1 Il metodo bootstrap 2 Esercitazione 3 Interpolazione
DettagliLEZIONE 23. Esempio 23.1.3. Si consideri la matrice (si veda l Esempio 22.2.5) A = 1 2 2 3 3 0
LEZIONE 23 231 Diagonalizzazione di matrici Abbiamo visto nella precedente lezione che, in generale, non è immediato che, data una matrice A k n,n con k = R, C, esista sempre una base costituita da suoi
DettagliFederico Lastaria. Analisi e Geometria 2. Matrici simmetriche. Il teorema spettrale. 1/24
Contenuto Endomorfismi auto-aggiunti. Matrici simmetriche. Il teorema spettrale Gli autovalori di una matrice simmetrica sono tutti reali. (Dimostrazione fatta usando i numeri complessi). Dimostrazione
DettagliDiagonalizzazione di matrici e applicazioni lineari
CAPITOLO 9 Diagonalizzazione di matrici e applicazioni lineari Esercizio 9.1. Verificare che v = (1, 0, 0, 1) è autovettore dell applicazione lineare T così definita T(x 1,x 2,x 3,x 4 ) = (2x 1 2x 3, x
DettagliAlgoritmi e Strutture Dati II: Parte B Anno Accademico 2004-2005. Lezione 11
Algoritmi e Strutture Dati II: Parte B Anno Accademico 2004-2005 Docente: Ugo Vaccaro Lezione 11 In questa lezione vedremo alcune applicazioni della tecnica greedy al progetto di algoritmi on-line. Vediamo
DettagliUNIVERSITA DI PISA FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA ELETTRONICA ANNO ACCADEMICO 2004-2005 TESI DI LAUREA
UNIVERSITA DI PISA FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA ELETTRONICA ANNO ACCADEMICO 2004-2005 TESI DI LAUREA SVILUPPO DI METODI DECONVOLUTIVI PER L INDIVIDUAZIONE DI SORGENTI INDIPENDENTI
DettagliIdentificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete Neuronale
Identificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete euronale Descrizione Il presente lavoro, facente segiuto a quanto descritto precedentemente, ha il fine di: 1) introdurre
DettagliAlgoritmi e strutture dati. Codici di Huffman
Algoritmi e strutture dati Codici di Huffman Memorizzazione dei dati Quando un file viene memorizzato, esso va memorizzato in qualche formato binario Modo più semplice: memorizzare il codice ASCII per
DettagliComputazione per l interazione naturale: Modelli dinamici
Computazione per l interazione naturale: Modelli dinamici Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2015.html
DettagliMINIMI QUADRATI. REGRESSIONE LINEARE
MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione
DettagliStatistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.
Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:
DettagliFinanza matematica - Lezione 01
Finanza matematica - Lezione 01 Contratto d opzione Un opzione è un contratto finanziario stipulato al tempo, che permette di eseguire una certa transazione, d acquisto call o di vendita put, ad un tempo
DettagliAnalisi di scenario File Nr. 10
1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica giorgio.calcagnini@uniurb.it http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html
DettagliUniversità di Napoli Parthenope Facoltà di Ingegneria
Università di Napoli Parthenope Facoltà di Ingegneria Corso di rasmissione Numerica docente: Prof. Vito Pascazio 18 a Lezione: 13/1/4 19 a Lezione: 14/1/4 Sommario rasmissione di segnali PM numerici su
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
DettagliA intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.
Algoritmi di routing dinamici (pag.89) UdA2_L5 Nelle moderne reti si usano algoritmi dinamici, che si adattano automaticamente ai cambiamenti della rete. Questi algoritmi non sono eseguiti solo all'avvio
DettagliCapitolo 13: L offerta dell impresa e il surplus del produttore
Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:
DettagliInformatica 3. Informatica 3. LEZIONE 10: Introduzione agli algoritmi e alle strutture dati. Lezione 10 - Modulo 1. Importanza delle strutture dati
Informatica 3 Informatica 3 LEZIONE 10: Introduzione agli algoritmi e alle strutture dati Modulo 1: Perchè studiare algoritmi e strutture dati Modulo 2: Definizioni di base Lezione 10 - Modulo 1 Perchè
DettagliEntropia. Motivazione. ? Quant è l informazione portata dalla sequenza? Abbiamo una sequenza S di N simboli (campioni audio, pixel, caratteri,...
Entropia Motivazione Abbiamo una sequenza S di N simboli (campioni audio, pixel, caratteri,... ) s,s 2,s 3,... ognuno dei quali appartiene ad un alfabeto A di M elementi.? Quant è l informazione portata
DettagliSistemi Informativi Territoriali. Map Algebra
Paolo Mogorovich Sistemi Informativi Territoriali Appunti dalle lezioni Map Algebra Cod.735 - Vers.E57 1 Definizione di Map Algebra 2 Operatori locali 3 Operatori zonali 4 Operatori focali 5 Operatori
DettagliSlide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliCorso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile
Problemi connessi all utilizzo di un numero di bit limitato Abbiamo visto quali sono i vantaggi dell utilizzo della rappresentazione in complemento alla base: corrispondenza biunivoca fra rappresentazione
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
DettagliDocumentazione esterna al software matematico sviluppato con MatLab
Documentazione esterna al software matematico sviluppato con MatLab Algoritmi Metodo di Gauss-Seidel con sovrarilassamento Metodo delle Secanti Metodo di Newton Studente Amelio Francesco 556/00699 Anno
DettagliAnalisi Statistica Spaziale
Analisi Statistica Spaziale Posa D., De Iaco S. posa@economia.unile.it s.deiaco@economia.unile.it UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA ANNO ACCADEMICO
DettagliRicerca Operativa Esercizi sul metodo del simplesso. Luigi De Giovanni, Laura Brentegani
Ricerca Operativa Esercizi sul metodo del simplesso Luigi De Giovanni, Laura Brentegani 1 1) Risolvere il seguente problema di programmazione lineare. ma + + 3 s.t. 2 + + 2 + 2 + 3 5 2 + 2 + 6,, 0 Soluzione.
Dettagli(a cura di Francesca Godioli)
lezione n. 12 (a cura di Francesca Godioli) Ad ogni categoria della variabile qualitativa si può assegnare un valore numerico che viene chiamato SCORE. Passare dalla variabile qualitativa X2 a dei valori
DettagliInterpolazione ed approssimazione di funzioni
Interpolazione ed approssimazione di funzioni Lucia Gastaldi Dipartimento di Matematica, http://dm.ing.unibs.it/gastaldi/ 9 novembre 2007 Outline 1 Polinomi Valutazione di un polinomio Algoritmo di Horner
DettagliLezione 9: Cambio di base
Lezione 9: Cambio di base In questa lezione vogliamo affrontare uno degli argomenti piu ostici per lo studente e cioè il cambio di base all interno di uno spazio vettoriale, inoltre cercheremo di capire
DettagliIDENTIFICAZIONE dei MODELLI e ANALISI dei DATI. Lezione 40: Filtro di Kalman - introduzione. Struttura ricorsiva della soluzione.
IDENTIFICAZIONE dei MODELLI e ANALISI dei DATI Lezione 40: Filtro di Kalman - introduzione Cenni storici Filtro di Kalman e filtro di Wiener Formulazione del problema Struttura ricorsiva della soluzione
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliAutovalori e Autovettori
Daniela Lera Università degli Studi di Cagliari Dipartimento di Matematica e Informatica A.A. 2008-2009 Autovalori e Autovettori Definizione Siano A C nxn, λ C, e x C n, x 0, tali che Ax = λx. (1) Allora
DettagliOttimizzazione nella gestione dei progetti Capitolo 4: la gestione dei costi (Programmazione multimodale): formulazioni
Ottimizzazione nella gestione dei progetti Capitolo 4: la gestione dei costi (Programmazione multimodale): formulazioni CARLO MANNINO Università di Roma La Sapienza Dipartimento di Informatica e Sistemistica
DettagliIntroduzione all Information Retrieval
Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information
DettagliCapitolo 2 Distribuzioni di frequenza
Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.
DettagliBasi di matematica per il corso di micro
Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
DettagliCorso di Visione Artificiale. Filtri parte I. Samuel Rota Bulò
Corso di Visione Artificiale Filtri parte I Samuel Rota Bulò Filtri spaziali Un filtro spaziale è caratterizzato da un intorno e un'operazione che deve essere eseguita sui pixels dell'immagine in quell'intorno.
DettagliOttimizzazione Multi Obiettivo
Ottimizzazione Multi Obiettivo 1 Ottimizzazione Multi Obiettivo I problemi affrontati fino ad ora erano caratterizzati da una unica (e ben definita) funzione obiettivo. I problemi di ottimizzazione reali
DettagliVerifica di ipotesi e intervalli di confidenza nella regressione multipla
Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo
DettagliEconomia Applicata ai sistemi produttivi. 06.05.05 Lezione II Maria Luisa Venuta 1
Economia Applicata ai sistemi produttivi 06.05.05 Lezione II Maria Luisa Venuta 1 Schema della lezione di oggi Argomento della lezione: il comportamento del consumatore. Gli economisti assumono che il
DettagliCodifiche a lunghezza variabile
Sistemi Multimediali Codifiche a lunghezza variabile Marco Gribaudo marcog@di.unito.it, gribaudo@elet.polimi.it Assegnazione del codice Come visto in precedenza, per poter memorizzare o trasmettere un
Dettagli2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione
Capitolo 2 MATRICI Fra tutte le applicazioni su uno spazio vettoriale interessa esaminare quelle che mantengono la struttura di spazio vettoriale e che, per questo, vengono dette lineari La loro importanza
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliStrutturazione logica dei dati: i file
Strutturazione logica dei dati: i file Informazioni più complesse possono essere composte a partire da informazioni elementari Esempio di una banca: supponiamo di voler mantenere all'interno di un computer
DettagliRegressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
DettagliMetodi e Modelli per l Ottimizzazione Combinatoria Il problema del flusso di costo minimo
Metodi e Modelli per l Ottimizzazione Combinatoria Il problema del flusso di costo minimo L. De Giovanni G. Zambelli 1 Problema del flusso a costo minimo Il problema del flusso a costo minimo é definito
DettagliEquazioni alle differenze finite (cenni).
AL 011. Equazioni alle differenze finite (cenni). Sia a n } n IN una successione di numeri reali. (Qui usiamo la convenzione IN = 0, 1,,...}). Diremo che è una successione ricorsiva o definita per ricorrenza
DettagliStatistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
DettagliAPPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI
APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI Indice 1 Le frazioni algebriche 1.1 Il minimo comune multiplo e il Massimo Comun Divisore fra polinomi........ 1. Le frazioni algebriche....................................
DettagliCorso di Matematica per la Chimica
Dott.ssa Maria Carmela De Bonis a.a. 203-4 I sistemi lineari Generalità sui sistemi lineari Molti problemi dell ingegneria, della fisica, della chimica, dell informatica e dell economia, si modellizzano
DettagliPROVA FINALE V. AULETTA G. PERSIANO ALGORITMI II - -MAGIS INFO
PROVA FINALE V. AULETTA G. PERSIANO ALGORITMI II - -MAGIS INFO 1. Load Balancing Un istanza del problema del load balancing consiste di una sequenza p 1,..., p n di interi positivi (pesi dei job) e un
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliOCCUPATI SETTORE DI ATTIVITA' ECONOMICA
ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971
DettagliPsicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE
Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una
Dettagli4. Operazioni elementari per righe e colonne
4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:
DettagliVARIABILI ALEATORIE CONTINUE
VARIABILI ALEATORIE CONTINUE Se X è una variabile aleatoria continua, la probabilità che X assuma un certo valore x fissato è in generale zero, quindi non ha senso definire una distribuzione di probabilità
DettagliPreprocessamento dei Dati
Preprocessamento dei Dati Raramente i dati sperimentali sono pronti per essere utilizzati immediatamente per le fasi successive del processo di identificazione, a causa di: Offset e disturbi a bassa frequenza
DettagliMetodi Computazionali
Metodi Computazionali Elisabetta Fersini fersini@disco.unimib.it A.A. 2009/2010 Catene di Markov Applicazioni: Fisica dinamica dei sistemi Web simulazione del comportamento utente Biologia evoluzione delle
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliLa Minimizzazione dei costi
La Minimizzazione dei costi Il nostro obiettivo è lo studio del comportamento di un impresa che massimizza il profitto sia in mercati concorrenziali che non concorrenziali. Ora vedremo la fase della minimizzazione
DettagliESERCIZI DI ALGEBRA LINEARE E GEOMETRIA
ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA Francesco Bottacin Padova, 24 febbraio 2012 Capitolo 1 Algebra Lineare 1.1 Spazi e sottospazi vettoriali Esercizio 1.1. Sia U il sottospazio di R 4 generato dai
DettagliMICROECONOMIA La teoria del consumo: Alcuni Arricchimenti. Enrico Saltari Università di Roma La Sapienza
MICROECONOMIA La teoria del consumo: Alcuni Arricchimenti Enrico Saltari Università di Roma La Sapienza 1 Dotazioni iniziali Il consumatore dispone ora non di un dato reddito monetario ma di un ammontare
Dettagliiovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi
iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso
DettagliAlgoritmi di clustering
Algoritmi di clustering Dato un insieme di dati sperimentali, vogliamo dividerli in clusters in modo che: I dati all interno di ciascun cluster siano simili tra loro Ciascun dato appartenga a uno e un
DettagliVALORE DELLE MERCI SEQUESTRATE
La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune
DettagliSequenziamento a minimo costo di commutazione in macchine o celle con costo lineare e posizione home (In generale il metodo di ottimizzazione
Sequenziamento a minimo costo di commutazione in macchine o celle con costo lineare e posizione home (In generale il metodo di ottimizzazione presentato in questo file trova la seq. a costo minimo per
DettagliRappresentazione nello spazio degli stati
Chapter 1 Rappresentazione nello spazio degli stati La modellazione di un sistema lineare di ordine n, fornisce un insieme di equazioni differenziali che una volta trasformate nel dominio discreto, possono
Dettagli1. PRIME PROPRIETÀ 2
RELAZIONI 1. Prime proprietà Il significato comune del concetto di relazione è facilmente intuibile: due elementi sono in relazione se c è un legame tra loro descritto da una certa proprietà; ad esempio,
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliUn modello matematico di investimento ottimale
Un modello matematico di investimento ottimale Tiziano Vargiolu 1 1 Università degli Studi di Padova Liceo Scientifico Benedetti Venezia, giovedì 30 marzo 2011 Outline 1 Investimento per un singolo agente
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliTeoria dei Giochi. Anna Torre
Teoria dei Giochi Anna Torre Almo Collegio Borromeo 14 marzo 2013 email: anna.torre@unipv.it sito web del corso:www-dimat.unipv.it/atorre/borromeo2013.html IL PARI O DISPARI I II S T S (-1, 1) (1, -1)
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliTutorato di GE110. Universitá degli Studi Roma Tre - Corso di Laurea in Matematica
Universitá degli Studi Roma Tre - Corso di Laurea in Matematica Tutorato di GE110 A.A. 2014-2015 - Docente: Prof. Angelo Felice Lopez Tutori: Federico Campanini e Giulia Salustri Soluzioni Tutorato 13
DettagliOttimizzazione delle interrogazioni (parte I)
Ottimizzazione delle interrogazioni I Basi di Dati / Complementi di Basi di Dati 1 Ottimizzazione delle interrogazioni (parte I) Angelo Montanari Dipartimento di Matematica e Informatica Università di
DettagliPage 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo
Evoluzione In ogni popolazione si verificano delle mutazioni. Intelligenza Artificiale In un ambiente che varia, le mutazioni possono generare individui che meglio si adattano alle nuove condizioni. Questi
DettagliCorso di Calcolo Numerico
Corso di Calcolo Numerico Dottssa MC De Bonis Università degli Studi della Basilicata, Potenza Facoltà di Ingegneria Corso di Laurea in Ingegneria Meccanica Corso di Calcolo Numerico - Dottssa MC De Bonis
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliMATLAB. Caratteristiche. Dati. Esempio di programma MATLAB. a = [1 2 3; 4 5 6; 7 8 9]; b = [1 2 3] ; c = a*b; c
Caratteristiche MATLAB Linguaggio di programmazione orientato all elaborazione di matrici (MATLAB=MATrix LABoratory) Le variabili sono matrici (una variabile scalare equivale ad una matrice di dimensione
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliMetodi e Modelli Matematici di Probabilità per la Gestione
Metodi e Modelli Matematici di Probabilità per la Gestione Prova scritta del 30/1/06 Esercizio 1 Una banca ha N correntisti. Indichiamo con N n il numero di correntisti esistenti il giorno n-esimo. Descriviamo
DettagliOttimizazione vincolata
Ottimizazione vincolata Ricordiamo alcuni risultati provati nella scheda sulla Teoria di Dini per una funzione F : R N+M R M di classe C 1 con (x 0, y 0 ) F 1 (a), a = (a 1,, a M ), punto in cui vale l
Dettagli