VC-dimension: Esempio



Похожие документы
SVM. Veronica Piccialli. Roma 11 gennaio Università degli Studi di Roma Tor Vergata 1 / 14

Capitolo 13: L offerta dell impresa e il surplus del produttore

Ottimizazione vincolata

Lezione del Teoria dei vettori ordinari

1. Sia dato un poliedro. Dire quali delle seguenti affermazioni sono corrette.

CONTINUITÀ E DERIVABILITÀ Esercizi proposti. 1. Determinare lim M(sinx) (M(t) denota la mantissa di t)

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI

Basi di matematica per il corso di micro

Ottimizzazione nella gestione dei progetti Capitolo 4: la gestione dei costi (Programmazione multimodale): formulazioni

Sia data la rete di fig. 1 costituita da tre resistori,,, e da due generatori indipendenti ideali di corrente ed. Fig. 1

MICROECONOMIA La teoria del consumo: Alcuni Arricchimenti. Enrico Saltari Università di Roma La Sapienza

15 febbraio Soluzione esame di geometria - 12 crediti Ingegneria gestionale - a.a COGNOME... NOME... N. MATRICOLA...

Parte 6. Applicazioni lineari

13. Campi vettoriali

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004

Matematica generale CTF

UNIVERSITÀ DEGLI STUDI DI TERAMO

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora:

MATEMATICA. { 2 x =12 y 3 y +8 x =0, si pone il problema di trovare, se esistono, un numero x ed un numero y che risolvano entrambe le equazioni.

La scelta in condizioni di incertezza

CURVE DI LIVELLO. Per avere informazioni sull andamento di una funzione f : D IR n IR può essere utile considerare i suoi insiemi di livello.

Dimensione di uno Spazio vettoriale

Massimi e minimi vincolati di funzioni in due variabili

10. Insiemi non misurabili secondo Lebesgue.

Tecniche di riconoscimento statistico

CORSO DI LAUREA IN INGEGNERIA.

LE FUNZIONI A DUE VARIABILI

Sequenziamento a minimo costo di commutazione in macchine o celle con costo lineare e posizione home (In generale il metodo di ottimizzazione

Applicazioni lineari

La Programmazione Lineare

PROGRAMMAZIONE LINEARE IN DUE VARIABILI

Ricerca Operativa A.A. 2007/ Dualità in Programmazione Lineare

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme

Ipotesi sulle preferenze

1 Applicazioni Lineari tra Spazi Vettoriali

MINIMI QUADRATI. REGRESSIONE LINEARE

Lezione 5. Argomenti. Premessa Vincolo di bilancio La scelta ottima del consumatore

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Funzioni. Parte prima. Daniele Serra

Richiami di algebra lineare e geometria di R n

LA RETTA. Retta per l'origine, rette orizzontali e verticali

Scelte in condizioni di rischio e incertezza

Lezione 9: Cambio di base

Funzioni di più variabili

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

Capitolo 26: Il mercato del lavoro

x 1 + x 2 3x 4 = 0 x1 + x 2 + x 3 = 0 x 1 + x 2 3x 4 = 0.

Parte 3. Rango e teorema di Rouché-Capelli

FUNZIONI / ESERCIZI SVOLTI

1. PRIME PROPRIETÀ 2

LE FUNZIONI E LE LORO PROPRIETÀ

Applicazioni del calcolo differenziale allo studio delle funzioni

EQUAZIONI DIFFERENZIALI. 1. Trovare tutte le soluzioni delle equazioni differenziali: (a) x = x 2 log t (d) x = e t x log x (e) y = y2 5y+6

2 + (σ2 - ρσ 1 ) 2 > 0 [da -1 ρ 1] b = (σ ρσ1 σ 2 ) = (σ 1

LEZIONE 7. Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x x2. 2, x3 +2x +3.

a) Osserviamo innanzi tutto che dev essere x > 0. Pertanto il dominio è ]0, + [. b) Poniamo t = log x. Innanzi tutto si ha:

SOLUZIONE DEL PROBLEMA 1 TEMA DI MATEMATICA ESAME DI STATO 2015

Un modello matematico di investimento ottimale

FUNZIONE ESPONENZIALE E FUNZIONE LOGARITMICA

Teoria dei Giochi. Anna Torre

Parte 2. Determinante e matrice inversa

Le preferenze e la scelta

Applicazioni dell'analisi in più variabili a problemi di economia

GEOMETRIA DELLE MASSE

2 Argomenti introduttivi e generali

ECONOMIA DEL LAVORO. Lezioni di maggio (testo: BORJAS) L offerta di lavoro

Sulle funzioni di W 1,p (Ω) a traccia nulla

La teoria dell offerta

SOLUZIONI D = (-1,+ ).

Sono casi particolari di MCF : SPT (cammini minimi) non vi sono vincoli di capacità superiore (solo x ij > 0) (i, j) A : c ij, costo di percorrenza

MONOPOLIO, MONOPOLISTA

Capitolo 10 Costi. Robert H. Frank Microeconomia - 5 a Edizione Copyright The McGraw-Hill Companies, srl

Complementi di Analisi per Informatica *** Capitolo 2. Numeri Complessi. e Circuiti Elettrici. a Corrente Alternata. Sergio Benenti 7 settembre 2013

FUNZIONE REALE DI UNA VARIABILE

MATEMATICA E STATISTICA CORSO B PROF. MARCO ABATE. 6 giugno 2007

Matematica 1 - Corso di Laurea in Ingegneria Meccanica

Esercizi su lineare indipendenza e generatori

Modello matematico PROGRAMMAZIONE LINEARE PROGRAMMAZIONE LINEARE

Metodi e Modelli per l Ottimizzazione Combinatoria Il problema del flusso di costo minimo

Esempi di funzione. Scheda Tre

CONTINUITÀ E DERIVABILITÀ Esercizi risolti

Edited by Foxit PDF Editor Copyright (c) by Foxit Software Company, 2004 For Evaluation Only.

Fondamenti e didattica di Matematica Finanziaria

Studio di una funzione ad una variabile

Consideriamo due polinomi

Studio di funzioni ( )

la funzione è definita la funzione non è definita Si osservi, infatti, che la radice di un numero negativo non esiste nel campo dei numeri reali.

Metodi Stocastici per la Finanza

Le funzioni continue. A. Pisani Liceo Classico Dante Alighieri A.S A. Pisani, appunti di Matematica 1

Capitolo 25: Lo scambio nel mercato delle assicurazioni

Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in

risulta (x) = 1 se x < 0.

Corrispondenze e funzioni

RICERCA OPERATIVA GRUPPO B prova scritta del 22 marzo 2007

Luigi Piroddi

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ

Транскрипт:

VC-dimension: Esempio Quale è la VC-dimension di. y b = 0 f() = 1 f() = 1 iperpiano 20?

VC-dimension: Esempio Quale è la VC-dimension di? banale. Vediamo cosa succede con 2 punti: 21

VC-dimension: Esempio Quale è la VC-dimension di? Quindi. Vediamo cosa succede con 3 punti: 22

VC-dimension: Esempio Quale è la VC-dimension di? Quindi. Cosa succede con 4 punti? 23

VC-dimension: Esempio Quale è la VC-dimension di? Quindi. Cosa succede con 4 punti? Non si riesce a frammentare 4 punti!! Infatti esisteranno sempre due coppie di punti che se unite con un segmento provocano una intersezione fra i due segmenti e quindi, ponendo ogni coppia di punti in classi diverse, per separarli non basta una retta, ma occorre una curva. Quindi 24

VC-dimension Dimostriamo che Per ogni tale che frammenta si ha realizzare tutte le possibili dicotomie di, infatti può, che sono esattamente. Scegliendo un cui vale per si ottiene possiamo concludere che applicando Quindi, ad entrambi i membri dell ultima disuguaglianza, 25

3 -, /. -,. (! "! % & 21 21! "! % & ' &* - Algoritmo di Apprendimento ( &* $ )0 *&0 ( &* # $ # )( Bound sull Errore Ideale per Classificazione Binaria Consideriamo un problema di classificazione binario (i.e., apprendimento di concetti). Dati - Training Set - Spazio delle Ipotesi l errore empirico che restituisce l ipotesi, dove minimizza è possibile derivare dei bound sull errore ideale (detto anche errore di generalizzazione), validi con probabilità, che hanno una forma del tipo Esempio: 26

Bound sull Errore Ideale per Classificazione Binaria Si noti che - il termine A DIPENDE SOLO dalla ipotesi restituita dall algoritmo di apprendimento ; - il termine B è INDIPENDENTE dalla ipotesi restituita dall algoritmo di apprendimento ; in particolare dipende dal rapporto fra VC-dimension dello spazio delle ipotesi e numero di esempi di apprendimento (il ( &*), oltre ovviamente che dalla confidenza ( ) con cui il bound è valido. 1.4 Il termine B è usualmente chiamato VC-confidence e risulta essere monotono rispetto al rapporto fissato (; &*aumenta all aumentare di. VC Confidence 1.2 1 0.8 0.6 0.4 0.2 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 VC Dimension / Numero Esempi 27

Structural Risk Minimization Problema: all aumentare della VC-dimension diminuisce l errore empirico (termine A), ma aumenta la VC confidence (termine B)! L approccio Structural Risk Minimization tenta di trovare un compromesso tra i due termini: Bound on true risk Si considerano tali che Bound on VCconfidence - - Error - si seleziona l ipotesi che ha il bound sull errore Empirical error ideale pi ù basso VCdim Esempio: Reti neurali con un numero crescente di neuroni nascosti H 1 H 2 H 3 H n 28

Support Vector Machines: idea base Possiamo applicare l approccio Structural Risk Minimization a spazi delle ipotesi costituiti da iperpiani? Sappiamo che un iperpiano in uno spazio a dimensioni ha. Come facciamo a creare una struttura di spazi delle ipotesi con VC-dimension crescente? Bisogna porre dei vincoli sugli iperpiani! Consideriamo iperpiani separatori con margine Consideriamo il caso in cui gli esempi siano linearmente separabili. Il margine è la distanza fra l iperpiano e l esempio più vicino. L iperpiano con margine maggiore è detto ottimo. nonoptimal optimal 29

Margine La distanza di un vettore da un iperpiano la possimo misurare in senso algebrico. Dato un iperpiano determinato dalla equazione restituisce la distanza algebrica di, la funzione discriminante dall iperpiano. Infatti, se esprimiamo come dove è la proiezione normale di sull iperpiano ed èla distanza algebrica x p x r > 0 desiderata ( se è sul lato positivo dell iperpiano, altrimenti ), allora (poiché risiede sull iperpiano). 30

Quindi o meglio Poiché esiste una infinità di soluzioni che differiscono solo per un fattore di scala su noti che l iperpiano non cambia scalando il suo vettore normale) ci si limita per convenzione a soluzioni che soddisfano l equazione (si Si noti che per l iperpiano ottimo, la distanza assoluta da uno degli esempi positivi più vicini è uguale a quella da uno degli esempi negativi più vicini. Il margine di separazione quindi definito come il doppio del margine: è Inoltre, se gli esempi sono linearmente separabili con margine da un iperpiano, allora dove per esempi positivi e per esempi negativi. Il problema di trovare l iperpiano ottimo si riduce quindi a quello di minimizzare. 31

$ Margine: Legame con SRM Theorema Sia R il diametro della palla più piccola che contiene tutti gli esempi di apprendimento. L insieme di iperpiani ottimi descritti dall equazione possiede VC-dimensionlimitata superiormente da dove ed è la dimensionalità dei dati di apprendimento. Quindi, se consideriamo gli spazi delle ipotesi con $ ed i dati sono linearmente separabili, allora l errore empirico è nullo per tutti gli iperpiani e quindi per minimizzare il bound sull errore ideale si deve selezionare l iperpiano con VC-dimension minima, cioè quello che minimizza (o equivalentemente massimizza il margine di separazione). 32

Caso Separabile: Formulazione Quadratica Nel caso di esempi linearmente separabili, è possibile trovare l iperpiano ottimo risolvendo il seguente problema vincolato di ottimizzazione quadratica: soggetto a: Questo problema, detto problema primale, si può risolvere più facilmente passando alla sua formulazione duale. La teoria della ottimizzazione afferma che: 1. un problema di ottimizzazione possiede una forma duale (più semplice da risolvere) se la funzione di costo e i vincoli sono strettamente convessi; 2. se le condizioni in 1 sono soddisfatte, l ottimo per il problema duale coincide con l ottimo del primale. Il nostro problema primale soddisfa le condizioni in 1. 33