Regressione Lineare e Regressione Logistica
|
|
|
- Gilberta Dolce
- 8 anni fa
- Visualizzazioni
Transcript
1 Regressione Lineare e Regressione Logistica Stefano Gualandi Università di Pavia, Dipartimento di Matematica twitter: blog:
2 1 Introduzione 2 Regressione Lineare 3 Regressione Logistica 4 Implementazione
3 Introduzione Il problema di apprendere dai dati si definisce tramite tre componenti principali: 1 Un generatore di vettori casuali x, estratti a caso da una data distribuzione P(x), non nota. 2 Un supervisore che restituisce un vettore di output y per ogni vettore di input x, seguendo una data distribuzione condizionata P(y x), non nota. 3 Un algoritmo di apprendimento, capace di implementare un insieme di funzioni f (x, w) con w Λ. Il problema consiste nel determinare una funzione dell insieme f (x, w), w Λ che predice la risposta del supervisore nel miglior modo possibile.
4 Funzione di rischio In pratica, si deve misurare la distanza tra la risposta y del supervisore per un dato vettore di input x e la risposta f (x, w) restituita dall algoritmo di apprendimento L(y, f (x, w)) Questa viene chiamata funzione di LOSS. Si considera il valore atteso di questa distanza, definendo la funzione di rischio R(w) = L(y, f (x, w)) dp(x, y) (1) L obbiettivo è trovare la funzione f (x, w ) che minimizza R(w), avendo a disposizione solo il training set: (x 1, y 1 ),..., (x N, y N ). (2)
5 Esempi di funzioni di loss 1 Pattern Recognition (Problema di Classificazione): L(y, f (x, w)) = { 0 se y = f (x, w) 1 se y f (x, w) (3) 2 Stima della funzione di regressione: L(y, f (x, w)) = (y f (x, w)) 2 (4) 3 Stime della funzione di densità: L(p(x, w)) = log p(x, w) (5)
6 Funzione di rischio empirico Poiché la distribuzione P(x, y) non è nota si usa la funzione di rischio empirica ˆR(w) = 1 N N L(y i, f (x i, w)) (6) i=1 in cui si calcola la media dei valori della funzione di loss nei punti del training set.
7 Funzione di rischio empirico Poiché la distribuzione P(x, y) non è nota si usa la funzione di rischio empirica ˆR(w) = 1 N N L(y i, f (x i, w)) (6) i=1 in cui si calcola la media dei valori della funzione di loss nei punti del training set. Si deve quindi risolvere il problema di ottimizzazione 1 ŵ = arg min ˆR(w) = arg min w Λ w Λ N N L(y i, f (x i, w)) (7) i=1
8 Regressione Lineare Sia x R p e si consideri la classe di funzioni f (x, w) lineari p y = f (x, w) = w 0 + x j w j. (8) i=j Per semplificare la notazione, si include nel vettore x il termine 1, in modo da includere w 0 nel vettore w. Si ottiene quindi y = f (x, w) = x T w. (9)
9 Regressione Lineare e Minimi quadrati Dato un insieme di campioni di punti i.i.d. z i = (x i, y i ) con i = 1,..., N, si vuole minimizzare il rischio empirico ˆR(w) = 1 N N (y i xi T w) 2 = (y Xw) T (y Xw), (10) i=1 in cui X è una matrice N (p + 1) e y è il vettore degli N output del training set.
10 Regressione Lineare e Minimi quadrati Dato un insieme di campioni di punti i.i.d. z i = (x i, y i ) con i = 1,..., N, si vuole minimizzare il rischio empirico ˆR(w) = 1 N N (y i xi T w) 2 = (y Xw) T (y Xw), (10) i=1 in cui X è una matrice N (p + 1) e y è il vettore degli N output del training set. Si deriva la (10) rispetto w e si definisce l equazione normale X T (y Xw) = 0 (11) Se la matrice X non è singolare, allora l unica soluzione è ŵ = (X T X) 1 X T y. (12)
11 Plot
12 Esercizio 1 Implementare una classe chiamata RegressioneLineare che ha due metodi: 1 fit(x,y): trova i parametri w risolvendo l equazione normale 2 predict(x): predice l output y per il dato vettore di input x
13
14 Regressione Logistica con due sole classi Quando ci sono solo due classi, poniamo 1 y i = 1, quando il campione i è nella prima classe 2 y i = 0, quando è nella seconda classe Abbiamo quindi p 1 (x, w) = p(x, w) = ex T w 1 + e x T w 1 p 2 (x, w) = 1 p(x, w) = 1 + e x T w
15 Regressione Logistica: Funzione di Loss La funzione di rischio empirico diventa ˆR(w) = N (y i log p(x i, w) + (1 y i ) log(1 p(x i, w))) = i=1 ( N e x ) i T w y i log i=1 1 + e 1 x i T w i) log 1 + e x i T w = N ( ) y i xi T w log(1 + e x T w ) i=1
16 Regressione Logistica: Funzione di Loss La funzione di rischio empirico diventa ˆR(w) = N (y i log p(x i, w) + (1 y i ) log(1 p(x i, w))) = i=1 ( N e x ) i T w y i log i=1 1 + e 1 x i T w i) log 1 + e x i T w = N ( ) y i xi T w log(1 + e x T w ) i=1 Per trovare il valore ŵ che dia il minimo della funzione precedente dobbiamo risolvere le p + 1 equazioni non lineari in w ˆR(w) w = N i=1 x i ( y i ex i T w 1 + e x i T w ) = 0. (13)
17 Minimizzare la Funzione di Loss Per risolvere le equazioni non lineari usiamo l algoritmo di Newton Raphson che calcola il valore otteniamo w in maniera iterativa: w j+1 = w j in cui tutte le derivate sono valutate in w j. ( ) 2 1 ˆR(w) ˆR(w) w w T w, (14)
18 Minimizzare la Funzione di Loss In forma matriciale, si può dimostrare che ˆR(w) w = X T (y p) (15) 2 ˆR(w) w w T = X T WX (16) In cui p è il vettore delle probabilità calcolate per l i-esimo campione di dati p(x i, w j ), e W la matrice N N con l i-esimo elemento diagonale pari a p(x i, w j )(1 p(x i, w j )).
19 Minimizzare la Funzione di Loss Il passo di Newton Raphson diventa quindi w j+1 = w j + (X T WX) 1 X T (y p) = (X T WX) 1 X T W (Xw j + W 1 (y p)) = (X T WX) 1 X T Wz, in cui, per semplificare la notazione, abbiamo prima moltiplicato w j per (X T WX) 1 (X T WX) e poi abbiamo moltiplicato (y p) per W 1 W. In pratica abbiamo riformulato il passo di Newton Raphson come un passo di minimi quadrati pesati, con risposta z = Xw j + W 1 (y p).
20 Plot
21 Plot
22 Plot
23 Esercizio 2 Implementare una classe chiamata RegressioneLogistica che ha due metodi: 1 fit(x,y): trova i parametri w utilizzando il metodo di Newton Raphson 2 predict(x): predice l output y per il dato vettore di input x ATTENZIONE: Si ponga un numero massimo di iterazioni, e si controlli che il valore della funzione di loss non diventi troppo piccolo (rischio di instabilità numerica!)
24 Funzione di Numpy da usare from numpy import matmul: moltiplicazioni tra matrici from numpy import transpose: calcola la trasposta di una matrice from numpy.linalg import inv: calcola l inversa di una matrice from numpy.linalg import pinv: calcola la pseudo inversa Altre funzioni di cui si deve consultare la documentazione: numpy.array, numpy.matrix, numpy.append, numpy.diag, numpy.vectorize
Introduzione alle Reti Neurali
Introduzione alle Reti Neurali Stefano Gualandi Università di Pavia, Dipartimento di Matematica email: twitter: blog: [email protected] @famo2spaghi http://stegua.github.com Reti Neurali Terminator
Laboratorio di Calcolo Numerico Laboratorio 12: Metodi iterativi per la soluzione di sistemi lineari
Laboratorio di Calcolo Numerico Laboratorio 12: Metodi iterativi per la soluzione di sistemi lineari Claudia Zoccarato E-mail: [email protected] Dispense: Moodle Dipartimento ICEA 24 Maggio 2017
Metodi computazionali per i Minimi Quadrati
Metodi computazionali per i Minimi Quadrati Come introdotto in precedenza si considera la matrice. A causa di mal condizionamenti ed errori di inversione, si possono avere casi in cui il e quindi S sarebbe
1. Si scriva una function Matlab che implementa il seguente metodo di punto fisso
Domanda 1 1. Si scriva una function Matlab che implementa il seguente metodo di punto fisso x n+1 = x n f(x n), n = 0, 1, 2,... K dove x 0 è il punto iniziale, f(x) = x 3 cos(x) e K è una costante assegnata.
Apprendimento statistico (Statistical Learning)
Apprendimento statistico (Statistical Learning) Il problema dell apprendimento Inquadriamo da un punto di vista statistico il problema dell apprendimento di un classificatore Un training set S={(x,y ),,(x
Laboratorio di Calcolo Numerico
Laboratorio di Calcolo Numerico M.R. Russo Università degli Studi di Padova Dipartimento di Matematica Pura ed Applicata A.A. 2009/2010 Equazioni non lineari Data una funzione consideriamo il problema
0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
Anno 4 Matrice inversa
Anno 4 Matrice inversa 1 Introduzione In questa lezione parleremo della matrice inversa di una matrice quadrata: definizione metodo per individuarla Al termine della lezione sarai in grado di: descrivere
Algoritmi di classificazione supervisionati
Corso di Bioinformatica Algoritmi di classificazione supervisionati Giorgio Valentini DI Università degli Studi di Milano 1 Metodi di apprendimento supervisionato per problemi di biologia computazionale
Apprendimento statistico (Statistical Learning)
Apprendimento statistico (Statistical Learning) Il problema dell apprendimento Inquadriamo da un punto di vista statistico il problema dell apprendimento di un classificatore Un training set S={(x,y ),,(x
Esercizio 1. Esercizio 2
Sia data la matrice A A(α) = Esercizio α 2 2α 2 2, α R.) determinare per quali valori del parametro reale α é verificata la condizione necessaria e sufficiente di convergenza per il metodo di Jacobi;.2)
Statistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: [email protected] 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
Equazioni e sistemi non lineari
Equazioni e sistemi non lineari Lucia Gastaldi DICATAM - Sezione di Matematica, http://lucia-gastaldi.unibs.it Indice 1 Ricerca degli zeri di una funzione Problema e definizioni Metodo di Newton-Raphson
Machine Learning: apprendimento, generalizzazione e stima dell errore di generalizzazione
Corso di Bioinformatica Machine Learning: apprendimento, generalizzazione e stima dell errore di generalizzazione Giorgio Valentini DI Università degli Studi di Milano 1 Metodi di machine learning I metodi
Esercitazione di Calcolo Numerico 1 22 Aprile Determinare la fattorizzazione LU della matrice a 1 1 A = 3a 2 a 2a a a 2 A =
Esercitazione di Calcolo Numerico 22 Aprile 29. Determinare la fattorizzazione LU della matrice a A = 3a 2 a 2a a a 2 ed utilizzarla per calcolare il det(a). 2. Calcolare il determinante della matrice
Problema. Sistemi lineari. Problema. Problema. Quali sono i potenziali in ogni nodo? Leggi di Kirkoff e di Ohm:
Problema 4 Ω 3 3 Ω 2 2 Ω 40 V Sistemi lineari 2 Ω Ω 2 Ω Ω 5 6 7 8 Ω 4 Ω Ω 0 V Quali sono i potenziali in ogni nodo? 2 4 Ω Problema 3 3 Ω 2 2 Ω 40 V 4 Ω Problema 3 3 Ω 2 2 Ω 40 V 2 Ω Ω 2 Ω Ω 2 Ω Ω 2 Ω Ω
Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A
Università di Siena Teoria della Stima Lucidi del corso di A.A. 2002-2003 Università di Siena 1 Indice Approcci al problema della stima Stima parametrica Stima bayesiana Proprietà degli stimatori Stime
Equazioni e sistemi non lineari
Equazioni e sistemi non lineari Lucia Gastaldi DICATAM - Sezione di Matematica, http://lucia-gastaldi.unibs.it Indice 1 Ricerca degli zeri di una funzione Problema e definizioni Metodo di Newton-Raphson
Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)
Derivazione numerica Introduzione al calcolo numerico Il calcolo della derivata di una funzione in un punto implica un processo al limite che può solo essere approssimato da un calcolatore. Supponiamo
Metodi e Modelli per l Ottimizzazione Combinatoria Ripasso sulla Programmazione Lineare e il metodo del Simplesso (parte I)
Metodi e Modelli per l Ottimizzazione Combinatoria Ripasso sulla Programmazione Lineare e il metodo del Simplesso (parte I) Luigi De Giovanni Giacomo Zambelli 1 Problemi di programmazione lineare Un problema
Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi
Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Il MRLM Il modello di regressione lineare multipla è usato per studiare le relazioni tra la variabile dipendente e diverse variabili indipendenti
ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)
ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI () Structure From Motion Date m immagini di n punti 3D (fissi) Stimare le m matrici di proiezione P i e gli n vettori X j date le mn corrispondenze x ij SFM
Corso di Matematica per la Chimica
Dott.ssa Maria Carmela De Bonis a.a. 2013-14 Pivoting e stabilità Se la matrice A non appartiene a nessuna delle categorie precedenti può accadere che al k esimo passo risulti a (k) k,k = 0, e quindi il
Inversa di una matrice
Geometria Lingotto. LeLing: La matrice inversa. Ārgomenti svolti: Inversa di una matrice. Unicita e calcolo della inversa. La inversa di una matrice. Il gruppo delle matrici invertibili. Ēsercizi consigliati:
Progetto Matlab N 2. Calcolo Numerico 6 CFU. Corso di Laurea in Ingegneria delle Comunicazioni 31/05/2014
Progetto Matlab N 2 Calcolo Numerico 6 CFU Corso di Laurea in Ingegneria delle Comunicazioni 31/05/2014 Procedimento 1. Scrivere una function che implementi il prodotto matrice-vettore AX con A matrice
STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:
esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia [email protected] http://www.lucamonno.it
Il modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Corso di Geometria BIAR, BSIR Esercizi 2: soluzioni
Corso di Geometria 2- BIAR, BSIR Esercizi 2: soluzioni Esercizio Calcolare il determinante della matrice 2 3 : 3 2 a) con lo sviluppo lungo la prima riga, b) con lo sviluppo lungo la terza colonna, c)
Metodi di Iterazione Funzionale
Appunti di Matematica Computazionale Lezione Metodi di Iterazione Funzionale Il problema di calcolare il valore per cui F() = si può sempre trasformare in quello di trovare il punto fisso di una funzione
Calcolo Numerico - Prova Matlab 19 luglio 2013
9 luglio 0 () tempo a disposizione per completare la prova: ora; () lo svolgimento della prova deve essere salvato in file denominati cognomenome#m; () è fatto assoluto divieto di aprire applicazioni diverse
Calcolo Numerico con elementi di programmazione
Calcolo Numerico con elementi di programmazione (A.A. 2014-2015) Appunti delle lezioni sui metodi per la soluzione di sistemi di equazioni non lineari Sistemi di equazioni non lineari Un sistema di equazioni
Esercitazione di Matematica su matrici e sistemi lineari
Esercitazione di Matematica su matrici e sistemi lineari Notazioni: deta, A T =trasposta di A, A 1 =inversa di A. 1. Si considerino le matrici A, B, C, D denite da 1 0 5 1 A = 0, B = 0 0, C = 0 1 0 6 1
Fin qui si sono considerate le variabili casuali ciascuna per proprio conto. Ora consideriamo la possibilità di relazioni tra variabili.
Sistemi di variabili casuali Fin qui si sono considerate le variabili casuali ciascuna per proprio conto. Ora consideriamo la possibilità di relazioni tra variabili. Esempi: - il massimo annuale della
Esercizi di Programmazione Lineare - Dualità
Esercizi di Programmazione Lineare - Dualità Esercizio n1 Dato il seguente problema 3 + 3 2 2 + a scriverne il duale; b risolvere il duale (anche geometricamente indicando cosa da esso si può dedurre sul
Raccolta di Esercizi d esame ( di Calcolo Numerico) Prof. Laura Pezza. Equazioni non lineari
Raccolta di Esercizi d esame ( di Calcolo Numerico) Prof. Laura Pezza Equazioni non lineari ESERCIZIO 1 Data l equazione ln(e + x) = 1 (1 + 4x) + 1 2 1.1 verificare analiticamente se sono soddisfatte le
Universita degli Studi di Ancona - Facolta di Ingegneria Laurea in Ing. Elettronica (VO) Ing. Informatica e Automatica - Ing. delle Telecomunicazioni
Universita degli Studi di Ancona - Facolta di Ingegneria Laurea in Ing. Elettronica (VO) Ing. Informatica e Automatica - Ing. delle Telecomunicazioni ANALISI NUMERICA - Primo Parziale - TEMA A (Prof. A.M.Perdon)
Interpolazione e approssimazione di funzioni
Interpolazione e approssimazione di funzioni Lucia Gastaldi Dipartimento di Matematica, http://dm.ing.unibs.it/gastaldi/ Laboratorio - 26 febbraio 2007 Outline 1 Interpolazione polinomiale Interpolazione
Metodo dei minimi quadrati e matrice pseudoinversa
Scuola universitaria professionale della Svizzera italiana Dipartimento Tecnologie Innovative Metodo dei minimi quadrati e matrice pseudoinversa Algebra Lineare Semestre Estivo 2006 Metodo dei minimi quadrati
Sistemi sovradeterminati
Sistemi sovradeterminati Sia A una matrice m n ove m > n sia b R m trovare una soluzione del sistema sovradeterminato Ax = b significa cercare di esprimere un vettore di R m come combinazione lineare di
Calcolo Numerico per Ingegneria. Corso estivo di Bressanone. Prof. L. Bergamaschi SOLUZIONE DELLA PROVA SCRITTA del
Calcolo Numerico per Ingegneria. Corso estivo di Bressanone. Prof. L. Bergamaschi SOLUZIONE DELLA PROVA SCRITTA del 9.8.2. Data l equazione x x = (a) Mostrare che essa ammette una e una sola soluzione
Corso di Calcolo Numerico
Corso di Laurea in Ingegneria Gestionale Sede di Fermo Corso di 9 - EQUAZIONI DIFFERENZIALI ORDINARIE valori iniziali Valori iniziali Ci occuperemo della soluzione numerica di equazioni del prim ordine
Ottimizzazione della geometria. Ottimizzazione della geometria A.A ! " B. Civalleri Chimica Computazionale a.a
Ottimizzazione della geometria A.A. 2006-07 07! " B. Civalleri Chimica Computazionale a.a. 2006-07 1 Ottimizzazione della geometria Definizioni (I) Superficie di energia potenziale (PES) La PES descrive
Corso di laurea in Informatica Calcolo Numerico Prof.ssa L. D Amore 12 Dicembre 2008 Esercizi di riepilogo tipo prova d esame
1 Cognome: Nome: Matricola: Corso di laurea in Informatica Calcolo Numerico Prof.ssa L. D Amore 12 Dicembre 2008 Esercizi di riepilogo tipo prova d esame 1. Si consideri il sistema aritmetico f. p. a precisione
a + 2b + c 3d = 0, a + c d = 0 c d
SPAZI VETTORIALI 1. Esercizi Esercizio 1. Stabilire quali dei seguenti sottoinsiemi sono sottospazi: V 1 = {(x, y, z) R 3 /x = y = z} V = {(x, y, z) R 3 /x = 4} V 3 = {(x, y, z) R 3 /z = x } V 4 = {(x,
