Pro e contro delle RNA



Похожие документы
Tecniche di riconoscimento statistico

Relazioni statistiche: regressione e correlazione

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

Elementi di Psicometria con Laboratorio di SPSS 1

Regressione non lineare con un modello neurale feedforward

Capitolo 13: L offerta dell impresa e il surplus del produttore

Corso di. Dott.ssa Donatella Cocca

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Esempio. Approssimazione con il criterio dei minimi quadrati. Esempio. Esempio. Risultati sperimentali. Interpolazione con spline cubica.

LE FUNZIONI A DUE VARIABILI

Equazione della Circonferenza - Grafico di una Circonferenza - Intersezione tra Circonferenza e Retta

Fondamenti di Informatica 2. Le operazioni binarie

Capitolo 2. Operazione di limite

LEZIONE n. 5 (a cura di Antonio Di Marco)

e-dva - eni-depth Velocity Analysis

Analisi della performance temporale della rete

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Capitolo 12 La regressione lineare semplice

STATISTICA IX lezione

Il concetto di valore medio in generale

MD 9. La macroeconomia delle economie aperte. UD 9.1. Macroeconomia delle economie aperte

Grafici di redditività BREAK-EVEN ANALYSIS

SVM. Veronica Piccialli. Roma 11 gennaio Università degli Studi di Roma Tor Vergata 1 / 14

Modello matematico PROGRAMMAZIONE LINEARE PROGRAMMAZIONE LINEARE

Statistiche campionarie

Più processori uguale più velocità?

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Tecniche di Prototipazione. Introduzione

E naturale chiedersi alcune cose sulla media campionaria x n

INDICE PREFAZIONE VII

La statistica multivariata

Regressione Logistica: un Modello per Variabili Risposta Categoriali

Il Regime IVA delle Cooperative sociali Opportune precisazioni

Registratori di Cassa

Paperone e Rockerduck: a cosa serve l antitrust?

PowerSchedo. Un sistema di supporto alla decisione nel settore dell'oil&gas. For further information:

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

VC-dimension: Esempio

MANUALE PARCELLA FACILE PLUS INDICE

PROGETTO EM.MA PRESIDIO

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi

Modelli per variabili dipendenti qualitative

1. Distribuzioni campionarie

LEZIONI CON I PAD Docente scuola secondaria IC Moglia Carla Casareggio Classi seconde 2014/2015 Proprietà triangoli e quadrilateri con Sketchometry

L IMPORTANZA DEL COACHING NELLE AZIENDE

Acquisizione delle immobilizzazioni materiali: acquisto

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone

LA RETTA. Retta per l'origine, rette orizzontali e verticali

Analisi dei costi e contabilità industriale

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux

Funzioni. Funzioni /2

Corrispondenze e funzioni

VALORE DELLE MERCI SEQUESTRATE

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Osservazioni sulla continuità per le funzioni reali di variabile reale

manifatturiera e per i servizi

Indice. pagina 2 di 10

Fasi di creazione di un programma

SPC e distribuzione normale con Access

24 : 3 = 8 con resto 0 26 : 4 = 6 con resto 2

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Capitolo 5. Funzioni. Grafici.

RAEE Uno contro Uno schedario di carico e scarico documento semplificato di trasporto dichiarazione sostitutiva RAEE

A cura di Giorgio Sordelli

Laboratorio di reti Relazione N 5 Gruppo 9. Vettorato Mattia Mesin Alberto

II.f. Altre attività sull euro

LA CORRELAZIONE LINEARE

Opportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica. Francesco Maria Sanna Roma, 3 maggio 2012

OSSERVAZIONI TEORICHE Lezione n. 4

Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto

Complementi di Analisi per Informatica *** Capitolo 2. Numeri Complessi. e Circuiti Elettrici. a Corrente Alternata. Sergio Benenti 7 settembre 2013

L intelligenza numerica

PO 01 Rev. 0. Azienda S.p.A.

LA FATTURAZIONE DEI SERVIZI COMMISSIONATI

Corso di Visione Artificiale. Immagini digitali. Samuel Rota Bulò

Dimensione di uno Spazio vettoriale

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

2 Argomenti introduttivi e generali

Il controllo dei rischi operativi in concreto: profili di criticità e relazione con gli altri rischi aziendali

Metodi statistici per le ricerche di mercato

COMPORTAMENTO AL FUOCO DI PAVIMENTI RESILIENTI A BASE DI PVC (M. Piana G. Vidotto)

Il riduttore di focale utilizzato è il riduttore-correttore Celestron f/ 6.3.

Come affrontare i monopoli naturali

La distribuzione Normale. La distribuzione Normale

FUNZIONE. Si scrive: A B f: A B x y=f(x) (si legge: f funzione da A in B) x f y= f(x)

Anno 3. Classificazione delle funzioni

La distribuzione Gaussiana

SISTEMA di GESTIONE QUALITÀ Non Conformità ed Efficacia delle Azioni Correttive Preventive

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Транскрипт:

Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione; - le RNA sono adatte ad essere implementate su macchine per il calcolo parallelo;

Pro e contro delle RNA Contro: - data hungry e overfitting: la stima dei pesi richiede numerosità consistenti; - difficoltà di stima: presenza di molti minimi locali nella funzione obiettivo; - interpretabilità: grosse difficoltà ad interpretare la relazione fra x ed y; - inferenza: non ci sono metodi statistici per il calcolo degli errori di stima associati ai parametri, per la scelta del numero di neuroni nascosti e per il pruning della rete;

Reti neurali con un livello nascosto sono in grado di risolvere problemi molto più complessi: regressione non lineare classificazione con la presenza di due o più rette discriminanti classificazione con criteri non lineari

Si tratta di problemi difficilmente affrontabili con tecniche tradizionali e per i quali le RNA sanno dare contributi importanti.

RNA per la regressione non lineare La regressione non lineare si ha quando Y è una variabile quantitativa che si assume dipendente da s variabili esogene X 1, X 2,, X s attraverso una funzione g non lineare. Yˆ = g ( X, X, L, ) 1 2 X s

Si può pensare sempre all esempio della catena di ipermercati che desidera prevedere il fatturato di un nuovo punto vendita sulla base di tre variabili di contesto relative all area in cui esso sorgerà. ˆ = Y g ( X, X, ) 1 2 X 3 Prima avevamo supposto che g fosse una funzione lineare, ma in realtà si potrebbe ipotizzare che il meccanismo che lega le variabili sia più complesso.

Graficamente si può rappresentare il caso di due sole variabili esogene X 1 e X 2. La regressione lineare equivale ad ipotizzare che i punti (y i x 1i x 2i ) siano interpolabili da un piano.

Con una regressione non lineare i punti (y i x 1i x 2i ) vengono interpolati da funzioni più complesse.

La complessità della funzione di regressione è definita dalla forma che si imprime alle propagation rule ed alle funzioni di attivazione. Ovviamente sono possibili un infinito numero di forme.

Vediamo cosa accade con due variabili esogene e una comune architettura di RNA: Un livello nascosto composto da due nodi (l=1, m=2) Propagation rule lineari sia nel livello nascosto che nel livello di output funzione di attivazione sigmoide nel livello nascosto e identità nel livello di output.

1 α 0 r 1 = 1/(1+exp( α 0 α 1 X 1 α 2 X 2 )) X 1 β 0 a = ω 1 r 1 + ω 2 r 2 = α 1 β1 r 1 ω 1 /(1+exp( α 0 α 1 X 1 α 2 X 2 ))+ ω 2 /(1+exp( β 0 β 1 X 1 β 2 X 2 )) a 1 = α 0 + α 1 X 1 + α 2 X 2 ω 1 Y = a Y α 2 r 2 = 1/(1+exp( β 0 β 1 X 1 β 2 X 2 )) r 2 ω 2 X 2 β 2 a 2 = β 0 + β 1 X 1 + β 2 X 2

Graficamente, per una particolare configurazione dei parametri, si ha la seguente funzione interpolante

La stessa rete con una diversa configurazione dei parametri, è in grado di fornire una funzione di regressione completamente diversa!

Naturalmente quando le variabili esogene sono più di due non è più possibile rappresentare graficamente la funzione di regressione. Inoltre per architetture più complesse cresce anche la complessità delle funzioni e la varietà di forme che esse possono assumere. Aver esaminato a fondo dei casi semplici ci è servito unicamente per avere un idea di come opera la rete nei casi complessi, che sono quelli effettivamente interessanti dal punto di vista operativo.

Quindi in generale: E estremamente difficile e comunque non interessa esplicitare la funzione di regressione. Non interessano i valori assunti dai parametri. Una volta dettate le regole fondamentali (l, m, propagation rule, funzioni di attivazione) la rete diviene una black box a cui fornire i nuovi inputs per ottenere i corrispondenti outputs.

Importa soltanto sapere che: Agendo sul numero di nodi nel livello nascosto, sulla forma delle propagation rule e delle funzioni di attivazione ai vari livelli, si ottengono un gran numero di diverse tipologie di non linearità Una stessa RNA è in genere in grado di approssimare una grande varietà di funzioni di regressione molto complesse

Tutto quanto detto per la classificazione con due variabili esogene si estende chiaramente anche al caso di s variabili esogene. In questo caso si perde la possibilità di rappresentare graficamente i punti e le funzioni discriminanti ed inoltre cresce molto la complessità delle funzioni stesse. Aver esaminato a fondo dei casi semplici ci è servito unicamente per avere un idea di come opera la rete nei casi complessi, che sono quelli effettivamente interessanti dal punto di vista operativo.

Anche nel caso della classificazione dunque: E estremamente difficile e comunque non interessa esplicitare la funzione discriminante. Non interessano i valori assunti dai parametri. Una volta dettate le regole fondamentali (l, m, propagation rule, funzioni di attivazione) la rete diviene una black box a cui fornire i nuovi inputs per ottenere le corrispondenti classificazioni.

Importa soltanto sapere che: Agendo sul numero di nodi nel livello nascosto, sulla forma delle propagation rule e delle funzioni di attivazione ai vari livelli, si ottengono diverse tipologie di discriminazione (lineare o non lineare, a una, due o più funzioni discriminanti). Una RNA è in genere in grado di effettuare classificazioni anche in casi di forme molto complesse.

Un osservazione sulla terminologia Un ultima osservazione: nel campo delle RNA si utilizza, come abbiamo visto, una terminologia specifica. Taluni termini sono spesso di effetto (si pensi alla parola apprendimento ) ma non devono ingannare, nel senso che si deve sempre tenere presente il loro effettivo significato, per non attribuire alle RNA capacità che vanno oltre quelle di puro e semplice strumento matematico. Vediamo quindi una breve rassegna di termini tipici delle RNA, associati al loro corrispondente nella terminolgia statistica classica.

Un osservazione sulla terminologia RNA Inputs Target Outputs Training set Esempio Pesi Apprendimento o Addestramento Statistica Variabili esogene o indipendenti Valori osservati Valori teorici (o previsti) Campione Unità campionaria Parametri Stima dei parametri