Apprendimento Automatico: Teoria e Applicazioni

Documenti analoghi
Corso di INFORMATICA PER LA COMUNICAZIONE DIGITALE (CLASSE L-31)

Apprendimento Automatico (Intro)

Università di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali

Apprendimento Automatico (Lezione 1)

Apprendimento Automatico (Feature Selection e Kernel Learning)

Corso di MATEMATICA (CLASSE LM-40)

Reti Neurali in Generale

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO -

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO -

Riduzione Dimensionalità

Appelli d'esame definiti nel prossimo anno

Reti Neurali. Corso di AA, anno 2016/17, Padova. Fabio Aiolli. 2 Novembre Fabio Aiolli Reti Neurali 2 Novembre / 14. unipd_logo.

REGISTRI D'ESAME CODICE ESAME CORSO DI LAUREA NOME DEL CORSO LAUREA CFU

Deep learning per il mondo business.

Circuiti e algoritmi per l elaborazione dell informazione

CALENDARIO APPELLI MAGISTRALI INFORMATICA - INFORMATICA INTERNAZIONALE - SECONDA SESSIONE D'ESAME: dal 12/06/2017 al 28/07/2017

Sistemi Intelligenti. Riassunto

Corso di Laurea Magistrale in Ingegneria Informatica

Riconoscimento e recupero dell informazione per bioinformatica

MACHINE LEARNING e DATA MINING Introduzione. a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it

Corso di Applicazioni di Intelligenza Artificiale LS. Prof. Paola Mello Anno accademico 2008/2009

Apprendimento automatico e Reti Neurali. Francesco Sambo tel

Prof. Laura Bonati, Dott. Domenico Fraccalvieri. DISAT, Ed. U1

Statistica multivariata 27/09/2016. D.Rodi, 2016

METODI QUANTITATIVI PER LA PREVISIONE SUI MERCATI DELL ENERGIA ELETTRICA E DEL GAS. Padova, 5 e 6 Aprile

Lezione introduttiva su reti neurali e SVM Veronica Piccialli. Corso di Ottimizzazione a.a (seconda parte)

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

Corso di Laurea Magistrale in Ingegneria Informa4ca.

MACHINE LEARNING E STRUMENTI ANTICRIMINE NELL ERA DEI BIG DATA. Gaetano Bruno Ronsivalle

Corso di FILOSOFIA (CLASSE L-5)

«Sciente e Tecnologie dei Beni Culturali»

Applicazioni in ambito biomedico e socio-sanitario di problemi inversi di grande complessità. Prof. Luca Zanni

Ricerca Operativa A.A. 2007/ Introduzione

Corso di Web Mining e Retrieval

Classificazione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Stima della qualità dei classificatori per l analisi dei dati biomolecolari

Intelligenza collettiva Swarm intelligence

MODELLISTICA DI IMPIANTI E SISTEMI Syllabus e Testi di Riferimento Prof. Giuseppe Iazeolla

Intelligenza Computazionale

Music Information Retrieval

Nuovo Corso di laurea magistrale in Ingegneria Informatica AA

Laurea magistrale in Data Science

DoE Seminary APPLICAZIONE DoE AVL CAMEO. Daniele Bistolfi

Fondamenti matematici per l'informatica MAT/03 6 Base 1 2 Ghiloni R Probabilita e statistica MAT/06 6 Aff. 1 2 Agostinelli C.

AMPL Problemi su Reti

Universita degli Studi di Pavia Corso di Studio: BIOINGEGNERIA

Esperienze di Advanced Analytics nella statistica ufficiale: strumenti e progetti

Universita degli Studi di Pavia Corso di Studio: BIOINGEGNERIA

L utilizzo dei Big Data in Istat: stato attuale e prospettive

Ricerca Operativa. Docente. 1. Introduzione

Transcript:

Apprendimento Automatico: Teoria e Applicazioni

Apprendimento Automatico Componenti strutturati del DI: Alberto Bertoni Paola Campadelli Elena Casiraghi Nicolò Cesa-Bianchi Dario Malchiodi Matteo Re Giorgio Valentini Dottorandi e assegnisti del DI: Giovanni Zappella, Claudio Ceruti (Dottorandi) Marco Frasca, Gabriele Lombardi, Luigi Malagò, Alessandro Rozza (Assegnisti)

Apprendimento Automatico Alcune applicazioni: Categorizzazione automatica di testi, immagini, geni... Analisi predittiva di reti sociali, biologiche e di altri sistemi complessi Recommendation systems Principali discipline coinvolte Statistica, teoria dell'informazione, teoria dei giochi Algoritmi e strutture dati Ottimizzazione Principali linee di ricerca Big / High-dimensional data Predizione su dati strutturati (reti, tassonomie) Algoritmi distribuiti, interagenti e attivi

Big Data analysis in Bioinformatica: Classificazione funzionale multispecie delle proteine UniprotKB/TrEMBL (410.000 specie, 34 milioni di sequenze) Analisi di reti biomolecolari SIMAP network (145 milioni di nodi, 2.6 miliardi di archi) Ricerca di nuovi farmaci e di nuovi target ChEMBLdb (1.5 milioni di composti, 11 milioni di attività ) Metodi di ML per la Biologia Computazionale: Metodi per la classificazione strutturata fortemente scalabili Apprendimento multi-view e multi-task guidato da conoscenza biologica a priori Metodi di apprendimento attivo per la predizione in grafi sparsi Implementazione scalabile di metodi locali per la predizione su grafi tramite tecnologie graph database anacletolab.di.unimi.it

Manifold Learning, Stima della Dimensionalità Intrinseca, Riduzione della Dimensionalità OBIETTIVI: data mining, apprendimento automatico, classificazione, etc. in spazi ad elevata dimensionalità PROBLEMI: curse of dimensionality, edge effect, sparsità dei dati, proprietà geometriche controintuitive SOLUZIONE: Riduzione della dimensionalità Dimensionalità intrinseca (id): parametro fondamentale definito come la minima dimensione dello spazio in cui è possibile proiettare i dati senza perdita di informazione Stato dell'arte: scarsi risultati in caso di dati rumorosi, immersioni non lineari, alti valori di id. PROPOSTE PRESENTATE: sviluppo di stimatori che sfruttano proprietà geometriche dei dati informative anche in alte dimensioni (IDEA, MiND, DANCo). OBIETTIVI FUTURI: sviluppo di tecniche di riduzione della dimensionalità basate sia sull'analisi delle caratteristiche geometriche considerate dagli stimatori sopra elencati, sia dall'id determinata.

Pubblicazioni e Progetti Pubblicazioni: S. Bubeck and N. Cesa-Bianchi, Regret analysis of stochastic and nonstochastic multi-armed bandit problems. Foundations and Trends in Machine Learning, 5(1)1-122, 2012. N. Cesa-Bianchi, M. Re, G. Valentini, Synergy of multi-label hierarchical ensembles, data fusion, and cost-sensitive methods for gene functional inference. Machine Learning, 88(1), pp. 209-241, 2012 M. Frasca, A. Bertoni, M. Re, and G. Valentini, A neural network algorithm for semi-supervised node label learning from unbalanced data. Neural Networks, 43:84-98, 2013 A. Rozza, G. Lombardi, C. Ceruti, E. Casiraghi, P. Campadelli. Novel high intrinsic dimensionality estimators. Machine Learning, 89(1):37-65, 2012. A. Rozza, G. Lombardi, E. Casiraghi, P. Campadelli (2012). Novel Fisher discriminant classifiers. Pattern Recognition, 45:3725-3737, 2012 Progetti: PASCAL2 Network of Excellence (2007-2012) Google Research Award (2010-2011) Xerox University Affairs Committee Award (2011-2013)