Corso di Web Mining e Retrieval (a.a. 2011-2012) Roberto Basili 1
Obbiettivi del Corso Introduzione alle nozioni di base per l accesso alle informazione distribuita Componente Fondazionale: Problemi di Ricerca e Classificazione dei testi Modelli Geometrici di Rappresentazione Machine Learning Applicazioni: Web Search Text, Music and Image Classification 2
Organizzazione del Corso: Parte I: Machine Learning ML, Data Mining, Algoritmi guidati dai dati Supervised, Unsupervised e Semi-supervised Learning Teoria Statistica dell Apprendimento (SLT) Applicazioni: Classification, Clustering, Sezione II: Information Retrieval IR tradizionale: Tasks, Modelli e Tecnologie Modelli di IR: ad hoc retrieval, Filtering, ranking IR su Web: Crawling, Spidering Sezione III: Web IR Sistemi e Tecnologie per l IR Web Retrieval: informazione e conoscenza distribuita Multimedia Retrieval, Web 2.0: SNA, opinion mining 3
Obbiettivi (2): Aspetti fondazionali Modelli ed Algoritmi di Apprendimento Automatico Ottimizzazione: Feature Selection, Dim. Reduction, Geometrical Embeddings Statistical Learning Theory Modelli di IR, motori di ricerca Esercitazioni Completamento della Teoria Introduzioni a sistemi e tecnologie Progetto Finale IR: Applicazioni, Modelli avanzati di IR ML for IR 4
Target Laurea Triennale in Informatica Automatica, Telecomunicazioni, Gestionale Prerequisiti: Elementi di Analisi e Geometria Elementi di Logica Calcolo delle Probabilità e Statistica Basi di Dati, Sistemi Basati su Conoscenza 5
Orari MAR h. 9:30-11:15 Aula C2 (Ed. Didattica) GIO h. 11:30-13:15 Aula C1 (Ed. Didattica) Ricevimento: GIOVEDI dopo la lezione Cercheremo di avere un altra lezione settimanale (9 cr) 6
Testi Consigliati IR Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan and Hinrich Schutze, Cambridge University Press. 2008. http://www- http://www-csli.stanford.edu/~hinrich/ csli.stanford.edu/~hinrich/information-retrieval-book.html MLxIR. Automatic Text Categorization: information-retrieval-book.html From Information Retrieval to Support Vector Learning, R. Basili, A. Moschitti. ARACNE Ed., 2005 Materiale complementare DBMS. "Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data", Liu, Bing, Springer-Verlag, Series: Data-Centric Systems and Applications, Berlin, ISBN: 978-3-540-37881-5, 2007. Articoli e Dispense Dispense e Lucidi delle lezioni: http://www.uniroma2.it/didattica/wmir/ http://www.uniroma2.it/didattica/wmir/ 7
8
Organizzazione: Esami Modalità del Corso Full (9 crediti) Studenti del nuovissimo ordinamento, Laurea Tecnologie di Internet Light (6 crediti) Laurea Informatica, Automatica e Gestionale 9
Esami Light Esonero MidTerm (dopo il 27 Novembre 2010) Scritto finale (dopo il 1 Febbraio 2011) E facoltativo (tirocinio?) un progetto (ad esempio, una applicazione IR in ambiente mobile, Android) o un approfondimento bibliografico (ricerca bibliografica su un arg. avanzato) 10
Esami Full Esonero MidTerm (dopo il 27 Novembre 2010) Scritto finale (dopo il 1 Febbraio 2011) E obbligatorio un progetto (ad esempio, una applicazione IR in ambiente mobile Android) o un approfondimento bibliografico (ricerca bibliografica su un arg. avanzato) 11
Esami (1) Approfondimento Bibliografico assegnamento di un tema e della relativa bibliografia, ricevimento dedicato (fuori degli orari delle lezioni), produzione di una relazione finale (stile Tesi), Esame: presentazione finale della tesina (poss. entro la fine del Corso) 12
Esami (2) Progetto (max 2/3 persone) Assegnamento di un progetto (stile tesi), ricevimento dedicato (fuori degli orari delle lezioni), produzione di un dimostrativo e di una breve relazione Esame: Discussione del progetto + Demo 13
Esempi di Progetti I progetti sono dedicati agli studenti della modalità Light NN (progetto) ma possono essere scelti anche da altri gruppi Esempi Sviluppo di un sistema di classificazione su informazione musicale (audio files, Web pages, MIDI) Riconoscimento e tracking di opinion leaders in social networks Algoritmi graph-based per NLP 14
Domande? 15
Action List Registrarsi al Corso : URL: http://www.enif.it/esami/ Definire il proprio gruppo (es Gestionale) tramite il campo Note Verranno pubblicati: Elenchi dei gruppi registrati Progetti Orari ricevimento per gli studenti che non seguono Slide e materiali complementari (in progress) 16