Gestione e condivisione di basi di dati e conoscenza Modulo 2 Orario del corso martedi o mercoledi (A SECONDA DEL GRUPPO) 10.00-13.00 AULA li5 Mercoledi 16.00-19.00 AULA H1 Da mercoledi 7 novembre 2018 a mercoledi 19 dicembre TOTALE ORE 36 cena@di.unito.it 2 Esame Testi n n Presentazione di un rogetto: discussione Domande di teoria su tutto il rogramma A. Rezzani, Business Intelligence, Aogeo à caitoli 1-5-9 n grui di due ersone massimo n dividervi già adesso in grui in modo da seguire iu agilmente il corso (rogetto costruito via via durante il corso) n à ossibilità di consegne di arte del rogetto durante il corso C. Berry, B. Linoff: Data mining, Aogeo 2003 à caitolo 1 e 5 oure Tan, Steinbach, Kumar: Introduction to Data Mining, AddisonWesley, 2006. htt://www.uokufa.edu.iq/staff/ehsanali/tan.df Ca 1, Ca 4: fino a sez 4.3, Ca 9: sez 9.1 3 4 Slides htt://www.di.unito.it/~cena/teaching.html Ricevimento su auntamento via email cena@di.unito.it 5 6 1
l'insieme di rincii metodologici e tecniche multidiscilinari volto a interretare ed estrarre conoscenza dai dati. I metodi della scienza dei dati si basano su tecniche roveniente da varie disciline, rincialmente da statistica e informatica, in articolar modo nei seguenti sottodomini: intelligenza artificiale (machine learning), basi di dati e data visualization. 7 8 Il ruolo di scienziato dei dati è stato definito dalla «Harvard Business Review» come "la rofessione iù sexy del ventunesimo secolo" ed è considerato uno dei quattro ruoli chiave reosti all'utilizzo sistematico dei big data nelle aziende. Chi è il Data Scientist? Data Analyst: le cometenze richieste sono in rimis la caacità di estrarre dati da database MySQL, gestire tabelle ivot in Excel (OLAP), rodurre visualizzazioni di base, gestire gli Analytics. base di ingegneria del software, cometenze statistiche, metodi di data minng e Machine Learning 9 10 Comutational social science concerned with comutational aroaches to the social sciences. This means that comuters are used to model, simulate, and analyze social henomena. Fields include comutational economics, comutational sociology,, and the automated analysis of contents, in social and traditional media. It focuses on investigating social and behavioral relationshis and interactions through social simulation, modeling, network analysis, and media analysis Claudio Schifanella - Informatica alicata alla comunicazione multimediale 11 12 2
Comutational social science un nuovo aroccio allo studio dei fenomeni sociali, che utilizza moltelici tecniche comutazionali quali data mining, l elaborazione del linguaggio naturale, il e la visualizzazione dei dati. L obiettivo e quello di comrendere le interazioni sociali attraverso l utilizzo massivo e comutazionale dei big data: un aroccio emergente, che sfrutta le milioni di tracce digitali che quotidianamente lasciamo in rete er eslorare in modo eslicativo, ma anche redittivo, la realta htts://www.youtube.com/watch?v=sekfnluoom c 13 l'insieme di rincii metodologici e tecniche multidiscilinari volto a interretare ed estrarre conoscenza dai dati. 14 Corsi collegati Analisi dei Dati à Renzo Carriero 3 anno ICT SOCIAL MEDIA ANALYSIS E BIG DATA à Giusee Tialdo, 2 anno CIME Arendimento automatico à Rosa Meo, Secialistica a informatica Master UNITO in Analisi Dati er la Business Intelligence e 15 Dati Informazione Conoscenza Dati: elemento conoscitivo minimo costituito da simboli (Shannon, 1948) à derivano dall osservazione 10138 Informazione: risultato dell elaborazione di iu dati à acquisizione di un significato sulla base di un contesto 10138 à ca, numero abitanti di una citta, PIN.. 16 Dati Informazione Conoscenza Conoscenza: uso di un certo numero di informazioni er attuare certe azioni doo interretazione, valutazione(ad esemio, risolvere un roblema, risondere ad una domanda) 10138 à quanti abitanti ci sono nel quartiere con ca? à in base all eserienza la conoscenza viene rivisitata Gestione e condivisione di basi di dati e di conoscenza Gestione:acquisizione, modellazione, elaborazione, conservazione di dati in forma strutturata Condivisione: rendere i dati fruibili ad altre ersone (oen) e macchine (semantic web) 17 18 3
Business Intelligence metodi e strumenti er convertire dati in informazioni informazioni in conoscenza conoscenza in iani di sviluo (D. Loshin 2003) 19 20 21 22 Gestione e condivisione di basi di dati e di conoscenza L'obiettivo del corso è quello di fornire una anoramica delle metodologie e alicazioni informatiche avanzate maggiormente utilizzate n er strutturare dati Data base (Microsoft access, Mysql) (CORSO CONSOLE) Data warehouse (Microsoft access, Mysql) n er analizzare dati OLAP (Online Analytical Processing) (SPSS, Excell, SQL Server analitics, etc) DATA MINING (Weka) Gestione e condivisione di basi di dati e di conoscenza Conoscere e saer alicare le tecniche di modellizzazione semantica della conoscenza Conoscere gli oen data ed essere in grado di ubblicare dati come oen, oltre che usare le banche dati oen esistenti 23-24 4
Programma del corso Programma del corso Prima arte Seconda arte n Data warehousing e analisi OLAP n Data mining n Semantic web, ontologie n linked oen data Visualizzazione di dati 25 26 Schematizzando il corso Schematizzando il corso Strutturazione dei dati Analisi dei dati Strutturazione dati à conoscenza data base (1 modulo) data warehouse OLAP data mining Linked (oen) data (rdf) Ontologie (Owl) Visualizzazione di dati 27 28 5