TAL e Open Data Aula Magna del Re*orato Università degli studi di Torino 21 Gennaio 2014 Open Data e Data Journalism Sabino Me*a RAI- CRIT, Supporto alle Ingegnerie per l Innovazione Tecnologica Area di ricerca Ingegneria dell Informazione Mul?mediale
Open Data Journalism definizioni esempi di Data Journalism (DDJ) e di Citizen Journalism cosa manca? una nuova era? eventi come base di dati linked nuove possibilità di divulgare notizie automatizzazione di alcuni processi servizi innovativi
Open Data I dati aperti sono dati che possono essere liberamente utilizzati, riutilizzati e ridistribuiti da chiunque, soggetti eventualmente alla necessità di citarne la fonte e di condividerli con lo stesso tipo di licenza con cui sono stati originariamente rilasciati Data Journalism Il processo di raccolta dei dati, il loro filtraggio e la loro visualizzazione permette ai giornalisti di raccontare nuove e convincenti storie The Guardian Open Knowledge Foundation Citizen Journalism i consumatori vorranno utilizzare la natura interattiva di internet per partecipare direttamente allo scambio delle notizie e delle idee. L informazione come lezione sta lasciando spazio all informazione come conversazione Associated Press
La nascita del Data Journalism Epidemia di colera: Broad Street, Londra. 1854. Il medico inglese J. Snow, scoprì che il colera si diffonde tramite l'acqua inquinata e non dall'inquinamento o da una forma nociva di "aria catva. Evento fondamentale per l odierna epidiemologia. http://en.wikipedia.org/wiki/1854_broad_street_cholera_outbreak
Data Journalism: esempio uno Weakileaks: la guerra in Afghanistan 25 luglio 2010 WikiLeaks pubblica una raccolta di documenti militari relativi alla guerra in Afghanistan, periodo gennaio 2004 - dicembre 2009. Tali documenti vengono rilasciati al Guardian, New York Times e Der Spiegel, che verificano l'autenticità del materiale. Storia: uccisione di civili da parte di truppe statunitensi e britanniche; sostegno di Pakistan e Iran ai talebani
Data Journalism: esempio due Slot machines in Italia 02 luglio 2013 Wired Italia Analizzando i da? rela?vi al numero di slot machines in Italia è emerso che maggiore è tale numero e maggiore è la quan?tà di denaro che viene giocata e persa. Il gioco d azzardo diventa un costo in termini di salute oltre che pesare sulle risorse della colletvità.
Data Journalism StrumenI principali Maggior parte DDJ avviene raccogliendo dati da internet. Numerosi strumenti per farlo: 1. Storify 2. Datawrapper 3. Thinglink 4. Timeline JS 5. Tableau 6. Storyful MultiSearch 7. WolframAlpha 8. FollowerWonk 9. Topsy 10. TinEye 11.
Data Journalism: principali a*ori The Guardian Wired IlFaLoQuoIdiano Repubblica
Giornalismo partecipa?vo o ci?zen journalism Esempi
cosa manca? i da? vanno ordina?, ripuli?, filtra?, ben visualizza? datasets sono separa? difficoltà nel condividere le analisi pubblicare i da? NON necessariamente vuol dire comunicare qualcosa giornalismo professionale DEVE organizzare le informazioni dove sono i fat? gli even? realmente accadu?? Comment is free, but facts are sacred. 1921, CP Sco*, Guardian editor
Event- You : una pia*aforma RAI evento definizione univoca repository di even?, univocamente iden?fica? datasets simili a CKAN, DBpedia, GeoNames, UMBEL, FOAF (diverso da Event- DetecIon and Tracking) even? seman?camente collega? (Linked Open Data) punto di riferimento per creare storie pia*aforma comune a*raverso la quale i ci*adini/giornalis? possono confrontarsi arricchimento stru*urato e machine- readable dell evento Seman.c Modelling and Management of Real- life Events for Enhanced Media Services and Applica.ons, S. Me*a e A. Messina News & Informa.on: Enhanced Media Services by Seman.c Web Technologies, S. Me*a e A. Messina
TAL e Open Data Event- You: un esempio ALentato alla Maratona di Boston 15 aprile 2013 Seman.c Modelling and Management of Real- life Events for Enhanced Media Services and Applica.ons, S. Me*a e A. Messina News & Informa.on: Enhanced Media Services by Seman.c Web Technologies, S. Me*a e A. Messina
Event-You: un link tra diverse piattaforme Seman.c Modelling and Management of Real- life Events for Enhanced Media Services and Applica.ons, S. Me*a e A. Messina News & Informa.on: Enhanced Media Services by Seman.c Web Technologies, S. Me*a e A. Messina
TAL e Open Data Event- You ArchiteLura di sistema Seman.c Modelling and Management of Real- life Events for Enhanced Media Services and Applica.ons, S. Me*a e A. Messina News & Informa.on: Enhanced Media Services by Seman.c Web Technologies, S. Me*a e A. Messina
TAL e Open Data EVENT-YOU Events (past or future) search or add event 17/06/2013 h 10. Rai mee?ng. (ID=005, user:sabinome*a) 12/06/2013 h 15.10. Messi served with tax complaint (ID=004, user:xxx)... Back-end: Triple-store Sesame/OWLIM server Front-end: Autenticazione (anche attraverso Facebook, Twitter, etc) Feedback utente Multimedia contents & Knowledge Base Reasoning & Statistics Generazione automatica di RSS feeds/twitter Geolocalizzazione automatica
TAL e Open Data Event- You: come popolare il repository? Il problema della partenza a freddo (cold- start issue) Hyper Media News machine learning su even? tagga? a mano RSS feeds (es. Ansa.it) elaborazione del linguaggio naturale o NLP (Natural Language Processing)
TAL e Open Data Hyper Media News - HMN ANTS + online newspapers or users blogs Basato su hybrid clustering algorithm M. Montagnuolo, M. Ferri, A. Messina, HMNews: an Integrated System for Searching and Browsing Hypermedia News Content, HyperText 2009, Torino, June 2009. A. Messina, M. Montagnuolo, A Generalised Cross- Modal Clustering Method Applied to Mul?media News Seman?c Indexing and Retrieval, 18th Interna?onal Conference on World Wide Web, Madrid, April 2009.
TAL e Open Data AutomaIc Newscast TranscripIon System - ANTS a plavorm targeted to automa?c news programs Basato su AutomaIc Speech RecogniIon Hidden Markov Model Three layered heurisic framework News segmenta?on SemanIc analysis module Named En??es Recogni?on and Classifica?on R. Borgotallo, G. Dimino, A. Messina, ANTS: a complete system for automa?c news programme annota?on based on audiovisual content and text analysis, EBU Technical Review nr. 313, Geneva, March 2008.
Event- You: conclusioni Vantaggi e servizi innovaivi nuovi o migliori dataset vengono incentivati identificazione univoca degli eventi abilita nuovi modi di diffondere notizie aggregare contenuti, aggregare altre notizie, valorizzare archivi automatizzare processi di diffusione notizie automatizzare processi di analisi sui dati facilitando lavoro giornalisti spronare giornalismo partecipativo di comuni cittadini creare nuovi sistemi di raccomandazione
TAL e Open Data Ontologia degli eveni h*p://data.press.net/ontology/
Ontologia degli eveni
Ontologia degli eveni
Ontologia degli eveni
Ontologia degli eveni