Web 2.0 e Open Data L'evoluzione del web Linux Day 2008 Edy Incoletti Presidente SLAG La riproduzione e distribuzione del seguente documento su qualsiasi supporto sono consentite a condizione che questa dicitura sia conservata.
Il principio: Internet Nasce negli anni 60 come progetto militare del DoD e nel 1969 viene usato per la prima volta dalle università rilasciando come standard aperti tutte le informazioni relative ai protocolli che lo costituiscono Riguarda il collegamento dei computer e alcuni protocolli per scambiare i dati: tecnologia pura. Si diffonde solamente negli ambienti militari americani e, più tardi, in quelli accademici Le tecnologie su cui si basa: tecnologie di collegamento fisico, tecnologie di basso livello per connessione e instradamento delle informazioni
L'espansione: WWW Nasce nel '90 grazie ad un'idea di Tim Berners- Lee che porta alla definizione degli standard aperti HTTP, HTML e URL Permette di collegare tra loro documenti disponibili in Internet: la tecnologia al servizio dell'utente Si diffonde in tutto il mondo in modo esponenziale Le tecnologie su cui si basa sono: Internet, il protocollo HTTP, HTML, il concetto di link
Il presente: Web 2.0 Il nome è usato per la prima volta nel 2004 da Dale Dougherty per tentare di spiegare un fenomeno sociale E' un insieme di tendenze sociali, economiche e tecnologiche che incentivano la partecipazione dell'utente, la disponibilità delle informazioni e l' effetto network : Web 2.0 non è una tecnologia, ma un modo di pensare e interagire con il web Un sito Web 2.0 basa il suo successo su 8 pattern che chiariscono la definizione stessa di Web 2.0
Web 2.0: I pattern Sfruttare l'intelligenza collettiva Stimolare gli utenti ad inserire contenuti Dare fiducia agli utenti Creare fiducia nei contenuti inseriti tramite meccanismi di controllo (pear review, punteggi,...) Risultato: i dati vengono forniti gratuitamente da milioni di persone Esempi: Google, Wikipedia, Flickr, Amazon, del.icio.us
Web 2.0: II pattern Alla base di tutto vi sono i dati Il successo di un sito proviene dai dati interessanti che fornisce e dalla difficoltà per gli altri di ricrearli Il successo commerciale arriva dalla possibilità di utilizzare i dati (in esclusiva) Esempi: Amazon, ebay, Craigslist, Gracenote
Web 2.0: III pattern Mischiare e consentire di mischiare Mashups: il sito è una piattaforma che gli altri possono utilizzare per riproporre le informazioni contenute Le informazioni possono essere rese disponibili via API (es. Google, Amazon) o via widgets (es. Flickr) Si avranno siti fornitori di dati e siti che li utilizzano Si potranno avere siti senza sito Il primo esempio di mashup della storia: housingmaps.com
Web 2.0: IV pattern Arricchire la user experience Semplicità, usabilità e standardizzazione Migliore interazione (AJAX e Flash) Capire ciò che l'utente vuole analizzandone il comportamento Consentire la personalizzazione e adattare le schermate in base all'utente Esempi: Google, Gmail, Google Maps
Web 2.0: V pattern Non pensare per i soli pc Il pc non è l'unico modo di accedere a Internet (cellulari, lettori MP3 evoluti,...) e gli altri dispositivi seguono sempre l'utente Il sito deve essere pensato per essere usato da questi dispositivi e per sfruttarne le caratteristiche principali Trovare gli amici nelle vicinanze, lasciare cose (es. foto) in posti ben precisi, scaricare musica nel momento in cui voglio sentirla, sapere un prezzo mandando la foto del codice a barre,... Esempi: Google Maps, itunes, BrightKite (geografico), Twitpic (foto)
Web 2.0: VI pattern Sviluppo perpetuo Il sito diventa un servizio e come tale deve adattarsi di continuo alle esigenze Le novità possono essere fornite solamente a gruppi limitati di utenti Gli utenti diventano i beta tester Sparisce il concetto di versione Esempi: Google, Flickr, Amazon
Web 2.0: VII pattern Sfruttare la long tail In una visione tradizionale di business le nicchie non sono considerate. Lavorando a livello mondiale una nicchia può diventare un core business Esempi: Netflix (DVD), Rhapsody (musica), Google advertising
Web 2.0: VIII pattern Modelli leggeri e scalabilità La tecnologia evolve molto velocemente: deve essere economico adattarsi a nuove esigenze L'impatto degli utenti potrebbe essere devastante per quantità e rapidità: deve essere rapido passare a strutture in grado di gestirlo Le soluzioni migliori: software open source (costi ridotti, grande supporto)
Web 2.0: esempi di successo Amazon Customer product reviews, listmania, customer product images, submit a product manual, user guides, email to a friend, product tags, product wiki, product discussion forum, rate this, recommendation engine, Amazon connect, what do customers, customers who bought this, reviewing rating, report this, comment on reviews, profile pages, sell yours Un'enorme parte delle informazioni di ogni prodotto sono fornite dagli utenti e costituiscono un database unico e difficilmente riproducibile (pattern I e II)
Web 2.0: esempi di successo Amazon Amazon API con programmi per rivenditori (pattern III) Quasi tutte le funzionalità disponibili sono state prima testate da utenti inconsapevoli (pattern V) Amazon Anywhere e Amzon 1-Click (pattern VI) Quantità enorme di articoli, Amazon Affiliates Program, zshops, Marketplace (pattern VII)
Web 2.0: esempi di successo Flickr Vive grazie alle foto inserite dagli utenti (pattern I e II) Flickr API e widgets (pattern III) Pesante uso di AJAX e Flash combinato a plugins pensati per migliorare la gestione dei propri dati (pattern IV) Le applicazioni per i cellulari sono sviluppate da terzi grazie alle API, esempio inviare una foto direttamente dal cellulare dopo averla scattata (pattern V) Vengono rilasciate modifiche al sito ogni giorno e a volte più volte al giorno (pattern VI)
Web 2.0: problemi Non è stato definito nessuno standard Ogni sito utilizza propri metodi per raccogliere e fornire informazioni, per autenticare gli utenti,... Non esistono strumenti e librerie comuni E' perfino difficile definire se un sito è web 2.0 o no
Web 2.0: problemi I walled gardens Ogni sito è una comunità a se stante L'accesso alle informazioni è subordinato all'iscrizione o ad altre limitazioni Le informazioni sono sottoposte a licenze più o meno restrittive In ogni sito devo ripetere le informazioni (es. chi sono i miei amici) i collegamenti sono tra le pagine, non tra le cose di cui le pagine parlano
Web 2.0: problemi Il II pattern va contro la società Il valore di un sito Web 2.0 per un'azienda è dato dai dati che possiede: i dati non vengono forniti gratuitamente in modo utilizzabile Se cerco un volo in realtà ho la pagina della compagnia aerea che parla di quel volo, se certo un libro ho la pagina del rivenditore o del recensore che parla di quel libro, se cerco una persona, ho la pagina del sito di social networking che mi descrive quella persona Il dato puro è difficilmente disponibile: si dovrebbe avere l'indirizzo (URI) del dato strutturato, non della sua visualizzazione
Il futuro: Web Semantico Nasce da un'idea del solito Tim Berners-Lee che porta, nel 2004, alla definizione degli standard aperti per RDS e OWL E' un web in cui i dati sono disponibili in modo strutturato, adatto all'interrogazione, all'interpretazione o all'elaborazione automatica. Ad ogni dato è associato il proprio significato semantico. Altri nome con cui viene chiamato: Web 3.0, Web.Next, Web of databases
Web Semantico: vantaggi I formati sono standard e comprensibili da qualsiasi programma Le URI puntano ai dati, non alle pagine che li visualizzano Si stanno diffondendo enormi database di informazioni libere Dal mash-up si passa al mesh-up: i dati sono pensati per essere mischiati e riorganizzati
Web Semantico: diffusione
Web Semantico: alcuni esempi RSS FOAF (www.foaf-project.org): Twitter, Facebook e Flickr permettono l'esportazione di file FOAF DBPedia (www.dbpedia.org) Geonames (www.gonames.org) DBTune.org (www.dbtune.org) e musicbrainz DBLP: database della letteratura informatica Riese: database eurostat
Web Semantico: alcuni esempi The CIA World Factbook Doapspace (doapspace.org): database dei progetti opensource (DOAP) Revyu.com: recensioni su qualsiasi cosa OpenGuides: guide turistiche Project Gutemberg: libri
Open Data Movement I dati appartengono alla razza umana I dati sono spesso raccolti con soldi pubblici I fatti non possono essere soggetti a copyright Una migliore disponibilità di dati migliora la ricerca e lo sviluppo Raccomandazione della commissione europea A1 Aprile 2006: Gli enti di ricerca finanziati da fondi pubblici dovrebbero stabilire una norma di comportamento europea che preveda la pubblicazione di tutti gli articoli pubblicati, dopo un determinato periodo di tempo, in un archivio 'open access'
I movimenti open Open access: si limitata all'accesso al documento, prevedendo anche che il documento non possa essere frazionato Open content: rispetto all'open data che è più orientato ai dati copre ogni contenuto Open notebook science: Open Data limitatamente ai dati sperimentali Open knowledge: copre sia i dati che i contenuti Open source movement: software
Storia del web: il succo Internet: Non sono i cavi, sono i computer che ci interessano - Vedo i computer senza guardare cosa li collega Web: Non sono i computer, sono i documenti che ci interessano - Vedo i documenti senza guardare i computer su cui risiedono Web Semantico: Non sono i documenti, sono quello di cui parlano ci interessa - Vedo i dati senza preoccuparmi del documento da cui provengono Tim Berners-Lee - Giant Global Graph
Bibliografia Tim Berners-Lee LinkedData (http://www.w3.org/designissues/linkeddata.html) Tim Berners-Lee Giant Global Graph (http://dig.csail.mit.edu/breadcrumbs/node/215) Tim Berners-Lee Hering of the Digital future of the United States: Part I The Future of the World Wide Web (http://dig.csail.mit.edu/2007/03/01-ushouse-future-of-the-web.html) Versione cliccabile del digramma dei dati LOD (http://richard.cyganiak.de/2007/10/lod/) Tim O'Reilly What Is Web 2.0 (http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html) John Musser, Tim O'Reilly - Web 2.0 Principles and Best Practices Wikipedia: il punto di partenza per qualsiasi definizione Foafsites: elenco di siti di social networking che espongono dati FOAF (http://esw.w3.org/topic/foafsites)