Web Feeds Contesto Il modello da cui si sono sviluppati i web feeds è quello delle agenzie di stampa (es. ANSA, Reuters) ovvero quegli enti e/o aziende il cui scopo è la fornitura di notizie ad altri organi di informazione come giornali, riviste, reti televisive. Il modello è il seguente: Le società radiofoniche, televisive etc... si abbonano al servizio fornito dall agenzia e a mezzo fax o telex ricevono aggiornamenti e notizie in tempo reale. C.Parisi 2 C.Parisi 1
Contesto Il web feed è la trasposizione nell era del world wide web di questo tipo di servizio. Alcuni siti web forniscono su richiesta dell utente un servizio gratuito di aggiornamento in merito al contenuto del proprio sito. I siti che offrono questo particolare servizio sono distinguibili dalla presenza di un icona in genere presente nella home page o anche nell indirizzo URL Feed Syndication C.Parisi 3 Contesto Gli utenti che vogliono abbonarsi per esempio ai feed del Corriere della sera selezionano il feed corrispondente e lo aggiungono a quelli presenti. Add on di FireFox per la gestione dei Feed C.Parisi 4 C.Parisi 2
Contesto Sottoscritto l abbonamento le nuove notizie o i relativi aggiornamenti sono visualizzati nella pagina del web browser mediante il titolo, una breve descrizione e la data dell aggiornamento oltre che il collegamento alla notizia completa. C.Parisi 5 Generalità è un servizio web gratuito che permette agli utenti di Internet di essere aggiornati sull evoluzione (cambiamento) di contenuti web da loro selezionati. I contenuti del web sono molto dinamici, specialmente quelli relativi a servizi di informazione. I fornitori di contenuti possono strutturare il loro sito in modo tale che programmi esterni opportunamente configurati possano interrogare lo stato di aggiornamento del sito e quindi del contenuto presente in esso. I content provider (gestori dei siti) che decidono di fornire questo servizio devono aggiungere alle pagine web queste informazioni con un formato particolare Gli utenti che vogliono usufruire del servizio devono usare un programma ad hoc per la sottoscrizione / gestione / visualizzazione dei feed. C.Parisi 6 C.Parisi 3
Schema di funzionamento I provider di contenuti web forniscono web feed per un dato argomento e/o settore informativo, l utente si abbona quel feed. Ad esempio nella figura l utente A si abbona i feed di due contenuti (uno sul corriere.it e l altro su cnn.com), l utente B solo il feed su corriere.it e l utente C su entrambi. Una collezione di web feed si chiama aggregazione ed è gestita da un programma detto Internet aggregator. Corriere.it Content distributor Syndicate Cnn.com User A User B Feed Reader User C C.Parisi 7 Esempio di web feed <?xml version="1.0"?> <rss version="2.0"> <channel> <title>example Channel</title> <link>http://example.com/</link> <description>my example channel</description> <item> <title>news for September the Second</title> <link>http://example.com/2002/09/02</link> <description>other things happened today</description> </item> <item> <title>news for September the First</title> <link>http://example.com/2002/09/01</link> <description>other things happened today</description> </item> </channel> </rss> Esempio di codice lato server per la definizione delle notizie ( item nel codice) fornite con il servizio di web feed. C.Parisi 8 C.Parisi 4
Feed Aggregator Feed aggregator detto anche feed reader è il programma (lato client) che gestisce l abbonamento a diversi feed e periodicamente verifica l aggiornamento del contenuto ad esso associato. Esso si collega con i server che offrono questo servizio per controllare se ci sono aggiornamenti (solo i server dei feed a cui l utente si è abbonato). I feed reader possono essere: Programmi client che si installano nel computer Programmi web-based a cui si ha accesso tramite web add-on/plug-in di web browser. Tutti i programmi che gestiscono web feed presentano in un unica finestra di visualizzazione tutti i contenuti richiesti dall utente. Per una maggiore facilità di utilizzo è possibile categorizzare gli elementi. C.Parisi 9 Feed Aggregator Breve descrizione di ciascuna notizia Elenco abbonamenti (web feeds) Dettaglio delle ultime notizie relative al feed del corriere C.Parisi 10 C.Parisi 5
Feed Aggregator I contenuti resi disponibili da feeds sono articoli di vario genere, blog, podcast, informazioni in tempo reale (ad es. info traffico, meteo). Pogrammi client standalone: FeedReader, WinRSS, RSS Xpress,... Programmi web based : Google Reader, Bloglines, My Yahoo! Per un elenco esaustivo : http://www.newsonfeeds.com/faq/aggregators C.Parisi 11 Google Reader C.Parisi 12 C.Parisi 6
Google Reader C.Parisi 13 Google Reader Categorie C.Parisi 14 C.Parisi 7
Web Feed Podcatcher I podcatcher sono la variante dei feeds aggregator specializzata in contenuti multimediali (audio, video e podcast). Si riferiscono ad applicazioni client o web-based che mantengono gli abbonamenti a feed di contenuti multimediali. Queste applicazioni oltre alla funzionalità dei feed reader hanno la possibilità di scaricare il contenuto multimediale e riprodurlo o sincronizzare il contenuto con un dispositivo portatile per la riproduzione. C.Parisi 15 Utilizzi I web feed hanno avuto diffusione a causa dell enorme contenuto informativo oramai presente in rete e alla difficoltà oggettiva in termini di tempo di controllare sito per sito o pagine per pagina alla ricerca di aggiornamenti alle notizie ivi pubblicate. Essi vengono impiegati per fornire gli aggiornamenti sulla situazione traffico, meteo, informazioni di tipo finanziario etc... Le software house li possono utilizzare per fornire update ai loro clienti gli aggiornamenti software dei programmi. Le stesse aziende potrebbero tramite un web feed server fornire un servizio ai propri dipendenti per esempio di distribuzione e notifica di aggiornamenti di documentazione interna e/o esterna. Di recente i feed reader sono anche disponibili per il mercato della telefonia mobile ad esempio AOL Mobile Fonte Internet C.Parisi 16 C.Parisi 8
Definizione tecnica Da un punto di vista tecnico il web feed è un file (generalmente XML) che contiene diversi item (elementi) corrispondenti ai diversi contenuti del sito web che vengono resi disponibili. Ciascun item comprende tra gli altri il link alla pagina, il titolo ed un breve descrizione del contenuto. Questo file inserito all interno del sito web fornisce i link ai feed reader una volta che hanno sottoscritto il feed relativo. La presenza di feeds nei siti web è segnalata generalmente da questa icona. I due principali formati di web feeds sono: RSS (Really Simple Syndication) Atom C.Parisi 17 Web Feed RSS e ATOM RSS e Atom sono i due formati per la pubblicazione dei feed all interno delle pagine web. Differiscono nel modo di specificare determinati dati (ad es. il tempo di aggiornamento del contenuto) RSS è il primo ad essere stato sviluppato con questo scopo, Atom è successivo al primo anche in seguito alle numerose modifiche e revisioni del formato RSS. Atom, proposto dall IETF come lo standard per i web feed (rfc 4287), è stato adottato da google per i suoi siti, ma RSS continua ad essere utilizzato. L ultima versione dell RSS (la 2.0) è il formato preferito per il feed dei programmi in podcasting, anche se Apple itunes supporta l utilizzo di Atom. É discrezione del web master quale formato utilizzare nella pubblicazione di feed, alcuni siti forniscono feed sia in Atom che RSS, altri uno in particolare. http://www.xul.fr/en-xml-rss.html Creazione di un web feed (RSS) C.Parisi 18 C.Parisi 9
Pubblicazione di un feed 1) Generare il file.xml che contiene i feed nel formato prescelto (RSS o Atom), nel caso particolare il formato prescelto è RSS (prova.xml) Ad esempio: <?xml version="1.0"?> <rss version="2.0"> <channel> <title>news</title> <link>http://www.corriere.it/</link> <description>news...</description> <item> <title>notizie del giorno</title> <link>http://www.corriere.it/index.html</link> <description>tutte le notizie in tempo reale</description> </item> </channel> </rss> 2) Salvare il file denominato prova.xml sullo spazio web del sito C.Parisi 19 Pubblicazione di un feed 3) Verificare il file prova.xml con un programma ( feed validator ). In internet sono presenti diversi programmi che effettuano la verifica del file, non necessitano di alcuna installazione. La verifica consta principalmente in un check di tipo sintattico del file xml rispetto al tipo di formato (RSS o Atom) utilizzato nella compilazione del file. 4) Collegare il file prova.xml al simbolo del feed nella pagina principale del sito ad esempio con il seguente codice html: <a href="http://www.corriere.it/prova.xml> <img src="rss.gif"> </a> C.Parisi 20 C.Parisi 10
Feed Validator I feed validator sono programmi che verificano la correttezza dell implementazione dei web feeds. Sono servizi online. Ad esempio il consorzio W3C offre questo servizio. http://validator.w3.org/feed/ Altro sito che offre servizi di validazione : http://feedvalidator.org/ C.Parisi 21 Web Feed Qualità del Servizio Questi servizi offrono un valido aiuto nella ricerca di novità nei contenuti in rete su siti di interesse. Servizi simili sono forniti tramite e-mail, ma i web feed forniscono una migliore QoS. La qualità è data principalmente da: Facilità di sottoscrizione e cancellazione della sottoscrizione Strutturazione delle news in categorie per migliore lettura da parte utente. Integrazione di diversi dispositivi per la riproduzione di contenuti multimediali. C.Parisi 22 C.Parisi 11
Web Feeds Sicurezza Rispetto alla sottoscrizione di newsletters (tramite e-mail) il web feed assicura anonimato da parte dell utente del servizio evitando utilizzo di propri riferimenti per l inoltro di spam, virus, phishing e spoofing. I problemi di sicurezza dati dalla lettura dei feeds da parte del client sono legati al fatto che si tratta di file xml in cui potrebbero essere presenti sia tag html che linguaggi di scripting. Ad esempio: Nell esempio i tag title e description contengono javascript. Fonte internet C.Parisi 23 Sicurezza É facoltà del feed reader interpretare o filtrare tag html presenti all interno del feed e eventuali comandi in linguaggi di scripting come quello visto. Alcuni reader che supportano entrambi i formati Rss e Atom filtrano i tag html in un formato e non nell altro, risultando pertanto vulnerabili a questo tipo di minacce. I feed aggregator di tipo web-based non essendo locali al PC presentano per l utente un rischio minore dei programmi client, anche se in questo caso il rischio è dirottato al sito che fornisce il servizio. C.Parisi 24 C.Parisi 12