Fare ricerche in Rete Il contesto attuale: il Web 2.0 Web 1.0 vs 2.0 by example Web 1.0 Web 2.0 DoubleClick --> Google AdSense Ofoto --> Flickr Akamai --> BitTorrent mp3.com --> Napster Britannica Online --> Wikipedia personal websites --> blogging Evite --> upcoming.org and EVDB domain name speculation --> search engine optimization page views --> cost per clicks creen scraping --> web services Publishing --> participation content management systems --> wikis directories (taxonomy) --> tagging ("folksonomy folksonomy") Stickiness --> syndication 1
Web 2.0 meme map Alcune lezioni fondamentali Il Web è una piattaforma (non un applicazione) Un sistema senza proprietario Basato su servizi Protocolli e standard aperti per lo scambio di dati e servizi (interoperabilità) Accordi di co-operazione Il valore del software è proporzionale alla misura e al dinamismo dei dati che aiuta a gestire Il potere del custoemr-self service e della gestione algoritmica dei dati estesa all intero Web, alle periferie e non solo al centro, alla coda lunga e non solo alla testa. Il servizio migliora automaticamente con l aumentare degli utenti che lo usano. Gli utilizzatori aggiungono valore partecipazione (P2P BitTorrent, Napster) Gli effetti del Network derivanti dai contributi degli utenti sono la chiave per dominare il mercato nell era del Web 2.0 2
Quali strumenti per cercare informazioni? Motori di Ricerca Google SCIRUS Enciclopedie online Wikipedia Basi di dati online UniMi Entrez NCBI (PubMed) Semantic Web Ontologie OWL Tag e Folksonomy Del.icio.us Flickr Rss e Podcast I motori di ricerca Google SCIRUS 3
I Motori di Ricerca Un motore di ricerca è un sistema automatico che analizza un insieme di dati spesso da lui stesso raccolti e restituisce un indice dei contenuti disponibili classificandoli in base a formule matematiche che ne indichino il grado di rilevanza data una determinata chiave di ricerca. (Wikipedia) I Motori di Ricerca: come funzionano? 1. Analisi: programmi specifici (spider o crawler) si muovono tra le pagine del web, ne analizzano il contenuto e identificano le informazioni sensibili della pagina 2. Catalogazione: le pagine vengono catalogate in base a criteri diversi per ogni motore e poi inserite nell archivio e nell indice del motore di ricerca 3. Risposta: quando un utente effettua una ricerca, il motore restituisce le pagine ordinandole secondo un grado di utilità che possono avere per l utente 4
Interfaccia Campo di ricerca: contiene le parole chiave sui cui si basa l interrogazione Bottoni per avviare la ricerca MI SENTO FORTUNATO : apre automaticamente la prima pagina restituita Interfaccia Alcune categorie di ricerca 5
Interfaccia Dominio della ricerca Interfaccia Strumenti per personalizzare le ricerche 6
Interpretiamo i risultati di una ricerca Titolo della pagina principale Breve descrizione del contenuto della pagina Informazioni generali Interpretiamo i risultati di una ricerca Titolo della pagina principale Breve descrizione del contenuto della pagina Informazioni generali 7
Interpretiamo i risultati di una ricerca Copia cache: versione presente al momento dell indicizzazione Ricerca di pagine simili Interpretiamo i risultati di una ricerca Copia cache: versione presente al momento dell indicizzazione Ricerca di pagine simili 8
Definire una ricerca Cosa possiamo inserire nel campo di ricerca? Parole Numeri Simboli speciali Calcoli Valute Misure Esempio: cerchiamo informazioni sulla città di Milano Definire una ricerca Stop words Parole comuni che google potrebbe esclude dalla ricerca ( dove, quando, la ) Esempio: 9
Definire una ricerca Come forzare la ricerca delle stop words? Con il simbolo + preposto alla parola Con le virgolette ( ): tutte le parole verranno ricercate nell ordine in cui appaiono Esempio: Definire una ricerca Google non riconosce gli accenti Esempio: Google non distingue maiuscolo e minuscolo 10
Definire una ricerca Come possiamo comporre le parole? AND : ricerca tutte le parole nella pagina OR ( ) : ricerca almeno una delle parola NOT (-) : vieta la presenza della parola nella pagina Definire una ricerca Come possiamo comporre le parole? AND : ricerca tutte le parole nella pagina OR ( ) : ricerca almeno una delle parola NOT (-) : vieta la presenza della parola nella pagina 11
Definire una ricerca Come possiamo comporre le parole? AND : ricerca tutte le parole nella pagina OR ( ) : ricerca almeno una delle parola NOT (-) : vieta la presenza della parola nella pagina Definire una ricerca ~ : si possono includere nei risultati i principali sinonimi di una parola chiave 12
Ricerca Avanzata RICERCA AVANZATA Google propone un interfaccia che permette di scrivere ricerche complesse Ricerca Avanzata AND OR NOT 13
Ricerca Avanzata Include / Esclude determinati tipi di file (Excel, Word, PDF) Filetype: Ricerca Avanzata Visualizza solo pagine che sono state indicizzate 3 6 12 mesi dalla data odierna (Daterange:) 14
Ricerca Avanzata Restringe la ricerca ad una parte specifica delle pagine Titolo intitle: Corpo della pagina intext: Indirizzo inurl: Ricerca Avanzata Ristringe la ricerca solo alle pagine che si trovano nel dominio specificato insite: (es. insite:unimi.it, insite:.edu) 15
Definizioni e Calcoli define: ricerca in dizionari ed enciclopedie la definizione esatta Inserendo un espressione matematica Google ne fornisce il risultato Directory (http://directory.google.it/) Le directory suddividono i siti per categorie Metodi di ricerca: Parole chiave Per navigazione attraverso i canali di ricerca 16
Immagini e News Immagini se state cercando foto o imamgini in genere da inserire nella vostra tesi. Notizie se state cercando eventi programmati o informazioni su avvenimenti passati. Mappe Mappe : http://maps.google.it/ se volete l indirizzo di un istuzione, o cercate un indirizzo preciso, o volete la mappa di una città Risultati : Visualizzazione grafica (integrate con fotografie satellitari) Ricerca nelle vicinanze Calcolo di percorsi 17
Pubblicazioni Scientifiche Pubblicazioni scientifiche: http://scholar.google.com/ se cercate l articolo di un autore, una pubblicazione su un argomento generico, una citazione da inserire in bibliografia Risultati : Comprendono Titolo collegato all'abstract dell'articolo o all'articolo completo. Citato da riporta agli articoli in cui è citato il risultato Link alle biblioteche (sia online sia offline) Ricerca Web SCIRUS for scientific information only E un motore di ricerca di soli articoli scientifici di diverse aree disciplinari Fa il crawling di sole pagine web scientifiche http://www.scirus.com/ 18
Wikipedia Wikipedia è un progetto di enciclopedia multilingue, web-based, a contenuto libero, scritta collaborativamente da volontari da tutto il mondo (Wikipedia) http://www.wikipedia.org/ Banche dati online UniMI Entrez NCBI 19
Servizi bibliotecari di UniMi UniMi: biblioteca digitale 20
UniMi: biblioteca digitale Entrez NCBI National Center for Biotechnology Information (NCBI) Entrez è il sistema di ricerca e ritrovamento integrato e text-based usato al NCBI per i maggiori database (tra cui PubMed, Nucleotide and Protein Sequences, Protein Structures, Complete Genomes, Taxonomy). http://www.ncbi.nlm.nih.gov/entrez/ 21
Entrez NCBI Consente di effettuare ricerche nei vari database Mappa relazioni esistenti fra oggetti dello stesso database Mappa relazioni esistenti fra l oggetto in esame e gli oggetti degli altri database http://www.ncbi.nlm.nih.gov/database/dat amodel/index.html I database PubMed e PubMed Central PubMed è un servizio de U.S. National Library of Medicine cheinclude oltre17 milioni di citazioni provenienti da MEDLINE e altri life science journals di articoli biomedici a partire dagli anni 50. PubMed Central (PMC) èl archiviolibero di letteratura (full text journal article) proveniente da journal biomedici e di life science de U.S. National Institutes of Health (NIH). 22
Il Semantic Web Cos è il Semantic web? E un estensione in evoluzione del World Wide Web in cui i i contenuti web possono essere espressi in formati che possono essere compresi, interpretati e usati anche da agenti software, consentendo loro di trovare, condividere e integrare informazioni in modo semplice Deriva da una visione del Web come mezzo universale di scambio di dati, informazioni e conoscenza avuta da Tim Berners-Lee È una ragnatela di dati (controllati da applicazioni) e non di documenti (presenti nel web) È basato su: RDF Resource Descriptor Format: usato per rappresentare informazioni e scambiare conoscenza nel web Fa riferimento a oggetti (risorse) e a come sono correlate fra loro OWL Web Ontology Language: usato per pubblicare e condividere insiemi di termini (ontologie) che supportino ricerche avanzate, agenti e KM Si focalizza su: Formati comuni per lo scambio di dati Linguaggi per legare dati e oggetti del mondo reale 23
Ontologie Un ontologia è una rappresentazione formale ed esplicità di una concettualizzazione condivisa (Studer, 1998) Definiscono un vocabolario (concetti/categorie e relazioni) che è possibile utilizzare per descrivere risorse Sono fortemente strutturate Definite a priori (dall alto) Sono descritte in OWL A cosa serve OWL? Un set di statement OWL da solo consente di inferire un ulteriore statement OWL, mentre un set di statement XML non consente di derivare ulteriori statement XML. Per generare nuovi dati con XML è necessario che la relativa conoscenza sia embedded nel codice. Es: Parenthood is a more general relationship than motherhood" e "Mary is the mother of Bill" consentono a OWL di concludere che "Mary is the parent of Bill". L utente può chiedere: "Who are Bill's parents?", e il sistema può rispondere che Mary è uno dei genitori di Bill, anche se questo fatto non è definito, ma derivato con un applicazione OWL. 24
Tag e Folksonomy Del.icio.us Flickr Tagging & Folksonomy Taggare una risorsa significa associare ad essa un certo insieme di parole chiave che, SECONDO ME, la descrivono. E un azione PERSONALE. Ma fatta da una comunità su uno stesso insieme di risorse offre un enorme valore organizzativo TAGGING FOLKSONOMIES 25
Folksonomies: cosa sono? (1) (Folksonomy) is not collaborative, is not putting things into categories, is not related to taxonomy [ ] Folksonomy is the result of personal free tagging for one s own retirieval. The tagging is done in social environment (shared and open to others) (Vander Wal) Folksonomies: cosa sono? (2) Folksonomy = Folks + Taxinomia Folks: popolo/gente Taxinomia = Taxis (ordinamento, classificazione) + Nomos (regola, legge) regole di classificazione (della realtà in oggetto) create dalle e basate sulle persone 26
classificazione NON E una categorizzazione NON nel senso comune del termine il classificare e il suo risultato spec. con riferimento alla sistemazione tassonomica delle specie [DeMauro 2007] MA raggruppamento in classi omogenee dei casi rilevanti di uno stesso fenomeno collettivo [DeMauro 2007] creata dalle e basata sulle persone The tagging is done in social environment Folksonomy is the rusult of personal free tagging [ ] for one s own retrieval The value [ ] is derived from people using their own vocabulary Tremendous value can be derived form this personal tagging when viewing it as a collective phenomenon 27
Folksonomies: caratteristiche Riflettono i modelli concettuali degli utilizzatori finali Flessibili e aggiornate Condivise Poco costose Facilmente usabili ( Tempi di apprendimento nulli) Del.icio.us 28
Flickr Flickr Cercare fotografie Commentare fotografie Classificare con tag Creare gruppi (pubblici o privati) per le proprie foto Applicare licenze creative commons Creare blog 29
RSS e Podcasting Stickiness Syndication Rss Podcast Aggregatori Stickiness Vs Syndication Stickiness Unamisuradella quantità di tempo speso su un sito in un certo periodo temporale Ogni cosa in un sito Web che incoraggia i visitatori a rimanervi a lungo Syndication Pubblicare simultaneamente, o fornire pubblicazioni simultanee in posti differenti 30
Web Syndication La Web Syndication consiste nel rendere disponibile un sommario dei più recenti contenuti di un sito (blog) Non è più l utente che deve andarsi a controllare periodicamente i contenuti di un sito, ma sono i contenuti che arrivano a lui Questo è possible grazie ai formati di dati RSS e Atom (basati su XML) Feed RSS Really Simple Syndication File in linguaggio XML che consente la creazione e la distribuzione di flussi informativi. Mediante il Feed RSS l utente non è più obbligato a visitare decine di siti per reperire informazioni ma sono le informazioni che, automaticamente, raggiungono l utente. 31
RSS: channel, feed e item Il sito (channel) mette a disposizione, nei diversi formati (feed), i propri contenuti (item all interno del feed). Chiunque può registrarsi al feed e riceverlo in automatico sul proprio computer RSS 2.0: un esempio <?xml version="1.0"?> <rss version="2.0"> <channel> <title> Liftoff News </title> <link> http://liftoff.msfc.nasa.gov/ </link> <description> Liftoff to Space Exploration. </description> <language> en-us </language> <pubdate> Tue, 10 Jun 2003 04:00:00 GMT </pubdate> <lastbuilddate> Tue, 10 Jun 2003 09:41:01 GMT </lastbuilddate> <docs> http://blogs.law.harvard.edu/tech/rss </docs> <generator> Weblog Editor 2.0 </generator> <managingeditor> editor@example.com </managingeditor> <webmaster> webmaster@example.com </webmaster> <item> <title> Star City </title> <link> http://liftoff.msfc.nasa.gov/news/2003/news-starcity.asp </link> <description> How do. </description> <pubdate> Tue, 03 Jun 2003 09:39:21 GMT </pubdate> <guid> http://liftoff.msfc.nasa.gov/2003/06/03.html#item573 </guid> </item> <item> </item> </channel> </rss> 32
Atom: un esempio <?xml version="1.0" encoding="utf-8"?> <feed xmlns="http://www.w3.org/2005/atom"> <title>example Feed</title> <subtitle>a subtitle.</subtitle> <link href="http://example.org/"/> <updated>2003-12-13t18:30:02z</updated> <author> <name>john Doe</name> <email>johndoe@example.com</email> </author> <id>urn:uuid:60a76c80-d399-11d9</id> </feed> <entry> <title>atom-powered </title> <link href="http://example.org/atom03"/> <id>urn:uuid:1225c695-cfb8-4ebb-</id> <updated>2003-12-13</updated> <summary>some text.</summary> </entry> Podcasting "Podcasting = ipod + broadcasting, cioè: trasmissione per l ipod Termine coniato nel 2004 Serve a distribuire su Internet file multimediali (audio, video, ecc.), utilizzando i formati ATOM o RSS, fruibili su device mobili o PC Il termine può indicare sia il contenuto che il metodo di distribuzione L idea è di fornire contenuti per una platea che desidera fruirli come, dove e quando preferisce. 33
Peculiarità del Podcasting Costi di creazione e di gestione contenuti Massima visibilità dei messaggi Praticità di fruizione Ottimizzazione del tempo Es. uso business del podcasting Gestione flussi informativi Corsi di formazione Aggiornamento professionale Comunicazione con i clienti Vendita dei contenuti Pubblicità 34
Nuove fruizioni del podcasting Video Telefoni cellulari Pocket Integrazione audio, video, pdf. Aggregatori RSS Sono degli strumenti: Desktop (es. FeedReader) Web Integrabili nel browser (es. Sage per Firefox) che si preoccupano di recuperare in modo automatico i feed a cui ci si è registrati. 35
Aggregatori Programmi in grado di raccogliere, aggregare, notizie provenienti da più siti 36