Informa(on Retrival. RispeBo alla teoria classica delle basi di da(, l enfasi non è sulla ricerca di da( ma sulla ricerca di informazioni.

Documenti analoghi
Introduzione all Information Retrieval

L organizzazione dei documenti nei sistemi multimediali

Modelli di recupero. Modello di recupero booleano

Sistemi di Elaborazione dell informazione II. Corso di Laurea Specialistica in Ingegneria Telematica II anno 4 CFU Università Kore Enna A.A.

Corso di Sistemi di Elaborazione delle informazioni

Motori di Ricerca. Servono ad effettuare ricerche sul web in modo semplice e immediato

Comunicazione Digitale

Come cercare le fonti di informazione scientifica GOOGLE / G. SCHOLAR. a cura della Biblioteca di Agraria

MOTORI DI RICERCA. Seconda Parte

CONCETTI E ARCHITETTURA DI UN SISTEMA DI BASI DI DATI

MMDBMS: aspetti da considerare. Basi di dati multimediali. Basi di dati multimediali. MMDBMS: aspetti da considerare. Basi di dati multimediali

Tecnologie, strumenti e processi alle informazioni e l estrazione della conoscenza

Corso Base Informatica Lezione

Basi di dati Basi di dati per bioinformatica

Architetture Client/Server e World Wide Web

ITI M. FARADAY. Programmazione a. s

Unità A1. Informazioni e dati. Obiettivi. Informazione automatica. Informatica. Informazione e conoscenza. Il concetto di informazione

PROGRAMMAZIONE DIDATTICA DISCIPLINARE

INFORMATICA PER LE SCIENZE UMANE a.a. 2017/2018

INFORMATICA PER LE SCIENZE UMANE a.a. 2016/2017

Corso di. Basi di Dati I. 1. Introduzione

Internet e Motori di ricerca

INFORMATICA TECNOLOGIE DELLA COMUNICAZIONE SAPERI MINIMI DISCIPLINARI

Corso di. Basi di Dati I. 1. Introduzione

INFORMATICA PER LE SCIENZE UMANE a.a. 2015/2016

Sommario. 1. Internet subito Le FAQ di Internet 13. Sommario vii

Reperimento dell'informazione

Gestione risorse (Windows)

ANNO SCOLASTICO: 2018/2019 PROGRAMMAZIONE DISCIPLINARE

ISTITUTO ISTRUZIONE SUPERIORE

futuro Blog sito dinamico, poi aggiungiamo le immagini, il contenuto e i link ai tre blocchi.

Informatica per la comunicazione" - lezione 11 -

Parte 2. - Il Documento Elettronico - Introduzione alla gestione delle basi Documentali. M. Diligenti Sistemi Gestione Documentale 1

Nella vita quotidiana esistono innumerevoli esempi di database. Un agenda telefonica, un vocabolario o un catalogo di viaggi, sono tutti esempi di

Grafici e Pagina web

Come ideare un sito...

INFORMATICA. Prof. Giorgio Poletti Laurea Triennale in Economia a.a

Guida semplice all utilizzo del sistema D-STAR Seconda Parte

Il Web. Struttura e servizi

Lezione 6. Siti, Utenti e Sessioni

Search Engine Optimization (SEO)

Disciplina: INFORMATICA

è l attività attraverso la quale si cerca di aumentare il traffico e la popolarità di un sito web

Sommario. Prefazione... xvii Ringraziamenti...xxv L autore...xxvi

Anno scolastico 2016 / Piano di lavoro individuale. ITE Falcone e Borsellino. Classe: IV ITE. Insegnante: EMANUELA DEGASPERI MARIA CANNONE

NAVIGAZIONE WEB MODULO 3

Corso di Informatica. Software di produttività personale e database. Ing Pasquale Rota

Sistemi di Information Retrieval. Sistemi di. Argomenti della lezione. Informazioni gestite

Internet: la rete delle reti

IL SITO WEB. Concetti generali

Informatica per le Scienze Umane. Introduzione al corso: programma dettagliato

LEZIONE BASI DI DATI I 22/10/2008 XML

INTRODUZIONE ALL INFORMATION RETRIEVAL

Indice Prefazione 1 Il diritto e la società dell informazione La società dell informazione Un nuovo paradigma soc

Come cercare le fonti di informazione scientifica Operatori e wildcards. a cura della Biblioteca di Agraria

Internet e Motori di ricerca

Analisi sito web olabit.it

164LE - INFORMATICA PER LE DISCIPLINE UMANISTICHE. Anno Accademico 2015/2016 Tommaso Mazzoli

PROGRAMMA PER LA PROVA DI ACCERTAMENTO

Pagina intenzionalmente lasciata bianca.

Indirizzo Liceo Scientifico opzione Scienze Applicate Classe 1 a sez. F Anno Scolastico

Ricevimento: dopo la lezione (in aula) o su appuntamento (Sede Scientifica Pal. 1 Primo Piano)

Web Immagini Video Maps News Libri Gmail altro igoogle Impostazioni di ricerca Accedi. Google search help

CURRICOLO DIPARTIMENTO INFORMATICA PRIMO BIENNIO

Pag Politecnico di Torino 1

Le basi di dati. Le basi di dati. dalla teoria all'utilizzo di tutti i giorni. Alessandro Tanasi

I numeri 1. Basi di SEO e AdWords. 3 dicembre 2015

D B M G D B M G 2. Gestione degli indici. Introduzione Strutture fisiche di accesso Definizione di indici in SQL Progettazione fisica

Basi di dati. Docente Prof. Alberto Belussi. Anno accademico 2009/10

INFORMATICA NOVITÀ IL LINGUAGGIO JAVA. Massimiliano Bigatti. Guida alla programmazione di base IN ALLEGATO AL VOLUME

autori-c/marco-calvo/internet manuale-per-luso-della-rete/

Sistemi Web per il turismo 25 ottobre 2016

Anno Scolastico

Le aree dell informatica

La ricerca con. A cura del gruppo Portale della Biblioteca Digitale. Novembre Sistema Bibliotecario di Ateneo Università di Padova

Analisi sito web emlalekle.org

Web marketing: come sfruttare la rete per promuovere la propria attività. A cura di Claudia Zarabara scrivi@claudiazarabara.

CAMP-SITE Box STUDIO GRAFICO SEO BASE SITO RESPONSIVE GESTIONE FACILE CON CMS FORMAZIONE

Informatica per le Scienze Umane. Introduzione al corso: programma

Disciplina: TECNOLOGIE DELLA COMUNICAZIONE

Basi di Dati Architetture Client/Server

DOCENTE PROF. ALBERTO BELUSSI. Anno accademico 2010/11

Internet e Motori di ricerca

EMC SourceOne TM for Microsoft SharePoint 7.0 Ricerca all'interno dell'archivio Guida rapida

Architetture Client/Server. Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo

Liceo Marie Curie (Meda) Scientifico Classico Linguistico

Liceo Marie Curie (Meda) Scientifico Classico Linguistico PROGRAMMAZIONE DISCIPLINARE PER COMPETENZE

Prof. Pagani Corrado HTML

Tecnico della progettazione implementazione e manutenzione di sistemi di gestione di database

Giselda De Vita

Librerie digitali. Uso di XML per memorizzare i metadati. Descrizione generale. XML per memorizzare i metadati. Motivi dell uso di XML

Fare ricerca, mai così facile

Analisi Marketing Online & SEO

Basi di dati D O C E N T E P R O F. A L B E R T O B E L U S S I. Anno accademico 2012/13

Introduzione al corso

semplice, intuitivo, dinamico e modulare

Un grafico utilizza i valori contenuti in un foglio di lavoro per creare una rappresentazione grafica delle relazioni esistenti tra loro;

Transcript:

Informa(on Retrival L Informa(on Retrieval (IR) si occupa della rappresentazione, memorizzazione e organizzazione dell informazione, al fine di rendere agevole all utente il soddisfacimento dei propri bisogni informa(vi. Data una collezione di documen( e un bisogno informa(vo dell utente, lo scopo di un sistema di IR è di trovare informazioni che potrebbero essere u$li, o rilevan$, per l utente. RispeBo alla teoria classica delle basi di da(, l enfasi non è sulla ricerca di da( ma sulla ricerca di informazioni.

Perché è interessante parlare di IR? Il sebore dell Informa(on Retrieval è stato studiato fin dagli anni `70. Negli anni `90, l esplosione del Web ha mol(plicato l interesse per IR. Il Web infak non è altro che un enorme collezione di documen(, sui quali gli uten( vogliono fare ricerche informazionali. Il problema principale è che non è semplice caraberizzare esabamente i bisogni informa(vi dell utente.

Differenze tra Informa(on Retrival e Data Retrival Un sistema di Data Retrieval (ad esempio un DBMS) ges(sce da( che hanno una strubura ed una seman(ca ben definita. Un sistema di Informa(on Retrieval ges(sce tes( scrik in linguaggio naturale, spesso non ben strubura( e seman(camente ambigui. Di conseguenza: Un linguaggio per Data Retrieval permebe di trovare tuk gli oggek che soddisfano esabamente le condizioni definite. Tali linguaggi (algebra relazionale, SQL) garan(scono una risposta correba e completa. Un sistema di Informa(on Retrieval, invece, potrebbe res(tuire, tra gli altri, oggek non esak; piccoli errori sono accebabili e probabilmente non verranno nota( dall utente.

ArchiteBura di un (pico Sistema di IR

Indicizzazione della collezione I sistemi di IR non operano sui documen( originali, ma su una vista logica degli stessi. Tradizionalmente i documen( di una collezione vengono rappresenta( tramite un insieme di keyword. La capacità di memorizzazione dei moderni elaboratori permebe talvolta di rappresentare un documento tramite l intero insieme delle parole in esso contenute; si parla allora di vista logica full text. Per collezioni molto grandi tale tecnica può essere inu(lizzabile; si u(lizzano allora tecniche di modifica del testo per ridurre la dimensione della vista logica, che diventa un insieme di index term. Il modulo di ges(one della collezione si occupa di creare gli opportuni indici, contenen( tali termini.

Processo di ricerca delle Informazioni

Web Search

In che modo si puo voler sapere qualcosa? In modo: molto vago modestamente preciso molto preciso enciclopedico. Internet: 3,307,998,701 pagine sull'indice di Google, Stimate piu' di 2 billioni di pagine in totale. documenti testuali (html, doc, pdf, pps, xls,..) con eventuali contenuti multimediali (immagini, suoni, animazioni) e dinamici (maggior interazione all'interno di un documento) siti (domains, subdomains) e sottositi indirizzamenti nei documenti verso altri documenti; si creano cosi' una multitudine di collegamenti e possibili percorsi

Motori di ricerca Problema: come trovare accesso a questa massa di informazioni senza perdersi? Soluzione: un sistema efficace di recupero dell'informazione! Umberto Eco Più si restringe il campo meglio si lavora e più si va sul sicuro Un motore di ricerca è un sistema automa(co che analizza un insieme di da(, generalmente raccol( dal programma stesso, e res(tuisce un insieme di risulta( disponibili, classificandoli in base alla cosiddeba rilevanza rela(va alle chiavi di ricerca inserite.

Principali Motori di Ricerca su Internet

Metodologie di ricerca I motori di ricerca esplorano il web tramite piccoli programmi chiamati ragni (spiders) o robots, i quali seguono i vari collegamenti presenti nei siti e mettono nell'indice le pagine trovate. Di solito i motori di ricerca si basano in gran parte sulla frequenza con cui una parola viene visualizzata in una pagina web.

Il Motori di Ricerca: GOOGLE

Storia di Google

Approccio Anali(co di Google Google usa fondamentalmente due tecnologie per organizzare i propri indici. PageRank Per poter fornire dei risultati di ricerca rilevanti Google utilizza la propria applicazione PageRank. Questo programma prova a misurare l'importanza delle singole pagine interpretando i collegamenti verso essa come voti in favore ad essa. Analisi testuale Quindi Google analizza l'intero contenuto delle pagine tenendo conto della formattazione del testo e della posizione precisa di ogni parola; considera inoltre anche le pagine web vicine (nel sito). Una semplice richiesta 1. L'utente inserisce nell'interfaccia delle parole chiavi. 2. Il sistema invia la ricerca al computer che gestisce l'indice. 3. All'elenco di indirizzi web rilevanti vengono aggiunti altre informazioni per rendere piu' facile l'interpretazione dei risultati. 4. I risultati della ricerca vengono restituiti all'utente.

Ricerca di Base

Operatori di Ricerca

Operatori di Ricerca (segue)

Operatori di Ricerca (segue)

Domini delle ricerche

Ricerca Avanzata

Operatori Avanza(

[ allinurl: google faq ] ritornerà solo documen( che contengono le parole google e faq nell URL, come www.google.com/help/faq.html [ flu shot in(tle:help ] ritornerà I docume( che contengono la parola help nel (tolo, e contengono le parole flu e shot dovunque nel documento, anche nel (tolo)

Operatore filetype: verrà res(tuito il risultato presente nei documen( con il suffisso specificato [ web page evalua(on checklist filetype:pdf ] ritornerà documen( pdf in cui sono contenute le parole web, page, evalua(on, and checklist. Operatore source: res(tuirà gli ar(coli contenen( le parole specificate nel giornale specificato. [ elec(on source:new_york_(mes ]ritornerà gli ar(coli con laparola elec(on che appare nel New York Times.

Funzioni Speciali

Meteo Lecce AC Inter, film Lecce, pizzerie a Lecce,

Opzioni: Impostazioni di ricerca di Google