Introduzione all Information Retrieval

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Introduzione all Information Retrieval"

Transcript

1 Corso di Web Mining & Retrieval Introduzione all Information Retrieval (a.a ) Roberto Basili 1

2 Outline Accesso e Ricerca delle informazioni distribuite Il processo di base dell IR Rilevanza Applicazioni dell IR: Classification Inf. Filtering & Routing Text Clustering Inf. Extraction, Question Answering Web search 2

3 Parte II: Information Retrieval Introduzione 3

4 Informazione Automatizzata Interne Esterne Pubbliche Sw libraries Lettere Basi di Dati Basi di Conoscenza Thesaura, Ontologie Videotex Blogs Grafici Immagini Personal Spaces Video Campioni Video Clips Chioschi Elettronici Pubblicazioni Multimediali Web pages Internet Portals DATI TESTI IMMAGINI SUONI MULTIMEDIALI 4

5 Applicazioni Midware Professionali Gestionali Tecniche Sistemi di Pagamento Elettronico Decisionali Controllo Operative Robotica Commutazione Misure Posta Elettronica Sistemi di Supporto Individuale Gestione Documentazione Telerilevamento Biblioteche CRM Digitali E-Government Commercio Elettronico Sound Editing Hard Disk Recording KM Controllo Ambientale DATI TESTI IMMAGINI SUONI MULTIMEDIALI 5

6 Reperimento della Informazione Se la memorizzazione (mediante dispositivi di memoria di massa) e massiva (testi, immagini, suoni, ) si pone il problema di ricercare tale informazione Il livello di astrazione consentito dai Sistemi Operativi (File System) e solo un primo livello: e insufficiente in molti casi (ad es. anagrafica) non e ottimale (riguardo alla velocità della ricerca) 6

7 Reperimento della Informazione Ricercare in generale significa definire i propri bisogni informativi memorizzare i risultati raffinare la propria selezione ridefinire i requisiti informativi navigare attraverso i dati trovati elaborare, cioè combinare i dati di diverse ricerche 7

8 Reperimento della Informazione (IR): Strumenti determinano (a priori) una strutturazione dell informazione da ricercare che rifletta il linguaggio di interrogazione rifletta la natura (cioe il contenuto) dei dati da ricercare (vd. JPEG, BMP, WAV!!) faciliti le operazioni interne di ricerca forniscono un linguaggio per la definizione dei bisogni informativi, detto linguaggio di interrogazione (Query language) 8

9 Dati: Tipico processo di IR Una collezione di documenti in linguaggio naturale. Una interrogazione utente (in genere una stringa di testo) Trovare: Un elenco ordinato di documenti rilevanti per la interrogazione (l ordinamento e decrescente) 9

10 Sistema di IR Documenti Query IR System Docs ordinati 1. Doc1 2. Doc2 3. Doc3.. 10

11 Rilevanza (Attinenza) La attinenza di un documento ad una interrogazione (query) e soggettiva e dipende da: appartenenza ad un campo semantico (soggetto) puntualità (essere recente ed al momento giusto) autorità (provenienza sicura) vicinanza agli obbiettivi dell utente ed al suo utilizzo dell informazione 11

12 Relevance da Stefano Mizzaro, "Relevance: The Whole History in Journal of the American Society of Information Science, volume 48, (9), , 1997, URL ="citeseer.ist.psu.edu/mizzaro96relevance.html" 12

13 Keyword (Parole chiave) Una keyword e costituita di una o piu parole rugby, Scozia, Italia 6 Nazioni, Istituto di Fisica Matematica Costituiscono la nozione piu semplice di attinenza, i.e. Occorrenza letterale nel testo Unico compromesso: Le parole definite come keyword debbono apparire frequentemente nel documento, indipendentemente del loro ordine (bag of words). 13

14 Limitazioni delle keywords (Silenzio) non vengono trovati documenti che includano (solo) termini sinonimi imposta vs. tassa, basket vs. pallacanestro Stati Uniti vs. USA (Rumore) vengono ritrovati documenti che includono termini ambigui imposta (finestra vs. tassa) Apple (company vs. frutta) operare (in mercato vs. chirurgia) Jaguar (macchina vs. software) Variabilità Ambiguità 14

15 oltre le keywords Le tecniche keyword-based e soprattutto estensioni e sviluppi recenti più espressivi Cenni alle implementazione di sistemi IR Modelli e metodi piuttosto che sistemistica Apprendimento automatico per il sostegno allo sviluppo su larga scala Legami con altre discipline: AI, SW e SE 15

16 IR intelligente Rendere sensibile il sistema al significato delle parole Es. imposta/ tassa, imposta/ finestra Considerare l ordinamento delle parole della interrogazione Es. computer science vs. science and computers Considerare l utente sulla base di un feedback esplicito o implicito Considerare informazioni sulla sorgente (ad es. autorità/affidabilità delle fonti) 16

17 Architettura di un sistema di IR User Need INTERFACCIA Utente OPERAZIONI sul testo Testo User Feedback OPERAZIONI sulla Query INDICIZZAZIONE Database Manager Query RICERCA INDICI Inverted file Docs Ordinati ORDINAMENTO Documenti Trovati Database Testi 17

18 Sistemi di IR: Componenti Operazioni sui Testi Selezione degli indici. Rimozione delle Stopword Stemming/Lemmatizzazione 18

19 Operazioni sui Testi. 19

20 Sistemi di IR: Componenti (2) INDICIZZAZIONE Costruisce l indice inverso: parole riferimenti ai documenti RICERCA: trova i documenti che includono un elemento della interrogazione (usando l indice inverso) ORDINAMENTO dei documenti trovati secondo i valori di attinenza. 20

21 Sistemi di IR: Componenti (3) Interfacce utente: gestiscono le interazioni Inserimento interrogazione e visualizzazione dei documenti. Relevance feedback. Visualizzazione dei risultati. Operazioni sulla Query: trasformano la query per migliorare le prestazioni: Espansione (Query expansion), per es. mediante un thesaurus. Trasformazione (pesatura) mediante relevance feedback. 21

22 IR: Ulteriori task Categorizzazione Automatica di Documenti Information filtering (spam filtering) Information routing Document clustering Recommending information or products Information extraction and Summarisation Question answering Opinion Mining 24

23 IR: Storia s: Esplorazione iniziale per piccole collezioni (abstract scientifici, leggi e documenti commerciali). Sviluppo del modello booleano di base e del Vector-Space Model Salton et Cornell University 25

24 1980 s: IR: Storia (2) Database documentali di enormi dimensioni Alcuni gestiti da imprese: Lexis-Nexis MEDLINE 26

25 1990 s: IR: Storia Ricerca di documenti attraverso Internet (FTP) Archie WAIS Ricerca nel World Wide Web Lycos Yahoo Altavista 27

26 1990 s continued: Competizioni NIST TREC IR: Storia Sistemi di raccomandazione Amazon NetPerceptions (collaborative filering) Categorizzazione automatica di documenti e & document clustering 28

27 2000 s Link analysis Google Storia Recente Information Extraction MUC conferences (80 s-90 s) Portali (WonderPort, Radiocor) Content Management (NetOWL, TREVI, NAMIC) Question Answering TREC Q/A track 29

28 IR : Storia recente 2000 s: Multimedia IR Immagini Video Audio e music Cross-Language IR DARPA Tides Sommarizzazione di Documenti 30

29 IR: Contiguita Disciplinare Database Management Library and Information Science Artificial Intelligence Natural Language Processing Machine Learning 31

30 Database Management Focus su dati strutturati memorizzati in tabelle relazionali non in testo libero. Focus su elaborazione efficiente di interrogazioni in linguaggi formali non ambigui (SQL). Semantica chiara di dati ed interrogazioni. DB distribuiti: interoperabilità Trend verso dati semi-strutturati (XML) cioe verso problemi simili a quelli di IR/AI. 32

31 Library and Information Science Focus sugli aspetti di utilizzabilità dell IR (interazione uomo-macchina, interfacce e visualizzazione). Centralità della conoscenza umana (categorizzazione e accessibilità) Focus su bibliometria (e.g. citation analysis) Trend relativo alle digital libraries avvicina a CS e IR. 33

32 Artificial Intelligence Focus sulla rappresentazione, gestione ed uso della conoscenza e sul ragionamento. Formalismi per rappresentare conoscenze ed interrogazioni : Logica dei predicati del primo ordine Reti bayesiane Semantic Web: ontologie e acceso all informazione intelligente (interoperabilita semantica). 34

33 Natural Language Processing Focus sul trattamento automatico della lingua (analisi sintattica, semantica e pragmatica nei testi e nel dialogo). Sintassi (cioè struttura sintagmatica dei testi) e semantica come strumenti di approssimazione del significato di un testo 35

34 NLP: verso l IR Word Sense Disambiguation Information Extraction Question Answering. NL Learning vs. Learning for IR 36

35 Machine Learning Focus sullo sviluppo di sistemi software che migliorano le proprie prestazioni tramite l esperienza. Classificazione Automatica mediante apprendimento supervisionato da esempi (supervised learning). Metodi automatici di clustering di documenti in classi significative (unsupervised learning for KM). 37

36 Machine Learning: direzioni verso l IR Categorizzazione dei Testi Classificazione Automatica Gerarchica (es. Yahoo). Filtering/Routing/Reccomendation Adattivi Automated spam filtering. Clustering dei Testi Clustering dei risultatio di IR queries. Sviluppo automatico di gerarchie di classi (Yahoo). Appprendimento Automatico per l Information Extraction Text Mining Analisi dei dati del Web 2.0 (Social Web Mining) 38

37 Text Clustering: Vivisimo 39

38 WSD TOPICS 40

39 Sommario Perche l IR è importante Cos e l IR Breve storia Come funziona un sistema generico di IR Cosa significa IR intelligente Quali sono le relazioni di questa tecnologia con altre aree della CS 41

Introduzione all Information Retrieval

Introduzione all Information Retrieval Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information

Dettagli

Sistemi di information retrieval e HCIR

Sistemi di information retrieval e HCIR Sistemi di information retrieval e HCIR Dott. Giuseppe Desolda Outline! Panoramica sui sistemi IR! Progettazione di interfacce per i sistemi IR! Framework di valutazione! Tecniche di visualizzazione e

Dettagli

Sommario [1/2] Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali

Sommario [1/2] Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali Introduzione alle Biblioteche Digitali Sommario [1/2] Cenni storici Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali Cos è una Biblioteca

Dettagli

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire La società Volocom Trasformare le informazioni in conoscenza 2 La società Volo.com dal 2001 è uno dei leader nei settori del Knowledge Management e nella gestione delle informazioni per la rassegna stampa

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

Introduzione alla Linguistica Computazionale

Introduzione alla Linguistica Computazionale Introduzione alla Linguistica Computazionale Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Ludici Adattati da Alessandro Lenci Dipartimento di Linguistica T. Bolelli

Dettagli

Corso di Web Mining e Retrieval

Corso di Web Mining e Retrieval Corso di Web Mining e Retrieval (a.a. 2011-2012) Roberto Basili 1 Obbiettivi del Corso Introduzione alle nozioni di base per l accesso alle informazione distribuita Componente Fondazionale: Problemi di

Dettagli

RILEVANZA = attinenza oggettiva/assoluta PERTINENZA = attinenza soggettiva/relativa (effettivo interesse personale) PUNTO DI FUTILITA ---> ranking

RILEVANZA = attinenza oggettiva/assoluta PERTINENZA = attinenza soggettiva/relativa (effettivo interesse personale) PUNTO DI FUTILITA ---> ranking NOZIONI DI INFORMATION RETRIEVAL a cura di Riccardo Ridi (Università Ca' Foscari di Venezia) aggiornate a Ottobre 2014 RILEVANZA = attinenza oggettiva/assoluta PERTINENZA = attinenza soggettiva/relativa

Dettagli

Sommario [1/2] Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali

Sommario [1/2] Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali Introduzione alle Biblioteche Digitali Sommario [1/2] Cenni storici Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali Cos è una Biblioteca

Dettagli

WEB Information Retrieval

WEB Information Retrieval WEB Information Retrieval Materiale tratto dal corso di Gabriella Pasi Materiale tratto da cap. 13 Modern Information Retrieval by Ricardo Baeza-Yates and Berthier Ribeiro-Neto http://www.sims.berkeley.edu/~hearst/irbook/

Dettagli

Automatic Text Processing

Automatic Text Processing Automatic Text Processing Ing. Leonardo Rigutini Dipartimento di Ingegneria dell Informazione Università di Siena Via Roma 53 53100 SIENA ITALY rigutini@dii.unisi.it Outlines L era dell informazione Information

Dettagli

Tecnologie informatiche e multimediali A.A. 2012/2013 - Elenco Obiettivi Prova scritta (STEP 1)

Tecnologie informatiche e multimediali A.A. 2012/2013 - Elenco Obiettivi Prova scritta (STEP 1) Tecnologie informatiche e multimediali A.A. 0/03 - Elenco Obiettivi Prova scritta (STEP ) Obiettivo didattico Descrivere gli elementi caratteristici delle tecnologie informatiche Numero item definire i

Dettagli

Introduzione al Semantic Web

Introduzione al Semantic Web Corso di Laurea Specialistica in Ingegneria Gestionale Corso di Sistemi Informativi Modulo II A. A. 2013-2014 Giuseppe Loseto Dal Web al Semantic Web 2 Dal Web al Semantic Web: Motivazioni Il Web dovrebbe

Dettagli

Semantica: un sistema per l indicizzazione, il retrieval semantico di learning objects e la generazione automatica di corsi didattici

Semantica: un sistema per l indicizzazione, il retrieval semantico di learning objects e la generazione automatica di corsi didattici Tesi di laurea Semantica: un sistema per l indicizzazione, il retrieval semantico di learning objects e la generazione automatica di corsi didattici Anno Accademico 2007/2008 Relatori Ch.mo prof. Angelo

Dettagli

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE di K A T H A G E D O R N, A R G U S A S S O C I A T E S MARZO 2 0 0 0 traduzione di: BARBARA WIEL MARIN DICEMBRE 2009 1 GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

Dettagli

Periodici elettronici e banche dati

Periodici elettronici e banche dati Servizio civile nazionale volontario Università di Pavia Progetto Vivere la biblioteca: dalla gestione al servizio - 2009 Periodici elettronici e banche dati Caterina Barazia Periodici elettronici: definizione

Dettagli

Pedigree Documentazione aggiuntiva Corso di reperimento dell informazione a.a. 2005/2006 prof.sa Maristella Agosti

Pedigree Documentazione aggiuntiva Corso di reperimento dell informazione a.a. 2005/2006 prof.sa Maristella Agosti Pedigree Documentazione aggiuntiva Corso di reperimento dell informazione a.a. 25/26 prof.sa Maristella Agosti Argenton Matteo Buzzi Lorenzo Gatto Giorgio Molinaro Matteo Zorzan Emmanuele Prestazioni

Dettagli

CUSTOMER RELATIONSHIP MANAGEMENT:

CUSTOMER RELATIONSHIP MANAGEMENT: LA BICOCCA PER LE IMPRESE CUSTOMER RELATIONSHIP MANAGEMENT: MODELLI E TECNOLOGIE PROGETTO WISPER: ESEMPIO DI CUSTOMER SATISFACTION VITTORIO VIGANO CONSORZIO MILANO RICERCHE MERCOLEDI 22 GIUGNO 2005 Università

Dettagli

Indicizzazione. Fasi del processo di IR. Indicizzazione: due aspetti. Corpus: Costruzione delle viste logiche dei documenti: Termine indice

Indicizzazione. Fasi del processo di IR. Indicizzazione: due aspetti. Corpus: Costruzione delle viste logiche dei documenti: Termine indice Fasi del processo di IR Indicizzazione Information need text input Pre-process documents Parse Query Index Rank Indicizzazione: due aspetti Costruzione delle viste logiche dei documenti: Per ogni documento

Dettagli

Breve descrizione del prodotto

Breve descrizione del prodotto Breve descrizione del prodotto 1. Il software AquaBrowser Library...2 1.1 Le funzioni di Search Discover Refine...3 1.2 Search: la funzione di ricerca e di presentazione dei risultati...3 1.2.1 La configurazione

Dettagli

Kirey Re.Search 2.0. Piattaforma di ricerca Open Source

Kirey Re.Search 2.0. Piattaforma di ricerca Open Source Kirey Re.Search 2.0 Piattaforma di ricerca Open Source Le esigenze Quando si parla di motori di ricerca si tende a pensare istintivamente solo a quelli utilizzati per effettuare ricerche in Internet, come

Dettagli

Uno sguardo a Lucene. Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011

Uno sguardo a Lucene. Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011 Uno sguardo a Lucene Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011 Outline Uno sguardo a Lucene Descrizione delle principali caratteristiche Realizzazione di un semplice

Dettagli

Laboratorio di Informatica

Laboratorio di Informatica Laboratorio di Informatica Introduzione al Web WWW World Wide Web CdL Economia A.A. 2012/2013 Domenica Sileo Università degli Studi della Basilicata Introduzione al Web : WWW >> Sommario Sommario 2 n World

Dettagli

MACHINE LEARNING E STRUMENTI ANTICRIMINE NELL ERA DEI BIG DATA. Gaetano Bruno Ronsivalle

MACHINE LEARNING E STRUMENTI ANTICRIMINE NELL ERA DEI BIG DATA. Gaetano Bruno Ronsivalle Gaetano Bruno Ronsivalle Università degli Studi di Verona Tecnologie informatiche e multimediali MACHINE LEARNING E STRUMENTI ANTICRIMINE NELL ERA DEI BIG DATA Argomenti Big Data: una galassia online Machine

Dettagli

Information Retrieval

Information Retrieval Information Retrieval Dario Rigolin Comperio srl CTO dario.rigolin@comperio.it Bologna 22 Maggio 2009 Master in Tecnologie OpenSource Agenda Presentazioni di rito Piccola introduzione sull'ir Cosa offre

Dettagli

Il reference digitale: l intermediazione e le risorse multimediali

Il reference digitale: l intermediazione e le risorse multimediali Università di RomaTre Stato attuale delle metodologie di gestione e diffusione dell informazione multimediale Roma, venerdì 3 dicembre 2004 Il reference digitale: l intermediazione e le risorse multimediali

Dettagli

1. BASI DI DATI: GENERALITÀ

1. BASI DI DATI: GENERALITÀ 1. BASI DI DATI: GENERALITÀ BASE DI DATI (DATABASE, DB) Raccolta di informazioni o dati strutturati, correlati tra loro in modo da risultare fruibili in maniera ottimale. Una base di dati è usualmente

Dettagli

Data Mining e Analisi dei Dati

Data Mining e Analisi dei Dati e Analisi dei Dati Rosaria Lombardo Dipartimento di Economia, Seconda Università di Napoli La scienza che estrae utili informazioni da grandi databases è conosciuta come E una disciplina nuova che interseca

Dettagli

Le informazioni. Fondamenti di informatica. I documenti. Information retrieval. Information retrieval. Ricerche alternative 19/02/2015

Le informazioni. Fondamenti di informatica. I documenti. Information retrieval. Information retrieval. Ricerche alternative 19/02/2015 Fondamenti di informatica Appunti sulla ricerca di informazioni per le scienze umane dal capitolo 8 del testo: M. Lazzari, Informatica umanistica, McGraw-Hill, 2014 Marco Lazzari Le informazioni 1. letteratura

Dettagli

Question answering e generazione automatica di contenuti su piattaforme mobile per i Beni Culturali

Question answering e generazione automatica di contenuti su piattaforme mobile per i Beni Culturali Question answering e generazione automatica di contenuti su piattaforme mobile per i Beni Culturali Napoli, 13 Ottobre 2009 Alberto Raggioli M.E.T.A. srl Centro Direzionale isola F11. Via G. Porzio Insert

Dettagli

ht://miner Un sistema open-source di data mining e data warehousing per lo studio dei comportamenti degli utenti su Internet

ht://miner Un sistema open-source di data mining e data warehousing per lo studio dei comportamenti degli utenti su Internet ht://miner Un sistema open-source di data mining e data warehousing per lo studio dei comportamenti degli utenti su Internet Gabriele Bartolini Comune di Prato Sistema Informativo Servizi di E-government

Dettagli

Rappresentazione della Conoscenza. Lezione 10. Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0

Rappresentazione della Conoscenza. Lezione 10. Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0 Rappresentazione della Conoscenza Lezione 10 Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0 Sistemi ed applicazioni Sistemi di rappresentazione della conoscenza basati su logiche descrittive.

Dettagli

Question Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes

Question Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes Question Answering e semantica Tecnologie emergenti per le imprese Cos è QuestIT? QuestIT nasce nell ambito di attività di ricerca in Intelligenza Artificiale presso il Dipartimento di Ingegneria dell

Dettagli

Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane

Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane Vantaggi e limiti delle folksonomie (difficoltà: *) Nel paragrafo 7.4 è stato introdotto il concetto di social

Dettagli

Ricerca di informazioni nelle banche dati giuridiche

Ricerca di informazioni nelle banche dati giuridiche Informatica giuridica A.A. 2005-06 Ricerca di informazioni nelle banche dati giuridiche Parte I Avv. Chiara Giovanna Bernardi bernardi@cirfid.unibo.it Definizioni NEL LINGUAGGIO COMUNE: Data base = base

Dettagli

INTRODUZIONE. Data Base Management Systems evoluzione tecniche gestione dati

INTRODUZIONE. Data Base Management Systems evoluzione tecniche gestione dati INTRODUZIONE Accesso ai dati tramite DBMS Livelli di astrazione Modello dei dati: schema / istanza / metadati Alcuni modelli dei dati Linguaggi per DBMS Architettura di base di un DBMS cesarini - BDSI

Dettagli

LABORATORIO di INFORMATICA

LABORATORIO di INFORMATICA Università degli Studi di Cagliari Corso di Laurea Magistrale in Ingegneria per l Ambiente ed il Territorio LABORATORIO di INFORMATICA A.A. 2010/2011 Prof. Giorgio Giacinto INTRODUZIONE AI SISTEMI DI BASI

Dettagli

Dalla rassegna stampa al monitoraggio delle informazioni in rete

Dalla rassegna stampa al monitoraggio delle informazioni in rete Dalla rassegna stampa al monitoraggio delle informazioni in rete Agenda Architettura dei servizi Strumenti di analisi delle news online: VoloPress Esercitazione Strategie di ricerca in rete: il servizio

Dettagli

Sistemi Informativi e Servizi in Rete

Sistemi Informativi e Servizi in Rete Sistemi Informativi e Servizi in Rete prof. V. De Antonellis Dipartimento di Ingegneria dell'informazione Università di Brescia valeria.deantonellis@ing.unibs.it Materiale del corso Sito web: www.ing.unibs.it/~deantone/

Dettagli

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Dettagli

MISSIONE AZIENDALE TRAMITE

MISSIONE AZIENDALE TRAMITE MISSIONE AZIENDALE progettazione, realizzazione, integrazione e conduzione di sistemi complessi con l utilizzo di nuove tecnologie per aziende ed enti pubblici TRAMITE Ricerca e Sviluppo per l ideazione,

Dettagli

Corso di Web Programming

Corso di Web Programming Corso di Web Programming 1. Introduzione a Internet e al WWW Paolo Milazzo Dipartimento di Informatica, Università di Pisa http://www.di.unipi.it/ milazzo milazzo di.unipi.it Corso di Laurea in Informatica

Dettagli

Archivio globale della Maremma

Archivio globale della Maremma Archivio globale della Maremma Archivi digitali della Biblioteca comunale Chelliana di Grosseto Programma per la gestione e consultazione SCIRE DBA Biblioteca Chelliana http://archivioglobale.chelliana.it/

Dettagli

Navigazione. per associazione. ipertesti/ipermedia. l utente naviga nello spazio dei documenti alla ricerca dei nodi di interesse

Navigazione. per associazione. ipertesti/ipermedia. l utente naviga nello spazio dei documenti alla ricerca dei nodi di interesse Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 5. Database e Information Retrieval per associazione Navigazione ipertesti/ipermedia l utente naviga nello spazio

Dettagli

browser Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero

browser Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 7. Ricerca delle informazioni in rete, browsers, portali, motori di ricerca browser Un browser è un programma

Dettagli

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE Il sistema di ricerca della biblioteca virtuale permette di accedere in maniera rapida ai materiali didattici di interesse degli studenti presenti all interno del

Dettagli

SQL Server. Applicazioni principali

SQL Server. Applicazioni principali SQL Server Introduzione all uso di SQL Server e utilizzo delle opzioni OLAP Applicazioni principali SQL Server Enterprise Manager Gestione generale di SQL Server Gestione utenti Creazione e gestione dei

Dettagli

La navigazione di profondità

La navigazione di profondità La navigazione di profondità Ovvero: ottenere risultati soddisfacenti nelle ricerche online Marco Gualmini 23 febbraio 2008 Image cropped from: http://commons.wikimedia.org/wiki/image:hmcs_windsor_ssk_877.jpg

Dettagli

Indicizzazione terza parte e modello booleano

Indicizzazione terza parte e modello booleano Reperimento dell informazione (IR) - aa 2014-2015 Indicizzazione terza parte e modello booleano Gruppo di ricerca su Sistemi di Gestione delle Informazioni (IMS) Dipartimento di Ingegneria dell Informazione

Dettagli

Corso di Web Mining e Retrieval. - Introduzione al Corso - (a.a. 2012-2013) Roberto Basili

Corso di Web Mining e Retrieval. - Introduzione al Corso - (a.a. 2012-2013) Roberto Basili Corso di Web Mining e Retrieval - Introduzione al Corso - (a.a. 2012-2013) Roberto Basili 1 Overview WM&R: Motivazioni e prospettive Richiami di Algebra Richiami di calcolo delle probabilità Introduzione

Dettagli

Docente: Augusto Celentano Savian Dario 808548 Marchetto Giovanni 810134

Docente: Augusto Celentano Savian Dario 808548 Marchetto Giovanni 810134 A Visual Approach to Multimedia Querying And Presentation: Delaunay MM Docente: Augusto Celentano Savian Dario 808548 Marchetto Giovanni 810134 Delaunay MM Framework per effettuare query e presentare dati

Dettagli

Modelli di Information Retrieval: I modelli base

Modelli di Information Retrieval: I modelli base Modelli di Information Retrieval: I modelli base Gabriella Pasi 1 Università degli Studi di Milano Bicocca Via Bicocca degli Arcimboldi 8 e-mail: pasi@disco.unimib.it Struttura base di un IRS ARCHIVIO

Dettagli

1 Introduzione 1 1.1 Information Retrieval: promesse e problemi... 1 1.2 Presentazione del lavoro... 3 1.3 Sommario... 5

1 Introduzione 1 1.1 Information Retrieval: promesse e problemi... 1 1.2 Presentazione del lavoro... 3 1.3 Sommario... 5 Indice 1 Introduzione 1 1.1 Information Retrieval: promesse e problemi..................... 1 1.2 Presentazione del lavoro................................ 3 1.3 Sommario........................................

Dettagli

Motori di ricerca. Andrea Marin

Motori di ricerca. Andrea Marin Andrea Marin Università Ca Foscari Venezia SVILUPPO INTERCULTURALE DEI SISTEMI TURISTICI SISTEMI INFORMATIVI E TECNOLOGIE WEB PER IL TURISMO - 1 a.a. 2012/2013 Section 1 Information Retrieval e Motori

Dettagli

Servizi di ricerca nel Web (Web search)

Servizi di ricerca nel Web (Web search) Servizi di ricerca nel Web (Web search) Generalità Introduzione Il web è il più grande database mondiali di contenuti. É un contenitore di informazioni che vengono pubblicate, modificate, cancellate, inserite

Dettagli

Analisi e catalogazione automatica dei Curriculum Vitae

Analisi e catalogazione automatica dei Curriculum Vitae Analisi e catalogazione automatica dei Curriculum Vitae CV Manager è lo strumento di Text Mining che automatizza l analisi, la catalogazione e la ricerca dei Curriculum Vitae L esigenza Quanto tempo viene

Dettagli

XML Retrieval Emanuele Panzeri

XML Retrieval Emanuele Panzeri Corso di Information Retrieval XML Retrieval Emanuele Panzeri panzeri@disco.unimib.it Università degli Studi di Milano Bicocca XML? extensible Markup Language Linguaggio definito come standard dal World

Dettagli

Facoltà di Farmacia - Corso di Informatica

Facoltà di Farmacia - Corso di Informatica Basi di dati Riferimenti: Curtin cap. 8 Versione: 13/03/2007 1 Basi di dati (Database, DB) Una delle applicazioni informatiche più utilizzate, ma meno conosciute dai non informatici Avete già interagito

Dettagli

Reti di Calcolatori. Lezione 3

Reti di Calcolatori. Lezione 3 Reti di Calcolatori Lezione 3 I livelli di una rete Per ridurre la complessità di progetto, le reti sono in generale organizzate a livelli: Il Formato dei Pacchetti Tutti pacchetti sono fatti in questo

Dettagli

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina Cosa è il DSS L elevato sviluppo dei personal computer, delle reti di calcolatori, dei sistemi database di grandi dimensioni, e la forte espansione di modelli basati sui calcolatori rappresentano gli sviluppi

Dettagli

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web Il World Wide Web Il Web Claudio Fornaro ver. 1.3 1 Il World Wide Web (ragnatela di estensione mondiale) o WWW o Web è un sistema di documenti ipertestuali collegati tra loro attraverso Internet Attraverso

Dettagli

IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web

IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web GLI INTERROGATIVI 1. Perché Internet è diventato il più grande contenitore di informazioni del mondo? 2. Perché non è sempre facile reperire

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

Lezione 8. Motori di Ricerca

Lezione 8. Motori di Ricerca Lezione 8 Motori di Ricerca Basi di dati Un campo prevalente dell applicazione informatica è quello costituito dall archiviazione e dalla gestione dei dati (basi di dati). Sistema Informativo. Un sistema

Dettagli

MODULO 2. Gestione dei File. Concetti base. Muoversi tra il menù dei programmi installati

MODULO 2. Gestione dei File. Concetti base. Muoversi tra il menù dei programmi installati MODULO 2 Gestione dei File MODULO 2 - GESTIONE DEI FILE 1 Concetti base Avviare e spegnere il computer Muoversi tra il menù dei programmi installati Di che risorse disponiamo? Pannello di controllo - Sistema

Dettagli

DATAWAREHOUSE DEVELOPER / DATAMINER

DATAWAREHOUSE DEVELOPER / DATAMINER DATAWAREHOUSE DEVELOPER / DATAMINER 2.4 Finalità e motivazioni dell'intervento: Dopo i finanziamenti a sostegno del progetto e attraverso l integrazione e la diversificazione produttiva, il PIT Tavoliere

Dettagli

BASI DI DATI. Queste slides sono un adattamento di quelle di Luca Anselma e Gian Luca Pozzato, cui va il mio ringraziamento

BASI DI DATI. Queste slides sono un adattamento di quelle di Luca Anselma e Gian Luca Pozzato, cui va il mio ringraziamento BASI DI DATI Queste slides sono un adattamento di quelle di Luca Anselma e Gian Luca Pozzato, cui va il mio ringraziamento BASI DI DATI (DATABASE, DB) Una delle applicazioni informatiche più utilizzate,

Dettagli

Corso di Sistemi di Elaborazione delle informazioni

Corso di Sistemi di Elaborazione delle informazioni Corso di Sistemi di Elaborazione delle informazioni Reti di Calcolatori Francesco Fontanella Il DNS Gli indirizzi IP sono in formato numerico: sono difficili da ricordare; Ricordare delle stringhe di testo

Dettagli

Reti di Calcolatori. Il Livello delle Applicazioni

Reti di Calcolatori. Il Livello delle Applicazioni Reti di Calcolatori Il Livello delle Applicazioni Il DNS Gli indirizzi IP sono in formato numerico: sono difficili da ricordare; Ricordare delle stringhe di testo è sicuramente molto più semplice; Il Domain

Dettagli

Architettura del. Sintesi dei livelli di rete. Livelli di trasporto e inferiori (Livelli 1-4)

Architettura del. Sintesi dei livelli di rete. Livelli di trasporto e inferiori (Livelli 1-4) Architettura del WWW World Wide Web Sintesi dei livelli di rete Livelli di trasporto e inferiori (Livelli 1-4) - Connessione fisica - Trasmissione dei pacchetti ( IP ) - Affidabilità della comunicazione

Dettagli

ELEMENTI DI INFORMATICA GIURIDICA

ELEMENTI DI INFORMATICA GIURIDICA Università degli Studi di Napoli «Federico II» Scuola Specializzazione Professioni Legali ELEMENTI DI INFORMATICA GIURIDICA Avv. Delia Boscia 18 marzo 2015 IL RAPPORTO TRA INFORMATICA E DIRITTO HA DATO

Dettagli

Come utilizzare il nuovo LEGGI D ITALIA Pubblica Amministrazione

Come utilizzare il nuovo LEGGI D ITALIA Pubblica Amministrazione Come utilizzare il nuovo LEGGI D ITALIA Pubblica Amministrazione 1 Cos è il nuovo Sistema LEGGI D ITALIA Pubblica Amministrazione è la nuova soluzione on line integrata e intelligente, realizzata su misura

Dettagli

Informatica per le discipline umanistiche 2 lezione 15

Informatica per le discipline umanistiche 2 lezione 15 Informatica per le discipline umanistiche 2 lezione 15 Nella lezione precedente: In realtà non tutto il data mining è dettato dagli interessi economici (commercial) data mining Abbiamo visto risvolti commerciali

Dettagli

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Facoltà di Ingegneria Corso di Laurea Specialistica in Ingegneria Informatica SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Relatore Chiarissimo

Dettagli

Introduzione E. TINELLI LTW A. A. 2011-2012

Introduzione E. TINELLI LTW A. A. 2011-2012 Corso di Laurea Specialistica in Ingegneria Informatica Corso di Linguaggi e Tecnologie Web A. A. 2011-2012 Web Information Retrieval Eufemia TINELLI Introduzione Per Web information Retrieval si intende

Dettagli

Interaction design Architettura dell informazione

Interaction design Architettura dell informazione Interaction design Architettura dell informazione Argomenti Un po di teoria: la ricerca dell informazione Schemi e strutture di organizzazione Progettare un IA: analisi degli utenti Gli elementi dell IA:

Dettagli

Corso di Marketing Industriale

Corso di Marketing Industriale U N I V E R S I T A' D E G L I S T U D I D I B E R G A M O Facoltà di Ingegneria Corso di Marketing Industriale Prof Ferruccio Piazzoni ferruccio.piazzoni@unibg.it Marketing e Comunicazione: Promo-Pub-DM

Dettagli

ORACLE BUSINESS INTELLIGENCE STANDARD EDITION ONE A WORLD CLASS PERFORMANCE

ORACLE BUSINESS INTELLIGENCE STANDARD EDITION ONE A WORLD CLASS PERFORMANCE ORACLE BUSINESS INTELLIGENCE STANDARD EDITION ONE A WORLD CLASS PERFORMANCE Oracle Business Intelligence Standard Edition One è una soluzione BI completa, integrata destinata alle piccole e medie imprese.oracle

Dettagli

Introduzione al Data Mining

Introduzione al Data Mining Introduzione al Data Mining Sistemi informativi per le Decisioni Slide a cura di Prof. Claudio Sartori Evoluzione della tecnologia dell informazione (IT) (Han & Kamber, 2001) Percorso evolutivo iniziato

Dettagli

Internet. Servizi applicativi

Internet. Servizi applicativi Internet Internet 1 Servizi applicativi World Wide Web: consultazione interattiva di ipermedia con modalità point-and-click browser e navigazione configurazione e sicurezza i motori di ricerca accesso

Dettagli

Cooperazione amministrativa e semantica: Il ruolo del Documento Intelligente

Cooperazione amministrativa e semantica: Il ruolo del Documento Intelligente Cooperazione amministrativa e semantica: Il ruolo del Documento Intelligente Romeo Pruno L attuazione dell e-government ha reso possibile la presentazione sul mercato IT di una grande quantità di soluzioni

Dettagli

Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web

Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web 16 febbraio 2015 Indice 1 Individuazione dei dataset 1 2 Dataset Repositories

Dettagli

I MOTORI DI RICERCA motori di ricerca. motori di ricerca per termini motori di ricerca sistematici

I MOTORI DI RICERCA motori di ricerca. motori di ricerca per termini motori di ricerca sistematici I MOTORI DI RICERCA Il numero di siti Internet è infinito e ormai ha raggiunto una crescita esponenziale; inoltre, ogni sito è costituito da diverse pagine, alcune volte centinaia, e individuare un informazione

Dettagli

Introduzione alla Business Intelligence

Introduzione alla Business Intelligence SOMMARIO 1. DEFINIZIONE DI BUSINESS INTELLIGENCE...3 2. FINALITA DELLA BUSINESS INTELLIGENCE...4 3. DESTINATARI DELLA BUSINESS INTELLIGENCE...5 4. GLOSSARIO...7 BIM 3.1 Introduzione alla Pag. 2/ 9 1.DEFINIZIONE

Dettagli

Il World Wide Web. Il Servizio World Wide Web (WWW) WWW WWW WWW WWW. Storia WWW: obbiettivi WWW: tecnologie Le Applicazioni Scenari Futuri.

Il World Wide Web. Il Servizio World Wide Web (WWW) WWW WWW WWW WWW. Storia WWW: obbiettivi WWW: tecnologie Le Applicazioni Scenari Futuri. Il Servizio World Wide Web () Corso di Informatica Generale (Roberto BASILI) Teramo, 20 Gennaio, 2000 Il World Wide Web Storia : obbiettivi : tecnologie Le Applicazioni Scenari Futuri La Storia (1990)

Dettagli

Descrizione della Ricerca

Descrizione della Ricerca Descrizione della Ricerca I contenuti web consentono il download, ovvero non sono protetti, fatti salvi i diritti inalienabili degli autori. La convenzione di Basilea offre i termini di diritto per l utilizzo

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

Informatica. Scopo della lezione

Informatica. Scopo della lezione 1 Informatica per laurea diarea non informatica LEZIONE 1 - Cos è l informatica 2 Scopo della lezione Introdurre le nozioni base della materia Definire le differenze tra hardware e software Individuare

Dettagli

***** Il software IBM e semplice *****

***** Il software IBM e semplice ***** Il IBM e semplice ***** ***** Tutto quello che hai sempre voluto sapere sui prodotti IBM per qualificare i potenziali clienti, sensibilizzarli sulle nostre offerte e riuscire a convincerli. IBM and Business

Dettagli

Organizzazione delle informazioni: Database

Organizzazione delle informazioni: Database Organizzazione delle informazioni: Database Laboratorio Informatico di base A.A. 2013/2014 Dipartimento di Scienze Aziendali e Giuridiche Università della Calabria Dott. Pierluigi Muoio (pierluigi.muoio@unical.it)

Dettagli

SQL Server BI Development Studio

SQL Server BI Development Studio Il Data warehouse SQL Server Business Intelligence Development Studio Analysis Service Sorgenti dati operazionali DB relazionali Fogli excel Data warehouse Staging Area e dati riconciliati Cubi Report

Dettagli

Introduzione. Elenco telefonico Conti correnti Catalogo libri di una biblioteca Orario dei treni aerei

Introduzione. Elenco telefonico Conti correnti Catalogo libri di una biblioteca Orario dei treni aerei Introduzione Elenco telefonico Conti correnti Catalogo libri di una biblioteca Orario dei treni aerei. ESEMPI DI INSIEMI DI DATI DA ORGANIZZARE ED USARE IN MANIERA EFFICIENTE Introduzione Più utenti con

Dettagli

Uso di un browser (con riferimento a Microsoft Internet Explorer 6.0)

Uso di un browser (con riferimento a Microsoft Internet Explorer 6.0) Uso di un browser (con riferimento a Microsoft Internet Explorer 6.0) Nota Bene: Si raccomanda di leggere queste dispense di fronte al computer, provando passo dopo passo le funzionalità descritte. Per

Dettagli

Data Base. Prof. Filippo TROTTA

Data Base. Prof. Filippo TROTTA Data Base Definizione di DataBase Un Database può essere definito come un insieme di informazioni strettamente correlate, memorizzate su un supporto di memoria di massa, costituenti un tutt uno, che possono

Dettagli

Il Livello delle Applicazioni

Il Livello delle Applicazioni Il Livello delle Applicazioni Il livello Applicazione Nello stack protocollare TCP/IP il livello Applicazione corrisponde agli ultimi tre livelli dello stack OSI. Il livello Applicazione supporta le applicazioni

Dettagli

Indicizzazione di documenti testuali

Indicizzazione di documenti testuali Indicizzazione di documenti testuali Generazione di un archivio di Documenti Testuali E eseguita off-line necessaria per accelerare il reperimento dei documenti E un processo che esegue le seguenti attività:

Dettagli

Data Warehousing e Data Mining

Data Warehousing e Data Mining Università degli Studi di Firenze Dipartimento di Sistemi e Informatica A.A. 2011-2012 I primi passi Data Warehousing e Data Mining Parte 2 Docente: Alessandro Gori a.gori@unifi.it OLTP vs. OLAP OLTP vs.

Dettagli

Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design

Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design Dipartimento INDACO Facoltà del Design - III Facoltà d Architettura Politecnico di Milano Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design

Dettagli

La base di dati (database)

La base di dati (database) La base di dati (database) La costruzione, analisi e interrogazione delle basi di dati Il Database e la sua organizzazione Un DATABASE è una raccolta strutturata di dati Database relazionali Organizzazione

Dettagli