Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web"

Transcript

1 Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web 16 febbraio 2015 Indice 1 Individuazione dei dataset 1 2 Dataset Repositories Dataset più Rilevanti Web Directories Selezione dei Dataset Analisi delle caratteristiche dei dataset disponibili Scelta del Dataset Individuazione dei dataset Il documento è preposto a riportare l analisi dei dataset disponibili per l addestramento e la convalida del sistema riguardanti l ambito Web. Verranno descritte e analizzate le varie risorse e in base a tali considerazioni viene motivata la scelta dei dataset adottati per le sperimentazioni. i dataset di interesse per il progetto sono quelli aventi dati di tipo testuale; in particolare, le sperimentazioni in questione riguardano la generazione e convalida di una tassonomia a partire da di tipo testuale in ambito Web. Tali pertanto dovranno essere costituiti da contenuto testuale estratto da pagine Web o newsgroup. Attualmente diversi dataset sono reperibili gratuitamente dal web; di seguito riportiamo una descrizione generale delle varie risorse di possibile interesse. 2 Dataset Repositories Esistono attualmente diversi repository in cui si possono reperire i dataset necessari. Il repository è un archivio digitale che esporre i dati, preservandoli in modo che siano sempre disponibili nel corso del tempo, migrandoli nel caso cambino i formati e i supporti. Si possono scegliere quali permessi dare a chi utilizza i dati attraverso la licenza. In genere si usano licenze Creative Commons 1 che obbligano a citare chi ha prodotto i dati. Tra i vari repository, i più 1 https://creativecommons.org/ 1

2 completi e diffusi nella comunità scientifica in ambito di machine learning sono descritti di seguito. UCI Machine Learning Repository 2. Inizialmente creato da ricercatori e studenti dell università della California-Irvine come archivio ftp, e attualmente gestito in collaborazione con l università del Massachusetts Amherst, il repository UCI fornisce alcuni dei più diffusi dataset in diversi settori del machine learning, fornendo dati sia di tipo nominale che numerico, per sistemi e algoritmi di classificazione, clustering, regressione etc. Linked Data 3. In informatica, i linked data costituiscono una modalità di pubblicazione, condivisione e connessione di dati strutturati e collegati tra loro. Il portale LinkedData fornisce diversi dataset relativi a tale tipologia di dati alla comunità scientifica. CKAN 4. E un catalogo gestito da una community specifica (formata da organi istituzionali, centri di ricerca, dipartimenti universitari etc.) che contiene dataset utili reperibili in Internet con licenze open source. Yahoo! Webscope 5. La nota società Yahoo! 6 mette a disposizione della comunità scientifica diversi dataset creati dai propri ricercatori o in alcuni casi collezionati dalle attività degli utenti del portale. TREC Datasets 7. Contiene i dataset (la maggior parte a pagamento) messi a disposizione dal NIST 8 (National Institute of Standards and Technology) durante le varie edizioni di una serie di conferenze scientifiche (TREC: Text REtrieval Conference) nell ambito dei settori in cui il focus è sull elaborazione di testuali. L idea principale era fornire una serie di dataset standard per le varie pubblicazioni del convegno, in modo da poter fornire alla comunità un supporto di confronto tra i vari algoritmi, sistemi, metodi, etc. 2.1 Dataset più Rilevanti Di seguito elenchiamo i dataset più diffusi disponibili in ambito della categorizzazione di testi, e che potrebbero risultare di interesse per le sperimentazioni del progetto. Sono stati considerati in questo elenco i dataset aventi un appropriato numero di categorie e di. Reuters Dataset 9. Attualmente uno dei dataset reali più utilizzati nel campo della classificazione di testi. E una collezione di articoli web collezionati dal sito di news della società Reuters Ltd. and Carnegie Group. Ogni articolo è stato manualmente etichettato secondo una struttura gerarchica di categorie. Una delle prime versioni

3 (denominata Reuters-21578), resa disponibile nei primi anni 90, è stata la risorsa di riferimento per le sperimentazioni su algoritmi e sistemi di elaborazione di testuali. La collezione contiene circa Nel 2000 è stata rilasciata una versione più estesa (denominata RCV1 per la versione contenente articoli in lingua inglese, e RCV2 per la collezione multilingua), contenente circa 1 milione di articoli. OHSUMED 10. E un set di formati da titoli e abstract di pubblicazioni scientifiche in ambito medico. I circa sono classificati secondo una strutture gerarchica aventi circa nodi. 20 Newsgroups 11. Una serie di articoli (circa 20000) estratti da 20 newsgroup. Un newsgroup è uno degli spazi virtuali creato su una rete di server interconnessi per discutere di un argomento (topic) ben determinato. Le 20 categorie sono spesso viste in una struttura gerarchica, in quanto alcune classi sono sotto-categorie di un topic più generale. BankSearch 12. E una collezione di pagine web categorizzate in 11 categorie, per un totale di circa pagine. Le categorie e le pagine sono estratte dalla web directory DMOZ (vedi sezione 2.2). Common Crawl Corpus 13. Contiene circa 5 milioni di pagine collezionate dai crawler di Amazon. I dataset sono reperibili gratuitamente, anche se la loro elaborazione richiede risorse computazionali elevate (pochi file di dimensione spesso superiori al GB). Amazon mette a disposizione, a pagamento, un servizio web atto all elaborazione con sistemi distribuiti (Amazon Elastic MapReduce 14 ) basato sul framework Hadoop. WayBack Machine 15. E un servizio del portale Internet Archive 16 il quale fornisce la possibilità di visualizzare miliardi di pagine web. Il sistema salva milioni di pagine ogni giorno, e le rende disponibili per la visualizzazione. Per una determinata pagina web, quindi, è possibile visualizzare il suo contenuto per diversi momenti del passato (da fine anni 90 agli ultimi giorni). Il portale attualmente contiene circa 450 miliardi di pagine (comprese di testo, codice, metadati, file multimediali etc.). Nel 2012 una porzione di dati (quasi 3 milioni di pagine web incirca 80 Tb) è disponibile gratuitamente per uso non commerciale, facendo richiesta alla società che gestisce il portale. TREC Datasets. I dataset messi a disposizione sono di diverse tipologie, tra cui anche raccolte di pagine web. Sono ampiamente diffusi, ma sono reperibili a pagamento. 2.2 Web Directories Altra risorsa di fondamentale importanza, soprattutto nella progettazione di motori di ricerca, è rappresentata dalle web directory. Una web directory è un elenco di siti web suddivisi in maniera gerarchica. Non è né un motore di ricerca né un archiviatore di siti mediante 10 filtering.html https://archive.org/web/ 16 https://archive.org/ 3

4 tag, ma li raccoglie ed organizza per mezzo di categorie e sotto-categorie tematiche. Una web directory consiste dunque in un portale in cui le risorse sono organizzate per aree tematiche, e vengono presentate come indici o, soprattutto, come tassonomie. Al giorno d oggi esistono migliaia e migliaia di Web directory, la maggior parte di esse create manualmente con team di esperti o volontari, in cui l iscrizione e l indicizzazione dei siti può avvenire in maniera gratuita o a pagamento. Le maggiori Web directory (ad esempio DMOZ 17, WWW Virtual Library 18, Best of The Web 19 o Joe Ant 20 ) contengono in genere milioni di pagine referenziate, categorizzate in centinaia di migliaia di categorie; dato che la quasi totalità delle web directory non fornisce i dati in formato scaricabile (ad esempio dump di database, file RDF/XML etc.), per recuperare strutture e link si rende comunque necessario l utilizzo di strumenti (quali crawler, spider, robot etc.) in grado di scaricare e analizzare i portali per estrarre i dati. Tra le più importanti Web directory, l unica per la quale è reso disponibile il dump delle pagine referenziate è DMOZ. DMoz (abbreviazione di Directory.Mozilla, il nome di dominio del suo sito), noto anche come Open Directory Project (ODP), è una web directory multilingue a contenuto aperto di proprietà della Time Warner e mantenuta da una comunità virtuale di redattori volontari. OPD può essere visto come una raccolta di hyperlinks indicizzati, reperibili nel Web. Essa è organizzata gerarchicamente per argomenti dal vasto allo specifico. La parola Open nel nome del progetto, indica un approccio assai diverso rispetto ad altre directory esistenti, di natura strettamente commerciale: gli elenchi di siti classificati da ODP vengono infatti resi disponibili gratuitamente a chiunque ne voglia fare uso, magari per ripubblicare la directory su altri siti. Questa scelta rende le informazioni raccolte da DMOZ aperte a tutti e ha favorito notevolmente la diffusione dei dati della directory sul web. ODP è sostenuta dagli editori della comunità, i quali valutano i siti per l inclusione nell indice; tutte le richieste sono soggette alla valutazione dell editore. I criteri seguiti per decidere se inserire o meno un sito in catalogo si basano esclusivamente sui contenuti dei siti stessi. 3 Selezione dei Dataset In questa sezione, dopo aver analizzato le caratteristiche, verranno illustrati i vantaggi e gli svantaggi del potenziale uso di ogni risorsa nell ambito del progetto, motivando così la decisione su quali dati utilizzare per le sperimentazioni nell ambito Web. 3.1 Analisi delle caratteristiche dei dataset disponibili Di seguito riportiamo i dataset di possibile interesse, in cui i dati sono reperibili in formato testuale. La Tabella 1 riporta in sintesi le caratteristiche di ogni dataset analizzato. La voce Tipologia indica se i dati sono relativi a pagine web o altri tipi di dato testuale; la colonna Policy indica se i dati sono reperibili gratuitamente, o dietro il pagamento del servizio; ogni dataset è caratterizzato inoltre dalla Popolosità dei dati, ovvero il numero totale di ; la Reperibilità indoca se il sito mette a disposizione o meno i dati (download ), o se è necessario una fase di acquisizione ulteriore (ad esempio crawling o parsing di pagine web), in quanto, nell ambito del progetto, i dati di interesse sono quelli per cui è disponibile il codice

5 Tabella 1: Caratteristiche dei dataset analizzati. Tipologia Policy Popolosità Reperibilità DMOZ Pagine Web Free WayBack Machine Pagine Web Free 4M di 3M di Altre Web Directory Pagine Web Free/Pay Variabile Reuters Articoli news Free OHSUMED Abstract paper scientifici Free 20 Newsgroups News Free BankSearch Pagine Web Free Common Crawl Corpus Pagine Web Free (Map-Reduce pay) 1M di M di TREC Datasets Varie Pay Variabile DB Dump Crawler necessario Crawler necessario Donwload Formato dei dati Link HTML Link HTML Link HTML File testuali File testuali File testuali Codice HTML Codice HTML Varie HTML o testo estratto da esso; a tal proposito viene indicato inoltre in tabella il Formato dei dati. La Web directory DMOZ è sicuramente uno degli strumenti più diffusi in ambito scientifico. In letteratura molteplici pubblicazioni riguardano lavori in cui la tassonomia DMOZ è la fonte principale dei dati necessari all addestramento e al test di algoritmi e sistemi. L elevata popolosità, sia in termini di numero di, sia in termini di categorie, nonché la struttura gerarchica molto profonda, rendono la tassonomia versatile e adattabile a molteplici settori di ricerca. Ma proprio l elevata complessità strutturale presenta la necessità di processi di affinamento ed estrazione di sotto-strutture più regolari ed uniformi; infatti, la tassonomia non ha una struttura omogenea, sia in termini di struttura tassonomica (la profondità varia a seconda del ramo considerato), sia in termini di popolosità di ciascuna categoria (i nodi possono avere da poche decine a migliaia di ). Inoltre sono popolate per la maggior parte soltanto le foglie della tassonomia (sono pochi i casi in cui i nodi intermedi hanno propri, e comunque difficilmente si supera la decina di ), anche se nell ambito del progetto questo costituisce un vantaggio, in quanto i dati di partenza sono rappresentati dalle foglie della tassonomia da generare. Un aspetto importante è dato dal fatto che la tassonomia è reperibile facilmente, in quanto è disponibile il download del database contente struttura della tassonomia, metadati e link alle pagine. E comunque necessaria una fase di download delle pagine Web considerate. Le altre Web Directory, compresa quella derivante da Way- Back Machine, non sono diffuse per l estrazione di dataset, pur essendo spesso più popolate, e, a seconda degli intenti delle società che le forniscono, meglio strutturate. L aspetto critico (e contrastante riguardo l ultimo aspetto) è che per la maggior parte di esse l indicizzazione, e quindi la presenza nella struttura, avviene a pagamento (per gli owner dei siti Web), e quindi potrebbero non essere rappresentative di una data categoria (ad esempio, per alcuni nodi potrebbero esserci pochi elementi). Si riscontrano dunque le stesse criticità riscontrate 5

6 DMOZ WayBack Machine Altre Web Directory Reuters OHSUMED 20 Newsgroups BankSearch Common Crawl Corpus TREC Datasets Tabella 2: Analisi dei dataset. Vantaggi Gerarchia profonda. Popolosità elevata. Reperibilità immediata del DB. La più adottata nella comunità scientifica. Popolosità elevata. Struttura gerarchica. Popolosità elevata. Struttura gerarchica Gerarchia ben strutturata. Diffusa nella comunità scientifica. Facilmente reperibile. Discreta diffusione nella comunità scientifica. Struttura gerarchica. Ampia diffusione nella comunità scientifica. Facilmente reperibile. Facilmente reperibile. Codice HTML. Pagine filtrate. Popolosità elevata. Struttura gerarchica. Popolosità elevata. Struttura gerarchica. Ampia diffusione. Possibilità di diverse tipologie. Svantaggi Necessità di download di ogni pagina Web. Struttura non uniforme. Necessità di crawling e recupero struttura. Non diffusa nella comunità scientifica. Per le free, necessità di download. Pagamento per la maggior parte. Non diffuse nella comunità scientifica. No pagine Web. Dominio molto specifico. No pagine Web. No gerarchia. Scarso numero di classi foglia (10). Utilizzo marginale nella comunità scientifica. Mole di dati elevata: framework per map-reduce a pagamento. non diffusa nella comunità scientifica. Dati reperibili a pagamento. in DMOZ, e ovviamente a parità di aspetti critici è preferibile utilizzare una risorsa consolidata e diffusa, in modo da avere riscontro nella comunità scientifica. Il dataset BankSearch presenta i vantaggi di (i) essere ben strutturato, in quanto c è un perfetto bilanciamento tra le classi; (ii) di avere i già filtrati, ovvero le pagine hanno contenuto informativo significativo e sono rimosse le pagine dinamiche, script etc.; (iii) di avere un elevato numero di per classe (un migliaio), e (iv) di essere facilmente reperibile in quanto il codice HTML di ogni pagina è fornito per il donwload. Lo svantaggio principale è che il numero di classi è limitato (10), e quindi se ne esclude l utilizzo per le sperimentazioni finali, ma può essere adoperato come toy dataset per le sperimentazioni preliminari sugli algoritmi implementati. I dataset reperibili dal sito relativo a TREC sarebbero di grande interesse, data la diffusione nella comunità scientifica come dati di riferimento e di comparazione tra diversi sistemi e algoritmi, e dati i diversi dataset riguardanti il Web, ma l acquisizione dei dati richiede un significativo investimento in denaro (in media qualche centinaio di dollari per dataset). I dataset Reuters, pur avendo struttura e contenuti significativi, hanno il difetto principale di non essere testo derivante da pagine Web. Pur essendo non rilevanti nell ambito specifico, sono comunque tenuti in considerazione per sperimentazioni parallele sulle metriche e sugli algoritmi definiti durante il progetto, fornendo un riscontro in ulteriori ambiti e settori. Stesso discorso per il dataset 20 Newsgroups, il quale ha però lo svantaggio di non avere una struttura gerarchica definita, seppure alcune classi possono essere intuitivamente raggruppate in macro-categorie. Il dataset OHSUMED invece, oltre ad essere relativo ad articoli scientifici e non a pagine 6

7 Web, ha lo svantaggio di essere definito per un dominio molto specifico (pubblicazioni in ambito medico), e di possibile scarsa rilevanza per gli algoritmi definiti. Discorso a parte per il dataset Common Crawl Corpus, il quale, pur avendo un elevato numero di e di classi, è di difficile elaborazione; la mole di dati ( 80T B di codici HTML e metadati), fa sì che si rende necessario utilizzare framework e algoritmi di Map-Reduce; Amazon mette a disposizione i suoi servizi, ma a pagamento. La Tabella 2 fornisce un riepilogo di vantaggi e svantaggi di ogni dataset analizzato. 3.2 Scelta del Dataset In base alle considerazioni precedenti, la risorsa considerata per le sperimentazioni è DMOZ. Nonostante la non omogeneità della tassonomia, il fatto di avere un dump del database che permetta una relativa limitazione delle risorse computazionali (l intera tassonomia è disponibile in meno di 2 GB di dati) ne facilita l analisi e l elaborazione della struttura. Questo è dato dal fatto di avere nel database solo i link di ogni pagina Web; se da un lato potrebbe risultare uno svantaggio, in realtà, volendo estrarre una sotto-tassonomia da DMOZ, è più semplice avere a disposizione soltanto i link, in quanto l accesso e l elaborazione della struttura comporta un minore sforzo in termini di risorse e tempi computazionali. Il primo passo è stato quello di scegliere l insieme delle classi foglia. Il lavoro è stato in prevalenza manuale; l analisi la struttura DMOZ e la scelta delle classi è avvenuta in maniera totalmente manuale. Le classi foglia scelte, vista la struttura non omogenea della tassonomia, ha comportato il fatto di scegliere in prevalenza dei nodi intermedi della tassonomia originale, in quanto, oltre l elevata profondità per le foglie di DMOZ, si ha la criticità di non avere sufficienti per ogni foglia (la maggior parte delle foglie di DMOZ, avendo un elevato grado di specificità, contiene pochi ). Per tale motivo, i di ciascuna classe foglia scelta sono risultanti dell unione dei totali contenuti nel sotto-albero risultante per ogni classe. Una volta scelta la struttura tassonomica, per ogni documento considerato, il quale nel database è caratterizzato da un link, è stata scaricata la pagina relativa (è stato implementato un semplice script per fare il parsing della pagina web); dal codice HTML si è recuperato il contenuto testuale. Le pagine non più attive e quelle con scarso contenuto testuale sono state eliminate. Da ogni pagina è stato rimosso il rumore (tag, metadati, link). Il report D3.4a descrive nel detaglio il dataset utilizzato per le sperimentazioni. 7

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

Moodle al Formez, Imma Citarelli

Moodle al Formez, Imma Citarelli Moodle al Formez Dott.ssa Imma Citarelli Formez - Centro di Formazione e Studi Centro di competenza e-learning e Knowledge management Apprendimento autonomo Libri, riviste, convegni Risorse on line Il

Dettagli

Cataloghi per i dati aperti

Cataloghi per i dati aperti Cataloghi per i dati aperti Questo materiale didattico è stato realizzato da Formez PA nel Progetto PerformancePA, Ambito A Linea 1, in convenzione con il Dipartimento della Funzione Pubblica, organismo

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

Per siti più strutturati le informazioni sono mantenute mediante particolari organizzazioni di dati: human-powered directories

Per siti più strutturati le informazioni sono mantenute mediante particolari organizzazioni di dati: human-powered directories Motori di ricerca Search Non confondiamo i motori di ricerca (search engine) con le funzioni di ricerca all interno dei siti. Le funzioni di ricerca all interno sono in genere costituite da script che

Dettagli

Information Literacy

Information Literacy Information Literacy Oggi ci sono molte risorse a disposizione per lo studio dell ingegneria, per questo è importante saperle utilizzare con discrezionalità per essere certi di aver fatto un lavoro di

Dettagli

I MOTORI DI RICERCA motori di ricerca. motori di ricerca per termini motori di ricerca sistematici

I MOTORI DI RICERCA motori di ricerca. motori di ricerca per termini motori di ricerca sistematici I MOTORI DI RICERCA Il numero di siti Internet è infinito e ormai ha raggiunto una crescita esponenziale; inoltre, ogni sito è costituito da diverse pagine, alcune volte centinaia, e individuare un informazione

Dettagli

Cataloghi per i dati aperti

Cataloghi per i dati aperti Progetto PerformancePA Ambito A - Linea 1 - Una rete per la riforma della PA Cataloghi per i dati aperti Autore: Vincenzo Patruno Creatore: Formez PA, Progetto Performance PA Diritti: Dipartimento della

Dettagli

Internet e Storia. Internet. INTERNET, uno strumento per la didattica della storia

Internet e Storia. Internet. INTERNET, uno strumento per la didattica della storia INTERNET, uno strumento per la didattica della storia Internet e Storia Internet Internet è come la più grande rete mondiale ed anche detta rete delle reti che collega centinaia di milioni di computer.

Dettagli

Introduzione a Internet e al World Wide Web

Introduzione a Internet e al World Wide Web Introduzione a Internet e al World Wide Web Una rete è costituita da due o più computer, o altri dispositivi, collegati tra loro per comunicare l uno con l altro. La più grande rete esistente al mondo,

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testuali Il text mining: una definizione Data mining per dati destrutturati ovvero documenti codificati in linguaggio

Dettagli

www.culturaitalia.it CULTURAITALIA UN PATRIMONIO DA ESPLORARE Ministero per i beni e le attività culturali

www.culturaitalia.it CULTURAITALIA UN PATRIMONIO DA ESPLORARE Ministero per i beni e le attività culturali www.culturaitalia.it CULTURAITALIA UN PATRIMONIO DA ESPLORARE CulturaItalia Presentazione del Portale della Cultura italiana 2 CulturaItalia CulturaItalia è il primo portale in Italia ad offrire un punto

Dettagli

SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data

SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data Roberto delle Donne (Università degli Studi di Napoli Federico II) Tiziana Possemato (@Cult) SHARE Scholarly Heritage and Access to Research

Dettagli

Ministerial NEtwoRk for Valorising Activities in digitisation. Museo & Web CMS Una piattaforma open source per la gestione di siti web accessibili

Ministerial NEtwoRk for Valorising Activities in digitisation. Museo & Web CMS Una piattaforma open source per la gestione di siti web accessibili Ministerial NEtwoRk for Valorising Activities in digitisation Museo & Web CMS Una piattaforma open source per la gestione di siti web accessibili Il passo successivo: Museo & Web CMS Piattaforma opensource

Dettagli

Servizi di ricerca nel Web (Web search)

Servizi di ricerca nel Web (Web search) Servizi di ricerca nel Web (Web search) Generalità Introduzione Il web è il più grande database mondiali di contenuti. É un contenitore di informazioni che vengono pubblicate, modificate, cancellate, inserite

Dettagli

Alfresco ECM. La gestione documentale on-demand

Alfresco ECM. La gestione documentale on-demand Alfresco ECM La gestione documentale on-demand Alfresco 3.2 La gestione documentale on-demand Oltre alla possibilità di agire sull efficienza dei processi, riducendone i costi, è oggi universalmente conosciuto

Dettagli

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web Il World Wide Web Il Web Claudio Fornaro ver. 1.3 1 Il World Wide Web (ragnatela di estensione mondiale) o WWW o Web è un sistema di documenti ipertestuali collegati tra loro attraverso Internet Attraverso

Dettagli

Question Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes

Question Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes Question Answering e semantica Tecnologie emergenti per le imprese Cos è QuestIT? QuestIT nasce nell ambito di attività di ricerca in Intelligenza Artificiale presso il Dipartimento di Ingegneria dell

Dettagli

Formazione sistema editoriale CMS

Formazione sistema editoriale CMS Ufficio Società dell'informazione Nome del Progetto Acronimo del Progetto Formazione sistema editoriale CMS Documento Data di stesura Maggio 2010 Versione 1.2 Sommario 1 Scopo... 3 2 Campo di applicazione...

Dettagli

Vision. highlights. la soddisfazione di ampliare i confini dell azienda. Un portale che fa!

Vision. highlights. la soddisfazione di ampliare i confini dell azienda. Un portale che fa! la soddisfazione di ampliare i confini dell azienda Un portale che fa! Il portale aziendale è un luogo di lavoro. Gemino è un Portal Application ricco di contenuti applicativi pronti all uso! highlights

Dettagli

Allegato A REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA)

Allegato A REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) Allegato A REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO

Dettagli

Laboratorio di Informatica

Laboratorio di Informatica Laboratorio di Informatica Introduzione al Web WWW World Wide Web CdL Economia A.A. 2012/2013 Domenica Sileo Università degli Studi della Basilicata Introduzione al Web : WWW >> Sommario Sommario 2 n World

Dettagli

Dove iniziare la ricerca bibliografica

Dove iniziare la ricerca bibliografica Information Literacy Oggi ci sono molte risorse a disposizione per lo studio dell ingegneria, per questo è importante saperle utilizzare con discrezionalità per essere certi di aver fatto un lavoro di

Dettagli

La gestione del documento

La gestione del documento Operatore giuridico d impresa Informatica Giuridica A.A 2002/2003 II Semestre La gestione del documento prof. Monica Palmirani Il documento A differenza del dato il documento è solitamente un oggetto non

Dettagli

Whorkshop luglio 2015

Whorkshop luglio 2015 Whorkshop luglio 2015 Argomenti dell evento Privacy e dematerializzazione 1/21 www.ambrostudio.it Perché la Privacy e la dematerializzazione? Cambia l atteggiamento nella gestione dei documenti E più un

Dettagli

Le dipendenze in rete

Le dipendenze in rete Le dipendenze in rete Guida all utilizzo di risorse, banche dati e siti web di qualità nel campo delle dipendenze patologiche La documentazione sulle dipendenze patologiche: dalla ReteCedro una proposta

Dettagli

Tassonomia Web Spam GIUGNO 2005

Tassonomia Web Spam GIUGNO 2005 Prefazione: Questo documento si basa sull originale Web Spam Taxonomy firmato da alcuni ricercatori del dipartimento di Computer Science della Stanford University e pubblicato ad Aprile 2005. Tassonomia

Dettagli

STATO delle ATTIVITA del GRUPPO di LAVORO per L INFORMATIZZAZIONE dei PRODOTTI in AMBIENTE GIS

STATO delle ATTIVITA del GRUPPO di LAVORO per L INFORMATIZZAZIONE dei PRODOTTI in AMBIENTE GIS STATO delle ATTIVITA del GRUPPO di LAVORO per L INFORMATIZZAZIONE dei PRODOTTI in AMBIENTE GIS Pierluigi CARA, Maurizio PIGNONE Convegno finale Progetti S Bologna, 4-5 giugno 2015 1 premessa L Allegato

Dettagli

Proposta App Smartphone e Tablet per Ufficio Concorsi Polizia di Stato

Proposta App Smartphone e Tablet per Ufficio Concorsi Polizia di Stato Proposta App Smartphone e Tablet per Ufficio Concorsi Polizia di Stato Indice App to you Introduzione Requisiti Funzionali Casi d uso Architettura SOA Proposte Dispositivi Supportati L App News Concorsi

Dettagli

Tilde WCM. Data. Moduli base. Versione 1.0. 29 Settembre 2011. giovedì 29 settembre 11

Tilde WCM. Data. Moduli base. Versione 1.0. 29 Settembre 2011. giovedì 29 settembre 11 Tilde WCM Moduli base Versione 1.0 29 Settembre 2011 Data IL CMS TILDE Il CMS o Content Management System, è lo strumento maggiormente utilizzato in qualsiasi progetto web. Ormai viene attivato su qualsiasi

Dettagli

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,

Dettagli

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE di K A T H A G E D O R N, A R G U S A S S O C I A T E S MARZO 2 0 0 0 traduzione di: BARBARA WIEL MARIN DICEMBRE 2009 1 GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

Dettagli

Le informazioni. Fondamenti di informatica. I documenti. Information retrieval. Information retrieval. Ricerche alternative 19/02/2015

Le informazioni. Fondamenti di informatica. I documenti. Information retrieval. Information retrieval. Ricerche alternative 19/02/2015 Fondamenti di informatica Appunti sulla ricerca di informazioni per le scienze umane dal capitolo 8 del testo: M. Lazzari, Informatica umanistica, McGraw-Hill, 2014 Marco Lazzari Le informazioni 1. letteratura

Dettagli

Un portale per l editoria medico-scientifica italiana

Un portale per l editoria medico-scientifica italiana Un portale per l editoria medico-scientifica italiana [22.11.2005] doi: 10.1389/DBmed1 Il progetto si propone come risultato la creazione di una banca dati bibliografica - accessibile via Web - su contenuti

Dettagli

Lezione 8. Motori di Ricerca

Lezione 8. Motori di Ricerca Lezione 8 Motori di Ricerca Basi di dati Un campo prevalente dell applicazione informatica è quello costituito dall archiviazione e dalla gestione dei dati (basi di dati). Sistema Informativo. Un sistema

Dettagli

I MOTORI DI RICERCA (I Parte)

I MOTORI DI RICERCA (I Parte) Introduzione I MOTORI DI RICERCA (I Parte) Una delle cose più incredibili che possiamo affermare riguardo ad Internet è che possiamo trovarci veramente di tutto. Qualsiasi argomento che ci viene in mente

Dettagli

WWW.ICTIME.ORG. Introduzione al SEO. Cimini Simonelli Testa

WWW.ICTIME.ORG. Introduzione al SEO. Cimini Simonelli Testa WWW.ICTIME.ORG Introduzione al SEO Cimini Simonelli Testa v.1 28 Gennaio 2008 Cecilia Cimini Angelo Simonelli Francesco Testa Introduzione al SEO EDIZIONE Gennaio 2008 Questo manuale utilizza la Creative

Dettagli

Archiviazione dei siti delle istituzioni europee

Archiviazione dei siti delle istituzioni europee Archiviazione dei siti delle istituzioni europee Il progetto pilota degli Archivi storici dell Unione europea tra principi e realizzazione corso ANAI, 18-19 maggio 2015 Leggero, trasparente, permanente

Dettagli

COMUNE DI BOVEZZO Provincia di Brescia

COMUNE DI BOVEZZO Provincia di Brescia COMUNE DI BOVEZZO Provincia di Brescia REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) INDICE Pagina TITOLO I Disposizioni Generali

Dettagli

Capitolo 5. Cercare informazioni sul Web

Capitolo 5. Cercare informazioni sul Web Capitolo 5 Cercare informazioni sul Web Cercare nel posto giusto Posti logici e noti per reperire informazioni sui nostri contributi pensionistici, chiediamo all INPS Biblioteche on-line La maggior parte

Dettagli

Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design

Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design Dipartimento INDACO Facoltà del Design - III Facoltà d Architettura Politecnico di Milano Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design

Dettagli

Su Internet, oggi, se il vostro sito Web non è dotato di funzionalità ricche o contenuti. I sistemi CMS e un introduzione a Joomla! In questo capitolo

Su Internet, oggi, se il vostro sito Web non è dotato di funzionalità ricche o contenuti. I sistemi CMS e un introduzione a Joomla! In questo capitolo 1 I sistemi CMS e un introduzione a Joomla! In questo capitolo Su Internet, oggi, se il vostro sito Web non è dotato di funzionalità ricche o contenuti aggiornati, è svantaggiato. L idea di potenziare

Dettagli

Comune di Lograto. Provincia di Brescia

Comune di Lograto. Provincia di Brescia Comune di Lograto Provincia di Brescia REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) (approvato con la deliberazione del Consiglio

Dettagli

Sommario [1/2] Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali

Sommario [1/2] Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali Introduzione alle Biblioteche Digitali Sommario [1/2] Cenni storici Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali Cos è una Biblioteca

Dettagli

GOOGLE, WIKIPEDIA E VALUTAZIONE SITI WEB. A cura delle biblioteche Umanistiche e Giuridiche

GOOGLE, WIKIPEDIA E VALUTAZIONE SITI WEB. A cura delle biblioteche Umanistiche e Giuridiche GOOGLE, WIKIPEDIA E VALUTAZIONE SITI WEB A cura delle biblioteche Umanistiche e Giuridiche ISTRUZIONI PER Usare in modo consapevole i motori di ricerca Valutare un sito web ed utilizzare: Siti istituzionali

Dettagli

Internet e World Wide Web

Internet e World Wide Web Alfonso Miola Internet e World Wide Web Dispensa C-02 Settembre 2005 1 Nota bene Il presente materiale didattico è derivato dalla dispensa prodotta da Luca Cabibbo Dip. Informatica e Automazione Università

Dettagli

Corso di Sistemi di Elaborazione delle informazioni

Corso di Sistemi di Elaborazione delle informazioni Corso di Sistemi di Elaborazione delle informazioni Reti di Calcolatori Francesco Fontanella Il DNS Gli indirizzi IP sono in formato numerico: sono difficili da ricordare; Ricordare delle stringhe di testo

Dettagli

Il Geoportale dei Progetti Sismologici DPC-INGV 2012-2013

Il Geoportale dei Progetti Sismologici DPC-INGV 2012-2013 Il Geoportale dei Progetti Sismologici DPC-INGV 2012-2013 AUTORI Maurizio Pignone - Istituto Nazionale di Geofisica e Vulcanologia - maurizio.pignone@ingv.it Pierluigi Cara - Dipartimento della Protezione

Dettagli

roberto.albiero@cnr.it

roberto.albiero@cnr.it 2.2 Gestione dei file 2.2.1 Concetti fondamentali Un file (termine inglese che significa archivio) è un insieme di informazioni codificate ed organizzate come una sequenza di byte; queste informazioni

Dettagli

Corso Creare Siti WEB

Corso Creare Siti WEB Corso Creare Siti WEB INTERNET e IL WEB Funzionamento Servizi di base HTML CMS JOOMLA Installazione Aspetto Grafico Template Contenuto Articoli Immagini Menu Estensioni Sito di esempio: Associazione LaMiassociazione

Dettagli

Search Engine Optimization per Calciomercato.it

Search Engine Optimization per Calciomercato.it www.mamadigital.com Search Engine Optimization per Calciomercato.it Mamadigital srl - Sede legale e operativa: Via Conegliano, 18-00182 Roma C.F. e P. iva 09738901009 Phone: +39 0670614560 Fax: +39 0670391132

Dettagli

Open Access e ruolo delle University Press

Open Access e ruolo delle University Press WorkShop Bibliosan 2013 Ricerca biomedica e pubblicazione dei risultati: la sostenibilità dell Open Access Open Access e ruolo delle University Press Fulvio Guatelli fulvio.guatelli@unifi.it Firenze University

Dettagli

COMUNE DI BARASSO (Provincia di Varese)

COMUNE DI BARASSO (Provincia di Varese) COMUNE DI BARASSO (Provincia di Varese) Approvate con delibera della Giunta Comunale n.30 del 18.05.2015 Linee guida per la disciplina di accesso e riutilizzo delle banche dati (open data) Redatte ai sensi

Dettagli

CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE

CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE A cura di Massimiliano Navacchia http://www.navacchia.it/ info@navacchia.it - cell. (+39) 3394676518

Dettagli

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire La società Volocom Trasformare le informazioni in conoscenza 2 La società Volo.com dal 2001 è uno dei leader nei settori del Knowledge Management e nella gestione delle informazioni per la rassegna stampa

Dettagli

Archivio OnLine. Versione Professionale - DNA PRO 3.0

Archivio OnLine. Versione Professionale - DNA PRO 3.0 Cos è Archivio OnLine di Theo Multimedia è una Banca Dati accessibile e aggiornabile via web. La struttura è quella di uno schedario elettronico: i s presenti sono schede singole, suddivise e ordinate

Dettagli

PROVINCIA DI FORLI'-CESENA RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA)

PROVINCIA DI FORLI'-CESENA RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) PROVINCIA DI FORLI'-CESENA REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) Approvato con Delibera di G.P. n. 141775/456 del 06/12/2013

Dettagli

Evoluzione del Web: Dal Web 1.0 al Web 2.0

Evoluzione del Web: Dal Web 1.0 al Web 2.0 Evoluzione del Web: Dal Web 1.0 al Web 2.0 1 Web 1.0 Siti e portali con contenuti prodotti dal publisher Organizzazione gerarchica dell informazione e navigazione attraverso menu Data base Interazione

Dettagli

Architettura dell informazione. Sistemi di ricerca

Architettura dell informazione. Sistemi di ricerca Architettura dell informazione Sistemi di ricerca Sistemi di ricerca Il sistema di ricerca è un elemento centrale della navigazione supplementare. La ricerca è uno degli strumenti preferiti dagli utenti

Dettagli

Un po di storia: la rete

Un po di storia: la rete Gabriella Pasi Università degli Studi di Milano Bicocca Il Web e i Motori di ricerca Un po di storia: la rete Metà degli anni 60: nasce ARPANET Fine anni 60: standardizzazione dei protocolli Anni 70: la

Dettagli

TRAME :: web 2.0 e archivi digitali

TRAME :: web 2.0 e archivi digitali TRAME :: web 2.0 e archivi digitali Gianni Corino - Andrea Bottino Politecnico di Torino Trame Tecnologie e ambienti di rete per la memoria culturale del XXI secolo Progetto PRIN biennale (2005-2007) cofinanziato

Dettagli

Content Development e Open Source Pierluigi Boda Università La Sapienza di Roma

Content Development e Open Source Pierluigi Boda Università La Sapienza di Roma Content Development e Open Source Università La Sapienza di Roma Contenuti: Cos è il content management Aspetti critici nello sviluppo dei CMS Opzioni tecnologiche per il CM Peculiarità dell opzione open

Dettagli

Conoscere per agire. L azienda Volocom

Conoscere per agire. L azienda Volocom L azienda Volocom 2 La società Volocom Volocom dal 2001 è uno dei leader nei settori del Knowledge Management e nella Gestione delle Informazioni per la Rassegna Stampa Multimediale. Volocom ha sottoscritto

Dettagli

Digital Archive and Gov t Content Management

Digital Archive and Gov t Content Management Digital Archive and Gov t Content Management IBM CoC Solutions 20012 IBM Corporation IBM Digital Archive & Govt Content Management Exec Summary La soluzione è stata sviluppata da IBM in collaborazione

Dettagli

Spettabile. Termine attività PREMESSA

Spettabile. Termine attività PREMESSA Spettabile Ogetto: Regione Lazio - Bando per l educazione permanente degli adulti. Misura 1.a di Sistema. Delibera Giunta Regionale n. 30 dell 11/01/2001 - (Pubblicato nel BUR Lazio n.5 del 20 febbraio

Dettagli

Compilare e gestire bibliografie: i software gratuiti. a cura di Laura Perillo Sistema Bibliotecario di Ateneo Agg. ottobre 2014

Compilare e gestire bibliografie: i software gratuiti. a cura di Laura Perillo Sistema Bibliotecario di Ateneo Agg. ottobre 2014 Compilare e gestire bibliografie: i software gratuiti a cura di Laura Perillo Sistema Bibliotecario di Ateneo Agg. ottobre 2014 I software per la gestione di bibliografie Chiamati reference managers o

Dettagli

Motori di Ricerca. Vale a dire: ci sono troppe informazioni, il problema è trovarle!

Motori di Ricerca. Vale a dire: ci sono troppe informazioni, il problema è trovarle! Motori di Ricerca "La Rete Internet equivale all unificazione di tutte le biblioteche del mondo, dove però qualcuno si è divertito a togliere tutti i libri dagli scaffali". Vale a dire: ci sono troppe

Dettagli

informarisorse IEEE/IET Electronic Library InFormare sull uso delle risorse elettroniche Risorse specialistiche. Politecnico

informarisorse IEEE/IET Electronic Library InFormare sull uso delle risorse elettroniche Risorse specialistiche. Politecnico informarisorse InFormare sull uso delle risorse elettroniche IEEE/IET Electronic Library Risorse specialistiche. Politecnico informarisorse InFormaRisorse informa è il nuovo servizio del Sistema bibliotecario

Dettagli

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da

Dettagli

GROUP POLICY MANAGEMENT CONSOLE (ACTIVE DIRECTORY)

GROUP POLICY MANAGEMENT CONSOLE (ACTIVE DIRECTORY) Date: 29/01/2013 Procedure: (Active Directory) Source: LINK Permalink: LINK Created by: HeelpBook Staff Document Version: 1.0 GROUP POLICY MANAGEMENT CONSOLE (ACTIVE DIRECTORY) Microsoft (GPMC) è un nuovo

Dettagli

Progetti di cooperazione internazionale e nazionale per la catalogazione e la riproduzione digitale

Progetti di cooperazione internazionale e nazionale per la catalogazione e la riproduzione digitale Progetti di cooperazione internazionale e nazionale per la catalogazione e la riproduzione digitale Rossella Caffo Direttore Istituto centrale per il catalogo unico delle biblioteche italiane Milano, 14

Dettagli

EXPLOit Content Management Data Base per documenti SGML/XML

EXPLOit Content Management Data Base per documenti SGML/XML EXPLOit Content Management Data Base per documenti SGML/XML Introduzione L applicazione EXPLOit gestisce i contenuti dei documenti strutturati in SGML o XML, utilizzando il prodotto Adobe FrameMaker per

Dettagli

WEB Information Retrieval

WEB Information Retrieval WEB Information Retrieval Materiale tratto dal corso di Gabriella Pasi Materiale tratto da cap. 13 Modern Information Retrieval by Ricardo Baeza-Yates and Berthier Ribeiro-Neto http://www.sims.berkeley.edu/~hearst/irbook/

Dettagli

Guida all uso dei Focus Tematici

Guida all uso dei Focus Tematici Guida all uso dei Focus Tematici Versione 1.0 Gennaio 2014 Focus Tematici La rete per l innovazione nella Pubblica Amministrazione Italiana Cos è un focus tematico Creazione di un Focus Tematico Di quali

Dettagli

Open DB 1.3 Ambiente di sviluppo per Progetti di Business Intelligence

Open DB 1.3 Ambiente di sviluppo per Progetti di Business Intelligence Open DB 1.3 Ambiente di sviluppo per Progetti di Business Intelligence Il modo più semplice per trovare, elaborare, consuntivare e stampare in forma efficace i dati. (Ovvero: come creare un report per

Dettagli

Strumenti e tecnologie per il web Gianluca Merlo 28/10/2014. https://www.flickr.com/photos/kalexanderson/52773348

Strumenti e tecnologie per il web Gianluca Merlo 28/10/2014. https://www.flickr.com/photos/kalexanderson/52773348 Strumenti e tecnologie per il web Gianluca Merlo 28/10/2014 https://www.flickr.com/photos/kalexanderson/52773348 https://www.flickr.com/photos/81171474@n06/7437936 Internet vs Web. Quale differenza? https://www.flickr.com/photos/pocphotography/12462536895/sizes/l

Dettagli

2.1 Introduzione ai linguaggi di marcatura

2.1 Introduzione ai linguaggi di marcatura Fondamenti di Informatica Sistemi di Elaborazione delle Informazioni Informatica Applicata 2.1 Introduzione ai linguaggi di marcatura Antonella Poggi Anno Accademico 2012-2013 DIPARTIMENTO DI SCIENZE DOCUMENTARIE

Dettagli

Presentazione funzionale. (utente redattore) Portale SPORVIC

Presentazione funzionale. (utente redattore) Portale SPORVIC TD Group S.p.A. www.tdgroup.it Presentazione funzionale (utente redattore) Portale SPORVIC TD Group S.p.A. Via del Fischione, 19 56019 Vecchiano - Migliarino P. (PI) Tel. (+39) 050.8971 Fax (+39) 050.897

Dettagli

MetaLib+ l evoluzione del servizio e il valore aggiunto di Primo Central

MetaLib+ l evoluzione del servizio e il valore aggiunto di Primo Central MetaLib+ l evoluzione del servizio e il valore aggiunto di Primo Central Convegno Itale Trieste, 30 Marzo 2012 Liliana Morotti - General Manager Ex Libris Italy Che cos è MetaLib+ E una versione light

Dettagli

*** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. ***

*** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. *** *** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. *** PREFAZIONE Questo progetto nasce perchè mi sono reso conto dell'importanza che i motori di ricerca hanno su Internet. Internet rappresenta

Dettagli

Breve descrizione del prodotto

Breve descrizione del prodotto Breve descrizione del prodotto 1. Il software AquaBrowser Library...2 1.1 Le funzioni di Search Discover Refine...3 1.2 Search: la funzione di ricerca e di presentazione dei risultati...3 1.2.1 La configurazione

Dettagli

Sistemi Informativi e WWW

Sistemi Informativi e WWW Premesse Sistemi Informativi e WWW WWW: introduce un nuovo paradigma di diffusione (per i fornitori) e acquisizione (per gli utilizzatori) delle informazioni, con facilità d uso, flessibilità ed economicità

Dettagli

Data mining. Vincenzo D Elia. vincenzo.delia@polito.it. DBDMG - Politecnico di Torino

Data mining. Vincenzo D Elia. vincenzo.delia@polito.it. DBDMG - Politecnico di Torino Data mining Vincenzo D Elia vincenzo.delia@polito.it DBDMG - Politecnico di Torino vincenzo.delia@polito.it Archivi Multimediali e Data Mining - p. 1 Rapid Miner vincenzo.delia@polito.it Archivi Multimediali

Dettagli

Applicazione: DoQui/Index - Motore di gestione dei contenuti digitali

Applicazione: DoQui/Index - Motore di gestione dei contenuti digitali Riusabilità del software - Catalogo delle applicazioni: Applicativo verticale Applicazione: DoQui/Index - Motore di gestione dei contenuti digitali Amministrazione: Regione Piemonte - Direzione Innovazione,

Dettagli

E-Shop/X4Shop : interfaccia IceCat the opencatalog

E-Shop/X4Shop : interfaccia IceCat the opencatalog E-Shop/X4Shop : interfaccia IceCat the opencatalog La presente guida illustra le corrette modalità di utilizzo delle procedure incluse nel Programma E-Shop/X4- Shop per accedere alle funzioni offerte dal

Dettagli

LA SOLUZIONE PER LA GESTIONE DINAMICA DELLE INFORMAZIONI IN UN PORTALE

LA SOLUZIONE PER LA GESTIONE DINAMICA DELLE INFORMAZIONI IN UN PORTALE LA SOLUZIONE PER LA GESTIONE DINAMICA DELLE INFORMAZIONI IN UN PORTALE WEBVISION APPARTIENE ALLA FAMIGLIA DEI CONTENT MANAGEMENT SYSTEM PER LA GESTIONE DINAMICA DELLE INFORMAZIONI E DEL LORO LAYOUT ALL

Dettagli

Librerie digitali. Introduzione. Cos è una libreria digitale?

Librerie digitali. Introduzione. Cos è una libreria digitale? Librerie digitali Introduzione Cos è una libreria digitale? William Arms "An informal definition of a digital library is a managed collection of information, with associated services, where the information

Dettagli

Capitolo 4 Pianificazione e Sviluppo di Web Part

Capitolo 4 Pianificazione e Sviluppo di Web Part Capitolo 4 Pianificazione e Sviluppo di Web Part Questo capitolo mostra come usare Microsoft Office XP Developer per personalizzare Microsoft SharePoint Portal Server 2001. Spiega come creare, aggiungere,

Dettagli

MANUALE DI UTILIZZO: INTRANET PROVINCIA DI POTENZA

MANUALE DI UTILIZZO: INTRANET PROVINCIA DI POTENZA MANUALE DI UTILIZZO: INTRANET PROVINCIA DI POTENZA Fornitore: Publisys Prodotto: Intranet Provincia di Potenza http://www.provincia.potenza.it/intranet Indice 1. Introduzione... 3 2. I servizi dell Intranet...

Dettagli

e i risultati dell indagine sugli archivi

e i risultati dell indagine sugli archivi Archivi aperti e istituzionali: il progetto DSpace ISS e i risultati dell indagine sugli archivi itit istituzionali i lidegli liirccs oncologici iitaliani i Elisabetta Poltronieri Istituto SuperiorediSanità.

Dettagli

Opendoc DLS Digital Library System

Opendoc DLS Digital Library System Opendoc DLS Digital Library System Opendoc DLS - Digital Library System Chi siamo Opendoc Srl è una società milanese nata a seguito di un'importante esperienza per il Ministero per i Beni e le Attività

Dettagli

Corso di Alfabetizzazione Informatica

Corso di Alfabetizzazione Informatica Corso di Alfabetizzazione Informatica Lezione 6 a.a. 2010/2011 Francesco Fontanella La Complessità del Hardware Il modello di Von Neumann è uno schema di principio. Attualmente in commercio esistono: diversi

Dettagli

Che cos'è e come funziona un motore di ricerca

Che cos'è e come funziona un motore di ricerca Che cos'è e come funziona un motore di ricerca Un motore di ricerca è un sistema automatico che analizza un insieme di dati raccolti e restituisce un indice dei contenuti disponibili, classificandoli in

Dettagli

Software Educativo Equo e Solidale

Software Educativo Equo e Solidale Software Educativo Equo e Solidale CIES - Lynx Versione febbraio 2007 IN SINTESI: questo progetto mira a applicare concetti e metodi ormai consolidati dal settore del Commercio Equo e Solidale ad un campo

Dettagli

Algoba Systems a sfruttare al meglio e a condividere le risorse digitali a loro disposizione Orphea Studio

Algoba Systems a sfruttare al meglio e a condividere le risorse digitali a loro disposizione Orphea Studio Da oltre 15 anni, Algoba Systems aiuta i suoi clienti a sfruttare al meglio e a condividere le risorse digitali a loro disposizione con Orphea Studio, la soluzione per la gestione delle risorse digitali

Dettagli

L architettura del sistema può essere schematizzata in modo semplificato dalla figura che segue.

L architettura del sistema può essere schematizzata in modo semplificato dalla figura che segue. Il software DigitalRepository/AMBiblioweb (DRBW) è un sistema di gestione completo per repository digitali implementato secondo lo standard MAG 2.0 e successive revisioni, in accordo con il modello OAIS.

Dettagli

Data Warehousing e Data Mining

Data Warehousing e Data Mining Università degli Studi di Firenze Dipartimento di Sistemi e Informatica A.A. 2011-2012 I primi passi Data Warehousing e Data Mining Parte 2 Docente: Alessandro Gori a.gori@unifi.it OLTP vs. OLAP OLTP vs.

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello della Web Application 5 3 Struttura della web Application 6 4 Casi di utilizzo della Web

Dettagli

Un motore di ricerca per i siti web della PA italiana. GooglePA, un motore di ricerca per i siti web della PA italiana

Un motore di ricerca per i siti web della PA italiana. GooglePA, un motore di ricerca per i siti web della PA italiana PA Un motore di ricerca per i siti web della PA italiana Roma, 19 maggio 2010 Cos è GooglePA GooglePa è una personalizzazione di Google realizzata con Google ricerca personalizzata Cerca solo tra le pagine

Dettagli

Specifica Tecnica. Migrazione a Plone del portale del Comune di Macerata.

Specifica Tecnica. Migrazione a Plone del portale del Comune di Macerata. Specifica Tecnica. Migrazione a Plone del portale del Comune di Macerata. autori Gruppo di lavoro versione documento Indice. Obiettivo. Architettura Informativa. Amministrazione Trasparente. Articolazione

Dettagli