Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web"

Transcript

1 Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web 16 febbraio 2015 Indice 1 Individuazione dei dataset 1 2 Dataset Repositories Dataset più Rilevanti Web Directories Selezione dei Dataset Analisi delle caratteristiche dei dataset disponibili Scelta del Dataset Individuazione dei dataset Il documento è preposto a riportare l analisi dei dataset disponibili per l addestramento e la convalida del sistema riguardanti l ambito Web. Verranno descritte e analizzate le varie risorse e in base a tali considerazioni viene motivata la scelta dei dataset adottati per le sperimentazioni. i dataset di interesse per il progetto sono quelli aventi dati di tipo testuale; in particolare, le sperimentazioni in questione riguardano la generazione e convalida di una tassonomia a partire da di tipo testuale in ambito Web. Tali pertanto dovranno essere costituiti da contenuto testuale estratto da pagine Web o newsgroup. Attualmente diversi dataset sono reperibili gratuitamente dal web; di seguito riportiamo una descrizione generale delle varie risorse di possibile interesse. 2 Dataset Repositories Esistono attualmente diversi repository in cui si possono reperire i dataset necessari. Il repository è un archivio digitale che esporre i dati, preservandoli in modo che siano sempre disponibili nel corso del tempo, migrandoli nel caso cambino i formati e i supporti. Si possono scegliere quali permessi dare a chi utilizza i dati attraverso la licenza. In genere si usano licenze Creative Commons 1 che obbligano a citare chi ha prodotto i dati. Tra i vari repository, i più 1 https://creativecommons.org/ 1

2 completi e diffusi nella comunità scientifica in ambito di machine learning sono descritti di seguito. UCI Machine Learning Repository 2. Inizialmente creato da ricercatori e studenti dell università della California-Irvine come archivio ftp, e attualmente gestito in collaborazione con l università del Massachusetts Amherst, il repository UCI fornisce alcuni dei più diffusi dataset in diversi settori del machine learning, fornendo dati sia di tipo nominale che numerico, per sistemi e algoritmi di classificazione, clustering, regressione etc. Linked Data 3. In informatica, i linked data costituiscono una modalità di pubblicazione, condivisione e connessione di dati strutturati e collegati tra loro. Il portale LinkedData fornisce diversi dataset relativi a tale tipologia di dati alla comunità scientifica. CKAN 4. E un catalogo gestito da una community specifica (formata da organi istituzionali, centri di ricerca, dipartimenti universitari etc.) che contiene dataset utili reperibili in Internet con licenze open source. Yahoo! Webscope 5. La nota società Yahoo! 6 mette a disposizione della comunità scientifica diversi dataset creati dai propri ricercatori o in alcuni casi collezionati dalle attività degli utenti del portale. TREC Datasets 7. Contiene i dataset (la maggior parte a pagamento) messi a disposizione dal NIST 8 (National Institute of Standards and Technology) durante le varie edizioni di una serie di conferenze scientifiche (TREC: Text REtrieval Conference) nell ambito dei settori in cui il focus è sull elaborazione di testuali. L idea principale era fornire una serie di dataset standard per le varie pubblicazioni del convegno, in modo da poter fornire alla comunità un supporto di confronto tra i vari algoritmi, sistemi, metodi, etc. 2.1 Dataset più Rilevanti Di seguito elenchiamo i dataset più diffusi disponibili in ambito della categorizzazione di testi, e che potrebbero risultare di interesse per le sperimentazioni del progetto. Sono stati considerati in questo elenco i dataset aventi un appropriato numero di categorie e di. Reuters Dataset 9. Attualmente uno dei dataset reali più utilizzati nel campo della classificazione di testi. E una collezione di articoli web collezionati dal sito di news della società Reuters Ltd. and Carnegie Group. Ogni articolo è stato manualmente etichettato secondo una struttura gerarchica di categorie. Una delle prime versioni

3 (denominata Reuters-21578), resa disponibile nei primi anni 90, è stata la risorsa di riferimento per le sperimentazioni su algoritmi e sistemi di elaborazione di testuali. La collezione contiene circa Nel 2000 è stata rilasciata una versione più estesa (denominata RCV1 per la versione contenente articoli in lingua inglese, e RCV2 per la collezione multilingua), contenente circa 1 milione di articoli. OHSUMED 10. E un set di formati da titoli e abstract di pubblicazioni scientifiche in ambito medico. I circa sono classificati secondo una strutture gerarchica aventi circa nodi. 20 Newsgroups 11. Una serie di articoli (circa 20000) estratti da 20 newsgroup. Un newsgroup è uno degli spazi virtuali creato su una rete di server interconnessi per discutere di un argomento (topic) ben determinato. Le 20 categorie sono spesso viste in una struttura gerarchica, in quanto alcune classi sono sotto-categorie di un topic più generale. BankSearch 12. E una collezione di pagine web categorizzate in 11 categorie, per un totale di circa pagine. Le categorie e le pagine sono estratte dalla web directory DMOZ (vedi sezione 2.2). Common Crawl Corpus 13. Contiene circa 5 milioni di pagine collezionate dai crawler di Amazon. I dataset sono reperibili gratuitamente, anche se la loro elaborazione richiede risorse computazionali elevate (pochi file di dimensione spesso superiori al GB). Amazon mette a disposizione, a pagamento, un servizio web atto all elaborazione con sistemi distribuiti (Amazon Elastic MapReduce 14 ) basato sul framework Hadoop. WayBack Machine 15. E un servizio del portale Internet Archive 16 il quale fornisce la possibilità di visualizzare miliardi di pagine web. Il sistema salva milioni di pagine ogni giorno, e le rende disponibili per la visualizzazione. Per una determinata pagina web, quindi, è possibile visualizzare il suo contenuto per diversi momenti del passato (da fine anni 90 agli ultimi giorni). Il portale attualmente contiene circa 450 miliardi di pagine (comprese di testo, codice, metadati, file multimediali etc.). Nel 2012 una porzione di dati (quasi 3 milioni di pagine web incirca 80 Tb) è disponibile gratuitamente per uso non commerciale, facendo richiesta alla società che gestisce il portale. TREC Datasets. I dataset messi a disposizione sono di diverse tipologie, tra cui anche raccolte di pagine web. Sono ampiamente diffusi, ma sono reperibili a pagamento. 2.2 Web Directories Altra risorsa di fondamentale importanza, soprattutto nella progettazione di motori di ricerca, è rappresentata dalle web directory. Una web directory è un elenco di siti web suddivisi in maniera gerarchica. Non è né un motore di ricerca né un archiviatore di siti mediante 10 filtering.html https://archive.org/web/ 16 https://archive.org/ 3

4 tag, ma li raccoglie ed organizza per mezzo di categorie e sotto-categorie tematiche. Una web directory consiste dunque in un portale in cui le risorse sono organizzate per aree tematiche, e vengono presentate come indici o, soprattutto, come tassonomie. Al giorno d oggi esistono migliaia e migliaia di Web directory, la maggior parte di esse create manualmente con team di esperti o volontari, in cui l iscrizione e l indicizzazione dei siti può avvenire in maniera gratuita o a pagamento. Le maggiori Web directory (ad esempio DMOZ 17, WWW Virtual Library 18, Best of The Web 19 o Joe Ant 20 ) contengono in genere milioni di pagine referenziate, categorizzate in centinaia di migliaia di categorie; dato che la quasi totalità delle web directory non fornisce i dati in formato scaricabile (ad esempio dump di database, file RDF/XML etc.), per recuperare strutture e link si rende comunque necessario l utilizzo di strumenti (quali crawler, spider, robot etc.) in grado di scaricare e analizzare i portali per estrarre i dati. Tra le più importanti Web directory, l unica per la quale è reso disponibile il dump delle pagine referenziate è DMOZ. DMoz (abbreviazione di Directory.Mozilla, il nome di dominio del suo sito), noto anche come Open Directory Project (ODP), è una web directory multilingue a contenuto aperto di proprietà della Time Warner e mantenuta da una comunità virtuale di redattori volontari. OPD può essere visto come una raccolta di hyperlinks indicizzati, reperibili nel Web. Essa è organizzata gerarchicamente per argomenti dal vasto allo specifico. La parola Open nel nome del progetto, indica un approccio assai diverso rispetto ad altre directory esistenti, di natura strettamente commerciale: gli elenchi di siti classificati da ODP vengono infatti resi disponibili gratuitamente a chiunque ne voglia fare uso, magari per ripubblicare la directory su altri siti. Questa scelta rende le informazioni raccolte da DMOZ aperte a tutti e ha favorito notevolmente la diffusione dei dati della directory sul web. ODP è sostenuta dagli editori della comunità, i quali valutano i siti per l inclusione nell indice; tutte le richieste sono soggette alla valutazione dell editore. I criteri seguiti per decidere se inserire o meno un sito in catalogo si basano esclusivamente sui contenuti dei siti stessi. 3 Selezione dei Dataset In questa sezione, dopo aver analizzato le caratteristiche, verranno illustrati i vantaggi e gli svantaggi del potenziale uso di ogni risorsa nell ambito del progetto, motivando così la decisione su quali dati utilizzare per le sperimentazioni nell ambito Web. 3.1 Analisi delle caratteristiche dei dataset disponibili Di seguito riportiamo i dataset di possibile interesse, in cui i dati sono reperibili in formato testuale. La Tabella 1 riporta in sintesi le caratteristiche di ogni dataset analizzato. La voce Tipologia indica se i dati sono relativi a pagine web o altri tipi di dato testuale; la colonna Policy indica se i dati sono reperibili gratuitamente, o dietro il pagamento del servizio; ogni dataset è caratterizzato inoltre dalla Popolosità dei dati, ovvero il numero totale di ; la Reperibilità indoca se il sito mette a disposizione o meno i dati (download ), o se è necessario una fase di acquisizione ulteriore (ad esempio crawling o parsing di pagine web), in quanto, nell ambito del progetto, i dati di interesse sono quelli per cui è disponibile il codice

5 Tabella 1: Caratteristiche dei dataset analizzati. Tipologia Policy Popolosità Reperibilità DMOZ Pagine Web Free WayBack Machine Pagine Web Free 4M di 3M di Altre Web Directory Pagine Web Free/Pay Variabile Reuters Articoli news Free OHSUMED Abstract paper scientifici Free 20 Newsgroups News Free BankSearch Pagine Web Free Common Crawl Corpus Pagine Web Free (Map-Reduce pay) 1M di M di TREC Datasets Varie Pay Variabile DB Dump Crawler necessario Crawler necessario Donwload Formato dei dati Link HTML Link HTML Link HTML File testuali File testuali File testuali Codice HTML Codice HTML Varie HTML o testo estratto da esso; a tal proposito viene indicato inoltre in tabella il Formato dei dati. La Web directory DMOZ è sicuramente uno degli strumenti più diffusi in ambito scientifico. In letteratura molteplici pubblicazioni riguardano lavori in cui la tassonomia DMOZ è la fonte principale dei dati necessari all addestramento e al test di algoritmi e sistemi. L elevata popolosità, sia in termini di numero di, sia in termini di categorie, nonché la struttura gerarchica molto profonda, rendono la tassonomia versatile e adattabile a molteplici settori di ricerca. Ma proprio l elevata complessità strutturale presenta la necessità di processi di affinamento ed estrazione di sotto-strutture più regolari ed uniformi; infatti, la tassonomia non ha una struttura omogenea, sia in termini di struttura tassonomica (la profondità varia a seconda del ramo considerato), sia in termini di popolosità di ciascuna categoria (i nodi possono avere da poche decine a migliaia di ). Inoltre sono popolate per la maggior parte soltanto le foglie della tassonomia (sono pochi i casi in cui i nodi intermedi hanno propri, e comunque difficilmente si supera la decina di ), anche se nell ambito del progetto questo costituisce un vantaggio, in quanto i dati di partenza sono rappresentati dalle foglie della tassonomia da generare. Un aspetto importante è dato dal fatto che la tassonomia è reperibile facilmente, in quanto è disponibile il download del database contente struttura della tassonomia, metadati e link alle pagine. E comunque necessaria una fase di download delle pagine Web considerate. Le altre Web Directory, compresa quella derivante da Way- Back Machine, non sono diffuse per l estrazione di dataset, pur essendo spesso più popolate, e, a seconda degli intenti delle società che le forniscono, meglio strutturate. L aspetto critico (e contrastante riguardo l ultimo aspetto) è che per la maggior parte di esse l indicizzazione, e quindi la presenza nella struttura, avviene a pagamento (per gli owner dei siti Web), e quindi potrebbero non essere rappresentative di una data categoria (ad esempio, per alcuni nodi potrebbero esserci pochi elementi). Si riscontrano dunque le stesse criticità riscontrate 5

6 DMOZ WayBack Machine Altre Web Directory Reuters OHSUMED 20 Newsgroups BankSearch Common Crawl Corpus TREC Datasets Tabella 2: Analisi dei dataset. Vantaggi Gerarchia profonda. Popolosità elevata. Reperibilità immediata del DB. La più adottata nella comunità scientifica. Popolosità elevata. Struttura gerarchica. Popolosità elevata. Struttura gerarchica Gerarchia ben strutturata. Diffusa nella comunità scientifica. Facilmente reperibile. Discreta diffusione nella comunità scientifica. Struttura gerarchica. Ampia diffusione nella comunità scientifica. Facilmente reperibile. Facilmente reperibile. Codice HTML. Pagine filtrate. Popolosità elevata. Struttura gerarchica. Popolosità elevata. Struttura gerarchica. Ampia diffusione. Possibilità di diverse tipologie. Svantaggi Necessità di download di ogni pagina Web. Struttura non uniforme. Necessità di crawling e recupero struttura. Non diffusa nella comunità scientifica. Per le free, necessità di download. Pagamento per la maggior parte. Non diffuse nella comunità scientifica. No pagine Web. Dominio molto specifico. No pagine Web. No gerarchia. Scarso numero di classi foglia (10). Utilizzo marginale nella comunità scientifica. Mole di dati elevata: framework per map-reduce a pagamento. non diffusa nella comunità scientifica. Dati reperibili a pagamento. in DMOZ, e ovviamente a parità di aspetti critici è preferibile utilizzare una risorsa consolidata e diffusa, in modo da avere riscontro nella comunità scientifica. Il dataset BankSearch presenta i vantaggi di (i) essere ben strutturato, in quanto c è un perfetto bilanciamento tra le classi; (ii) di avere i già filtrati, ovvero le pagine hanno contenuto informativo significativo e sono rimosse le pagine dinamiche, script etc.; (iii) di avere un elevato numero di per classe (un migliaio), e (iv) di essere facilmente reperibile in quanto il codice HTML di ogni pagina è fornito per il donwload. Lo svantaggio principale è che il numero di classi è limitato (10), e quindi se ne esclude l utilizzo per le sperimentazioni finali, ma può essere adoperato come toy dataset per le sperimentazioni preliminari sugli algoritmi implementati. I dataset reperibili dal sito relativo a TREC sarebbero di grande interesse, data la diffusione nella comunità scientifica come dati di riferimento e di comparazione tra diversi sistemi e algoritmi, e dati i diversi dataset riguardanti il Web, ma l acquisizione dei dati richiede un significativo investimento in denaro (in media qualche centinaio di dollari per dataset). I dataset Reuters, pur avendo struttura e contenuti significativi, hanno il difetto principale di non essere testo derivante da pagine Web. Pur essendo non rilevanti nell ambito specifico, sono comunque tenuti in considerazione per sperimentazioni parallele sulle metriche e sugli algoritmi definiti durante il progetto, fornendo un riscontro in ulteriori ambiti e settori. Stesso discorso per il dataset 20 Newsgroups, il quale ha però lo svantaggio di non avere una struttura gerarchica definita, seppure alcune classi possono essere intuitivamente raggruppate in macro-categorie. Il dataset OHSUMED invece, oltre ad essere relativo ad articoli scientifici e non a pagine 6

7 Web, ha lo svantaggio di essere definito per un dominio molto specifico (pubblicazioni in ambito medico), e di possibile scarsa rilevanza per gli algoritmi definiti. Discorso a parte per il dataset Common Crawl Corpus, il quale, pur avendo un elevato numero di e di classi, è di difficile elaborazione; la mole di dati ( 80T B di codici HTML e metadati), fa sì che si rende necessario utilizzare framework e algoritmi di Map-Reduce; Amazon mette a disposizione i suoi servizi, ma a pagamento. La Tabella 2 fornisce un riepilogo di vantaggi e svantaggi di ogni dataset analizzato. 3.2 Scelta del Dataset In base alle considerazioni precedenti, la risorsa considerata per le sperimentazioni è DMOZ. Nonostante la non omogeneità della tassonomia, il fatto di avere un dump del database che permetta una relativa limitazione delle risorse computazionali (l intera tassonomia è disponibile in meno di 2 GB di dati) ne facilita l analisi e l elaborazione della struttura. Questo è dato dal fatto di avere nel database solo i link di ogni pagina Web; se da un lato potrebbe risultare uno svantaggio, in realtà, volendo estrarre una sotto-tassonomia da DMOZ, è più semplice avere a disposizione soltanto i link, in quanto l accesso e l elaborazione della struttura comporta un minore sforzo in termini di risorse e tempi computazionali. Il primo passo è stato quello di scegliere l insieme delle classi foglia. Il lavoro è stato in prevalenza manuale; l analisi la struttura DMOZ e la scelta delle classi è avvenuta in maniera totalmente manuale. Le classi foglia scelte, vista la struttura non omogenea della tassonomia, ha comportato il fatto di scegliere in prevalenza dei nodi intermedi della tassonomia originale, in quanto, oltre l elevata profondità per le foglie di DMOZ, si ha la criticità di non avere sufficienti per ogni foglia (la maggior parte delle foglie di DMOZ, avendo un elevato grado di specificità, contiene pochi ). Per tale motivo, i di ciascuna classe foglia scelta sono risultanti dell unione dei totali contenuti nel sotto-albero risultante per ogni classe. Una volta scelta la struttura tassonomica, per ogni documento considerato, il quale nel database è caratterizzato da un link, è stata scaricata la pagina relativa (è stato implementato un semplice script per fare il parsing della pagina web); dal codice HTML si è recuperato il contenuto testuale. Le pagine non più attive e quelle con scarso contenuto testuale sono state eliminate. Da ogni pagina è stato rimosso il rumore (tag, metadati, link). Il report D3.4a descrive nel detaglio il dataset utilizzato per le sperimentazioni. 7

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

Cataloghi per i dati aperti

Cataloghi per i dati aperti Cataloghi per i dati aperti Questo materiale didattico è stato realizzato da Formez PA nel Progetto PerformancePA, Ambito A Linea 1, in convenzione con il Dipartimento della Funzione Pubblica, organismo

Dettagli

Internet e Storia. Internet. INTERNET, uno strumento per la didattica della storia

Internet e Storia. Internet. INTERNET, uno strumento per la didattica della storia INTERNET, uno strumento per la didattica della storia Internet e Storia Internet Internet è come la più grande rete mondiale ed anche detta rete delle reti che collega centinaia di milioni di computer.

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testuali Il text mining: una definizione Data mining per dati destrutturati ovvero documenti codificati in linguaggio

Dettagli

Cataloghi per i dati aperti

Cataloghi per i dati aperti Progetto PerformancePA Ambito A - Linea 1 - Una rete per la riforma della PA Cataloghi per i dati aperti Autore: Vincenzo Patruno Creatore: Formez PA, Progetto Performance PA Diritti: Dipartimento della

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

I MOTORI DI RICERCA motori di ricerca. motori di ricerca per termini motori di ricerca sistematici

I MOTORI DI RICERCA motori di ricerca. motori di ricerca per termini motori di ricerca sistematici I MOTORI DI RICERCA Il numero di siti Internet è infinito e ormai ha raggiunto una crescita esponenziale; inoltre, ogni sito è costituito da diverse pagine, alcune volte centinaia, e individuare un informazione

Dettagli

Information Literacy

Information Literacy Information Literacy Oggi ci sono molte risorse a disposizione per lo studio dell ingegneria, per questo è importante saperle utilizzare con discrezionalità per essere certi di aver fatto un lavoro di

Dettagli

Per siti più strutturati le informazioni sono mantenute mediante particolari organizzazioni di dati: human-powered directories

Per siti più strutturati le informazioni sono mantenute mediante particolari organizzazioni di dati: human-powered directories Motori di ricerca Search Non confondiamo i motori di ricerca (search engine) con le funzioni di ricerca all interno dei siti. Le funzioni di ricerca all interno sono in genere costituite da script che

Dettagli

Ministerial NEtwoRk for Valorising Activities in digitisation. Museo & Web CMS Una piattaforma open source per la gestione di siti web accessibili

Ministerial NEtwoRk for Valorising Activities in digitisation. Museo & Web CMS Una piattaforma open source per la gestione di siti web accessibili Ministerial NEtwoRk for Valorising Activities in digitisation Museo & Web CMS Una piattaforma open source per la gestione di siti web accessibili Il passo successivo: Museo & Web CMS Piattaforma opensource

Dettagli

Question Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes

Question Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes Question Answering e semantica Tecnologie emergenti per le imprese Cos è QuestIT? QuestIT nasce nell ambito di attività di ricerca in Intelligenza Artificiale presso il Dipartimento di Ingegneria dell

Dettagli

Introduzione a Internet e al World Wide Web

Introduzione a Internet e al World Wide Web Introduzione a Internet e al World Wide Web Una rete è costituita da due o più computer, o altri dispositivi, collegati tra loro per comunicare l uno con l altro. La più grande rete esistente al mondo,

Dettagli

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web Il World Wide Web Il Web Claudio Fornaro ver. 1.3 1 Il World Wide Web (ragnatela di estensione mondiale) o WWW o Web è un sistema di documenti ipertestuali collegati tra loro attraverso Internet Attraverso

Dettagli

Proposta App Smartphone e Tablet per Ufficio Concorsi Polizia di Stato

Proposta App Smartphone e Tablet per Ufficio Concorsi Polizia di Stato Proposta App Smartphone e Tablet per Ufficio Concorsi Polizia di Stato Indice App to you Introduzione Requisiti Funzionali Casi d uso Architettura SOA Proposte Dispositivi Supportati L App News Concorsi

Dettagli

WWW.ICTIME.ORG. Introduzione al SEO. Cimini Simonelli Testa

WWW.ICTIME.ORG. Introduzione al SEO. Cimini Simonelli Testa WWW.ICTIME.ORG Introduzione al SEO Cimini Simonelli Testa v.1 28 Gennaio 2008 Cecilia Cimini Angelo Simonelli Francesco Testa Introduzione al SEO EDIZIONE Gennaio 2008 Questo manuale utilizza la Creative

Dettagli

Lezione 8. Motori di Ricerca

Lezione 8. Motori di Ricerca Lezione 8 Motori di Ricerca Basi di dati Un campo prevalente dell applicazione informatica è quello costituito dall archiviazione e dalla gestione dei dati (basi di dati). Sistema Informativo. Un sistema

Dettagli

informarisorse IEEE/IET Electronic Library InFormare sull uso delle risorse elettroniche Risorse specialistiche. Politecnico

informarisorse IEEE/IET Electronic Library InFormare sull uso delle risorse elettroniche Risorse specialistiche. Politecnico informarisorse InFormare sull uso delle risorse elettroniche IEEE/IET Electronic Library Risorse specialistiche. Politecnico informarisorse InFormaRisorse informa è il nuovo servizio del Sistema bibliotecario

Dettagli

Tassonomia Web Spam GIUGNO 2005

Tassonomia Web Spam GIUGNO 2005 Prefazione: Questo documento si basa sull originale Web Spam Taxonomy firmato da alcuni ricercatori del dipartimento di Computer Science della Stanford University e pubblicato ad Aprile 2005. Tassonomia

Dettagli

Corso Creare Siti WEB

Corso Creare Siti WEB Corso Creare Siti WEB INTERNET e IL WEB Funzionamento Servizi di base HTML CMS JOOMLA Installazione Aspetto Grafico Template Contenuto Articoli Immagini Menu Estensioni Sito di esempio: Associazione LaMiassociazione

Dettagli

Allegato A REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA)

Allegato A REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) Allegato A REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO

Dettagli

Tilde WCM. Data. Moduli base. Versione 1.0. 29 Settembre 2011. giovedì 29 settembre 11

Tilde WCM. Data. Moduli base. Versione 1.0. 29 Settembre 2011. giovedì 29 settembre 11 Tilde WCM Moduli base Versione 1.0 29 Settembre 2011 Data IL CMS TILDE Il CMS o Content Management System, è lo strumento maggiormente utilizzato in qualsiasi progetto web. Ormai viene attivato su qualsiasi

Dettagli

La ricerca delle informazioni nei siti web di Ateneo con Google Search Appliance Progetto, implementazione e sviluppi

La ricerca delle informazioni nei siti web di Ateneo con Google Search Appliance Progetto, implementazione e sviluppi La ricerca delle informazioni nei siti web di Ateneo con Google Search Appliance Progetto, implementazione e sviluppi Il progetto del sistema di ricerca delle informazioni L'esigenza del sistema di ricerca

Dettagli

E-Shop/X4Shop : interfaccia IceCat the opencatalog

E-Shop/X4Shop : interfaccia IceCat the opencatalog E-Shop/X4Shop : interfaccia IceCat the opencatalog La presente guida illustra le corrette modalità di utilizzo delle procedure incluse nel Programma E-Shop/X4- Shop per accedere alle funzioni offerte dal

Dettagli

Un po di storia: la rete

Un po di storia: la rete Gabriella Pasi Università degli Studi di Milano Bicocca Il Web e i Motori di ricerca Un po di storia: la rete Metà degli anni 60: nasce ARPANET Fine anni 60: standardizzazione dei protocolli Anni 70: la

Dettagli

Moodle al Formez, Imma Citarelli

Moodle al Formez, Imma Citarelli Moodle al Formez Dott.ssa Imma Citarelli Formez - Centro di Formazione e Studi Centro di competenza e-learning e Knowledge management Apprendimento autonomo Libri, riviste, convegni Risorse on line Il

Dettagli

Il Geoportale dei Progetti Sismologici DPC-INGV 2012-2013

Il Geoportale dei Progetti Sismologici DPC-INGV 2012-2013 Il Geoportale dei Progetti Sismologici DPC-INGV 2012-2013 AUTORI Maurizio Pignone - Istituto Nazionale di Geofisica e Vulcanologia - maurizio.pignone@ingv.it Pierluigi Cara - Dipartimento della Protezione

Dettagli

GROUP POLICY MANAGEMENT CONSOLE (ACTIVE DIRECTORY)

GROUP POLICY MANAGEMENT CONSOLE (ACTIVE DIRECTORY) Date: 29/01/2013 Procedure: (Active Directory) Source: LINK Permalink: LINK Created by: HeelpBook Staff Document Version: 1.0 GROUP POLICY MANAGEMENT CONSOLE (ACTIVE DIRECTORY) Microsoft (GPMC) è un nuovo

Dettagli

Il portale nasce in riuso del portale governativo dati.gov.it in cui vengono collegati quasi tutti i dataset OD rilasciati in Italia:

Il portale nasce in riuso del portale governativo dati.gov.it in cui vengono collegati quasi tutti i dataset OD rilasciati in Italia: IL PORTALE DATI.REGIONE.BASILICATA.IT Il portale nasce in riuso del portale governativo dati.gov.it in cui vengono collegati quasi tutti i dataset OD rilasciati in Italia: il giorno 24 Novembre viene rilasciata

Dettagli

COMUNE DI BOVEZZO Provincia di Brescia

COMUNE DI BOVEZZO Provincia di Brescia COMUNE DI BOVEZZO Provincia di Brescia REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) INDICE Pagina TITOLO I Disposizioni Generali

Dettagli

Comune di Lograto. Provincia di Brescia

Comune di Lograto. Provincia di Brescia Comune di Lograto Provincia di Brescia REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) (approvato con la deliberazione del Consiglio

Dettagli

Un portale per l editoria medico-scientifica italiana

Un portale per l editoria medico-scientifica italiana Un portale per l editoria medico-scientifica italiana [22.11.2005] doi: 10.1389/DBmed1 Il progetto si propone come risultato la creazione di una banca dati bibliografica - accessibile via Web - su contenuti

Dettagli

Vision. highlights. la soddisfazione di ampliare i confini dell azienda. Un portale che fa!

Vision. highlights. la soddisfazione di ampliare i confini dell azienda. Un portale che fa! la soddisfazione di ampliare i confini dell azienda Un portale che fa! Il portale aziendale è un luogo di lavoro. Gemino è un Portal Application ricco di contenuti applicativi pronti all uso! highlights

Dettagli

La gestione del documento

La gestione del documento Operatore giuridico d impresa Informatica Giuridica A.A 2002/2003 II Semestre La gestione del documento prof. Monica Palmirani Il documento A differenza del dato il documento è solitamente un oggetto non

Dettagli

*** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. ***

*** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. *** *** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. *** PREFAZIONE Questo progetto nasce perchè mi sono reso conto dell'importanza che i motori di ricerca hanno su Internet. Internet rappresenta

Dettagli

INTERNET. Un percorso per le classi prime Prof. Angela Morselli

INTERNET. Un percorso per le classi prime Prof. Angela Morselli INTERNET Un percorso per le classi prime Prof. Angela Morselli PARTE 1 INTERNET: LA RETE DELLE RETI 2 È ALQUANTO DIFFICILE RIUSCIRE A DARE UNA DEFINIZIONE ESAUSTIVA E CHIARA DI INTERNET IN POCHE PAROLE

Dettagli

Cercare documenti Web

Cercare documenti Web Pagine web (struttura html) Cercare documenti Web Motori di Ricerca I MOTORI DI RICERCA Sulla rete Web vi sono strumenti specifici chiamati motori di ricerca (research engines) per la ricerca di siti e

Dettagli

Servizi di ricerca nel Web (Web search)

Servizi di ricerca nel Web (Web search) Servizi di ricerca nel Web (Web search) Generalità Introduzione Il web è il più grande database mondiali di contenuti. É un contenitore di informazioni che vengono pubblicate, modificate, cancellate, inserite

Dettagli

Search Engine Optimization per Calciomercato.it

Search Engine Optimization per Calciomercato.it www.mamadigital.com Search Engine Optimization per Calciomercato.it Mamadigital srl - Sede legale e operativa: Via Conegliano, 18-00182 Roma C.F. e P. iva 09738901009 Phone: +39 0670614560 Fax: +39 0670391132

Dettagli

Il Manager di contenuti (CMS) proposto presenta i seguenti vantaggi:

Il Manager di contenuti (CMS) proposto presenta i seguenti vantaggi: Idee e Progetti s.a.s. Piazza Castelnuovo, 26/A Web: Oggetto: Preventivo Sito Web Professional + pubblicità sui motori di ricerca con Virtual Tour 1) Realizzazione sito web: La realizzazione del sito prevede

Dettagli

Alfresco ECM. La gestione documentale on-demand

Alfresco ECM. La gestione documentale on-demand Alfresco ECM La gestione documentale on-demand Alfresco 3.2 La gestione documentale on-demand Oltre alla possibilità di agire sull efficienza dei processi, riducendone i costi, è oggi universalmente conosciuto

Dettagli

Guida all uso di. a cura dell Area Economia Applicata (AEA) - IPI

Guida all uso di. a cura dell Area Economia Applicata (AEA) - IPI Guida all uso di a cura dell Area Economia Applicata (AEA) - IPI 1. Introduzione pag. 2 2. Scelta dell area tematica e del dato pag. 4 3. Criteri di selezione pag. 7 4. Esportazione pag. 9 1 Questa guida

Dettagli

Content Development e Open Source Pierluigi Boda Università La Sapienza di Roma

Content Development e Open Source Pierluigi Boda Università La Sapienza di Roma Content Development e Open Source Università La Sapienza di Roma Contenuti: Cos è il content management Aspetti critici nello sviluppo dei CMS Opzioni tecnologiche per il CM Peculiarità dell opzione open

Dettagli

Motori di ricerca. Reti e Web. Motori di ricerca. Motori di ricerca - Interfaccia. Motori di ricerca

Motori di ricerca. Reti e Web. Motori di ricerca. Motori di ricerca - Interfaccia. Motori di ricerca Reti e Web Si stima vi siano almeno 13 miliardi di pagine Web Sistemi per la ricerca e la catalogazione delle pagine Web motori di ricerca (Google, Yahoo!, Bing,...) cataloghi sistematici (Yahoo! directory)

Dettagli

idw INTELLIGENT DATA WAREHOUSE

idw INTELLIGENT DATA WAREHOUSE idw INTELLIGENT DATA WAREHOUSE NOTE CARATTERISTICHE Il modulo idw Amministrazione Finanza e Controllo si occupa di effettuare analisi sugli andamenti dell azienda. In questo caso sono reperite informazioni

Dettagli

Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design

Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design Dipartimento INDACO Facoltà del Design - III Facoltà d Architettura Politecnico di Milano Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design

Dettagli

MediaWiki. Giuseppe Frisoni

MediaWiki. Giuseppe Frisoni MediaWiki Giuseppe Frisoni MediaWiki: costruire insieme 1/2 L'enorme successo di Wikipedia, la nota enciclopedia online, è sotto gli occhi di tutti; cosa meno nota, invece, è la piattaforma con cui è progettata.

Dettagli

STATO delle ATTIVITA del GRUPPO di LAVORO per L INFORMATIZZAZIONE dei PRODOTTI in AMBIENTE GIS

STATO delle ATTIVITA del GRUPPO di LAVORO per L INFORMATIZZAZIONE dei PRODOTTI in AMBIENTE GIS STATO delle ATTIVITA del GRUPPO di LAVORO per L INFORMATIZZAZIONE dei PRODOTTI in AMBIENTE GIS Pierluigi CARA, Maurizio PIGNONE Convegno finale Progetti S Bologna, 4-5 giugno 2015 1 premessa L Allegato

Dettagli

Opendoc DLS Digital Library System

Opendoc DLS Digital Library System Opendoc DLS Digital Library System Opendoc DLS - Digital Library System Chi siamo Opendoc Srl è una società milanese nata a seguito di un'importante esperienza per il Ministero per i Beni e le Attività

Dettagli

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,

Dettagli

TRAME :: web 2.0 e archivi digitali

TRAME :: web 2.0 e archivi digitali TRAME :: web 2.0 e archivi digitali Gianni Corino - Andrea Bottino Politecnico di Torino Trame Tecnologie e ambienti di rete per la memoria culturale del XXI secolo Progetto PRIN biennale (2005-2007) cofinanziato

Dettagli

Cimini Simonelli - Testa

Cimini Simonelli - Testa WWW.ICTIME.ORG Joomla 1.5 Manuale d uso Cimini Simonelli - Testa Cecilia Cimini Angelo Simonelli Francesco Testa Joomla 1.5 Manuale d uso V.1-31 Gennaio 2008 ICTime.org non si assume nessuna responsabilità

Dettagli

CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE

CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE A cura di Massimiliano Navacchia http://www.navacchia.it/ info@navacchia.it - cell. (+39) 3394676518

Dettagli

principalmente un programma per la gestione di bibliografie: dalla raccolta dei riferimenti alla formattazione delle citazioni

principalmente un programma per la gestione di bibliografie: dalla raccolta dei riferimenti alla formattazione delle citazioni COS È? principalmente un programma per la gestione di bibliografie: dalla raccolta dei riferimenti alla formattazione delle citazioni un programma gratuito: la versione base offre 300 MB di spazio disco

Dettagli

Premessa. 1. Funzionalità del portale.. 1. Servizi per gli utenti esterni all Amministrazione Scolastica... 3

Premessa. 1. Funzionalità del portale.. 1. Servizi per gli utenti esterni all Amministrazione Scolastica... 3 edumonitor MONITORAGGIO ED ANALISI DEI PERCORSI SCOLASTICI REALIZZATI PER PREVENIRE IL DISAGIO GIOVANILE Guida al Portale Premessa. 1 Funzionalità del portale.. 1 Servizi per gli utenti esterni all Amministrazione

Dettagli

P.O.R. SARDEGNA 2000-2006 MISURA 3.13 ALLEGATO A. SCHEDA PROGETTO per la creazione di BIBLIOTECA SCIENTIFICA REGIONALE

P.O.R. SARDEGNA 2000-2006 MISURA 3.13 ALLEGATO A. SCHEDA PROGETTO per la creazione di BIBLIOTECA SCIENTIFICA REGIONALE REGIONE AUTONOMA DELLA SARDEGNA CENTRO REGIONALE DI PROGRAMMAZIONE P.O.R. SARDEGNA 2000-2006 MISURA 3.13 RICERCA E SVILUPPO TECNOLOGICO NELLE IMPRESE E TERRITORIO ALLEGATO A SCHEDA PROGETTO per la creazione

Dettagli

Cimini Simonelli - Testa

Cimini Simonelli - Testa WWW.ICTIME.ORG Joomla 1.5 Manuale d uso Cimini Simonelli - Testa Il pannello di amministrazione Accedendo al pannello di amministrazione visualizzeremo una schermata in cui inserire il nome utente (admin)

Dettagli

MANUALE DI UTILIZZO: INTRANET PROVINCIA DI POTENZA

MANUALE DI UTILIZZO: INTRANET PROVINCIA DI POTENZA MANUALE DI UTILIZZO: INTRANET PROVINCIA DI POTENZA Fornitore: Publisys Prodotto: Intranet Provincia di Potenza http://www.provincia.potenza.it/intranet Indice 1. Introduzione... 3 2. I servizi dell Intranet...

Dettagli

Alcune semplici definizioni

Alcune semplici definizioni Alcune semplici definizioni Un CMS (Content management system), in italiano Sistema di gestione dei contenuti è uno strumento software che si installa generalmente su un server web, il cui compito è facilitare

Dettagli

GOOGLE, WIKIPEDIA E VALUTAZIONE SITI WEB. A cura delle biblioteche Umanistiche e Giuridiche

GOOGLE, WIKIPEDIA E VALUTAZIONE SITI WEB. A cura delle biblioteche Umanistiche e Giuridiche GOOGLE, WIKIPEDIA E VALUTAZIONE SITI WEB A cura delle biblioteche Umanistiche e Giuridiche ISTRUZIONI PER Usare in modo consapevole i motori di ricerca Valutare un sito web ed utilizzare: Siti istituzionali

Dettagli

Kirey Re.Search 2.0. Piattaforma di ricerca Open Source

Kirey Re.Search 2.0. Piattaforma di ricerca Open Source Kirey Re.Search 2.0 Piattaforma di ricerca Open Source Le esigenze Quando si parla di motori di ricerca si tende a pensare istintivamente solo a quelli utilizzati per effettuare ricerche in Internet, come

Dettagli

COMUNE DI BARASSO (Provincia di Varese)

COMUNE DI BARASSO (Provincia di Varese) COMUNE DI BARASSO (Provincia di Varese) Approvate con delibera della Giunta Comunale n.30 del 18.05.2015 Linee guida per la disciplina di accesso e riutilizzo delle banche dati (open data) Redatte ai sensi

Dettagli

Digital Archive and Gov t Content Management

Digital Archive and Gov t Content Management Digital Archive and Gov t Content Management IBM CoC Solutions 20012 IBM Corporation IBM Digital Archive & Govt Content Management Exec Summary La soluzione è stata sviluppata da IBM in collaborazione

Dettagli

LA SOLUZIONE PER LA GESTIONE DINAMICA DELLE INFORMAZIONI IN UN PORTALE

LA SOLUZIONE PER LA GESTIONE DINAMICA DELLE INFORMAZIONI IN UN PORTALE LA SOLUZIONE PER LA GESTIONE DINAMICA DELLE INFORMAZIONI IN UN PORTALE WEBVISION APPARTIENE ALLA FAMIGLIA DEI CONTENT MANAGEMENT SYSTEM PER LA GESTIONE DINAMICA DELLE INFORMAZIONI E DEL LORO LAYOUT ALL

Dettagli

Corso di Alfabetizzazione Informatica

Corso di Alfabetizzazione Informatica Corso di Alfabetizzazione Informatica Lezione 6 a.a. 2010/2011 Francesco Fontanella La Complessità del Hardware Il modello di Von Neumann è uno schema di principio. Attualmente in commercio esistono: diversi

Dettagli

6 BILANCI E NOTA INTEGRATIVA

6 BILANCI E NOTA INTEGRATIVA Bollettino 5.00-265 6 BILANCI E NOTA INTEGRATIVA 6.1 [5.00\ 22] Il bilancio in formato XBRL 6.1.1 Normativa Il DPCM del 10 dicembre 2008 - Specifiche tecniche del formato elettronico elaborabile (XBRL)

Dettagli

Open Access e ruolo delle University Press

Open Access e ruolo delle University Press WorkShop Bibliosan 2013 Ricerca biomedica e pubblicazione dei risultati: la sostenibilità dell Open Access Open Access e ruolo delle University Press Fulvio Guatelli fulvio.guatelli@unifi.it Firenze University

Dettagli

Come leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci

Come leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci Come leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci I motori di ricerca in internet: cosa sono e come funzionano Roberto Ricci, Servizio Sistema

Dettagli

PROVINCIA DI FORLI'-CESENA RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA)

PROVINCIA DI FORLI'-CESENA RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) PROVINCIA DI FORLI'-CESENA REGOLAMENTO RELATIVO ALLA PUBBLICAZIONE, ALLA FACOLTÀ DI ACCESSO TELEMATICO E AL RIUTILIZZO DEI DATI PUBBLICI (OPEN DATA) Approvato con Delibera di G.P. n. 141775/456 del 06/12/2013

Dettagli

COMPLETA SICUREZZA GRAZIE ALL ACCESSO PROTETTO E AI LIVELLI AUTORIZZATIVI

COMPLETA SICUREZZA GRAZIE ALL ACCESSO PROTETTO E AI LIVELLI AUTORIZZATIVI Consultazione prodotti e gestione ordini via internet SAM r-evolution La rivoluzione non è cambiare il software! SAM OW - Open Web Open-Web è l applicazione web per la consultazione online degli articoli

Dettagli

Il database management system Access

Il database management system Access Il database management system Access Corso di autoistruzione http://www.manualipc.it/manuali/ corso/manuali.php? idcap=00&idman=17&size=12&sid= INTRODUZIONE Il concetto di base di dati, database o archivio

Dettagli

MANUALE D USO DELLA PIATTAFORMA ITCMS

MANUALE D USO DELLA PIATTAFORMA ITCMS MANUALE D USO DELLA PIATTAFORMA ITCMS MANULE D USO INDICE 1. INTRODUZIONE... 2 2. ACCEDERE ALLA GESTIONE DEI CONTENUTI... 3 3. GESTIONE DEI CONTENUTI DI TIPO TESTUALE... 4 3.1 Editor... 4 3.2 Import di

Dettagli

Presentazione e dimostrazione di utilizzo

Presentazione e dimostrazione di utilizzo L AMBIENTE OPEN SOURCE A SUPPORTO DELLE BEST PRACTICE DI ITIL un progetto open source per la gestione dei processi ICT Presentazione e dimostrazione di utilizzo Fabio Bottega f.bottega@tecnoteca.it MILANO,

Dettagli

Laboratorio di Informatica

Laboratorio di Informatica Laboratorio di Informatica Introduzione al Web WWW World Wide Web CdL Economia A.A. 2012/2013 Domenica Sileo Università degli Studi della Basilicata Introduzione al Web : WWW >> Sommario Sommario 2 n World

Dettagli

CONTENT MANAGEMENT SYSTEM

CONTENT MANAGEMENT SYSTEM CONTENT MANAGEMENT SYSTEM P-2 PARLARE IN MULTICANALE Creare un portale complesso e ricco di informazioni continuamente aggiornate, disponibile su più canali (web, mobile, iphone, ipad) richiede competenze

Dettagli

Web 2.0: applicativi in medicina Roma, 9-10 dicembre 2013

Web 2.0: applicativi in medicina Roma, 9-10 dicembre 2013 Corso Web 2.0: applicativi in medicina Roma, 9-10 dicembre 2013 biblioire@ifo.it Fabio D Orsogna Francesca Servoli int. 6225 Che cos è un BLOG? Un blog è un particolare tipo di sito web, ma con delle

Dettagli

Formazione sistema editoriale CMS

Formazione sistema editoriale CMS Ufficio Società dell'informazione Nome del Progetto Acronimo del Progetto Formazione sistema editoriale CMS Documento Data di stesura Maggio 2010 Versione 1.2 Sommario 1 Scopo... 3 2 Campo di applicazione...

Dettagli

www.culturaitalia.it CULTURAITALIA UN PATRIMONIO DA ESPLORARE Ministero per i beni e le attività culturali

www.culturaitalia.it CULTURAITALIA UN PATRIMONIO DA ESPLORARE Ministero per i beni e le attività culturali www.culturaitalia.it CULTURAITALIA UN PATRIMONIO DA ESPLORARE CulturaItalia Presentazione del Portale della Cultura italiana 2 CulturaItalia CulturaItalia è il primo portale in Italia ad offrire un punto

Dettagli

Open Access o libertà del software

Open Access o libertà del software Open Access o libertà del software La questione della libertà del software è solo in minima parte un problema tecnico. Dai computer e dalla rete dipende una parte della nostra capacità di conservare e

Dettagli

Wordpress LABORATORIO - Made in Italy: Eccellenze in Digitale. 18/2/16 - Andrea Tombesi Paolo Roganti

Wordpress LABORATORIO - Made in Italy: Eccellenze in Digitale. 18/2/16 - Andrea Tombesi Paolo Roganti Wordpress LABORATORIO - Made in Italy: Eccellenze in Digitale 18/2/16 - Andrea Tombesi Paolo Roganti Cos è un CMS? Un CMS (Content Management System), è un software che ti permette di gestire un blog (o

Dettagli

HTML il linguaggio per creare le pagine per il web

HTML il linguaggio per creare le pagine per il web HTML il linguaggio per creare le pagine per il web Parte I: elementi di base World Wide Web Si basa sul protocollo HTTP ed è la vera novità degli anni 90 Sviluppato presso il CERN di Ginevra è il più potente

Dettagli

Iniziative e biblioteche digitali del Politecnico : un incontro di lavoro Aula Magna, Politecnico di Milano, 1 ottobre 2004

Iniziative e biblioteche digitali del Politecnico : un incontro di lavoro Aula Magna, Politecnico di Milano, 1 ottobre 2004 Iniziative e biblioteche digitali del Politecnico : un incontro di lavoro Aula Magna, Politecnico di Milano, 1 ottobre 2004 Archivio degli indici e degli abstract delle tesi di laurea delle Facoltà di

Dettagli

Le informazioni. Fondamenti di informatica. I documenti. Information retrieval. Information retrieval. Ricerche alternative 19/02/2015

Le informazioni. Fondamenti di informatica. I documenti. Information retrieval. Information retrieval. Ricerche alternative 19/02/2015 Fondamenti di informatica Appunti sulla ricerca di informazioni per le scienze umane dal capitolo 8 del testo: M. Lazzari, Informatica umanistica, McGraw-Hill, 2014 Marco Lazzari Le informazioni 1. letteratura

Dettagli

Compilare e gestire bibliografie: i software gratuiti. a cura di Laura Perillo Sistema Bibliotecario di Ateneo Agg. ottobre 2014

Compilare e gestire bibliografie: i software gratuiti. a cura di Laura Perillo Sistema Bibliotecario di Ateneo Agg. ottobre 2014 Compilare e gestire bibliografie: i software gratuiti a cura di Laura Perillo Sistema Bibliotecario di Ateneo Agg. ottobre 2014 I software per la gestione di bibliografie Chiamati reference managers o

Dettagli

Capitolo 5. Cercare informazioni sul Web

Capitolo 5. Cercare informazioni sul Web Capitolo 5 Cercare informazioni sul Web Cercare nel posto giusto Posti logici e noti per reperire informazioni sui nostri contributi pensionistici, chiediamo all INPS Biblioteche on-line La maggior parte

Dettagli

Capitolo 4 Pianificazione e Sviluppo di Web Part

Capitolo 4 Pianificazione e Sviluppo di Web Part Capitolo 4 Pianificazione e Sviluppo di Web Part Questo capitolo mostra come usare Microsoft Office XP Developer per personalizzare Microsoft SharePoint Portal Server 2001. Spiega come creare, aggiungere,

Dettagli

Cultura Tecnologica di Progetto

Cultura Tecnologica di Progetto Cultura Tecnologica di Progetto Politecnico di Milano Facoltà di Disegno Industriale - DATABASE - A.A. 2003-2004 2004 DataBase DB e DataBase Management System DBMS - I database sono archivi che costituiscono

Dettagli

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire La società Volocom Trasformare le informazioni in conoscenza 2 La società Volo.com dal 2001 è uno dei leader nei settori del Knowledge Management e nella gestione delle informazioni per la rassegna stampa

Dettagli

Corso di Web programming Modulo T3 A2 - Web server

Corso di Web programming Modulo T3 A2 - Web server Corso di Web programming Modulo T3 A2 - Web server 1 Prerequisiti Pagine statiche e dinamiche Pagine HTML Server e client Cenni ai database e all SQL 2 1 Introduzione In questa Unità si illustra il concetto

Dettagli

Applicazione: DoQui/Index - Motore di gestione dei contenuti digitali

Applicazione: DoQui/Index - Motore di gestione dei contenuti digitali Riusabilità del software - Catalogo delle applicazioni: Applicativo verticale Applicazione: DoQui/Index - Motore di gestione dei contenuti digitali Amministrazione: Regione Piemonte - Direzione Innovazione,

Dettagli

Segesta srl Via Giacomo Peroni 400 00131 Roma Tel. 06/36.00.65.96 Fax 06/233.28.703 marketing@segestaitalia.it

Segesta srl Via Giacomo Peroni 400 00131 Roma Tel. 06/36.00.65.96 Fax 06/233.28.703 marketing@segestaitalia.it Segesta srl Via Giacomo Peroni 400 00131 Roma Tel. 06/36.00.65.96 Fax 06/233.28.703 marketing@segestaitalia.it Cosa dice la normativa italiana? Il protocollo informatico è l'insieme delle risorse di calcolo,

Dettagli

SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data

SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data Roberto delle Donne (Università degli Studi di Napoli Federico II) Tiziana Possemato (@Cult) SHARE Scholarly Heritage and Access to Research

Dettagli

Open Publishing Made Easy!

Open Publishing Made Easy! Open Publishing Made Easy! Seminario Residenziale CIBER Università di Napoli, 11 novembre 2005 Che cos è HyperJournal è un software per creare e gestire riviste scientifiche elettroniche e cartacee. è

Dettagli

Librerie digitali. Introduzione. Cos è una libreria digitale?

Librerie digitali. Introduzione. Cos è una libreria digitale? Librerie digitali Introduzione Cos è una libreria digitale? William Arms "An informal definition of a digital library is a managed collection of information, with associated services, where the information

Dettagli

Open Archives e motori di ricerca. di Ilaria Moroni

Open Archives e motori di ricerca. di Ilaria Moroni Open Archives e motori di ricerca di Ilaria Moroni Ultimo aggiornamento: ottobre 2013 Sommario Open archives: Pleiadi SSRN Motori di ricerca: Google Books Google Scholar Scirus Open Archives per cercare

Dettagli

Alfa Layer S.r.l. Via Caboto, 53 10129 Torino ALFA PORTAL

Alfa Layer S.r.l. Via Caboto, 53 10129 Torino ALFA PORTAL ALFA PORTAL La struttura e le potenzialità della piattaforma Alfa Portal permette di creare, gestire e personalizzare un Portale di informazione in modo completamente automatizzato e user friendly. Tramite

Dettagli

Dove iniziare la ricerca bibliografica

Dove iniziare la ricerca bibliografica Information Literacy Oggi ci sono molte risorse a disposizione per lo studio dell ingegneria, per questo è importante saperle utilizzare con discrezionalità per essere certi di aver fatto un lavoro di

Dettagli

Internet e World Wide Web

Internet e World Wide Web Alfonso Miola Internet e World Wide Web Dispensa C-02 Settembre 2005 1 Nota bene Il presente materiale didattico è derivato dalla dispensa prodotta da Luca Cabibbo Dip. Informatica e Automazione Università

Dettagli

LEZIONE 3. Il pannello di amministrazione di Drupal, configurazione del sito

LEZIONE 3. Il pannello di amministrazione di Drupal, configurazione del sito LEZIONE 3 Il pannello di amministrazione di Drupal, configurazione del sito Figura 12 pannello di controllo di Drupal il back-end Come già descritto nella lezione precedente il pannello di amministrazione

Dettagli

CLOUD COMPUTING. Che cos è il Cloud

CLOUD COMPUTING. Che cos è il Cloud CLOUD COMPUTING Che cos è il Cloud Durante la rivoluzione industriale, le imprese che si affacciavano per la prima volta alla produzione dovevano costruirsi in casa l energia che, generata da grandi macchine

Dettagli

Archiviazione dei siti delle istituzioni europee

Archiviazione dei siti delle istituzioni europee Archiviazione dei siti delle istituzioni europee Il progetto pilota degli Archivi storici dell Unione europea tra principi e realizzazione corso ANAI, 18-19 maggio 2015 Leggero, trasparente, permanente

Dettagli