CORSO DI SISTEMI INFORMATIVI III
|
|
- Gilberta Salvatori
- 8 anni fa
- Visualizzazioni
Transcript
1 CORSO DI SISTEMI INFORMATIVI III Componenti Principali di un Sistema di IR e i documenti gestiti Gloria Bordogna CNR IDPA Via Pasubio 5, c/o POINT, Dalmine (BG) gloria.bordogna@idpa.cnr.it
2 Storia dell Information Retrieval P. Luhn s statistical indexing/abstracting (1959), G. Salton (60s) MEDLINE (1964), Dialogue (1967) Modelli di ranking: ordinamento dei documenti sulla base di una stima della loro rilevanza (relevance ranking, tardi anni 80) Multimedia, Internet, Digital Libraries (tardi anni 90) Semantic Web: indicizzazione concettuale, disambiguazione (dal 2000)
3 Evoluzione dell Information Retrieval In origine i sistemi di IR erano sistemi di retrieval di riferimenti utilizzati in modalità batch; Attualmente i sistemi di IR sono usati in modalità interattiva real time: per reperire e visualizzare l intero documento; possono essere usati da utenti inesperti; gestiscono collezioni di documenti multimediali (ad esempio il Web) in vari formati Evoluzione dell IR è influenzata da: supporti di memorizzazione sempre piu capaci ed economici; software per la creazione di documenti in formato digitale (wordprocessors, GIS, ecc.); strumenti e SW per la digitalizzazione di documenti cartacei (OCR). strumenti di acquisizioni di dati digitali (immagini, video) Web
4 Struttura base di un IRS ARCHIVIO DI DOCUMENTI INDICIZZAZIONE Tipicamente testi non strutturati o semistrutturati RAPPRESENTAZIONE FORMALE DEI DOCUMENTI Off line DOCUMENTI STIMATI RILEVANTI MECCANISMO DI MATCHING On line FORMULAZIONE DELLA QUERY RAPPRESENTAZIONE DELLA QUERY Un IRS è basato su un modello matematico
5 Il processo di indicizzazione Problema: come descrivere il contenuto semantico di un documento in un modo automaticamente gestibile? Il processo di indicizzazione è basato sull estrazione di elementi (feature) che costituiscono la base della descrizione (rappresentazione) del documento. Per i testi tali elementi (detti indici) sono generalmente parole. I documenti sono rappresentati come insiemi (pesati) di parole. (!! Idea concepita alla fine degli anni 50 e ancora di punta!!!!) {Information, retrieval, computer, science, discipline, keywords } The experimental evidence accumulated over the past 20 years indicates that text indexing systems based on the assignment of appropriately weighted single terms produce retrieval results that are superior than those obtainable with other more elaborate text representations. These results depend crucially on the choice of effective term-weighting systems. (Salton, 1988)
6 Formulazione di richieste (linguaggi di interrogazione) Query semplici Generalmente composte di due o tre, fino a un massimo di 10-12, parole (keywords) es., ricerche su web Query Booleane Es. analisi AND immagini Query con contesto operatori di prossimità, frasi di ricerca Es. neural networks AND immagini Query sul contenuto e sulla struttura Es. Immagini IN titolo Query in Linguaggio Naturale L utente sintetizza le sue necessità informative mediante parole chiave
7 IR: Confronto tra rappresentazione dei documenti e query SCOPO: Reperire i documenti rilevanti per l utente, ossia pertinenti rispetto alle necessità informative espresse in una query (la rilevanza di un documento e relativa alla query formulata). Confronto esatto: Rilevante/ Non Rilevante Confronto parziale: Basato sul calcolo di un punteggio (RSV) risultato di un confronto rispetto alla query (ad. es. misura della vicinanza della query al documento) I documenti sufficientemente vicini o simili alla query vengono reperiti. E necessario definire un metodo per valutare la rilevanza (RSV) (dipende dal modello di Informazion Retrieval)
8 Misure di Similarità utilizzate nell IR similarità tra singoli termini (stringhe) 1) per correggere errori di battitura 2) Per tener conto della correlazione semantica (sinonimia) similarità tra rappresentazione della query e del documento (definita nell ambito di un modello) similarità tra documenti 1) Per tener conto della correlazione semantica 2) Per ottimizzare la struttura dati similarità tra query (profili) di utenti diversi 1) Per applicare tecniche di tipo collaborativo 2) Per ottimizzare l IR in sistemi di IR distribuiti
9 Processo di reperimento delle informazioni Feedback dell utente Interfaccia utente Necessità informative Testo Testo Operazioni di analisi del testo Operazioni sulle query Query Vista Logica Vista Logica Indicizzazione Sistema di gestione dell archivio di Documenti Documenti ordinati Calcolo della Similarità Documenti Reperiti Ordinamento Indici Archivio di Testi
10 Information Retrieval moderno Un sistema moderno di IR opera sia off-line sia on-line (2 cicli distinti) off-line line: costruisce le rappresentazioni dei documenti mediante indicizzazione e organizza tali rappresentazioni in una struttura dati interna; on-line line: legge la query di un utente (parsing), la interpreta e restituisce all utente i documenti stimati rilevanti rispetto ad essa, in una delle forme seguenti: un insieme di documenti stimati rilevanti ( retrieval binario ); una lista ordinata di documenti. Ordine decrescente di {grado probabilità} di rilevanza ( ranked retrieval). Gruppi di documenti omogenei per argomento (ordinati) (talvolta) relevance-feedback: il sistema prende in input il feedback dell utente sui documenti appena trovati e lo usa per costruire una nuova query che porti ad un retrieval più efficace.
11 Difficoltà dell Information Retrieval L Information retrieval è caratterizzato da: Incompletezza della rappresentazione dei documenti soggettività del concetto di rilevanza Ambiguità del significato dei termini Vaghezza delle richieste utente Incertezza della correttezza del risultato Approssimazione del meccanismo di confronto E un attività che necessita di essere modellata con strumenti formali adatti a trattare imprecisione e incertezza IR deve cercare di soddisfare necessità di informazione espresse in modo vago, impreciso mediante le ambiguità del linguaggio naturale, e deve confrontarle, in un modo approssimativo con le informazioni contenute in un documento, ed espresse mediante lo stesso linguaggio naturale. (Smeaton, 1997)
12 Caratteristica dell IR Un algoritmo è scorretto se produce un risultato errato. Un approccio euristico alla soluzione di problemi cerca di produrre risultati il più possibile vicini a quelli che ci si aspetta come corretti. La bontà di un approccio euristico viene misurata valutando quanto dista il risultato prodotto da quello corretto. Le tecniche di IR sono essenzialmente di natura euristica. La bontà di un modello di IR si misura in termini di vicinanza dei risultati prodotti a quelli corretti.
13 Misure di Efficacia del Retrieval Precisione = Rilevanti e Reperiti Reperiti Richiamo = Rilevanti e Reperiti Rilevanti
14 Livelli di Recall (esempio) Num documenti totali reperiti = ci sono solo 5 documenti rilevanti in totale. Posizione nella lista DocId Recall Precision 10 A (1 solo ril rep) 20 B (2 ril rep) 50 C (3 ril rep) 100 D (4 ril rep) 1500 E (5 ril rep)
15 GRAFICO di Recall-Precisione precisione recall Calcola la precisione a.1,.2,.3,, 1.0 livelli di recall. Il grafico ottimale è una retta orizzontale Y=1 precisione sempre a 1 per qualunque valore di recall. Tipicamente all aumentare del recall diminuisce la precisione
16 Documenti : caso + semplice Unità reperibili di Dimensione arbitraria testoin formatolibero codifica EBCDIC, ASCII (8 bit), UNICODE (16 bit) ecc. lingua composto da stringhe di caratteri di un alfabeto ecc; Es. sequenze del genoma (appl. bioinformatica), formule di composti chimici, Parole in linguaggio naturale Esempi articoli di quotidiani, di riviste, messaggi, lettere, referti medici, pagine web, ecc..
17 Caratteristiche dei Documenti documento stile sintassi Testo + struttura + altri media (immagini, suoni,..) + semantica metadati
18 Metadati Tratto da Metadata is information about information - labeling, cataloging and descriptive information structured in such a way that allows pages to be properly searched and processed in particular by computer. In other words, what is now very much needed on the Web is metadata. W3C's Metadata Activity is concerned with ways to model and encode metadata. A particular priority of W3C is to use the Web to document the meaning of the metadata. Our strong interest in metadata has prompted development of the Resource Description Framework (RDF) and Ontology Web Language (OWL) as W3C Recommendations
19 Metadati I metadati associati a un documento sono dati esterni al documento: metadati descrittivi (Dublin Core Metadata Set): relativi alla creazione del documento e non al suo contenuto, ad esempio: titolo, autori, data, lunghezza (in pagine, parole, bytes, ecc.), genere (libro, articolo, memo, mail, ecc), ISBN
20 Metadati metadati semantici relativi all argomento trattato dal documento: Abstract Keywords Subject Codes Library of Congress LCSC Dewey Decimal UMLS (Unified Medical Language System) Subject Codes possono essere estratti da un ontologia
21 Web Metadata POWDER (Protocol for Web Description Resources ) è un gruppo di lavoro del W3C che definisce il protocollo per pubblicare descrizione di risorse Web (es metadati di pagine Web, di siti Web, di servizi Web) usando RDF, OWL, e HTTP. Descrizione del contenuto Descrizione di una collezione di pagine Informazioni sulla privacy (accessi, crawling, indexing) Diritti di proprietà intellettuale (es. copyright) Content ratings (per filtri di censura) PICS (Platform for Internet Content Selection) Firme digitali per valutazione autorevolezza pagine Es: <meta http-equiv="content-type" content="text/html; charset=utf-8">
22 Linguaggi per la compilazione di Metadati MARC Machine Readable Cataloging Record: formato più diffuso per le digital libraries RDF Resource Description Framework Permette la descrizione delle risorse Web per facilitare l elaborazione automatica delle informazioni. RDF è un istanza di XML (RDF/XML) RDF è parte dell attività del gruppo sul semantic web del W3C RDF è raccomandato dal W3C (dal 2004) Esempi di utilizzo: Descrizione di proprietà di prodotti in vendita (prezzi, disponibilità) Descrizione della temporizzazione di eventi su WEB Descrizione di informazioni sulle pagine web (autori, titoli, contenuti, copyright ecc., ) Descrizione del contenuto e del rating delle immagini su web Descrizione del contenuto dei motori di ricerca
23 Metadati espressi in RDF RDF identifica le risorse Web con un URI (Uniform Resource Identifier) e le descrive con proprietà e valori di proprietà La struttura di una espressione RDF è una tripla (RDF Statement): (risorsa, proprietà, valore) Risorsa (soggetto) una qualunque RDF URI, blank node Es.: proprietà (predicato) è una risorsa che ha un nome Es.: autore, homepage valore della proprietà (oggetto) RDF URI reference, a literal or a blank node Es.: Pippo,
24 Formati per documenti testuali Nei sistemi di IR classici i documenti dovevano venire rappresentati in un formato interno per poter essere indicizzati e gestiti 1 OPERAZIONE: (file sorgente FILE DI INPUT O di GENERAZIONE) Documenti scritti con word-processor comuni: MsWord, Wordperfect, (formato parzialmente binario) TeX, RTF, HTML, XML ( Rich Text Format) (formato ASCII) Formati per la visualizzazione e la stampa: PDF (Portable Document Format) Postscript (linguaggio potente per disegni e testo) MIME (Multipurpose Internet Mail Exchange) per le supporta varie codifiche di caratteri Formati compressi: ARJ, ZIP (Winzip, Gzip)
25 Compressione dei documenti testuali Necessaria per: ottimizzare occupazione di spazio; ridurre i tempi di trasmissione nell IR distribuito; Problemi critici: tempi di compressione e decompressione. Alcuni tipi di compressione permettono il matching compresso Formati compressi senza perdita di informazione Compressione di caratteri o di parole riduzione n bit utili per rappresentare il carattere o la parola Compression rate (riduzione al 25% -da 8 bit a 2- bit molto buona, riduzione al 45% buona)
26 Formati per immagini Formati per rappresentazioni raster (pixels): XBM, BMP, PCX Costosi in termini di spazio Formati compressi: es. GIF Graphic Interchange Format (buono per immagine B/N) JPEG Joint Photographic Experts Group (la perdita è parametrizzata) TIFF Tagged Image File Format (permette di memorizzare metadati) TGA Targa Image File (per video games)
27 Documenti [semi]-strutturati Definizioni Un documento strutturato è composto da sezioni distinte, testuali o multimediali, di lunghezza variabile. Le sezioni sono sequenze di caratteri omogenee rispetto all argomento che trattano. Gli archivi di documenti strutturati, sono collezioni di documenti che hanno una struttura rigidamente fissata, archivi semi-strutturati sono caratterizzati da irregolarità nella struttura, ad esempio i documenti su web. Si assume che ciascun documento contenga un numero prefissato di sezioni comuni a tutti (es: URL, Titolo, Testo). Documenti non strutturati Documenti semi strutturati Documenti strutturati
28 Documenti con struttura omogenea Documento: è una sequenza di sezioni (campi) fissi non sovrapposti Es: una mail ha i seguenti campi: sender, receiver, date, subject e un corpo. data text campi text text I campi sono delimitati dai tag (per l individuazione)
29 Linguaggi per la codifica di Documenti semi-strutturati I documenti [semi]-strutturati di una collezione sono conformi a un modello di dati semistrutturati (Abiteboul et al. 2000) Un modello di dati semistrutturati è definito mediante un metalinguaggio. Ad es. un documento scritto in HTML è un istanza di un modello di dati semistrutturati I documenti [semi]-strutturati possono essere rappresentati da grafi diretti in cui i nodi sono le sezioni (sottoparti del documento) e le connessioni tra nodi le relazioni tra le sottoparti.
30 Linguaggi per la codifica di documenti semi-strutturati I linguaggi di markup sono stati definiti per permettere di descrivere mediante comandi testuali inseriti nel testo di un documento istruzioni di formattazione, di strutturazione, e attributi del testo. SGML (Standard Generalized Markup Language ISO 8879) è il metalinguaggio standard per la definizione di linguaggi di markup.
31 Linguaggi di Markup Usati per annotare documenti con tags che indicano un layout o un informazione semantica. La maggior parte dei linguaggi per la compilazione di documenti (RTF, Latex, HTML) definiscono primariamente il layout. Standard GML(1969) SGML (1985) HTML (1993) HyperText extensible XML (1998)
32 Come creare una collezione omogenea di Documenti XML Specifiche di XML in Italiano tradotte dal sito W3C 1) Si definiscono dei vincoli sulla possibile struttura dei documenti XML di una collezione. A tale scopo si crea il DTD (Document Type Definition) (*.dtd) (La specifica del DTD è opzionale in XML) XML schema (*.xsd) 2) Si creano i documenti della collezione. File.XML. Ogni documento è un istanza del DTD e può essere rappresentato da un grafo 3) Si creano i file di stile per specificare l aspetto tipografico dei documenti. File XSL (extensible Stylesheet Language)
33 Document Type Definition DTD Standard MathML: per le formule matematiche. SMIL (Synchronized Multimedia Integration Language): per lo scheduling di presentazioni multimediali RDF (Resource Description Framework): per i metadati di risorse web TEI (Text Encoding Initiative): For literary works. NewsML: per le notizie. GML (Geographic markup language): per I dati georeferenziati. AIML: per la strumentazione astronomica
34 Parsing di Documenti XML Processamento di un documento XML al fine di creare una struttura dati interna per ulteriori processamenti. SAX (Simple API per XML): legge un testo XML, individua gli eventi (delimitatori di tag) che vengono mandati all applicazione per ulteriori processamenti (es. Analisi lessicale o di contenuto). DOM (Document Object Model): scandisce un testo XML e costruisce una struttura dati ad albero object-oriented. Fornisce delle funzioni che possono essere richiamate da programma per manipolare i nodi dell'albero: introduce un livello di astrazione tra il documento XML e l'applicazione che lo deve utilizzare/elaborare
35 Documenti XML nella collezione INEX articoli di riviste IEEE article fm bdy ti atl sec Ieee trans on Syst. Image analysis st introduction p This paper
36 Definizione dello stile dei documenti (Extensible Style-sheet Language) Per specificare l aspetto tipografico di un documento istanza di un dato DTD, è necessario definire un file di stile, ad es. in XSL (extensible Stylesheet Language) = istanza di XML Permette di definire layout per documenti XML. Permette di definire come mappare XML in XHTML. Alternativamente per definire uno style sheet di documenti HTML si può associare un file in CSS (Cascading Style Sheet) Mantenendo separata la definizione strutturale del documento dalla definizione di stile è possibile produrre layout diversi dello stesso documento senza dover duplicare il contenuto del documento stesso, ma semplicemente associando un file di stile diverso. Ciò garantisce la consistenza delle informazioni in caso di aggiornamento dei dati.
37 Gestione di una collezione di Documenti semistrutturati in XML schema.dtd Doc1.XML Doc2.XML. Docn.XML Istanze del DTD Layout1.XSL Layout1-doc1.XSL Layout1-doc2.XSL Layout1-docn.XSL Layoutm.XSL Layoutm-doc1.XSL Layoutm-doc2.XSL Layoutm-docn.XSL
Introduzione all Information Retrieval
Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information
Dettagliconnessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI
Documenti su Internet LINGUAGGI DI MARKUP Internet permette (tra l altro) di accedere a documenti remoti In generale, i documenti acceduti via Internet sono multimediali, cioè che possono essere riprodotti
DettagliSISTEMI PER L ACCESSO L INFORMAZIONI. Gabriella Pasi. Università degli Studi di Milano Bicocca U14 - Viale Sarca 336 e-mail: pasi@disco.unimib.
SISTEMI PER L ACCESSO L A INFORMAZIONI Gabriella Pasi Università degli Studi di Milano Bicocca U14 - Viale Sarca 336 e-mail: pasi@disco.unimib.it Programma del corso 1. Introduzione Il problema dell accesso
DettagliLaboratorio Matematico Informatico 2
Laboratorio Matematico Informatico 2 (Matematica specialistica) A.A. 2006/07 Pierluigi Amodio Dipartimento di Matematica Università di Bari Laboratorio Matematico Informatico 2 p. 1/1 Informazioni Orario
DettagliLa gestione del documento
Operatore giuridico d impresa Informatica Giuridica A.A 2002/2003 II Semestre La gestione del documento prof. Monica Palmirani Il documento A differenza del dato il documento è solitamente un oggetto non
DettagliInformatica per la comunicazione" - lezione 10 -
Informatica per la comunicazione" - lezione 10 - Evoluzione del Web" Nell evoluzione del Web si distinguono oggi diverse fasi:" Web 1.0: la fase iniziale, dal 1991 ai primi anni del 2000" Web 2.0: dai
DettagliStrutturazione logica dei dati: i file
Strutturazione logica dei dati: i file Informazioni più complesse possono essere composte a partire da informazioni elementari Esempio di una banca: supponiamo di voler mantenere all'interno di un computer
DettagliFILE: ESTENSIONI o Formati. Augusto Grossi
FILE: ESTENSIONI o Formati Augusto Grossi File: estensioni Tutti i file sono distinguibili tra loro, oltre che dal nome e dall icona, anche dal formato (o estensione), indicato sempre dopo il nome del
DettagliBasi di Dati Multimediali. Fabio Strocco
Basi di Dati Multimediali Fabio Strocco September 19, 2011 1 Contents 2 Introduzione Le basi di dati (o database) hanno applicazioni in molti campi, in cui è necessario memorizzare, analizzare e gestire
Dettagliextensible Markup Language
XML a.s. 2010-2011 extensible Markup Language XML è un meta-linguaggio per definire la struttura di documenti e dati non è un linguaggio di programmazione un documento XML è un file di testo che contiene
DettagliXML. XML è contemporaneamente: XML non è:
XML XML è contemporaneamente: Linguaggio di annotazione (Markup) che permette di creare gruppi di marcatori (tag set) personalizzati (MathML, XHTML, chemicalml, ecc..) Formato standard per lo scambio dei
DettagliOttimizzazione delle interrogazioni (parte I)
Ottimizzazione delle interrogazioni I Basi di Dati / Complementi di Basi di Dati 1 Ottimizzazione delle interrogazioni (parte I) Angelo Montanari Dipartimento di Matematica e Informatica Università di
Dettagli1. BASI DI DATI: GENERALITÀ
1. BASI DI DATI: GENERALITÀ BASE DI DATI (DATABASE, DB) Raccolta di informazioni o dati strutturati, correlati tra loro in modo da risultare fruibili in maniera ottimale. Una base di dati è usualmente
DettagliISTITUTO TECNICO ECONOMICO MOSSOTTI
CLASSE III INDIRIZZO S.I.A. UdA n. 1 Titolo: conoscenze di base Conoscenza delle caratteristiche dell informatica e degli strumenti utilizzati Informatica e sistemi di elaborazione Conoscenza delle caratteristiche
DettagliXML: extensible Markup Language
XML: extensible Markup Language Laura Farinetti Dip. Automatica e Informatica Politecnico di Torino laura.farinetti@polito.it L. Farinetti - Politecnico di Torino 1 Introduzione XML: extensible Markup
DettagliBASE DI DATI: introduzione. Informatica 5BSA Febbraio 2015
BASE DI DATI: introduzione Informatica 5BSA Febbraio 2015 Di cosa parleremo? Base di dati relazionali, modelli e linguaggi: verranno presentate le caratteristiche fondamentali della basi di dati. In particolare
DettagliProtocolli applicativi: FTP
Protocolli applicativi: FTP FTP: File Transfer Protocol. Implementa un meccanismo per il trasferimento di file tra due host. Prevede l accesso interattivo al file system remoto; Prevede un autenticazione
DettagliWorking Draft 0.5 (Telefonia)
Working Draft 0.5 (Telefonia) Abstract Lo scopo del progetto è lo sviluppo di un SCP (Semantic Collaborative Portal), cioè un sistema di visualizzazione di una banca dati documentaria di grandi dimensioni
DettagliOrganizzazione degli archivi
COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i
Dettagli2.1 Introduzione ai linguaggi di marcatura
Fondamenti di Informatica Sistemi di Elaborazione delle Informazioni Informatica Applicata 2.1 Introduzione ai linguaggi di marcatura Antonella Poggi Anno Accademico 2012-2013 DIPARTIMENTO DI SCIENZE DOCUMENTARIE
DettagliIntroduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico
Introduzione alle basi di dati Introduzione alle basi di dati Gestione delle informazioni Base di dati Modello dei dati Indipendenza dei dati Accesso ai dati Vantaggi e svantaggi dei DBMS Gestione delle
DettagliEditoria Digitale. Schema didattico di riferimento 1
Editoria Digitale Schema didattico di riferimento 1 1. Che cos è un documento digitale? 1. Cos è un documento digitale 2. Qual è la natura del libro digitale 3. Quali sono le differenze tra l editoria
DettagliProgettaz. e sviluppo Data Base
Progettaz. e sviluppo Data Base! Progettazione Basi Dati: Metodologie e modelli!modello Entita -Relazione Progettazione Base Dati Introduzione alla Progettazione: Il ciclo di vita di un Sist. Informativo
DettagliLibrerie digitali. Introduzione. Cos è una libreria digitale?
Librerie digitali Introduzione Cos è una libreria digitale? William Arms "An informal definition of a digital library is a managed collection of information, with associated services, where the information
DettagliRICERCA DELL INFORMAZIONE
RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa
Dettaglib) Dinamicità delle pagine e interattività d) Separazione del contenuto dalla forma di visualizzazione
Evoluzione del Web Direzioni di sviluppo del web a) Multimedialità b) Dinamicità delle pagine e interattività c) Accessibilità d) Separazione del contenuto dalla forma di visualizzazione e) Web semantico
DettagliEXPLOit Content Management Data Base per documenti SGML/XML
EXPLOit Content Management Data Base per documenti SGML/XML Introduzione L applicazione EXPLOit gestisce i contenuti dei documenti strutturati in SGML o XML, utilizzando il prodotto Adobe FrameMaker per
DettagliSimple & Efficient. www.quick-software-line.com
Cosa è XML? extensible Markup Language Linguaggio è una definizione limitativa XML serve a descrivere con precisione qualsiasi informazione XML è estensibile. Ovvero non ha tag predefiniti come HTML XML
DettagliRappresentazione della Conoscenza. Lezione 10. Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0
Rappresentazione della Conoscenza Lezione 10 Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0 Sistemi ed applicazioni Sistemi di rappresentazione della conoscenza basati su logiche descrittive.
DettagliDatabase. Si ringrazia Marco Bertini per le slides
Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida
DettagliAnalisi dei requisiti e casi d uso
Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................
DettagliOUTPUT DI STATA IN MARK-UP LANGUAGES: GENERAZIONE AUTOMATICA DI TABELLE IN HTML E LATEX
1 CONVEGNO ITALIANO DEGLI UTENTI DI STATA OUTPUT DI STATA IN MARK-UP LANGUAGES: GENERAZIONE AUTOMATICA DI TABELLE IN HTML E LATEX Rosa Gini Jacopo Pasquini Osservatorio di Epidemiologia Agenzia Regionale
DettagliAPPENDICE C extensible Markup Language
APPENDICE C extensible Markup Language C.1 extensible Markup Language, concetti di base XML è un dialetto di SGML progettato per essere facilmente implementabile ed interoperabile con i suoi due predecessori
Dettagli/XML ALBERTO BELUSSI ANNO ACCADEMICO 2009/2010 XML
XML 1 ALBERTO BELUSSI ANNO ACCADEMICO 2009/2010 XML XML è un linguaggio di marcatura proposto dal W3C XML definisce una sintassi generica per contrassegnare i dati di un documento elettronico con marcatori
DettagliI Sistemi Informativi
I Sistemi Informativi Definizione Un Sistema Informativo è un mezzo per acquisire, organizzare, correlare, elaborare e distribuire le informazioni che riguardano una realtà che si desidera descrivere e
DettagliStrumenti di modellazione. Gabriella Trucco
Strumenti di modellazione Gabriella Trucco Linguaggio di modellazione Linguaggio formale che può essere utilizzato per descrivere (modellare) un sistema Il concetto trova applicazione soprattutto nell
DettagliCosa è un foglio elettronico
Cosa è un foglio elettronico Versione informatica del foglio contabile Strumento per l elaborazione di numeri (ma non solo...) I valori inseriti possono essere modificati, analizzati, elaborati, ripetuti
DettagliArchitettura del. Sintesi dei livelli di rete. Livelli di trasporto e inferiori (Livelli 1-4)
Architettura del WWW World Wide Web Sintesi dei livelli di rete Livelli di trasporto e inferiori (Livelli 1-4) - Connessione fisica - Trasmissione dei pacchetti ( IP ) - Affidabilità della comunicazione
DettagliIMMAGINE BITMAP E VETTORIALI
BITMAP VETTORIALE VETTORIALE BITMAP IMMAGINE BITMAP è una immagine costituita da una matrice di Pixel. PIXEL (picture element) indica ciascuno degli elementi puntiformi che compongono la rappresentazione
DettagliTecniche Multimediali
Chiedersi se un computer possa pensare non è più interessante del chiedersi se un sottomarino possa nuotare Edsger Dijkstra (The threats to computing science) Tecniche Multimediali Corso di Laurea in «Informatica»
DettagliEnrico Fagnoni <e.fagnoni@e-artspace.com> BOTK IN A NUTSHELL
Enrico Fagnoni BOTK IN A NUTSHELL 20/01/2011 1 Business Ontology ToolKit Business Ontology Toolkit (BOTK) è un insieme estensibile di strumenti per realizzare applicazioni basate
DettagliLezione 1. Introduzione e Modellazione Concettuale
Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and
DettagliLa struttura: DTD. Laura Farinetti Dip. Automatica e Informatica Politecnico di Torino. laura.farinetti@polito.it
La struttura: DTD Laura Farinetti Dip. Automatica e Informatica Politecnico di Torino laura.farinetti@polito.it L. Farinetti - Politecnico di Torino 1 Modello di struttura I tag annidati danno origine
DettagliArchivi e database. Prof. Michele Batocchi A.S. 2013/2014
Archivi e database Prof. Michele Batocchi A.S. 2013/2014 Introduzione L esigenza di archiviare (conservare documenti, immagini, ricordi, ecc.) è un attività senza tempo che è insita nell animo umano Primi
DettagliCostruire un progetto di digitalizzazione
Convegno di studio ABEI Senigallia 2012 Costruire un progetto di digitalizzazione standard, formati e strumenti adeguati agli obiettivi di un progetto relatore dr. Paolo Tentori Novantiqua Multimedia BIBLIOTECA
DettagliGESTIONE della BASE di DATI
GESTIONE della SE di DTI I dati sono una componente fondamentale di un GIS Devono essere valutati con attenzione gli strumenti usati per: creare l archivio dei dati manipolare le informazioni contenute
DettagliURI. Introduzione. Pag. 1
URI Introduzione Gli URI (Universal Resource Indentifier) sono una sintassi usata in WWW per definire i nomi e gli indirizzi di oggetti (risorse) su Internet. Questi oggetti sono considerati accessibili
DettagliIntroduzione al Semantic Web
Corso di Laurea Specialistica in Ingegneria Gestionale Corso di Sistemi Informativi Modulo II A. A. 2013-2014 Giuseppe Loseto Dal Web al Semantic Web 2 Dal Web al Semantic Web: Motivazioni Il Web dovrebbe
DettagliDispensa di database Access
Dispensa di database Access Indice: Database come tabelle; fogli di lavoro e tabelle...2 Database con più tabelle; relazioni tra tabelle...2 Motore di database, complessità di un database; concetto di
DettagliLe Basi di Dati. Le Basi di Dati
Le Basi di Dati 20/05/02 Prof. Carlo Blundo 1 Le Basi di Dati Le Base di Dati (database) sono un insieme di tabelle di dati strutturate in maniera da favorire la ricerca di informazioni specializzate per
DettagliInformatica. Prof. M. Colajanni Università di Modena Reggio Emilia
Informatica Prof. M. Colajanni Università di Modena Reggio Emilia PARTE 4 - World Wide Web WORLD WIDE WEB La killer application di Internet I motivi alla base del successo del Web ( perché è risultata
DettagliDal foglio di carta alla multimedialità
Dal foglio di carta alla multimedialità Multimediale Che utilizza più mezzi di comunicazione. Nell'ambito delle tecnologie educative significa utilizzare più mezzi didattici integrati. IPERTESTO E IPERMEDIA
DettagliFONDAMENTI di INFORMATICA L. Mezzalira
FONDAMENTI di INFORMATICA L. Mezzalira Possibili domande 1 --- Caratteristiche delle macchine tipiche dell informatica Componenti hardware del modello funzionale di sistema informatico Componenti software
DettagliArchitettura client-server
Architettura client-server In un architettura client-server ci sono due calcolatori connessi alla rete: un client che sottopone richieste al server un server in grado di rispondere alle richieste formulate
DettagliLinguaggi per il web oltre HTML: XML
Linguaggi per il web oltre HTML: XML Luca Console Con XML si arriva alla separazione completa tra il contenuto e gli aspetti concernenti la presentazione (visualizzazione). XML è in realtà un meta-formalismo
DettagliProtezione delle registrazioni di tracciamento da modifiche non autorizzate A R.1.6 [TU4452000/52/1/b]
7 CHECK LIST 7.1 Tabella di Controllo sezione 1 A R.1.1 [TU4452000/52/1/a] Garanzie di sicurezza e integrità del sistema A R.1.2 [DPCM311000/7/1] Requisiti minimi di sicurezza del sistema operativo dell
DettagliI linguaggi di marcatura e XML per la codifica dei dati d archivio
I linguaggi di marcatura e XML per la codifica dei dati d archivio Corso di formazione per l'apprendimento e l'utilizzo della piattaforma IBC-xDams Modena, 21 gennaio 2014 Mirella M. Plazzi e F.Ricci IBC
DettagliDBMS (Data Base Management System)
Cos'è un Database I database o banche dati o base dati sono collezioni di dati, tra loro correlati, utilizzati per rappresentare una porzione del mondo reale. Sono strutturati in modo tale da consentire
DettagliCome archiviare i dati per le scienze sociali
Come archiviare i dati per le scienze sociali ADPSS-SOCIODATA Archivio Dati e Programmi per le Scienze Sociali www.sociologiadip.unimib.it/sociodata E-mail: adpss.sociologia@unimib.it Tel.: 02 64487513
DettagliDBMS. Esempi di database. DataBase. Alcuni esempi di DBMS DBMS. (DataBase Management System)
(DataBase Management System) Sistemi di ges3one di basi di da3 Un Database Management System è un sistema software progettato per consentire la creazione e manipolazione efficiente di database (collezioni
DettagliApplicazioni web centrati sui dati (Data-centric web applications)
Applicazioni web centrati sui dati (Data-centric web applications) 1 ALBERTO BELUSSI ANNO ACCADEMICO 2009/2010 WEB La tecnologia del World Wide Web (WWW) costituisce attualmente lo strumento di riferimento
DettagliSiti web centrati sui dati (Data-centric web applications)
Siti web centrati sui dati (Data-centric web applications) 1 A L B E R T O B E L U S S I A N N O A C C A D E M I C O 2 0 1 2 / 2 0 1 3 WEB La tecnologia del World Wide Web (WWW) costituisce attualmente
DettagliUso delle basi di dati DBMS. Cos è un database. DataBase. Esempi di database
Uso delle basi di dati Uso delle Basi di Dati Il modulo richiede che il candidato comprenda il concetto di base dati (database) e dimostri di possedere competenza nel suo utilizzo. Cosa è un database,
DettagliLa Metodologia adottata nel Corso
La Metodologia adottata nel Corso 1 Mission Statement + Glossario + Lista Funzionalià 3 Descrizione 6 Funzionalità 2 Schema 4 Schema 5 concettuale Logico EA Relazionale Codice Transazioni In PL/SQL Schema
DettagliCorso di Access. Prerequisiti. Modulo L2A (Access) 1.1 Concetti di base. Utilizzo elementare del computer Concetti fondamentali di basi di dati
Corso di Access Modulo L2A (Access) 1.1 Concetti di base 1 Prerequisiti Utilizzo elementare del computer Concetti fondamentali di basi di dati 2 1 Introduzione Un ambiente DBMS è un applicazione che consente
DettagliReti di Calcolatori. Il Livello delle Applicazioni
Reti di Calcolatori Il Livello delle Applicazioni Il DNS Gli indirizzi IP sono in formato numerico: sono difficili da ricordare; Ricordare delle stringhe di testo è sicuramente molto più semplice; Il Domain
DettagliLa sintassi di un DTD si basa principalmente sulla presenza di quattro dichiarazioni:
XML: DTD Da un punto di vista cronologico, il primo approccio per la definizione di grammatiche per documenti XML è rappresentato dai Document Type Definition (DTD). Un DTD è un documento che descrive
DettagliCome leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci
Come leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci I motori di ricerca in internet: cosa sono e come funzionano Roberto Ricci, Servizio Sistema
DettagliIntroduzione ai database relazionali
Introduzione ai database relazionali Tabelle Un database (DB) è costituito da un insieme di file che memorizzano dati opportunamente organizzati Nei database relazionale tale organizzazione è costituita
DettagliScopo della lezione. Informatica. Informatica - def. 1. Informatica
Scopo della lezione Informatica per le lauree triennali LEZIONE 1 - Che cos è l informatica Introdurre i concetti base della materia Definire le differenze tra hardware e software Individuare le applicazioni
DettagliHTML e Linguaggi. Politecnico di Milano Facoltà del Design Bovisa. Prof. Gianpaolo Cugola Dipartimento di Elettronica e Informazione
HTML e Linguaggi Politecnico di Facoltà del Design Bovisa Prof. Gianpaolo Cugola Dipartimento di Elettronica e Informazione cugola@elet.polimi.it http://home.dei.polimi.it/cugola Indice Il linguaggio del
DettagliInternet Architettura del www
Internet Architettura del www Internet è una rete di computer. Il World Wide Web è l insieme di servizi che si basa sull architettura di internet. In una rete, ogni nodo (detto host) è connesso a tutti
DettagliIL SISTEMA INFORMATIVO
IL SISTEMA INFORMATIVO In un organizzazione l informazione è una risorsa importante al pari di altri tipi di risorse: umane, materiali, finanziarie, (con il termine organizzazione intendiamo un insieme
DettagliSITI-Reports. Progetto SITI. Manuale Utente. SITI-Reports. ABACO S.r.l.
Progetto SITI Manuale Utente SITI-Reports ABACO S.r.l. ABACO S.r.l. C.so Umberto, 43 46100 Mantova (Italy) Tel +39 376 222181 Fax +39 376 222182 www.abacogroup.eu e-mail : info@abacogroup.eu 02/03/2010
DettagliReti di Telecomunicazione Lezione 6
Reti di Telecomunicazione Lezione 6 Marco Benini Corso di Laurea in Informatica marco.benini@uninsubria.it Lo strato di applicazione protocolli Programma della lezione Applicazioni di rete client - server
Dettaglidisponibili nel pacchetto software.
Modulo syllabus 4 00 000 00 0 000 000 0 Modulo syllabus 4 DATABASE 00 000 00 0 000 000 0 Richiede che il candidato dimostri di possedere la conoscenza relativa ad alcuni concetti fondamentali sui database
Dettagli01. Conoscere l area di lavoro
01. Conoscere l area di lavoro Caratteristiche dell interfaccia Cambiare vista e dividere le viste Gestire i pannelli Scegliere un area di lavoro Sistemare le barre degli strumenti Personalizzare le preferenze
DettagliSistema Informativo Geografico:
Sistemi Informativi Geografici Sistema Informativo Geografico: È un sistema informativo che tratta informazioni spaziali georeferenziate, ne consente la gestione e l'analisi. Informazioni spaziali: dati
DettagliXSL: extensible Stylesheet Language
XSL: extensible Stylesheet Language XSL è un insieme di tre linguaggi che forniscono gli strumenti per l elaborazione e la presentazione di documenti XML in maniera molto flessibile. I tre linguaggi devono
DettagliData Base. Prof. Filippo TROTTA
Data Base Definizione di DataBase Un Database può essere definito come un insieme di informazioni strettamente correlate, memorizzate su un supporto di memoria di massa, costituenti un tutt uno, che possono
DettagliPiano di gestione della qualità
Piano di gestione della qualità Pianificazione della qualità Politica ed obiettivi della qualità Riferimento ad un eventuale modello di qualità adottato Controllo della qualità Procedure di controllo.
DettagliIl database management system Access
Il database management system Access Corso di autoistruzione http://www.manualipc.it/manuali/ corso/manuali.php? idcap=00&idman=17&size=12&sid= INTRODUZIONE Il concetto di base di dati, database o archivio
DettagliALLEGATO AL MANUALE DEL SERVIZIO DI CONSERVAZIONE DEI DOCUMENTI INFORMATICI CLASSI DOCUMENTALI
ALLEGATO AL MANUALE DEL SERVIZIO DI CONSERVAZIONE DEI DOCUMENTI INFORMATICI CLASSI DOCUMENTALI Pag.2 di 10 Indice 1. Introduzione... 2. oggetto di conservazione... 3. Formati dei file inviabili in conservazione
DettagliISTITUTO ISTRUZIONE SUPERIORE "L. EINAUDI" - ALBA (CN) ANNO SCOLASTICO 2014/2015
ISTITUTO ISTRUZIONE SUPERIORE "L. EINAUDI" - ALBA (CN) ANNO SCOLASTICO 2014/2015 CLASSE: 1 I Disciplina: Tecnologia dell Informazi one e della Comunicazione. PROGETTAZIONE DIDATTICA ANNUALE Elaborata e
DettagliInformatica grafica e Multimedialità. 4 Immagini grafiche
Immagini raster e vettoriali Le immagini grafiche si distinguono in due classi differenti: immagini raster e immagini vettoriali. Le immagini raster, dette anche pittoriche o pixel-oriented, dividono l
DettagliTecnologie Web T Introduzione a XML
Tecnologie Web T Introduzione a Home Page del corso: http://www-db.deis.unibo.it/courses/tw/ Versione elettronica: 2.01..pdf Versione elettronica: 2.01.-2p.pdf 1 Che cos è? : Extensible Markup Language:
DettagliHTML il linguaggio per creare le pagine per il web
HTML il linguaggio per creare le pagine per il web Parte I: elementi di base World Wide Web Si basa sul protocollo HTTP ed è la vera novità degli anni 90 Sviluppato presso il CERN di Ginevra è il più potente
DettagliIl linguaggio SQL. è di fatto lo standard tra i linguaggi per la gestione di data base relazionali.
(Structured Query Language) : Il linguaggio è di fatto lo standard tra i linguaggi per la gestione di data base relazionali. prima versione IBM alla fine degli anni '70 per un prototipo di ricerca (System
DettagliIntroduzione ai Web Services Alberto Polzonetti
PROGRAMMAZIONE di RETE A.A. 2003-2004 Corso di laurea in INFORMATICA Introduzione ai Web Services alberto.polzonetti@unicam.it Introduzione al problema della comunicazione fra applicazioni 2 1 Il Problema
DettagliARCHIMEDIA Il Programma di ARCHIVIAZIONE OTTICA
ARCHIMEDIA Il Programma di ARCHIVIAZIONE OTTICA Che cosa è ArchiMedia Concetti Generali La realizzazione di un archivio informatico di documenti, presuppone la possibilità di inserire in un unico contenitore
DettagliCORSI I principali programmi Adobe Photoshop/InDesign/Illustrator Nozioni di base
CORSI I principali programmi Adobe Photoshop/InDesign/Illustrator Nozioni di base Interfaccia programma InDesign Comprendere il concetto dei programmi Adobe e la loro funzione Prima di tutto bisogna tener
DettagliCome funziona il WWW. Architettura client-server. Web: client-server. Il protocollo
Come funziona il WWW Il funzionamento del World Wide Web non differisce molto da quello delle altre applicazioni Internet Anche in questo caso il sistema si basa su una interazione tra un computer client
DettagliUn ripasso di aritmetica: Rappresentazione binaria - operazioni. riporti
Un ripasso di aritmetica: Rappresentazione binaria - operazioni A queste rappresentazioni si possono applicare le operazioni aritmetiche: riporti 1 1 0 + 1 0 = 1 0 0 24 Un ripasso di aritmetica: Rappresentazione
DettagliScaletta. Estensioni UML per il Web. Applicazioni web - 2. Applicazioni web. WAE: Web Application Extension for UML. «Client page»
Scaletta Estensioni UML per il Web Michele Zennaro 14-05-2004 Le applicazioni web Scopo di un estensione UML per il web Due punti di vista Uno più astratto Uno più vicino ai file fisici conclusivo Commenti
DettagliCompilatore risorse display grafico LCD serie IEC-line
Compilatore risorse display grafico LCD serie IEC-line aggiornamento: 22-11-2012 IEC-line by OVERDIGIT overdigit.com 1. Il display grafico LCD I PLC della serie IPC-line possono disporre opzionalmente
DettagliIl calcolatore - Applicazioni
Alfonso Miola Il calcolatore - Applicazioni Esercitazione Dispensa B-01-E Settembre 2005 1 Contenuti Applicazioni Applicazioni e Interfacce Il pacchetto Office Word Excel Power Point Il CD per ECDL 2 Applicazioni
DettagliRECOGNITION ProductInfo
RECOGNITION Product Info Indicizzazione Automatica tramite Riconoscimento di Codice a Barre e Testo RECOGNITION rende ancor più rapida l archiviazione di documenti in DocuWare, grazie all individuazione
DettagliAccess. P a r t e p r i m a
Access P a r t e p r i m a 1 Esempio di gestione di database con MS Access 2 Cosa è Access? Access e un DBMS che permette di progettare e utilizzare DB relazionali Un DB Access e basato sui concetti di
DettagliStruttura del formato MARC21 Bibliografico per la catalogazione delle risorse elettroniche. Griglia consigliata dei campi a lunghezza variabile.
Struttura del formato per la catalogazione delle risorse elettroniche. Griglia consigliata dei campi a lunghezza variabile. A cura di Florica Campeanu e Paola Manoni. Campo Nome Note Esempi 000 LEADER
DettagliBASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone
BASI DI DATI per la gestione dell informazione Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone Libro di Testo 22 Chianese, Moscato, Picariello e Sansone BASI DI DATI per la Gestione dell
Dettagli