Il Sistema Integrato dei Istat

Documenti analoghi
I DATI E LA LORO INTEGRAZIONE 63 4/001.0

Elena Baralis 2007 Politecnico di Torino 1

Syllabus A042 Insegnamenti disciplinari

I dati geografici come perno della conoscenza su un territorio Antonella Poggi

Basi di Dati. Concetti e Principi Generali. Maria Mirto

Le basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza

R. Orsini - A. Roncato - F. Dalla Libera

AscotWeb - mediatore Versione dicembre 2015

DatiOpen: il portale Linked Open Data dell Istat

Introduzione Concetti Generali Pratica su Access Link utili. ECDL - Database. European Computer Driving Licence - Modulo 5 - Database LEZIONE 1

Cap. 1-I 1 I sistemi informatici

Basi di dati attive. Una base di dati è ATTIVA quando consente la definizione e la gestione di regole di produzione (regole attive o trigger).

Basi di dati. Elena Baralis Politecnico di Torino

SQL e linguaggi di programmazione. Cursori. Cursori. L interazione con l ambiente SQL può avvenire in 3 modi:

ERP, ENTERPRISE RESOURCE PLANNING

Basi di dati Basi di dati per bioinformatica

DOCENTE PROF. ALBERTO BELUSSI. Anno accademico 2010/11

Grid Data Management Services. Griglie e Sistemi di Elaborazione Ubiqui

UD12. Fotografie di conoscenza

Basi di dati D O C E N T E P R O F. A L B E R T O B E L U S S I. Anno accademico 2012/13

SISTEMI INFORMATIVI TERRITORIALI DATABASES -LEZIONE 3

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1

Programmare e valutare la formazione

SISTEMI INFORMATIVI E DATABASE

Informatica per le Scienze Umane. Introduzione al corso: programma

BASI DI DATI E UTENTI DI BASI DI DATI

Elementi di Informatica LB Basi di Dati. Anno accademico 2007/2008 Prof. Stefano Contadini

Il progetto Sistan Hub per la diffusione delle statistiche ufficiali al servizio dei processi decisionali sul territorio

TECNOLOGIA INNOVAZIONE: IL CNR DI PISA LANCIA ODINET, IL GOOGLE DEGLI OPEN DATA

Ore settimanali di lezione: 3 h di cui 2 in compresenza con l insegnante di Lab. di Informatica prof.ssa E.De Gasperi

Esercitazione di Basi di Dati

Simulatore dinamico di un impianto CSP a sali fusi validato da prove sperimentali

OSSERVATORIO DEL MERCATO DEL LAVORO: EVOLUZIONI DEL SISTEMA INFORMATIVO LAVORO

S.T.A.R. Statistical network in Tourism sector of Adriatic Region -

Data warehouse: esperienze, sviluppi e prospettive

Da un sistema provinciale ad uno regionale Il SIRED L esperienza della Sardegna

Linguaggi e Ambienti di Programmazione

SESSIONE PITCH 1 Big Data Analytics Qlik

Cybersecurity per la PA: approccio multicompliance Sogei

REPERTORIO DELLE QUALIFICAZIONI PROFESSIONALI DELLA REGIONE CAMPANIA

Basi di Dati. Corso di Informatica. Memorizzazione dei Dati. Accesso ai Dati. Corso di Laurea in Conservazione e Restauro dei Beni Culturali

La standardizzazione dei metadati della Pubblica Amministrazione

Progetto Base di Conoscenza del Contribuente

Open Database Connectivity (ODBC)

IL SITO TREVISOLAVORA

Company Profile IMOLA INFORMATICA

Ingegneria del Software 4. Introduzione a UML. Dipartimento di Informatica Università di Pisa A.A. 2014/15

DataBase Management System - DBMS

Interrogazioni in linguaggio naturale a basi dati eterogenee: l ontologia del

Database. Cos è un database? Intro Tipi di entità Mapping ER/EER à Relazionale

Architetture distribuite per progetti di egovernment

Le basi di dati. Le basi di dati. dalla teoria all'utilizzo di tutti i giorni. Alessandro Tanasi

Il business del significato (e delle ontologie)

Informatica per le Scienze Umane. Introduzione al corso: programma dettagliato

IL PROCESSO di PROGETTAZIONE

INFORMATICA PER LE SCIENZE UMANE a.a. 2016/2017

SISTEMA INFORMATIVO E SISTEMA INFORMATICO. Sistema informativo e sistema informatico

APPENDICE 4 AL CAPITOLATO TECNICO

Ripasso Concetti Pratica in Access Link utili. ECDL - Database. European Computer Driving Licence - Modulo 5 - Database LEZIONE 3

ARCHITETTURA DI UN DBMS

MODELLI DEI DATI. Informatica Generale (AA 07/08) Corso di laurea in Scienze della Comunicazione Facoltà di Lettere e Filosofia

Data warehouse: introduzione

Informatica Generale (AA 07/08) Corso di laurea in Scienze della Comunicazione Facoltà di Lettere e Filosofia. Università degli Studi di Salerno

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB

Comunità Tematica DOCUMENTI DIGITALI. Ambito strategico e allineamento ADER

Towards Shared Patient Records: an Architecture for Using Routine Data for Nationwide Research

I DSS e la gestione dei dati e della conoscenza. Prof. Luca Gnan

INFORMATICA PER LE SCIENZE UMANE a.a. 2015/2016

INFORMATICA. Prof. MARCO CASTIGLIONE ITS Tito Acerbo - PESCARA

CONCETTI E ARCHITETTURA DI UN SISTEMA DI BASI DI DATI

Flussi informativi integrati

INTRODUZIONE. Prof. Fabio A. Schreiber. Dipartimento di Elettronica e Informazione Politecnico di Milano PROGRAMMA DEL CORSO

Accesso a banche dati remote ed eterogenee mediante interfacce di browsing su thesauri

Introduzione alle Basi di Dati

Orkestrio PEC Dare valore alla PEC grazie alla gestione documentale

LogIS Logistics Information System Il Port Community System di Venezia

PROGRAMMAZIONE INFORMATICA SECONDO BIENNIO. Liceo Scientifico opzione Scienze Applicate

Rappresentazione della Conoscenza. Lezione 1. Rappresentazione della Conoscenza Daniele Nardi, 2008Lezione 1 0

Tecniche per l Integrazionel di Dati Eterogenei

Un sistema di registri statistici basato sull integrazione di informazioni da archivi amministrativi, indagini statistici e stime di popolazione

SISTEMA UNICO E CENTRALIZZATO

BEST PRACTICE NELLE RETI DI RICERCA E SISTEMI DI SERVIZIO DELLA GESTIONE DOCUMENTALE DIGITALE. dott. MARIO PO Roma 25 maggio 2007

CREAZIONE DI FRAMEWORK PER LO SCAMBIO DATI FRA IMPRESE: DIZIONARIO E GENERATORE DI XML SCHEMA IN MODA-ML

Basi di dati Architetture e linee di evoluzione

CREARE VALORE DAGLI OPEN DATA Open Data Integration per le aziende. Mirko Orsini, CEO & Co-Founder

INTRODUZIONE ALLA PROGETTAZIONE. Patrizio Dazzi a.a

Esperienze di Advanced Analytics nella statistica ufficiale: strumenti e progetti

SISTEMI INFORMATIVI GEOGRAFICI (GIS)

Allegato A. Codice candidatura. Requisiti minimi. N. unità. Descrizione profilo

Basi di dati. Giuseppe De Giacomo. Dipartimento di Informatica e Sistemistica Antonio Ruberti SAPIENZA Università di Roma

InViMall - Intelligent Virtual Mall. Progetto MSE MI Modello del Dominio. Survey

INNOVAZIONI E SPERIMENTAZIONI. Nuove prospettive per la statistica ufficiale: metodi bayesiani per la stima dei flussi demografici

Introduzione alla Modellazione Solida

Misurare la conoscenza e i ritorni dei programmi di Knowledge Management: concetti e approcci

GESTIONE DOCUMENTALE E DEMATERIALIZZAZIONE. Syllabus Versione 2.0

Dall informatica dell Inail all Inail digitale Sintesi di un percorso di valorizzazione delle persone e di ripensamento dell organizzazione.

Introduzione al Semantic Web

Presentazione Società. Tel.:

Algoritmi, Strutture Dati e Programmi. UD 1.d: Dati e Tipi di Dato

Tesi di Laurea Triennale in Ingegneria Informatica REALIZZAZIONE DI UN APPLICATIVO PER LA GESTIONE DI FOGLI DI LAVORO INTEGRATO IN OUTLOOK 2010

Transcript:

Il Sistema Integrato dei Registri @ Istat Progettazione e realizzazione di una architettura Ontology-Based Mauro Bruno, Roberta Radini, Laura Tosco Istituto Nazionale di Statistica - Istat

Sommario Il contesto Il Sistema Integrato dei Registri (SIR) Ontology Based Data Management System (OBDM) Realizzazione del SIR attraverso un OBDM Esempi di interrogazione del SIR Sistema Integrato dei Registri, Mauro Bruno Forum PA 2

Il contesto Programma di modernizzazione dell ISTAT: Ufficialmente approvato nel 2016 Profonda revisione della struttura organizzativa. Centralizzazione delle strutture trasversali (Informatica, Metodologia, Raccolta Dati, Diffusione) Profonda revisione dei processi di produzione statistica Sistema Integrato dei Registri (SIR) rappresenta uno dei pilastri della nuova architettura: «Single logical environment to support the consistency of statistical production processes, in particular identification and estimation for the whole integrated system of units and variables» Sistema Integrato dei Registri, Mauro Bruno Forum PA 3

Sistema Integrato dei Registri (SIR) Registro Individui Individui Unità Economiche Registro Attività Registro Luoghi Attività Registro Unità Economiche Luoghi Rappresentazione insiemistica Rappresentazione Entità-Relazione Sistema Integrato dei Registri, Mauro Bruno Forum PA 4

SIR: tipologie di registro RSB (Registro Base) contiene diverse popolazioni statistiche e il set minimo di variabili per caratterizzare le unità statistiche RSE (Registro Esteso) estende le informazioni di un RSB su una popolazione specifica RST (Registro Tematico) supporta più processi statistici trattando alcuni temi in modo consistente e condiviso Sistema Integrato dei Registri, Mauro Bruno Forum PA 5

SIR: Data Architecture Registro Base: Attività Registro Tematico: Relazioni di lavoro Registro Base: Unità Economiche Registro Base: Individui e Famiglie Registro Base: Luoghi Sistema Integrato dei Registri, Mauro Bruno Forum PA 6

SIR: what s missing? Sistema integrato dei registri: Ambiente di supporto dei processi di produzione Permette di identificare e stimare le unità statistiche Garantisce l integrità dei dati a livello di record Come accedere ai dati in modo integrato e indipendente dall eterogeneità (semantica & tecnologica) delle fonti dati? Ontology Based Data Management System Sistema Integrato dei Registri, Mauro Bruno Forum PA 7

Ontology Based Data Management System (OBDM) OBDM: Permette di accedere, integrare e gestire differenti fonti di dati Basato su una architettura a tre livelli: Ontologia: rappresentazione formale e concettuale del dominio di interesse Sorgenti dati: sorgenti dei dati input generalmente eterogenee sia dal punto di vista semantico che tecnologico Mapping: permette di specificare le corrispondenze tra le sorgenti dati e l ontologia Sistema Integrato dei Registri, Mauro Bruno Forum PA 8

Ontology Based Data Management System (OBDM) Ontologia Mapping Livello di Mapping Mapping delle fonti dati nei corrispondenti concetti definiti nell ontologia Registro Individui Registro Luoghi Registro Unità Economiche OBDM è progettato al fine di garantire l integrità all interno di ciascun registro (intra) e tra registri (inter) Sistema Integrato dei Registri, Mauro Bruno Forum PA 9

OBDM: Principali caratteristiche Caratteristiche principali di OBDM: Trasparenza: rispetto alle sorgenti dati. Non è necessario conoscere come & dove sono memorizzati i dati Vista globale: i concetti sono definiti globalmente in modo univoco. Concetti definiti in diversi domini devono essere modellati sull ontologia Consistenza: l utilizzo di una rappresentazione formale permette di evidenziare eventuali inconsistenze semantiche e nei dati (funzionalità di reasoning) Sistema Integrato dei Registri, Mauro Bruno Forum PA 10

ODBM: Architettura M2M LOD OBDM Dissemination DW Sistema Integrato dei Registri, Mauro Bruno Forum PA 11

Vantaggi di un SIR basato su OBDM Livello ontologico: Gestisce l accesso al sistema offrendo servizi all utente finale Permette di governare la fase di data-integration garantendo la qualità dei dati integrati (l ontologia non è utilizzata solo a livello documentale) Offre funzionalità di reasoning permettendo di inferire nuova conoscenza gli utenti statistici possono scoprire pattern impliciti che permettono di comprendere più a fondo i dati da analizare Sistema Integrato dei Registri, Mauro Bruno Forum PA 12

Vantaggi di un SIR basato su ontologie Integration layer: Permette di virtualizzare le sorgenti dati Esegue interrogazioni on-the-fly Metadati: Formalizzazione dei metadati consente l accoppiamento di dati & metadati Modellazione formale consente di accedere ai metadati tramite sistemi IT Sistema Integrato dei Registri, Mauro Bruno Forum PA 13

Esempio di interrogazione del SIR

Ontologia delle Relazioni di lavoro Individuo Lavoratore Sistema Integrato dei Registri, Mauro Bruno Forum PA 15

Ontologia degli Individui Individuo Sistema Integrato dei Registri, Mauro Bruno Forum PA 16

Integrazione dati: stesso concetto Individuo (Ontologia Individui) Individuo (Ontologia relazioni di lavoro) Sistema Integrato dei Registri, Mauro Bruno Forum PA 17

Interrogazione attraverso l ontologia Vorremmo ottenere una risposta alla seguente domanda: le persone che hanno la residenza in una certa regione e classificarle per età, titolo di studio e condizione occupazionale Non è necessario conoscere come & dove sono memorizzati i dati Sistema Integrato dei Registri, Mauro Bruno Forum PA 18

Interrogazione attraverso l ontologia Interrogazione (SPARQL) Ontologia Mapping Individui che hanno la residenza in una regione classificati per età e titolo di studio Registro Individui Generazione di query SQL attraverso algoritmi di query-rewriting Registro Lavoro Individui classificati sulla condizione lavorativa Sistema Integrato dei Registri, Mauro Bruno Forum PA 19

Grazie per la vostra attenzione!