Ingestion tools for open data (via files and services) towards DISIT Ontology for Smart City



Documenti analoghi
Km4City: Accesso Semplice a

Service Map API. FODD, Florence Open Data Day Salone de Dugento, Palazzo Vecchio, Firenze 21/02/2015

NuMa Nuove Manutenzioni. Web Application per la Gestione dell Iter di Manutenzione degli Edifici e del Territorio

Puoi aumentare la popolarità della tua azienda e singoli prodotti, sia a livello locale che più ampio.

Cosa è un foglio elettronico

Alfa Layer S.r.l. Via Caboto, Torino ALFA PORTAL

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

Linee guida per il Comitato Tecnico Operativo 1

Descrizione funzionale

SISTEMA DI TELECONTROLLO PER LA GESTIONE DELLA FLOTTA

Access. P a r t e p r i m a

ISTRUZIONI OPERATIVE AGGIORNAMENTO DEL 18/04/2013

La georeferenziazione delle banche dati gli Uffici Giudiziari in Toscana

Le Basi di Dati. Le Basi di Dati

4 PASSI PER INVIARE LA TUA NEWSLETTER CON MAILUP

Utilizzo della APP IrriframeVoice. Versione 1.0 maggio 2015

Aggregatore di Open Data del territorio fiorentino e toscano

istraffic Sistema di monitoraggio Traffico

INNOVAZIONE XNOTTA PER PORTALI TURISTICI

Istruzioni operative (v. 1.01) Servizio MB - Mobile Banking Banca Passadore

developed by Emanuele De Carlo

IL SISTEMA INFORMATIVO

Opportunity. Il nostro valore aggiunto nella gestione della fidelizzazione

Riccardo Dutto, Paolo Garza Politecnico di Torino. Riccardo Dutto, Paolo Garza Politecnico di Torino

BMSO1001. Virtual Configurator. Istruzioni d uso 02/10-01 PC

MANUALE PARCELLA FACILE PLUS INDICE

Il Centro di controllo del traffico. Fabio Cartolano Comune di Bologna

DBMS. Esempi di database. DataBase. Alcuni esempi di DBMS DBMS. (DataBase Management System)

Presentazione C-Navigo

DATANET Innovation & Integration

La Nabla Quadro s.r.l.

Introduzione ai Web Services Alberto Polzonetti

Guida alla registrazione on-line di un NovaSun Log

LE CARATTERISTICHE. Caratteristiche. - tel fax pag. 2

Cosa succede quando si naviga

Uso delle basi di dati DBMS. Cos è un database. DataBase. Esempi di database

Istruzioni per l utilizzo di file KML (Google Earth) con Software dei navigatori satellitari TELE System

Sebina OpenLibrary OPAC

leaders in engineering excellence

CENTRALE UNICA DI SOCCORSO

CRM / WEB CRM CUSTOMER RELATIONSHIP MANAGEMENT

Power-Studio è un semplice, veloce potente ed intuitivo applicativo software di monitoraggio e supervisione energetica che consente di realizzare:

Archiviazione digitale per SAP con DocuWare

SQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project

Configuration Management

Mon Ami 3000 Centri di costo Contabilità analitica per centri di costo/ricavo e sub-attività

Problem Management. Obiettivi. Definizioni. Responsabilità. Attività. Input

Sistema di Sorveglianza e Ambient Intelligence per Residenze Sanitarie Assistenziali

Basi di Dati e Microsoft Access

Istruzioni operative per la gestione delle Non Conformità e delle Azioni Correttive.

GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL

Guida alla registrazione on-line di un DataLogger

Progetto Turismo Pisa

CONTROLLO DI GESTIONE DELLO STUDIO

I sistemi di trasporto intelligenti: sperimentazione e innovazione nella Provincia di Livorno

Controllo accessi nei cantieri

Guida all accesso al portale e ai servizi self service

Guida dell utente. Centro di fatturazione UPS

IRSplit. Istruzioni d uso 07/10-01 PC

Introduzione a Quantum GIS (QGIS) - passaggio dal software ArcView 3.x a software GIS OpenSource

TUTOR81 e-learning PROFESSIONAL

InteGrazIone con MICrosoFt DYnaMICs. mailup.com

con Torino, 30 Settembre 2011 Amedeo Levorato Amministratore Delegato Federico Filira Responsabile R&S

TOOL PSCL FUNZIONALITÀ E PROCEDURE DI UTILIZZO

Il Sistema Informativo Territoriale del Comune di Siena

1. BASI DI DATI: GENERALITÀ

Comuninrete sistema integrato per la gestione di siti web ed interscambio di informazioni e servizi.

L insieme di queste funzioni, costituisce un sistema completo di gestione e controllo del lavoro di ogni Punto Vendita.

PRODUZIONE PAGELLE IN FORMATO PDF

1. Introduzione. 2. Il Progetto

Crea il catalogo dei tuoi prodotti su ipad e iphone con un App. Anzi, con upp!

La ricerca delle informazioni nei siti web di Ateneo con Google Search Appliance Progetto, implementazione e sviluppi

Procedura per Anagrafe Nazionale Alunni Scuole Paritarie

I MODULI Q.A.T. PANORAMICA. La soluzione modulare di gestione del Sistema Qualità Aziendale

Nuovo Order Manager per il software NobelProcera

Domande e risposte su Avira ProActiv Community

Airone Gestione Rifiuti Funzioni di Esportazione e Importazione

MANUALE UTENTE. In questo manuale verranno descritte tutte le sue funzioni. Il sistema OTRS è raggiungibile al seguente link:

Attività federale di marketing

SITO DI PUBBLICAZIONE ANNUNCI

Tutorial: mappa dei punti di ricarica per i veicoli elettrici

INGEGNERIA DEL SOFTWARE

SIRTEL. Sistema Informativo per la Rendicontazione Telematica degli Enti Locali. Schema di funzionamento del processo per l Ente Locale

La suite Pentaho Community Edition

POSSUM Project Workshop Settimo Programma Quadro Galileo ASI 26 th June 2012

OmniAccessSuite. Plug-Ins. Ver. 1.3

Gestione dell Informazione Geo-Spaziale. Presentazione del corso Maria Luisa Damiani A.A

Gestione delle informazioni necessarie all attività di validazione degli studi di settore. Trasmissione degli esempi da valutare.

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse

BDCC : Guida rapida all utilizzo

TERM TALK. software per la raccolta dati

La VPN con il FRITZ!Box Parte II. La VPN con il FRITZ!Box Parte II

PIATTAFORMA DOCUMENTALE CRG

Domande frequenti su Phoenix FailSafe

Il Traffic Operation Centre della Regione Piemonte

Real Time Control (RTC): modalità di invio dei dati

Gestione delle transazioni. Database Management Systems 3ed, R. Ramakrishnan and J. Gehrke 1

COSTER. Import/Export su SWC701. SwcImportExport

ViviFacile. sul trasporto pubblico locale della città di Roma. Roma, 24 ottobre 2011

migliora la tua flotta con un click

Transcript:

Ingestion tools for open data (via files and services) towards DISIT Ontology for Smart City Prof. Paolo Nesi Department of Information Engineering University of Florence Via S. Marta 3, 50139, Firenze, Italy tel: +39-055-4796523, fax: +39-055-4796363 DISIT Lab alias http://www.disit.org paolo.nesi@unifi.it, http://www.disit.org/nesi 1

Contesto: Smart City Sii Mobility promuove, nell'ambito della mobilità urbana su gomma e/o su rotaia, lo sviluppo di nuove tecnologie e soluzioni ICT innovative finalizzate a migliorare l'interoperabilità dei sistemi di gestione informativi e di infomobilità urbana e metropolitana. Collabora nel supporto fra OUC/ASL, associazioni e famiglie con disabili 2

Sii-Mobility DISIT Lab, Distributed Data Intelligence and Technologies Title: Support of Integrated Interoperability for Services to Citizens and Public Administration Duration:36months Cost:22Meuro Objectives: 1. Reduction of social costs of mobility; 2. Simplify the use of mobility systems; 3. Developing working solutions and application, with testing methods; 4. Contribute to standardization organs, and establishing relationships with other smart cities management systems. The Sii Mobility platform will be capable to provide support for SME and Public Administrations. Sii Mobility consists in a federated/integrated interoperable solution aimed at enabling a wide range of specific applications for private services to citizen and commercial services to SME. Link: /siimobility.html DISIT smart city and OD projects 3

DISIT smart city and OD projects 4

Coll@bora Title: Collaborative Support for Parents and Operators of Disabled Duration: 24months Cost: 1 Meuro Objectives: providing strong advantages for 1. Relatives interested in facilitating relations with the management team; 2. Associations in order to offer a better service to the families and people with disabilities by providing a collaborative support to the involved teams, but also to manage the wealth of knowledge, to support the training of the staff, etc. Coll@bora provides a secure collaboration tool for the teams and for the association to support the families and the disabled people. Link: /collabora.html DISIT smart city and OD projects 5

Obiettivi (una parte) Analisi dei dati in tempo reale messi a disposizione dalla Regione Toscana Creazione di una fase di ingestion per l acquisizione automatica dei dati Definizione di procedure dedicate alla trasformazione dei dati acquisiti in triple RDF e memorizzazione su database semantico Riconciliazione dei dati raccolti con quelli relativi al grafo stradale Creazione di una base di dati RDF con informazioni provenienti da varie fonti Creazione di una fase di ingestion per l acquisizione automatica delle informazioni Interrogazione del database per la verifica dei collegamenti tra i diversi elementi acquisiti e facenti parte del grafo stradale 6

Analisi dei dati (per mobilita ed attuali) I dati utilizzati per questo lavoro sono quelli messi a disposizione dal MIIC (Mobility Information Integration Center), un progetto della Regione Toscana che si occupa della raccolta, da enti federati, di dati relativi alla infomobilità e della loro distribuzione mediante web services. I web services espongono dati relativi a: traffico, stato dei parcheggi, AVM (Automatic Vehicle Monitoring), emergenze viarie e informazioni meteo. Queste ultime due tipologie sono state escluse dal lavoro per carenza di dati. 7

Analisi dei dati attuali MIIC Sensori traffico: dati relativi alla situazione della viabilità stradale provenienti da gestori di sistemi di rilevamento a sensori Le misurazioni comprendono dati come distanza media tra veicoli, velocità media di transito, percentuale di occupazione della strada, transiti orari, ecc. I sensori sono divisi in gruppi, ciascuno identificato da un codice di catalogo che viene passato come parametro in fase di invocazione del web service Un gruppo è un insieme di sensori che monitora un tratto stradale I gruppi producono una misurazione ogni 5 o ogni 10 minuti Attualmente sono attivi 71 gruppi su tutto il territorio toscano, per un totale di 126 sensori 8

Analisi dei dati attuali MIIC Lo stato di un parcheggio viene descritto da dati come il numero di posti totali e occupati, il numero di veicoliinentrataeinuscita,ecc. I parcheggi sono divisi in gruppi, ciascuno identificato da un codice di catalogo che viene passato come parametro in fase di invocazione del web service Un gruppo corrisponde all insieme di parcheggi appartenenti a un comune La situazione di ogni parcheggio viene pubblicata circa ogni minuto Attualmente vengono monitorati 50 parcheggi DISIT Lab, Distributed Data Intelligence and Technologies Parcheggi: dati relativi allo stato di occupazione dei parcheggiprovenienti da gestori di aree di parcheggio. 9

Analisi dei dati, AVM locata in RT AVM: dati in tempo reale relativi ai mezzi del trasporto pubblico locale dell area fiorentina dotati di dispositivi AVM Monitora lo stato delle corse attive sul territorio, dove una corsa è il percorso che esegue un mezzo da un capolinea di inizio a uno di fine I dati forniti sono relativi allo stato di ritardo o anticipo di un mezzo, posizione del mezzo in coordinate GPS, informazioni sull ultima fermata effettuata e su quelle programmate, ecc. Il web service viene invocato passando come parametro il codice identificativo della corsa I dispositivi AVM inviano due tipi di messaggio, uno in corrispondenza di un orario programmato, solitamente ogni minuto, e uno in corrispondenza di un evento notevole come l arrivo a una fermata, la partenza da un capolinea o l interruzione del servizio Attualmente vengono monitorate le corse relative a 8 linee del trasporto pubblico di Firenze 10

Dati statici: dati aggiornati raramente che arricchiscono quelli in tempo reale Vengono forniti dall Osservatorio Regionale per la Mobilità ed i Trasporti mediante un portale con interfaccia grafica, al momento non è disponibile un web service che permetta il dowload automatico Informazioni sulla geolocalizzazione dei parcheggi e dei sensori censiti dal MIIC (da riconciliare) Dettagli aggiuntivi sulla rete di trasporto pubblico: descrizione e dettagli di linee, percorsi e fermate, geolocalizzazione con coordinate Gauss Boaga delle fermate (da riconciliare) 11

Altri dati di origine Previsioni meteo fornite dal consorzio LaMMA Formato XML Informazioni sul giorno attuale: ora tramonto/alba sole, ora tramonto/alba luna, altezza sole Previsioni sul giorno attuale e sui 4 successivi: temperatura massima, temperatura percepita, pioggia, umidità, potenza raggi uv Previsioni su cinque momenti della giornata: mattina, pomeriggio Un file per ognuno dei 286 comuni aggiornato 2 volte al giorno Servizi della regione Toscana Formato CSV Servizi di varia natura: banche, scuole, enogastronomia, ospedali, negozi, teatri, musei Localizzati geograficamente da indirizzo (via, numero civico) e comune di appartenenza Contengono il nome del servizio, indirizzo, comune, provincia, tipologia di servizio, numero telefono, email 24 file contenenti 28560 servizi diversi 12

Altri Dati di origine DISIT Lab, Distributed Data Intelligence and Technologies Statistiche sul comune di Firenze Formato CSV Contengono informazioni sul comune e sulle vie di Firenze: sinistri per via, arrivi turistici, veicoli circolanti Le statistiche riguardano gli ultimi cinque anni Analizzati sei diversi file contenenti 8100 statistiche Linea tram Formato KMZ Contiene file in formato KML usato per gestire dati geospaziali nei programmi Google earth e Google maps Contiene le coordinate che compongono il percorso coperto dalla linea tram 13

Architettura del sistema DISIT Lab, Distributed Data Intelligence and Technologies 15

From Ingestion to LOG service LOG service http://log.disit.org 16

Linked Open Graph SmartCityOntology Test on http://log.disit.org DISIT smart city and OD projects 17

Ingestion, un esempio Eseguita da Pentaho Kettle (software ETL) 1) Si passa il nome del file da processare 2) Viene recuperato l URL della risorsa 3) Download del file (solo se è stato aggiornano dall ultima volta) 4) Aggiornamento della data di download 5) Trasformazione risorsa: da XML a forma tabulare, eliminazione caratteri speciali, creazione chiavi, informazioni aggiuntive 6) Memorizzazione su HBase Parametro: nome file GET URL GET last_update HTTP GET condizionata Aggiornamento last_update Trasformazione Process Table Process Table Process Table HBase 18

Ingestion (un esempio) 19

Fase A (ingestion) Eseguita con Pentaho Kettle (software ETL) In fase di lancio, alla trasformazione vengono passati i parametri necessari Il web service viene invocato con un HTTP Post Dal risultato, in formato XML, vengono estratti con XPath i campi utili I campi vengono manipolati a seconda delle necessità dettate dal tipo di dato Viene aggiornata la tabella MySQL dei processi con il timestamp relativo all ultima versione dei dati La procedura termina con la memorizzazione dei dati su HBase Parametri HTTP Post Estrazione e manipolazione dei dati HBase Process Manager 20

Fase A (ingestion) 21

DISIT Ontologia Smart City 22

Ontologia (parte di ) Servizi Linea tram Statistiche Linea tram Previsioni meteo 23

Fase B DISIT Lab, Distributed Data Intelligence and Technologies Anche questa fase viene gestita da Pentaho Kettle Da HBase vengono selezionate le righe con data di inserimento maggiore rispetto a quella dell ultima generazione di triple RDF Questi dati vengono scritti su una tabella temporanea MySQL Viene invocata la funzione di Karma Data Integration che trasforma dati in forma tabulare nella forma di triple RDF, utilizzando un modello R2RML Le triple generate vengono caricate su OWLIM Creazione tabella temporanea MySQL Data ultima generazione triple RDF Estrazione ultimi dati da HBase Process Manager Trasferimento dei dati selezionati sulla tabella temporanea Generazione triple RDF Modello R2RML OWLIM 24

Riconciliazione DISIT Lab, Distributed Data Intelligence and Technologies Consiste nell assicurarsi che i dati siano conformi all ontologia e ai dati inseriti nello stesso database da altre fonti Avviene sia in fase di ingestion con la manipolazione dei dati (es: eventuale conversione date in formato W3C datetime) sia successivamente con l aggiunta di nuove triple RDF Perquantoriguardaidatidisensori e parcheggi, di cui non viene fornita la geolocalizzazione, è stato necessario individuare il codice del toponimo corrispondente a ciascun indirizzo fornito dal MIIC. I dati in tempo reale AVM non hanno richiesto riconciliazione in quanto geolocalizzati con coordinate GPS 25

ES. Riconciliazione A volte risulta necessario aggiungere informazioni ai dati in modo da garantire il collegamento tra i vari elementi dell ontologia Alle informazioni relative ai dati statistici e previsioni meteo si aggiungono, prima della generazione delle triple, le chiavi delle entità del grafo stradale Nei servizi la riconciliazione avviene dopo la generazione delle triple 26

Riconciliazione servizi DISIT Lab, Distributed Data Intelligence and Technologies Nel caso della riconciliazione dei servizi si deve fare in modo di mantenere le informazioni relative agli indirizzi scritti in maniera differente rispetto a quelli sul grafo stradale Collegamento tra gli oggetti di tipo Road e le entità di tipo Service Creazione di un nuovo oggetto Road (contenente il nuovo indirizzo) Legame di uguaglianza tra il nuovo oggetto e l elemento Road corrispondente (owl:sameas) Relazione SiiMobility:isIn tra il nuovo oggetto e l elemento Service 27

ES. Riconciliazione servizi Service_Key Road_Key R_address extendname BELLAVISTA- Largo_F.lli_Alinari_15 Cod_ toponimo 048017LargoF.lliAlinari Largo F.lli Alinari LARGO FRATELLI ALINARI RT04801701866TO CASA_DEL_LAGO- Lungarno A._Vespucci_58 048017LungarnoA.Vespucci Lungarno A. Vespucci LUNGARNO AMERIGO VESPUCCI RT04801701874TO COSMOPOLITAN- Via_F._Baracca187 048017ViaF.Baracca Via F. Baracca VIA FRANCESCO BARACCA RT04801702987TO SAN_PAOLO_IMI- VIA_DE'_VECCHIETTI_22/R 048017VIADE'VECCHIETTI VIA DE' VIA DEI VECCHIETTI RT04801702383TO VECCHIETTI CREDITO_ARTIGIANO- 048017VIADE'BONI VIA DE BONI VIA DEI BONI RT04801702326TO VIA_DE'_BONI_1 Auditorium_al_Duomo- 048017ViaDe'Cerretani Via De' Cerretani VIA DEI CERRETANI RT04801702317TO Via_De'_Cerretani_54/r Service Nuovo elemento Road Elemento Road grafo stradale 28

Service_Key Road_Key R_address extendname BELLAVISTA- Largo_F.lli_Alinari_15 Riconciliazione servizi Cod_ toponimo 048017LargoF.lliAlinari Largo F.lli Alinari LARGO FRATELLI ALINARI RT04801701866TO CASA_DEL_LAGO- Lungarno A._Vespucci_58 048017LungarnoA.Vespucci Lungarno A. Vespucci LUNGARNO AMERIGO VESPUCCI RT04801701874TO COSMOPOLITAN- Via_F._Baracca187 048017ViaF.Baracca Via F. Baracca VIA FRANCESCO BARACCA RT04801702987TO SAN_PAOLO_IMI- VIA_DE'_VECCHIETTI_22/R 048017VIADE'VECCHIETTI VIA DE' VIA DEI VECCHIETTI RT04801702383TO VECCHIETTI CREDITO_ARTIGIANO- 048017VIADE'BONI VIA DE BONI VIA DEI BONI RT04801702326TO VIA_DE'_BONI_1 Auditorium_al_Duomo- 048017ViaDe'Cerretani Via De' Cerretani VIA DEI CERRETANI RT04801702317TO Via_De'_Cerretani_54/r SiiMobility:isIn owl:sameas Service Nuovo elemento Road Elemento Road grafo stradale 29

Validazione e Verifica Query in linguaggio SPARQL Query di verifica del collegamento tra gli oggetti creati e quelli del grafo stradale Si seleziona un elemento del grafo stradale e si richiedono tutti gli elementi ad esso collegati Nel caso di grandi quantità di dati risulta necessario contare il numero di elementi collegati Oggetto Totale Riconciliabili (7 comuni Riconciliati di Firenze) Previsioni meteo 286 7 7 Statistiche del comune 115 115 115 Uffici Pubblici 752 176 176 Servizi 28560 3559 3502 Statistiche sulle vie di Firenze 7987 7987 7987 30

Validazione e Verifica Ricerca delle vie percorse dalla linea tram Si seleziona un punto della linea tram Si sceglie un raggio di ricerca Tra i punti contenuti nell area di ricerca si seleziona il più vicino Dal punto si risale al nome della via Junction Distanza (m) Latitudine Longitudine Via 90 38 43.77779642732306 8 250 22.3 43.77460751116613 1 290 39.9 43.77322799395684 4 275 9.8 43.77405294000986 7 340 12.6 43.76716934154219 3 DISIT Lab, Distributed Data Intelligence and Technologies 11.238888207612815 VIA ELIO GABBUGGIANI 11.225652786995651 VIA DEL SANSOVINO 11.214513710276817 VIA LUDOVICO CIGOLI 11.220394913130223 VIALE FRANCESCO TALENTI 11.208852373835150 VIALE PIETRO NENNI 31

Validazione e Verifica Ricerca delle vie percorse dalla linea tram Si seleziona un punto della linea tram Si sceglie un raggio di ricerca Tra i punti contenuti nell area di ricerca si seleziona il più vicino Dal punto si risale al nome della via Junction Distanza (m) Latitudine Longitudine Via 90 38 43.77779642732306 8 250 22.3 43.77460751116613 1 290 39.9 43.77322799395684 4 275 9.8 43.77405294000986 7 340 12.6 43.76716934154219 3 DISIT Lab, Distributed Data Intelligence and Technologies 11.238888207612815 VIA ELIO GABBUGGIANI 11.225652786995651 VIA DEL SANSOVINO 11.214513710276817 VIA LUDOVICO CIGOLI 11.220394913130223 VIALE FRANCESCO TALENTI 11.208852373835150 VIALE PIETRO NENNI 32

Validazione e Verifica DISIT Lab, Distributed Data Intelligence and Technologies 33

Validazione e Verifica DISIT Lab, Distributed Data Intelligence and Technologies 34

considerazioni DISIT Lab, Distributed Data Intelligence and Technologies I dati risultano essere ben collegati permettendo di effettuare query che coinvolgono diverse aree dell ontologia Potrebbero essere utilizzati strumenti che aiutano ad analizzare e riconciliare i dati Già adesso il database RDF creato sembra collocarsi in un ambito Big Data Dati Elementi Triple Linea tram 570 5132 Statistiche 8100 59315 Servizi 28560 269121 Previsioni meteo 3,5 milioni l anno 46 milioni l anno 35

Verifiche e validazioni Le query vengono effettuate con il linguaggio SPARQL Sono state eseguite query per verificare i risultati della riconciliazione e query per mettere alla prova le capacità del database semantico Verifica della riconciliazione: E stato verificato che ogni parcheggio/sensore fosse correttamente collegato al grafo stradale Il numero di istanze collegate deve coincidere col numero di parcheggi/sensori 36

Interrogazione del database semantico Posizione delle fermate: LefermatevengonogeolocalizzateconcoordinateGPS,conquesta query viene trovata l elemento stradale più vicino a una fermata, per poter poi risalire al nome della strada in cui è posizionata Stop ID Stopname Roadname Distance FM0405 GRAMSCI 02 VIALE ANTONIO GRAMSCI FM0515 MARCONI 01 VIA GUGLIELMO MARCONI FN0465 D ANNUNZIO 09 VIA GABRIELE D ANNUNZIO 6.5m 5.7m 9.7m 37

Considerazioni DISIT Lab, Distributed Data Intelligence and Technologies Ci possono essere notevoli margini di miglioramento da parte del MIIC, principalmente sarebbero da migliorare i tempi di risposta del web service relativo ai dati dei sensori e terminare lo sviluppo del web service relativo ai dati dei dispositivi AVM Supponendo un funzionamento a pieno regime dei vari web services, si può dire che si lavora nell ambito dei big data Tipo di dato Rilevazioni al giorno Righe di HBase al giorno Byte al giorno Byte al mese Sensori 18.000 18.000 9 MB 270 MB Parcheggi 7.200 7.200 21 MB 630 MB AVM 45.000 500.000 300 MB 9 GB Totale 70.200 525.200 330 MB 10 GB 38

Data Analytics and Data Reasoning DISIT personnel is capable to integrate and define algorithms grounded on: statistical analysis, data mining, learning and knowledge reasoning. The typical goals are for: data reconciliation, data quality assessment and correction, data connection and inference, deduction, prediction, pattern detection, critical condition detection, discovering un expected correlations. DISIT smart city and OD projects 39