Esperienze di Advanced Analytics nella statistica ufficiale: strumenti e progetti
|
|
|
- Massimiliano Toscano
- 8 anni fa
- Visualizzazioni
Transcript
1 Esperienze di Advanced Analytics nella statistica ufficiale: strumenti e progetti Direzione Centrale per le tecnologie informatiche e della comunicazione
2 Introduzione
3 I Big Data nella statistica ufficiale A partire dal 2013 la comunità statistica internazionale è impegnata nello studio di come sfruttare fonti dati alternative per la produzione di statistica ufficiale Il percorso fatto finora ha evidenziato come l impatto dei Big Data investa il processo di produzione a tutti i livelli
4 Innovazione tecnologica nei processi di produzione Piattaforme Big Data Advanced Visualizzazione Machine learning Analytics
5 A gennaio 2016 Istat ha completato il setup della piattaforma di produzione on-premise per la memorizzazione e l elaborazione dei big data Perché non in cloud? Non possibile per i vincoli di privacy sui dati Non (solo) sperimentale Acquisita e installata per rispondere a un requisito specifico (progetto Scanner Data)
6 Standard Hadoop parallel storage/processing, SQL, NoSQL, Spark Extensions High-speed analytics engine Administration console Specifiche tecniche 32/16 Core CPUs 128 Gb RAM per nodo Connessione interna a 20Gbit 6 x 1.2Tb HD per nodo (60Tb in totale) Security Advanced access control Cluster Hadoop da 8 nodi
7 La piattaforma è stata progettata con l idea di ospitare dati per progetti diversi e ad alto livello di criticità dal punto di vista della privacy E stato implementato un meccanismo avanzato di sicurezza Integrazione con il back-end di autenticazione via Kerberos Definizione di permessi a livello dettagliato (tabella)
8 RDBMS Offload Big Data staging Scenari di utilizzo Esperimenti Elaborazioni pesanti
9 Use Case 1 Scanner Data Nuova sorgente dati per il calcolo dell indice dei prezzi al consumo Transazioni dei prodotti nei supermercati, registrate alle casse Un record per prodotto quantità, fatturato (per settimana) Fornitura dati settimanale Campione di 2100 negozi che coprono 80 province 750 milioni di record all anno
10 Use Case 1 Scanner Data Architettura dati ibrida (database offload) DBMS mantiene dati correnti Procedure di data cleaning Hadoop mantiene dati storici Sempre disponibili per analisi via SQL o tool di BI/visualizzazione
11 Use Case 1 Scanner Data Report e Visualizzazioni Analisi su estrazioni Dashboard di controllo Statistical Software Enhanced data warehouse Dati correnti Dati storici Data Broker Portale Acquisizione Controlli RDBMS Hadoop Data cleaning Calcolo indici Analisi online
12 Use Case 1 Scanner Data Timeline 2015 Inizio progetto e analisi preliminare dei dati 2016 Preparazione della data collection 2017 Calcolo degli indici in parallelo 2018 Produzione
13 Andamento della fornitura in termini di numero di record ricevuto per punto vendita per ogni settimana
14 Use Case 1 Scanner Data Utilizzo della piattaforma Big Data per il calcolo e l analisi sull intero dataset Calcolo degli indici con diversi metodi e confronto dei risultati Implementazione di diverse metodologie per l eliminazione dei dati anomali e confronto dei risultati Procedure implementate in Spark
15 Analisi della distribuzione dei dati per la valutazione delle performance delle procedure di identificazione dei dati anomali Possibile sperimentazione di tecniche di machine learning
16 Use Case 1 Scanner Data Prossimi passi Consolidamento del processo di produzione e inizio del parallelo con la rilevazione tradizionale Statistica sperimentale: implementazione di un modello per il calcolo di indici di parità del potere d acquisto
17 Use Case 2 Dati telefonici Attività sperimentale Analisi di dati telefonici per determinare pattern di movimento della popolazione Campione di dati Un mese di telefonate/sms su Pisa e Roma Call Detail Records ID chiamante, ora, durata, posizione antenna Strumento: Sociometer Software realizzato da Università di Pisa/CNR in Spark
18 Use Case 2 Dati telefonici Esecuzione del software sul nostro cluster interno e analisi dei risultati per valutarne la possibilità di utilizzo per il calcolo di varie stime Presenze sui territori (flussi e stock) Mobilità/pendolarismo Domanda turistica domestica Densità di presenze in luoghi chiave
19 Conclusioni
20 Conclusioni: Installazione e configurazione Hadoop Processo molto complesso: Molti componenti interconnessi Non semplice capire gli errori L installazione è solo l inizio Aggiornamenti continui Gestione degli utenti Guasti, rallentamenti, etc.
21 Conclusioni: Costruzione delle competenze Profili e skill diversificati e molto specifici IT Sistemisti Hadoop coinvolge pesantemente il settore ed è necessaria una formazione mirata IT - analisti dati/sviluppatori L uso di SQL garantisce una transizione fluida ai nuovi strumenti per gli analisti DB Spark trova ampio margine di applicazione ma ha una curva di apprendimento ed è più apprezzato dagli sviluppatori Statistici Cambio di paradigma necessario per costruire la capacità di lavorare su dataset più grandi Cooperazione più stretta con l IT per sfruttare meglio il potenziale della tecnologia
22 Grazie!
Dashboard del movimento turistico
Sistema interattivo di analisi e visualizzazione dati Osservatorio del turismo, artigianato e commercio Osservatorio XX Conferenza Nazionale ASITA, 8 10 novembre 2016, Cagliari Assessorato del turismo,
La scelta di Dedagroupdi IBM Power Systems per SAP HANA per i propri servizi di DataCenter
La scelta di Dedagroupdi IBM Power Systems per SAP HANA per i propri servizi di DataCenter Simone Armari - Responsabile IT Architects & Consultants e Cloud & Managed Services Dedagroup - Business Technology
SESSIONE PITCH 1 Big Data Analytics Qlik
SESSIONE PITCH 1 Big Data Analytics Qlik - SOSE e Qlik con il progetto OpenCivitas orientano la gestione della spesa pubblica in base a criteri di efficienza Roberto Fontana, Marketing Director, Qlik Progetto
Italy Spain UK Germany. Progetto Mangrovia
Italy Spain UK Germany Progetto Mangrovia Introduzione a Mangrovia Mangrovia Introduzione Process Control Room Architettura multi-livello in grado di connettere i processi di business con la rilevazione
Obiettivi, sviluppo e risultati principali del progetto STEEL
Evento conclusivo progetto STEEL CNR Roma 3 novembre 2011 Obiettivi, sviluppo e risultati principali del progetto STEEL Enrico Del Re CNIT e Università di Firenze Il progetto STEEL Progetto Nazionale:
SI-SOFT INFORMATICA SRL Corso Unione Sovietica 612/ Torino (TO)
Presentazione aziendale Aggiornamento 2015 SI-SOFT INFORMATICA SRL Corso Unione Sovietica 612/21-10135 - Torino (TO) www.si-soft.org 011 3589954 [email protected] CHI SIAMO Si-Soft Informatica nasce nel
Logistica e nuove prospettive con le soluzioni di business analytics di SAP
Logistica e nuove prospettive con le soluzioni di business analytics di SAP Analytics 2013 Join the New Data Revolution Milano, 13 Giugno 2013 Dino Burigo BI Developer Head, Luxottica Antonello Morelli
Ciclo di vita per lo sviluppo di software sicuro
Ciclo di vita per lo sviluppo di software sicuro (a cura di Roberto Ugolini Postecom Spa) Security Service Unit Documento pubblico Le motivazioni del cambiamento 1/3 2 Aumentare il livello di sicurezza
Sistan Hub: un sistema a rete condiviso per la diffusione di dati statistici
Sistan Hub: un sistema a rete condiviso per la diffusione di dati statistici Webinar «Il progetto Sistan Hub» Roma, 17 novembre 2014 [email protected] [email protected] Obiettivo del progetto realizzazione
Gli investimenti in network logistici integrati
Gli investimenti in network logistici integrati Giulio Di Gravio Dipartimento di Meccanica e Aeronautica Università degli Studi di Roma La Sapienza Vinitaly 9 aprile 2010, Verona Caratteristiche della
L utilizzo dei Big Data in Istat: stato attuale e prospettive
L utilizzo dei Big Data in Istat: stato attuale e prospettive Giulio Barcaroli FORUM PA 28 maggio 2015 Outline Illustrazione delle attività portate avanti dall Istat, riguardanti: la prosecuzione di sperimentazioni
UN DATAWAREHOUSE PER IL CONTROLLO E MONITORAGGIO DELLA SPESA FARMACEUTICA CONVENZIONATA
UN DATAWAREHOUSE PER IL CONTROLLO E MONITORAGGIO DELLA SPESA FARMACEUTICA CONVENZIONATA Fabio Raimondi Project Manager Tecnologie Digitali ed Applicative Business Analytics e Big Data Il progetto S.I.R.FARMA
Università di Bergamo Facoltà di Ingegneria INGEGNERIA DEL SOFTWARE. Paolo Salvaneschi A4_3 V2.1. Progettazione. Metodi e Linguaggi
Università di Bergamo Facoltà di Ingegneria INGEGNERIA DEL SOFTWARE Paolo Salvaneschi A4_3 V2.1 Progettazione Metodi e Linguaggi Il contenuto del documento è liberamente utilizzabile dagli studenti, per
Percorsi formativi Moduli richiesti Tematiche
ALLEGATO III Obiettivo specifico: 10.8 Diffusione della società della conoscenza nel mondo della scuola e della formazione e adozione di approcci didattici innovativi. Percorsi formativi Moduli richiesti
API: building block della Digital Transformation
Rossella Macinante Practice Leader Milano, 21 Marzo 2017 La crescita dell App Economy continua Fonte: App Annie, 2017 Fonte: NetConsulting cube, 2017 Gli italiani sono sempre più connessi Fonte: CommScore
ideacloud Business Driven Infrastructure Services
ideacloud Business Driven Infrastructure Services ideacloud è la nuova famiglia di servizi creata da ideato per dotare le Infrastrutture IT di agilità, scalabilità e velocità. Trasformiamo l IT in un fattore
Corso Programmazione Java Standard
Corso Programmazione Java Standard Codice: ITJS0113 Durata: 40 ore Descrizione corso Questo corso fornisce una panoramica sulle varie sfaccettature della sintassi del linguaggio Java, integrata con mirate
Cybersecurity, come difendersi dal furto dati
Osservatorio Information Security & Privacy Cybersecurity, come difendersi dal furto dati Giorgia Dragoni Ricercatrice Osservatorio Information Security & Privacy, Politecnico di Milano 09 Maggio 2017
Tecnico in meteo-climatologia operativa
Denominazione Figura / Profilo / Obiettivo Professioni NUP/ISTAT correlate Attività economiche di riferimento: ATECO 2007/ISTAT Area professionale Sottoarea professionale Descrizione Tecnico in meteo-climatologia
Ore settimanali di lezione: 3 h di cui 2 in compresenza con l insegnante di Lab. di Informatica prof.ssa E.De Gasperi
Anno scolastico 2015/2016 Piano di lavoro individuale ISS BRESSANONE-BRIXEN LICEO SCIENTIFICO - LICEO LINGUISTICO - ITE Classe: III ITE Insegnante: Prof.ssa Maria CANNONE Materia: INFORMATICA Ore settimanali
BIG DATA E ANALYTICS PER IL MONDO ASSICURATIVO
17 Marzo 2016 BIG DATA E ANALYTICS PER IL MONDO ASSICURATIVO Valerio Momoni Cerved, Direttore Marketing e Sviluppo Prodotti Cerved è da 40 anni una big data company Dati Database di 800 TB in continua
Corso SAP Gestione degli Acquisti COMPLETO 10 GIORNI
Corso SAP Gestione degli Acquisti COMPLETO 10 GIORNI Finalità: acquisire le nozioni teoriche e pratiche del modulo MM e le principali operazioni di gestione degli acquisti. Durata: 80 ore Introduzione
EasyBridge. Il ponte intelligente tra Nodo, cittadini e PA. Seminario RisorseComuni
. Il ponte intelligente tra Nodo, cittadini e PA Relatore Stefano Bonasegale Direttore Generale Progetti e Soluzioni SpA Progetti e Soluzioni Società nata nel 1999 3 Sedi in Italia: Milano, Ravenna e Bari
Brizio Palamà Italiana Università del Salento /2016 Attuale posizione Università del Salento, Lecce, Italia
F ORMATO EUROPEO PER IL CURRICULUM VITAE INFORMAZIONI PERSONALI Nome Nazionalità Amministrazione Email istituzionale Telefono Brizio Palamà Italiana Università del Salento [email protected] 0832
S.T.A.R. Statistical network in Tourism sector of Adriatic Region -
Statistical network in Tourism sector of Adriatic Region - 12 luglio 2012 DI CHE COSA SI TRATTA Progetto co-finanziato dall Unione Europea Per il miglioramento della statistica sul turismo Per la creazione
BASI DI DATI E UTENTI DI BASI DI DATI
BASI DI DATI E UTENTI DI BASI DI DATI Introduzione alle basi di dati (1) 2 La gestione dell informazione L informazione rappresenta oggi uno dei beni più preziosi all interno di una qualsiasi organizzazione
REPERTORIO DELLE QUALIFICAZIONI PROFESSIONALI DELLA REGIONE CAMPANIA
REPERTORIO DELLE QUALIFICAZIONI PROFESSIONALI DELLA REGIONE CAMPANIA SETTORE ECONOMICO PROFESSIONALE 1 Servizi di informatica Processo Sviluppo e gestione di prodotti e servizi informatici Sequenza di
PON Corsi Formazione PNSD Assistenti Amministrativi
PON Corsi Formazione PNSD Assistenti Amministrativi Il PNSD a scuola 4 Missione e visione del PNSD; azioni del PNSD Opportunità di partecipazione a bandi nazionali ed europe Docenza formazione su tematiche
SMART METER GAS E SENSORI INTELLIGENTI Sperimentazione nel Comune di Grosseto
LA RETE 169 MHz PER TELE-LETTURA E TELE-GESTIONE SMART METER GAS E SENSORI INTELLIGENTI Sperimentazione nel Comune di Grosseto Ing. Alessandra Buzzigoli Strategie e Sviluppo Gruppo Estra H-FARM Roncade,
REPERTORIO DELLE QUALIFICAZIONI PROFESSIONALI DELLA REGIONE CAMPANIA
REPERTORIO DELLE QUALIFICAZIONI PROFESSIONALI DELLA REGIONE CAMPANIA SETTORE ECONOMICO PROFESSIONALE 1 AREA COMUNE SERVIZI PER LE IMPRESE Sequenza di processo Area di Attività Qualificazione regionale
della Regione Marche
Interoperabilità e cooperazione: l esperienza della Regione Marche interoperabilità nella gestione della modulistica online: il sistema regionale DOcument DIstribution BOX Dott. Andrea Sergiacomi Scenari
Strumenti per l automazione del testing di applicazioni web Javascript-based
tesi di laurea Strumenti per l automazione del testing di applicazioni web Javascript-based Anno Accademico 2005/2006 relatore Ch.mo prof. Porfirio Tramontana 1 candidato Salvatore Agnello Matr. 41/2612
Implementazione di un sistema open source per il Network Access Control. C. Catalano, S. Forestieri, F. Marrone, M. Pericò
Implementazione di un sistema open source per il Network Access Control C. Catalano, S. Forestieri, F. Marrone, M. Pericò Sommario 1. Scenari 2. Requisiti dell implementazione 3. La soluzione PacketFence
ALLEGATO AL CAPITOLATO TECNICO
ALLEGATO AL CAPITOLATO TECNICO Appalto per l affidamento dei servizi di sviluppo, manutenzione e supporto del software applicativo Sistema informatico di prevenzione del furto di identità (SCIPAFI) Requisiti
Big data ed eventi: quasi un tutorial. Prof. Riccardo Melen [email protected]
Big data ed eventi: quasi un tutorial Prof. Riccardo Melen [email protected] Big Data Monitoraggio di reti e infrastrutture IT performance: data center, SOA/ESB, infrastrutture virtuali, configurazione
APPENDICE 4 AL CAPITOLATO TECNICO
APPENDICE 4 AL CAPITOLATO TECNICO Descrizione dei profili professionali INDICE 1 PROFILI PROFESSIONALI RICHIESTI 3 1.1 CAPO PROGETTO 3 1.2 ANALISTA FUNZIONALE 4 1.3 ANALISTA PROGRAMMATORE 5 1.4 PROGRAMMATORE
Un caso di successo per la Manutenzione Predittiva:
Il caso Tekfor Un caso di successo per la Manutenzione Predittiva: Contesto: Un azienda che produce componentistica per il settore Automotive e che si era posta l obiettivo di ridurre i tempi di inattività
INFORMAZIONI PERSONALI VIA R. R. GARIBALDI 7, ROMA ESPERIENZA LAVORATIVA NOME CLAUDIO CIMMINO INDIRIZZO TELEFONO FAX
INFORMAZIONI PERSONALI NOME CLAUDIO CIMMINO INDIRIZZO TELEFONO 06 5168 4176 FAX VIA R. R. GARIBALDI 7, 00145 ROMA E-MAIL [email protected] NAZIONALITÀ ITALIANA DATA DI NASCITA 16/04/1973 SESSO
ALTEC SERVICE & LAB SRL - Via Oslavia, 72/ Desio (MB) -
Una parabola ascendente Altec vanta una storia di quasi quarant anni di successi: un traguardo possibile grazie al costante impegno, al rinnovamento e alla continua trasformazione. Nata nel 1979 come laboratorio
Software di rilevazione presenze
Software di rilevazione presenze Descrizione La manualità nei controlli e nei calcoli delle ore lavorate, allunga i tempi di preparazione della busta paga e induce spesso in errori di varia natura. Un
Piattaforma di Sportello. Soluzione evoluta per l operatività di Sportello
Piattaforma di Sportello Soluzione evoluta per l operatività di Sportello Canali e Core Banking Front End Unico Soluzione integrata per l operatività di filiale Internet e Mobile Banking Soluzioni evolute
La nostra storia inizia nel 1992, anno in cui Nova Systems Roma viene costituita e muove i primi passi nel mercato dei servizi informatici.
COMPANY PROFILE La nostra storia inizia nel 1992, anno in cui Nova Systems Roma viene costituita e muove i primi passi nel mercato dei servizi informatici. In risposta alla veloce evoluzione delle tecnologie
REPERTORIO DELLE QUALIFICAZIONI PROFESSIONALI DELLA REGIONE CAMPANIA
REPERTORIO DELLE QUALIFICAZIONI PROFESSIONALI DELLA REGIONE CAMPANIA SETTORE ECONOMICO PROFESSIONALE 1 Area Comune Processo Gestione del processo produttivo, qualità, funzioni tecniche e logistica interna
