Data Quality in Poste Italiane Roma, 24 gennaio 2006 Operational & Information Technology Audit
Poste Italiane S.p.A. I nostri numeri Totale dipendenti (media annuale) Aree territoriali Filiali Uffici postali Addetti al recapito Addetti agli sportelli 151.463 9 140 13.855 41.294 65.220
Settore Postale Prodotti e Servizi Corrispondenza (Posta Ordinaria, Prioritaria, Raccomandata, Assicurata, atti giudiziari, altra posta registrata) Posta commerciale (Postatarget, cataloghi, posta non indirizzata, ecc.) Periodici (stampe, gadgets, libri, ecc.) Posta proveniente dall'estero Comunicazioni elettroniche (telegrammi, fax, telex) Corriere Espresso (Poste Italiane e Sda) Pacchi Volumi 3.683.589.000 1.722.102.000 1.252.531.000 196.642.000 18.350.000 41.429.000 22.883.000
Risparmio Postale Anno 2004 Ammontare complessivo su libretti di risparmio, buoni fruttiferi e conti correnti postali 251.167 milioni di euro Polizze vita: importi sottoscritti Conto Bancoposta: numero di conti correnti in essere 4.698 milioni di euro 4.201.584 conti correnti
Progetto EDW Marketing & Vendite Telefonia Trouble Ticketing Controllo di Gestione - CET HR Data Warehouse Poste Italiane Contenimento Costi - Energia Internal Auditing e Data Quality BIC Scheda Cliente Service Control Room eprocurement
Data Quality: necessità La qualità dei dati è un requisito fondamentale per il successo dei progetti di data warehousing. Le informazioni presenti nei repository aziendali devono presentare un adeguata credibilità altrimenti saranno ignorate dai decision-makers
Data Quality: modello Il modello ha permesso di classificare le informazioni in base al livello di qualità raggiunto, fornendo così a chi le riceve indicazioni sulla loro affidabilità 1 LIVELLO DI QUALITA 2 3 4 5 Identificazione e descrizione Identificazione e descrizione Completezza Congruenza dei limiti di accettabilità Congruenza dei limiti di accettabilità Tempestività Affidabilità statistica Affidabilità statistica 6 Congruenza con Sistemi Sorgenti Congruenza con Sistemi Sorgenti
Data Quality: progetto Obiettivo del progetto di Data Quality è stato il controllo e la certificazione dei dati presenti nel sistema EDW di Poste Italiane per valutarne e migliorarne la loro qualità. Il progetto ha investito diverse aree di business, permettendo una mappatura dettagliata dei processi di data warehousing.
Data Quality: principali processi Produzione Dati Gestione Operativa Erogazione Servizio Staging Area Data Warehouse Data Mart Settoriali Estrazioni dati elementari dai Sistemi Sorgente Trasferimento dati nell area operativa DW Controllo formale dei dati ricevuti Caricamento aree temporanee Staging Area Trasformazione dati da SA Popolamento strutture dati del DW Aggregazione dati secondo regole dei DM Popolamento strutture dati dei Data Mart Reportistica per gli utenti finali PIATTAFORME z/os - SAP TERADATA WINDOWS - TERADATA Schedulazione e controllo attività
Data Quality: attività (1/2) Internal Data Quality Verifica delle fasi di popolamento dati nel EDW Documentazione dei controlli implementati nella fase di alimentazione (ETL) Controllo e quadratura interna (Staging Area vs. EDW) Tracciatura delle anomalie sui dati ed evidenza tramite modalità di presentation (cruscotti)
Data Quality: attività (2/2) External Data Quality Determinazione di metriche e cruscotti per la quadratura dei dati Realizzazione dei controlli utili alla sincronizzazione delle attività Definizione del processo di miglioramento dei dati Certificazione delle informazioni con i Sistemi Sorgente
Data Quality: strumenti In fase di aggiornamento
Data Quality: risultati (1/2) Certificazione E stato introdotto nell architettura il concetto di certificazione della qualità, attraverso il quale è possibile garantire che i dati soddisfano determinati requisiti di affidabilità. Questo elemento risulta determinante quando, le Divisioni Aziendali a cui il progetto EDW fornisce il servizio, devono interagire con altri soggetti.
Data Quality:risultati (2/2) Miglioramento dei dati Le criticità evidenziate, dai momenti di acquisizione e qualificazione dati in EDW, hanno avviato un processo di miglioramento delle informazioni attraverso il riciclo guidato dei dati verso i sistemi sorgente SISTEMA SISTEMA SORGENTE SORGENTE FORNITURA FORNITURA DATI DATI POPOLAMENTO POPOLAMENTO DEL DEL DW DW SITUAZIONI SITUAZIONI ANOMALE ANOMALE QUALIFICAZIONE E CERTIFICAZIONE DATI DATI