Big Data e la forza degli eventi Da sovraccarico informativo a strumento di conoscenza Big Data e IT Strategy Come costruire l Impresa Intelligente Università Milano Bicocca 1 Marzo 2013 GIUSEPPE LIETO
Gartner definition "Big data are high-volume, high-velocity, and/or high-variety information assets that require new forms of processing to enable enhanced decision making, insight discovery and process optimization 2
Analytics con approccio classico BI (~ 1996) 3
Evoluzione verso Data Warehouse (~2004) 4
Il nuovo modello Big Data (~ 2011) 5
Di cosa parlerò A. Perché introdurre progetti di Big Data nelle aziende B. Come introdurre progetti Big Data nelle aziende Di cosa non parlerò C. Quale tecnologia utilizzare per i Big Data 6
7
A. Perché introdurre progetti di Big Data 1. Il primo approccio con le tecnologie dei Big Data fa apparire questa tecnologia come la soluzione a tutti i problemi di estrazione di conoscenza dai dati gestiti e gestibili da un Organizzazione 2. Si possono sviluppare applicazioni in modo semplice e veloce nei campi più disparati: Application management IT Operation management Security Compliance Business Analytics.. Change monitoring Network management Server management Virtualization management Desktop management SLA management. Web Analytics Revenue optimization Transaction analysis. 8
Dashboard 9
A. Perché introdurre progetti di Big Data Quindi la soluzione sembrerebbe essere mettiamo tutto in un grande contenitore, indicizziamotutti i dati possibili, mettiamoci all opera perché ci aspetta la soluzione a tutti i nostri problemi 10
B. Come introdurre progetti di Big Data (una buona ragione) 1. Si deve partire da un caso d'uso, un fattore per migliorare la competitività, un problema di costo o qualunque altra ragione per cui l uso di tecnologie Big Data fa diventare conveniente la soluzione del problema 2. Driver tipici sono il tipo di informazioni (ad esempio fonti di informazione non strutturate) o il grande volume di informazioni da trattare; in ogni caso, è necessario identificare esattamente perché si sta perseguendo la strada dei Big Data 3. Un buon fattore è sempre il ROI. Il costo per la soluzione del problema è sicuramente una ragione convincente (il costo include sia il costo della tecnologia che quello del lavoro e dei tempi di realizzazione) 11
B. Come introdurre progetti di Big Data (un team di lavoro convinto) 1. Il team di lavoro deve comprendere le potenzialità degli strumenti di Big Data. Non si tratta di realizzare un progetto tradizionale: bisogna coinvolgere il team per sensibilizzarlo sulle nuove possibilità di questi strumenti. Realizzato un caso sarà tipicamente semplice realizzarne un altro, anche se non era inizialmente previstoe sarà il team stesso ad essere propositivo 12
B. Come introdurre progetti di Big Data (un team di lavoro convinto) 1. I risultati non vanno considerati come ennesima elaborazione di dati presenti in database o data warehouse, ma piuttosto come nuovo modo di ottenere informazioni dai dati, anche da quelli non strutturati e che non erano utilizzati per gli scopi del nostro caso. Non si tratta, quindi di sostituire banche dati esistenti, ma piuttosto di aumentare il livello di integrazione dei dati ottenendo così nuove informazioni 13
B. Come introdurre progetti di Big Data (un team di lavoro convinto) Big Data come tecnologia additiva e non sostitutiva per ottenere risultati in modo rapido e con costi contenuti 14
B. Come introdurre progetti di Big Data (skill tecnico di sviluppo non necessariamente elevato) 1. Le tecnologie Big Data consentono di utilizzare linguaggi di scripting piuttosto semplici, rendendo spesso disponibili sistemi visuali per disegnare applicazioni. 2. Può essere più importante coinvolgere personale che conosce le fonti dei dati e i loro contenuti che personale con uno skill tecnico di programmazione elevato Non sottovalutare problemi di sicurezza e di privacy 15
B. Come introdurre progetti di Big Data (evoluzione di prototipi) Non c è cosa migliore che provare Provare a sviluppare il progetto in un ambiente di test rappresentativo di come potrà essere l'ambiente di produzione può essere una buona tecnica per una serie di motivi: per capire le caratteristiche prestazionali del sistema, come può scalare al crescere delle dimensioni, come determinare le risorse professionali ed EDP necessarie e, soprattutto, verificare di aver compreso tutte le variabili in gioco. Essere sicuri che i dati che si pensa di elaborare siano effettivamente disponibili e in una forma utilizzabile Attenzione! Non dimentichiamo i problemi di sicurezza e di governance 16
B. Come introdurre progetti di Big Data (certezza di poter usare i dati) Il tempo per poter materialmente stabilire il canale per l accesso ai dati potrebbe non essere breve (dati di responsabilità di aree aziendali non coinvolte, dati sensibili, dati immediatamente utilizzabili,..) 17
B. Come introdurre progetti di Big Data (modello operativo semplice) Individuazione delle esigenze funzionali Con l ausilio di opportuni tools: - si definiscono i requisiti di massima dell applicazione - si selezionano i componenti da utilizzare Individuazione delle esigenze prestazionali Si definisce la profondità di analisi, in termini di - storage massimo richiesto / tempo di retention - tempi di risposta desiderati / CPU allocata - opzioni di configurazione Sviluppoe/o configurazione dei servizi, collaudo e rilascio Le applicazioni possono essere rilasciate in varie modalità (cloud, private cloud, servizi,..) Attivazione del servizio Possibili sviluppi custom Configurazioni specifiche Possibilità di customizzazioni per specifiche esigenze. 18
Modalità di introduzione di progetti big data (una buona ragione) (un team di lavoro convinto) (skill tecnico di sviluppo non necessariamente elevato) (evoluzione di prototipi) (certezza di poter usare i dati) (modello operativo semplice) L attenzione si sposta verso gli obiettivi. La definizione degli obiettivi viene effettuata con il team di lavoro che vede progressivamente concretizzare gli sforzi, senza competenze di sviluppo particolari, ma vedendo valorizzata la propria competenza sui dati che... diventano informazioni 19
Giuseppe Lieto glieto@sysmanagement.it www.sysmanagement.it Grazie per l attenzione