L A T E C H N O L O G Y T R A N S F E R P R E S E N T A Roma, Dicembre 2-3, 2013 Residenza di Ripetta Via di Ripetta, 231 INTERNATIONAL S U M M I T 2 0 1 3 BIG DATA ANALYTICS
D E S C R I Z I O N E Negli ultimi anni la sfida di gestire e analizzare i dati per supportare le necessità di business è stata realizzata attraverso l implementazione di Operational Data Stores e Data Warehouses. Oggi però i requisiti dei dati sono cambiati e la velocità di cambiamento del business è tale che molti modelli di dati di Data Warehouse sono faticosi da gestire. Inoltre nuove sorgenti di dati sono spesso non conosciute e non strutturate ma importanti per il business che ha bisogno di scoprire, esplorare e visualizzare questi dati prima ancora di avere il design del modello dati. In aggiunta il Change Management non si muove al ritmo di cui le aziende avrebbero bisogno. La grande ascesa nei volumi dei dati è guidata da una molto maggiore velocità delle transazioni e dai dati generati dalle macchine. Dati del click stream, dai Web log e sensor networks, sono due esempi di nuove sorgenti dati che il business vuole analizzare. Di conseguenza, da un lato aumenta la velocità con cui questi dati vengono generati, dall altro i dati da analizzare sono sempre più complessi. Per supportare queste necessità di business abbiamo visto emergere tecnologie di Big Data, includendo databases NoSQL, la piattaforma Apache Hadoop e le sue componenti tecnologiche, un nuovo MapReduce basato su tools di discovery e analisi, tecnologia di search, stream processing e un enorme crescita nell analitica. L obiettivo di questo Summit è di aiutare a capire queste tecnologie di Big Data e come integrarle con le tradizionali piattaforme di Data Warehousing e Business Intelligence in una moderna architettura a supporto dell analitica dell Enterprise. Spiega inoltre come usarle per ottenere un vantaggio competitivo. Gli argomenti trattati includeranno: Disgregazione della tecnologia: come il technology stack sta indirizzando il cambiamento nella tecnologia di IT, BI e Big Data Una guida di Hadoop, Pig e Hive SQL su Hadoop: opzioni per integrare Big Data negli ambienti tradizionali di BI Databases NoSQL Graph Databases e Graph Analytics La direzione di Analytics e Big Data Analytics Sviluppare Big Data Analytics sul Cloud Approcci all analisi di dati multi-strutturati
SPEAKERS Mike Ferguson È Managing Director Europeo di Intelligent Business Strategies Limited. Come consulente è specializzato in sistemi Database, Business Intelligence, Enterprise Application Integration, Corporate ed e-business Portals, soluzioni intelligenti di CRM e di Supply Chain. Ha più di 30 anni di esperienza di IT, ha operato consulenze per importanti aziende ed è stato frequentemente speaker in molti eventi e seminari in tutto il mondo. È stato Principal e co-fondatore della Codd & Date UK e Chief Architect alla NCR sul DBMS Teradata. Philip Howard È Direttore della Ricerca alla Bloor Research, dove gestisce il gruppo di Information Management con particolare riferimento ai database management systems (di tutti i tipi: transazionali, Warehousing, NoSQL ecc.), data integration, data governance e tecnologie associate. È un frequent speaker in Conferenze internazionali. Daniel Eklund Philip Howard SCHEDA D ISCRIZIONE Mike Ferguson Robin Bloor Da restituire compilata a: Technology Transfer Piazza Cavour, 3-00193 Roma Tel. 06-6832227 Fax 06-6871102 www.technologytransfer.it info@technologytransfer.it
Partecipanti Direttori IT, CIO, IT Managers, Architetti IT, Business Intelligence Managers, Professionisti di Data Warehousing, Data Scientists, Enterprise Architects, Data Architects Robin Bloor È co-fondatore e Chief Analyst del Bloor Group, un azienda di analisti fondata in partnership con Eric Kavanagh. Il Bloor Group è specializzato nell analisi della tecnologia con particolare riferimento alle aree dell Enterprise Software QUOTA DI PARTECIPAZIONE Euro 1400 (+IVA) La quota di partecipazione comprende documentazione, colazioni di lavoro e coffee breaks. MODALITÀ DI ISCRIZIONE Il pagamento della quota, IVA inclusa, dovrà essere effettuato tramite bonifico, codice Iban: IT 03 W 06230 03202 000057031348 Banca: Cariparma Agenzia 1 di Roma intestato alla Technology Transfer S.r.l. e la ricevuta di versamento inviata insieme alla scheda di iscrizione a: TECHNOLOGY TRANSFER S.r.l. Piazza Cavour, 3-00193 ROMA (Tel. 06.6832227 - Fax 06. 6871102) entro il 18 Novembre 2013 CONDIZIONI GENERALI In caso di rinuncia con preavviso inferiore a 15 giorni verrà addebitato il 50% della quota di partecipazione, in caso di rinuncia con preavviso inferiore ad una settimana verrà addebitata l intera quota. In caso di cancellazione del seminario, per qualsiasi causa, la responsabilità della Technology Transfer si intende limitata al rimborso delle quote di iscrizione già pervenute. SCONTI DI GRUPPO Se un azienda iscrive allo stesso evento 5 partecipanti, pagherà solo 4 partecipazioni. Chi usufruisce di questa agevolazione non ha diritto ad altri sconti per lo stesso evento. ISCRIZIONI IN ANTICIPO I partecipanti che si iscriveranno al seminario 30 giorni prima avranno uno sconto del 5%. Development e della Business Intelligence. Lavora nel campo dell analisi della tecnologia dal 1989 quando ha fondato la Bloor Research, un azienda che è diventata una delle più importanti società di consulenza sulla tecnologia in UK. Vive negli Stati Uniti dal 2002. ROMA 2-3 Dicembre 2013 Residenza di Ripetta Via di Ripetta, 231 In caso di rinuncia o di cancellazione dei seminari valgono le condizioni generali riportate sopra. Quota di iscrizione Euro 1400 (+IVA) Nome Cognome Funzione aziendale Azienda Partita IVA Codice fiscale Indirizzo CAP Città Provincia Telefono Fax E-mail Timbro e firma DURATA ED ORARIO 2 giorni: 9.30-13.00 14.00-17.00 International Summit 2013 È previsto il servizio di traduzione simultanea Tutela dati personali Ai sensi dell art. 13 della legge n. 196/2003, il partecipante è informato che i suoi dati personali acquisiti tramite la scheda di partecipazione al seminario saranno trattati da Technology Transfer anche con l ausilio di mezzi elettronici, con finalità riguardanti l esecuzione degli obblighi derivati dalla Sua partecipazione al seminario, per finalità statistiche e per l invio di materiale promozionale dell attività di Technology Transfer. Il conferimento dei dati è facoltativo ma necessario per la partecipazione al seminario. Il titolare del trattamento dei dati è Technology Transfer, Piazza Cavour, 3-00193 Roma, nei cui confronti il partecipante può esercitare i diritti di cui all art. 13 della legge n. 196/2003. Daniel Eklund È un software architect ed esperto di tecnologia con oltre 15 anni di esperienza nel settore dell Enterprise Software Development. Lavora come consulente alla Thing Big Analytics dove segue molte importanti aziende per l implementazione di sistemi di Big Data e la nuova generazione di sistemi NoSQL usando Hadoop, Hive, Pig, Cascading e HBase per fornire la nuova generazione di soluzioni di analitica e di Data Warehousing. La sua notevole esperienza in Java Enterprise Development ha fatto sì che i linguaggi di programmazione, sia quelli dinamici (Smalltalk, Ruby, Lisp, Pyton) che quelli funzionali (Erlang, Haskell, Scala, Clojure), diventassero la sua passione.
P R O G R A M M A Prima Giornata Sessione 1 Disgregazione della tecnologia: come il technology stack sta indirizzando il cambiamento nella tecnologia di IT, BI e Big Data Robin Bloor Fino a poco tempo fa la Legge di Moore a livello hardware è stata la principale forza motrice dell evoluzione delle funzionalità del software. Lo è ancora in una certa misura, ma il suo impatto è cambiato. Questa presentazione illustra la gamma di influenze che determinano l evoluzione delle applicazioni software e soprattutto dell emergenza delle tecnologie Big Data come conseguenza di queste influenze. Inoltre, suggerisce come l industria IT probabilmente si evolverà. Sessione 2 Una guida di Hadoop, Pig e Hive Daniel Eklund Google, Yahoo, Facebook e altri sono ben noti per i propri investimenti sui Big Data. Queste importanti aziende usano la piattaforma Hadoop per creare valore da questa moltitudine di dati che acquisiscono. Hive è una infrastruttura Data Warehouse costruita sopra Hadoop per gestire i dati più efficacemente e ottimizzare la performance delle queries. Infine Pig è una piattaforma per analizzare grandi insiemi di dati ed è conosciuta per la sua facilità di programmazione e le opportunità di ottimizzazione ed estendibilità. Questa sessione fa una panoramica di questi linguaggi e di come potrebbero essere usati nel Vostro prossimo progetto sui Big Data. Sessione 3 SQL su Hadoop: opzioni per integrare Big Data negli ambienti tradizionali di BI Mike Ferguson Non ci sono dubbi che all inizio Hadoop era stato visto come un regno di programmatori a cui veniva richiesto di costruire applicazioni analitiche personalizzate usando Java, Python, C# e altri linguaggi di programmazione. Ma questo interessa una piccola comunità che è ben poca cosa rispetto alla grandissima comunità SQL che opera nel mondo dell analitica. Hadoop Hive è stata la prima iniziativa per interfacciare SQL a Hadoop con HiveQL. Negli ultimi dodici mesi la pressione dei clienti ha prodotto una serie di annunci di interfacce SQL a Hadoop che bypassano MapReduce. Ma quanto sono buone queste opzioni? Cosa si sta facendo per integrare i database relazionali con Hadoop? Questa sessione esamina queste opzioni, discute i pro e i contro di ciascuna e mostra come i vendors di database relazionali e Hadoop stanno aprendo Haddop agli analisti di business della comunità SQL che vogliono sfruttare questa piattaforma per una freeform exploratory analytics. Sessione 4 Oltre Hadoop: uno sguardo ai databases NoSQL Philip Howard C è una tendenza a identificare Hadoop con Big Data. Ma ci sono molte alternative, alcune di queste sono rivali di Hadoop, mentre altre si focalizzano nell area dell analitica dove una soluzione basata su Hadoop potrebbe non essere ottimale. È anche importante conoscere le soluzioni che non sono limitate al mercato NoSQL. Infatti molte di queste soluzioni sono apparse prima che il marketing del concetto NoSQL emergesse. Questa sessione discute queste alternative a Hadoop ed esamina dove e perché potrebbero essere superiori a Hadoop.
Seconda Giornata Sessione 5 Uno sguardo dettagliato a databases grafici e analitica grafica Philip Howard Anche la più semplice delle queries si basa sulle relazioni e si possono calcolare queste queries abbastanza facilmente usando la tecnologia convenzionale. Ma questo non è il caso per quelle relazioni molto complesse e che includono molti elementi e dati strutturati e non strutturati. Inoltre questo presuppone che Voi le conosciate prima che queste relazioni esistano. I databases grafici (conosciuti anche come triple stores o RDF stores) sono stati progettati per superare questi problemi in ambienti diversi che vanno da MDM a fraud detection e dalla ricerca medica all analitica. In questa sessione si discuteranno le caratteristiche dei databases grafici, di come potrebbero essere impiegati e dei principali prodotti presenti sul mercato. Sessione 6 La direzione di Analytics e Big Data Analytics Robin Bloor Questa sessione considera la natura della Data Science da un punto di vista workload, tenendo conto dell impatto dei Big Data nel mondo dell analitica dei dati e dei recenti sviluppi nel software analitico: Hadoop e le sue componenti, visualizzazione, operational intelligence e machine learning e tutto questo impatterà sul modo in cui verrà fatta l analitica dei dati. Sessione 7 Big Data: Data Volume o Performance? Panel con Vendors e Speakers Sessione 8 Sviluppare Big Data Analytics sul Cloud usando Amazon Elastic MapReduce Daniel Eklund La sessione Vi fornirà delle conoscenze fondamentali che Vi permetteranno di sviluppare applicazioni su Amazon Elastic MapReduce (Amazon EMR). L obiettivo è quello di fornirvi le basi per crescere come sviluppatore EMR. Coprirà gli aspetti importanti del modello di calcolo di Hadoop e MapReduce e Vi fornirà delle indicazioni fondamentali per una transizione dal Vostro ambiente esistente di applicazioni di Data Management a EMR. Sessione 9 Approcci all analisi di dati multi-strutturati Mike Ferguson Questa sessione analizza le tecnologie analitiche emergenti per dati multi-strutturati e spiega come usarle per migliorare gli aspetti di business. Non tutti i progetti di analitica sono implementati usando la tecnologia del database relazionale, specialmente se si tratta di grandi volumi di dati e di dati non strutturati. Si sofferma inoltre sull emergenza di Big Data Analytics, usando Hadoop e MapReduce. Si analizzerà poi il ruolo crescente del search in un ambiente analitico come un mezzo per colmare il divario nell analizzare dati strutturati e non strutturati. Infine la sessione guarda all analisi dei dati in movimento per real-time analytics su alti volumi di dati a bassa latenza. Tecniche per produrre dati di valore da un contenuto non strutturato Esempi di prodotti di analitica del contenuto Come ottenere il massimo dall Enterprise search in un ambiente Big Data Analizzare dati in movimento: stream processing analytics
TECHNOLOGY TRANSFER Piazza Cavour, 3-00193 Roma Tel. 06.6832227 - Fax 06.6871102 www.technologytransfer.it info@technologytransfer.it