Talend Open Studio Esperienze di utilizzo di ETL in DCSC Andrea Libratore e Daniele Frongia (DCSC/A)
Esperienze di utilizzo di ETL in DCSC Diffusione di Talend in Istat DCMT
Esperienze di utilizzo di ETL in DCSC Una panoramica sui competitor di Talend (1/3) Informatica PowerCenter - Standard Edition con poche funzionalità - Performance non eccellenti - Necessità di ETL Server IBM Information Server ex IBM WebSphere DataStage ex Ascential - Motore e linguaggio proprietari - Necessità di ETL Server - Metadati gestiti con un altro tool IBM (MetaStage) IBM DB2 Enterprise Edition - Costi elevati t38
Diapositiva 3 t38 posizione logo: 21,90-18 tabanell; 21/03/2006
Esperienze di utilizzo di ETL in DCSC Una panoramica sui competitor di Talend (2/3) Microsoft SQL Server Integration Services - Costi elevati - Nessuna visibilità del codice prodotto - Orientato a prodotti/linguaggi/s.o. Microsoft Business Objects Data Integrator - Fa meglio altre cose: integrazione di dati finalizzata ad analisi in ambiente BO - Metadati gestiti con un Metadata Manager esterno t47
Diapositiva 4 t47 posizione logo: 21,90-18 tabanell; 21/03/2006
Esperienze di utilizzo di ETL in DCSC Una panoramica sui competitor di Talend (3/3) Oracle Warehouse Builder - Le funzionalità più interessanti sono costose e richiedono Oracle 10g Enterprise Edition - Dialoga poco col mondo non Oracle Pentaho Data Integrator (Kettle) - Marc Russel s Benchmark t39
Diapositiva 5 t39 posizione logo: 21,90-18 tabanell; 21/03/2006
Esperienze di utilizzo di ETL in DCSC Talend vs IBM DataStage Talend Open Studio Java project / v2.0.0m3 IBM WebSphere DataStage v7.5 Configurazione: Windows XP SP2, 2GB RAM Intel DualCore T2400 @1.83GHz 6.03 secondi 23.87 secondi Test: Flusso dati caricati: 1.000.000 di record Formato dell input: testo, csv Formato dell output: testo, csv, XML ETL: filtro, aggregazione, ordinamento
Esperienze di utilizzo di ETL in DCSC Open Talend Studio t41
Diapositiva 7 t41 posizione logo: 21,90-18 tabanell; 21/03/2006
Esperienze di utilizzo di ETL in DCSC VOI NON SIETE QUI ERP/CRM Finanza Caricamenti Data Warehouse Caricamenti di Data Mart Caricamenti di applicazioni OLAP OLAP Produzione Data Mart Budgeting File di dati esterni Data Warehouse Data Mart
Esperienze di utilizzo di ETL in DCSC Open Talend Studio in DCSC Rilevazione sulle contrattazioni e conflitti di lavoro (Andrea Libratore e Rosaria Occulto) Rilevazione sul movimento turistico (Andrea Libratore e Daniele Frongia) Job generalizzabile orientato alle rilevazioni Istat (Andrea Libratore) Test su usabilità Creazione di un job (XLS > MySQL) in meno di 20 minuti t42
Diapositiva 9 t42 posizione logo: 21,90-18 tabanell; 21/03/2006
Titolo del convegno anche su più righe anche su più righe Job generalizzabile
Titolo del convegno anche su più righe anche su più righe Open Talend Studio, la versione Enterprise Talend Open Studio Business Modeler Job Designer Metadata Manager Talend Integration Suite - Enterprise Edition Grid Conductor CPU Balancer Talend Integration Suite - Professional Edition Distant Run Job Conductor Advanced Activity Monitoring Dashboard Talend Integration Suite - Team Edition Advanced Studio Shared Repository Job Conductor Activity Monitoring Console Enterprise Teamwork Single User Open Source Subscription GPL
Esperienze di utilizzo di ETL in DCSC Open Talend Studio in Istat? DWH e Business Intelligence CHECK (CONISTAT) ETL per le rilevazioni t44
Diapositiva 12 t44 posizione logo: 21,90-18 tabanell; 21/03/2006
Conclusioni Strumento utile e meritevole di approfondimento Censimento dei problemi aperti http://segnalazionit.blogspot.com/ Talend sul Web