Che cosa è SADAS INFOMANAGER (1982) Gestione Archivi Storici (1992) SADAS (2005) Ambiente MVS OVERMILLION (1990) Client-Server e multipiattaforma



Documenti analoghi
SQL Server Introduzione all uso di SQL Server e utilizzo delle opzioni Olap. Dutto Riccardo - SQL Server 2005.

Data warehouse Introduzione

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

SQL Server BI Development Studio

DBMS (Data Base Management System)

Rassegna sui principi e sui sistemi di Data Warehousing

Cosa è un data warehouse?

PROGRAMMA DI CLASSE 5AI

Data Warehousing (DW)

Riccardo Dutto, Paolo Garza Politecnico di Torino. Riccardo Dutto, Paolo Garza Politecnico di Torino

DSCube. L analisi dei dati come strumento per i processi decisionali

PROGRAMMAZIONE MODULARE DI INFORMATICA CLASSE QUINTA - INDIRIZZO MERCURIO SEZIONE TECNICO

Corso di Access. Prerequisiti. Modulo L2A (Access) 1.1 Concetti di base. Utilizzo elementare del computer Concetti fondamentali di basi di dati

1. BASI DI DATI: GENERALITÀ

DATABASE.

Introduzione ai Sistemi di Gestione di Basi di Dati XML

Al giorno d oggi, i sistemi per la gestione di database

Chi siamo. Tecnologia che va oltre

Facoltà di Farmacia - Corso di Informatica

Basi di Dati Relazionali

Informatica Generale Andrea Corradini Sistemi di Gestione delle Basi di Dati

Introduzione al data base

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico

INFORMATICA. Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE.

Analisi dei Dati. Lezione 10 Introduzione al Datwarehouse

Il database management system Access

SQL Server. Applicazioni principali

Uso delle basi di dati DBMS. Cos è un database. DataBase. Esempi di database

Basi di dati. Il Linguaggio SQL. K. Donno - Il Linguaggio SQL

Dispensa di database Access

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni

Database. Francesco Tapparo Informatica e Bioinformatica /16

Cosa è un foglio elettronico

INFORMATICA PER LE APPLICAZIONI ECONOMICHE PROF.SSA BICE CAVALLO

Data warehouse in Oracle

Sommario. Oracle Database 10g (laboratorio) Grid computing. Oracle Database 10g. Concetti. Installazione Oracle Database 10g

AICA - Workshop 01/03/2011

DOCUMENT MANAGEMENT SYSTEM E VISTE UTILIZZO DEL DMS E DELLE VISTE IN AZIENDA

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

SQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project

Università degli studi Roma Tre Dipartimento di informatica ed automazione. Tesi di laurea

Indice Introduzione Elementi di base dei database Il linguaggio SQL (Structured Query Language)

LA SOLUZIONE. EVOLUTION, con la E LA TECNOLOGIA TRASPARENTE IL SOFTWARE INVISIBILE INVISIBILE ANCHE NEL PREZZO R.O.I. IMMEDIATO OFFERTA IN PROVA

Il linguaggio SQL. è di fatto lo standard tra i linguaggi per la gestione di data base relazionali.

Le Basi di Dati. Le Basi di Dati

Lezione 1. Introduzione e Modellazione Concettuale

Le Basi di dati: generalità. Unità di Apprendimento A1 1

Corso Sistemi Informativi Avanzati. Programma 30 set Installazione Macchina Virtuale. Introduzione alla BI nelle Aziende.

Introduzione all Architettura del DBMS

RRF Reply Reporting Framework

un insieme di processi per raccogliere e analizzare informazioni e dare risposta a esigenze di:

Ottimizzazione delle interrogazioni (parte I)

Misura delle prestazioni dei processi aziendali con sistemi di integrazione dati open source

Data Base Management System. Strumenti: Formato: Pro: Contro: Software specifico. Proprietario

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

Progettaz. e sviluppo Data Base

Utilizzando Microsoft Access. Si crea la tabella Anagrafica degli alunni,le Materie e i voti si mettono alcuni campi

Operazioni sui database

BASE DI DATI: introduzione. Informatica 5BSA Febbraio 2015

PROGETTAZIONE E IMPLEMENTAZIONE DI UN DATAWAREHOUSE

La suite Pentaho Community Edition

Access. P a r t e p r i m a

Business Intelligence

Esercitazione query in SQL L esercitazione viene effettuata sul database viaggi e vacanze che prevede il seguente modello E/R:

Istruzioni DML di SQL

Business Intelligence CRM

B C I un altro punto di vista Introduzione

Il Sistema Operativo. Introduzione di programmi di utilità. Elementi di Informatica Docente: Giorgio Fumera

Informatica I per la. Fisica

HBS Soluzione per il settore Noleggi

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Progetto Migrazione a DB2 V8

Introduzione alla Business Intelligence.

SELEZIONE ICD icandidati

Data Warehouse Architettura e Progettazione

Allegato Tecnico Database As A Service

Stai impaginando manualmente centinaia di pagine?

Data Base. Prof. Filippo TROTTA

Archivio: è un insieme organizzato di informazioni (movimenti contabili, archivi: clienti/fornitori, personale, magazzino) Proprietà:

PROGRAMMAZIONE MODULARE. Periodo mensile. Ore previste

UN PROGRAMMA APPLICATIVO: ACCESS Access è un programma del pacchetto Office che permette di realizzare database

Data Warehousing e Data Mining

Organizzazione delle informazioni: Database

L informatica INTRODUZIONE. L informatica. Tassonomia: criteri. È la disciplina scientifica che studia

Cos è Infinity Project

Introduzione alla Business Intelligence

Anagrafica. Check-List. Autocomposizione guidata

Knowledge Management. Sistemi Informativi 08/05/12. Introduzione (1/2)

La piattaforma di lettura targhe intelligente ed innovativa in grado di offrire servizi completi e personalizzati

TIMESHARK: Uno strumento per la visualizzazione e l analisi delle supertimelines. Relatore: Federico Grattirio

Appunti sulle basi di dati. Cos è una base base di dati? Introduzione. D. Gubiani. 19 Luglio 2005

Progettaz. e sviluppo Data Base

SICUREZZA Luoghi di Lavoro

Database e reti. Piero Gallo Pasquale Sirsi

DATABASE RELAZIONALI

DATAMORFOSI. E la sintesi della strategia di prodotto di Webgate400.

5.6.1 REPORT, ESPORTAZIONE DI DATI

Lezione 9. Applicazioni tradizionali

MODULO 5 DATA BASE PROGRAMMA. Progettazione rapida introduzione alla progettazione di DB

Transcript:

1

Che cosa è SADAS SADAS è un DBMS column-based progettato in modo specifico per ottenere grandi performance nell interrogazione di archivi statici di grandi dimensioni (analisi data warehouse, OLAP). SADAS è prodotto dalla Advanced Systems Srl, SW house che lavora da quasi 30 anni su architetture specifiche per data warehouse management: INFOMANAGER (1982) OVERMILLION (1990) Gestione Archivi Storici (1992) SADAS (2005) Ambiente MVS Client-Server e multipiattaforma (MVS,Unix, MS-DOS, Windows) Tra le sue principali applicazioni la procedura per l antiriciclaggio bancario (Sherlock) SQL-99 Standard 64-bit 2

Che cosa non è SADAS SADAS non è un DBMS progettato per scopi transazionali od operazionali (OLTP): non è cioè progettato per gestire la concorrenza di migliaia di accessi in lettura e scrittura. DBMS Operazionali Utenti Migliaia Centinaia Accessi Centinaia di record in lettura e scrittura Aggiornamenti Continui Periodici DBMS Data Warehouse Milioni di record, per lo più in lettura Copertura Temporale Solo dati correnti Dati correnti e storici Ottimizzazione Accessi OLTP su frazioni del DB Accessi OLAP su gran parte del DB 3

Dove si colloca SADAS SADAS si colloca al centro fra gli strumenti di ETL necessari per caricare i dati provenienti dalla produzione, da applicazioni, altri DW etc e gli strumenti preposti all analisi ed al reporting (Business Intelligence). Streams Apps OLTP EDW Files ETL Replication Data Quality Feeds (Rewrite,append, update) Sql ODBC JDBC SCI Analytics Reporting Source Systems 4

Compatibilità Compatibilità SADAS è un sistema aperto, ovvero garantisce la compatibilità con gli altri strumenti utilizzati per la gestione del data warehouse. SADAS è interrogabile con script SQL compatibili con lo standard SQL-99 ed è accessibile attraverso i driver standard di accesso ai DBMS. SADAS dispone inoltre di particolari strumenti proprietari per l interrogazione degli archivi. 5

Il progetto di ricerca SADAS è il risultato di un progetto di ricerca condotto dall Advanced Systems in collaborazione con: Università di Pisa Università del Sannio Il responsabile del progetto è stato il prof. Antonio Albano. (Progetto N. 11384 di Ricerca Industriale nel Settore Informatico e Telematico Fondo FAR, legge 297/99) EDBT 2006 International Conference on Extending Data Base Tecnology Titolo del progetto di ricerca: Another example of a Data Warehouse System based on transposed files SEBD 2006 XIV Convegno Nazionale su Sistemi Evoluti per Basi di Dati Titolo del progetto di ricerca: Star Query Plans in SADAS: a Data Warehouse System Based on Transposed Files 6

Perché un nuovo modello Limiti dell approccio tradizionale A B C Strumenti nati per ambienti transazionali, poco efficienti in ambienti OLAP Tempi di risposta di tipo batch al crescere dei dati Complessità di disegno e di gestione Soluzioni tradizionali A B Incremento continuo della potenza elaborativa (multiprocessor etc.) Creazione di strutture dati ridondanti (viste, preaggregazioni, etc.) 7

Perché un nuovo modello Principali inconvenienti dell approccio tradizionale: A B C D Conseguente aumento degli spazi richiesti (3-5 volte i dati di input) Aumento della complessità di gestione (disegno, tuning, partizionamento, caricamento, etc) Aumento dei costi relativi a piattaforme HW e SW Perdita di visibilità dei dettagli nelle aggregazioni 8

I punti di forza di SADAS Performance In media 100 volte più veloce dei principali competitors row-based. Costi Operativi La minore potenza elaborativa richiesta comporta una riduzione dei costi delle piattaforme HW e delle licenze SW. DB Management La gestione di strutture come aggregazioni, viste, etc. viene effettuata in automatico. Il DBA inoltre può disporre sempre del dato al dettaglio, eliminando gli inconvenienti relativi al caricamento di dati pre-aggregati. Compatibilità I driver ODBC e JDBC assicurano la compatibilità con i più diffusi strumenti di BI. 9

Performance L architettura SADAS Le eccezionali performance di SADAS sono legate all introduzione di elementi innovativi nella progettazione ed implementazione del DBMS: Column-based L architettura è colonnare, ovvero una tabella viene conservata in memoria come un insieme di files, uno per ogni campo della tabella. Ridondanza dei dati Un utilizzo spinto della ridondanza delle forme di rappresentazione dei dati (indici e strutture accessorie). Learn By Usage La capacità di creare dinamicamente nuove strutture di indici sulla base delle interrogazioni più frequentemente poste dagli utenti. Intelligent Upload La capacità di effettuare, all atto del caricamento, un aggiornamento delle strutture esistenti, senza doverle ricostruire (perdendo tempo). 10

Performance I vantaggi del Column-Based La struttura di memorizzazione elementare di SADAS è il file colonna. La tabella caricata viene affettata verticalmente producendo un numero di file pari al totale degli attributi della tabella: questo comporta una significativa riduzione del carico di I/O nella fase di inquiry. 12

Performance Cosa dicono gli esperti Donald Feinberg, Gartner Vice President, 2008 "Column databases typically outperform all other databases for analytic applications, including those that are built specifically for data warehousing Boris Evelson, Forrester Research Principal Analyst, 2008 Columnar databases are specifically designed and optimized for nothing but OLAP query processing. Their schemas are also much more flexible since it s as easy to drop, add or update a column in a columnar database as it is to insert, change or delete a row in a relational database 13

Nuovi Temi di Ricerca Viste sintetiche materializzate In base al LOG di tutte le query eseguite su un database, in una definita finestra temporale, si vuole fare attività di ricerca e sviluppo per sperimentare la possibilità di creare automaticamente viste sintetiche, analizzando la tipologia di query e la frequenza di utilizzo Clustering Attività di ricerca sulle strategie migliori per la distribuzione e partizione delle strutture fisiche di Sadas, per analizzare e misurare l efficienza degli algoritmi di Sadas in relazione alle where clause, group by clause, order by clause; implementazione di algoritmi di raccordo che effettuino il merge o l unione delle risposte parziali, per la produzione del risultato finale. Multipiattaforma Conversione ed eventuale riscrittura degli algoritmi di Sadas in ambiente Unix in relazione alle where clause, group by clause, order by clause. Test di efficienza degli algoritmi di Sadas in ambiente Unix. SQL Sadas Estensione del dialetto SQL di Sadas per il supporto delle subquery correlate nella where clause Estensione del dialetto SQL di Sadas in relazione alle estensioni utilizzate in ambito data warehouse 14

Q&A www.sadasdb.com www.advancedsystems.it 15