Relazione sul data warehouse e sul data mining



Documenti analoghi
Cosa è un data warehouse?

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

INFORMATICA. Prof. MARCO CASTIGLIONE ISTITUTO TECNICO STATALE TITO ACERBO - PESCARA

Lezione 1. Introduzione e Modellazione Concettuale

CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

25/11/14 ORGANIZZAZIONE AZIENDALE. Tecnologie dell informazione e controllo

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

SCHEDA PRODOTTO PAG. 1 J O B T I M E W F. Variazioni mensili al cartellino presenze. Versione 6.1. JOBTIME Work Flow

Sistemi informativi secondo prospettive combinate

Data Warehousing (DW)

Data warehouse Introduzione

REALIZZARE UN MODELLO DI IMPRESA

PON ISTITUTO DI ISTRUZIONE SECONDARIA SUPERIORE Distretto Scolastico n GINOSA (TA)

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone

Olga Scotti. Basi di Informatica. Excel

Controllo di Gestione

Sistemi informativi aziendali struttura e processi

DSCube. L analisi dei dati come strumento per i processi decisionali

uadro Soluzione software e hardware Per le rilevazione presenze Gestione Aziendale Fa quadrato attorno alla tua azienda

SOLUZIONE Web.Orders online

B C I un altro punto di vista Introduzione

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico

Sistemi Informativi e Sistemi ERP

Creare una Rete Locale Lezione n. 1

Base di dati e sistemi informativi

comscore: costruire un grande data warehouse per i Big Data

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Tecnologie dell informazione e della comunicazione per le aziende

Airone Gestione Rifiuti Funzioni di Esportazione e Importazione

Questionario R.C. Società di Informatica

SOLUZIONI INFORMATICHE PER LO STUDIO LEGALE

Istituto Tecnico settore Economico. Indirizzo Amministrazione, Finanza e Marketing

CRM / WEB CRM CUSTOMER RELATIONSHIP MANAGEMENT

I database relazionali (Access)

TECNICO SUPERIORE DEI TRASPORTI E DELL INTERMODALITÀ

Finalità della soluzione Schema generale e modalità d integrazione Gestione centralizzata in TeamPortal... 6

Data Mining a.a

Progettaz. e sviluppo Data Base

DATAMORFOSI. E la sintesi della strategia di prodotto di Webgate400.

Introduzione al data base

I sistemi di reporting e i rapporti direzionali

Scheda. Il CRM per la Gestione del Marketing. Accesso in tempo reale alle Informazioni di rilievo

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni

1. BASI DI DATI: GENERALITÀ

CRM / WEB CRM CUSTOMER RELATIONSHIP MANAGEMENT

ISTITUTO TECNICO COMMERCIALE STATALE ABBA - BALLINI

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi

Indice. pagina 2 di 10

IL SISTEMA INFORMATIVO

Il catalogo MARKET. Mk6 Il sell out e il trade marketing: tecniche, logiche e strumenti

Piano di gestione della qualità

Aris TimeSheet. che guardano oltre. enti e aziende. Soluzioni per

Data mining for e- commerce sites

Business Intelligence CRM

Archimede ver GUIDA FUNZIONALE ARCHIMEDE VER

Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita;

Business Intelligence Revorg. Roadmap. Revorg Business Intelligence. trasforma i dati operativi quotidiani in informazioni strategiche.

4.5 CONTROLLO DEI DOCUMENTI E DEI DATI

Il CRM per la Gestione del Servizio Clienti

Business Intelligence

PROGETTAZIONE E IMPLEMENTAZIONE DI UN DATAWAREHOUSE

2 Gli elementi del sistema di Gestione dei Flussi di Utenza

PROVINCIA DI MATERA. Regolamento per il funzionamento. dell Ufficio Relazioni con il Pubblico della Provincia di Matera

JOB - Amministrazione del personale. La soluzione Sistemi per il professionista delle paghe.

Sistemi Informativi Aziendali I

ISTITUTO TECNICO E. Mattei DECIMOMANNU (CA)

Progettaz. e sviluppo Data Base

Cos è il CRM. Andrea De Marco

Le forme di promozione nei mercati esteri. Michela Floris

Strutturazione logica dei dati: i file

MANUALE DELLA QUALITÀ Pag. 1 di 6

Gestione Turni. Introduzione

IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE

Protocollo Informatico (D.p.r. 445/2000)

LA RICLASSIFICAZIONE DEI SALDI CONTABILI CON MICROSOFT ACCESS 2007

Sistemi di misurazione e valutazione delle performance

Programma del Corso. Dati e DBMS SQL. Progettazione di una. Normalizzazione

Customer Relationship Management. Eleonora Ploncher 3 aprile 2006

La Metodologia adottata nel Corso

Sistema Banca dati e Repertorio dei dispositivi medici Notifiche multiple di DM simili

lem logic enterprise manager

sommario 1. introduzione al sistema 2. moduli base 3. tracciabilità e rintracciabilità 4. diagramma di flusso operativo 5.

1 CARICAMENTO LOTTI ED ESISTENZE AD INIZIO ESERCIZIO

Roma, ITIS G. GALILEI 28 ottobre 2010

La Skills Card relativa alle certificazioni Nuova ECDL è svincolata dalla singola certificazione.

Introduzione ad OLAP (On-Line Analytical Processing)

Architetture Informatiche. Dal Mainframe al Personal Computer

Analisi e catalogazione automatica dei Curriculum Vitae

Architetture Informatiche. Dal Mainframe al Personal Computer

LA GESTIONE DELLE INFORMAZIONI IN AZIENDA: LA FUNZIONE SISTEMI INFORMATIVI 173 7/001.0

Transcript:

Relazione sul data warehouse e sul data mining INTRODUZIONE Inquadrando il sistema informativo aziendale automatizzato come costituito dall insieme delle risorse messe a disposizione della tecnologia, dalle persone che le utilizzano e dalle applicazioni che possono essere fatte con esse, con la finalità di automatizzare l archiviazione, la produzione, l elaborazione e la distribuzione dei dati aziendali, possiamo dire che i dati da esso utilizzati non provengono solo dall interno dell azienda, ma anche dall esterno, da una banca dati, ma anche semplicemente da un articolo di un quotidiano. Quindi un generico sistema informativo utilizza dati strutturati, come il record di un dipendente, oppure i registri IVA, e da dati non strutturati, come riunioni, telefonate, segnalazioni di un agente, etc. etc. Intanto, lo sviluppo dei sistemi informatici nelle aziende, che procede insieme al progresso dell hardware e del software, corrisponde alle esigenze di: - rendere automatici i lavori ripetitivi, eliminando gli errori delle trascrizioni e nella ripetizione dei dati in schedari e documenti diversi; - poter disporre dei dati che servono in tempi molto brevi, utilizzando supporti che possono memorizzare grandissime quantità di informazioni. Dalla meccanografia alle reti di computer l evoluzione del sistema informatico aziendale ha introdotto anche procedure standard di espletamento delle attività nella progettazione, nella produzione e nell amministrazione. I risultati che si ottengono sono quindi indipendenti dalle persone che utilizzano risorse informatiche, ed è possibile introdurre nel sistema informatico persone senza particolari requisiti di formazione specialistica, anche per la crescente facilità nell uso delle apparecchiature informatiche. In particolare i maggiori benefici e l espansione più rilevante si è avuta nel livello operativo della piramide di anthony, e in particolare nelle aree contabili e nell automazione dei lavori d ufficio. Esistono poi procedure e applicazioni riguardanti l aspetto decisionale, come i prodotti software denominati DSS (Decision Support System), cioè programmi che consentono di raccogliere e rielaborare dati, anche provenienti da archivi e applicazioni diverse, che possono servire da supporto nelle decisioni aziendali. In questo modo il sistema informatico si può sviluppare non solo in senso orizzontale nelle diverse aree, ma anche in senso verticale nei controlli. Pagina 1 di 6

LE BASI DI DATI AZIENDALI Gli ultimi decenni hanno visto un grande incremento della qualità di informazioni e di dati memorizzati in formato elettronico. Questo accumulo di dati è avvenuto con tassi di crescita esplosivi. SI è stimato che la quantità di informazioni nel mondo raddoppia ogni 20 mesi e le dimensioni e il numero dei database aumentano ancora più velocemente. La disponibilità dei dati è favorita dall uso di periferiche per l acquisizione di dati, quali i POS (Point of Sale) negli esercizi commerciali, di terminali remoti e di connessione alle reti. Dopo aver concentrato una così grande quantità di dati, il problema è stabilire quale valore si possa ottenere da queste risorse di informazione. L informazione è al centro delle operazioni di business e le persone che nell imprea devono prendere le decisioni (decision makers), potrebbero usare i dati memorizzati per ottenere nuovi risultati nel mercato dell azienda. Il successo di un prodotto o di una strategia marketing dipendono infatti dalle informazioni che l azienda dispone sulla propria clientela. I database management system DBMS facilitano l accesso ai dati memorizzati, ma questo è solo una piccola parte di quello che si può ottenere dai dati. I sistemi tradizionali di elaborazione delle transizioni on-line (OLTP, on-line trasaction processing) consentono di immettere dati nei data base in modo veloce e con sicurezza ed efficienza, ma non sono adatti per produrre analisi significative. Una società di assicurazione offre prodotti assicurativi insieme a molte altre società, un banca offre un mutuo come molti altri istituti di credito:la differenza che può determinare il successo di un prodotto è legata alle informazioni che l azienda possiede sui clienti circa le motivazioni all acquisto, le preferenze, la distribuzione geografica, le caratteristiche demografiche (come già visto a lezione). L analisi dei dati può fornire ulteriori conoscenza sul business andando al di là dei dati esplicitamente memorizzati per derivare conoscenze riguardo alla situazione dell impresa e del mercato esterno: questo si chiama DATA MINING o scoperta di conoscenza estratta dalla miniera dei dati aziendali. Il DATA MINING è l estrazione non banale di informazione dai dati, implicita, sconosciuta in precedenza e potenzialmente utile; esso si realizza attraverso la ricerca delle associazioni tra i dati e degli indicatori globali che esistono nei grandi database, ma che sono nascosti all interno della vastità dei dati. Pagina 2 di 6

Il risultato di questo lavoro fornisce informazioni e conoscenze che vengono messe a disposizione delle aree aziendali di supporto alle decisioni, previsioni e valutazioni. Le applicazioni che vengono utilizzate in queste aree sono indicate con le sigle: - DSS (Decision Support System), sistemi di supporto alle decisioni; - OLAP (on-line Analytical Porcessing), elaborazioni di analisi on-line; - EIS (Executive Information System), supporto alla direzione aziendale, per agevolare il controllo degli andamenti e degli indicatori di business. Gli aspetti pratici del Data Mining possono essere: - raggruppamenti di dati - sommarizzazione di dati - apprendimento di regole di classificazione - ricerca di dipendenze tra i dati - analisi di cambiamenti - individuazione di anomalie - analisi di comportamenti e di abitudini IL DATA WAREHOUSE Il Data Mining serve a vagliare grandi quantità di dati per produrre associazione tra i dati, per scoprire regole e fatti. Tutto questo lavoro diventa produttivo se i dati appropriati vengono raccolti e memorizzati in un Data WareHouse: un DataWareHouse può essere definito come il database di tipo decisionale che diventa il deposito centralizzato dei dati e che viene interrogato per intervenire sul business dell azienda; è il legame logico tra ciò che i manager vedono nelle loro applicazioni per il supporto delle decisioni e le attività operazionali dell azienda. Le tecniche per i datawarehouse consentono di estrarre e trasformare i dati presenti nei database relazionali per caricarli nei database decisionali dei sistemi informativi direzionali, per l analisi e il reporting degli utenti che devono pendere le decisioni: i responsabili aziendali possono in questo modo penetrare all interno del vasto database dei dati operazionali dell azienda, per determinare gli indicatori, rispondere all andamento del mercato, facilitare gli forzi di previsione e di pianificazione. Ci sono quattro caratteristiche che descrivono un data warehouse: 1. orientato ad un aspetto specifico: i dati sono organizzati secondo un aspetto invece che un applicazione; per esempio in una società di assicurazione un data Pagina 3 di 6

warehouse organizza i dati secondo i clienti o i premi invece che secondo i differenti prodotti assicurativi (auto, vita). I dati organizzati per argomento contengono solo le informazioni necessarie nei processi di supporto alle decisioni. 2. integrato: quando i dati risiedono in molte applicazioni separate nell ambiente operazionale, la codifica dei dati è spesso inconsistente. Per esempio, in una applicazione, il sesso delle persone è codificato con M e F, in un altra con 0 e 1. Quando i dati passano dal sistema operazionale al data warehouse, essi devono assumere un uniformità nella codifica, per esempio trasformando il sesso in M o F. 3. consolidato: il data warehouse contiene i dati che sono precedenti da 5 a 10 anni, o più vecchi, che devono essere usati per confronti, tendenze e previsioni. Questi dati non possono essere modificati. 4. non volatile: i dati non possono essere modificati o cambiati in nessun modo una volta che sono entrati nel data warehouse, ma possono essere solo caricati e consultati. La realizzazione di un data warehouse si compone di tre elementi fondamentali: strumenti per estrarre, trasformare e caricare dati provenienti dai database operazionali; archivi per memorizzare i dati in database decisionali; strumenti per accedere e operare l analisi dei dati in archivio. La seguente tabella illustra le differenze tra un database tradizionale e un data warehouse: Caratteristica Operazionale DATABASE Decisionale DATA WAREHOUSE Obiettivo Transazione giornaliere Ritrovamento e analisi delle informazioni Tipo di dati Dati per gestire il business Dati per analizzare il business Stato dei dati Modificabili Storici Pagina 4 di 6

CAMPI DI APPLICAZIONE Le applicazioni di data mining e di data warehouse sono potenzialmente importanti in vari campi per ottenere indicatori, controlli di andamenti, previsioni e pianificazioni, come si vede dai seguenti esempi: Commercio e grande distribuzione indicatori negli acquisti dei clienti associazioni tra le caratteristiche demografiche dei clienti previsione di risposta a una campagna di pubblicità postale analisi del contenuto del carrello della spesa Assicurazioni previsione sulle nuove polizze che verranno acquistate dai clienti indicatori di comportamento dei clienti a rischio individuazione di comportamenti fraudolenti Trasporti percorsi ottimali per le consegne caricamento degli automezzi in funzione degli itinerari Medicina comportamento dei pazienti per prevedere le visite ambulatoriali terapie mediche di successo per differenti malattie Pagina 5 di 6

BANCHE indicatori di usi fraudolenti delle carte di credito identificazione dei clienti fedeli previsione su come i clienti cambieranno il tipo di carta di credito modalità di utilizzo della carta di credito per gruppi di clienti correlazioni nascoste tra differenti indicatori finanziari identificazione delle regole del mercato attraverso i dati storici Per quanto concerne i prodotti commerciali per eseguire il Data Mining, si rimanda al seguente indirizzo web dal quale è possibile scaricare il documento Stato dell arte dei sistemi commerciali di Data Warehouse redatto da InterData: www.dia.uniroma3.it/interdata/relaz98/mo.htm Pagina 6 di 6