SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1
Sistemi informazionali La crescente diffusione dei sistemi informativi a supporto delle attività aziendali ha fatto nascere un nuovo tipo di esigenza: sfruttare il patrimonio dei dati per identificare le informazioni utili al processo decisionale. I primi strumenti di supporto alle decisioni furono: Report Fogli excel Ben presto tali soluzioni mostrano evidenti limiti. 2
Sistemi informazionali Limiti dei report: Staticità dei dati estratti: un report fotografa un istante aziendale secondo una logica prefissata. Un ulteriore dettaglio richiede il lancio di un secondo report (se disponibile, altrimenti bisogna implementarlo) Difficoltà e lentezza iter di realizzazione: se il sistema operazionale è fornito da una terza parte possono passare anche mesi per l effettiva realizzazione. Anche se sviluppato internamente richiede più passaggi per la realizzazione Parzialità: i report lavorano esclusivamente sulla base dati operazionale presente in azienda e male si integrano con fonti esterne 3
Sistemi informazionali Limiti dei fogli elettronici: Macchinosità: i dati devono essere estratti dalle fonti e copiati nei fogli. Se le fonti sono diverse spesso non sono nemmeno copiabili Scarso controllo dei dati: nessun controllo sulla natura dei dati Proliferazione di strumenti personali di calcolo: ogni persona crea la propria soluzione spesso replicando parzialmente il lavoro di altri Grande complessità strutturale del db operazionale: è praticamente impossibile che un utente medio conosca la logica e dunque possa identificare la locazione fisica delle informazioni 4
sistemi operazionali => sistemi informazionali Esempio di interrogazione: Quale modalità di pagamento è stata concordata col cliente? Quali fatture devo ancora pagare? Cosa deve produrre oggi il centro di lavoro X Esiste una correlazione tra la zona che risiede il cliente, la sua scolarità e la propensione all acquisto beni di lusso? All ultima interrogazione può rispondere solo un sistema informazionale perché sui sistemi operazionali le interrogazioni sono previste, prefissate e definite dai processi implementati 5
Concetti generali. Terminologia 1/2 6 Aumenta la mole dei dati disponibili, aumenta la richiesta di estrazione informazioni strategiche. Nell ambito dei sistemi informazionali sono d uso corrente terminologie e acronimi: Data warehouse: è la base dati informazionale, raccoglie in un unico magazzino (warehouse) tutti i dati di interesse per l azienda Data warehousing: insieme di attività che porta alla definizione, costruzione e mantenimento struttura delle informazioni nel data warehouse Decision Support System (DSS): sistemi di supporto alle decisioni, sono tutti gli strumenti informatici che servono all estrazione di informazioni per il processo decisionale. Es. browser OLAP
Concetti generali. Terminologia 2/2 Data mining: l insieme di strumenti e tecniche utilizzate per estrarre dai dati informazioni nascoste. Il data mining si basa sul principio che spesso i dati possono rivelare relazioni che l utente non immagina Business intelligence: si intende in senso ampio l insieme delle attività orientate a estrarre informazioni dai dati di business Knowledge management: la conoscenza non è mantenuta dai dati stutturabili/strutturati ma anche dall insieme delle competenze e conoscenze che ogni persona porta nell azienda e dai dati reperibili tramite web 7
Sistemi di data warehouse I sistemi di data warehouse sono solitamente costituiti da: Dal data warehouse vero e proprio, ovvero il database che mantiene le informazioni Dalle procedure che utilizzano il data warehouse, le più svariate: popolamento del db, trasformazione, controllo e riorganizzazione dei dati al fornire strumenti di analisi per i processi aziendali Il frutto finale dei sistemi di data warehouse sono solitamente gli analizzatori OLAP, On Line-Analytical Processing (Edgar Codd, 1993). Si possono definire come uno strumento interattivo di analisi guidata dalle ipotesi sui dati. L utente formula un ipotesi e interroga la base dati per verificare la veridicità dell ipotesi. 8
Sistemi di data mining 1/2 I sistemi di data mining hanno lo scopo di portare alla luce informazione nascoste nei dati, sono sistemi complessi in grado di elaborare enormi quantità di dati difficilmente trattabili da una persona. Le elaborazioni tipo sono: ricercare schemi che si ripetono Associazioni tra i dati Cluster (dati che si dispongono in modo preferenziale attorno a particolari valori) singolarità (dati che si discostano dalla maggioranza degli altri) Tendenze Utilizzano tecniche complesse come il calcolo statistico multivariato, pattern recognition e intelligenza artificiale. 9
10 Sistemi di data mining 2/2 Probabilmente non si può parlare di data mining senza avere alle spalle un sistema solido di data warehouse. Ecco alcuni ambiti di utilizzo: Ambito commerciale, i centri di distribuzione analizzano le preferenze dei clienti. Tramite le carte fedeltà tracciano il profilo del cliente e associare il dettaglio acquisti effettuati. Le variabili sono numerose: del cliente (sesso, età, scolarità, nucleo familiare, reddito) dell acquisto (giorno, ora, prodotto, quantità, posizione prodotto, promozioni, pagamento) Ambito produttivo, le informazioni dei reclami e del rilevamento non conformità sono analizzate congiuntamente con quelle dei componenti utilizzati allo scopo di rilevare frequenze particolari di guasti associandoli ad un determinato lotto o lavorazioni
11 Dati. Operazionale vs informazionali 1/3 L informazione analitica si differenzia in modo marcato dall informazione operazionale. Caratteristiche di scostamento sono: Finalità: i sistemi operazionali hanno come fine l esecuzione o il supporto all esecuzione di operazioni quotidiane. I sistemi informazionali devono descrivere il passato, aiutare a identificare i problemi e le cause, suggerire i cambiamenti da apportare Struttura: i dati dei sistemi operazionali sono articolati attorno a funzioni, procedure ed eventi. Nei sistemi informazionali le informazioni riguardano il soggetto (individuali o collettivi) Utenza e strumenti: i sistemi operazionali sono utilizzati prevalentemente da personale esecutivo e dai primi livelli di management
Dati. Operazionale vs informazionali 2/3 Livello di dettaglio: nelle informazioni quotidiane interessa accedere a informazioni puntuali sull oggetto, esempio l operatore che inserisce un ordine vuole sapere condizioni commerciali, di spedizione, pagamento A livello decisionale l informazione dettagliata è inutile, servono dati aggregati per cogliere contemporaneamente più punti di vista Tipo di accesso: i sistemi informazionali non producono nessun dato, cercano di cogliere le relazione fra i dati. L accesso ai dati è di solito in sola lettura. L aggiornamento/inserimento dei dati avviene nei sistemi operazionali con scadenza solitamente giornaliera 12
Dati. Operazionale vs informazionali 3/3 Differenze così marcate tra dati utilizzabili per i sistemi operazionali e informazionali rendono le basi di dati progettate per il supporto operazionale assolutamente inadeguate per il supporto informazionale. Conseguenza: sistemi informazionali adottano il modello multidimensionale 13
Il modello multidimensionale Perché utilizzare un modello a struttura multidimensionale? Perché è intuitivo, facilmente interpretabile dall utente, particolarmente efficiente nelle operazione di aggregazione e disaggregazione dei dati. Esempi di analisi: Abitudini di acquisto dei clienti => si valutano gli acquisti effettuati dai clienti Efficienza della catena di distribuzione => si associano agenti e articoli IL modello standard utilizzato prevalentemente è l ipercubo: una matrice multidimensionale 14
Il modello multidimensionale Per costruire un ipercubo dobbiamo identificare: Fatto elementare o elemento, un valore per ogni possibile cordinata Misure numeriche che quantificano il fatto elementare Dimensioni, le coordinate di ciascun elemento Esempio: Il fatto elementare è la vendita di un prodotto, le misure sono la quantità e l importo. Le dimensioni di analisi sono l articolo venduto, l anno e la zona dove è stato venduto il prodotto 15
L ipercubo La figura rappresenta l ipercubo a 3 dimensioni relativo all esempio nella slide precedente 16
Si noti come dall ipercubo risulta più facile leggere le informazioni rispetto alle tabelle che contengono i dati Prodotto Area 2003 2004 Confronto Articolo 1 Centro 60 56 7% Est 203 220 8% Ovest 64 64 0% Prodotto Area Agente 2003 2004 Confronto Articolo 1 Est Dal Farra 43 52 21% Del Do 24 25 4% Mansi 28 30 7% Trevisan 28 30 7% Ovest Brambilla 89 93 4% Cozzi 71 75 6% Raiteri 13 11-15% Rossi 27 28 4%
Data mart Il data warehouse per completezza e profondità storica può raggiungere dimensioni estremamente elevate e/o probabilmente contenere dati che a qualcuno potrebbero non servire. Esempio, il direttore delle vendite e marketing è poco interessato alle informazioni relative alle spedizioni o sui dipendenti. Al fine di ridurre la complessità viene utilizzato un data mart, una sorta di data warehouse tematico che contiene solo i dati riguardanti una certa area di indagine 18
19 Creazione data mart tematici