Trattamento dati nelle imprese

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Trattamento dati nelle imprese"

Transcript

1 Università degli studi di Torino Corso di laurea in Fisica maggio 2006 Trattamento dati nelle imprese Riccardo Grosso

2 Programma del corso I) cenni storici, tipologie di basi dati, cenni di progettazione basi dati, riuso dati, data quality, data mining, esempi di realizzazione sistemi decisionali II) progettazione basi dati operazionali (approfondimento) e cenni di reverse engineering III) progettazione basi dati decisionali (approfondimento) IV) repository di metadati e schemi concettuali V) applicazione del modeling concettuale al web (cenni di web semantico ed ontologie) VI) DOMANDE DI VERIFICA

3 Cenni storici L'esigenza dell'archiviazione è cresciuta di pari passo con l'evoluzione della civiltà. L'archiviazione in senso lato può essere intesa, prima di tutto, come un'organizzazione della memoria, di un singolo individuo così come di un organismo, di un Ente, di uno Stato, di un popolo. Fin dall'ottavo secolo avanti Cristo gli Assiri e i Babilonesi avevano creato ed organizzato dei veri e propri archivi. Questa ipotesi è stata formulata sulla base dei resti giunti fino a noi di documenti costituiti da simboli cuneiformi incisi su cilindri e tavolette d'argilla.

4 Cenni storici Nell'antichità ci sono stati anche numerosi esempi di forme alternative di archiviazione, come l'archiviazione orale. In tale contesto si inserisce anche la figura dello mnemon, che, nell'antica Grecia era un impiegato pubblico, il quale, sotto il vincolo di un giuramento di riservatezza (a tutela della privacy come si direbbe oggi) aveva il compito di memorizzare informazioni utili alla gestione dello Stato, tra cui sentenze emesse dai giudici, contratti stipulati tra i privati e informazioni sullo stato patrimoniale dei singoli cittadini.

5 Cenni storici Tali paleo-archivi servono a testimoniare che nell'uomo è sempre stata molto sentita la necessità di organizzare in modo "ufficiale" i documenti. Tale organizzazione, da un punto di vista storico, è una fonte insostituibile di informazioni sulla civiltà che ha creato e custodito tali documenti. Uno dei concetti che emerge prepotentemente da questa valutazione è che l'esigenza di creare un archivio nasce dalla necessità di conservare ed organizzare i dati e i documenti. Quindi il concetto di archivio è strettamente correlato ai concetti di dato, documento, organizzazione e conservazione.

6 Cenni storici Passando dal concetto di archiviazione orale o scritta a quello di archiviazione magnetica, il problema è che le informazioni non possono essere conservate nella memoria centrale del computer (RAM) in quanto allo spegnimento vanno perdute. Fino agli anni 60 le tecnologie utilizzate per memorizzare stabilmente i dati consistevano in nastri perforati e schede perforate di carta (per i dati che non subivano modifiche frequenti). I dati soggetti a frequenti variazioni come i dati di gestione aziendale venivano messi su nastri magnetici. Meno frequenti e più costosi erano i tamburi magnetici: grossi cilindri di metallo in rapida rotazione sulla cui superficie era depositata una vernice magnetica su cui si spostava una testina di scrittura e lettura.

7 Cenni storici Ormai da 20 anni la tecnologia utilizzata per la archiviazione di informazioni modificabili è il disco magnetico. La fortuna del disco non accenna a diminuire. Anzi sembra aumentare continuamente di capacità, attraverso una diminuzione delle dimensioni della testina, e di velocità di accesso, attraverso una maggiore velocità di rotazione. Il costo dei dischi magnetici è passato nel giro di 10 anni da lire al megabyte nel 1987 alle 500 lire del 1996.

8 Cenni storici Questa tendenza sembra essere duratura anche se la tecnologia magnetica rimane sempre più costosa di quella ottica (che nel caso dei CD scrivibili (CDR) è di circa 1 centesimo al megabyte). La memoria disco costa molto di meno della memoria RAM che ha un costo intorno alle 5 euro a megabyte, ma ha una velocità di accesso dell ordine dei 10 millisecondi contro i 70 nanosecondi della RAM. Questo ultimo aspetto condiziona tutto il funzionamento del calcolatore. In una grande azienda possono esserci infatti Terabyte (migliaia di Gigabyte) di memoria disco.

9 Cenni storici Il disco viene utilizzato per conservare gli archivi di una azienda cioè i dati sulla amministrazione, sulle vendite e sui processi produttivi. Rendere veloci gli accessi a questi dati è più importante della velocità di calcolo necessaria per trattarli. Nei mainframe il problema veniva risolto parzialmente dotando le unità disco (controller del disco) di grande memoria e intelligenza di gestione. In pratica veniva messa una notevole quantità di memoria RAM su ogni controller in modo che tutti i dati più frequentemente letti venissero inseriti nella memoria RAM senza la necessità di caricarli continuamente dal disco.

10 Cenni storici Anche i moderni sistemi operativi utilizzano questa tecnica, in altre parole i dati del disco vengono bufferizzati in memoria RAM. Un buffer è una zona di memoria usata come deposito e come tampone tra i processi che richiedono i dati ed il disco. Il disco viene comunque visto dal sistema operativo come un insieme di tracce e settori. Alcuni file vengono gestiti in modo particolare sia per le ricerche di dati che per la loro scrittura. Questi file sono detti normalmente archivi. Le aggregazioni di archivi tra di loro correlati sono definite normalmente data base.

11 Cenni storici Tipologie di basi di dati Con un certo grado di approssimazione possiamo dire che esistono due modi di suddividere e gestire i dati: gestori di file e Data Base relazionali. Gestori di file: ogni base di dati è rappresentata da un file, che si divide in record: il record rappresenta uno degli elementi che si desidera registrare, ed è composto a sua volta da campi, cioè dati elementari che caratterizzano ogni entità da classificare. Con un gestore di file, ogni dato si immagazzina in un unico file e le operazioni sui dati interessano un solo record per volta. Data Base relazionali: si presentano in forma tabellare in cui le righe rappresentano i record e le colonne rappresentano i campi. Le operazioni realizzate con questo tipo di Data Base riguardano le tabelle e non i record individuali, come nel caso dei gestori di file.

12 Cenni storici Prima della comparsa dei database relazionali esistevano altre tipologie di database, come i gerarchici ed i reticolari. Questi richiedevano una conoscenza approfondita dei dettagli fisici concernenti la memorizzazione dei dati su disco e anche le operazioni concettualmente più semplici (come leggere i dati di una tabella) richiedevano un grosso lavoro. Oggi sono scomparsi perché il modello relazionale presenta degli enormi vantaggi.

13 Cenni storici Oggi i principali Data Base sono di tipo relazionale, ciò perché praticamente tutti gli insiemi di dati che corrispondono a entità complesse organizzate come imprese, scuole, associazioni varie, implicano collegamenti tra i vari dati ad esempio: ai fornitori sono collegate le merci, agli alunni i corsi, e così via. La norma fondamentale per stabilire relazioni tra tabelle, cioè tra contenitori di dati correlabili, è che il campo di collegamento non deve avere ripetizioni, ossia ogni record deve potere essere identificato in maniera univoca. chiave Il campo che permette l'identificazione di ogni record è detto "chiave primaria" e deve essere comune alle tabelle che si intende correlare. primaria

14 Cenni storici Classificazione delle basi dati Alfanumeriche Operazionali Gerarchiche Reticolari Relazionali Decisionali Relazionali Multidimensionali Documentali Geografiche

15 Progettazione Basi Dati operazionali Modellare i dati Perché modellare i dati: Per comprendere la loro logica e le loro dipendenze Con quale metodo o strumento: Con il modello entità-relazioni o entity-relationship arricchito con le generalizzazioni

16 Progettazione Basi Dati operazionali Perché modellare? Il valore portato dall informatica e potenzialmente utilizzabile da un organizzazione è direttamente correlabile con la ricchezza e la coerenza del suo patrimonio di dati. Tale patrimonio è costituito sia dai fattori interni che servono per produrre il prodotto/servizio, sia dai fattori esterni che interagiscono con l organizzazione nella sua attività quotidiana.

17 Progettazione Basi Dati operazionali Perché modellare? Questi fattori possono essere individuati come entità e qualificati attraverso delle proprietà: ciò costituisce la base informativa che identifica l organizzazione sul mercato. La base informativa quindi rappresenta un immagine del mondo che l organizzazione si crea per poter interagire in modo coordinato tra i vari settori operativi e in accordo con le sue strategie e le sue procedure.

18 Progettazione Basi Dati operazionali Perché modellare? Questa immagine che schematizza la realtà, per poter essere efficace deve rispecchiare la pluralità dei rapporti che l organizzazione intrattiene con ciascuna entità. Tale pluralità rappresenta i differenti punti di vista con cui le varie parti dell organizzazione considerano l entità stessa. I diversi punti di vista devono poi confluire come sottoinsiemi logici in una descrizione generale valida per l organizzazione nel suo complesso.

19 Progettazione Basi Dati operazionali Perché modellare? Matricola cliente Dati anagrafici Indirizzo Posizione debitoria fido Fatturato alla data Valore Ordinato Alla data Dettaglio ordini Entità cliente Settore vendite Settore amministrazione Settore marketing Settore produzione

20 Progettazione Basi Dati operazionali Perché modellare? Un livello ulteriore di rappresentazione riguarda il modo in cui le entità vengono rappresentate in termini informatici. Nel mondo dell informatica a ciascuna entità corrisponde un record (elemento di registrazione sulla memoria di massa). Tale record viene qualificato dai suoi attributi tra cui quello di identificazione (chiave). I record facenti parte di una categoria, in quanto attinenti allo stesso tipo di entità, costituiscono nel mondo informatico un archivio o file.

21 Progettazione Basi Dati operazionali Perchè modellare? In queste schematizzazioni esiste una certa ambiguità logica tra entità ed attributo. La distinzione intuitiva non è rigorosa e può cambiare cambiando la prospettiva. Se si volesse dare particolare enfasi al settore produzione il prodotto (articolo) diventerebbe un entità ed il cliente un attributo

22 Progettazione Basi Dati operazionali Perchè modellare? La scelta tra le varie modalità di rappresentazione incide sull efficienza con cui i dati saranno poi reperiti e deve quindi essere coerente con le strategie operative. L insieme dei dati raccolti non deve contenere al suo interno elementi contraddittori e deve dare una descrizione completa dei vari aspetti del fenomeno che interessa l azienda.

23 Progettazione Basi Dati operazionali Perché modellare? L insieme logico degli archivi o flussi di un organizzazione, unitamente alle tecniche per collegarli tra loro per elaborarli e reperire le informazioni, è la Base di Dati. La Base di Dati è una componente essenziale della struttura di un sistema informatico. Il modo in cui i dati vengono archiviati e gestiti condiziona le regole secondo cui l organizzazione interagisce con gli interlocutori interni ed esterni.

24 Progettazione Basi Dati operazionali Il modello dei dati Esaminiamo i passi che portano dalla teoria alla realizzazione di un Database. I modelli sono strumenti per rappresentare la realtà. La rappresentazione generata secondo le regole del modello viene chiamata schema. Il processo di rappresentazione di un database si articola in tre fasi ciascuna delle quali si riferisce a un diverso livello di astrazione.

25 Progettazione Basi Dati operazionali Il modello dei dati La scomposizione in fasi del processo di progettazione ha lo scopo di scomporre i problemi e garantire la possibilità di modifica delle soluzioni adottate. Queste fasi sono: Schema concettuale (o modello concettuale) Progettazione Schema logico (o modello Logico) Realizzazione Schema Fisico (o modello Fisico) Implementazione

26 Progettazione Basi Dati operazionali Il modello concettuale Il livello concettuale rappresenta la realtà dei dati e le relazioni tra essi attraverso uno schema. Il livello concettuale è la rappresentazione completa ed efficace del contesto, cioè della realtà a cui si riferisce. Essa è la rappresentazione più vicina alla logica umana. I modelli dei dati usati nella progettazione concettuale vengono definiti modelli semantici. Quello più diffuso è l ENTITY-RELATIONSHIP che prevede la individuazione delle Entità, cioè degli oggetti concreti o astratti, a la loro classificazione in insiemi omogenei.

27 Progettazione Basi Dati operazionali Il modello concettuale Le dipendenze tra i dati vengono rappresentati medianti relazioni tra le corrispondenti entità. Esempi di entità sono: una persona, un modello di automobile, un movimento contabile, una prova sostenuta da uno studente. Gli studenti sono classificabili nel tipo entità Studente, i diversi modelli di automobile sono classificabili nel tipo entità Automobile.

28 Progettazione Basi Dati operazionali Il modello concettuale Ciascun studente rappresenta un istanza del tipo entità Studente. L associazione (in inglese relationship quindi relazione) è un legame che stabilisce un interazione tra le entità. Per esempio tra l entità Persona e l entità Automobile esiste un associazione che può essere descritta nel linguaggio naturale secondo due direzioni: una persona possiede una o più automobili e un automobile è posseduta da una persona. Le proprietà delle entità e delle associazioni vengono descritte attraverso gli attributi.

29 Progettazione Basi Dati operazionali Le caratteristiche di ciascun entità vengono descritte tramite gli attributi. Attributi dell insieme di entità articolo possono essere Art_Cod,Art_descr,Art_Prezzo,Art_Iva. Il modello concettuale Ogni attributo è caratterizzato da un nome e dall insieme di valori che esso può assumere. Art_Cod Art_Descr Art_Prezzo Art_Iva

30 Progettazione Basi Dati operazionali Il modello concettuale Le caratteristiche di ogni attributo sono: Formato: Tipo di valori che assume (carattere, numerico, data/ora) Dimensione: Indica la quantità massima di caratteri o cifre inseribili Opzionalità: Indica la possibilità di non essere sempre valorizzato: l attributo è obbligatorio se il suo valore non deve essere nullo, facoltativo se sono accettati valori nulli

31 Progettazione Basi Dati operazionali Il modello concettuale I diversi valori assunti dagli attributi determinano le diverse istanze dell entità. L insieme dei possibili valori assunti da un attributo si chiama Dominio dell attributo. Si indica con il concetto di chiave (chiave primaria o primary key) l insieme di uno o più attributi che consentono di distinguere un istanza dall altra: esempi di chiavi sono il Codice di un Prodotto o la Matricola di un dipendente

32 Progettazione Basi Dati operazionali Entità Il modello concettuale Studente Facoltà Relazione Scelta da Studente Facoltà Iscritto a

33 Progettazione Basi Dati operazionali Attributi Il modello concettuale Studente Matricola Chiave Nome Indirizzo Studente Matricola Nome Indirizzo

34 Progettazione Basi Dati operazionali Il modello logico La fase logica del processo di progettazione di un DB ha lo scopo di tradurre lo schema concettuale in modello logico dei dati. Lo schema logico (a differenza del concettuale) dipende dal tipo di DBMS utilizzato e in particolare dal modello logico dei dati. Il Modello logico dei dati rappresenta come sono organizzati i dati negli archivi elettronici: descrive quindi la composizione ed il formato dei dati nel loro aspetto di struttura logica di dati. Il livello logico viene derivato dal livello concettuale Il Modello logico dei dati è quindi la tecnica di organizzazione e accesso ai dati utilizzata da specifiche categorie di DBMS

35 Progettazione Basi Dati operazionali Il modello fisico Il Modello fisico rappresenta l'effettiva installazione degli archivi elettronici: esso indica l'ubicazione dei dati nelle memorie di massa (dischi). Il livello fisico è quindi l'implementazione del livello logico sui supporti per la registrazione fisica dei dati: partizioni, puntatori, blocchi fisici, cluster, indici. Il Modello fisico stabilisce come le strutture definite a livello logico debbano essere organizzate negli archivi e nelle strutture del filesystem; esso dipende quindi dal tipo di DBMS, dal sistema operativo e dalla piattaforma hardware utilizzata del sistema che ospita il DBMS.

36 UOMO Progettazione Basi Dati operazionali Il Bignami dell entity relationship s pos a s i s pos a con DONNA e' generato genera da F IGLIO guida e' guidata da AUT OMOBILE

37 Progettazione Basi Dati operazionali Il Bignami dell entity relationship UOMO.sposa.DONNA» Ovvero SOGGETTO.predicato-verbale.COMPLEMENTO-OGGETTO» Ovvero ENTITA.relazione.ENTITA

38 Progettazione Basi Dati operazionali

39 Progettazione Basi Dati operazionali Basi Dati Relazionali Definizione di una Primary Key Una primary key (PK) non consente duplicazioni di valori e non può essere NULL. Ciascuna riga è univocamente identificata da una colonna o da un set di colonne (primary key composta). Una chiave candidata può servire anche da PK. Tabella S_ITEM ORD_ID ITEM_ID PRODUCT_ID PRICE QUANTITY QUANTITY_SHIPPED Primary Key Composta

40 Progettazione Basi Dati operazionali Basi Dati Relazionali Definizione di una Foreign Key Una foreign key (FK) è una colonna o una combinazione di colonne in una tabella che fa riferimento a una PK o una UK di una stessa tabella o di un altra tabella. Le FK sono basate sui valori dei dati e sono puramente logiche. Il valore deve corrispondere al valore della colonna collegata o essere NULL. Se una FK è parte di una PK non può essere NULL.

41 Progettazione Basi Dati operazionali Il Bignami dell entity relationship

42 Progettazione Basi Dati operazionali Il Bignami dell entity relationship Le generalizzazioni PERSONA generalizza»uomo»donna

43 Progettazione Basi Dati operazionali Il Bignami dell entity relationship PERSONA UOMO DONNA

44 Progettazione Basi Dati operazionali DBMS I dati prima di far parte del DB devono passare attraverso uno strumento che li gestisca. Il DBMS (DataBase Management System) è il componente del software di base che ti consente di gestire uno o più database.

45 Progettazione Basi Dati operazionali I primi DBMS, realizzati per grandi calcolatori, risalgono alla fine degli anni 60: erano i vecchi FILE SYSTEM. L accesso ai dati era diretto e presentavano vari svantaggi: DBMS Non vi era il controllo e la gestione degli archivi di dati Ci si doveva preoccupare che venissero rispettati i requisiti di ridondanza minima Ci si doveva preoccupare se i dati erano utilizzati contemporaneamente da più utenti Ci si doveva preoccupare se i dati erano utilizzati da più applicazioni Esistevano problemi di permanenza dei dati

46 Progettazione Basi Dati operazionali DBMS Le applicazioni rivolgono le richieste di accesso alla base di dati al DBMS, il quale gestisce i dati svincolando le applicazioni da tale onere. Si ottiene cosi un triplice scopo cioè: Le funzionalità di gestione della base dati sono raggruppate in un unico insieme Le applicazioni sono più leggere e veloci da realizzare Nessuna applicazione potrà cosi effettuare operazioni scorrette sul Database

47 Progettazione Basi Dati operazionali L utilizzo del DBMS comporta una serie di vantaggi che si traducono in una gestione dei dati più affidabile e coerente. DBMS Le caratteristiche vantaggiose del DBMS e contemporaneamente del DB stesso sono: Indipendenza delle applicazioni dalla struttura fisica dei dati Indipendenza dalla struttura logica dei dati Utilizzo da parte di più utenti con applicazioni diverse Eliminazione della ridondanza Eliminazione della inconsistenza Facilità di accesso Integrità dei dati Sicurezza dei dati

48 Progettazione Basi Dati operazionali DBMS In particolare ne deriva: Indipendenza dei dati dall applicazione Riservatezza nell accesso ai dati Gestione dell integrità fisica dei dati Gestione dell integrità logica dei dati Sicurezza e ottimizzazione nell uso dei dati

49 Progettazione Basi Dati operazionali DBMS Indipendenza dei dati dall applicazione In un ambiente FILE SYSTEM i dati avevano senso e valore solo se interpretati dai programmi. La struttura dei dati dipendeva dall applicazione, l applicazione doveva conoscere il formato fisico dei dati, la loro localizzazione, chiavi ecc. Con il DBMS invece i dati hanno una struttura che PRESCINDE dall applicazione che tra l altro non deve piu fare riferimento alla struttura fisica dei dati. Ciò comporta molti vantaggi nella manutenzione del sistema informativo dato che le modifiche alla struttura fisica dei dati non comportano modifiche alle applicazioni.

50 Progettazione Basi Dati operazionali DBMS Riservatezza nell accesso ai dati In un ambiente FILE SYSTEM il sistema di gestione dati non consentiva VISIONI LOGICHE diverse dello STESSO INSIEME DI DATI, ciò comportava l impossibilità di rendere disponibile a determinate categorie di utenza solo parti dell archivio e di soddisfare il REQUISITO DI MINIMA RIDONDANZA DEI DATI. Con l utilizzo di un DBMS vi è la possibilità di avere visioni logiche, multiple e contemporanee della struttura fisica dei dati

51 Progettazione Basi Dati operazionali La gestione dell integrità fisica dei dati DBMS Per soddisfare il requisito di PERSISTENZA DEI DATI è necessario garantire che il sistema di gestione del DataBase mantenga nel tempo le informazioni registrate (ad es. in caso di caduta del sistema o di guasto ai dispositivi di memorizzazione). Inoltre è necessario che il sistema sia protetto da accessi contemporanei agli stessi dati da parte di più utenti. Questa operazione è completamente automatica e controllata dal DBMS e non mette quindi a rischio la consistenza dei dati. Esistono delle norme da seguire per l amministratore del DBMS per impostare e configurare correttamente il sistema al fine di garantire l integrità fisica dei dati.

52 Progettazione Basi Dati operazionali DBMS La gestione dell integrità logica dei dati L integrità logica dei dati consiste nella possibilità di DEFINIRE DEI VINCOLI in modo che non sia possibile inserire o apportare modifiche ai dati CHE NON ABBIANO UN SENSO NEL CONTESTO DELLA REALTA RAPPRESENTATA. Tali vincoli possono essere riferiti: Alle singole categorie di dati (Es. limiti di valori a specifici intervalli o N possibili scelte di valori da immettere) Alle relazioni tra le categorie.

53 Progettazione Basi Dati operazionali DBMS La gestione dell integrità logica dei dati Un tipico caso di integrità logica su una relazione è quello della cosidetta INTEGRITA REFERENZIALE INTEGRITA REFERENZIALE: Definendo tra le categorie un vincolo di integrità referenziale il sistema impedirà la cancellazione di ordini con dettagli ancora esistenti e l inserimento di dettagli non correlati ad un ordine

54 Progettazione Basi Dati operazionali Basi Dati Relazionali Sicurezza e ottimizzazione dell uso dei dati Grazie al DBMS si possono gestiste gli UTENTI e le RISORSE. Le Funzioni di gestione degli utenti consentono all amministratore del sistema di definire dei vincoli di accesso ai dati e di stabilire per ciascun utente il diritto di accesso (SCRITTURA, LETTURA, MODIFICA e cosi via) alle singole unita di informazione del DB. Il DBMS inoltre gestendo direttamente alcune risorse quali le periferiche consente di ottimizzare l utilizzo rispetto a come queste vengono controllati direttamente dal sistema operativo.

55 Progettazione Basi Dati operazionali Approfondimenti sulla progettazione concettuale dati Il corso del professor Lenzerini:

56 Progettazione Basi Dati operazionali Approfondimenti sulle tecniche di reverse/forward

57 Introduzione alle basi dati decisionali Basi dati operazionali e decisionali Differenze Dall operazionale al decisionale

58 Tipologie di Banche Dati Due tipologie di banche dati: operazionali: contengono dati di interesse quotidiano vengono aggiornate costantemente in relazione alle procedure amministrative e tecniche di competenza di un ente informativo-decisionali: servono per supportare le esigenze di integrazione di informazioni provenienti da banche dati operazionali diverse sia ai fini di diffondere conoscenze, sia per supportare i processi decisionali ai diversi livelli (micro o macro decisioni)

59 Tipologie di sistemi informativi Sistemi decisionali Sistemi operazionali?? st 4th Qtr Qtr

60 Sistema operazionale Elabora le necessità del day to day Disegnato per specifiche funzioni Fornisce alcuni reports

61 Sistema decisionale? st Qtr 4th Qtr Supporto alle Decisioni Analisi delle Tendenze Reportistica

62 Criticità sistema operazionali Molte delle richieste dell utente sono complesse da soddisfare, causa l attuale difficoltà di accesso agli Operational Data Bases.

63 Che cos è un Data Warehouse? All interno di un sistema informativo, per Data Warehouse si intende la componente che deve soddisfare esigenze di tipo informativo e decisionale E costituito da una architettura complessiva di ambienti hardware e software, da applicazioni che alimentano la base dati decisionale e che ne consentono la fruizione in funzione delle diverse esigenze

64 Che cos è un Data Warehouse? Passare dai dati alle informazioni Remember that the ultimate goal of Data Warehouse is to keep the right information to the right people in the most intelligent form Dr R. Hackathorn - Bolder Technology

65 Che cos è un Data Warehouse? Mentre i dati sono contenuti negli archivi dei database operativi, progettati per rispondere ad esigenze settoriali, per informazioni si intendono le conoscenze che hanno un unico significato in tutte le situazioni e che possono essere utilizzate per i processi decisionali ed informativi

66 Data Warehouse: una definizione tecnica A non volatile source of time-series, subject oriented, data copies for end user computing (Inmon, 1990)

67 Obiettivi del DW Performance Flessibilità Scalabilità Facilità d uso Qualità dei dati

68 Obiettivi del DW Richieste dinamiche Performance Analisi Multi Dimensionale vs Tradizionale Impatto minimo sui Operational System

69 Obiettivi del DW Flessibilità Flessibilità del Modello Modifica delle strutture dati

70 Obiettivi del DW Scalabilità Numero degli utenti Volume dei dati

71 Obiettivi del DW Facilità d uso Comprensione del Modello Navigazione Manipolazione

72 Che cos è un Data Warehouse? Subject-Oriented (orientato alle aree tematiche) Integrato Time-Variant (comprende dati temporali) Non volatile Collection of data in support of management s decision making process Bill Inmon

73 Subject-oriented (Orientata ai soggetti) Nel DW i dati sono organizzati per soggetto anziché per applicazione Tra tutte le informazioni operazionali vengono selezionate solo quelle necessarie per il processo decisionale

74 Data copies - Copie dei dati I dati vengono trasferiti dal data base operazionale a quello decisionale effettuando operazioni di trasformazione Quando i dati di provenienza diversa vengono trasferiti al D.W. devono assumere una codifica omogenea ed un significato univoco. Ad esempio un informazione riferita al sesso potrebbe essere memorizzata con codici diversi, M/F in un caso 0/1 in un altro.

75 Time series - Serie storiche Vengono memorizzate fotografie della stessa realtà in momenti successivi Questo consente di effettuare confronti, individuare tendenze e fare previsioni. I dati vengono aggiornati periodicamente (e non in tempo reale come nei sistemi gestionali).

76 Non volatile - Persistenti Nel DW i dati immessi non vengono più modificati Essendo fotografie ripetute nel tempo, una volta immesse non vengono modificate. I dati immessi vengono in genere sottoposti a processi di aggregazione.

77 Perché un Data Warehouse Per ricavare informazioni (non solo dati) Per comprendere la qualità delle basi dati Per migliorare la qualità del dato operazionale Per offrire funzioni decisionali integrate nell operazionale

78 Perché un Data Warehouse Per migliorare la ricerca del business Per valorizzare il servizio fornito all utente Per migliorare la qualità dei dati al servizio dell utente Per re-ingegnerizzare i processi di Business Per fornire competitività all azienda

79 Cos è un Data Warehouse: per capirsi meglio. Non è un prodotto, ma un insieme di componenti che costruiscono un architettura Il cuore è una base dati strutturata diversamente da quelle operazionali E un vecchio problema, ma ora sono disponibili metodologie e strumenti di alimentazione ed accesso molto specializzati

80 Architettura Logica utente che aggiorna i dati applicazioni di produzione (OLTP) utente che interroga i dati applicazioni di ricerca e analisi(olap) base dati di produzione Dati sorgente Alimentazione Dati Dati destinazione base dati decisionale (DW) Metadati Basi dati operazionali Basi dati informativo-decisionali

81 Com è fatto un Data Warehouse? Alimentazione DW (Data Capture): dalla base dati amministrativa-gestionale alla base dati decisionale (Data Warehouse) back-end Accesso DW (Data Access): Servizi di accesso al Data Warehouse da parte degli utenti finali front-end

82 Data Warehouse Framework Raw detail No/minimal history Source OLTP Systems Data characteristics Integrated Scrubbed History Summaries Targeted Specialized (OLAP) Data Marts Data Warehouse Design Mapping Extract Scrub Transform Load Index Aggregation Replication Data Set Distribution Access & Analysis Resource Scheduling & Distribution Meta Data System Monitoring

83 I metadati Sono le Pagine gialle Punti di vista: l utente finale, l amministratore dati, l analista, l azienda Esempi sui contenuti: catalogo delle informazioni, fonte, algoritmi di derivazione, qualità dei dati, dimensioni per la navigazione multidimensionale

84 I metadati I Metadati coprono l intero processo di DW/DM Disegno Mapping Estrazione Trasformazione Caricamento Indicizzazione Aggregazioni Replica Distribuzione dei dati Accesso e Analisi Resource Scheduling & Distribution Metadati System Monitoring Assolutamente necessario per la riuscita del progetto

85 Data Capture Data Management Estrazione e trasformazione dei dati Integrazione dati da diverse fonti Validazione dei dati (IMPORTANTE!!) Aggregazione Schedulazione aggiornamenti Caricamento nel data base e flussi di snellimento (scarico dati storici) Data Organization Metadati: Inserimento Aggiornamento

86 Il Processo di ETL (Extract, Transform & Load) Dati OLTP System Data Staging Area aggregazione classificazione (Enterprise) Data Warehouse Dati Esterni validazione standardizzazione Data Mart Data Mart Estrazione Pulizia Trasformazione Caricamento Metadati

87 Data Capture Le alternative sviluppare programmi ad hoc acquistare appositi tool Scelta da meditare, costi mediamente elevati Le nostre scelte programmi ad hoc: PL/SQL, SAS tool: SAS Warehouse Administrator

88 Quale database per il DW Le alternative relazionale (Oracle,...) relazionale ah hoc per D.W.(Red Brick) multidimensionale (Essbase,...) mix tra relazionale e multidimensionale (H- OLAP) Le nostre scelte: Oracle e SAS

89 Data Modeling per sistemi decisionali elevata complessità di una struttura E/R classica (tipica dei sistemi transazionali) eccessiva difficoltà per l utente finale di rintracciare i dati di Interesse impossibilità di effettuare analisi sui dati necessità di passare ad una struttura logica e fisica dei dati, più funzionale rispetto alle esigenze del data warehouse

90 Struttura di una base dati decisionale Oggetto di Intervento Comune Beneficiario Finanziamenti Procedimento La Base Dati è un insieme di fatti fatti nello spazio multidimensionale

91 Struttura multidimensionale L architettura fisica del Modello Dimensionale è descritta attraverso lo STAR SCHEMA Prodotto Clienti Tempo Geografia Produzione

92 Data Modeling per sistemi decisionali: lo Star Schema è uno schema di dati facilmente navigabile è uno schema fortemente denormalizzato il patrimonio informativo è organizzato per soggetti : separazione concettuale dei soggetti ogni soggetto è modellato autonomamente in uno Star Schema

93 Data Modeling per sistemi decisionali: lo Star Schema Dimensione1 Dimensione1_PK Tavola dei Fatti Dimensione1_PK Dimensione2_PK Dimensione3_PK Dimensione4_PK Dimensione2 Dimensione2_PK Dimensione3 Dimensione3_PK Misura1 Misura2 Misura3 Misura4 Dimensione4 Dimensione4_PK

94 Data Modeling per sistemi decisionali: lo Star Schema Tavola dei fatti Contiene i Fatti del Business che si intende analizzare o misurare (generalmente numerici) Tavole delle dimensioni Le Dimension rappresentano il CONTESTO per i fatti che si intende analizzare

95 Esempio di Star Schema

96 Esempio di Star Schema

97 Data Access Elaborazioni periodiche e off line Elaborazioni su richiesta e on line Strumenti di query e reporting (su dati alfanumerici e/o su dati territoriali) Analisi multidimensionale Applicazioni EIS (what-if, agenti intelligenti, applicazioni GIS specializzate) e di modellazione (modelli matematici, modelli territoriali, ecc.) Data mining

98 Tecniche di Accesso alle Informazioni TIPI DI UTENTE Dirigenti Intermedi Impiegati EIS Executive InformationSystem Produzione Queries & Reports su esigenze Queries & Reports preconfezionati OLAP Data Mining Visualizza Analizza Scopri TIPI DI PROCESSO

99 Cos è l OLAP? On Line Analytical Processing Due accezioni In contrapposizione ad OLTP (On Line Transaction Processing): Insieme dei processi che accedono ad un Data Warehouse Più specifica: analisi di tipo multidimensionale, con operazioni di navigazione sui dati (drill-up, drill-down, drill-across, slice & dice)

100 Data Mining: Definizione The automatic discovery of knowledge from stored data Approccio più specializzato, metodi statistici, strutture dati specifiche diverse dal DW

101 Quali ambienti per il Data Access Tool verticali (es. prodotti sugli aspetti finanziari o di marketing quale la soluzione DW SAP, ) Tool orizzontali chiavi in mano (es. Business Objects Tool orizzontali aperti (es. SAS) Le nostre scelte: SAS System Business Objects

102 Business Object Navigazione sui dati organizzati in Universi Accesso ai dati trasparente rispetto alla struttura fisica del database Utenti finali Utenti finali Query Panel Universo DataBase

103 SAS Utenti finali Utenti finali Creazione prospetto MDDB

104 Esempio

105 Back-end Front-end Oracle SAS Warehouse Administrator Data Warehous e Business Objects REPORT Alimentazione DW (Data capture) Accesso DW (Data access)

106 Dal DB gestionale Analisi base dati gestionale + Studio delle interrogazioni

107 al DB decisionale

108 L applicazione sviluppata wijsp Bdm/luisa

109 Approfondimenti sulla progettazione DataWarehouse Il corso del professor Batini:

110 Cenni sul riuso dei dati Costruire una serie di tavole di riferimento (di uso operazionale e decisionale) contenenti codifiche comuni, complete, certificate ed aggiornate costituisce un primo passo per l'integrazione delle basi dati, l'interscambio informativo e la cooperazione tra le diverse amministrazioni. Per acquisire la classificazione che si vuole gestire in una tavola trasversale, viene ricercata la fonte dati più qualificata. Obiettivo è quello di identificare l'ente responsabile dell'informazione (ISTAT per i codici Istat, Ministero delle Finanze per i codici Belfiore, ecc): in tal senso i dati acquisiti vengono considerati "certificati", ovvero emessi dalla fonte che li produce e ne è responsabile. Una volta acquisito il flusso informativo dalla fonte dati individuata, si procede comunque ad una fase sistematica di controllo e validazione dei dati acquisiti: viene verificata, ad esempio, la corrispondenza del livello di aggiornamento con quello dichiarato dalla fonte, la completezza dell'informazione, in sintesi l'idoneità dei dati a corrispondere all'obiettivo informativo per cui sono raccolti.

111 Cenni sulla qualità dei dati La Qualità dei Dati è la misura dell'accordo che esiste tra quanto rappresentato in un sistema informativo, e lo stesso dato nel mondo reale. Una Qualità dei Dati del 100% indica che esiste un perfetto allineamento dei dati presenti nel nostro sistema informativo, con quanto presente nel mondo reale. Data la natura di continua evoluzione caratteristica del mondo reale, nessun sistema informativo di una dimensione significativa può avere una Qualità dei Dati del 100%. L'obiettivo da perseguire è quello di avere dei dati sufficientemente aggiornati, accurati e completi in modo che possano essere utilizzati efficacemente. I processi di data quality devono eliminare non solo i semplici errori e le ridondanze. Devono rendere tra loro consistenti set di dati che sono stati creati in tempi diversi, seguendo differenti regole di raccolta o esigenze di business. In passato (e talvolta ancora oggi), gran parte del lavoro di ripulitura dei dati poteva essere fatto "a mano" dagli operatori. Il laborioso processo di ricerca e correzione per eliminare le informazioni scorrette, completare quelle parziali o cancellare quelle duplicate è molto costoso e inoltre comporta l'aggiunta di nuovi errori. Ma per questo esistono oggi dei tools specializzati che usano complessi algoritmi per analizzare, standardizzare, correggere e integrare le informazioni.

112 Tools di data quality Un valido tool di Data Quality deve essere di supporto in tutte le fasi del complesso processo di bonifica dati, che parte dall'analisi iniziale del problema (analisi dati e processi), procede con la pianificazione e l'implementazione degli interventi di miglioramento e si conclude incorporando le misure di miglioramento nel sistema. In primo luogo il tool di Data Quality deve consentire di effettuare attività di pulizia e integrazione dei dati utilizzando vocabolari, regole sintattiche e di fonetica che sono proprie della lingua italiana. Inoltre deve fornire procedure specializzate che siano di supporto alle seguenti attività: Data profiling: utilizzo di tecnologia analitica applicata ai dati per comprendere contenuto e struttura delle quantità di informazioni elaborate ed applicare funzioni statistiche sui dati; Deduplicazione: individuazione di record simili (record linking); Standardizzazione: associazione ad una serie di valori definiti "somiglianti" di un valore standard determinato.

113 Tools di data quality Dovrebbe essere consentita anche la customizzazione del tool, ovvero la generazione di regole e criteri personalizzati che si adattino al contesto informativo su cui viene attivato il processo di bonifica dati. Infine le funzionalità di Data Quality devono poter essere integrate nei processi di ETL (Estrazione Trasformazione e Caricamento massivo di dati) e nelle procedure di Data Entry. Allo scopo di valutare i requisiti sopraelencati, il gruppo ha avviato la sperimentazione del tool di Data Quality fornito della SAS, SAS Data Quality Solution, avuto in prova dall'ottobre del Questa sperimentazione ha avuto buon esito e, a giugno 2004, il CSI ha proceduto alla richiesta di acquisto della licenza di SAS Data Quality, per il suo utilizzo in numerosi progetti aziendali.

114 Definizione di qualità dei dati Definizione del concetto di qualità fornita dallo standard ISO 8402 Quality Management and Quality Assurance-Vocabulary : l insieme delle caratteristiche di un entità che conferiscono ad essa la capacità di soddisfare esigenze espresse ed implicite La qualità dei dati può essere definita come segue: Un insieme di caratteristiche che un data item deve avere affinché effettui i compiti per cui è stato concepito; tali caratteristiche sono specificatamente riferite ai valori ed al formato del data item Una definizione di data item è: Dato un modello di dati, un data item è l elemento a granularità più bassa del modello

115 Proprietà della qualità dei dati In base a queste definizioni si possono evidenziare le seguenti due proprietà: la qualità di un entità è un concetto soggettivo, fortemente dipendente dai requisiti che l utente dell entità richiede in maniera implicita o esplicita; la qualità è rapportata ad un insieme di caratteristiche, è dunque un concetto multidimensionale,ovvero determinabile in base a diverse componenti piuttosto che in base ad una singola.

116 Dimensioni della qualità dei valori Le dimensioni della qualità dei dati sono classificate in tre categorie: schema concettuale, valori e formato: Lo schema concettuale si riferisce all aspetto intensionale dei dati, ovvero a quella componente dei dati che rimane invariata nel tempo. I valori sono invece relativi all aspetto estensionale dei dati, ossia alla parte variabile nel tempo. Il formato è connesso alla modalità di rappresentazione dei dati.

117 Dimensioni della qualità dei valori Accuratezza sintattica, definita come vicinanza del valore del data item ad un valore nel dominio di definizione sintattico considerato corretto. Ad esempio, un basso grado di accuratezza sintattica corrisponde ad un valore di un data item che è Mrio anziché Mario. Accuratezza semantica, definita come vicinanza del valore del data item ad un valore nel dominio di definizione semantico considerato corretto. Ad esempio, un basso grado di accuratezza semantica corrisponde al caso in cui si abbia Maria anziché Mario. Accuratezza temporale, definita come vicinanza del valore del data item al valore temporalmente corretto. Si consideri, come esempio, il data item indirizzo di residenza; se Mario Rossi deve avere un indirizzo di residenza X alla data Dx e un indirizzo di residenza Y alla data Dy, qualora risulti che alla data Dy ha l indirizzo X, il dato non è temporalmente corretto.

118 Dimensioni della qualità dei valori Attualità, definita come adeguatezza del valore del data item rispetto alle esigenze temporali del contesto di utilizzo. Se, ad esempio, l orario delle lezioni relativo ai corsi di un università è aggiornato "tardi" nella informativa destinata agli studenti, rispetto all inizio dei corsi, il dato ha un livello insufficiente di attualità. Completezza dei valori, definita come l estensione con cui i valori dei data item sono presenti nella base di dati. Un data item possiede un valore oppure è nullo; i valori nulli dovrebbero essere limitati, ed in ogni caso bisogna specificarne il significato. Consistenza Interna, relativa al grado di consistenza di valori di data item nell ambito della stessa entità. Ad esempio i valori dei data item CAP, Comune, Provincia, devono risultare consistenti nell ambito dell entità Persona. Consistenza Esterna, relativa al grado di consistenza di valori di data item nell ambito di entità diverse. Ad esempio, Mario Rossi è celibe in un entità relativa al suo stato matrimoniale, mentre Anna Rossi si dichiara moglie dello stesso Mario Rossi, in un entità di tipo diverso.

119 Cause di dati errati Le principali cause di dati errati possono essere così riassunte: Inserimento di informazioni errate nel data entry: errata grafia, uso delle maiuscole, abbreviazioni o diverso ordine d'inserimento dei nomi. La dispersione dei dati presso diversi soggetti, secondo logiche quasi sempre funzionali alle esigenze delle singole amministrazioni (ovvero la mancata identificazione della responsabilità del dato e del processo) La disomogeneità dell informazione (ovvero la mancanza di sistemi di codifica standardizzati a livello sia dell'azienda sia di settore). Database suddivisi in differenti dipartimenti e aziende in cui i dati in ogni struttura sono registrati con regole differenti per ogni database. Utilizzo di informazioni prese da vecchi database che contengono dati obsoleti e scarsamente documentati. L assenza di procedure ad hoc di gestione della qualità dei dati e/o di procedure di gestione dei dati autonome rispetto alle funzionalità offerte dai sistemi.

120 Metodologie di miglioramento Basate sui Dati correggere i Dati Confronto dei dati con la realtà che rappresentano costoso, a campione, molto preciso una tantum per orientare l intervento Confronto dei dati tra due o più archivi (applicazione di tecniche di record matching: record diversi che si riferiscono alla stessa identità del mondo reale) + Facilmente applicabile, costo medio Il matching non garantisce una correttezza massima Confronto dei dati con vincoli o business rules (su un campo, su più campi, considerazioni probabilistiche) + spesso efficace, poco costoso non garantisce per il futuro, riguarda solo la conformità alle regole, non la accuratezza, particolarmente adatti a dati permanenti

121 Metodologie di miglioramento Basate sui Processi individuare e correggere le cause di errore Identificare il processo Identificare il Process Owner e Data Stewards (Identificazione delle responsabilità) Descrivere il processo Stabilire un sistema di misura Definire un sistema di monitoraggio e controllo (dei dati e/ del processo) Identificare gli obiettivi di miglioramento Realizzare gli interventi di miglioramento

122 Il MINING Esperienze di text e data mining in CSI per gli enti della pubblica amministrazione regionale

123 Text mining Il Text Mining, anche conosciuto come Analisi Testuale Intelligente, Text Data Mining o Knowledge Discovery in Text (KDT), è un processo di analisi per estrarre nuova e valida conoscenza dai documenti di testo e per dedurre informazioni da grandi quantità di dati non strutturati, combinandoli con variabili quantitative, esattamente come il Data Mining fa con i dati strutturati.questa tecnica ha un potenziale decisamente interessante, se si pensa che una larga fetta delle informazioni con cui ci si confronta quotidianamente sono di tipo testuale e possono quindi rappresentare una fonte importante di approfondimento per quanto riguarda la conoscenza delle realtà che si vogliono analizzare.si parte da un insieme di documenti testuali e si affronta una prima fase di cleaning e riduzione dei dati, avente l obiettivo di decomporli e rappresentarli attraverso una struttura adatta alle analisi di data mining, tramite la rimozione dei termini di disturbo, l analisi morfologica dei termini e la creazione di tabelle di frequenza. Dopo questa prima fase di analisi linguistica, si passa all analisi statistica dei dati: i documenti vengono classificati in gruppi omogenei (cluster analysis) e può venir effettuata un analisi predittiva che, a partire da questi risultati, classifichi nuovi documenti.

124 Text mining Il Text Mining offre la possibilità di effettuare un filtraggio intelligente dei documenti non strutturati, dal momento che, al contrario di quanto avveniva con i primi strumenti di Data Retrieval, nel realizzare l analisi viene considerato anche il contesto: non si basa cioè sulla presenza di una parola singola bensì sulle relazioni che essa mantiene con le altre per dare un significato univoco all'enunciato. Obiettivi Lo scopo di un'analisi di text mining è approntare un sistema automatico che permetta di: leggere, interpretare, classificare ed integrare i dati provenienti da numerose fonti (Internet, intranet, banche dati, mail, forum, report, ), al fine di scoprire in maniera rapida ed efficace conoscenza utile anche su un numero molto grande di documenti; estrarre conoscenza dal testo: esso viene trasformato in tabelle facilmente interpretabili con sistemi quali-quantitativi; classificare automaticamente i documenti in maniera predittiva: i testi vengono assegnati a distinte aree tematiche sulla base dei parametri di classificazione trovati nelle analisi effettuate durante la prima fase di interpretazione dell'universo dei documenti.

125 Data mining Il Data mining è definito come: il processo di estrazione di conoscenza da banche dati di grandi dimensioni tramite l'applicazione di algoritmi che individuano le associazioni "nascoste" tra le informazioni e le rendono visibili. In altre parole, col nome Data mining si intende l'applicazione di una o più tecniche che consentono l'esplorazione di grandi quantità di dati, con l'obiettivo di individuare le informazioni più significative e di renderle disponibili e direttamente utilizzabili nell'ambito del decision making. L'estrazione di conoscenza (informazioni significative) avviene tramite individuazione delle associazioni ("patterns" oppure sequenze ripetute oppure regolarità) nascoste nei dati. In questo contesto un "pattern" indica una struttura, un modello, o, in generale, una rappresentazione sintetica dei dati. Il termine Data mining è utilizzato come sinonimo di knowledge discovery in databases (KDD), anche se sarebbe più preciso parlare di knowledge discovery quando ci si riferisce al processo di estrazione della conoscenza, e di Data mining come di una particolare fase del suddetto processo (la fase di applicazione di uno specifico algoritmo per l'individuazione dei "patterns").

126 Data mining I risultati a cui può giungere l'attività di Data mining sono molteplici: - associazioni - due eventi si verificano spesso insieme (ad esempio chi compra uno zaino scolastico tende ad acquistare anche dei quaderni); - sequenze - due eventi successivi sembrano legati da una relazione di causa-effetto (chi compra un mouse su Internet, tempo dopo acquista anche un tappetino); - classificazioni - il riconoscimento di un ordine in una serie di eventi, con la conseguente riorganizzazione dei dati in proprio possesso; - raggruppamenti - la ricerca e la presentazione di gruppi di fatti non precedentemente noti; - previsioni - lo studio della probabile evoluzione futura della propria attività in base alle risultanze dei dati raccolti.

127 Filone Data Mining analisi del rispetto delle linee guida nel trattamento dell ipertensione segmentazione delle scuole materne del Piemonte modello di previsione del successo della formazione professionale analisi di Web Mining di un sito regionale nell ambito del progetto Catalogo dei servizi decisionali

128 Analisi trattamento ipertensione Analisi modelli prescrittivi piemontesi trattamento farmacologico dell ipertensione Obiettivo: raggruppare i medici con profili simili nel trattamento farmacologico prescelto (monotrattamento, trattamenti combinati ) nel trattamento dell ipertensione. Verificare in quale modo le linee guida OMS per il trattamento dell ipertensione sono rispettate. Periodo di osservazione: Soggetti: Fonte: primo semestre 2002 Soggetti: Medici di base generici Fonte: Datawarehouse delle prescrizioni farmaceutiche regionale

129 Analisi trattamento ipertensione Flusso delle analisi realizzate con Entreprise Miner

130 Analisi trattamento ipertensione Risultati cluster analysis con Mappe di Kohonen

131 Analisi trattamento ipertensione Cluster 7 (300 medici) Comportamento: segue linee guida monosomministrazione per pazienti non a rischio, combinazioni esclusive per pazienti a rischio Profilo medio del medico: medico di "campagna" Cluster 3 (150 medici) Comportamento: non segue linee guida, in particolare usa associazioni non consigliate, poco monosomministrazione Profilo medio del medico: pochi anni attività 0-10, medico di "città" Tipo paziente: niente di particolare (età, numero pazienti ipertesi, ipertesi a rischio) Azione di informazione specifica

132 Filone Data Mining analisi del rispetto delle linee guide nel trattamento dell ipertensione segmentazione delle scuole materne del Piemonte modello di previsione del successo della formazione professionale analisi di Web Mining di un sito regionale nell ambito del progetto Catalogo dei servizi decisionali

133 Segmentazione delle scuole materne

134 Filone Data Mining analisi del rispetto delle linee guide nel trattamento dell ipertensione segmentazione delle scuole materne del Piemonte modello di previsione del successo della formazione professionale analisi di Web Mining di un sito regionale nell ambito del progetto Catalogo dei servizi decisionali

135 Follow-up occupazionale corsi FP Esempio di albero decisionale

136 Filone Data Mining analisi del rispetto delle linee guide nel trattamento dell ipertensione segmentazione delle scuole materne del Piemonte modello di previsione del successo della formazione professionale analisi di Web Mining di un sito regionale nell ambito del progetto Catalogo dei servizi decisionali

137 Le analisi statistiche degli accessi al Data Warehouse

Data Warehousing e Data Mining

Data Warehousing e Data Mining Università degli Studi di Firenze Dipartimento di Sistemi e Informatica A.A. 2011-2012 I primi passi Data Warehousing e Data Mining Parte 2 Docente: Alessandro Gori a.gori@unifi.it OLTP vs. OLAP OLTP vs.

Dettagli

La Business Intelligence per la PA piemontese

La Business Intelligence per la PA piemontese La Business Intelligence per la PA piemontese GIULIANA BONELLO CSI PIEMONTE 0 Agenda Premessa Le basi dati della PA piemontese Le applicazioni di carattere decisionale della PA piemontese La piattaforma

Dettagli

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence Introduzione Definizione di Business Intelligence: insieme di processi per raccogliere

Dettagli

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da

Dettagli

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011 Data warehousing Introduzione A partire dagli anni novanta è risultato chiaro che i database per i DSS e le analisi di business intelligence vanno separati da quelli operazionali. In questa lezione vedremo

Dettagli

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Obiettivi. Presentare l evoluzione dei sistemi informativi: da supporto alla operatività a supporto al momento decisionale Definire

Dettagli

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni Data warehouse Data warehouse La crescita dell importanza dell analisi dei dati ha portato ad una separazione architetturale dell ambiente transazionale (OLTP on-line transaction processing) da quello

Dettagli

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Data warehousing Introduzione A partire dalla metà degli anni novanta è risultato chiaro che i database per i DSS e le analisi di business intelligence vanno separati da quelli operazionali. In questa

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

Data Base. Prof. Filippo TROTTA

Data Base. Prof. Filippo TROTTA Data Base Definizione di DataBase Un Database può essere definito come un insieme di informazioni strettamente correlate, memorizzate su un supporto di memoria di massa, costituenti un tutt uno, che possono

Dettagli

Introduzione alla Business Intelligence

Introduzione alla Business Intelligence SOMMARIO 1. DEFINIZIONE DI BUSINESS INTELLIGENCE...3 2. FINALITA DELLA BUSINESS INTELLIGENCE...4 3. DESTINATARI DELLA BUSINESS INTELLIGENCE...5 4. GLOSSARIO...7 BIM 3.1 Introduzione alla Pag. 2/ 9 1.DEFINIZIONE

Dettagli

Relazione sul data warehouse e sul data mining

Relazione sul data warehouse e sul data mining Relazione sul data warehouse e sul data mining INTRODUZIONE Inquadrando il sistema informativo aziendale automatizzato come costituito dall insieme delle risorse messe a disposizione della tecnologia,

Dettagli

Progettaz. e sviluppo Data Base

Progettaz. e sviluppo Data Base Progettaz. e sviluppo Data Base! Introduzione ai Database! Tipologie di DB (gerarchici, reticolari, relazionali, oodb) Introduzione ai database Cos è un Database Cos e un Data Base Management System (DBMS)

Dettagli

TEORIA sulle BASI DI DATI

TEORIA sulle BASI DI DATI TEORIA sulle BASI DI DATI A cura del Prof. Enea Ferri Cos è un DATA BASE E un insieme di archivi legati tra loro da relazioni. Vengono memorizzati su memorie di massa come un unico insieme, e possono essere

Dettagli

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File system verso DBSM Vantaggi di un DBMS Modelli dei dati Utenti

Dettagli

Data Warehousing (DW)

Data Warehousing (DW) Data Warehousing (DW) Il Data Warehousing è un processo per estrarre e integrare dati storici da sistemi transazionali (OLTP) diversi e disomogenei, e da usare come supporto al sistema di decisione aziendale

Dettagli

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Dettagli

Introduzione ai sistemi di basi di dati

Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Alessandro.bardine@gmail.com alessandro.bardine@iet.unipi.it Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File

Dettagli

Database. Organizzazione di archivi mediante basi di dati. ing. Alfredo Cozzi 1

Database. Organizzazione di archivi mediante basi di dati. ing. Alfredo Cozzi 1 Database Organizzazione di archivi mediante basi di dati ing. Alfredo Cozzi 1 Il database è una collezione di dati logicamente correlati e condivisi, che ha lo scopo di soddisfare i fabbisogni informativi

Dettagli

Data Warehouse Architettura e Progettazione

Data Warehouse Architettura e Progettazione Introduzione Data Warehouse Architettura! Nei seguenti lucidi verrà fornita una panoramica del mondo dei Data Warehouse.! Verranno riportate diverse definizioni per identificare i molteplici aspetti che

Dettagli

Data warehouse Introduzione

Data warehouse Introduzione Database and data mining group, Data warehouse Introduzione INTRODUZIONE - 1 Pag. 1 Database and data mining group, Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi

Dettagli

PBI Passepartout Business Intelligence

PBI Passepartout Business Intelligence PBI Passepartout Business Intelligence TARGET DEL MODULO Il prodotto, disponibile come modulo aggiuntivo per il software gestionale Passepartout Mexal, è rivolto alle Medie imprese che vogliono ottenere,

Dettagli

Archivi e database. Lezione n. 7

Archivi e database. Lezione n. 7 Archivi e database Lezione n. 7 Dagli archivi ai database (1) I dati non sempre sono stati considerati dall informatica oggetto separato di studio e di analisi Nei primi tempi i dati erano parte integrante

Dettagli

Sistemi Informativi e Basi di Dati

Sistemi Informativi e Basi di Dati Sistemi Informativi e Basi di Dati Laurea Specialistica in Tecnologie di Analisi degli Impatti Ecotossicologici Docente: Francesco Geri Dipartimento di Scienze Ambientali G. Sarfatti Via P.A. Mattioli

Dettagli

Miriam Gotti m.gotti@cineca.it

Miriam Gotti m.gotti@cineca.it Cenni sul Dat a Warehouse Ravenna 5 Novembre 2007 Miriam Gotti m.gotti@cineca.it www. cineca.it Agenda Fondamenti di Data Warehouse Modello Multidimensionale Analisi OLAP Introduzione a Statportal www.cineca.it

Dettagli

DATA MINING E DATA WAREHOUSE

DATA MINING E DATA WAREHOUSE Reti e sistemi informativi DATA MINING E DATA WAREHOUSE Marco Gottardo FONTI Wikipedia Cineca Università di Udine, Dipartimento di fisica, il data mining scientifico thepcweb.com DATA MINING 1/2 Il Data

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

Sistemi informativi aziendali

Sistemi informativi aziendali Sistemi informativi aziendali Lezione 12 prof. Monica Palmirani Sistemi informativi e informatici Sistemi informativi = informazioni+processi+comunicazione+persone Sistemi informatici = informazioni+hardware+software

Dettagli

Introduzione al Data Warehousing

Introduzione al Data Warehousing Il problema - dati IPERVENDO Via Vai 111 P.I.11223344 Vendite II Trim. (Milioni!) Introduzione al Data Warehousing tecnologia abilitante per il data mining ACQUA MIN 0.40 LATTE INTERO 1.23 SPAZZ.DENTI

Dettagli

Architetture per l analisi di dati

Architetture per l analisi di dati Architetture per l analisi di dati Basi di dati: Architetture e linee di evoluzione - Seconda edizione Capitolo 8 Appunti dalle lezioni Motivazioni I sistemi informatici permettono di aumentare la produttività

Dettagli

Data Warehousing: concetti base e metodologie

Data Warehousing: concetti base e metodologie Data Warehousing: concetti base e metodologie Paolo Atzeni (con la collaborazione di Luca Cabibbo e Riccardo Torlone) Università di Roma Tre Dipartimento di Informatica e Automazione atzeni@dia.uniroma3.it

Dettagli

Basi di Dati Complementi Esercitazione su Data Warehouse

Basi di Dati Complementi Esercitazione su Data Warehouse Sommario Basi di Dati Complementi Esercitazione su Data Warehouse 1. Riassunto concetti principali dalle slide della lezione di teoria 2.Studio di caso : progettazione di un Data Warehouse di una catena

Dettagli

Introduzione ad OLAP (On-Line Analytical Processing)

Introduzione ad OLAP (On-Line Analytical Processing) Introduzione ad OLAP (On-Line Analytical Processing) Metodi e Modelli per il Supporto alle Decisioni 2002 Dipartimento di Informatica Sistemistica e Telematica (Dist) Il termine OLAP e l acronimo di On-Line

Dettagli

Introduzione. La misurazione dei sistemi di Data Warehouse. Definizioni & Modelli. Sommario. Data Warehousing. Introduzione. Luca Santillo (CFPS)

Introduzione. La misurazione dei sistemi di Data Warehouse. Definizioni & Modelli. Sommario. Data Warehousing. Introduzione. Luca Santillo (CFPS) Introduzione La misurazione dei sistemi di Data Warehouse Luca Santillo (CFPS) AIPA, 17/5/01 In pratica I concetti generali, le definizioni e le regole di conteggio possono essere difficili da applicare

Dettagli

Sistemi Informativi. Catena del valore di PORTER

Sistemi Informativi. Catena del valore di PORTER Sistemi Informativi Catena del valore di PORTER La catena del valore permette di considerare l'impresa come un sistema di attività generatrici del valore, inteso come il prezzo che il consumatore è disposto

Dettagli

Sistemi Informativi Aziendali II

Sistemi Informativi Aziendali II Modulo 2 Sistemi Informativi Aziendali II 1 Corso Sistemi Informativi Aziendali II - Modulo 2 Modulo 2 La gestione delle informazioni strutturate nell impresa: La progettazione di un Data Base; Le informazioni

Dettagli

Introduzione ai database I concetti fondamentali Database e DBMS Per comprendere appieno cos'è un Database e quali sono i vantaggi legati al suo impiego, soprattutto nel settore gestionale, è necessario

Dettagli

I livelli di progettazione possono essere così schematizzati: Esistono tre tipi diversi di modelli logici: Modello gerarchico: Esempio SPECIFICHE

I livelli di progettazione possono essere così schematizzati: Esistono tre tipi diversi di modelli logici: Modello gerarchico: Esempio SPECIFICHE I DATABASE o basi di dati possono essere definiti come una collezione di dati gestita dai DBMS. Tali basi di dati devono possedere determinati requisiti, definiti come specifiche, necessarie per il processo

Dettagli

E-Mail. Scheduling. Modalità d invio. E-Mail

E-Mail. Scheduling. Modalità d invio. E-Mail BI BI Terranova, azienda leader in Italia per le soluzioni Software rivolte al mercato delle Utilities, propone la soluzione Software di Business Intelligence RETIBI, sviluppata per offrire un maggiore

Dettagli

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Corso di Laurea Magistrale in Ingegneria per l Ambiente e il Territorio A.A. 2014-2015 Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Strutture di dati: DB e DBMS DATO E INFORMAZIONE Dato: insieme

Dettagli

Basi di dati. Basi di dati = database. Basi di dati

Basi di dati. Basi di dati = database. Basi di dati Basi di dati Da leggere: Cap. 6 Sawyer, Williams (testo A) Basi di dati = database Sono una delle applicazioni informatiche che hanno avuto il maggiore utilizzo in uffici, aziende, servizi -> oggi anche

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Sistemi informazionali La crescente diffusione dei

Dettagli

Laboratorio di Progettazione e Sviluppo di Sistemi Informatici

Laboratorio di Progettazione e Sviluppo di Sistemi Informatici 1 Laboratorio di Progettazione e Sviluppo di Sistemi Informatici 2 Laboratorio di Progettazione e Sviluppo di Sistemi Informatici Parte del corso intersettoriale "Laboratorio di Progettazione e Sviluppo

Dettagli

Le Basi di dati: generalità. Unità di Apprendimento A1 1

Le Basi di dati: generalità. Unità di Apprendimento A1 1 Le Basi di dati: generalità Unità di Apprendimento A1 1 1 Cosa è una base di dati In ogni modello di organizzazione della vita dell uomo vengono trattate informazioni Una volta individuate e raccolte devono

Dettagli

Lorenzo Braidi. Database design. Libro_datadesign.indb 1 23-11-2004 10:06:17

Lorenzo Braidi. Database design. Libro_datadesign.indb 1 23-11-2004 10:06:17 Lorenzo Braidi Database design Libro_datadesign.indb 1 23-11-2004 10:06:17 Sommario Introduzione...XI Capitolo 1 Le basi di dati relazionali... 1 Le basi di dati... 1 Un po di storia... 2 I database gerarchici...

Dettagli

Informatica (Basi di Dati)

Informatica (Basi di Dati) Corso di Laurea in Biotecnologie Informatica (Basi di Dati) Introduzione alle Basi di Dati Anno Accademico 2009/2010 Da: Atzeni, Ceri, Paraboschi, Torlone - Basi di Dati Lucidi del Corso di Basi di Dati

Dettagli

Lezione 3. Modello Multidimensionale dei Dati Metadati per il Data Warehousing Accesso ai Data Warehouses Implementazioni per il Data Warehousing

Lezione 3. Modello Multidimensionale dei Dati Metadati per il Data Warehousing Accesso ai Data Warehouses Implementazioni per il Data Warehousing Lezione 3 Modello Multidimensionale dei Dati Metadati per il Data Warehousing Accesso ai Data Warehouses Implementazioni per il Data Warehousing 27/02/2010 1 Modello multidimensionale Nasce dall esigenza

Dettagli

Corso di Laurea in Ingegneria Informatica Algoritmi e basi di dati Modulo Basi di dati a.a. 2010-2011

Corso di Laurea in Ingegneria Informatica Algoritmi e basi di dati Modulo Basi di dati a.a. 2010-2011 Corso di Laurea in Ingegneria Informatica Algoritmi e basi di dati Modulo Basi di dati a.a. 2010-2011 2011 Docente: Gigliola Vaglini Docente laboratorio: Alessandro Lori 1 Obiettivi del corso Imparare

Dettagli

Corso di Informatica (Basi di Dati)

Corso di Informatica (Basi di Dati) Corso di Informatica (Basi di Dati) Lezione 1 (12 dicembre 2008) Introduzione alle Basi di Dati Da: Atzeni, Ceri, Paraboschi, Torlone - Basi di Dati Lucidi del Corso di Basi di Dati 1, Prof. Carlo Batini,

Dettagli

BASI DI DATI. Queste slides sono un adattamento di quelle di Luca Anselma e Gian Luca Pozzato, cui va il mio ringraziamento

BASI DI DATI. Queste slides sono un adattamento di quelle di Luca Anselma e Gian Luca Pozzato, cui va il mio ringraziamento BASI DI DATI Queste slides sono un adattamento di quelle di Luca Anselma e Gian Luca Pozzato, cui va il mio ringraziamento BASI DI DATI (DATABASE, DB) Una delle applicazioni informatiche più utilizzate,

Dettagli

Data Mining e Analisi dei Dati

Data Mining e Analisi dei Dati e Analisi dei Dati Rosaria Lombardo Dipartimento di Economia, Seconda Università di Napoli La scienza che estrae utili informazioni da grandi databases è conosciuta come E una disciplina nuova che interseca

Dettagli

Introduzione al data warehousing

Introduzione al data warehousing Introduzione al data warehousing, Riccardo Torlone aprile 2012 1 Motivazioni I sistemi informatici permettono di aumentare la produttività delle organizzazioni automatizzandone la gestione quotidiana dei

Dettagli

Sistemi Informativi La Modellazione Dimensionale dei Fatti. Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi

Sistemi Informativi La Modellazione Dimensionale dei Fatti. Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi Sistemi Informativi La Modellazione Dimensionale dei Fatti Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi Obiettivi Nelle lezioni precedenti abbiamo modellato i processi

Dettagli

Progetto Turismo Pisa. Sommario dei risultati

Progetto Turismo Pisa. Sommario dei risultati 2012 Progetto Turismo Pisa Sommario dei risultati 0 Studio realizzato per il Comune di Pisa da KddLab ISTI-CNR Pisa Sommario 1 Progetto Turismo Pisa: Sintesi dei risultati... 1 1.1 L Osservatorio Turistico

Dettagli

Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2)

Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2) Tecnologie per i sistemi informativi Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2) Letizia Tanca lucidi tratti dal libro: Atzeni, Ceri, Paraboschi, Torlone Introduzione

Dettagli

Data Warehousing. Esercitazione 1

Data Warehousing. Esercitazione 1 Esercitazione 1 IBM DB2 UDB DB2 Universal Database Suite di strumenti per la gestione dei dati Funzioni avanzate per soluzioni business intelligence Dispone di strumenti di sviluppo del data warehouse

Dettagli

Sistemi Informativi. Basi di Dati. Progettazione concettuale. Architettura Progettazione Analisi funzionale

Sistemi Informativi. Basi di Dati. Progettazione concettuale. Architettura Progettazione Analisi funzionale 6LVWHPL,QIRUPDWLYL H DVLGL'DWL Oreste Signore (Oreste.Signore@cnuce.cnr.it) &RQWHQXWR Sistemi Informativi Basi di Dati Architettura Progettazione Analisi funzionale Progettazione concettuale Information

Dettagli

INTRODUZIONE ALLA TEORIA DEI DATABASE. Autore: ing. Mauro Pullin

INTRODUZIONE ALLA TEORIA DEI DATABASE. Autore: ing. Mauro Pullin INTRODUZIONE ALLA TEORIA DEI DATABASE Autore: ing. Mauro Pullin 2 INDICE 1 INTRODUZIONE...3 2 SCHEMA DEL PERCORSO...3 3 SVILUPPO DELLE LEZIONI...4 3.1 LEZIONE 1 LA MODELLAZIONE DEI DATI E LE ENTITÀ...4

Dettagli

Un progetto di Datawarehouse Politecnico di Milano 27 Maggio 2002

Un progetto di Datawarehouse Politecnico di Milano 27 Maggio 2002 Un progetto di Datawarehouse Politecnico di Milano 27 Maggio 2002 Indice Deloitte Consulting e il Cliente Obiettivi, approccio e risultati Il Datawarehouse Dimensioni di analisi Modello di calcolo Modello

Dettagli

Sistemi informativi aziendali

Sistemi informativi aziendali Sistemi informativi aziendali Lezione 12 prof. Monica Palmirani Sistemi informativi e informatici Sistemi informativi = informazioni+processi+comunicazione+persone Sistemi informatici = informazioni+hardware+software

Dettagli

Thematica Software Technologies

Thematica Software Technologies Sperimentazione di Servizi Innovativi alle Imprese Produttrici di Software Università della Calabria 21-10-2004 Giovanni Laboccetta Thematica s.r.l. www.thematica.it glaboccetta@thematica.it Perché i data

Dettagli

PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO 147 6/001.0

PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO 147 6/001.0 PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO 147 6/001.0 PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO ELEMENTI FONDAMENTALI PER LO SVILUPPO DI SISTEMI INFORMATIVI ELABORAZIONE DI

Dettagli

1. BASI DI DATI: GENERALITÀ

1. BASI DI DATI: GENERALITÀ 1. BASI DI DATI: GENERALITÀ BASE DI DATI (DATABASE, DB) Raccolta di informazioni o dati strutturati, correlati tra loro in modo da risultare fruibili in maniera ottimale. Una base di dati è usualmente

Dettagli

INFORMATICA. Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE.

INFORMATICA. Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE. INFORMATICA Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE. APPLICAZIONI WEB L architettura di riferimento è quella ampiamente diffusa ed

Dettagli

Governo Digitale a.a. 2011/12

Governo Digitale a.a. 2011/12 Governo Digitale a.a. 2011/12 I sistemi di supporto alle decisioni ed il Data Warehouse Emiliano Casalicchio Agenda Introduzione i sistemi di supporto alle decisioni Data warehouse proprietà architettura

Dettagli

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Roccatello Ing. Eduard L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Agenda Presentazione docente Definizione calendario Questionario pre corso

Dettagli

Corso di Informatica Generale 1 IN1. Linguaggio SQL

Corso di Informatica Generale 1 IN1. Linguaggio SQL Università Roma Tre Facoltà di Scienze M.F.N. di Laurea in Matematica di Informatica Generale 1 Linguaggio SQL Marco (liverani@mat.uniroma3.it) Sommario Prima parte: le basi dati relazionali Basi di dati:

Dettagli

Statistica: l uso delle banche dati del MIUR

Statistica: l uso delle banche dati del MIUR RI Glossario Statistica: l uso delle banche dati del MIUR Dove si trovano, come si estraggono e come si possono usare i dati scolastici rilevati annualmente dal MIUR DI ANNA MASSA L a statistica, strumento

Dettagli

CAPITOLO 9 Piattaforme di Business Intelligence e DSS

CAPITOLO 9 Piattaforme di Business Intelligence e DSS CAPITOLO 9 Piattaforme di Business Intelligence e DSS Lucidi di Gianmario Motta 2010 OBIETTIVI DI APPRENDIMENTO Identificare quali sono le applicazioni d uso dei sistemi di BI Spiegare quali sono le caratteristiche

Dettagli

Database. Si ringrazia Marco Bertini per le slides

Database. Si ringrazia Marco Bertini per le slides Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida

Dettagli

Organizzazione degli archivi

Organizzazione degli archivi COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i

Dettagli

Considera tutti i requisiti funzionali (use cases) NON deve necessariamente modellare i requisiti non funzionali

Considera tutti i requisiti funzionali (use cases) NON deve necessariamente modellare i requisiti non funzionali Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Progettazione OO E. TINELLI Punto di Partenza Il modello di analisi E una rappresentazione minima del

Dettagli

Rassegna sui principi e sui sistemi di Data Warehousing

Rassegna sui principi e sui sistemi di Data Warehousing Università degli studi di Bologna FACOLTA DI SCIENZE MATEMATICHE, FISICHE E NATURALI Rassegna sui principi e sui sistemi di Data Warehousing Tesi di laurea di: Emanuela Scionti Relatore: Chiar.mo Prof.Montesi

Dettagli

L E I N F O R M A Z I O N I P E R F A R E

L E I N F O R M A Z I O N I P E R F A R E L E I N F O R M A Z I O N I P E R F A R E C E N T R O Con InfoBusiness avrai Vuoi DATI CERTI per prendere giuste DECISIONI? Cerchi CONFERME per le tue INTUIZIONI? Vuoi RISPOSTE IMMEDIATE? SPRECHI TEMPO

Dettagli

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse Introduzione data warehose Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa Data Warehouse Che cosa e un data warehouse? Quali sono i modelli dei dati per data warehouse Come si progetta

Dettagli

DBMS (Data Base Management System)

DBMS (Data Base Management System) Cos'è un Database I database o banche dati o base dati sono collezioni di dati, tra loro correlati, utilizzati per rappresentare una porzione del mondo reale. Sono strutturati in modo tale da consentire

Dettagli

Corso di Informatica

Corso di Informatica Corso di Informatica Modulo T2 B1 - Progettazione dei DB 1 Prerequisiti Ciclo di vita del software file system Metodologia di progettazione razionale del software 2 1 Introduzione Per la realizzazione

Dettagli

Database e Microsoft Access. Ing. Antonio Guadagno

Database e Microsoft Access. Ing. Antonio Guadagno Database e Microsoft Access Ing. Antonio Guadagno Database e Microsoft Access Un Database non è altro che un insieme di contenitori e di strumenti informatici che ci permette di gestire grossi quantitativi

Dettagli

Introduzione alle Basi di Dati

Introduzione alle Basi di Dati 1 Introduzione alle Basi di Dati Massimo Paolucci (paolucci@dist.unige.it) DIST Università di Genova Sistema Azienda 2 Sistema organizzativo è costituito da una serie di risorse e di regole necessarie

Dettagli

Dynamic Warehousing: la tecnologia a supporto della Business Intelligence 2.0. Giulia Caliari Software IT Architect

Dynamic Warehousing: la tecnologia a supporto della Business Intelligence 2.0. Giulia Caliari Software IT Architect Dynamic Warehousing: la tecnologia a supporto della Business Intelligence 2.0 Giulia Caliari Software IT Architect Business Intelligence: la nuova generazione Infrastruttura Flessibilità e rapidità di

Dettagli

PRESENTAZIONE SERVIZI P.M.I.

PRESENTAZIONE SERVIZI P.M.I. PRESENTAZIONE SERVIZI P.M.I. Profilo La Società Hermes nasce nel 2010 per portare sul mercato le esperienze maturate da un team di specialisti e ricercatori informatici che hanno operato per anni come

Dettagli

Risorsa N 002994 DATI ANAGRAFICI: FORMAZIONE E CORSI: ISTRUZIONE E CERTIFICAZIONI: LINGUE STRANIERE: COMPETENZE INFORMATICHE:

Risorsa N 002994 DATI ANAGRAFICI: FORMAZIONE E CORSI: ISTRUZIONE E CERTIFICAZIONI: LINGUE STRANIERE: COMPETENZE INFORMATICHE: Risorsa N 002994 DATI ANAGRAFICI: Nato il : 1971 Residente a : Pavia FORMAZIONE E CORSI: Nel 02/2013: Corso di Oracle Business Intelligence Enterprise Edition (OBIEE) 11.1.3 Nel 04/2007: Corso di Analisi

Dettagli

I Sistemi Informativi

I Sistemi Informativi I Sistemi Informativi Definizione Un Sistema Informativo è un mezzo per acquisire, organizzare, correlare, elaborare e distribuire le informazioni che riguardano una realtà che si desidera descrivere e

Dettagli

Sistemi Informativi Aziendali I

Sistemi Informativi Aziendali I Modulo 6 Sistemi Informativi Aziendali I 1 Corso Sistemi Informativi Aziendali I - Modulo 6 Modulo 6 Integrare verso l alto e supportare Managers e Dirigenti nell Impresa: Decisioni più informate; Decisioni

Dettagli

Organizzazione delle informazioni: Database

Organizzazione delle informazioni: Database Organizzazione delle informazioni: Database Laboratorio Informatico di base A.A. 2013/2014 Dipartimento di Scienze Aziendali e Giuridiche Università della Calabria Dott. Pierluigi Muoio (pierluigi.muoio@unical.it)

Dettagli

Introduzione al data base

Introduzione al data base Introduzione al data base L Informatica è quella disciplina che si occupa del trattamento automatico dei dati con l ausilio del computer. Trattare i dati significa: raccoglierli, elaborarli e conservarli

Dettagli

SOMMARIO. 9- Basi di dati direzionali. Tipi di sistemi direzionali SISTEMI INFORMATIVI DIREZIONALI. Basi di Dati per la gestione dell Informazione

SOMMARIO. 9- Basi di dati direzionali. Tipi di sistemi direzionali SISTEMI INFORMATIVI DIREZIONALI. Basi di Dati per la gestione dell Informazione 1 SOMMARIO 2 9- Basi di dati direzionali Basi di Dati per la gestione dell Informazione A. Chianese, V. Moscato, A. Picariello, L. Sansone Sistemi Informativi Direzionali (SID) Architettura dei SID La

Dettagli

Database. Informatica 2014-2015 - Dott. Muzzioli Valerio. 1 di 1. Argomenti trattati: Nozioni di base: i database, i modelli di dati, DBMS

Database. Informatica 2014-2015 - Dott. Muzzioli Valerio. 1 di 1. Argomenti trattati: Nozioni di base: i database, i modelli di dati, DBMS Database Argomenti trattati: Nozioni di base: i database, i modelli di dati, DBMS Database relazionali: tabelle, campi, record; indici di taballa Chiavi primarie ed esterne Relazioni tra tabelle: definizione

Dettagli

MASTER UNIVERSITARIO

MASTER UNIVERSITARIO MASTER UNIVERSITARIO Analisi Dati per la Business Intelligence In collaborazione con II edizione 2013/2014 Dipartimento di Culture, Politica e Società Dipartimento di Informatica gestito da aggiornato

Dettagli

PIANO DI LAVORO (a.s. 2014/2015) Prof.ssa Andrea Luppichini Prof. Marco Fiorentini DISCIPLINA Informatica

PIANO DI LAVORO (a.s. 2014/2015) Prof.ssa Andrea Luppichini Prof. Marco Fiorentini DISCIPLINA Informatica lllo Istituto Tecnico Commerciale Statale e per Geometri E. Fermi Pontedera (Pi) Via Firenze, 51 - Tel. 0587/213400 - Fax 0587/52742 http://www.itcgfermi.it E-mail: mail@itcgfermi.it PIANO DI LAVORO (a.s.

Dettagli

Sistema di Gestione di Basi di Dati DataBase Management System DBMS

Sistema di Gestione di Basi di Dati DataBase Management System DBMS Base di dati (accezione generica) collezione di dati, utilizzati per rappresentare le informazioni di interesse per una o più applicazioni di una organizzazione (accezione specifica) collezione di dati

Dettagli

La qualità delle informazioni:

La qualità delle informazioni: misurazione e controllo in Enterprise Data Warehouse FABIO BALDUZZI ICTEAM Torino / Direttore Tecnico 0 Dati strutturati INFORMAZIONI DMS Dati non strutturati DATI Contesto Esperienza Enterprise Knowledge

Dettagli

DEFINIZIONI FONDAMENTALI

DEFINIZIONI FONDAMENTALI Consorzio per la formazione e la ricerca in Ingegneria dell'informazione DEFINIZIONI FONDAMENTALI Per vincere ci vuole una buona partenza... Docente: Cesare Colombo CEFRIEL colombo@cefriel.it http://www.cefriel.it

Dettagli

Introduzione a data warehousing e OLAP

Introduzione a data warehousing e OLAP Corso di informatica Introduzione a data warehousing e OLAP La Value chain Information X vive in Z S ha Y anni X ed S hanno traslocato Data W ha del denaro in Z Stile di vita Punto di vendita Dati demografici

Dettagli

Facoltà di Farmacia - Corso di Informatica

Facoltà di Farmacia - Corso di Informatica Basi di dati Riferimenti: Curtin cap. 8 Versione: 13/03/2007 1 Basi di dati (Database, DB) Una delle applicazioni informatiche più utilizzate, ma meno conosciute dai non informatici Avete già interagito

Dettagli

SISTEMA INFORMATIVO DIREZIONE E CONTROLLO

SISTEMA INFORMATIVO DIREZIONE E CONTROLLO LA SUITE JSIDIC La soluzione proposta, identificata da JSIDIC SISTEMA INFORMATIVO DIREZIONE E CONTROLLO, si presenta come un sistema capace di misurare le performance aziendali, con una soluzione unica

Dettagli

INTRODUZIONE. Data Base Management Systems evoluzione tecniche gestione dati

INTRODUZIONE. Data Base Management Systems evoluzione tecniche gestione dati INTRODUZIONE Accesso ai dati tramite DBMS Livelli di astrazione Modello dei dati: schema / istanza / metadati Alcuni modelli dei dati Linguaggi per DBMS Architettura di base di un DBMS cesarini - BDSI

Dettagli

70555 Informatica 3 70777 Sicurezza 2. 70555 Mario Rossi 70777 Anna Bianchi. Esempio istanza:

70555 Informatica 3 70777 Sicurezza 2. 70555 Mario Rossi 70777 Anna Bianchi. Esempio istanza: DOMANDE 1) Definire i concetti di schema e istanza di una base di dati, fornendo anche un esempio. Si definisce schema di una base di dati, quella parte della base di dati stessa che resta sostanzialmente

Dettagli

Agenda. I sistemi a supporto delle decisioni Information Directory Sviluppi futuri. Cinque anni di Data Warehouse:dai dati alle decisioni 1

Agenda. I sistemi a supporto delle decisioni Information Directory Sviluppi futuri. Cinque anni di Data Warehouse:dai dati alle decisioni 1 Cinque anni di Data Warehouse: dai dati alle decisioni Mario ANCILLI SETTORE SISTEMI INFORMATIVI ED INFORMATICA DIREZIONE ORGANIZZAZIONE; PIANIFICAZIONE, SVILUPPO E GESTIONE DELLE RISORSE UMANE Torino,

Dettagli

Corso di Informatica

Corso di Informatica Corso di Informatica Modulo T2 A2 Introduzione ai database 1 Prerequisiti Concetto di sistema File system Archivi File e record 2 1 Introduzione Nella gestione di una attività, ad esempio un azienda, la

Dettagli