Trattamento dati nelle imprese

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Trattamento dati nelle imprese"

Transcript

1 Università degli studi di Torino Corso di laurea in Fisica maggio 2006 Trattamento dati nelle imprese Riccardo Grosso

2 Programma del corso I) cenni storici, tipologie di basi dati, cenni di progettazione basi dati, riuso dati, data quality, data mining, esempi di realizzazione sistemi decisionali II) progettazione basi dati operazionali (approfondimento) e cenni di reverse engineering III) progettazione basi dati decisionali (approfondimento) IV) repository di metadati e schemi concettuali V) applicazione del modeling concettuale al web (cenni di web semantico ed ontologie) VI) DOMANDE DI VERIFICA

3 Cenni storici L'esigenza dell'archiviazione è cresciuta di pari passo con l'evoluzione della civiltà. L'archiviazione in senso lato può essere intesa, prima di tutto, come un'organizzazione della memoria, di un singolo individuo così come di un organismo, di un Ente, di uno Stato, di un popolo. Fin dall'ottavo secolo avanti Cristo gli Assiri e i Babilonesi avevano creato ed organizzato dei veri e propri archivi. Questa ipotesi è stata formulata sulla base dei resti giunti fino a noi di documenti costituiti da simboli cuneiformi incisi su cilindri e tavolette d'argilla.

4 Cenni storici Nell'antichità ci sono stati anche numerosi esempi di forme alternative di archiviazione, come l'archiviazione orale. In tale contesto si inserisce anche la figura dello mnemon, che, nell'antica Grecia era un impiegato pubblico, il quale, sotto il vincolo di un giuramento di riservatezza (a tutela della privacy come si direbbe oggi) aveva il compito di memorizzare informazioni utili alla gestione dello Stato, tra cui sentenze emesse dai giudici, contratti stipulati tra i privati e informazioni sullo stato patrimoniale dei singoli cittadini.

5 Cenni storici Tali paleo-archivi servono a testimoniare che nell'uomo è sempre stata molto sentita la necessità di organizzare in modo "ufficiale" i documenti. Tale organizzazione, da un punto di vista storico, è una fonte insostituibile di informazioni sulla civiltà che ha creato e custodito tali documenti. Uno dei concetti che emerge prepotentemente da questa valutazione è che l'esigenza di creare un archivio nasce dalla necessità di conservare ed organizzare i dati e i documenti. Quindi il concetto di archivio è strettamente correlato ai concetti di dato, documento, organizzazione e conservazione.

6 Cenni storici Passando dal concetto di archiviazione orale o scritta a quello di archiviazione magnetica, il problema è che le informazioni non possono essere conservate nella memoria centrale del computer (RAM) in quanto allo spegnimento vanno perdute. Fino agli anni 60 le tecnologie utilizzate per memorizzare stabilmente i dati consistevano in nastri perforati e schede perforate di carta (per i dati che non subivano modifiche frequenti). I dati soggetti a frequenti variazioni come i dati di gestione aziendale venivano messi su nastri magnetici. Meno frequenti e più costosi erano i tamburi magnetici: grossi cilindri di metallo in rapida rotazione sulla cui superficie era depositata una vernice magnetica su cui si spostava una testina di scrittura e lettura.

7 Cenni storici Ormai da 20 anni la tecnologia utilizzata per la archiviazione di informazioni modificabili è il disco magnetico. La fortuna del disco non accenna a diminuire. Anzi sembra aumentare continuamente di capacità, attraverso una diminuzione delle dimensioni della testina, e di velocità di accesso, attraverso una maggiore velocità di rotazione. Il costo dei dischi magnetici è passato nel giro di 10 anni da lire al megabyte nel 1987 alle 500 lire del 1996.

8 Cenni storici Questa tendenza sembra essere duratura anche se la tecnologia magnetica rimane sempre più costosa di quella ottica (che nel caso dei CD scrivibili (CDR) è di circa 1 centesimo al megabyte). La memoria disco costa molto di meno della memoria RAM che ha un costo intorno alle 5 euro a megabyte, ma ha una velocità di accesso dell ordine dei 10 millisecondi contro i 70 nanosecondi della RAM. Questo ultimo aspetto condiziona tutto il funzionamento del calcolatore. In una grande azienda possono esserci infatti Terabyte (migliaia di Gigabyte) di memoria disco.

9 Cenni storici Il disco viene utilizzato per conservare gli archivi di una azienda cioè i dati sulla amministrazione, sulle vendite e sui processi produttivi. Rendere veloci gli accessi a questi dati è più importante della velocità di calcolo necessaria per trattarli. Nei mainframe il problema veniva risolto parzialmente dotando le unità disco (controller del disco) di grande memoria e intelligenza di gestione. In pratica veniva messa una notevole quantità di memoria RAM su ogni controller in modo che tutti i dati più frequentemente letti venissero inseriti nella memoria RAM senza la necessità di caricarli continuamente dal disco.

10 Cenni storici Anche i moderni sistemi operativi utilizzano questa tecnica, in altre parole i dati del disco vengono bufferizzati in memoria RAM. Un buffer è una zona di memoria usata come deposito e come tampone tra i processi che richiedono i dati ed il disco. Il disco viene comunque visto dal sistema operativo come un insieme di tracce e settori. Alcuni file vengono gestiti in modo particolare sia per le ricerche di dati che per la loro scrittura. Questi file sono detti normalmente archivi. Le aggregazioni di archivi tra di loro correlati sono definite normalmente data base.

11 Cenni storici Tipologie di basi di dati Con un certo grado di approssimazione possiamo dire che esistono due modi di suddividere e gestire i dati: gestori di file e Data Base relazionali. Gestori di file: ogni base di dati è rappresentata da un file, che si divide in record: il record rappresenta uno degli elementi che si desidera registrare, ed è composto a sua volta da campi, cioè dati elementari che caratterizzano ogni entità da classificare. Con un gestore di file, ogni dato si immagazzina in un unico file e le operazioni sui dati interessano un solo record per volta. Data Base relazionali: si presentano in forma tabellare in cui le righe rappresentano i record e le colonne rappresentano i campi. Le operazioni realizzate con questo tipo di Data Base riguardano le tabelle e non i record individuali, come nel caso dei gestori di file.

12 Cenni storici Prima della comparsa dei database relazionali esistevano altre tipologie di database, come i gerarchici ed i reticolari. Questi richiedevano una conoscenza approfondita dei dettagli fisici concernenti la memorizzazione dei dati su disco e anche le operazioni concettualmente più semplici (come leggere i dati di una tabella) richiedevano un grosso lavoro. Oggi sono scomparsi perché il modello relazionale presenta degli enormi vantaggi.

13 Cenni storici Oggi i principali Data Base sono di tipo relazionale, ciò perché praticamente tutti gli insiemi di dati che corrispondono a entità complesse organizzate come imprese, scuole, associazioni varie, implicano collegamenti tra i vari dati ad esempio: ai fornitori sono collegate le merci, agli alunni i corsi, e così via. La norma fondamentale per stabilire relazioni tra tabelle, cioè tra contenitori di dati correlabili, è che il campo di collegamento non deve avere ripetizioni, ossia ogni record deve potere essere identificato in maniera univoca. chiave Il campo che permette l'identificazione di ogni record è detto "chiave primaria" e deve essere comune alle tabelle che si intende correlare. primaria

14 Cenni storici Classificazione delle basi dati Alfanumeriche Operazionali Gerarchiche Reticolari Relazionali Decisionali Relazionali Multidimensionali Documentali Geografiche

15 Progettazione Basi Dati operazionali Modellare i dati Perché modellare i dati: Per comprendere la loro logica e le loro dipendenze Con quale metodo o strumento: Con il modello entità-relazioni o entity-relationship arricchito con le generalizzazioni

16 Progettazione Basi Dati operazionali Perché modellare? Il valore portato dall informatica e potenzialmente utilizzabile da un organizzazione è direttamente correlabile con la ricchezza e la coerenza del suo patrimonio di dati. Tale patrimonio è costituito sia dai fattori interni che servono per produrre il prodotto/servizio, sia dai fattori esterni che interagiscono con l organizzazione nella sua attività quotidiana.

17 Progettazione Basi Dati operazionali Perché modellare? Questi fattori possono essere individuati come entità e qualificati attraverso delle proprietà: ciò costituisce la base informativa che identifica l organizzazione sul mercato. La base informativa quindi rappresenta un immagine del mondo che l organizzazione si crea per poter interagire in modo coordinato tra i vari settori operativi e in accordo con le sue strategie e le sue procedure.

18 Progettazione Basi Dati operazionali Perché modellare? Questa immagine che schematizza la realtà, per poter essere efficace deve rispecchiare la pluralità dei rapporti che l organizzazione intrattiene con ciascuna entità. Tale pluralità rappresenta i differenti punti di vista con cui le varie parti dell organizzazione considerano l entità stessa. I diversi punti di vista devono poi confluire come sottoinsiemi logici in una descrizione generale valida per l organizzazione nel suo complesso.

19 Progettazione Basi Dati operazionali Perché modellare? Matricola cliente Dati anagrafici Indirizzo Posizione debitoria fido Fatturato alla data Valore Ordinato Alla data Dettaglio ordini Entità cliente Settore vendite Settore amministrazione Settore marketing Settore produzione

20 Progettazione Basi Dati operazionali Perché modellare? Un livello ulteriore di rappresentazione riguarda il modo in cui le entità vengono rappresentate in termini informatici. Nel mondo dell informatica a ciascuna entità corrisponde un record (elemento di registrazione sulla memoria di massa). Tale record viene qualificato dai suoi attributi tra cui quello di identificazione (chiave). I record facenti parte di una categoria, in quanto attinenti allo stesso tipo di entità, costituiscono nel mondo informatico un archivio o file.

21 Progettazione Basi Dati operazionali Perchè modellare? In queste schematizzazioni esiste una certa ambiguità logica tra entità ed attributo. La distinzione intuitiva non è rigorosa e può cambiare cambiando la prospettiva. Se si volesse dare particolare enfasi al settore produzione il prodotto (articolo) diventerebbe un entità ed il cliente un attributo

22 Progettazione Basi Dati operazionali Perchè modellare? La scelta tra le varie modalità di rappresentazione incide sull efficienza con cui i dati saranno poi reperiti e deve quindi essere coerente con le strategie operative. L insieme dei dati raccolti non deve contenere al suo interno elementi contraddittori e deve dare una descrizione completa dei vari aspetti del fenomeno che interessa l azienda.

23 Progettazione Basi Dati operazionali Perché modellare? L insieme logico degli archivi o flussi di un organizzazione, unitamente alle tecniche per collegarli tra loro per elaborarli e reperire le informazioni, è la Base di Dati. La Base di Dati è una componente essenziale della struttura di un sistema informatico. Il modo in cui i dati vengono archiviati e gestiti condiziona le regole secondo cui l organizzazione interagisce con gli interlocutori interni ed esterni.

24 Progettazione Basi Dati operazionali Il modello dei dati Esaminiamo i passi che portano dalla teoria alla realizzazione di un Database. I modelli sono strumenti per rappresentare la realtà. La rappresentazione generata secondo le regole del modello viene chiamata schema. Il processo di rappresentazione di un database si articola in tre fasi ciascuna delle quali si riferisce a un diverso livello di astrazione.

25 Progettazione Basi Dati operazionali Il modello dei dati La scomposizione in fasi del processo di progettazione ha lo scopo di scomporre i problemi e garantire la possibilità di modifica delle soluzioni adottate. Queste fasi sono: Schema concettuale (o modello concettuale) Progettazione Schema logico (o modello Logico) Realizzazione Schema Fisico (o modello Fisico) Implementazione

26 Progettazione Basi Dati operazionali Il modello concettuale Il livello concettuale rappresenta la realtà dei dati e le relazioni tra essi attraverso uno schema. Il livello concettuale è la rappresentazione completa ed efficace del contesto, cioè della realtà a cui si riferisce. Essa è la rappresentazione più vicina alla logica umana. I modelli dei dati usati nella progettazione concettuale vengono definiti modelli semantici. Quello più diffuso è l ENTITY-RELATIONSHIP che prevede la individuazione delle Entità, cioè degli oggetti concreti o astratti, a la loro classificazione in insiemi omogenei.

27 Progettazione Basi Dati operazionali Il modello concettuale Le dipendenze tra i dati vengono rappresentati medianti relazioni tra le corrispondenti entità. Esempi di entità sono: una persona, un modello di automobile, un movimento contabile, una prova sostenuta da uno studente. Gli studenti sono classificabili nel tipo entità Studente, i diversi modelli di automobile sono classificabili nel tipo entità Automobile.

28 Progettazione Basi Dati operazionali Il modello concettuale Ciascun studente rappresenta un istanza del tipo entità Studente. L associazione (in inglese relationship quindi relazione) è un legame che stabilisce un interazione tra le entità. Per esempio tra l entità Persona e l entità Automobile esiste un associazione che può essere descritta nel linguaggio naturale secondo due direzioni: una persona possiede una o più automobili e un automobile è posseduta da una persona. Le proprietà delle entità e delle associazioni vengono descritte attraverso gli attributi.

29 Progettazione Basi Dati operazionali Le caratteristiche di ciascun entità vengono descritte tramite gli attributi. Attributi dell insieme di entità articolo possono essere Art_Cod,Art_descr,Art_Prezzo,Art_Iva. Il modello concettuale Ogni attributo è caratterizzato da un nome e dall insieme di valori che esso può assumere. Art_Cod Art_Descr Art_Prezzo Art_Iva

30 Progettazione Basi Dati operazionali Il modello concettuale Le caratteristiche di ogni attributo sono: Formato: Tipo di valori che assume (carattere, numerico, data/ora) Dimensione: Indica la quantità massima di caratteri o cifre inseribili Opzionalità: Indica la possibilità di non essere sempre valorizzato: l attributo è obbligatorio se il suo valore non deve essere nullo, facoltativo se sono accettati valori nulli

31 Progettazione Basi Dati operazionali Il modello concettuale I diversi valori assunti dagli attributi determinano le diverse istanze dell entità. L insieme dei possibili valori assunti da un attributo si chiama Dominio dell attributo. Si indica con il concetto di chiave (chiave primaria o primary key) l insieme di uno o più attributi che consentono di distinguere un istanza dall altra: esempi di chiavi sono il Codice di un Prodotto o la Matricola di un dipendente

32 Progettazione Basi Dati operazionali Entità Il modello concettuale Studente Facoltà Relazione Scelta da Studente Facoltà Iscritto a

33 Progettazione Basi Dati operazionali Attributi Il modello concettuale Studente Matricola Chiave Nome Indirizzo Studente Matricola Nome Indirizzo

34 Progettazione Basi Dati operazionali Il modello logico La fase logica del processo di progettazione di un DB ha lo scopo di tradurre lo schema concettuale in modello logico dei dati. Lo schema logico (a differenza del concettuale) dipende dal tipo di DBMS utilizzato e in particolare dal modello logico dei dati. Il Modello logico dei dati rappresenta come sono organizzati i dati negli archivi elettronici: descrive quindi la composizione ed il formato dei dati nel loro aspetto di struttura logica di dati. Il livello logico viene derivato dal livello concettuale Il Modello logico dei dati è quindi la tecnica di organizzazione e accesso ai dati utilizzata da specifiche categorie di DBMS

35 Progettazione Basi Dati operazionali Il modello fisico Il Modello fisico rappresenta l'effettiva installazione degli archivi elettronici: esso indica l'ubicazione dei dati nelle memorie di massa (dischi). Il livello fisico è quindi l'implementazione del livello logico sui supporti per la registrazione fisica dei dati: partizioni, puntatori, blocchi fisici, cluster, indici. Il Modello fisico stabilisce come le strutture definite a livello logico debbano essere organizzate negli archivi e nelle strutture del filesystem; esso dipende quindi dal tipo di DBMS, dal sistema operativo e dalla piattaforma hardware utilizzata del sistema che ospita il DBMS.

36 UOMO Progettazione Basi Dati operazionali Il Bignami dell entity relationship s pos a s i s pos a con DONNA e' generato genera da F IGLIO guida e' guidata da AUT OMOBILE

37 Progettazione Basi Dati operazionali Il Bignami dell entity relationship UOMO.sposa.DONNA» Ovvero SOGGETTO.predicato-verbale.COMPLEMENTO-OGGETTO» Ovvero ENTITA.relazione.ENTITA

38 Progettazione Basi Dati operazionali

39 Progettazione Basi Dati operazionali Basi Dati Relazionali Definizione di una Primary Key Una primary key (PK) non consente duplicazioni di valori e non può essere NULL. Ciascuna riga è univocamente identificata da una colonna o da un set di colonne (primary key composta). Una chiave candidata può servire anche da PK. Tabella S_ITEM ORD_ID ITEM_ID PRODUCT_ID PRICE QUANTITY QUANTITY_SHIPPED Primary Key Composta

40 Progettazione Basi Dati operazionali Basi Dati Relazionali Definizione di una Foreign Key Una foreign key (FK) è una colonna o una combinazione di colonne in una tabella che fa riferimento a una PK o una UK di una stessa tabella o di un altra tabella. Le FK sono basate sui valori dei dati e sono puramente logiche. Il valore deve corrispondere al valore della colonna collegata o essere NULL. Se una FK è parte di una PK non può essere NULL.

41 Progettazione Basi Dati operazionali Il Bignami dell entity relationship

42 Progettazione Basi Dati operazionali Il Bignami dell entity relationship Le generalizzazioni PERSONA generalizza»uomo»donna

43 Progettazione Basi Dati operazionali Il Bignami dell entity relationship PERSONA UOMO DONNA

44 Progettazione Basi Dati operazionali DBMS I dati prima di far parte del DB devono passare attraverso uno strumento che li gestisca. Il DBMS (DataBase Management System) è il componente del software di base che ti consente di gestire uno o più database.

45 Progettazione Basi Dati operazionali I primi DBMS, realizzati per grandi calcolatori, risalgono alla fine degli anni 60: erano i vecchi FILE SYSTEM. L accesso ai dati era diretto e presentavano vari svantaggi: DBMS Non vi era il controllo e la gestione degli archivi di dati Ci si doveva preoccupare che venissero rispettati i requisiti di ridondanza minima Ci si doveva preoccupare se i dati erano utilizzati contemporaneamente da più utenti Ci si doveva preoccupare se i dati erano utilizzati da più applicazioni Esistevano problemi di permanenza dei dati

46 Progettazione Basi Dati operazionali DBMS Le applicazioni rivolgono le richieste di accesso alla base di dati al DBMS, il quale gestisce i dati svincolando le applicazioni da tale onere. Si ottiene cosi un triplice scopo cioè: Le funzionalità di gestione della base dati sono raggruppate in un unico insieme Le applicazioni sono più leggere e veloci da realizzare Nessuna applicazione potrà cosi effettuare operazioni scorrette sul Database

47 Progettazione Basi Dati operazionali L utilizzo del DBMS comporta una serie di vantaggi che si traducono in una gestione dei dati più affidabile e coerente. DBMS Le caratteristiche vantaggiose del DBMS e contemporaneamente del DB stesso sono: Indipendenza delle applicazioni dalla struttura fisica dei dati Indipendenza dalla struttura logica dei dati Utilizzo da parte di più utenti con applicazioni diverse Eliminazione della ridondanza Eliminazione della inconsistenza Facilità di accesso Integrità dei dati Sicurezza dei dati

48 Progettazione Basi Dati operazionali DBMS In particolare ne deriva: Indipendenza dei dati dall applicazione Riservatezza nell accesso ai dati Gestione dell integrità fisica dei dati Gestione dell integrità logica dei dati Sicurezza e ottimizzazione nell uso dei dati

49 Progettazione Basi Dati operazionali DBMS Indipendenza dei dati dall applicazione In un ambiente FILE SYSTEM i dati avevano senso e valore solo se interpretati dai programmi. La struttura dei dati dipendeva dall applicazione, l applicazione doveva conoscere il formato fisico dei dati, la loro localizzazione, chiavi ecc. Con il DBMS invece i dati hanno una struttura che PRESCINDE dall applicazione che tra l altro non deve piu fare riferimento alla struttura fisica dei dati. Ciò comporta molti vantaggi nella manutenzione del sistema informativo dato che le modifiche alla struttura fisica dei dati non comportano modifiche alle applicazioni.

50 Progettazione Basi Dati operazionali DBMS Riservatezza nell accesso ai dati In un ambiente FILE SYSTEM il sistema di gestione dati non consentiva VISIONI LOGICHE diverse dello STESSO INSIEME DI DATI, ciò comportava l impossibilità di rendere disponibile a determinate categorie di utenza solo parti dell archivio e di soddisfare il REQUISITO DI MINIMA RIDONDANZA DEI DATI. Con l utilizzo di un DBMS vi è la possibilità di avere visioni logiche, multiple e contemporanee della struttura fisica dei dati

51 Progettazione Basi Dati operazionali La gestione dell integrità fisica dei dati DBMS Per soddisfare il requisito di PERSISTENZA DEI DATI è necessario garantire che il sistema di gestione del DataBase mantenga nel tempo le informazioni registrate (ad es. in caso di caduta del sistema o di guasto ai dispositivi di memorizzazione). Inoltre è necessario che il sistema sia protetto da accessi contemporanei agli stessi dati da parte di più utenti. Questa operazione è completamente automatica e controllata dal DBMS e non mette quindi a rischio la consistenza dei dati. Esistono delle norme da seguire per l amministratore del DBMS per impostare e configurare correttamente il sistema al fine di garantire l integrità fisica dei dati.

52 Progettazione Basi Dati operazionali DBMS La gestione dell integrità logica dei dati L integrità logica dei dati consiste nella possibilità di DEFINIRE DEI VINCOLI in modo che non sia possibile inserire o apportare modifiche ai dati CHE NON ABBIANO UN SENSO NEL CONTESTO DELLA REALTA RAPPRESENTATA. Tali vincoli possono essere riferiti: Alle singole categorie di dati (Es. limiti di valori a specifici intervalli o N possibili scelte di valori da immettere) Alle relazioni tra le categorie.

53 Progettazione Basi Dati operazionali DBMS La gestione dell integrità logica dei dati Un tipico caso di integrità logica su una relazione è quello della cosidetta INTEGRITA REFERENZIALE INTEGRITA REFERENZIALE: Definendo tra le categorie un vincolo di integrità referenziale il sistema impedirà la cancellazione di ordini con dettagli ancora esistenti e l inserimento di dettagli non correlati ad un ordine

54 Progettazione Basi Dati operazionali Basi Dati Relazionali Sicurezza e ottimizzazione dell uso dei dati Grazie al DBMS si possono gestiste gli UTENTI e le RISORSE. Le Funzioni di gestione degli utenti consentono all amministratore del sistema di definire dei vincoli di accesso ai dati e di stabilire per ciascun utente il diritto di accesso (SCRITTURA, LETTURA, MODIFICA e cosi via) alle singole unita di informazione del DB. Il DBMS inoltre gestendo direttamente alcune risorse quali le periferiche consente di ottimizzare l utilizzo rispetto a come queste vengono controllati direttamente dal sistema operativo.

55 Progettazione Basi Dati operazionali Approfondimenti sulla progettazione concettuale dati Il corso del professor Lenzerini:

56 Progettazione Basi Dati operazionali Approfondimenti sulle tecniche di reverse/forward

57 Introduzione alle basi dati decisionali Basi dati operazionali e decisionali Differenze Dall operazionale al decisionale

58 Tipologie di Banche Dati Due tipologie di banche dati: operazionali: contengono dati di interesse quotidiano vengono aggiornate costantemente in relazione alle procedure amministrative e tecniche di competenza di un ente informativo-decisionali: servono per supportare le esigenze di integrazione di informazioni provenienti da banche dati operazionali diverse sia ai fini di diffondere conoscenze, sia per supportare i processi decisionali ai diversi livelli (micro o macro decisioni)

59 Tipologie di sistemi informativi Sistemi decisionali Sistemi operazionali?? st 4th Qtr Qtr

60 Sistema operazionale Elabora le necessità del day to day Disegnato per specifiche funzioni Fornisce alcuni reports

61 Sistema decisionale? st Qtr 4th Qtr Supporto alle Decisioni Analisi delle Tendenze Reportistica

62 Criticità sistema operazionali Molte delle richieste dell utente sono complesse da soddisfare, causa l attuale difficoltà di accesso agli Operational Data Bases.

63 Che cos è un Data Warehouse? All interno di un sistema informativo, per Data Warehouse si intende la componente che deve soddisfare esigenze di tipo informativo e decisionale E costituito da una architettura complessiva di ambienti hardware e software, da applicazioni che alimentano la base dati decisionale e che ne consentono la fruizione in funzione delle diverse esigenze

64 Che cos è un Data Warehouse? Passare dai dati alle informazioni Remember that the ultimate goal of Data Warehouse is to keep the right information to the right people in the most intelligent form Dr R. Hackathorn - Bolder Technology

65 Che cos è un Data Warehouse? Mentre i dati sono contenuti negli archivi dei database operativi, progettati per rispondere ad esigenze settoriali, per informazioni si intendono le conoscenze che hanno un unico significato in tutte le situazioni e che possono essere utilizzate per i processi decisionali ed informativi

66 Data Warehouse: una definizione tecnica A non volatile source of time-series, subject oriented, data copies for end user computing (Inmon, 1990)

67 Obiettivi del DW Performance Flessibilità Scalabilità Facilità d uso Qualità dei dati

68 Obiettivi del DW Richieste dinamiche Performance Analisi Multi Dimensionale vs Tradizionale Impatto minimo sui Operational System

69 Obiettivi del DW Flessibilità Flessibilità del Modello Modifica delle strutture dati

70 Obiettivi del DW Scalabilità Numero degli utenti Volume dei dati

71 Obiettivi del DW Facilità d uso Comprensione del Modello Navigazione Manipolazione

72 Che cos è un Data Warehouse? Subject-Oriented (orientato alle aree tematiche) Integrato Time-Variant (comprende dati temporali) Non volatile Collection of data in support of management s decision making process Bill Inmon

73 Subject-oriented (Orientata ai soggetti) Nel DW i dati sono organizzati per soggetto anziché per applicazione Tra tutte le informazioni operazionali vengono selezionate solo quelle necessarie per il processo decisionale

74 Data copies - Copie dei dati I dati vengono trasferiti dal data base operazionale a quello decisionale effettuando operazioni di trasformazione Quando i dati di provenienza diversa vengono trasferiti al D.W. devono assumere una codifica omogenea ed un significato univoco. Ad esempio un informazione riferita al sesso potrebbe essere memorizzata con codici diversi, M/F in un caso 0/1 in un altro.

75 Time series - Serie storiche Vengono memorizzate fotografie della stessa realtà in momenti successivi Questo consente di effettuare confronti, individuare tendenze e fare previsioni. I dati vengono aggiornati periodicamente (e non in tempo reale come nei sistemi gestionali).

76 Non volatile - Persistenti Nel DW i dati immessi non vengono più modificati Essendo fotografie ripetute nel tempo, una volta immesse non vengono modificate. I dati immessi vengono in genere sottoposti a processi di aggregazione.

77 Perché un Data Warehouse Per ricavare informazioni (non solo dati) Per comprendere la qualità delle basi dati Per migliorare la qualità del dato operazionale Per offrire funzioni decisionali integrate nell operazionale

78 Perché un Data Warehouse Per migliorare la ricerca del business Per valorizzare il servizio fornito all utente Per migliorare la qualità dei dati al servizio dell utente Per re-ingegnerizzare i processi di Business Per fornire competitività all azienda

79 Cos è un Data Warehouse: per capirsi meglio. Non è un prodotto, ma un insieme di componenti che costruiscono un architettura Il cuore è una base dati strutturata diversamente da quelle operazionali E un vecchio problema, ma ora sono disponibili metodologie e strumenti di alimentazione ed accesso molto specializzati

80 Architettura Logica utente che aggiorna i dati applicazioni di produzione (OLTP) utente che interroga i dati applicazioni di ricerca e analisi(olap) base dati di produzione Dati sorgente Alimentazione Dati Dati destinazione base dati decisionale (DW) Metadati Basi dati operazionali Basi dati informativo-decisionali

81 Com è fatto un Data Warehouse? Alimentazione DW (Data Capture): dalla base dati amministrativa-gestionale alla base dati decisionale (Data Warehouse) back-end Accesso DW (Data Access): Servizi di accesso al Data Warehouse da parte degli utenti finali front-end

82 Data Warehouse Framework Raw detail No/minimal history Source OLTP Systems Data characteristics Integrated Scrubbed History Summaries Targeted Specialized (OLAP) Data Marts Data Warehouse Design Mapping Extract Scrub Transform Load Index Aggregation Replication Data Set Distribution Access & Analysis Resource Scheduling & Distribution Meta Data System Monitoring

83 I metadati Sono le Pagine gialle Punti di vista: l utente finale, l amministratore dati, l analista, l azienda Esempi sui contenuti: catalogo delle informazioni, fonte, algoritmi di derivazione, qualità dei dati, dimensioni per la navigazione multidimensionale

84 I metadati I Metadati coprono l intero processo di DW/DM Disegno Mapping Estrazione Trasformazione Caricamento Indicizzazione Aggregazioni Replica Distribuzione dei dati Accesso e Analisi Resource Scheduling & Distribution Metadati System Monitoring Assolutamente necessario per la riuscita del progetto

85 Data Capture Data Management Estrazione e trasformazione dei dati Integrazione dati da diverse fonti Validazione dei dati (IMPORTANTE!!) Aggregazione Schedulazione aggiornamenti Caricamento nel data base e flussi di snellimento (scarico dati storici) Data Organization Metadati: Inserimento Aggiornamento

86 Il Processo di ETL (Extract, Transform & Load) Dati OLTP System Data Staging Area aggregazione classificazione (Enterprise) Data Warehouse Dati Esterni validazione standardizzazione Data Mart Data Mart Estrazione Pulizia Trasformazione Caricamento Metadati

87 Data Capture Le alternative sviluppare programmi ad hoc acquistare appositi tool Scelta da meditare, costi mediamente elevati Le nostre scelte programmi ad hoc: PL/SQL, SAS tool: SAS Warehouse Administrator

88 Quale database per il DW Le alternative relazionale (Oracle,...) relazionale ah hoc per D.W.(Red Brick) multidimensionale (Essbase,...) mix tra relazionale e multidimensionale (H- OLAP) Le nostre scelte: Oracle e SAS

89 Data Modeling per sistemi decisionali elevata complessità di una struttura E/R classica (tipica dei sistemi transazionali) eccessiva difficoltà per l utente finale di rintracciare i dati di Interesse impossibilità di effettuare analisi sui dati necessità di passare ad una struttura logica e fisica dei dati, più funzionale rispetto alle esigenze del data warehouse

90 Struttura di una base dati decisionale Oggetto di Intervento Comune Beneficiario Finanziamenti Procedimento La Base Dati è un insieme di fatti fatti nello spazio multidimensionale

91 Struttura multidimensionale L architettura fisica del Modello Dimensionale è descritta attraverso lo STAR SCHEMA Prodotto Clienti Tempo Geografia Produzione

92 Data Modeling per sistemi decisionali: lo Star Schema è uno schema di dati facilmente navigabile è uno schema fortemente denormalizzato il patrimonio informativo è organizzato per soggetti : separazione concettuale dei soggetti ogni soggetto è modellato autonomamente in uno Star Schema

93 Data Modeling per sistemi decisionali: lo Star Schema Dimensione1 Dimensione1_PK Tavola dei Fatti Dimensione1_PK Dimensione2_PK Dimensione3_PK Dimensione4_PK Dimensione2 Dimensione2_PK Dimensione3 Dimensione3_PK Misura1 Misura2 Misura3 Misura4 Dimensione4 Dimensione4_PK

94 Data Modeling per sistemi decisionali: lo Star Schema Tavola dei fatti Contiene i Fatti del Business che si intende analizzare o misurare (generalmente numerici) Tavole delle dimensioni Le Dimension rappresentano il CONTESTO per i fatti che si intende analizzare

95 Esempio di Star Schema

96 Esempio di Star Schema

97 Data Access Elaborazioni periodiche e off line Elaborazioni su richiesta e on line Strumenti di query e reporting (su dati alfanumerici e/o su dati territoriali) Analisi multidimensionale Applicazioni EIS (what-if, agenti intelligenti, applicazioni GIS specializzate) e di modellazione (modelli matematici, modelli territoriali, ecc.) Data mining

98 Tecniche di Accesso alle Informazioni TIPI DI UTENTE Dirigenti Intermedi Impiegati EIS Executive InformationSystem Produzione Queries & Reports su esigenze Queries & Reports preconfezionati OLAP Data Mining Visualizza Analizza Scopri TIPI DI PROCESSO

99 Cos è l OLAP? On Line Analytical Processing Due accezioni In contrapposizione ad OLTP (On Line Transaction Processing): Insieme dei processi che accedono ad un Data Warehouse Più specifica: analisi di tipo multidimensionale, con operazioni di navigazione sui dati (drill-up, drill-down, drill-across, slice & dice)

100 Data Mining: Definizione The automatic discovery of knowledge from stored data Approccio più specializzato, metodi statistici, strutture dati specifiche diverse dal DW

101 Quali ambienti per il Data Access Tool verticali (es. prodotti sugli aspetti finanziari o di marketing quale la soluzione DW SAP, ) Tool orizzontali chiavi in mano (es. Business Objects Tool orizzontali aperti (es. SAS) Le nostre scelte: SAS System Business Objects

102 Business Object Navigazione sui dati organizzati in Universi Accesso ai dati trasparente rispetto alla struttura fisica del database Utenti finali Utenti finali Query Panel Universo DataBase

103 SAS Utenti finali Utenti finali Creazione prospetto MDDB

104 Esempio

105 Back-end Front-end Oracle SAS Warehouse Administrator Data Warehous e Business Objects REPORT Alimentazione DW (Data capture) Accesso DW (Data access)

106 Dal DB gestionale Analisi base dati gestionale + Studio delle interrogazioni

107 al DB decisionale

108 L applicazione sviluppata wijsp Bdm/luisa

109 Approfondimenti sulla progettazione DataWarehouse Il corso del professor Batini:

110 Cenni sul riuso dei dati Costruire una serie di tavole di riferimento (di uso operazionale e decisionale) contenenti codifiche comuni, complete, certificate ed aggiornate costituisce un primo passo per l'integrazione delle basi dati, l'interscambio informativo e la cooperazione tra le diverse amministrazioni. Per acquisire la classificazione che si vuole gestire in una tavola trasversale, viene ricercata la fonte dati più qualificata. Obiettivo è quello di identificare l'ente responsabile dell'informazione (ISTAT per i codici Istat, Ministero delle Finanze per i codici Belfiore, ecc): in tal senso i dati acquisiti vengono considerati "certificati", ovvero emessi dalla fonte che li produce e ne è responsabile. Una volta acquisito il flusso informativo dalla fonte dati individuata, si procede comunque ad una fase sistematica di controllo e validazione dei dati acquisiti: viene verificata, ad esempio, la corrispondenza del livello di aggiornamento con quello dichiarato dalla fonte, la completezza dell'informazione, in sintesi l'idoneità dei dati a corrispondere all'obiettivo informativo per cui sono raccolti.

111 Cenni sulla qualità dei dati La Qualità dei Dati è la misura dell'accordo che esiste tra quanto rappresentato in un sistema informativo, e lo stesso dato nel mondo reale. Una Qualità dei Dati del 100% indica che esiste un perfetto allineamento dei dati presenti nel nostro sistema informativo, con quanto presente nel mondo reale. Data la natura di continua evoluzione caratteristica del mondo reale, nessun sistema informativo di una dimensione significativa può avere una Qualità dei Dati del 100%. L'obiettivo da perseguire è quello di avere dei dati sufficientemente aggiornati, accurati e completi in modo che possano essere utilizzati efficacemente. I processi di data quality devono eliminare non solo i semplici errori e le ridondanze. Devono rendere tra loro consistenti set di dati che sono stati creati in tempi diversi, seguendo differenti regole di raccolta o esigenze di business. In passato (e talvolta ancora oggi), gran parte del lavoro di ripulitura dei dati poteva essere fatto "a mano" dagli operatori. Il laborioso processo di ricerca e correzione per eliminare le informazioni scorrette, completare quelle parziali o cancellare quelle duplicate è molto costoso e inoltre comporta l'aggiunta di nuovi errori. Ma per questo esistono oggi dei tools specializzati che usano complessi algoritmi per analizzare, standardizzare, correggere e integrare le informazioni.

112 Tools di data quality Un valido tool di Data Quality deve essere di supporto in tutte le fasi del complesso processo di bonifica dati, che parte dall'analisi iniziale del problema (analisi dati e processi), procede con la pianificazione e l'implementazione degli interventi di miglioramento e si conclude incorporando le misure di miglioramento nel sistema. In primo luogo il tool di Data Quality deve consentire di effettuare attività di pulizia e integrazione dei dati utilizzando vocabolari, regole sintattiche e di fonetica che sono proprie della lingua italiana. Inoltre deve fornire procedure specializzate che siano di supporto alle seguenti attività: Data profiling: utilizzo di tecnologia analitica applicata ai dati per comprendere contenuto e struttura delle quantità di informazioni elaborate ed applicare funzioni statistiche sui dati; Deduplicazione: individuazione di record simili (record linking); Standardizzazione: associazione ad una serie di valori definiti "somiglianti" di un valore standard determinato.

113 Tools di data quality Dovrebbe essere consentita anche la customizzazione del tool, ovvero la generazione di regole e criteri personalizzati che si adattino al contesto informativo su cui viene attivato il processo di bonifica dati. Infine le funzionalità di Data Quality devono poter essere integrate nei processi di ETL (Estrazione Trasformazione e Caricamento massivo di dati) e nelle procedure di Data Entry. Allo scopo di valutare i requisiti sopraelencati, il gruppo ha avviato la sperimentazione del tool di Data Quality fornito della SAS, SAS Data Quality Solution, avuto in prova dall'ottobre del Questa sperimentazione ha avuto buon esito e, a giugno 2004, il CSI ha proceduto alla richiesta di acquisto della licenza di SAS Data Quality, per il suo utilizzo in numerosi progetti aziendali.

114 Definizione di qualità dei dati Definizione del concetto di qualità fornita dallo standard ISO 8402 Quality Management and Quality Assurance-Vocabulary : l insieme delle caratteristiche di un entità che conferiscono ad essa la capacità di soddisfare esigenze espresse ed implicite La qualità dei dati può essere definita come segue: Un insieme di caratteristiche che un data item deve avere affinché effettui i compiti per cui è stato concepito; tali caratteristiche sono specificatamente riferite ai valori ed al formato del data item Una definizione di data item è: Dato un modello di dati, un data item è l elemento a granularità più bassa del modello

115 Proprietà della qualità dei dati In base a queste definizioni si possono evidenziare le seguenti due proprietà: la qualità di un entità è un concetto soggettivo, fortemente dipendente dai requisiti che l utente dell entità richiede in maniera implicita o esplicita; la qualità è rapportata ad un insieme di caratteristiche, è dunque un concetto multidimensionale,ovvero determinabile in base a diverse componenti piuttosto che in base ad una singola.

116 Dimensioni della qualità dei valori Le dimensioni della qualità dei dati sono classificate in tre categorie: schema concettuale, valori e formato: Lo schema concettuale si riferisce all aspetto intensionale dei dati, ovvero a quella componente dei dati che rimane invariata nel tempo. I valori sono invece relativi all aspetto estensionale dei dati, ossia alla parte variabile nel tempo. Il formato è connesso alla modalità di rappresentazione dei dati.

117 Dimensioni della qualità dei valori Accuratezza sintattica, definita come vicinanza del valore del data item ad un valore nel dominio di definizione sintattico considerato corretto. Ad esempio, un basso grado di accuratezza sintattica corrisponde ad un valore di un data item che è Mrio anziché Mario. Accuratezza semantica, definita come vicinanza del valore del data item ad un valore nel dominio di definizione semantico considerato corretto. Ad esempio, un basso grado di accuratezza semantica corrisponde al caso in cui si abbia Maria anziché Mario. Accuratezza temporale, definita come vicinanza del valore del data item al valore temporalmente corretto. Si consideri, come esempio, il data item indirizzo di residenza; se Mario Rossi deve avere un indirizzo di residenza X alla data Dx e un indirizzo di residenza Y alla data Dy, qualora risulti che alla data Dy ha l indirizzo X, il dato non è temporalmente corretto.

118 Dimensioni della qualità dei valori Attualità, definita come adeguatezza del valore del data item rispetto alle esigenze temporali del contesto di utilizzo. Se, ad esempio, l orario delle lezioni relativo ai corsi di un università è aggiornato "tardi" nella informativa destinata agli studenti, rispetto all inizio dei corsi, il dato ha un livello insufficiente di attualità. Completezza dei valori, definita come l estensione con cui i valori dei data item sono presenti nella base di dati. Un data item possiede un valore oppure è nullo; i valori nulli dovrebbero essere limitati, ed in ogni caso bisogna specificarne il significato. Consistenza Interna, relativa al grado di consistenza di valori di data item nell ambito della stessa entità. Ad esempio i valori dei data item CAP, Comune, Provincia, devono risultare consistenti nell ambito dell entità Persona. Consistenza Esterna, relativa al grado di consistenza di valori di data item nell ambito di entità diverse. Ad esempio, Mario Rossi è celibe in un entità relativa al suo stato matrimoniale, mentre Anna Rossi si dichiara moglie dello stesso Mario Rossi, in un entità di tipo diverso.

119 Cause di dati errati Le principali cause di dati errati possono essere così riassunte: Inserimento di informazioni errate nel data entry: errata grafia, uso delle maiuscole, abbreviazioni o diverso ordine d'inserimento dei nomi. La dispersione dei dati presso diversi soggetti, secondo logiche quasi sempre funzionali alle esigenze delle singole amministrazioni (ovvero la mancata identificazione della responsabilità del dato e del processo) La disomogeneità dell informazione (ovvero la mancanza di sistemi di codifica standardizzati a livello sia dell'azienda sia di settore). Database suddivisi in differenti dipartimenti e aziende in cui i dati in ogni struttura sono registrati con regole differenti per ogni database. Utilizzo di informazioni prese da vecchi database che contengono dati obsoleti e scarsamente documentati. L assenza di procedure ad hoc di gestione della qualità dei dati e/o di procedure di gestione dei dati autonome rispetto alle funzionalità offerte dai sistemi.

120 Metodologie di miglioramento Basate sui Dati correggere i Dati Confronto dei dati con la realtà che rappresentano costoso, a campione, molto preciso una tantum per orientare l intervento Confronto dei dati tra due o più archivi (applicazione di tecniche di record matching: record diversi che si riferiscono alla stessa identità del mondo reale) + Facilmente applicabile, costo medio Il matching non garantisce una correttezza massima Confronto dei dati con vincoli o business rules (su un campo, su più campi, considerazioni probabilistiche) + spesso efficace, poco costoso non garantisce per il futuro, riguarda solo la conformità alle regole, non la accuratezza, particolarmente adatti a dati permanenti

121 Metodologie di miglioramento Basate sui Processi individuare e correggere le cause di errore Identificare il processo Identificare il Process Owner e Data Stewards (Identificazione delle responsabilità) Descrivere il processo Stabilire un sistema di misura Definire un sistema di monitoraggio e controllo (dei dati e/ del processo) Identificare gli obiettivi di miglioramento Realizzare gli interventi di miglioramento

122 Il MINING Esperienze di text e data mining in CSI per gli enti della pubblica amministrazione regionale

123 Text mining Il Text Mining, anche conosciuto come Analisi Testuale Intelligente, Text Data Mining o Knowledge Discovery in Text (KDT), è un processo di analisi per estrarre nuova e valida conoscenza dai documenti di testo e per dedurre informazioni da grandi quantità di dati non strutturati, combinandoli con variabili quantitative, esattamente come il Data Mining fa con i dati strutturati.questa tecnica ha un potenziale decisamente interessante, se si pensa che una larga fetta delle informazioni con cui ci si confronta quotidianamente sono di tipo testuale e possono quindi rappresentare una fonte importante di approfondimento per quanto riguarda la conoscenza delle realtà che si vogliono analizzare.si parte da un insieme di documenti testuali e si affronta una prima fase di cleaning e riduzione dei dati, avente l obiettivo di decomporli e rappresentarli attraverso una struttura adatta alle analisi di data mining, tramite la rimozione dei termini di disturbo, l analisi morfologica dei termini e la creazione di tabelle di frequenza. Dopo questa prima fase di analisi linguistica, si passa all analisi statistica dei dati: i documenti vengono classificati in gruppi omogenei (cluster analysis) e può venir effettuata un analisi predittiva che, a partire da questi risultati, classifichi nuovi documenti.

124 Text mining Il Text Mining offre la possibilità di effettuare un filtraggio intelligente dei documenti non strutturati, dal momento che, al contrario di quanto avveniva con i primi strumenti di Data Retrieval, nel realizzare l analisi viene considerato anche il contesto: non si basa cioè sulla presenza di una parola singola bensì sulle relazioni che essa mantiene con le altre per dare un significato univoco all'enunciato. Obiettivi Lo scopo di un'analisi di text mining è approntare un sistema automatico che permetta di: leggere, interpretare, classificare ed integrare i dati provenienti da numerose fonti (Internet, intranet, banche dati, mail, forum, report, ), al fine di scoprire in maniera rapida ed efficace conoscenza utile anche su un numero molto grande di documenti; estrarre conoscenza dal testo: esso viene trasformato in tabelle facilmente interpretabili con sistemi quali-quantitativi; classificare automaticamente i documenti in maniera predittiva: i testi vengono assegnati a distinte aree tematiche sulla base dei parametri di classificazione trovati nelle analisi effettuate durante la prima fase di interpretazione dell'universo dei documenti.

125 Data mining Il Data mining è definito come: il processo di estrazione di conoscenza da banche dati di grandi dimensioni tramite l'applicazione di algoritmi che individuano le associazioni "nascoste" tra le informazioni e le rendono visibili. In altre parole, col nome Data mining si intende l'applicazione di una o più tecniche che consentono l'esplorazione di grandi quantità di dati, con l'obiettivo di individuare le informazioni più significative e di renderle disponibili e direttamente utilizzabili nell'ambito del decision making. L'estrazione di conoscenza (informazioni significative) avviene tramite individuazione delle associazioni ("patterns" oppure sequenze ripetute oppure regolarità) nascoste nei dati. In questo contesto un "pattern" indica una struttura, un modello, o, in generale, una rappresentazione sintetica dei dati. Il termine Data mining è utilizzato come sinonimo di knowledge discovery in databases (KDD), anche se sarebbe più preciso parlare di knowledge discovery quando ci si riferisce al processo di estrazione della conoscenza, e di Data mining come di una particolare fase del suddetto processo (la fase di applicazione di uno specifico algoritmo per l'individuazione dei "patterns").

126 Data mining I risultati a cui può giungere l'attività di Data mining sono molteplici: - associazioni - due eventi si verificano spesso insieme (ad esempio chi compra uno zaino scolastico tende ad acquistare anche dei quaderni); - sequenze - due eventi successivi sembrano legati da una relazione di causa-effetto (chi compra un mouse su Internet, tempo dopo acquista anche un tappetino); - classificazioni - il riconoscimento di un ordine in una serie di eventi, con la conseguente riorganizzazione dei dati in proprio possesso; - raggruppamenti - la ricerca e la presentazione di gruppi di fatti non precedentemente noti; - previsioni - lo studio della probabile evoluzione futura della propria attività in base alle risultanze dei dati raccolti.

127 Filone Data Mining analisi del rispetto delle linee guida nel trattamento dell ipertensione segmentazione delle scuole materne del Piemonte modello di previsione del successo della formazione professionale analisi di Web Mining di un sito regionale nell ambito del progetto Catalogo dei servizi decisionali

128 Analisi trattamento ipertensione Analisi modelli prescrittivi piemontesi trattamento farmacologico dell ipertensione Obiettivo: raggruppare i medici con profili simili nel trattamento farmacologico prescelto (monotrattamento, trattamenti combinati ) nel trattamento dell ipertensione. Verificare in quale modo le linee guida OMS per il trattamento dell ipertensione sono rispettate. Periodo di osservazione: Soggetti: Fonte: primo semestre 2002 Soggetti: Medici di base generici Fonte: Datawarehouse delle prescrizioni farmaceutiche regionale

129 Analisi trattamento ipertensione Flusso delle analisi realizzate con Entreprise Miner

130 Analisi trattamento ipertensione Risultati cluster analysis con Mappe di Kohonen

131 Analisi trattamento ipertensione Cluster 7 (300 medici) Comportamento: segue linee guida monosomministrazione per pazienti non a rischio, combinazioni esclusive per pazienti a rischio Profilo medio del medico: medico di "campagna" Cluster 3 (150 medici) Comportamento: non segue linee guida, in particolare usa associazioni non consigliate, poco monosomministrazione Profilo medio del medico: pochi anni attività 0-10, medico di "città" Tipo paziente: niente di particolare (età, numero pazienti ipertesi, ipertesi a rischio) Azione di informazione specifica

132 Filone Data Mining analisi del rispetto delle linee guide nel trattamento dell ipertensione segmentazione delle scuole materne del Piemonte modello di previsione del successo della formazione professionale analisi di Web Mining di un sito regionale nell ambito del progetto Catalogo dei servizi decisionali

133 Segmentazione delle scuole materne

134 Filone Data Mining analisi del rispetto delle linee guide nel trattamento dell ipertensione segmentazione delle scuole materne del Piemonte modello di previsione del successo della formazione professionale analisi di Web Mining di un sito regionale nell ambito del progetto Catalogo dei servizi decisionali

135 Follow-up occupazionale corsi FP Esempio di albero decisionale

136 Filone Data Mining analisi del rispetto delle linee guide nel trattamento dell ipertensione segmentazione delle scuole materne del Piemonte modello di previsione del successo della formazione professionale analisi di Web Mining di un sito regionale nell ambito del progetto Catalogo dei servizi decisionali

137 Le analisi statistiche degli accessi al Data Warehouse

Organizzazione degli archivi

Organizzazione degli archivi COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i

Dettagli

Database. Si ringrazia Marco Bertini per le slides

Database. Si ringrazia Marco Bertini per le slides Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida

Dettagli

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Corso di Laurea Magistrale in Ingegneria per l Ambiente e il Territorio A.A. 2014-2015 Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Strutture di dati: DB e DBMS DATO E INFORMAZIONE Dato: insieme

Dettagli

Progettaz. e sviluppo Data Base

Progettaz. e sviluppo Data Base Progettaz. e sviluppo Data Base! Introduzione ai Database! Tipologie di DB (gerarchici, reticolari, relazionali, oodb) Introduzione ai database Cos è un Database Cos e un Data Base Management System (DBMS)

Dettagli

1. BASI DI DATI: GENERALITÀ

1. BASI DI DATI: GENERALITÀ 1. BASI DI DATI: GENERALITÀ BASE DI DATI (DATABASE, DB) Raccolta di informazioni o dati strutturati, correlati tra loro in modo da risultare fruibili in maniera ottimale. Una base di dati è usualmente

Dettagli

Data Warehousing (DW)

Data Warehousing (DW) Data Warehousing (DW) Il Data Warehousing è un processo per estrarre e integrare dati storici da sistemi transazionali (OLTP) diversi e disomogenei, e da usare come supporto al sistema di decisione aziendale

Dettagli

Il database management system Access

Il database management system Access Il database management system Access Corso di autoistruzione http://www.manualipc.it/manuali/ corso/manuali.php? idcap=00&idman=17&size=12&sid= INTRODUZIONE Il concetto di base di dati, database o archivio

Dettagli

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Dettagli

La Metodologia adottata nel Corso

La Metodologia adottata nel Corso La Metodologia adottata nel Corso 1 Mission Statement + Glossario + Lista Funzionalià 3 Descrizione 6 Funzionalità 2 Schema 4 Schema 5 concettuale Logico EA Relazionale Codice Transazioni In PL/SQL Schema

Dettagli

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L. DATA WAREHOUSE Un Dataware House può essere definito come una base di dati di database. In molte aziende ad esempio ci potrebbero essere molti DB, per effettuare ricerche di diverso tipo, in funzione del

Dettagli

Introduzione al data base

Introduzione al data base Introduzione al data base L Informatica è quella disciplina che si occupa del trattamento automatico dei dati con l ausilio del computer. Trattare i dati significa: raccoglierli, elaborarli e conservarli

Dettagli

Progettazione di Basi di Dati

Progettazione di Basi di Dati Progettazione di Basi di Dati Prof. Nicoletta D Alpaos & Prof. Andrea Borghesan Entità-Relazione Progettazione Logica 2 E il modo attraverso il quale i dati sono rappresentati : fa riferimento al modello

Dettagli

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014 Archivi e database Prof. Michele Batocchi A.S. 2013/2014 Introduzione L esigenza di archiviare (conservare documenti, immagini, ricordi, ecc.) è un attività senza tempo che è insita nell animo umano Primi

Dettagli

Sistemi informativi secondo prospettive combinate

Sistemi informativi secondo prospettive combinate Sistemi informativi secondo prospettive combinate direz acquisti direz produz. direz vendite processo acquisti produzione vendite INTEGRAZIONE TRA PROSPETTIVE Informazioni e attività sono condivise da

Dettagli

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni Introduzione Ai Data Bases Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni I Limiti Degli Archivi E Il Loro Superamento Le tecniche di gestione delle basi di dati nascono

Dettagli

Basi di dati. (Sistemi Informativi) teoria e pratica con Microsoft Access. Basi di dati. Basi di dati. Basi di dati e DBMS DBMS DBMS

Basi di dati. (Sistemi Informativi) teoria e pratica con Microsoft Access. Basi di dati. Basi di dati. Basi di dati e DBMS DBMS DBMS Basi di Basi di (Sistemi Informativi) Sono una delle applicazioni informatiche che hanno avuto il maggiore utilizzo in uffici, aziende, servizi (e oggi anche sul web) Avete già interagito (magari inconsapevolmente)

Dettagli

MODELLO RELAZIONALE. Introduzione

MODELLO RELAZIONALE. Introduzione MODELLO RELAZIONALE Introduzione E' stato proposto agli inizi degli anni 70 da Codd finalizzato alla realizzazione dell indipendenza dei dati, unisce concetti derivati dalla teoria degli insiemi (relazioni)

Dettagli

Sistemi Informativi e Basi di Dati

Sistemi Informativi e Basi di Dati Sistemi Informativi e Basi di Dati Laurea Specialistica in Tecnologie di Analisi degli Impatti Ecotossicologici Docente: Francesco Geri Dipartimento di Scienze Ambientali G. Sarfatti Via P.A. Mattioli

Dettagli

MODULO 5 Appunti ACCESS - Basi di dati

MODULO 5 Appunti ACCESS - Basi di dati MODULO 5 Appunti ACCESS - Basi di dati Lezione 1 www.mondopcnet.com Modulo 5 basi di dati Richiede che il candidato dimostri di possedere la conoscenza relativa ad alcuni concetti fondamentali sui database.

Dettagli

BASI DI DATI - : I modelli di database

BASI DI DATI - : I modelli di database BASI DI DATI - : I modelli di database DAL 1960 ci si e' orientati verso 3 direzioni: 1 MODELLO GERARCHICO Se i dati si presentano naturalmente in una struttura ad albero (ES. File System) Limiti: rigidità

Dettagli

Corso di Access. Prerequisiti. Modulo L2A (Access) 1.1 Concetti di base. Utilizzo elementare del computer Concetti fondamentali di basi di dati

Corso di Access. Prerequisiti. Modulo L2A (Access) 1.1 Concetti di base. Utilizzo elementare del computer Concetti fondamentali di basi di dati Corso di Access Modulo L2A (Access) 1.1 Concetti di base 1 Prerequisiti Utilizzo elementare del computer Concetti fondamentali di basi di dati 2 1 Introduzione Un ambiente DBMS è un applicazione che consente

Dettagli

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico Introduzione alle basi di dati Introduzione alle basi di dati Gestione delle informazioni Base di dati Modello dei dati Indipendenza dei dati Accesso ai dati Vantaggi e svantaggi dei DBMS Gestione delle

Dettagli

I Sistemi Informativi

I Sistemi Informativi I Sistemi Informativi Definizione Un Sistema Informativo è un mezzo per acquisire, organizzare, correlare, elaborare e distribuire le informazioni che riguardano una realtà che si desidera descrivere e

Dettagli

Database: collezione di fatti, registrabili e con un ben preciso significato, relazionati fra di loro

Database: collezione di fatti, registrabili e con un ben preciso significato, relazionati fra di loro Database relazionali: un'introduzione Database: collezione di fatti, registrabili e con un ben preciso significato, relazionati fra di loro Rappresentazione astratta di aspetti del mondo reale (Universe

Dettagli

Corso di Informatica (Basi di Dati)

Corso di Informatica (Basi di Dati) Corso di Informatica (Basi di Dati) Lezione 1 (12 dicembre 2008) Introduzione alle Basi di Dati Da: Atzeni, Ceri, Paraboschi, Torlone - Basi di Dati Lucidi del Corso di Basi di Dati 1, Prof. Carlo Batini,

Dettagli

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?) Ambiente Access La Guida di Access Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?) Guida in linea Guida rapida Assistente di Office indicazioni

Dettagli

Data Base. Prof. Filippo TROTTA

Data Base. Prof. Filippo TROTTA Data Base Definizione di DataBase Un Database può essere definito come un insieme di informazioni strettamente correlate, memorizzate su un supporto di memoria di massa, costituenti un tutt uno, che possono

Dettagli

IL SISTEMA INFORMATIVO

IL SISTEMA INFORMATIVO IL SISTEMA INFORMATIVO In un organizzazione l informazione è una risorsa importante al pari di altri tipi di risorse: umane, materiali, finanziarie, (con il termine organizzazione intendiamo un insieme

Dettagli

ISTITUTO TECNICO ECONOMICO MOSSOTTI

ISTITUTO TECNICO ECONOMICO MOSSOTTI CLASSE III INDIRIZZO S.I.A. UdA n. 1 Titolo: conoscenze di base Conoscenza delle caratteristiche dell informatica e degli strumenti utilizzati Informatica e sistemi di elaborazione Conoscenza delle caratteristiche

Dettagli

BANCHE DATI. Informatica e tutela giuridica

BANCHE DATI. Informatica e tutela giuridica BANCHE DATI Informatica e tutela giuridica Definizione La banca dati può essere definita come un archivio di informazioni omogenee e relative ad un campo concettuale ben identificato, le quali sono organizzate,

Dettagli

REALIZZARE UN MODELLO DI IMPRESA

REALIZZARE UN MODELLO DI IMPRESA REALIZZARE UN MODELLO DI IMPRESA - organizzare e gestire l insieme delle attività, utilizzando una piattaforma per la gestione aziendale: integrata, completa, flessibile, coerente e con un grado di complessità

Dettagli

database: modello entityrelationship

database: modello entityrelationship Insegnamento di Informatica CdS Scienze Giuridiche A.A. 2007/8 database: modello entityrelationship Prof.Valle D.ssaFolgieri Lez7 25.10.07 Trattamento dati. Database: modello entity-relationship 1 Fasi

Dettagli

Progettaz. e sviluppo Data Base

Progettaz. e sviluppo Data Base Progettaz. e sviluppo Data Base! Progettazione Basi Dati: Metodologie e modelli!modello Entita -Relazione Progettazione Base Dati Introduzione alla Progettazione: Il ciclo di vita di un Sist. Informativo

Dettagli

Progettazione di un Database

Progettazione di un Database Progettazione di un Database Per comprendere il processo di progettazione di un Database deve essere chiaro il modo con cui vengono organizzati e quindi memorizzati i dati in un sistema di gestione di

Dettagli

Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita;

Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita; .netbin. è un potentissimo strumento SVILUPPATO DA GIEMME INFORMATICA di analisi dei dati con esposizione dei dati in forma numerica e grafica con un interfaccia visuale di facile utilizzo, organizzata

Dettagli

Organizzazione delle informazioni: Database

Organizzazione delle informazioni: Database Organizzazione delle informazioni: Database Laboratorio Informatico di base A.A. 2013/2014 Dipartimento di Scienze Aziendali e Giuridiche Università della Calabria Dott. Pierluigi Muoio (pierluigi.muoio@unical.it)

Dettagli

Base di dati e sistemi informativi

Base di dati e sistemi informativi Base di dati e sistemi informativi Una base di dati è un insieme organizzato di dati opportunamente strutturato per lo svolgimento di determinate attività La base di dati è un elemento fondamentale per

Dettagli

Sistemi Informativi e Sistemi ERP

Sistemi Informativi e Sistemi ERP Sistemi Informativi e Sistemi Trasformare i dati in conoscenza per supportare le decisioni CAPODAGLIO E ASSOCIATI 1 I SISTEMI INFORMATIVI LI - E IMPRESA SISTEMA DI OPERAZIONI ECONOMICHE SVOLTE DA UN DATO

Dettagli

11. Evoluzione del Software

11. Evoluzione del Software 11. Evoluzione del Software Andrea Polini Ingegneria del Software Corso di Laurea in Informatica (Ingegneria del Software) 11. Evoluzione del Software 1 / 21 Evoluzione del Software - generalità Cosa,

Dettagli

DBMS (Data Base Management System)

DBMS (Data Base Management System) Cos'è un Database I database o banche dati o base dati sono collezioni di dati, tra loro correlati, utilizzati per rappresentare una porzione del mondo reale. Sono strutturati in modo tale da consentire

Dettagli

SOLUZIONE Web.Orders online

SOLUZIONE Web.Orders online SOLUZIONE Web.Orders online Gennaio 2005 1 INDICE SOLUZIONE Web.Orders online Introduzione Pag. 3 Obiettivi generali Pag. 4 Modulo di gestione sistema Pag. 5 Modulo di navigazione prodotti Pag. 7 Modulo

Dettagli

Basi di Dati Relazionali

Basi di Dati Relazionali Corso di Laurea in Informatica Basi di Dati Relazionali a.a. 2009-2010 PROGETTAZIONE DI UNA BASE DI DATI Raccolta e Analisi dei requisiti Progettazione concettuale Schema concettuale Progettazione logica

Dettagli

Dominio applicativo. Analisi e ricognizione delle fonti dati

Dominio applicativo. Analisi e ricognizione delle fonti dati Dominio applicativo La Società chiamata StraSport, si occupa di vendite all ingrosso di articoli sportivi. Ha agenzie distribuite sul territorio italiano che gestiscono le vendite, ognuna di esse gestisce

Dettagli

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione SISTEMI INFORMATIVI AVANZATI -2010/2011 1 Introduzione In queste dispense, dopo aver riportato una sintesi del concetto di Dipendenza Funzionale e di Normalizzazione estratti dal libro Progetto di Basi

Dettagli

AMMINISTRARE I PROCESSI

AMMINISTRARE I PROCESSI LE SOLUZIONI AXIOMA PER LE AZIENDE DI SERVIZI AMMINISTRARE I PROCESSI (ERP) Axioma Value Application Servizi Axioma, che dal 1979 offre prodotti software e servizi per le azienda italiane, presenta Axioma

Dettagli

Facoltà di Farmacia - Corso di Informatica

Facoltà di Farmacia - Corso di Informatica Basi di dati Riferimenti: Curtin cap. 8 Versione: 13/03/2007 1 Basi di dati (Database, DB) Una delle applicazioni informatiche più utilizzate, ma meno conosciute dai non informatici Avete già interagito

Dettagli

TEORIA sulle BASI DI DATI

TEORIA sulle BASI DI DATI TEORIA sulle BASI DI DATI A cura del Prof. Enea Ferri Cos è un DATA BASE E un insieme di archivi legati tra loro da relazioni. Vengono memorizzati su memorie di massa come un unico insieme, e possono essere

Dettagli

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi ControlloCosti Cubi OLAP I cubi OLAP Un Cubo (OLAP, acronimo di On-Line Analytical Processing) è una struttura per la memorizzazione e la gestione dei dati che permette di eseguire analisi in tempi rapidi,

Dettagli

Informatica (Basi di Dati)

Informatica (Basi di Dati) Corso di Laurea in Biotecnologie Informatica (Basi di Dati) Introduzione alle Basi di Dati Anno Accademico 2009/2010 Da: Atzeni, Ceri, Paraboschi, Torlone - Basi di Dati Lucidi del Corso di Basi di Dati

Dettagli

lem logic enterprise manager

lem logic enterprise manager logic enterprise manager lem lem Logic Enterprise Manager Grazie all esperienza decennale in sistemi gestionali, Logic offre una soluzione modulare altamente configurabile pensata per la gestione delle

Dettagli

Il software impiegato su un computer si distingue in: Sistema Operativo Compilatori per produrre programmi

Il software impiegato su un computer si distingue in: Sistema Operativo Compilatori per produrre programmi Il Software Il software impiegato su un computer si distingue in: Software di sistema Sistema Operativo Compilatori per produrre programmi Software applicativo Elaborazione testi Fogli elettronici Basi

Dettagli

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi Indice generale OOA Analisi Orientata agli Oggetti Introduzione Analisi Metodi d' analisi Analisi funzionale Analisi del flusso dei dati Analisi delle informazioni Analisi Orientata agli Oggetti (OOA)

Dettagli

I MODULI Q.A.T. PANORAMICA. La soluzione modulare di gestione del Sistema Qualità Aziendale

I MODULI Q.A.T. PANORAMICA. La soluzione modulare di gestione del Sistema Qualità Aziendale La soluzione modulare di gestione del Sistema Qualità Aziendale I MODULI Q.A.T. - Gestione clienti / fornitori - Gestione strumenti di misura - Gestione verifiche ispettive - Gestione documentazione del

Dettagli

12. Evoluzione del Software

12. Evoluzione del Software 12. Evoluzione del Software Andrea Polini Ingegneria del Software Corso di Laurea in Informatica (Ingegneria del Software) 12. Evoluzione del Software 1 / 21 Evoluzione del Software - generalità Cosa,

Dettagli

Università degli Studi di Parma Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica. Ingegneria del Software. La fase di Analisi

Università degli Studi di Parma Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica. Ingegneria del Software. La fase di Analisi Università degli Studi di Parma Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica Ingegneria del Software La fase di Analisi Giulio Destri Ing. del software: Analisi - 1 Scopo del modulo Definire

Dettagli

Le Basi di Dati. Le Basi di Dati

Le Basi di Dati. Le Basi di Dati Le Basi di Dati 20/05/02 Prof. Carlo Blundo 1 Le Basi di Dati Le Base di Dati (database) sono un insieme di tabelle di dati strutturate in maniera da favorire la ricerca di informazioni specializzate per

Dettagli

Programma del Corso. Dati e DBMS SQL. Progettazione di una. Normalizzazione

Programma del Corso. Dati e DBMS SQL. Progettazione di una. Normalizzazione Programma del Corso Dati e DBMS DBMS relazionali SQL Progettazione di una base di dati Normalizzazione (I prova scritta) (II prova scritta) Interazione fra linguaggi di programmazione e basi di dati Cenni

Dettagli

MODELLO E/R. Modellazione dei dati

MODELLO E/R. Modellazione dei dati MODELLO E/R Maria Mirto Modellazione dei dati Modellare i dati significa: costruire una rappresentazione semplificata della realtà osservata, individuandone gli elementi caratterizzanti e i legami intercorrenti

Dettagli

Archivi e database. Lezione n. 7

Archivi e database. Lezione n. 7 Archivi e database Lezione n. 7 Dagli archivi ai database (1) I dati non sempre sono stati considerati dall informatica oggetto separato di studio e di analisi Nei primi tempi i dati erano parte integrante

Dettagli

B C I un altro punto di vista Introduzione

B C I un altro punto di vista Introduzione Bollicine Community B C Intelligence B C I un altro punto di vista Introduzione Graziano Guazzi General Manager Data Flow Settembre 2007 pag, 1 Cosa misurare La definizione di quale domanda di mercato

Dettagli

I database relazionali sono il tipo di database attualmente piu diffuso. I motivi di questo successo sono fondamentalmente due:

I database relazionali sono il tipo di database attualmente piu diffuso. I motivi di questo successo sono fondamentalmente due: Il modello relazionale I database relazionali sono il tipo di database attualmente piu diffuso. I motivi di questo successo sono fondamentalmente due: 1. forniscono sistemi semplici ed efficienti per rappresentare

Dettagli

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone BASI DI DATI per la gestione dell informazione Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone Libro di Testo 22 Chianese, Moscato, Picariello e Sansone BASI DI DATI per la Gestione dell

Dettagli

Basi di dati. Il Modello Relazionale dei Dati. K. Donno - Il Modello Relazionale dei Dati

Basi di dati. Il Modello Relazionale dei Dati. K. Donno - Il Modello Relazionale dei Dati Basi di dati Il Modello Relazionale dei Dati Proposto da E. Codd nel 1970 per favorire l indipendenza dei dati Disponibile come modello logico in DBMS reali nel 1981 (non è facile realizzare l indipendenza

Dettagli

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Obiettivi. Presentare l evoluzione dei sistemi informativi: da supporto alla operatività a supporto al momento decisionale Definire

Dettagli

La tecnologia cloud computing a supporto della gestione delle risorse umane

La tecnologia cloud computing a supporto della gestione delle risorse umane La tecnologia cloud computing a supporto della gestione delle risorse umane L importanza delle risorse umane per il successo delle strategie aziendali Il mondo delle imprese in questi ultimi anni sta rivolgendo

Dettagli

03. Il Modello Gestionale per Processi

03. Il Modello Gestionale per Processi 03. Il Modello Gestionale per Processi Gli aspetti strutturali (vale a dire l organigramma e la descrizione delle funzioni, ruoli e responsabilità) da soli non bastano per gestire la performance; l organigramma

Dettagli

Basi di dati. Concetti introduttivi ESEMPIO. INSEGNAMENTI Fisica, Analisi, Aule. Docenti. Entità Relazioni Interrogazioni. Ultima modifica: 26/02/2007

Basi di dati. Concetti introduttivi ESEMPIO. INSEGNAMENTI Fisica, Analisi, Aule. Docenti. Entità Relazioni Interrogazioni. Ultima modifica: 26/02/2007 Basi di dati Concetti introduttivi Ultima modifica: 26/02/2007 ESEMPIO INSEGNAMENTI Fisica, Analisi, Informatica Aule Docenti Entità Relazioni Interrogazioni St udent i Database 2 Tabella (I) STUDENTE

Dettagli

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse Introduzione data warehose Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa Data Warehouse Che cosa e un data warehouse? Quali sono i modelli dei dati per data warehouse Come si progetta

Dettagli

Project Cycle Management

Project Cycle Management Project Cycle Management Tre momenti centrali della fase di analisi: analisi dei problemi, analisi degli obiettivi e identificazione degli ambiti di intervento Il presente materiale didattico costituisce

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA Facoltà di Ingegneria

UNIVERSITA DEGLI STUDI DI BRESCIA Facoltà di Ingegneria ESAME DI STATO DI ABILITAZIONE ALL'ESERCIZIO DELLA PROFESSIONE DI INGEGNERE PRIMA PROVA SCRITTA DEL 22 giugno 2011 SETTORE DELL INFORMAZIONE Tema n. 1 Il candidato sviluppi un analisi critica e discuta

Dettagli

MANUALE MOODLE STUDENTI. Accesso al Materiale Didattico

MANUALE MOODLE STUDENTI. Accesso al Materiale Didattico MANUALE MOODLE STUDENTI Accesso al Materiale Didattico 1 INDICE 1. INTRODUZIONE ALLA PIATTAFORMA MOODLE... 3 1.1. Corso Moodle... 4 2. ACCESSO ALLA PIATTAFORMA... 7 2.1. Accesso diretto alla piattaforma...

Dettagli

UN APP FLESSIBILE E INTUITIVA PER GESTIRE I TUOI AFFARI IN TUTTA COMODITÀ

UN APP FLESSIBILE E INTUITIVA PER GESTIRE I TUOI AFFARI IN TUTTA COMODITÀ UN APP FLESSIBILE E INTUITIVA PER GESTIRE I TUOI AFFARI IN TUTTA COMODITÀ APP Mobile MIGLIORA LA QUALITÀ DEL RAPPORTO CON I CLIENTI, SCEGLI LA TECNOLOGIA DEL MOBILE CRM INTEGRABILE AL TUO GESTIONALE AZIENDALE

Dettagli

La Progettazione Concettuale

La Progettazione Concettuale La Progettazione Concettuale Università degli Studi del Sannio Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica CorsodiBasidiDati Anno Accademico 2006/2007 docente: ing. Corrado Aaron Visaggio

Dettagli

I database relazionali (Access)

I database relazionali (Access) I database relazionali (Access) Filippo TROTTA 04/02/2013 1 Prof.Filippo TROTTA Definizioni Database Sistema di gestione di database (DBMS, Database Management System) Sistema di gestione di database relazionale

Dettagli

Ciclo di vita dimensionale

Ciclo di vita dimensionale aprile 2012 1 Il ciclo di vita dimensionale Business Dimensional Lifecycle, chiamato anche Kimball Lifecycle descrive il framework complessivo che lega le diverse attività dello sviluppo di un sistema

Dettagli

Esercizio data base "Biblioteca"

Esercizio data base Biblioteca Rocco Sergi Esercizio data base "Biblioteca" Database 2: Biblioteca Testo dell esercizio Si vuole realizzare una base dati per la gestione di una biblioteca. La base dati conterrà tutte le informazioni

Dettagli

Business Intelligence Revorg. Roadmap. Revorg Business Intelligence. trasforma i dati operativi quotidiani in informazioni strategiche.

Business Intelligence Revorg. Roadmap. Revorg Business Intelligence. trasforma i dati operativi quotidiani in informazioni strategiche. soluzioni di business intelligence Revorg Business Intelligence Utilizza al meglio i dati aziendali per le tue decisioni di business Business Intelligence Revorg Roadmap Definizione degli obiettivi di

Dettagli

TECNICO SUPERIORE DEI TRASPORTI E DELL INTERMODALITÀ

TECNICO SUPERIORE DEI TRASPORTI E DELL INTERMODALITÀ ISTRUZIONE E FORMAZIONE TECNICA SUPERIORE SETTORE TRASPORTI TECNICO SUPERIORE DEI TRASPORTI E DELL INTERMODALITÀ STANDARD MINIMI DELLE COMPETENZE TECNICO PROFESSIONALI TECNICO SUPERIORE DEI TRASPORTI E

Dettagli

Database 1 biblioteca universitaria. Testo del quesito

Database 1 biblioteca universitaria. Testo del quesito Database 1 biblioteca universitaria Testo del quesito Una biblioteca universitaria acquista testi didattici su indicazione dei professori e cura il prestito dei testi agli studenti. La biblioteca vuole

Dettagli

ARCHIVIAZIONE DOCUMENTALE NEiTdoc

ARCHIVIAZIONE DOCUMENTALE NEiTdoc ARCHIVIAZIONE DOCUMENTALE NEiTdoc PROCESS & DOCUMENT MANAGEMENT La documentazione può essere definita un complesso di scritture prodotte da entità pubbliche o private nell espletamento della loro attività,

Dettagli

Lezione V. Aula Multimediale - sabato 29/03/2008

Lezione V. Aula Multimediale - sabato 29/03/2008 Lezione V Aula Multimediale - sabato 29/03/2008 LAB utilizzo di MS Access Definire gli archivi utilizzando le regole di derivazione e descrivere le caratteristiche di ciascun archivio ASSOCIAZIONE (1:1)

Dettagli

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi. Algoritmi 1 Sommario Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi. 2 Informatica Nome Informatica=informazione+automatica. Definizione Scienza che si occupa dell

Dettagli

Come archiviare i dati per le scienze sociali

Come archiviare i dati per le scienze sociali Come archiviare i dati per le scienze sociali ADPSS-SOCIODATA Archivio Dati e Programmi per le Scienze Sociali www.sociologiadip.unimib.it/sociodata E-mail: adpss.sociologia@unimib.it Tel.: 02 64487513

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

Automazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it

Automazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it Automazione Industriale (scheduling+mms) scheduling+mms adacher@dia.uniroma3.it Introduzione Sistemi e Modelli Lo studio e l analisi di sistemi tramite una rappresentazione astratta o una sua formalizzazione

Dettagli

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI) COMUNE DI RAVENNA Il sistema di valutazione delle posizioni del personale dirigente GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI) Ravenna, Settembre 2004 SCHEMA DI SINTESI PER LA

Dettagli

WorkFLow (Gestione del flusso pratiche)

WorkFLow (Gestione del flusso pratiche) WorkFLow (Gestione del flusso pratiche) Il workflow è l'automazione di una parte o dell'intero processo aziendale dove documenti, informazioni e compiti vengono passati da un partecipante ad un altro al

Dettagli

Capitolo 13. Interrogare una base di dati

Capitolo 13. Interrogare una base di dati Capitolo 13 Interrogare una base di dati Il database fisico La ridondanza è una cosa molto, molto, molto brutta Non si devono mai replicare informazioni scrivendole in più posti diversi nel database Per

Dettagli

Strutturazione logica dei dati: i file

Strutturazione logica dei dati: i file Strutturazione logica dei dati: i file Informazioni più complesse possono essere composte a partire da informazioni elementari Esempio di una banca: supponiamo di voler mantenere all'interno di un computer

Dettagli

Riconoscibilità dei siti pubblici: i domini della Pa e le regole di.gov.it

Riconoscibilità dei siti pubblici: i domini della Pa e le regole di.gov.it Riconoscibilità dei siti pubblici: i domini della Pa e le regole di.gov.it Gabriella Calderisi - DigitPA 2 dicembre 2010 Dicembre 2010 Dominio.gov.it Cos è un dominio? Se Internet è una grande città, i

Dettagli

Attività federale di marketing

Attività federale di marketing Attività federale di marketing Gestione e certificazione delle sponsorizzazioni Il Feedback Web Nel piano di sviluppo della propria attività di marketing, la FIS ha adottato il sistema Feedback Web realizzato

Dettagli

Integrazione dei processi aziendali Sistemi ERP e CRM. Alice Pavarani

Integrazione dei processi aziendali Sistemi ERP e CRM. Alice Pavarani Integrazione dei processi aziendali Sistemi ERP e CRM Alice Pavarani Un ERP rappresenta la maggiore espressione dell inseparabilità tra business ed information technology: è un mega-package di applicazioni

Dettagli

La Business Intelligence per la PA piemontese

La Business Intelligence per la PA piemontese La Business Intelligence per la PA piemontese GIULIANA BONELLO CSI PIEMONTE 0 Agenda Premessa Le basi dati della PA piemontese Le applicazioni di carattere decisionale della PA piemontese La piattaforma

Dettagli

Raggruppamenti Conti Movimenti

Raggruppamenti Conti Movimenti ESERCITAZIONE PIANO DEI CONTI Vogliamo creare un programma che ci permetta di gestire, in un DB, il Piano dei conti di un azienda. Nel corso della gestione d esercizio, si potranno registrare gli articoli

Dettagli

Indice. pagina 2 di 10

Indice. pagina 2 di 10 LEZIONE PROGETTAZIONE ORGANIZZATIVA DOTT.SSA ROSAMARIA D AMORE Indice PROGETTAZIONE ORGANIZZATIVA---------------------------------------------------------------------------------------- 3 LA STRUTTURA

Dettagli

Data Base Management System. Strumenti: Formato: Pro: Contro: Software specifico. Proprietario

Data Base Management System. Strumenti: Formato: Pro: Contro: Software specifico. Proprietario Data Base Management System Strumenti: Software specifico Formato: Pro: Proprietario Massima semplicità di inserimento e gestione Tipizzazione Validazione dei dati Contro: Creazione del database Programmazione

Dettagli

ƒ Gli standard e la gestione documentale

ƒ Gli standard e la gestione documentale 81267$1'$5' 3(5/$*(67,21('280(17$/( Giovanni Michetti SC11 Gestione dei documenti d archivio giovanni.michetti@uniroma1.it Strumenti per l informazione e la documentazione: le norme UNI (Roma, 18 giugno

Dettagli

Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale.

Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale. Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale. Il presente materiale didattico costituisce parte integrante del percorso formativo

Dettagli

Organizzazione e pianificazione delle attività di marketing

Organizzazione e pianificazione delle attività di marketing Organizzazione e pianificazione delle attività di marketing Il continuum delle strutture tra efficienza ed efficacia Struttura funzionale Struttura divisionale Struttura a matrice Struttura orizzontale

Dettagli

Strumenti di modellazione. Gabriella Trucco

Strumenti di modellazione. Gabriella Trucco Strumenti di modellazione Gabriella Trucco Linguaggio di modellazione Linguaggio formale che può essere utilizzato per descrivere (modellare) un sistema Il concetto trova applicazione soprattutto nell

Dettagli