FORME NORMALI E DIPENDENZE

Похожие документы

Attributi e domini. A per {A}; XY per X Y (pertanto A 1 A 2 A 3 denota

SISTEMI INFORMATIVI AVANZATI -2010/ Introduzione

Normalizzazione. Relazionali

Decomposizione senza perdita. Decomposizione senza perdita. Conservazione delle dipendenze. Conservazione delle dipendenze

Normalizzazione. Normalizzazione. Normalizzazione e modello ER. Esempio. Normalizzazione

Normalizzazione (Codd, 1972)

DIP. FUNZIONALI E FORME NORMALI esempi cfr. Albano Ghelli Orsini Basi di dati relazionali e a oggetti Zanichelli, 1997, cap.6 RIDONDANZE E ANOMALIE

BASI DI DATI DIPENDENZE FUNZIONALI E FORME NORMALI

LA NORMALIZZAZIONE. Introduzione

Organizzazione degli archivi

Il Modello Relazionale

b) Costruire direttamente le relazioni e poi correggere quelle che presentano anomalie

Lo schema concettuale risultante dalla progettazione concettuale è l input alla fase di progettazione logica.

(anno accademico )

Il linguaggio SQL: query innestate

Data Management Software. Il linguaggio SQL. Raggruppamenti. Paolo Avallone Sr Consulting IT Specialist DB2, Data Management Marzo 2004

Il modello relazionale dei dati e stato introdotto da Codd. nel 1970 (E.F. Codd, \A relational model of data for large

I database relazionali sono il tipo di database attualmente piu diffuso. I motivi di questo successo sono fondamentalmente due:

Basi di dati. Il Modello Relazionale dei Dati. K. Donno - Il Modello Relazionale dei Dati

Secondo Compitino di Basi di Dati

( x) ( x) 0. Equazioni irrazionali

Introduzione alla teoria dei database relazionali. Come progettare un database

NORMALIZZAZIONE DI SCHEMI RELAZIONALI. Prof.ssa Rosalba Giugno

Analisi dei Dati 12/13 Esercizi proposti 3 soluzioni

Basi di Dati e Sistemi Informativi. Progettazione logica: Il modello relazionale

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

Vincoli di integrità

MODELLO RELAZIONALE. Introduzione

Operazioni sui database

database: modello entityrelationship

Equilibrio bayesiano perfetto. Giochi di segnalazione

Lezione 2. Il modello entità relazione

Basi di dati I. Esercitazione proposta

Rappresentare i nessi logici con gli insiemi

4. Operazioni elementari per righe e colonne

Database. Si ringrazia Marco Bertini per le slides

u 1 u k che rappresenta formalmente la somma degli infiniti numeri (14.1), ordinati al crescere del loro indice. I numeri u k

Progettaz. e sviluppo Data Base

MODELLO RELAZIONALE. cesarini-bdsi mod relazionale 1 MODELLO RELAZIONALE

2) Codici univocamente decifrabili e codici a prefisso.

Università degli Studi di L Aquila. Facoltà di Ingegneria. Corso di Laurea in Ingegneria Elettronica Corso di Sistemi Informativi

Decomposizioni di uno schema, Decomposizioni che preservano i dati (loss-less joins) Prof.ssa Rosalba Giugno

1 Serie di Taylor di una funzione

Introduzione Ordini parziali e Reticoli Punti fissi

Il seguente esempio ha lo scopo di illustrare i 3 tipi di relazione 1:1,1:N,N:N. Tabella Conto: Tabella Conto:

Rappresentazione grafica di entità e attributi

Il Modello Relazionale

Basi di Dati. Progettazione del Modello ER. K. Donno - Progettazione del Modello ER

BASE DI DATI: sicurezza. Informatica febbraio ASA

Ottimizazione vincolata

La manutenzione come elemento di garanzia della sicurezza di macchine e impianti

Basi di Dati II. Qualità di schemi relazionali (2) Qualità di schemi relazionali. 1) Semantica degli attributi di una relazione

x u v(p(x, fx) q(u, v)), e poi

Capitolo 13: L offerta dell impresa e il surplus del produttore

Dimensione di uno Spazio vettoriale

Basi di Dati. Conversione Modello ER in Modello Relazionale. K. Donno - Conversione Modello ER in Modello Relazionale

Informatica 3. Informatica 3. LEZIONE 10: Introduzione agli algoritmi e alle strutture dati. Lezione 10 - Modulo 1. Importanza delle strutture dati

15 febbraio Soluzione esame di geometria - 12 crediti Ingegneria gestionale - a.a COGNOME... NOME... N. MATRICOLA...

Compito DA e BD. Tempo concesso: 90 minuti 12 giugno 03 Nome: Cognome: Matricola: Esercizio 1

Gestione dei servizi all utenza. 3. Autorizzazioni

Lezione 8. La macchina universale

Progettazione di Basi di Dati

UNIVERSITA DEGLI STUDI DI BRESCIA Facoltà di Ingegneria

Basi di dati. (Sistemi Informativi) teoria e pratica con Microsoft Access. Basi di dati. Basi di dati. Basi di dati e DBMS DBMS DBMS

BASI DI DATI - : I modelli di database

ARCHIVI E DATABASE (prof. Ivaldi Giuliano)

Basi di dati. Concetti introduttivi ESEMPIO. INSEGNAMENTI Fisica, Analisi, Aule. Docenti. Entità Relazioni Interrogazioni. Ultima modifica: 26/02/2007

Lezioni di Matematica 1 - I modulo

DBMS (Data Base Management System)

Capitolo 2 Distribuzioni di frequenza

Politecnico di Milano Facoltà di Ingegneria dell Informazione AGENTI AUTONOMI E SISTEMI MULTIAGENTE Appello COGNOME E NOME

5.3 TABELLE RECORD Inserire, eliminare record in una tabella Aggiungere record Eliminare record

I DATABASE Database relazionale

Progettazione concettuale

Corso di Sistemi di Gestione di Basi di Dati. Esercitazione sul controllo di concorrenza 12/02/2004

REGOLAMENTO (UE) N. 1235/2011 DELLA COMMISSIONE

TEORIA sulle BASI DI DATI

Sono casi particolari di MCF : SPT (cammini minimi) non vi sono vincoli di capacità superiore (solo x ij > 0) (i, j) A : c ij, costo di percorrenza

Generazione Automatica di Asserzioni da Modelli di Specifica

Elementi di Algebra Relazionale

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Laboratorio di Pedagogia Sperimentale. Indice

Albero semantico. Albero che mette in corrispondenza ogni formula con tutte le sue possibili interpretazioni.

F (x) = f(x) per ogni x I. Per esempio:

Il Modello Relazionale

Progettazione e realizzazione di un applicativo Web Annunci Immobiliari

COMMISSIONE DELLE COMUNITÀ EUROPEE PARERE DELLA COMMISSIONE

Automazione Industriale (scheduling+mms) scheduling+mms.

La norma ISO 9001:08 ha apportato modifiche alla normativa precedente in

CAPACITÀ DI PROCESSO (PROCESS CAPABILITY)

Archivi e Basi di Dati

Appunti sulla Macchina di Turing. Macchina di Turing

Esponenziali elogaritmi

Modello Relazionale. Modello Relazionale. Relazioni - Prodotto Cartesiano. Relazione: tre accezioni. Es. Dati gli insiemi

Транскрипт:

Sistemi Informativi: Forme Normali e Dipendenze FORME NORMALI E DIPENDENZE La teoria della normalizzazione e delle dipendenze ha come scopo principale quello di fornire gli strumenti teorici e pratici per progettare dei buoni schemi relazionali, ovvero: come combinare insieme degli attributi in uno schema; come combinare insieme piu schemi per formare uno schema del DB. Uno dei principali obiettivi che ci si propone è evitare i problemi legati all aggiornamento dei dati: Anomalie di modifica Anomalie di inserimento Anomalie di cancellazione e alla presenza di informazioni ridondanti.

Sistemi Informativi: Forme Normali e Dipendenze m Articolo Magazzino Quantità Indirizzo scarpe VR 1 25,000 v. Albere 17, Verona pantaloni VR 1 15,000 v. Albere 17, Verona scarpe BO 5,200 v. Agucchi 3, Bologna camicie VR 2 35,000 v. del Lavoro 4, Verona.... 1. Se un magazzino cambia indirizzo occorre modificare tutte le tuple relative a quel magazzino. 2. Se si inserisce un nuovo articolo in un magazzino occorre replicare l indirizzo del magazzino. 3. Non si può inserire l informazione relativa alla sede di un magazzino se non vi è almeno un articolo. 4. Se un magazzino si svuota, si perde l informazione sulla sua sede.

a su fa M Qg a = π AMQ (m) i su fm Ig i = π MI (m) Sistemi Informativi: Forme Normali e Dipendenze Soluzione: La relazione originaria si può ricostruire con un join: m su fa M Q Ig m = a 1 i

Sistemi Informativi: Forme Normali e Dipendenze i Imp cod Rep cod Nome imp Capo rep 1 1 Rossi Bianchi 2 1 Menconi Bianchi 3 2 Dell Amico Marchi.... 1. Se viene cambiato il capo di un reparto occorre modificare le tuple di tutti gli impiegati di quel reparto. 2. Se si inserisce un nuovo impiegato in un reparto già esistente occorre replicare il nome del capo. 3. Se si elimina l ultimo impiegato di un reparto, si perde l informazione sul capo.

r su fi R Ng r = π IRN (i) c su fr Cg c = π RC (i) Sistemi Informativi: Forme Normali e Dipendenze i si decompone in: i si riottiene con un join: i su fi R N Cg i = r 1 c

8t 1 t 2 2 r : t 1 [X ]=t 2 [X ] ) t 1 = t 2 : Sistemi Informativi: Forme Normali e Dipendenze Superchiavi e Chiavi Definizione 1 (Superchiave) Dato uno schema R e un insieme di attributi X R, X è una superchiave di R se e solo se, per ogni relazione legale r dello schema si ha: Definizione 2 (Chiave) Dato uno schema R e un insieme di attributi X R, X è una chiave di R se e solo se, per ogni relazione legale r dello schema si ha: 1. X è superchiave 2. @Y : Y X tale che Y sia superchiave. Esempio 1 Dato lo schema fimp cod Rep cod Nome imp Capo repg Imp cod è chiave (e quindi superchiave), fimp cod Rep codg è superchiave (ma non chiave).

Sistemi Informativi: Forme Normali e Dipendenze Osservazione 1 Il concetto di chiave è semantico: non si può dire che un insieme di attributi X è una chiave solo perchè le condizioni 1 e 2 sono soddisfatte in una specifica relazione. Dire che X è una chiave equivale ad imporre un vincolo sulle possibili relazioni dello schema: non possono esistere due tuple con lo stesso valore della chiave. Solo le relazioni che soddisfano questo vincolo sono dette legali. Spesso si parla di chiavi candidate in luogo di chiavi, per mettere in evidenza che, per motivi di collegamento tra gli schemi e di implementazione, occorre privilegiarne una, che viene detta chiave primaria.

8t 1 t 2 2 r : t 1 [X ]=t 2 [X ] ) t 1 [Y ]=t 2 [Y ] Sistemi Informativi: Forme Normali e Dipendenze Dipendenze Funzionali Le dipendenze funzionali (FD) sono state introdotte da Codd (1970) per poter caratterizzare i motivi che portano ad avere ridondanza ed anomalie di aggiornamento. Definizione 3 (Dipendenza funzionale) Dato uno schema S e due insiemi di attributi X Y S non necessariamente disgiunti, X determina funzionalmente Y, scritto X! Y,se e solo se le relazioni legali dello schema sono solo quelle per cui si ha: Esempio 2 Dato lo schema fimp cod Rep cod Nome imp Capo repg, si ha: Imp! cod Rep cod Imp! cod Nome imp Rep! cod Capo rep Teorema 1 Xè una superchiave di S se e solo se X! S.

Sistemi Informativi: Forme Normali e Dipendenze Osservazione 2 Se Y X allora si ha sicuramente X! Y (FD banali) Le forme normali definiscono particolari proprietà dello schema con riferimento alle FD su di esso definite. Fanno uso del concetto di attributo primo. Definizione 4 (Attributo primo) Un attributo A dello schema R è primo se e solo se fa parte di almeno una chiave di R. In caso contrario A è detto non-primo.

Sistemi Informativi: Forme Normali e Dipendenze 1 Seconda Forma Normale (2NF) La 2NF è rivolta ad eliminare le anomalie che si generano quando qualche attributo non-primo dipende funzionalmente solo da una parte di una chiave (dipendenza non completa o parziale). Esempio 3 Dato lo schema fa M Q Ig ( MAGAZZINI ), la dipendenza funzionale di I da AM non è completa, perchèsiham! I. Definizione 5 (Seconda forma normale) Uno schema R è in 2NF se ognuno dei suoi attributi non-primi è completamente dipendente da ognuna delle chiavi. Esempio 4 Lo schema fa M Q Ig non èin2nf.glischemifa M Qg fm Ig sono in 2NF.

Sistemi Informativi: Forme Normali e Dipendenze 1 Il riferimento ai soli attributi non-primi è essenziale. Esempio 5 Nello schema Stradario fvia Comune CAPg si ha: è chiave fvia CAPg! CAP Comune Tuttavia, fvia Comuneg è chiave, quindi Comune è primo. Dunque lo schema èin 2NF. Se le chiavi sono tutte composte da un solo attributo, allora lo schema è sicuramente in 2NF.

Rep cod! Capo rep: X! Y A 62 Y: Sistemi Informativi: Forme Normali e Dipendenze 1 Terza Forma Normale (3NF) Nello schema Impiegati fimp cod Rep cod Nome repg imp Capo si ha: Imp! cod Rep cod Imp! cod Nome imp Imp! cod Capo rep Lo schema èin2nf(lachiaveè Imp cod), ma vi sono ancora anomalie, dovute alle dipendenze transitive. Definizione 6 (Dipendenza transitiva) Dato lo schema S e X S, A 2 S, A è transitivamente dipendente da X se esiste Y S tale che: 6! Y X! Y A

fimp cod Rep cod Nome impg frep cod Capo repg Sistemi Informativi: Forme Normali e Dipendenze 1 Esempio 6 Nello schema fimp cod Rep cod Nome imp Capo repg, le condizioni della definizione sono verificate sostituendo Imp cod a X, Rep cod a Y, Capo rep a A. Dunque Capo rep dipende transitivamente da Imp cod. Definizione 7 (Terza forma normale) UnoschemaRè in 3NF se e solo se ognuno dei suoi attributi non-primi non dipende transitivamente da nessuna delle chiavi. Esempio 7 Gli schemi: sono in 3NF.

Sistemi Informativi: Forme Normali e Dipendenze 1 Osservazione 3 Benchè gli schemi in 3NF non siano esenti da problemi, tale livello di normalizzazione è spesso accettato come soddisfacente in pratica. Teorema 2 Se uno schema è in 3NF, allora è anche in 2NF. Dimostrazione: (Per assurdo.) Sia R in 3NF ma non in 2NF. Allora esistono X, Y e A in R, con X chiave, Y X e A non-primo non appartenente a Y,talicheY! A. Poichè X! Y (FD banale) e Y 6! X (altrimenti X non sarebbe chiave) si deriva che A è transitivamente dipendente da X, contraddicendo l ipotesi che lo schema fosse in 3NF. 2 Osservazione 4 Dato uno schema R e un insieme F di FD su R, stabilire se lo schema èin 3NF è un problema molto probabilmente non risolubile in tempo polinomiale, al pari di quello di stabilire se un attributo èprimo.

Sistemi Informativi: Forme Normali e Dipendenze 1 ALGORITMI DI NORMALIZZAZIONE Tutti gli algoritmi di normalizzazione mirano a produrre degli schemi che soddisfino certe proprietà (forme normali), operando una decomposizione degli attributi e delle relative dipendenze. Oltre al desiderato livello di normalizzazione, vi sono altri due requisiti che una decomposizione dovrebbe soddisfare: Preservare i dati. Una decomposizione che preserva i dati, detta anche senza perdita, garantisce che la relazione originaria è ottenibile attraverso join naturale delle relazioni ottenute dalla decomposizione Preservare le dipendenze. Una decomposizione che preserva le dipendenze garantisce che l unione delle dipendenze degli schemi ottenuti dalla decomposizione è equivalente all insieme di dipendenze definite sullo schema originario.

r = π R1 (r) 1 π R2 (r): Sistemi Informativi: Forme Normali e Dipendenze 1 Definizione 8 (Decomposizione senza perdita) Dato uno schema R consideriamo una sua decomposizione ρ = fr 1 R 2 g tale che R = R 1 [ R 2. Diciamo che ρ è senza perdita se e solo se, per ogni possibile r istanza di R, Pertanto r può essere ricostruita esattamente a partire dalle sue proiezioni.

Sistemi Informativi: Forme Normali e Dipendenze 1 Decomposizione per proiezione in 3NF: algoritmo intuitivo È possibile definire algoritmi formali per la decomposizione in 3NF, in molti casi è tuttavia possibile utilizzare un algoritmo di decomposizione, detto intuitivo, che opera come segue: Non 2NF. Sia R = fk 1 K 2 X Y g uno schema con chiave K 1 K 2 che non èin2nfacausa della FD K 1! X. Allora R può essere decomposto, senza perdita di informazione, nei due schemi R 1 = fk 1 Xg e R 2 = fk 1 K 2 Y g.

Sistemi Informativi: Forme Normali e Dipendenze 1 Non 3NF. Sia R = fk X Y Zg uno schema con chiave K che non èin3nfacausadella FD X! Y. Allora R può essere decomposto, senza perdita di informazione, nei due schemi fk X Zg e fx Y g. Viceversa, se la situazione è del tipo fk 1 K 2 X Y Zg, con chiave K 1 K 2, e vale la FD K 1 X! Y, allora si può decomporre negli schemi fk 1 K 2 X Zg e fk 1 X Y g. Esempio 8 fo S D Ag con OS! DA e OD! A. La dipendenza di A da OS è transitiva. Si generano quindi i due schemi fo S Dg e fo D Ag.