INTRODUZIONE A SQL Definizione di tabelle e domini Alcuni vincoli di integrità Struttura base SELECT FROM WHERE Funzioni di aggregazione (MIN, MAX, SUM, AVG, COUNT) Query da più tabelle (FROM R1, Rk) Join espliciti ( R1 JOIN R2 ON ( ) ) Join di una tabella con se stessa Raggruppamenti (GROUP BY, HAVING) Ordinamento (ORDER BY) Join naturale, join esterno (NATURAL JOIN, OUTER JOIN) Query e valori nulli cesarini-bdsi introduzione a SQL 1
STRUCTURED QUERY LANGUAGE SQL Chamberlin et al (IBM, San Josè) : SEQUEL, Structured English Query Language, 1974 Standard ANSI: SQL-86, SQL-89, SQL-92 (SQL-2), SQL-3 Linguaggio dichiarativo definizione dei dati (domini, tabelle base) query, inserimento, aggiornamento, cancellazione definizione e manipolazione di viste vincoli di integrità privilegi di accesso embedded SQL transazioni terminologia SQL: tabelle, righe, colonne, nomi di colonna cesarini-bdsi introduzione a SQL 2
DOMINIO dominio elementare (int, char, date,, LOB, link ipertestuale, ) dominio definito dall utente CREATE DOMAIN città AS CHAR(12) DEFAULT???? CONSTRAINT città_vinc CHECK (VALUE IN ( Firenze, Prato, Empoli )) città: nome del dominio CHAR(12) dominio elementare su cui è definito il dominio CITTA la stringa???? viene inserita dal sistema in assenza di diversa specifica città_vinc: nome del vincolo di integrità CHECK specifica il vincolo di integrità cesarini-bdsi introduzione a SQL 3
DEFINIZIONE DI TABELLE CREATE TABLE Fornitori ( f_cod CHAR(5) PRIMARY KEY, fisc CHAR(16) UNIQUE, f_nome CHAR(20) NOT NULL, città CHAR(15) DEFAULT sconosciuta ) CREATE TABLE Articoli ( a_cod CHAR(6) PRIMARY KEY, a_nome CHAR(20), colore CHAR(8), peso INT, luogo città) molti DBMS richiedono che i vincoli UNIQUE e PRIMARY KEY siano accompagnati da un esplicito NOT NULL cesarini-bdsi introduzione a SQL 4
DEFINIZIONE DI TABELLE CREATE TABLE Forniture ( f_cod CHAR(5), a_cod CHAR(6), quantità INT, PRIMARY KEY (f_cod, a_cod), FOREIGN KEY (f_cod) REFERENCES Fornitori(f_cod), FOREIGN KEY (a_cod) REFERENCES Articoli(a_cod)) vincolo di integrità referenziale: tabella interna (Forniture) tabella esterna (Fornitori o Articoli a seconda del vincolo considerato) cesarini-bdsi introduzione a SQL 5
CONTROLLI VINCOLO INT. REF. tabella interna: ogni inserimento o aggiornamento che viola il vincolo viene rifiutato non si può aggiungere a Forniture una tupla con un valore per f_cod che non compare in Fornitori tabella esterna: per ogni cancellazione o aggiornamento che viola il vincolo si può avere: no action (specifica di default): l operazione viene rifiutata cascade: l operazione viene propagata set null: l operazione viene effettuata e sulla tabella interna i valori corrispondenti vengono posti a NULL set default: l operazione viene effettuata e sulla tabella interna i valori corrispondenti vengono posti a DEFAULT cesarini-bdsi introduzione a SQL 6
VINCOLO INTEGRITA REF esempio CREATE TABLE Impiegato ( codice CHAR(6) PRIMARY KEY, nome CHAR(20), cognome CHAR(20), stipendio INT, ufficio CHAR(10), FOREIGN KEY (ufficio) REFERENCES Uffici(nome_ufficio) ON DELETE SET NULL ON UPDATE CASCADE) nome_ufficio deve essere chiave primaria per Uffici cesarini-bdsi introduzione a SQL 7
VINCOLI INTEGRITA esempio Supposto di avere già creato le tabelle STUD (matr, nome, cognome, indirizzo, data_nascita, laurea) CORSO (codice, corso_laurea, nome_c, crediti) Si definisce la tabella ESAME (stud, corso, data, voto, lode) CREATE TABLE Esame ( stud CHAR(7) NOT NULL, corso CHAR (10) NOT NULL, voto INT NOT NULL CHECK (voto BETWEEN 18 AND 30), data DATE, lode CHAR(1) NOT NULL CHECK (lode IN ( s, n )) CHECK ((lode = n ) OR (voto = 30)), PRIMARY KEY (stud, corso), FOREIGN KEY (stud) REFERENCES Stud (matr), FOREIGN KEY (corso) REFERENCES Corso (codice)) cesarini-bdsi introduzione a SQL 8
VINCOLO INTEGRITA REFERENZIALE i cicli Difficoltà del trattamento dei cicli presenti nella definizione dei vincoli di integrità referenziale Se si definisce un vincolo fra S e R, e un altro fra R e S non è possibile fare un inserimento né in R né in S Gli inserimenti devono essere fatti all interno di transazioni, specificando che i controlli siano fatti al termine della transazione Caso particolare di ciclo: tabella autoreferenziale CREATE TABLE Impiegato ( cod_imp CHAR(10) NOT NULL, cod_manager CHAR(10), PRIMARY KEY (cod_imp), FOREIGN KEY (cod_manager) REFERENCES Impiegato (cod_imp)) cesarini-bdsi introduzione a SQL 9
QUERY SELECT stud, corso FROM Esame WHERE voto>27 AND data>31/12/02 SELECT matr, nome, cognome FROM Stud WHERE laurea= informatica SELECT data, voto FROM Esame WHERE corso= 12345 SELECT DISTINCT data, voto FROM Esame WHERE corso= 12345 SELECT DISTINCT a 1, a k FROM R π a1, ak σ cond R WHERE cond cesarini-bdsi introduzione a SQL 10
QUERY SELECT * tutti gli attributi di Stud FROM Stud WHERE Stud.data_nascita < 1/1/1980 SELECT * FROM Stud SELECT * FROM Stud ORDER BY Stud.laurea SELECT Corso.codice, Corso.nome_c, Corso.crediti FROM Corso WHERE Corso.corso_laurea = informatica cesarini-bdsi introduzione a SQL 11
Condizioni nella clausola WHERE OR, AND, NOT su predicati semplici Predicati semplici =, <>, <, >, <=, >= IS NULL, IS NOT NULL IN (val 1, val 2, val k ) BETWEEN val 1 AND val 2 LIKE pattern pattern: abc stringa % sequenza di zero o più caratteri qualsiasi _ un carattere qualsiasi cesarini-bdsi introduzione a SQL 12
QUERY con LIKE SELECT Corso.codice, Corso.nome_c Corso.nome_c potrebbe essere omesso FROM Corso WHERE Corso.nome_c = informatica è equivalente a SELECT Corso.codice, Corso.nome_c FROM Corso WHERE Corso.nome_c LIKE informatica SELECT Corso.codice, Corso.nome_c FROM Corso WHERE Corso.nome_c = fondamenti di informatica SELECT Corso.codice, Corso.nome_c FROM Corso WHERE Corso.nome_c LIKE %informatica% cesarini-bdsi introduzione a SQL 13
FUNZIONI DI AGGREGAZIONE numero dei corsi, numero delle righe in Corso, cardinalità di Corso SELECT COUNT(*) FROM Corso numero di esami superati con lode SELECT COUNT(*) FROM Esame WHERE Esame.lode = s numero di studenti che hanno dato almeno un esame SELECT COUNT (DISTINCT Esame.stud) FROM Esame Possibilità prevista dallo standard SQL, verificare sul sistema in oggetto ACCESS non la accetta cesarini-bdsi introduzione a SQL 14
FUNZIONI DI AGGREGAZIONE il valore medio di crediti dei corsi in Corso SELECT AVG (Corso.crediti) FROM Corso il valore medio di crediti dei corsi del corso di laurea di informatica SELECT AVG(Corso.crediti) FROM Corso WHERE Corso.corso_laurea = informatica la data di nascita dello studente più giovane (il risultato è una unica data di nascita se ci sono più studenti nati quel giorno) SELECT MAX(Stud.data_nascita) FROM Stud SELECT MAX(Stud.data_nascita) FROM Stud WHERE Stud.laurea = matematica cesarini-bdsi introduzione a SQL 15
FUNZIONI DI AGGREGAZIONE la prima e l ultima data di esami del corso di codice 123 SELECT MIN(Esame.data), MAX(Esame.data) FROM Esame WHERE Esame.corso = 123 Il totale dei crediti dei corsi del corso di laurea in informatica SELECT SUM(Corso.crediti) FROM Corso WHERE Corso.corso_laurea = informatica cesarini-bdsi introduzione a SQL 16
QUERY DA PIU TABELLE SELECT Stud.matr, Stud.nome, Stud.cognome, Esame.corso, Esame.voto FROM Stud, Esame WHERE Stud.matr = Esame.stud AND Esame.voto>24 è equivalente a SELECT S.matr, S.nome, S.cognome, E.corso, E.voto FROM Stud AS S, Esame AS E WHERE S.matr = E.stud AND E.voto > 24 π S.matr, S.nome, S.cognome, E.corso, E.voto σ S.matr=E.stud AND E.voto>24 (S E) cesarini-bdsi introduzione a SQL 17
QUERY DA PIU TABELLE Il numero di matricola degli studenti che hanno dato l esame del corso di codice 123 SELECT Esame.stud FROM Esame WHERE Esame.corso = 123 Il numero di matricola, il nome e il cognome degli studenti che hanno dato l esame del corso di codice 123 SELECT Stud.matr, Stud.nome, Stud.cognome FROM Stud, Esame WHERE Stud.matr = Esame.stud AND Esame.corso = 123 Il numero di matricola, il nome e il cognome degli studenti che hanno dato l esame del corso di nome basi di dati SELECT Stud.matr, Stud.nome, Stud.cognome FROM Stud, Esame, Corso WHERE Stud.matr = Esame.stud AND Esame.corso = Corso.codice AND Corso.nome_c = basi di dati cesarini-bdsi introduzione a SQL 18
QUERY DA PIU TABELLE (join esplicito) Il numero di matricola, il nome e il cognome degli studenti che hanno dato l esame del corso di codice 123 SELECT Stud.matr, Stud.nome, Stud.cognome FROM Stud INNER JOIN Esame ON (Stud.matr = Esame.stud) WHERE Esame.corso = 123 Il numero di matricola, il nome e il cognome degli studenti che hanno dato l esame del corso di nome basi di dati SELECT Stud.matr, Stud.nome, Stud.cognome FROM Stud INNER JOIN Esame ON (Stud.matr = Esame.stud) INNER JOIN Corso ON (Esame.corso = Corso.codice) WHERE Corso.nome_c = basi di dati La parola INNER può essere omessa cesarini-bdsi introduzione a SQL 19
QUERY DA PIU TABELLE Cognome, nome e matricola degli studenti che hanno preso almeno un 30, ordinati per cognome SELECT DISTINCT Stud.cognome, Stud.nome, Stud.matr FROM Stud, Esame WHERE Stud.matr = Esame.stud AND Esame.voto = 30 ORDER BY Stud.cognome di tutti i corsi con numero di crediti maggiore o uguale a 4, si vuole il codice e il nome di quelli per cui sono stati dati esami nel mese di giugno 2003 SELECT DISTINCT Corso.codice, Corso.nome_c FROM Corso JOIN Esame ON (Corso.codice = Esame.corso) WHERE Corso.crediti >= 4 AND Esame.data BETWEEN 1/6/03 AND 30/6/03 cesarini-bdsi introduzione a SQL 20
JOIN di una tabella con se stessa Impiegato ( codice, nome, stipendio, manager) dom(manager) = dom(codice) i manager sono a loro volta catalogati in Impiegato Si vuole l elenco degli impiegati (codice e nome) che guadagnano più del loro manager SELECT A.codice, A.nome FROM Impiegato AS A, Impiegato AS B WHERE A.manager = B.codice AND A.stipendio >B.stipendio cesarini-bdsi introduzione a SQL 21
RAGGRUPPAMENTI Si vuole la stampa di tutti i diversi corsi di laurea che appaiono in Stud SELECT DISTINCT Stud.laurea FROM Stud Query alternativa: si suddivide Stud in sottotabelle raggruppando le righe che hanno valori uguali in Stud.laurea, di queste sottotabelle si stampa il valore di Stud.laurea utilizzo poco interessante del GROUP BY SELECT Stud.laurea FROM Stud GROUP BY Stud.laurea Si vuole l elenco dei corsi di laurea, ciascuno accompagnato dal numero di studenti iscritti SELECT Stud.laurea, COUNT (*) FROM Stud GROUP BY Stud.laurea la funzione di aggregazione viene applicata ad ogni sottotabella cesarini-bdsi introduzione a SQL 22
RAGGRUPPAMENTI Si può ridenominare la colonna che viene stampata SELECT Stud.laurea AS corso_di_laurea, COUNT (*) AS numero_studenti FROM Stud GROUP BY Stud.laurea ORDER BY Stud.laurea SELECT Esame.stud, MAX(Esame.voto) AS massimo_voto_riportato FROM Esame GROUP BY Esame.stud SELECT Esame.stud AS studenti_che_ hanno_preso_almeno_un_30, COUNT(*) AS numero_di_30_ottenuti FROM Esame WHERE Esame.voto = 30 GROUP BY Esame.stud ORDER BY Esame.stud cesarini-bdsi introduzione a SQL 23
RAGGRUPPAMENTI Elenco degli studenti (numero di matricola) di informatica che hanno dato almeno un esame, ciascuno accompagnato dalla media dei voti che ha preso SELECT Esame.stud AS studenti_di_informatica, AVG(Esame.voto) AS voto_medio FROM Esame JOIN Stud ON (Esame.stud = Stud.matr) WHERE Stud.laurea = informatica GROUP BY Esame.stud query errata: nella SELECT compare la stampa di attributi che non sono nel GROUP BY SELECT Stud.matr, Stud.nome, Stud.cognome, AVG(Esame.voto) AS voto_medio FROM Esame JOIN Stud ON (Esame.stud = Stud.matr) WHERE Stud.laurea = informatica GROUP BY Stud.matr cesarini-bdsi introduzione a SQL 24
RAGGRUPPAMENTI SELECT Stud.matr, Stud.nome, Stud.cognome, AVG(Esame.voto) AS voto_medio FROM Esame JOIN Stud ON (Esame.stud = Stud.matr) WHERE Stud.laurea = informatica GROUP BY Stud.matr, Stud.nome, Stud.cognome Elenco degli studenti (numero di matricola) di informatica che hanno dato almeno tre esami, ciascuno accompagnato dalla media dei voti che ha preso SELECT Esame.stud AS studenti_di_informatica, AVG(Esame.voto) AS voto_medio FROM Esame JOIN Stud ON (Esame.stud = Stud.matr) WHERE Stud.laurea = informatica GROUP BY Esame.stud HAVING COUNT(*)>2 di tutti i gruppi vengono considerati solo quelli con più di due righe cesarini-bdsi introduzione a SQL 25
RAGGRUPPAMENTI SELECT Esame.stud, AVG(Esame.voto) FROM Esame GROUP BY Esame.stud HAVING AVG(Esame.voto)>=22 ORDER BY 2 ordina secondo la seconda espressione nella SELECT query errata: gli attributi in HAVING devono essere in funzioni aggregate o nella GROUP BY SELECT Esame.stud, MIN(Esame.voto) FROM Esame GROUP BY Esame.stud HAVING Esame.data > 31/5/2003 SELECT Esame.stud, MIN(Esame.voto) FROM Esame WHERE Esame.data > 31/5/2003 GROUP BY Esame.stud cesarini-bdsi introduzione a SQL 26
JOIN NATURALE STUD (matr, nome, cognome, indirizzo, data_nascita, laurea) ESAME (matr, corso, data, voto, lode) ESAME.matr ref STUD.matr SELECT DISTINCT Stud.matr, Stud.nome, Stud.cognome FROM Stud NATURAL JOIN Esame attributi di nome uguale (matr) WHERE Stud.laurea = informatica AND Esame.lode = s è equivalente a SELECT DISTINCT Stud.matr, Stud.nome, Stud.cognome FROM Stud JOIN Esame ON (Stud.matr = Esame.matr) WHERE Stud.laurea = informatica AND Esame.lode = s però nel risultato intermedio compare due volte la colonna matr cesarini-bdsi introduzione a SQL 27
JOIN ESTERNO STUD (matr, nome, cognome, indirizzo, data_nascita, laurea) ESAME (matr, corso, data, voto, lode) CORSO (codice, corso_laurea, nome_c, crediti) ESAME.matr ref STUD.matr ESAME.corso ref CORSO.codice SELECT Stud.matr, Stud.laurea, Esame.corso, Esame.data FROM Stud NATURAL LEFT OUTER JOIN Esame degli studenti che non hanno fatto esami (Stud.matr non contribuisce al join naturale) viene stampata una riga con matricola e corso di laurea associati a valori nulli per corso e data la parola OUTER può essere omessa SELECT Stud.matr, Stud.laurea, Esame.corso, Esame.data FROM Stud NATURAL LEFT JOIN Esame cesarini-bdsi introduzione a SQL 28
JOIN ESTERNO STUD (matr, nome, cognome, indirizzo, data_nascita, laurea) ESAME (matr, corso, data, voto, lode) CORSO (codice, corso_laurea, nome_c, crediti) ESAME.matr ref STUD.matr ESAME.corso ref CORSO.codice In SQL tutti i tipi di join possono essere OUTER SELECT Corso.codice, Corso.laurea, Esame.matr, Esame.voto FROM Corso LEFT JOIN Esame ON (Corso.codice = Esame.corso) RIGHT OUTER JOIN - FULL OUTER JOIN SELECT Esame.matr, Esame.voto, Corso.codice, Corso.laurea FROM Esame RIGHT JOIN Corso ON (Corso.codice = Esame.corso) cesarini-bdsi introduzione a SQL 29
QUERY / VALORI NULLI SELECT * FROM Articoli WHERE città= Prato OR città IS NULL SQL92: operatori applicati a valori nulli: sconosciuto logica a tre valori la SELECT restituisce solo le righe per cui la condizione è vera le funzioni di aggregazione ignorano i NULL ad eccezione di COUNT(*) cesarini-bdsi introduzione a SQL 30
QUERY / VALORI NULLI LAUREA = stud data voto Rossi 10/4/01 106 Verdi 10/4/01 NULL Bianchi 15/10/01 98 SELECT * FROM Laurea WHERE voto <100 UNION SELECT * FROM Laurea Where voto >= 100 SELECT * FROM Laurea WHERE voto <100 UNION SELECT * FROM Laurea Where voto >= 100 UNION SELECT * FROM Laurea WHERE voto IS NULL stud data voto Rossi 10/4/01 106 Bian chi 15/10/01 98 stud data voto Rossi 10/4/01 106 Bianchi 15/10/01 98 Verdi 10/4/01 NULL cesarini-bdsi introduzione a SQL 31
QUERY / VALORI NULLI Articolo (a-cod, a-nome, colore, peso, luogo) SELECT SUM(peso) / COUNT(*) FROM Articolo SELECT AVG(peso) FROM Articolo Se peso può avere valori nulli, le due query possono dare risultati diversi: i valori nulli non vengono inclusi nel calcolo delle funzioni SELECT colore FROM Articolo GROUP BY colore Se colore ha valori nulli, viene fatto un unico gruppo colore NULL rosso blu cesarini-bdsi introduzione a SQL 32
QUERY / VALORI NULLI DISTINCT due righe [v1 vk] e [w1 wk] sono uguali se vi = wi i oppure vi e wi sono entrambi nulli Articoli = a-cod a-nome colore peso luogo x penna rosso NULL Empoli y penna blu 10 Empoli z lapis NULL NULL Firenze w gomma NULL NULL Prato u lapis blu 10 Prato SELECT DISTINCT colore, peso FROM Articoli SELECT colore, peso FROM Articoli colore peso colore peso rosso NULL rosso NULL blu 10 blu 10 NULL NULL NULL NULL NULL NULL blu 10 cesarini-bdsi introduzione a SQL 33
Articoli = a-cod QUERY / VALORI NULLI prove fatte con DB2 a-nome colore peso luogo x penna rosso NULL Empoli y penna blu 10 Empoli z lapis NULL NULL Firenze w gomma NULL NULL Prato u lapis blu 10 Prato SELECT COUNT (*) FROM Articoli 5 SELECT COUNT (*) FROM Articoli WHERE colore IS NULL AND peso IS NULL 2 SELECT COUNT (colore) FROM Articoli 3 SELECT COUNT (DISTINCT colore) FROM Articoli 2 SELECT COUNT (DISTINCT peso) FROM Articoli 1 cesarini-bdsi introduzione a SQL 34
QUERY / VALORI NULLI C.J. Date, H. Darwen A Guide to THE SQL STANDARD third edition, Addison Wesley, 1994 CHAPTER 16 / Missing Information and Nulls 16.6 A Recommendation Avoid nulls. cesarini-bdsi introduzione a SQL 35