Database Francesco Tapparo Informatica e Bioinformatica 2013-14 1/16
Trend attuali CPU sempre più potenti Memorie di massa di dimensioni sempre maggiori Eniac: 180m 2 Memoria: 20 numeri di 10 cifre, meno di 160 bytes Smartphone Memoria: 1GB Francesco Tapparo Informatica e Bioinformatica 2013-14 2/16
Gestione dei dati Il nuovo problema è la gestione dei dati Dati dei siti memorizzati da google: 850TB (dati non aggiornati) Come gestirli: accederci, cercarli, inserirne di nuovi, rimuoverli? Francesco Tapparo Informatica e Bioinformatica 2013-14 3/16
Archivi manuali Prima dell avvento dei computer, i dati erano salvati su supporti cartacei: quaderni, memorizzazione sequenziale dei dati. E riordinarli secondo criteri diversi da quello in cui sono stati scritti Ad esempio un quaderno di fatture, scritte secondo l ordine di emissione, riordinarle alfabeticamente. schedari, dove i dati sono organizzati in schede (ad esempio una scheda per ogni fattura) Francesco Tapparo Informatica e Bioinformatica 2013-14 4/16
Archivi Una scheda rappresenta una singola fattura e c'è una sola scheda per ogni fattura Però informazioni presenti su una scheda (attributi) possono essere ripetute Francesco Tapparo Informatica e Bioinformatica 2013-14 5/16
Archivi Un archivio deve essere specifico all ambito a cui fa riferimento, non può contenere tutto se si vuole costruire uno schedario clienti ad ogni cliente dovrà essere associata una scheda Ogni scheda dovrà contenere le informazioni, chiamate attributi, che costituiscono l elemento la scheda di una fattura potrà avere i seguenti attributi: data di emissione, ammontare, nome cliente, ecc... Francesco Tapparo Informatica e Bioinformatica 2013-14 6/16
Database Un database (base di dati) è l'equivalente software di un archivio Più formalmente, il termine database indica un archivio di dati riguardanti uno o più argomenti correlati tra loro e strutturato in modo da consentire la gestione dei dati stessi da parte di applicazioni software gestite da un elaboratore. Francesco Tapparo Informatica e Bioinformatica 2013-14 7/16
Database Nel gergo dei database si utilizzano i seguenti termini corrispondenti a quelli che abbiamo visto: Attributo = Campi Scheda = Record Archivio di Schede = Database I database sono salvati su memorie di massa, mentre gli archivi su supporti cartacei La gestione dei dati è gestita da programmi applicativi Francesco Tapparo Informatica e Bioinformatica 2013-14 8/16
Database Due tipi di database Flat file Database relazionali Flat file Francesco Tapparo Informatica e Bioinformatica 2013-14 9/16
Database flat file Quale è il separatore di campo? Quale è il separatore di record? Francesco Tapparo Informatica e Bioinformatica 2013-14 10/16
Database flat file Un flat file biologico può contenere migliaia o milioni di record. Si usano gli indici Francesco Tapparo Informatica e Bioinformatica 2013-14 11/16
Flat file: considerazioni Vantaggi molte banche dati biologiche lo usano per la consultazione Di semplice consultazione Svantaggi: Complicato aggiornare il database Se si aggiorna il db si devono ricreare tutti gli indici Francesco Tapparo Informatica e Bioinformatica 2013-14 12/16
Database relazionali Un Database Relazionale è un insieme di TABELLE (table), in origine chiamate relazioni, collegate logicamente l una con l altra. Una tabella di un DB relazionale è l equivalente di un flat-file. Si utilizzano più tabelle per evitare di duplicare i dati. Francesco Tapparo Informatica e Bioinformatica 2013-14 13/16
Database relazionali Francesco Tapparo Informatica e Bioinformatica 2013-14 14/16
Database relazionali I database relazionali necessitano di particolari programmi di gestione (Database Management System o DBMS) Il DBMS funge da interfaccia verso il database, in una tipica configurazione client-server. Il server è residente su un computer remoto, mentre i client sono in generale altri computer. Francesco Tapparo Informatica e Bioinformatica 2013-14 15/16
SQL SQL è uno standard molto diffuso per i DBMS Mysql Oracle Postgreql... Con SQL è possibile eseguire ricerche molto complesse, inserire, eliminare ed aggiornare record Francesco Tapparo Informatica e Bioinformatica 2013-14 16/16