L importanza dei DATI in un GIS All interno di un GIS, i dati sono una risorsa cruciale. Inoltre bisogna tenere presente che i dati di tipo geografico sono costosi da acquisire archiviare manipolare anche perché solitamente occorrono grandi volumi di dati per risolvere problemi geografici di tipo sostanziale. Qualità dei dati - Metadati 1
L importanza dei DATI in un GIS Stime dei costi di acquisizione dei dati per GIS: più del doppio del costo di hardware e software, oppure 70% del costo totale di implementazione di un intero GIS (altra stima). Ciò significa che quando si acquisiscono dati per un GIS è fondamentale verificare che essi rispondano ai requisiti richiesti per la base di dati che si intende organizzare. Si deve cioè verificare qual è la qualità dei dati. Qualità dei dati - Metadati 2
QUALITA DEI DATI Parametri usati per valutarla DEFINIZIONE DI QUALITA DEI DATI: fitness for use idoneità all uso (previsto dall utente) ACCURATEZZA PRECISIONE RISOLUZIONE (spaziale) SCALA CONSISTENZA LOGICA COMPLETEZZA Lo US Standard for Digital Cartographic Data Quality propone come categorie soggette a verifica le seguenti: accuratezza delle posizioni accuratezza degli attributi consistenza logica completezza Qualità dei dati - Metadati 3
ACCURATEZZA E la discrepanza fra il valore registrato nella base di dati e il valore vero (per quanto lo si può conoscere) o accettato come tale. La valutazione dell accuratezza di una osservazione (misura) può essere fatta solo per confronto con la misura più accurata che sarebbe possibile ottenere. L accuratezza (e quindi la conoscenza fornita da una misura) si distingue in: accuratezza nelle posizioni accuratezza negli attributi e dipende dalla scala usata per la misura. s. per intervalli o s. per rapporti: le misure sono di tipo numerico e comportano incertezze numeriche >>> ERRORI e modellizzazione degli errori s. nominale e s. ordinale (si tratta solitamente di classificazioni, es. tipi di suolo o di vegetazione): la misura comporta la definizione di appartenenza a una categoria (classe) >>> MATRICE DELL ERRORE DI CLASSIFICAZIONE Qualità dei dati - Metadati 4
ERRORI nelle posizioni Incertezze numeriche Gli errori numerici, per dati di tipo numerico (essenzialmente, dati di posizione), sono indicatori dell accuratezza. L errore va visto come un concetto di tipo statistico, il che richiede che sia nota la natura del procedimento di misura (esperimenti con numerose ripetizioni delle misure). ESEMPIO: se si sa che il procedimento di misura è tale da dar luogo ad osservazioni distribuite secondo una curva normale (gaussiana), il valore più probabile è rappresentato dalla media e la dispersione dei dati attorno alla media è indicata da σ (scarto quadratico medio). Qualità dei dati - Metadati 5
Errori negli attributi MATRICE DELL ERRORE DI CLASSIFICAZIONE Per i dati di tipo non numerico (di solito, classificazioni) si possono valutare gli errori tramite la matrice dell errore di classificazione: si registra il numero di campioni osservati al suolo come appartenenti a una certa classe, interpretati come appartenenti a determinate classi. I campioni interpretati correttamente risultano sulla diagonale della matrice. E così possibile valutare: errore di omissione (percentuale di una certa categoria che non è stato classificato come tale); errore di commissione (percentuale che è stata classificata in una certa categoria, ma in realtà non è stata verificata essere tale). Qualità dei dati - Metadati 6
Esempio di MATRICE DELL ERRORE DI CLASSIFICAZIONE Percentuale di terreno erboso interpretato correttamente: p = 300/600 = 50% totali dei valori osservati al suolo dati interpretati in modo corretto valori interpretati nelle diverse classi Qualità dei dati - Metadati 7
PRECISIONE E il grado di dettaglio con cui si registra un valore (per esempio, se si tratta di dati numerici è il numero di cifre significative). ATTENZIONE: per quanto riguarda i valori numerici, se si sa che un certo valore non può essere più accurato di 0.1 mm, non ha alcun significato registrare tale valore in mm con più di una cifra decimale. Qualità dei dati - Metadati 8
RISOLUZIONE spaziale Questo parametro indica la più piccola differenza distinguibile fra due valori misurabili. Su una carta (leggibile dall occhio umano) è il minimo spessore di una linea (raramente inferiore a 0.1 mm). Su un plotter la risoluzione più fine è determinata teoricamente dalla separazione fra i pixel: stampante laser: 0.08 mm; plotter laser (alta qualità): 0.008 mm (non visibile ad occhio nudo). Qualità dei dati - Metadati 9
RISOLUZIONE Esistono altri due tipi di RISOLUZIONE: risoluzione temporale risoluzione tematica legati al grado di dettaglio temporale e con cui si registrano i dati. tematico Qualità dei dati - Metadati 10
SCALA In assenza di altri dati sull accuratezza, la scala può essere un parametro interessante. Infatti la scala di una carta contiene implicitamente informazioni sulla risoluzione spaziale (precisione) e sull accuratezza. Scala Risoluzione Accuratezza (precisione) 1:1000000 500 m 1000 m 1:500000 250 m 500 m 1:250000 125 m 250 m 1:100000 50 m 100 m 1:50000 25 m 50 m 1:10000 5 m 10 m La linea più sottile che è possibile disegnare su una carta rappresenta un limite alla risoluzione raggiungibile a una determinata scala. Alla scala 1:10000 una linea di spessore 0.5 mm rappresenta 5 m al suolo: nessun oggetto di dimensioni inferiori può essere registrato. Qualità dei dati - Metadati 11
SCALA Inoltre la scala di una carta è legata alle operazioni di generalizzazione che si devono eseguire per realizzarla. Concetto di generalizzazione Le informazioni e la loro simbolizzazione sono selezionate e modificate in modo da adattarsi alla scala prescelta. Qualità dei dati - Metadati 12
CONSISTENZA LOGICA fra i dati La consistenza logica si riferisce al fatto che non ci siano dati in contraddizione fra di loro. TEST di consistenza logica: controllo degli eventuali vincoli matematici o logici (relazioni matematiche o logiche fra i dati) test sulla topologia, per individuare ad esempio bordi mancanti poligoni non etichettati Qualità dei dati - Metadati 13
COMPLETEZZA E un parametro relativo alla mancanza di errori di omissione all interno della base di dati, e si riferisce ai criteri usati per selezionare le informazioni da inserire fra i dati. La valutazione della completezza dei dati si basa su: verifiche relative all inclusione fra i dati di oggetti appartenenti a liste note; verifiche relative all inclusione fra i dati di oggetti di dimensioni (area o spessore) minime. Qualità dei dati - Metadati 14
COSTO del mantenimento della qualità dei dati La stima del costo annuale del mantenimento della qualità di una base di dati è: ATTENZIONE! C m = 10 % C a C C m a = = costo mantenimento costo acquisizione Qualità dei dati - Metadati 15
Evoluzione della qualità dei dati in funzione del TEMPO nessun tipo di manutenzione manutenzione periodica Qualità dei dati - Metadati 16
Il problema del TRASFERIMENTO DATI Quando si esegue un trasferimento di dati geografici, vanno rispettati due requisiti: 1 Occorre formattare i dati in modo standardizzato e riconoscibile STANDARD di TRASFERIMENTO DATI 2 Occorre fornire informazioni sufficienti perché l utente possa giudicare se i dati gli sono davvero utili per i suoi scopi e hanno la qualità che li rende tali uso dei METADATI (i metadati sono descritti all interno dello standard di trasferimento) Qualità dei dati - Metadati 17
I METADATI I metadati sono un insieme strutturato di informazioni digitali relative a una determinata base di dati e preparato da chi ha creato la base di dati. Scopi per cui sono creati i metadati: consentire agli utilizzatori della base di dati di valutare l utilità dell informazione a disposizione per l applicazione di loro interesse; fornire l opportuna documentazione nel caso di trasferimento di dati: in effetti, molti standard di trasferimento per dati spaziali richiedono elementi contenuti nei metadati; servire come documentazione interna (eventualmente disponibile on line ), per registrare la provenienza e la catena di processamento dei dati. Qualità dei dati - Metadati 18
Identificazione dei dati Descrizione concisa dell insieme dei dati Responsabile dei dati ( contatto ) Chi contattare per ottenere i dati Condizioni di trasferimento dei dati Come possono essere acquisiti i dati Stato dei dati Grado di completezza o disponibilità dei dati Provenienza dei dati Origine dell insieme di dati Rappresentazione cartografica usata Sistema di riferimento e sistema di rappresentazione cartografica Riferimento dei metadati Informazioni specifiche sui metadati Processamento dei dati Operazioni eseguite sui dati Qualità dei dati Contenuto informativo dei metadati Parametri per la valutazione della qualità dei dati Lista di elementi e attributi Descrizione esplicita dell informazione contenuta nei dati Qualità dei dati - Metadati 19
Contenuto informativo dei metadati Identificazione dei dati Identification information Data set identity Identification code Theme keywords Use restrictions Access restrictions Spatial data structure Data set description Bounding coordinates Geographic keywords Browse graphic Contact information and content for metadata. Hydrologic unit map, intermediate scale Not applicable Hydrology, basin, hydrologic unit, watershed None, public domain None Vector Hydrologic units as defined by the federal government, collected and digitized at 1:250,000 scale with 1:100,000 scale insets in several western states. Hydrologic units have been appended into a single data set that comprises the conterminous 48 states, removing map edges in the process. Polygon and boundary attributes are present for site analysis and basin boundary symbolization. 21.4346, -126.0221 49.23, -67.000 NAS Conterminous United States None Qualità dei dati - Metadati 20
Contenuto informativo dei metadati Browse graphic Contact information Contact type Contact organization Contact person Contact mailing address Contact telephone Contact fax number Contact electronic mail Contact instructions Contact liability Transfer information Transfer format Transfer mode Transfer size Transfer instructions Fees Status information Data set status Release date Maintenance and update frequency Source information Custodian U.S. Geological Survey, Water Resources Division Ms. Jane Doe 444 National Center, Reston, VA 22092 (703) 555-1212 (703) 555-1234 jdoe@usgs.gov Contact for technical information via e-mail or regular mail Data are in public domain. Custodian does not assume any liability. DLG-3 Optional Online/offline 40 MB Data are available through WAIS software and anonymous ftp from Internet site 130.11.51.171. Tape requests are filled at cost of duplication. Fees range from $50 to $500 depending on tape format and media. Contact for detailed pricing. Available 19921001 As needed Responsabile dei dati ( contatto ) Condizioni di trasferimento dei dati Stato dei dati Qualità dei dati - Metadati 21
Contenuto informativo dei metadati Maintenance and update frequency Source information Source descriptor Source citation Source data resolution Coordinate system information Horizontal coord. System Coordinate type Coordinate units Origin latitude Origin longitude Latitude of standard parallel one Latitude of standard parallel two False easting False northing Central azimuth Central scale factor Datum name Ellipsoid name Ellipsoid semimajor axis Ellipsoid reciprocal flattening Vertical coord. System Vertical coordinate type Vertical datum name Vertical datum type Metadata reference information As needed Land use and land cover digital data from 1:250,000 and 1:100,000 scale maps GIRAS series data from USGS National Mapping Division. U.S. Geological Survey, 1990, land use and land cover digital data from 1:250,000 and 1:100,000 scale maps, data users guide 4. U.S. Geological Survey, 1982, codes for the identification of hydrologic units in the United States and the Caribbean outlying areas: U.S. Geological Survey Circular 878-A. 10 m. Albers equal-area conic Map projection Meters Not applicable -96.0 29.5 45.5 not applicable Not applicable Not applicable Not applicable North American Datum 1927 Clarke 1866 6378206.4 294.9786982 Not applicable Not applicable Not applicable Not applicable Provenienza dei dati Rappresentazione cartografica usata Qualità dei dati - Metadati 22
Contenuto informativo dei metadati Vertical datum type Metadata reference information Metadata date Metadata contact Processing history information Process used Process parameters Process date Not applicable 19930105 Jane Doe, U.S. Geological Survey Riferimento dei metadati Processamento dei dati Original materials were USGS/NMD quadrangle based digital files in the UTM projection. These files were processed as follows: 1. Performed an affine transformation between the internal map coordinates (to nearest 10 meters) and true UTM coordinates for each quadrangle. 2. Eliminated bounding neatline from each quadrangle and replaced with geometrically correct neatline. Extended undershoots to intersect new neatline using 500 metr maximum extension. Clipped overshoots to neatline. 3. Reestablished topology of polygon and line features using 2 meter feature feature tolerance, clipped all overshoot features. 4. Joined all quadrangle data sets together, preserving line and polygon features and attribution. 5. Removed map edge lines where hydrologic unit identities (HUC) were the same on either side of a line. See process description. 19920801 Qualità dei dati - Metadati 23
Contenuto informativo dei metadati Process date Data quality information Horizontal positional accuracy Horizontal posit. accur. Explanation Vertical positional accuracy Vertical posit. accur. Explanation Thematic accuracy Thematic accuracy explanation Logical consistency Completeness Feature/attribute information Feature label Feature definition Feature definition source Attribute label Attribute definition Attribute definition source Attribute feature association Attribute domain value +/- 150 meters Deductive estimate, map materials at 1:250,000 scale do not comply with National Map Accuracy Standards. Not applicable. Not applicable. Greater than 90 % Value derived from comparison with 1:2M scale source values. Data set is verified topologically-structured polygon and line data with nodes at all intersections. All hydrologic units identified by U.S.G.S. are included in this digital map product. Several hydrologic units may be composed of multiple, non-contiguous polygons. Hydrologic unit codes Hydrologic units delimit catchment basin for stream segments. U.S.G.S- Circular 878-A Area Area measured in equal area meters. Algorithm used by software. Area associated with each hydrologic unit. Positive real numbers. Qualità dei dati Lista di elementi e attributi presenti nei dati Qualità dei dati - Metadati 24