GEOMATEMATICA Dott.ssa ELVIRA DI NARDO Dipartimento di Matematica e Informatica http://www.unibas.it/utenti/dinardo/ G. Ciotoli, M. Finoia Dalla Statistica alla Geostatistica: Introduzione all analisi dei dati geologici ed ambientali ARACNE (2005) STATVIEW Che cos è la statistica? La statistica è una scienza costituita da una serie di metodologie utilizzate per la raccolta, per l analisi, per la presentazione e l interpretazione dei dati. Cercheremo di rispondere alle seguenti domande: -Se assumiamo che il campione di osservazioni che dobbiamo studiare è rappresentativo del gruppo da cui proviene, cosa possiamo dire riguardo al gruppo? -Con quale probabilità possiamo dire che il gruppo di osservazioni che sto studiando è simile al gruppo originario? 1
Popolazione: insieme di tutti gli elementi di interesse in uno studio Campione: Sottoinsieme della popolazione. Cercheremo di rispondere alle seguenti domande: -Se assumiamo che il campione di osservazioni che dobbiamo studiare è rappresentativo del gruppo da cui proviene, cosa possiamo dire riguardo al gruppo? -Con quale probabilità possiamo dire che il gruppo di osservazioni che sto studiando è simile al gruppo originario? CAMPIONE DATI STATISTICA DESCRITTIVA STATISTICA INFERENZIALE METODI ESPLORATIVI TEORIA DELLA PROBABILITA Riassunti delle informazioni contenute nei dati mediante procedure aritmetiche e/o grafiche - Verifica di ipotesi - Previsioni - Interpretazione - Costruzione di modelli generali per descrivere la popolazione 2
E significativa la differenza tra la composizione di graniti appartenenti a due rocce intrusive differenti? ESEMPIO Nella tabella sono riportati i valori della percentuale di quarzo contenuta in due rocce intrusive. Per ogni roccia sono stati prelevati 8 campioni. Al fine di classificare i due campioni di roccia, esiste una differenza significativa tra le due serie di campioni? Esiste una ciclicità nella stratificazione di una sequenza carbonatica? ESEMPIO E possibile analizzare la natura delle transizioni da uno strato all altro anziché le posizioni relative degli strati nella sequenza. 3
L approccio sperimentale 1. Conoscenza del territorio Investigazione preliminare del sito per la ricostruzione di un modello concettuale del fenomeno studiato. Ex: possibile combinazione sito - sorgente di contaminazione. 2. Pianificazione attività conoscitive 3. Campionamento 4. Procedure di trattamento dei dati 5. Descrizione statistica 6. Scelta dei test 7. Analisi della distribuzione spaziale 8. Elaborazione delle mappe tematiche VARIABILE QUALITATIVA O CATEGORIALE SCALA NOMINALE : etichette non confrontabili SCALA ORDINALE : etichette confrontabili DATI VARIABILE QUANTITATIVA DISCRETI NUMERI INTERI CONTINUI NUMERI REALI Dati relativi o ad intervalli (ex: temperatura zero variabile) Dati assoluti (ex: peso/lunghezza zero fisso) Dati chiusi (ex: dati in forma di percentuale) Dati di direzione (ex: sono espressi in angoli, la direzionerispetto al nord del piano di una stratificazione) 4
ID = numero progressivo del campione T( C) = temperatura dell acqua sorgente X(m) = longitudine geografica in metri ph = concentrazione degli ioni H+ Y(m) = latitudine geografica in metri Cond = conducibilità elettrica in OHM Nome = denominazione dell acqua -9999 = dato mancante Comune = località in cui è situata la sorgente Prov = provincia Parametri chimico-fisici e alla composizione chimica di alcune acque minerali italiane FONTE DEI DATI PRIMARIA SECONDARIA DATI SPERIMENTALI DATI BIBLIOGRAFICI DATI DI CAMPAGNA DATI DI OSSERVAZIONE 5
TIPI DI ERRORI Errori sistematici: dipendono dagli strumenti e dalle tecniche di misura utilizzate (strumenti tarati male). Errori casuali white noise L accuratezza è la vicinanza di un valore misurato al suo valore reale dipende dallo strumento. 50 La precisione è la vicinanza di misure ripetute al medesimo valore A B C D Un valore può essere preciso ma non accurato. Tutti i colpi centrano il bersaglio e sono molto vicini = accuratezza e precisione. I colpi sono tutti nello stesso posto, ma lontani dal centro del bersaglio = scarsa accuratezza e buona precisione I colpi sono dispersi attorno al centro ma la loro media coincide con quella del bersaglio = accuratezza e bassa precisione. I colpi sono dispersi attorno al centro e la loro media non coincide con quella del bersaglio = bassa accuratezza e bassa precisione. 6
Come leggere da un grafico precisione ed accuratezza. La popolazioneè rappresentata da tutte le misure ipoteticamente possibili che possono essere effettuate sull entità oggetto di studio. - Composizione di tutti i graniti del mondo; - Dimensioni di tutti gli esemplari di una specie di trilobite; - Il contenuto in elementi in traccia di tutti i sedimenti fluviali POPOLAZIONE IPOTETICA: intera entità del fenomeno studiato esistente misure granulometriche di un orizzonte sabbioso che affiora in superficie e che è stato parzialmente eroso. POPOLAZIONE ESISTENTE: porzione rimanente dell intera entità (orizzonte sabbioso) che rappresenta la popolazione oggetto di studio. POPOLAZIONE DISPONIBILE: la popolazione esistente da cui è possibile estrarre un campione rappresentativo 7
Le Fasi Dell ANALISI DATA SET DESCRIZIONE DEI DATI MISURE INFERENZA Conclusioni CAMPIONE CAMPIONAMENTO POPOLAZIONE - Pianificazione - Previsione - Intervento Tecniche statistiche Statistica descrittiva Statistica Matematica Statistica Inferenziale Statistica parametrica e non parametrica Tecniche di statistica univariata Tecniche di statistica bivariata Analisi delle serie temporali Tecniche di analisi spaziale 8
TECNICHE DI CAMPIONAMENTO Campionamento ragionato: la selezione dell unità è effettuata sulla base delle conoscenze pregresse sull area investigata. -Lo studio è condotto a piccola scala -Numero di campioni piccolo - individuazione di aree anomale TECNICHE DI CAMPIONAMENTO Campionamento casuale: la selezione dell unità è effettuata in modo tale che tutte le unità abbiano la stessa probabilità di essere selezionate. Necessaria popolazione omogenea. -Poco controllabili spazio/tempo - si ignorano informazioni pregresse 9
TECNICHE DI CAMPIONAMENTO Campionamento stratificato: la selezione dell unità è effettuata per gruppi (strati) che sono poi campionati separatamente. -Monitoraggio temporale Campionamento sistematico: la selezione dell unità è effettuata nel tempo e nello spazio secondo uno schema predefinito - Dati prelevati secondo una griglia a maglia quadrata - Dati prelevati ad intervalli regolari nel tempo -Copertura uniforme, progettazione griglia semplice, incrementare il dettaglio in certe aree Campionamento pesato: la selezione dell unità è una combinazione tra campionamento casuale e campionamento ragionato. - Consigliato in presenza di un costo elevato di misure. 10