Uso di Big data in Epidemiologia ambientale ed occupazionale Progetto BEEP ATTIVITÁ 3.1. Protocollo operativo per la determinazione di mappe di concentrazione di inquinanti atmosferici e di parametri meteorologici a livello di sezione di censimento -------------------------------------------------------------------------- 1
Descrizione attività: Determinazione di mappe giornaliere di concentrazione di inquinanti atmosferici e di parametri meteorologici a livello di sezione di censimento mediante tecniche di data fusion basate su simulazioni modellistiche numeriche a scala metropolitana, dati osservati di concentrazione di inquinanti e di parametri meteo fornite dalle reti di monitoraggio e dati territoriali. Le mappe saranno prodotte per le seguenti 6 città: Milano, Torino, Bologna, Roma, Bari e Palermo e per gli anni 2013, 2014 e 2015. Modalità di esecuzione attività: L applicazione dei modelli numerici (meteorologico prognostico e di qualità dell aria) e di tecniche di data fusion verrà esternalizzata mediante affidamento a società privata avente comprovata competenza nell utilizzo di tali modelli e adeguate risorse di calcolo (piattaforme High-Performance Computing) per l esecuzione delle simulazioni richieste. Tipologia del prodotto fornito: Dovranno essere resi disponibili, per i tre anni considerati, campi medi giornalieri bidimensionali relativi ai diversi parametri meteorologici e di qualità dell aria sulle 6 città. Descrizione del protocollo operativo per l analisi di simulazioni meteorologiche Le simulazioni meteorologiche su base oraria devono essere condotte mediante l applicazione del modello meteorologico WRF-ARW (di seguito WRF, https://www.mmm.ucar.edu/weatherresearch-and-forecasting-model). Il modello WRF dovrà essere alimentato da condizioni iniziali ed al contorno che descrivano lo stato iniziale dell atmosfera e l evoluzione temporale dei campi meteorologici a scala sinottica. Queste informazioni dovranno essere estratte da analisi o previsioni meteorologiche prodotte da modelli globali, quali quelli utilizzati dai principali servizi meteorologici nazionali ed internazionali. Per tale ricostruzione si dovrà fare uso di analisi meteorologiche il cui processo produttivo si basa sull integrazione di osservazioni sperimentali nei calcoli prodotti dai modelli prognostici. Le analisi meteorologiche utilizzate per la definizione delle condizioni iniziali e al contorno di WRF dovranno essere prodotte da uno dei centri meteorologici internazionali di riferimento, quali ECMWF (https://www.ecmwf.int/) e NCEP (http://www.ncep.noaa.gov/), o da uno dei servizi meteorologici nazionali dell Unione Europea. Poiché lo studio è finalizzato alla produzione di mappe ad alta risoluzione sulle sei città, dovrà essere utilizzata una delle parametrizzazioni per la scala urbana disponibili nel modello WRF per una miglior descrizione dei fenomeni dinamici e termodinamici indotti dalla presenza degli edifici. La parametrizzazione da utilizzare verrà concordata in fase esecutiva. L applicazione del modello meteorologico WRF richiede inoltre la disponibilità di informazioni statiche in grado di descrivere le caratteristiche della superficie terrestre nell area interessata dalle simulazioni. Tali dati includono: il modello digitale del terreno, la descrizione dell uso del suolo, ed 2
una serie di informazioni accessorie che riguardano le caratteristiche del sottosuolo, della superficie terrestre e della sua copertura naturale o artificiale. Le basi dati di riferimento per tutte le variabili richieste sono rese disponibili, a corredo del codice WRF, da NCAR (http://www2.mmm.ucar.edu/wrf/users). Per applicazioni del modello ad alta risoluzione spaziale sul territorio Italiano e, in particolare, sulle aree urbanizzate, si ritiene non soddisfacente la descrizione dell uso del suolo disponibile all interno delle basi dati standard di WRF. Dovrà quindi essere utilizzato il set di dati europei di riferimento del CORINE Land Cover (http://land.copernicus.eu/pan-european/corine-land-cover), in modo da ottenere la miglior descrizione possibile della copertura del terreno. I dati CORINE dovranno essere formattati secondo le specifiche del codice WRF per poter essere letti e processati direttamente dal preprocessore WPS, che fa parte del sistema modellistico di WRF. Le simulazioni del modello WRF dovranno essere impostate, per ciascuna delle 6 città, su un sistema di domini di calcolo innestati che permettano la corretta discesa di scala delle condizioni meteorologiche previste e la ricostruzione della circolazione atmosferica e delle condizioni dispersive a scala locale. Il dominio target sarà definito in modo da contenere l intera area urbanizzata in considerazione ed una porzione significativa del territorio ad essa circostante, in modo da permettere l identificazione degli effetti urbani. La risoluzione considerata per il dominio target dovrà essere pari ad 1 km. La configurazione definitiva dei domini di calcolo sarà concordata in fase esecutiva. Il numero e la risoluzione dei livelli verticali sarà definito durante la fase iniziale delle attività in modo da permettere di ottenere una risoluzione sufficiente in prossimità del suolo e all interno dello strato limite atmosferico. Descrizione protocollo operativo per l analisi di simulazioni di qualità dell aria Le simulazioni di qualità dell aria su base oraria dovranno essere condotte mediante l applicazione del modello euleriano FARM (https://hpc-forge.cineca.it). Le simulazioni con il modello FARM dovranno essere effettuate su domini che includono le aree urbane di interesse utilizzando, come condizioni al contorno, i campi di concentrazione prodotti dalle simulazioni a scala nazionale effettuate nell ambito del progetto. Per la messa a punto dell input emissivo alle simulazioni di qualità dell aria dovrà essere utilizzato un software modulare che provvede alla effettuazione delle seguenti operazioni: utilizzare in input i dati provenienti dall inventario nazionale prodotto da ISPRA; se disponibili potranno essere utilizzati gli inventari regionali in luogo di quello nazionale; considerare sorgenti associate a elementi puntuali (singoli camini), lineari (es. archi stradali, qualora disponibili) o poligonali (es. comuni, province, celle di una griglia); 3
disaggregare spazialmente le emissioni su griglie di calcolo a piacere, considerando i riferimenti cartografici delle diverse sorgenti e sulla base di eventuali proxy aggiuntive, che saranno reperite ed elaborate; modulare su base oraria sui periodi di interesse i dati di inventario, sulla base di profili temporali tipici per le diverse attività; aggregare le emissioni di composti organici volatili (COV) e di particolato presenti nell inventario nelle specie-gruppo e nelle componenti del particolato considerate rispettivamente dal meccanismo chimico gassoso e dal modulo di aerosol implementati nel modello FARM (es. composti aromatici a bassa ed alta reattività per quanto riguarda i COV e ammonio/solfato/nitrato/carbonio elementare e organico per quanto riguarda il particolato). Tale operazione, comunemente detta speciazione, verrà effettuata considerando rispettivamente il meccanismo chimico gassoso SAPRC99 ed il modulo di aerosol aero3 ed utilizzando profili di speciazione, adeguatamente documentati, associati alle diverse attività emissive. Le simulazioni con il modello FARM dovranno essere effettuate considerando una estensione verticale pari a 10 km al di sopra dell orografia e fissando i livelli verticali in modo tale che vi sia un numero sufficiente di livelli al di sotto di 200 metri e che il primo livello abbia uno spessore pari a 20 metri. La scelta dei domini di calcolo e della loro struttura orizzontale e verticale sarà comunque condivisa ed effettuata nel primo incontro di pianificazione delle attività. La configurazione iniziale dei modelli WRF e FARM dovrà essere sottoposta a verifica attraverso il confronto degli output prodotti con variabili meteorologiche e di qualità dell aria misurate. Descrizione del protocollo operativo per l applicazione di tecniche di data fusion Dovranno essere utilizzati modelli basati su tecniche di Land Use Regression (LUR). Tale approccio, ampiamente utilizzato in ambito epidemiologico, consente di produrre mappe ad una maggiore risoluzione spaziale rispetto al modello di partenza, coerentemente con la risoluzione spaziale dei dati di uso del suolo. Tali tecniche si basano sul seguente modello probabilistico: Y =β +β x +β x + +β x +ε i=1,2,3,,n ove 0, 1,,, k sono i parametri della regressione (da stimare), x 1, x 2,, x k le variabili indipendenti (predittori), n e k rispettivamente il numero di osservazioni e di variabili indipendenti e i la componente stocastica di valore atteso nullo ( N(0, 2 )). Nel caso in esame la variabile dipendente Yi può essere data, ad esempio, dalla differenza tra il parametro (meteorologico o di qualità dell aria) rilevato dalla stazione di misura i-esima e calcolato dal modello nella cella di calcolo in cui ricade la stazione considerata; mentre i termini x 1, x 2,, x k sono costituiti dai differenti parametri considerati dal modello probabilistico (edificato, agricolo, popolazione lunghezza dei tratti stradali, intensità del traffico, etc.). Calcolati i parametri della regressione sarà 4
quindi possibile correggere il campo di background prodotto dal modello in funzione dei diversi predittori considerati. Al fine di poter applicare tali tecniche dovranno essere raccolti i parametri di uso del suolo e ragionevolmente connessi con i parametri richiesti (es. relativamente alla temperatura è di sicuro interesse la superficie edificata/isola di calore urbano) per le sei città considerate nello studio unitamente ai dati osservati relativi agli inquinanti individuati da DIP-EPI. Al fine della validazione dei risultati, dovranno essere utilizzate tecniche di cross validazione (es. suddividendo i dati in due insiemi: uno per il training del modello probabilistico ed uno per la sua validazione o utilizzando tecniche cosiddette di leave-one-out ) finalizzate alla verifica delle mappe prodotte mediante l utilizzo delle tecniche di data fusion proposte. Saranno infine prodotti per le sei città e per i tre anni considerati i campi giornalieri alla risoluzione di sezione di censimento relativi agli inquinanti individuati. 5