AZIONE DI SISTEMA G. Partner responsabile Università de Corse

N componente 5 N azione 3.2 Titolo prodotto : prototipi software di simulazione del comportamento idrologico del bacino versante del sud est della Corsica tenendo conto le ottimizzazioni AZIONE DI SISTEMA G Partner responsabile Università de Corse

Rapporto 1. Type de Rapport Initial Intermediaire Final Rapport 5.3.2 Période du rapport 01/06/12 au 31/02/13 2. Identification sous-projet Titre Acronyme Azione di Sistema G : Consolidamento di un modello di caratterizzazione e di gestione di un bacino idrico ASG

1. introduzione Il progetto "Ottimizzazione della gestione delle risorse idriche nel sud-est della Corsica", guidato dall'università di Corte e finanziato dal programma di cooperazione FESR croce Italia / Francia "Marittimo" è quello di utilizzare una zona sperimentale, nel sud est della Corsica, a sviluppare e validare un sistema di supporto alla gestione incorporando metodi che possono poi essere applicati alle aree di vocazione agricola e turistica del bacino del Mediterraneo. È stato stimato che la situazione attuale potrebbe essere migliorata utilizzando dispositivi di misurazione, previsione e supporto alle decisioni. Miglioramenti attesi sono: Migliore ripartizione del consumo di acqua attraverso le previsioni più attendibili. Una diminuzione dei costi di pompaggio attraverso misure e previsioni. Migliore efficienza di trasferimento di stoccaggio e di acqua attraverso tecniche di ottimizzazione. SITEC contribuisce al progetto e, in questo contesto, è assistito da ONERA. Tale assistenza comprende tre lotti: Stato dell'arte e definizione. Implementazione di data mining. Implementazione di ottimizzazione. Questa seconda relazione intermedia sull'attuazione del data mining. Si compone di tre capitoli. Il capitolo sull'applicazione di metodi basati su processi di apprendimento dell'applicazione dei metodi lineari e reti neurali a base radiale dei dati disponibili. Il prossimo capitolo presenta il lavoro svolto per monitorare i test di validazione. Infine, un capitolo descrive l'integrazione dei modelli nel programma di ottimizzazione. Applicazione di metodi basati sull'apprendimento metodologia I dati utilizzati I dati corrispondono ad una stima del riempimento della diga sul dell'ospedale 20 anni, 1.040 settimana. Si è deciso di suddividere i dati in tre sezioni: I primi 12 anni sono la base per le previsioni di un passato coerente. I successivi tre anni sono i campioni su cui viene eseguita l'identificazione minimizzando l'errore di predizione. I restanti 5 anni non sono parte della formazione di base e sono tenuti in riserva per i test di convalida. La Figura 1 mostra questa ripartizione.

Figura 1: Contributi per la diga dell'ospedale Posizione del problema Al tempo t, si prevede, sulla base dei dati osservati negli ultimi 12 anni, tra T e T-623, che saranno gli stessi dati del prossimo anno, tra t e t +1 52. E 'quindi costruire e identificare i parametri dei metodi di previsione, 52, del t +1 per quello di t 52. Metodi testati Metodi testati dividono in tre categorie. Primi metodi di riferimento che riflettono la prassi operativa ed i metodi lineari e infine metodi basati su reti neurali. Metodi di riferimento Il metodo più comune è quella di considerare una storia. Per un periodo di 12 anni la formula è: 12 1 A H ( t s / t) A( t s 52 j) 12 j1 s nella gamma da 1 a 52. A (t) rappresenta il contributo al tempo misurato t e AH (t + s /t) è la previsione fatta al tempo t + t degli ingressi a s. metodi lineari

Il principio di metodi lineari è quello di selezionare o fattori esplicativi A (t + s) di A (t), A (t-1)... poi regrediscono tra questi fattori e A (t + s) da metodo dei minimi quadrati. Lasciate r1 (s),.., rn (s) ritardi n fattori esplicativi individuati e A1 (s),..., an (s), b (s) coefficienti di regressione, la formula di previsione è data da: i n A L ( t s / t) max b( s) ai ( s) A( t s ri ( s)),0 i1 con: ( s) s r i I fattori sono selezionati in modo ricorsivo tenendo uno con il coefficiente di correlazione più significativa. Appendice 7.2 dettagli del calcolo dei coefficienti di correlazione e fornisce una guida sui tavoli per verificare l'ipotesi di una relazione lineare. Per il primo fattore, si esaminano le correlazioni tra A (t + s) e A (t), A (t-1)... Per fattore n +1, si esaminano le correlazioni tra, da un lato il residuo A (t + s)-g (t + s / t), e gli altri fattori ancora non selezionate per a (t) a (t-1)... Metodi basati su reti neurali Reti neurali con base radiale in inglese Funzione a base radiale (RBF) reti, permettono di approssimare una funzione f (x) di un vettore x da una somma pesata di funzioni base di tipo da: i N 1 T ( xci ) ( xci ) 2 ( x) a0 aie i1 dove x è l'ingresso della rete e che le impostazioni di rete siano vettore: a 0 un termine costante a0 opzionale a i hanno il peso della cella esimo per i = 1,..., N c i al di sopra del vettore centro della cella-esimo per i = 1,..., N per regolare la sovrapposizione tra le cellule. Quando il risultato della funzione è vettore, non hanno più i vettori di peso, ma la stessa dimensione come il risultato. A una rete RBF è imparare, da un insieme di campioni (x, y = f(x ) pour = 1,,M) relativo alla funzione f (x) per trovare più piccola differenza tra f (x) e (x) regolazione della et (a i, c i pour i = 1,,N). Parametri. Questo si traduce in: M min, a1,..., an, c1,..., cn 1 T y ( x ) y ( x ) Concluzione Lo studio presentato in questo rapporto è destinato principalmente per contribuire alla realizzazione di data mining. La metodologia proposta è quella di dividere i dati in tre set cronologicamente successivi. Il primo set permette una prima base passato le previsioni, il secondo di identificare i coefficienti del modello e per testare e validare i modelli finali. Questo approccio è stato applicato a tre tipi di metodi: i metodi di riferimento

metodi lineari I metodi che utilizzano RBF. Due metodi di riferimento non richiedono l'identificazione dei coefficienti: previsione dalla storia e predire l'ultima disponibile. La convalida mostra che per i dati utilizzati e il taglio che è stato fatto, la storia predizione è sempre preferibile alla predizione dall'ultima misurazione. Un terzo metodo di riferimento è pesare la storia e l'ultima misura di un fattore corrispondente al secondo set di dati. La grande differenza tra i dati di identificazione e validazione dei dati che il risultato convalida di questo terzo metodo è peggiore di quello storico. Questa differenza influenzato anche il risultato di metodi lineari e metodi di convalida utilizzando RBF: Questi metodi non sono in grado di superare la storia di convalida. Tuttavia, troviamo che aumentando il numero di fattori di metodi lineari e aumentando il numero di cellule per alcuni metodi utilizzando RBF portato molti una riduzione del gap di convalida. Questo convalida l'approccio globale alla costruzione di modelli da iterativo aggiunta di regressori. Infine, sembra che tra i vari metodi innovativi sperimentati è l'uso più efficiente dei centri di RBF ottenuti dalla classificazione con e senza termine costante. Tuttavia, è necessario ricordare che, data la scarsa affidabilità dei dati utilizzati, questi risultati sono un modo per esporre un processo che conclusioni definitive potrebbero trarre dall'uso di misure affidabili. Assistenza state fornite durante l'attuazione della ottimizzazione. Calcoli l'accelerazione e la migliore precisione turbinages ottimali è stata proposta sulla base di una domanda di Programmazione Lineare. Questo lavoro è destinato a continuare lungo tre assi: L'adattamento del metodo descritto da una divisione tra la prima serie di dati e il secondo insieme di dati per ciascun metodo.