APPLICAZIONE DI SISTEMI GENETICI-FUZZY ALL ANALISI DI DATI BIOMEDICI RELATIVI A PAZIENTI AFFETTI DA DISFUNZIONE TIROIDEA Relatori: Chiar.mo Prof. Francesco Marcelloni Chiar.ma Prof.ssa Beatrice Lazzerini Candidato: Cataldo De Benedictis Anno accademico 2006-2007
A mio padre, che mi ha insegnato i valori della vita, dato sempre la possibilità di scegliere e per tutti i sacrifici che ha fatto per farmi realizzare. A mia madre, che mi ha sempre sostenuto nei miei studi e incoraggiato nei momenti difficili. A mia sorella, alla quale voglio molto bene. Ad Alessio, il cui supporto è stato fondamentale nella realizzazione di questo lavoro. A mio cugino Luigi il fratello che non ho avuto, compagno di tante avventure. A Giovanni, Ciccio, Gerard, Sante e tutti coloro che in questi anni mi hanno fatto sentire a casa anche se ero mille chilometri distante. A Taranto, città dei due mari a cui sarò legato per sempre.
Sommario Il lavoro che presentiamo è l applicazione di un metodo ingegneristico ad un problema medico. Il metodo ingegneristico è un sistema genetico-fuzzy; generiamo un sistema inferenziale fuzzy (Fis) dai dati. Il problema medico in analisi è il distiroidismo; la disfunzione tiroidea che analizzeremo nello specifico è la sindrome da bassa T3. Richiamiamo concetti di logica fuzzy e algoritmi genetici. Progettiamo e sviluppiamo due metodi. Il primo metodo, di Wang&Mendel, genera una base di regole fuzzy con la particolarità di combinare informazioni numeriche e linguistiche in una struttura comune. Il secondo, di Magdalena, ottimizza tale base di regole attraverso tecniche genetiche, applicando le funzioni di scaling. Illustriamo la selezione degli ingressi ottimi, una variante al metodo di Magdalena. Presentiamo il problema medico, che l Unità Operativa IV di Medicina Interna AUOP-Pisa ha fornito, facendo dei cenni ai principi fisiologici delle disfunzioni tiroidee. Ricerchiamo e verifichiamo l esistenza di eventuali relazioni tra alcune dimensioni delle analisi biomediche e la loro diversa influenza nella classificazione dei pazienti affetti dalla sindrome da bassa T3. Come benchmark del sistema utilizziamo il Fuzzy C-Means. Classifichiamo i pazienti e selezioniamo le dimensioni che meglio si prestano alla caratterizzazione del classificatore, tramite l applicazione del metodo della selezione degli ingressi ottimi.
INDICE GENERALE CAPITOLO 1 INTRODUZIONE pag. 6 CAPITOLO 2 CENNI TEORICI pag. 11 2.1 Introduzione pag. 12 2.2 La logica fuzzy pag. 13 2.2.1 Esempi di insiemi fuzzy pag. 14 2.2.2 Insieme fuzzy pag. 15 2.2.3 Operazioni sugli insiemi fuzzy pag. 16 2.2.4 Relazioni fuzzy pag. 17 2.2.5 Variabili linguistiche pag. 18 2.2.6 Implicazioni fuzzy pag. 19 2.2.7 Ragionamento approssimato pag. 20 2.2.8 Tecniche d inferenza pag. 21 2.2.9 La defuzzificazione pag. 22 2.2.10 Il toolbox della logica fuzzy di Matlab pag. 23 2.3 Gli algoritmi genetici pag. 25 2.3.1 La codifica del cromosoma pag. 26 2.3.2 La funzione di qualità (fitness) pag. 26 2.3.3 Operatori di crossover e mutazione pag. 27 2.3.4 Algoritmo genetico pag. 29 2.3.5 Il toolbox degli algoritmi genetici del Matlab pag. 31 CAPITOLO 3 IL PROGETTO pag. 34 3.1 Introduzione pag. 35 3.2 Il metodo di Wang e Mendel pag. 39 3.2.1 Sistema fuzzy a modello libero con apprendimento pag. 40 3.2.2 Divisione degli spazi di Input-Output in regioni fuzzy pag. 41 3.2.3 Generazione di regole fuzzy dalle stringhe di dati pag. 42 3.2.4 Assegnamento di un valore ad ogni regola pag. 44 3.2.5 Creazione di una base di regole fuzzy combinata pag. 46 3.2.6 Determinazione di una mappatura basata una base di regole pag. 47 3.3 L ottimizzazione del modello fuzzy pag. 51 3.3.1 Il metodo di Magdalena pag. 52 3.3.2 Miglioramento delle prestazioni di un FLC con gli alg. genetici pag. 52
3.3.3 Sistemi genetici fuzzy pag. 53 3.3.4 Ottimizzazione delle prestazioni di una FLC pag. 56 3.3.5 Le funzioni di scaling pag. 57 3.3.6 Processo d apprendimento pag. 61 3.4 Applicazione del sistema inferenziale fuzzy alle analisi biomediche pag. 63 CAPITOLO 4 LO SVILUPPO pag. 64 4.1 Introduzione pag. 65 4.2 Implementazione del metodo di Wang&Mendel pag. 66 4.3 Codice di alcune funzioni Matlab del metodo di Wang&Mendel pag. 69 4.4 Esempio di Fis generato pag. 73 4.5 Implementazione del metodo di Magdalena pag. 75 4.6 Codice di alcune funzioni Matlab del metodo di Magdalena pag. 79 4.7 Selezione degli ingressi ottimi (Input Selection) pag. 84 CAPITOLO 5 TEST FUNZIONALE pag. 86 5.1 Introduzione pag. 87 5.2 Structure of Wages pag. 88 5.3 Iris pag. 101 CAPITOLO 6 IL PROBLEMA TIROIDEO pag. 112 6.1 Introduzione pag. 113 6.2 Il problema tiroideo pag. 114 6.3 Analisi mediche pag. 119 CAPITOLO 7 ANALISI DEI DATI BIOMEDICI pag. 122 7.1 Introduzione pag. 123 7.2 Presentazione del problema pag. 124 7.3 Analisi preliminare e statistica del dataset pag. 134 7.4 Classificazione dei pazienti pag. 142 7.5 Ricerca di relazioni nel dataset pag. 148 7.6 Selezione degli ingressi ottimi pag. 156 CAPITOLO 8 CONCLUSIONI E SVILUPPI FUTURI pag. 162 BIBLIOGRAFIA pag. 165