Apprendimento di Reti Bayesiane per la Valutazione del Valore Diagnostico e Prognostico dei Test Ergometrici nei Pazienti con Sospetta Cardiopatia Ischemica Paolo Frasconi 1 Andrea Passerini 1 Alberto Conti 2 1 Dipartimento di Sistemi e Informatica Università degli Studi di Firenze 2 UDT DEA Azienda Ospedaliero-Universitaria di Careggi, Firenze
Introduzione Obiettivo dello studio Applicazione di tecniche di apprendimento automatico alla valutazione preventiva del valore diagnostico di test ergonometrici in base alle specificità del paziente Possibili applicazioni Razionalizzazione delle risorse e riduzione di costi e rischi da radiazione per il paziente. Uso del modello probabilistico appreso in ambito didattico, per valutare gli effetti dell osservazione di alcune variabili sulle probabilità associate a quelle ancora non osservate.
Apprendimento automatico In cosa consiste Tecniche algoritmiche in grado di elaborare spiegazioni per induzione a partire da un insieme di dati (e.g. individuare i sintomi di una patologia a partire da cartelle cliniche di pazienti sani e malati) Concetti fondamentali algoritmo di apprendimento una procedura che prende dati in ingresso e restituisce un loro modello esplicativo scelto in un determinato spazio di ipotesi dati di addestramento caso semplice: dati rappresentati da un numero fisso di attributi (e.g. informazioni di anamnesi, analisi ed esami) generalizzazione la capacità di un modello di spiegare dati non ancora osservati. Si valuta riservando una parte dei dati disponibili per testare il modello appreso
Ragionamento probabilistico In cosa consiste Nell utilizzare gli strumenti di calcolo della probabilità nel ragionamento automatico in presenza di conoscenza affetta da incertezza. Concetti fondamentali inferenza probabilistica calcola la probabilità di un evento data l evidenza su altri eventi ad esso correlati. indipendenza A e B sono indipendenti se qualunque informazione relativa ad A è irrilevante per predire B indipendenza condizionale A e B sono condizionalmente indipendenti dato C se, noto C, A è irrilevante per predire B
Reti di indipendenza condizionale Cosa sono Rappresentazioni compatte della distribuzione congiunta su un insieme di variabili, in cui sono codificate esplicitamente le assunzioni di indipendenza condizionale Reti Bayesiane grafo della rete ogni nodo è una variabile, un arco orientato da A a B indica una dipendenza di B da A. parametri della rete sono le probabilità condizionali di ciascuna variabile della rete, data una certa configurazione di valori per le sue cause.
Relazioni di causa-effetto e semantica delle reti
Acquisizione dati (1) Dati raccolti presso l Unità Dolore Toracico dell Azienda Ospedaliero-Universitaria Careggi nel 2004 800 pazienti con episodio recente di dolore toracico casi idonei a test da sforzo dopo analisi preliminari (diagnosi incerta) Test ergometrici praticati: elettrocardiogramma (ex-ecg) ecocardiogramma (ex-echo) tomografia ad emissione di fotone singolo (ex-spect)
Acquisizione dati (2) Angiografia coronarica se positivi ad almeno un test Follow-up di un anno per i restanti Giudicati affetti da malattia coronarica: pazienti positivi alla coronarografia (stenosi superiore o uguale al 50%) pazienti affetti da evento coronarico durante il periodo di follow-up Recuperate altre variabili potenzialmente correlate con la patologia: età, sesso, familiarità, punteggio del dolore toracico, fumo, diabete, glicemia a digiuno, obesità, iperten- sione, dislipidemia.
Rete Bayesiana ottenuta
Risultati generalizzazione Verificata l efficacia nel predire la patologia (in percentuale): accuratezza sensitività specificità predittività neg. 90.5±3.3 74.0±7.1 94.0±2.2 94.3±2.0 Possibilità di simulare nuovi casi, inserendo manualmente i valori per gli attributi osservabili e verificando come si aggiornano le probabilità
Risultati Valutazione valore diagnostico Associato costi (in unità arbitrarie) ai diversi test ex-spect ex-ecg ex-echo 1 0.1 0.21 Costo viene combinato a variazione di entropia della variabile di interesse (patologia) dopo il test Possibilità di comparare il valore diagnostico dei vari test in relazione alle specificità del paziente
Ringraziamenti Gian Franco Gensini (Università degli Studi di Firenze) Riccardo Pini (Università degli Studi di Firenze) Simone Magazzini (UDT DEA, Azienda Ospedaliero-Universitaria di Careggi, Firenze) Alessandro Rosselli (DEA, ASL 10, Firenze) Alberto Fortini (ASL 3, Pistoia)