I files devono essere in formato.dbf (DBIII Plus o DBIV) e contenere un codice identificativo univoco.



Documenti analoghi
Airone Gestione Rifiuti Funzioni di Esportazione e Importazione

Outlook Plugin per VTECRM

MANUALE PARCELLA FACILE PLUS INDICE

Consiglio regionale della Toscana. Regole per il corretto funzionamento della posta elettronica

Il sofware è inoltre completato da una funzione di calendario che consente di impostare in modo semplice ed intuitivo i vari appuntamenti.

Manuale Utente. Gestione Richieste supporto Data Warehouse. Della Ragioneria Generale dello Stato. Versione 1.0. Roma, Ottobre 2015

MANUALE UTENTE Fiscali Free

Manuale Utente. Gestione Richieste supporto BDAP. Versione 1.0

Software per la registrazione delle schede Istat D.11 sulle dimissioni dagli istituti di cura per aborto spontaneo. Manuale d uso

I Codici Documento consentono di classificare le informazioni e di organizzare in modo logico l archiviazione dei file.

Banca dati Professioniste in rete per le P.A. Guida all uso per le Professioniste

CREAZIONE DI UN DATABASE E DI TABELLE IN ACCESS

OSSERVATORIO REGIONALE CONTRATTI PUBBLICI DI LAVORI, SERVIZI E FORNITURE

Studio Prof. Versione 2

La Stampa Unione. Individuare la lista indirizzi per la Stampa Unione

PROCEDURA DI CHIUSURA ANNO FISCALE 2006 CON E-SHOP

1.0 GUIDA PER L UTENTE

Monitoraggio Flussi Finanziari

AD HOC Servizi alla Persona

GESGOLF SMS ONLINE. Manuale per l utente

MANUALE UTENTE Profilo Azienda Partecipata. APPLICATIVO CAFWeb

Manuale Operativo Adesione Attività. Promozionali FIPAV

UTILIZZO DEL MODULO DATA ENTRY PER L IMPORTAZIONE DEI DOCUMENTI (CICLO PASSIVO)

Gestione Risorse Umane Web

Progetto NoiPA per la gestione giuridicoeconomica del personale delle Aziende e degli Enti del Servizio Sanitario della Regione Lazio

4.1 FAX Sollecito consegne via (Nuova funzione)

CERTIFICATI DIGITALI. Manuale Utente

SOMMARIO... 3 INTRODUZIONE...

Manuale Utente Albo Pretorio GA

Sistema Gestionale FIPRO. Dott. Enea Belloni Ing. Andrea Montagnani

Guida rapida per l utilizzo del servizio OwnCloud-MIUR (versione 1.6)

CONTENT MANAGEMENT SY STEM

corso di Access MICROSOFT ACCESS Docente: Andrea Mereu Università degli studi di Cagliari 16 aprile 9 maggio 2012

Istruzioni per l installazione del software per gli esami ICoNExam (Aggiornate al 15/01/2014)

M:\Manuali\VARIE\GENERAZIONE REPORT PARAMETRICI.doc GENERAZIONE REPORT PARAMETRICI

STAMPA UNIONE DI WORD

ACCESSO AL SISTEMA HELIOS...

Tutte le interrogazioni possono essere condotte su qualsiasi campo della banca dati (ad esempio, Forma, Frequenza, Lunghezza, ecc...).

SOFTWARE CONTRATTI STUDIO K

Direzione Centrale per le Politiche dell Immigrazione e dell Asilo

Sistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate

2. LOGIN E RECUPERO DATI DI ACCESSO

1. ACCESSO AL DATABASE

RILEVA LIGHT Manuale dell Utente

2. LOGIN E RECUPERO DATI DI ACCESSO

Internet Explorer 6. Gestione cookie

ESTARWEB ISTRUZIONI SEZIONE DOCUMENTALE

Sistema Informativo Gestione Fidelizzazione Clienti MANUALE D USO

Versioni x.7.9 Note Operative

LeggiCATASTO. Le due funzionalità principali sono:

Università degli Studi di Ferrara - A.A. 2014/15 Dott. Valerio Muzzioli ORDINAMENTO DEI DATI

GCEWEB Denunce mensili in WEB

Schede ADI ADP ADEM Prestazioni aggiuntive MMG. - Manuale - Data Solution Provider s.r.l.

Manuale operativo - Procedura per la costruzione, la pubblicazione di questionari

MANUALE UTENTE. In questo manuale verranno descritte tutte le sue funzioni. Il sistema OTRS è raggiungibile al seguente link:

ANAGRAFE ALUNNI ISTRUZIONI PER LE SCUOLE PARITARIE Linee guida per la trasmissione delle nuove iscrizioni a.s. 2010/11

NAVIGAZIONE DEL SI-ERC: UTENTE PROGETTISTA

Dipartimento per i Trasporti, la Navigazione e i Sistemi Informativi e Statistici Direzione Generale per la Motorizzazione Centro Elaborazione Dati

I TUTORI. I tutori vanno creati la prima volta seguendo esclusivamente le procedure sotto descritte.

Progetto: ARPA Fonte Dati. ARPA Fonte Dati. Regione Toscana. Manuale Amministratore

ISTRUZIONI PER L UTILIZZO DELLA SCHEDA INFORMATIZZATA E MODALITA DI INVIO DEI DATI - L. R. 162/98 PROGRAMMA

Guida alla compilazione on-line delle domande di Dote Scuola A.S per le Famiglie INDICE

TUTORIAL PUBBLICARE e INVIARE CIRCOLARI (v 1.5) -- PRIMA FASE -- PUBBLICAZIONE DI UNA CIRCOLARE (e suoi eventuali allegati)

OlyjobNet_manualeUtente.doc V Pag. 1 di 14 OLYJOB.NET. Manuale Utente USO PUBBLICO

PROGRAMMA GESTIONE TURNI MANUALE UTENTE. Programma Gestione Turni Manuale Utente versione 1.1

RICHIESTE INTERVENTO

FPf per Windows 3.1. Guida all uso

Manuale Utente SIRECO

Gestione delle informazioni necessarie all attività di validazione degli studi di settore. Trasmissione degli esempi da valutare.

GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL

Manuale operatore per l utilizzo dell utente di dominio

MANUALE TECNICO n AGGIORNATO AL GESTIONE DOCUMENTALE

MANUALE PROSPETTI ONLINE VIA S.A.RE.

Procedura SMS. Manuale Utente

5-1 FILE: CREAZIONE NUOVO DOCUMENTO

INSERIMENTO DATI BASILARI

Manuale Utente. Sistema Informativo Ufficio Centrale Stupefacenti

* in giallo le modifiche apportate rispetto alla versione precedente datata 09/03/2011

EasyPrint v4.15. Gadget e calendari. Manuale Utente

Istruzioni per l uso dei programmi MomCad, TraveCon, TraveFon

DATI STATISTICI NOTARILI GIUDA ALL UTILIZZO DELLA PROCEDURA CON DIGITAL OFFICE

Manuale d uso. Windows Phone 7 DPS Daily Notes V1.0

Client manuale d uso Versione af Ottobre 2010

COMUNICAZIONE UTENTI SISTEMI-PROFIS INSTALLAZIONE GE.RI.CO e PARAMETRI2015

QG Gestione Assenze. Inserimento per Classe. Per la gestione delle assenze accedere dal Menu Giornaliere->Assenze e Giustificazioni

GUIDA RAPIDA PER LA REGISTRAZIONE DELLE INFORMAZIONI EDITORIALI E PER L INSERIMENTO E LA GESTIONE DEI PRODOTTI

Software per la registrazione delle schede Istat D.11 sulle dimissioni dagli istituti di cura per aborto spontaneo. Manuale d uso

INPS Direzione Centrale Sistemi Informativi e Tecnologici. Area CRM & Contact Center

Regione Toscana. ARPA Fonte Dati. Manuale Amministratore. L. Folchi (TAI) Redatto da

SIRTEL. Sistema Informativo per la Rendicontazione Telematica degli Enti Locali. Schema di funzionamento del processo per l Ente Locale

Manuale Utente Amministrazione Trasparente GA

per immagini guida avanzata Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel

1 Elenchi clienti e fornitori

Accesso all Area di Lavoro

WORD per WINDOWS95. Un word processor e` come una macchina da scrivere ma. con molte più funzioni. Il testo viene battuto sulla tastiera

Funzioni di Trasferimento Movimenti

SPRING SQ COMUNICAZIONE OPERAZIONI IVA NON INFERIORI A 3000 EURO PER L ANNO 2011

Scheda operativa Versione rif c00. Libro Inventari

NOVITA VERSIONE La soluzione CAD/CAM per il cablaggio elettrico

uadro Soluzioni software per L archiviazione elettronica dei documenti Gestione Aziendale Fa quadrato attorno alla tua azienda

Transcript:

Appaiamento di archivi nominativi Software for Automated Linkage in Italy (SALI) Dr. Luigino dal Maso, CRO Aviano Le procedure di appaiamento tra i casi di diversi archivi costituiscono un opportunità particolarmente utile per la condivisione di informazioni provenienti da fonti diverse, orientabili a studi epidemiologici ed alla sorveglianza dei pazienti registrati in archivi di patologia. In presenza di codici univoci di collegamento (criterio deterministico) queste procedure sono affrontabili dalla maggior parte dei programmi di gestione dergli archivi. Nella ben più frequente evenienza della non disponibilità di campi-chiave affidabili, emerge la necessità di software in grado di trattare archivi di numerosità medio-alte, utilizzando i comuni dati anagrafici, anche nei casi di non perfetta corrispondenza degli stessi, garantendo una minima perdita dei legami possibili. Il programma SALI, sviluppato presso l unità di Epidemiologia e Biostatistica del Centro di Riferimento Oncologico di Aviano (PN), è nato con lo scopo di appaiare record individuali di archivi di media grandezza (nell ordine di 100.000 records) consentendo la possibilità di una revisione manuale del risultato e tutelando, in ogni fase dell operazione, la riservatezza anagrafica degli individui trattati. Il programma è ottimizzato per una probabilità di appaiamento inferiore all 1%, pur essendo in grado di offrire buone prestazioni anche con percentuali attese superiori (subordinatamente alla potenza del processore) SALI, sviluppato in linguaggio CA-Clipper, usa archivi in formato Dbase e richiede come campi-chiave: cognome, nome e data di nascita, permettendo di tenere in considerazione possibili errori di imputazione dei campi-chiave. La procedura di appaiamento è basata su 7 livelli, due dei quali automatici e cinque interattivi, nei quali l operatore può decidere attraverso specifiche finestre se accettare o rifiutare l appaiamento proposto. SALI può essere usato in ogni sistema operativo IBM-compatibile (DOS o Windows). Istruzioni per il linkage con SALI I files devono essere in formato.dbf (DBIII Plus o DBIV) e contenere un codice identificativo univoco. Le date devono essere trasformate in campi separati per giorno, mese, anno (formato carattere, vedi tracciato seguente). Non è necessario che i files da linkare contengano una sola volta il cognome-nome-datanas paziente perché il programma lavora anche con multipli, ma ciò rende la fase manuale del linkage può diventare più lunga. E, tuttavia, necessario, esista un identificativo univoco (es.: numero progressivo) dei record altrimenti i record con lo stesso identificativo (successivi al primo) non vengono presi in considerazione. Per velocizzare la procedura, è opportuno che il file con il maggior numero di record sia il file1.

Esempio struttura: File1 ID1 identificativo univoco del record nel file1 COGN1 cognome NOME1 nome GGNAS1 giorno nascita MMNAS1 mese nascita AAAANAS1 anno nascita VAR1 altre variabili file1 File2 ID2 identificativo univoco del record nel file2 COGN2 cognome NOME2 nome GGNAS2 giorno nascita MMNAS2 mese nascita AAAANAS2 anno nascita VAR2 altre variabili file2 Quando i files sono pronti vanno collocati in una cartella (es.: c:\linkage ), preferibilmente (non necessariamente) la stessa per files e programma. Apparirà una piccola finestra in cui specificare l indirizzo rispettivamente di file1, file2 (i files vanno indicati con l estensione.dbf) e di dove si vuole collocare il file di output (es. out.dbf). Inserendo file1 il programma chiede: a) se il file è stato preparato (nomi e cognomi in caratteri maiuscoli senza spazi ed interpunzioni; per es.: Da Vinci e Maria-Josè diventeranno DAVINCI e MARIAJOSE): rispondere n b) se il file è non stato indicizzato (ordinato) per tutte le variabili-chiave: rispondere n Inserendo file2 il programma chiede se il file è stato preparato: rispondere n Dopo l invio, se non ci sono problemi (es.: files inesistenti) il programma chiede di segnalare la posizione (ordine sequenziale) nei files delle variabili che serviranno per il linkage. Fatto questo il programma chiederà l autorizzazione per eseguire le procedure

Seguiranno 7 diversi livelli di linkage con un diverso trattamento delle variabili, articolati come segue (SALI versione 3.3): Livello a Cognome. Nome. Data nascita. Intervento manuale b 0 Uno dei due nomi contenuto nell altro No 1 c Come al livello 0, oppure i primi 7 caratteri uguali, oppure un nome senza la prima lettera contenuta nell altro Anno uguale No 2 Come al livello 1 Almeno 7 caratteri comuni e almeno 5 caratteri nella stessa posizione 3 Per ogni cognome un massimo di 20 caratteri non trovati nell altro e una stringa comune di almeno 2 caratteri Come al livello 1 (mese e giorno possono essere invertiti) 4 Un cognome contenuto nell altro oppure i primi 7 caratteri uguali Per ogni nome un massimo di 20 caratteri non trovati nell altro e una stringa comune di almeno 2 caratteri Come al livello 3 5 6 Un cognome contenuto nell altro oppure i primi 7 caratteri uguali Per ogni cognome un massimo di 3 caratteri non trovati nell altro e una stringa coune di almeno 4 caratteri Come al livello 4 Uno dei due nomi uguale alla prima parte dell altro Almeno 7 caratteri comuni e almeno 6 nella stessa posizione Come al livello 5 a. gli appaiamenti effettuati in uno stadio precedente sono trascurati dal successivo b. dal livello 2 ogni possibile linkage viene proposto ad uno ad uno e l operatore deve decidere se accettarlo o no. c. il livello 1 viene proposto in SALI3.3 dopo il livello 5 vista la minore specificità. Altre caratteristiche del programma: - è possibile saltare il livello proposto - nomi e cognomi possono essere cancellati, criptati o lasciati invariati nel file di output - il livello 6 può essere utilizzato solo in situazioni particolari con richiesta grande sensibilità (procedura onerosa) Il programma, pur utilizzando files nominativi, non visualizza mai cognomi e nomi durante la fase di linkage, per motivi di riservatezza. Nei livelli con scelta manuale all operatore verranno proposti i casi simili (tabella sopra) ed egli verrà aiutato a scegliere se accettare il linkage o no sulla base della presentazione delle due stringhe criptate dei nomi con lunghezza pari ai caratteri

La fase 2 (nomi e cognomi circa uguali, vedi tabella sopra) mostrerà la seguente finestra: La fase 3 (data di nascita uguale, vedi tabella sopra) mostrerà la seguente finestra: Il simbolo * significa stessa lettera nella stessa posizione Il simbolo $ significa lettera contenuta nell altra stringa, ma in posizione diversa Il simbolo - significa lettera diversa Nell esempio sopra i due record hanno stesso nome (non mostrato, vedi tabella sopra), stessa data di nascita, una sottostringa comune di 5 caratteri nel cognome nelle posizioni mostrate (esempio classico di errata trascrizione di caratteri doppi nel cognome). E importante sottolineare: Che solo la coincidenza degli asterischi indica corrispondenza delle stringhe, mentre la coincidenza degli altri simboli, sebbene crei un effetto ottico analogo, può sottendere differenze notevoli. Che rispondendo n (NO) alla richiesta di linkage i due casi verranno esclusi, mentre rispondendo y (SI) si potrà in seguito eventualmente rifiutare il linkage in una fase ulteriore di controllo che comporterà il confronto di ulteriori variabili presenti nei 2 archivi (es.: comune di nascita, data di morte). Le diverse condizioni di lavoro (dimensione dei files da linkare, probabilità che differenze piccole corrispondano davvero a pazienti diversi) determineranno l opportunità di criteri di linkage più stretti (lavoro più veloce, maggiore specificità) o più larghi (lavoro più lento, maggiore sensibilità).

Alla fine della procedura il programma chiede se le stringhe con i cognomi e i nomi debbano essere cancellate (opzione necessaria nel caso di un linkage da effettuare in cieco per motivi di riservatezza) oppure no. Nel primo caso (dati sensibili), per consentire ulteriori controlli, vengono mantenute solo le strighe di nomi e cognomi criptate tramite *, $ e -, altrimenti, se i files sono liberamente utilizzabili dagli operatori, il file di output, oltre al tutte le variabili linkate dei record comuni, conterrà anche i cognomi e nomi in chiaro dei due files. Dopo la fine della procedura e con qualsiasi software (DB3/4, Excel, Access, ecc.), potrà essere condotta un ultima verifica dei record linkati (per eliminare i falsi positivi ), tenendo presente che ogni record contenente le variabili proveniente da entrambi i files, conterrà anche una variabile con il livello di linkage effettuato. Nel caso si scelgano a priori criteri più larghi di inclusione (al limite premendo sempre y ad ogni richiesta) si potranno selezionare i record con livello di linkage ad es. superiori ad 1 per ricontrollarli ed effettuare a questo punto la accettazione/rifiuto. Bibliografia (descrizione dettagliata di SALI): Dal Maso L, Braga C, Franceschi S. Methodology Used for Software for Automated Linkage in Italy (SALI). Journal of Biomedical Informatics 2001, 34, 387-395 Il software è disponibile gratuitamente a soli fini di ricerca epidemiologica facendo richiesta scritta a: Dr. Luigino Dal Maso, Unità di Epidemiologia e Biostatistica (e-mail epidemiology@cro.it) Centro Riferimento Oncologico, v. Pedemontana occ. 12, 33081 AVIANO (PN) Per l uso del programma si richiede la citazione bibliografica allegata.