CAPTIDOC Estrae dati da documenti digitali e predispone registrazioni gestionali Versione: 1 Data : 10/03/2014 Redatto da: CLAUDIO CAPRARA Approvato da: RICCARDO ROMAGNOLI Categoria: Annuncio prodotto Destinatari: Collaboratori, utenti, rivenditori, assistenti. Elenco delle versioni Versione draft TeamSystem 04/03/2014 Versione 1 10/03/2014 TAG Captidoc, ArchiMedia, Archivia Plus, Documenti Commerciali Annuncio DocPortal DocFnder web compabilità Polyedro
Sommario 1. CaptiDOC...- 3-1.1. Servizio on line...- 3-1.2. Prodotto on site...- 3-1.3. Miglioramento continuo...- 3-1.4. Documenti elettronici e cartacei...- 3-1.5. Schema generale di funzionamento...- 4-2. Punti di forza...- 4-3. Il processo...- 5-3.1. Vantaggi degli archivi digitali di ArchiMedia e Archivia Plus...- 6-3.1.1. Archivi Sostitutivi...- 6-3.1.2. Scansione massiva con ArchiScan...- 6-4. La preparazione...- 6-5. Requsiti...- 7-5.1. servizio...- 7-5.2. prodotto...- 7-5.2.1. Requisiti per l installazione...- 7-5.3. Rilascio...- 7-5.4. Codici ordine...- 7-6. Domande frequenti...- 8 -
1. CAPTIDOC E un software che estrae dati da documenti digitali secondo modelli logici definiti e predispone le registrazioni contabili o E.r.p.. E composto da 4 moduli: Il motore o.c.r. che ricrea il testo nei documenti acquisiti come immagine Il motore semantico, che riconosce ed estrae i dati necessari Il motore logico, che verifica la coerenza dei valori estratti Il motore gestionale, che genera l output per il software gestionale. E integrabile nei software di conservazione digitale ArchiMedia e Archivia Plus e dispone di un output xml generico utilizzabile su qualsiasi gestionale oltre che output specifici per i gestionali TeamSystem, Zucchetti, Sistemi. 1 1.1. 1.2. 1.3. 1.4. SERVIZIO ON LINE Captidoc può essere utilizzato come servizio. L archivio digitale del cliente invia i documenti al server remoto che restituisce i risultati. PRODOTTO ON SITE Captidoc può essere installato su un server o workstation locale ed elaborare i documenti in tempo reale. Il collegamento internet è comunque indispensabile per ricevere costantemente le nuove istruzioni. MIGLIORAMENTO CONTINUO Captidoc invia le registrazioni sbagliate al server Capti Manager. Lo staff di addetti alla manutenzione, provvede a migliorare le regole affinché l errore non si ripeta.al cliente vengono addebitate solo le registrazioni giuste. DOCUMENTI ELETTRONICI E CARTACEI Captidoc utilizza sia documenti originali elettronici (pdf xml) che le immagini digitali di documenti cartacei acquisiti con scanner. Gli utilizzatori di Captidoc devono privilegiare il trattamento di documenti elettronici poiché la legge lo consente. 1 Vengono utilizzate le funzioni di importazione prima nota già disponibili in numerosi software
1.5. SCHEMA GENERALE DI FUNZIONAMENTO 2. PUNTI DI FORZA Riconoscimento testo basato su librerie Abby Fine Reader multilingua Estrazione dati completamente semantica Data base centrale con istruzioni continuamente aggiornate e distribuite a tutti i sistemi. Addebito solo per le registrazioni valide 2 2 Sono considerate valide le registrazione che l utilizzatore importa senza modifiche. Se l errore è dovuto a ocr la registrazione viene considerata valida anche se corretta dall operatore.
3. IL PROCESSO L utente deve conservare in un archivio digitale i documenti ricevuti o scansionati. La struttura consigliata è quella standard dei programmi ArchiMedia e Archivia Plus sia nella configurazione per studi tributari (DAV) che nella configurazione azienda (FA, FV, CON). Con l elaborazione, i documenti formati da immagini (cartacei scansionati) vengono sottoposti a ocr (riconoscimento del testo), quelli elettronici inviati direttamente alla estrazione. Dal testo vengono estratti i dati per le registrazioni analizzando il linguaggio utilizzato nel documento e isolando i valori significativi. I risultati vengono presentati in una comoda videata di pre registrazionedove l utente può correggere e confermare.
3.1. VANTAGGI DEGLI ARCHIVI DIGITALI DI ARCHIMEDIA E ARCHIVIA PLUS Completata l esportazione il gestionale oltre a caricare i dati dei documenti può mantenere il collegamento al documento digitale conservato grazie alle funzioni DocFinder e DocFinder Web. 3.1.1. ARCHIVI SOSTITUTIVI Gli archivi utilizzati da Captidoc, possono essere legalizzati con l aggiunto della firma digitale e sostituire a tutti gli effetti di legge gli archivi cartacei. La firma e le funzioni di conservazione sono garantite dal modulo Firma con il quale vengono generati ogni anno centinaia di migliaia di supporti sostitutivi. 3.1.2. SCANSIONE MASSIVA CON ARCHISCAN La scansione massiva effettuata con Archiscan è perfettamente compatibile con i processi di Capitdoc. 4. LA PREPARAZIONE Per ottenere una versione ottimizzata del programma, l utente deve predisporre una raccolta di almeno 3 mesi di documenti contabili già registrati e una stampa della relativa prima nota. L archivio digitale viene sottoposto a pre elaborazione per individuare le criticità, personalizzare le regole, e ottenere il maggior numero di registrazioni corrette. Aggiornate le istruzioni, l utente può utilizzare il sistema sapendo già quali saranno i risultati medi di precisione.
5. REQUSITI 5.1. 5.2. SERVIZIO Per utilizzare il servizio on line è necessaria una linea con capacità di upload proporzionata al volume di documenti da caricare. Si consiglia come capacità minimo una hdsl da 2 megabit. Test su Adsl +, caricamento di 100 fatture da 3 pagine di media circa 140 minuti di utilizzo pieno della linea elaborazione 30 minuti. PRODOTTO Per utilizzare il programma on site, è necessario un server o una workstation Windows su cui vengono installati i 4 componenti del programma. La velocità di elaborazione dipende dal dispositivo, indicativamente 100 fatture 300 pagine 30 minuti (workstation I5 4 gb ram) 5.2.1. REQUISITI PER L INSTALLAZIONE Infrastruttura o Server windows 2008 o superiore o Microsoft.net 4.0 o superiore o Sql Server Express o superiore o Internet Information Server 7.0 o superiore o Un indirizzo ip raggiungibile Software Applicativo per l archivio digitale o ArchiMedia / Archivia Plus Suite Universal con Firma o ArchiScan o Etichettatrice bar code con etichette o ArchiMedia / Archivia Plus Estensione Sql Express o superiore o Opzional Docportal o Un numero di licenze Client adeguato alle richieste 5.3. RILASCIO Aprile 2014 5.4. CODICI ORDINE ARP70 Captidoc per Archivia Plus (prereq.:arp52) ARM70 - Captidoc per Archivia Plus (prereq.:arp52)
6. DOMANDE FREQUENTI CaptiDoc richiede una personalizzazione per ogni tipo di fattura No, CaptiDoc ha un approccio semantico e riconosce già un 60% di fatture senza personalizzazioni. Tuttavia per avere il massimo della precisione è importante poter testare il programma su un archivio digitale già formato e completo di registrazioni. Questo consente non solo di inserire le regole necessarie per le fatture formate in modo particolare, ma anche di capire le abitudini dell utente nell assegnare i vari conti. CaptiDoc può trattare i documenti elettronici nativi come le fatture ricevute in formato pdf o xml? Si, CaptiDoc preferisce i documenti elettronici, se sono immagini di documenti cartacei, prima di estrarre i dati esegue il riconoscimento ocr utilizzando apposite librerie Abbyy Fine Reader CaptiDoc va a cercare i dati in determinate aree oppure prescinde da come son disposti L approccio è totalmente semantico. CaptiDoc conosce il linguaggio utilizzato nelle fatture e va a raccogliere i valori valutando la loro posizione rispetto alle etichette presenti nel documento. In pratica utilizza un motore semantico spaziale. Come importo i movimenti nel mio gestionale Vengono generati dei file di importazione nel formato supportato dal gestionale esempio per i programmi TeamSystem Gecom viene generato un file da utilizzare con IMPPN. Quanto incide la scansione nel riconoscimento Molto, la scansione deve essere di buona qualità, diversamente si ottengono errori di riconoscimento del testo e di conseguenza il motore semantico fallisce. Diversamente da altri non è necessario fare scansioni in toni di grigio, basta il classico bianco e nero con il miglior contrasto possibile. Ma qualsiasi errore ocr fa fallire il motore semantico No, perché gli errori ocr più ricorrenti vengono corretti dal sistema inoltre per fatture particolarmente complicate, durante la fase di apprendimento si possono anche impostare letture di aree fisse, forzando un comportamento solo spaziale (senza semantica). Come fate ad addebitare solo le registrazioni corrette? Ogni correzione fatta dall operatore, genera una non conformità che il sistema invia al centro di supporto per il controllo. Questo fa scattare l opzione di non addebito.