Sezione 2 Risultati della validazione della risorsa e del software ItalWordnet C. Bagnasco, C. Biasuzzi, M. Ferraro, L. Gilardoni (Quinary)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Sezione 2 Risultati della validazione della risorsa e del software ItalWordnet C. Bagnasco, C. Biasuzzi, M. Ferraro, L. Gilardoni (Quinary)"

Transcript

1 Sezione 2 Risultati della validazione della risorsa e del software ItalWordnet C. Bagnasco, C. Biasuzzi, M. Ferraro, L. Gilardoni (Quinary) 1 INTRODUZIONE VALUTAZIONE GENERALE E DI COPERTURA Ambiente e modalità di valutazione Corrispondenza del modello alle specifiche Valutazione di usabilità dell'interfaccia di browsing Valutatori senza conoscenza pregressa del modello: risultati della valutazione Valutatore con competenze di problematiche linguistiche ma senza competenze specifiche su IWN Valutatore di estrazione marketing/economica Valutazione di integrabilità del software Valutazione di copertura del lessico Valutazione di usabilità dell'interfaccia di editing VALUTAZIONE SPERIMENTALE Il sistema di classificazione attuale Il caso sperimentale Navigazione nella rete un esempio Strumenti di supporto CONCLUSIONI RIFERIMENTI BIBLIOGRAFICI...29

2 1 Introduzione Oggetto delle attività legate alla linea 1.4 era la validazione della risorsa ItalWordNet. Le attività sono state pianificate in modo da coprire due aspetti: una ri-validazione generale e di copertura, sulla falsariga di quanto già effettuato preliminarmente in fase di sviluppo, al fine di verificare le ultime modifiche/estensioni al prototipo - pianificate come attività della linea 1.3 e/o apportate per rispondere ad eventuali anomalie riscontrate nelle precedenti fasi di valutazione e fornire una valutazione generale finale una validazione sperimentale basata su un caso d uso della risorsa. Questo documento contiene nei successivi due capitoli i risultati delle due attività di validazione, e nel terzo una descrizione sintetica complessiva dei risultati dell attività di valutazione. 2 Valutazione Generale e di copertura Durante la linea 1.4 è stata effettuata una validazione finale della risorsa e del software ItalWordNet dal punto di vista generale e di copertura dei contenuti, sulla falsariga di quanto già effettuato in fase precedente sulle versioni intermedie al fine di controllare l evoluzione rispetto a quanto reso disponibile al termine della fase 1.3. In particolare, sono stati effettuati: valutazione qualitativa delle funzionalità di interfaccia, verificando il comportamento del sistema sia in modo esaustivo (disamina puntuale di tutte le funzionalità esistenti) sia in modo mirato, sulla base di specifici scenari di utilizzo, al fine di verificarne la completezza. verifica delle funzionalità dell API, sia in termini di adeguatezza via analisi qualitativa di documentazione e codice, sia operativamente attraverso l utilizzo per i sistemi usati per i test di copertura e la validazione sperimentale. verifiche di copertura, sia sugli stessi data set utilizzati durante le valutazioni preliminari in fase 1.2 e 1.3 al fine di verificare l evoluzione del sistema, sia su nuovi data set. Tutti i test sono stati effettuati presso la sede di Quinary, utilizzando il materiale reso disponibile in fase iniziale e i successivi aggiornamenti sul sito ftp di progetto. E da notare che il processo di valutazione è stato necessariamente ma anche proficuamente un processo incrementale, dove una serie di anomalie riscontrate in corso d opera sono state in corso d opera affrontate tramite successivi rilasci di estensioni e/o patches al prototipo. In questo documento non vengono riportati i dettagli su quanto risolto in corso d'opera ma si rimarca come tale attività abbia avuto una certa rilevanza, ad ulteriore dimostrazione dell utilità del processo di valutazione. 2.1 Ambiente e modalità di valutazione Il software ItalWordNet è stato installato su due Personal Computer (PC) connessi in rete: 2

3 un PC con 256 Mb di RAM e processore Intel PentiumIII, in ambiente Microsoft Windows NT 4.0, Service Pack 6 un PC con 128 Mb di RAM e processore Intel PentiumIII, in ambiente Microsoft Windows NT 4.0, Service Pack 6 Sul primo PC è stato installato il server, il client e l interfaccia grafica per il test delle API. Sul secondo PC è stato installato il client e l interfaccia grafica per il test delle API. Il software è stato scaricato dal sito ILC (ftp.ilc.pi.cnr.it) in diverse riprese. Valutazioni preliminari sono state effettuate su una prima versione come rilasciata al termine della fase 1.3 (28/5), su successive versioni (30/7,11/10) rilasciate a seguito della segnalazione di alcune incongruenze e/o errori minori, e su un ultima versione congelata alla data del 26/10. I test quantitativi di cui si riportano i risultati nel seguito fanno riferimento all'ultima versione. Il software è stato testato da due collaboratori di Quinary, entrambi sviluppatori software con conoscenza pregressa del modello di ItalWordNet, mentre i contenuti e l'interfaccia, come dettagliato in seguito, sono stati oggetto di valutazione da parte di collaboratori di Quinary senza pregressa conoscenza del sistema. 2.2 Corrispondenza del modello alle specifiche Il modello, così come presentato dall interfaccia di browsing, corrisponde in termini di informazioni reperibili e relazioni esplorabili al modello definito nel documento finale della linea 1.1. Utilizzando l'interfaccia è possibile accedere a db diversi; in particolare, sia al modello generico che al modello economico, sia ad entrambi attraverso il modello 'plugin' realizzato. Il modello plugin ha inserito le entry del dominio economico sul db generico, mascherando, come descritto altrove, le entry sovrapposte. Tutte le valutazioni sono state effettuate sul modello 'plugin' che ingloba db generico ed economico. E' da sottolineare che, in accordo a quanto previsto dal capitolato e dalle specifiche definite nella linea 1.1, i campi semantici, contenenti la caratterizzazione delle entry in termini di dominio, sono presenti esclusivamente per i termini del db economico. Come vedremo più in dettaglio nel seguito, questa limitazione, ancorché prevista, è significativa e potrebbe essere oggetto di utile estensione al sistema. La copertura in termini di relazioni e informazioni agganciate alle entry appare in generale soddisfacente, soprattutto per le relazioni principali. E' tuttavia da notare come alcune relazioni non siano valorizzate (si veda la tabella 1), il che potrebbe indicare la necessità di una revisione critica che elimini alcune relazioni portando ad una semplificazione del modello. Descrizione Totale Nomi Verbi Aggettivi Avverbi Nomi Propri # synset # sensi # lemmi # rel. interne # rel. esterne Tabella 1 3

4 Relazione Totale Nomi Verbi Agg. Avv. Nomi Propri NEAR_SYNONYM XPOS_NEAR_SYNONYM HAS_HYPERONYM/HAS_HYPONYM HAS_XPOS_HYPERONYM HAS_XPOS_HYPONYM ANTONYM COMPL_ANTONYM 2 2 GRAD_ANTONYM XPOS_ANTONYM 0 XPOS_NEAR_ANTONYM HAS_HOLONYM/HAS_MERONYM HAS_MERO_PART/HAS_HOLO_PART HAS_MERO_MEMBER/ HAS_HOLO_MEMBER HAS_MERO_MADEOF/HAS_HOLO_MADEOF HAS_MERO_PORTION/ HAS_HOLO_PORTION HAS_MERO_LOCATION/ HAS_HOLO_LOCATION CAUSES IS_CAUSED_BY RESULTS_IN/IS_RESULT_OF FOR_PURPOSE_OF/IS_PURPOSE_OF 4 4 IS_MEANS_FOR/HAS_MEANS HAS_SUBEVENT IS_SUBEVENT_OF INVOLVED ROLE INVOLVED_AGENT ROLE_AGENT INVOLVED_PATIENT ROLE_PATIENT INVOLVED_INSTRUMENT ROLE_INSTRUMENT INVOLVED_LOCATION ROLE_LOCATION INVOLVED_DIRECTION ROLE_DIRECTION INVOLVED_SOURCE_DIRECTION ROLE_SOURCE_DIRECTION INVOLVED_TARGET_DIRECTION ROLE_TARGET_DIRECTION INVOLVED_RESULT ROLE_RESULT CO_ROLE CO_AGENT_PATIENT/CO_PATIENT_AGENT 2 2 CO_AGENT_INSTRUMENT/CO_INSTRUMENT_AGENT CO_AGENT_RESULT/CO_RESULT_AGENT 2 2 CO_PATIENT_INSTRUMENT/CO_INSTRUMENT_PATIENT 1 1 CO_PATIENT_RESULT/CO_RESULT_PATIENT 2 2 CO_INSTRUMENT_RESULT/CO_RESULT_INSTRUMENT 2 2 BE_IN_STATE STATE_OF IN_MANNER IS_MANNER_FOR DERIVATION LIABLE_TO HAS_LIABILITY IS_A_VALUE_OF 1 1 4

5 HAS_VALUE 1 1 PERTAINS_TO HAS_PERTAINED HAS_INSTANCE BELONGS_TO_CLASS FUZZYNYM XPOS_FUZZYNYM Tabella 2 Per quanto riguarda la correttezza delle relazioni, una verifica non potrebbe che essere manuale e puntuale; tuttavia anche se durante la fase di valutazione sono state riscontrate alcune relazioni quantomeno discutibili 1, il fenomeno appare di dimensione accettabile ed è qualitativamente giudicato rientrare nella norma di simili sistemi (e.g. paragonabile, almeno come ordine di grandezza, con il tasso di variazioni riscontrabili tra una versione e la successiva di Wordnet inglese). Anche le scelte effettuate in fase di costruzione, quali per esempio quelle relative all'inserimento dei nomi propri (cfr. deliverable linea 3, sez ) o ai criteri di costruzione del db economico in generale (cfr. deliverable linea 3, sez ) appaiono congruenti. L'unico criterio che lascia qualche perplessità, soprattutto rispetto ad utilizzi del database per trattamenti automatici, riguarda la gestione degli aggettivi (si veda in proposito deliverable linea1, sezioni ,2) che porta a situazioni quali quella per i colori dove, ad esempio, l'aggettivo 'rosso' ha l'aggettivo 'cremisi' sia come iponimo che come near-synonym, o a situazioni quali quelle evidenziate nel deliverable della linea3, sezione 1.1.3, dove l'iperonimia ha due valenze sostanzialmente diverse caso rosso/colorato, ignorante/privo ma sostanzialmente indistinguibili in automatico e quindi di dubbia utilità. Definizioni, glosse ed esempi non sono sempre valorizzate; solo il 45 % dei synsets ha una definizione. 2.3 Valutazione di usabilità dell'interfaccia di browsing Gli attributi che sono stati considerati per valutare l usabilità dell interfaccia per l'utente esterno di ItalWordNet appartengono all insieme di attributi che, nell ambito degli studi sulle interfacce uomo - macchina, vengono solitamente considerati per valutare globalmente l' usabilità di un sistema software (Nielsen 1995). La valutazione è stata fatta principalmente sull'interfaccia di browsing, con alcune verifiche sull'interfaccia di editing. Le verifiche sono state effettuate da personale con competenze sul sistema, ma, come dettagliato in seguito, sono stati anche effettuate sessioni con personale senza 1 Ad esempio alcuni synset legati da relazioni di iponimia e iperonimia destano perplessità e andrebbero quantomeno spiegati. E per esempio il caso di essere (definizione: ha funzione di copula ) come iperonimo di vendere, o di abbacchiare e soprattutto regalare come iponimi di vendere ( regalare nel senso di vendere a prezzo stracciato?). In altri casi alcuni synset sembrano invece perfettamente identici; ad esempio i due sensi di rivendere o i sens1 1 e 3 del verbo spacciare. O la differenza tra azioni a risparmio e azioni di risparmio. Ulteriori casi puntuali verranno riportati, a titolo di esempio, nella sezione 3. 5

6 pregressa conoscenza. In seguito vengono riportati i risultati riassuntivi delle sessioni di valutazione, sui quali concorda la totalità degli sperimentatori. Ulteriori osservazioni, formulate dai valutatori senza conoscenza pregressa del modello, vengono riportate nei successivi paragrafi. consistenza nella presentazione e nell'interazione. La presentazione grafica per i diversi tipi di oggetti è consistente è comprensibile. Gli unici dubbi riguardano: la corrispondenza, non sempre facile da effettuare tra le voci di menu associate ai bottoni Nome, Verbo Aggettivo e l insieme di relazioni che appaiono nella porzione di finestre dedicata al browsing delle relazioni. l'uso 'non standard' di elementi visuali dall'aspetto di bottoni con funzionalità di menu: ad esempio le voci di cui alla nota precedente agganciano dei menu mentre il bottone 'pulisci' sulla stessa linea e con lo stesso aspetto è un vero 'action button'. In entrambi i casi tuttavia la problematicità reale dell'aspetto è minima. Tutte le funzionalità fornite dall'interfaccia hanno un comportamento consistente; alcune voci (in particolare nell'interfaccia di editing i campi corrispondenti ai campi semantici e alla top ontology) non sono attive ma la cosa è correttamente presentata disabilitando le corrispondenti voci di menu o bottoni. E' da rimarcare tuttavia che nella versione finale del client ItalWordnet permangono due 'viste' in zona 'relazioni' che non sono mai valorizzate: 'Wordnet Inglese1.5' e 'Terminologia'; il collegamento tra Wordnet Italiano e ILI continua inoltre ad essere monodirezionale (Italiano- >ILI) e non e' possibile, inoltre, 'navigare' tra le relazioni dei synset ILI gestione degli errori. La versione finale dell interfaccia non presenta errori bloccanti: è stato verificato che errori bloccanti precedentemente riscontrati nelle precedenti versione sono stati corretti dagli sviluppatori. Le procedure di conferma per ricerche troppo lunghe non sempre sono effettuate in modo coerente (ad esempio, non viene chiesta conferma per ricerche onerose nella Top Ontology). Il sistema finale sembra comunque avere buone caratteristiche di robustezza. tempi di risposta. I tempi di risposta dell interfaccia sono soddisfacenti. I tempi più lunghi (diversi minuti) riguardano alcune ricerche nella Top Ontology, o effettuate sulla base di stringhe parzialmente specificate (cioè contenenti il carattere *). facilità d'uso. E risultato semplice imparare ad utilizzare l interfaccia di browsing e non si sono riscontrati particolari problemi nel ricordare, a distanza di tempo, le modalità di utilizzo. La cosa è leggermente più problematica per le interfacce di editing, che peraltro sono riservate ad utenti per definizione esperti. L'unica vera critica fattibile all'interfaccia e l'impossibilità di navigare nei synset partendo dalle relazioni. Ovvero dato un synset posso vedere quelli correlati nella finestra delle relazioni, ma per poter da li 'seguire le catene' occorre riportare manualmente il lemma nel campo di ricerca. adeguatezza dell'help in linea e della documentazione sul funzionamento dell interfaccia. La documentazione e l help in linea non sono disponibili. Per quanto riguarda la documentazione fornita con le API, si veda il paragrafo 1.4. task match. Le funzionalità fornite per esplorare l'organizzazione dei termini nella rete semantica sono adeguate. 6

7 2.3.1 Valutatori senza conoscenza pregressa del modello: risultati della valutazione Come accennato in precedenza, sono state effettuate due sessioni di uso da parte di utenti che non hanno mai visto il sistema raccogliendone il feedback. I due utenti sono caratterizzati in modo diverso: - Una persona con competenze su problematiche linguistiche (ma non un linguista, ovvero comunque sempre con taglio industriale) e di classificazione ma senza competenze specifiche WordNet (al di la ovviamente di sapere cos è) - Una persona totalmente al di fuori delle problematiche e di estrazione marketing/economica. In generale, i due utenti hanno valutato positivamente l interfaccia ed hanno espresso alcune osservazioni sul modello e sulla copertura. Anche se al di fuori dello scope di questa sezione di valutazione, queste osservazioni vengono riportate, poiché danno un utile indicazione delle aspettative che può avere un utente con competenze linguistiche ed un generico utente finale rispetto ad una risorsa linguistica. I risultati delle due sezioni di valutazione sono dettagliati nel seguito Valutatore con competenze di problematiche linguistiche ma senza competenze specifiche su IWN La sessione di valutazione è iniziatata senza fornire spiegazioni particolari riguardo al modello ed alla sua interfaccia. Al valutatore è stato consegnato per consultazione il documento: Specifiche Tecniche di SI-TAL Manuale Operativo. A richiesta, sono state fornite informazioni sulla semantica delle relazioni. consistenza nella presentazione e nell interazione La presentazione grafica è giudicata nel complesso consistente. Sono però state fatte le seguenti osservazioni ci si aspetta di poter selezionare iponimi ed iperonimi nella finestra della relazione, per proseguire da lì la navigazione. è fuorviante che le finestre non vengano ripulite ogni volta che si ricerca un nuovo lemma i termini appartenenti a dizionari specializzati (in questo caso, al dominio economico) dovrebbero essere evidenziati graficamente i menù associati ai bottoni Nome, Verbo e Aggettivo sono fuorvianti: si pensa diano informazioni diverse da quelle ottenibili navigando nelle finestre a partire dai synset gestione degli errori. Non si sono verificati errori durante l interazione tempi risposta I tempi di risposta sono stati giudicati ragionevoli, tranne che per le ricerche sull ontologia. In questo caso, sarebbe utile avere un warning sulla lunghezza del tempo di attesa, che dovrebbe essere quantificato. facilità uso. L interfaccia è facile da usare. Viene però giudicato fastidioso lo scorrimento del mouse sui sensi 7

8 task match. Le funzionalità di browsing sono state giudicate adeguate. Le funzionalità di editing non sono state testate. Osservazioni su copertura e comprensibilità del modello Per quanto riguarda la copertura, il valutatore ha rilevato che non sono presenti i termini utilizzati nella new economy (web, portale, sms, wap, utms), mentre sono invece presenti i nomi delle opere liriche. Lo sbilanciamento nella copertura è stato giudicato fuorviante: un help in linea dovrebbe informare l utilizzatore sulle caratteristiche della copertura. Il valutatore ha anche notato la presenza di un numero esiguo di avverbi e, in molti casi, la mancata valorizzazione di informazioni legate alle varianti. E stata anche notata la mancanza di glosse, che rende difficile discriminare tra i sensi. In questo caso il valutatore ha però sottolineato che è comunque possibile comprendere le differenze tra i sensi esaminando le relazioni. Per quanto riguarda invece la comprensibilità del modello, l utilizzatore giudica poco comprensibili i criteri di classificazione dei Basic Concept rispetto alla Top Ontology (alcuni esempi di note: può essere intuitivo che cascata e spedire siano legate con location, mentre il legame con location non si capisce per convertire, risucchiare, salare, citare ; perché fiume è un place, mentre cascata è una location?"). La riccchezza del modello e le informazioni associabili alle varianti (uso tratti) aveva inoltre suggerito la possibilità di rappresentare casi in cui le parole non sono usate nel loro senso comune, che non sono invece stati trovati all interno del dizionario. Il valutatore ha sottolineato che la possibilità di rappresentare modi di dire darebbe valore aggiunto in un sistema di analisi linguistica (esempi forniti: Caporetto nel senso di disfatta; il senso di carne nel modo di dire: non mettiamo troppa carne al fuoco ). Il valutatore non ha poi compreso il significato di alcune relazioni tra i verbi (ad esempio IS_SUBEVENT_OF, HAS_SUBEVENT, IS_CAUSED), mentre ha percepito che alcune altre (INVOLVED_AGENT, INVOLVED_LOCATION, INVOLVED_INSTRUMENT) potrebbero essere utili in un analisi linguistica, poiché possono aiutare a legare semanticamente parti del discorso che potrebbero anche essere lontane. Come ultimo punto, sono state rilevate alcune anomalie (percezione di duplicazioni di sensi, iponimi comuni) nei casi in cui un lemma è presente sia nella risorsa generica che in quella specifica (è il caso di accordo, agreement, FIAT, comprare). Valutazione finale In generale, la valutazione qualitativa dell interfaccia e della risorsa è stata positiva. Risorsa e interfaccia sono stati percepiti come funzionali all utilizzo in linguistica: il valutatore ha espresso dubbi sulla possibilità dell utilizzo della stessa da parte di un generico utente finale, a causa della complessità del modello. Si noti che, il valutatore di estrazione economica (potenziale utente finale) ha dato in questo caso giudizio opposto.. Secondo il valutatore, una possibile utile applicazione potrebbe essere quella di integrare la risorsa in una interfaccia in cui si visualizza un documento, si selezionano parole e queste vengono cercate in automatico. Dato un tipo di documento (economico, oppure legale) la ricerca si potrebbe poi effettuare in un dizionario di dominio. In questo modo la risorsa sarebbe utilizzabile come helpn-line, al posto del dizionario dei sinonimi Valutatore di estrazione marketing/economica La sessione di valutazione è stata preceduta da una breve spiegazione sulle funzionalità dello strumento e sulle caratteristiche principali del modello. La persona che ha fornito le spiegazioni ha poi assistito alla sessione di interazione con il sistema, fornendo supporto quando necessario. 8

9 consistenza nella presentazione e nell interazione Sono state fatte le seguenti osservazioni: ci si aspetta di poter selezionare iponimi ed iperonimi nella finestra delle relazioni, per proseguire da lì la navigazione. quando un lemma o una forma flessa non viene accettato, l interfaccia dovrebbe fornire una spiegazione: il generico messaggio di warning dovrebbe dare informazioni sul formato accettato i termini appartenenti al dominio economico dovrebbero essere evidenziati graficamente gestione degli errori. Non si sono verificati errori durante l interazione tempi risposta I tempi di risposta sono stati giudicati molto brevi. facilità uso. L interfaccia di browsing è stata giudicata facile da usare. Il valutatore ha cercato anche di utilizzare l interfaccia di editing, per inserire un nuovo nome proprio, ma non è riuscito nell intento. Il valutatore ha sottolineato che questa operazione dovrebbe essere facile, perchè la necessità di estendere il dizionario con nomi propri è comune per un utente finale 2. task match. Le funzionalità di browsing sono state giudicate adeguate. Osservazioni su copertura e comprensibilità del modello Il valutatore ha in generale, giudicato favorevolmente la copertura del lessico generico. Ha però rilevato la mancanza di alcuni temini specifici, ancorchè di recente introduzione nel linguaggio comune umts, gsm). E stata anche notata la mancanza di glosse, che rende difficile discriminare tra i sensi e la valorizzazione numericamente non omogenea delle relazioni. Per quanto riguarda invece la comprensibilità del modello, il valutatore giudica intuitiva ed utile l organizzazione in gruppi di sinonimi, ma di fatto sottolinea di riuscire a seguire e comprendere solo le relazioni principali tra i lemmi (iperonimia, iponimia, antinomia). Viene giudicata necessaria la presenza di un help in linea, che dovrebbe fornire alcune informazioni sul modello. Un altra informazione giudicata necessaria riguarda le fonti dalle quali sono stati estratti i nomi propri: ad esempio,mentre si può supporre che le azioni presenti siano quelle della Borsa di Milano, non si sa da dove provengano i nomi dei fondi. Anche questo valutatore ha infine rilevato alcune anomalie (percezione di duplicazioni di sensi, iponimi comuni) nel caso di un lemma è presente sia nella risorsa generica che in quella specifica (fondo). Valutazione qualitativa finale 2 L'utilizzo di ItalWordnet anche come repository di nomi propri è però un argomento delicato. E' opinione degli autori della valutazione che ItalWordnet non dovrebbe trasformarsi in un gazetter, sia per la difficoltà di manutenzione sia per la migliore adeguatezza di strumenti diversi a questo scopo. In questo senso potrebbe apparire sensato gestire classi specifiche di nomi propri (ad es. nomi comuni Paolo o nomi geografici rilevanti Italia, ma non San Casciano in Val di Pesa) o nomi che hanno assunto un significato specifico nel lessico (ad es. Don Chisciotte). Il problema è però che la cosa dovrebbe essere gestita in modo omogeneo. Se un utente trova i nomi delle azioni si aspetta anche quelli dei fondi, se trova le opere liriche si aspetta anche i Beatles. 9

10 La risorsa e l interfaccia sono state giudicate in modo molto positivo. 2.4 Valutazione di integrabilità del software Le API di IWN sono state testate sia utilizzando l interfaccia Tcl/Tk sviluppata da IRST, che integrando le chiamate di funzioni in un modulo software Java utilizzato per la realizzazione dei test di copertura, che integrando una semplice funzionalità di accesso e presentazione all'interno di un esistente sistema di classificazione realizzato in lisp, come dettagliato in seguito. Tutte le API testate funzionano correttamente e forniscono una copertura adeguata in termine di funzionalità di ricerca. Non immediata da utilizzare (se non da sistemi lisp) è però la sintassi LISPlike di output delle API: la presenza di parentesi graffe e di stringhe con apici quotati rende difficile l interpretazione dei risultati e necessario lo sviluppo di parser specifici; in caso di future estensioni si suggerisce di estendere l'api permettendo la comunicazione di strutture XML analoghe a quelle già utilizzate per l'export. La documentazione delle API, è abbastanza dettagliata da permettere l utilizzo delle funzioni. Al fine di rendere possibile la distribuzione ad utenti finali, è però necessario integrarla con alcuni esempi di utilizzo all interno di alcuni linguaggi di programmazione; sono anche state riscontrati alcuni minori disallineamenti tra la documentazione ed il codice sul formato di alcune informazioni ritornate. Al fine di iniziare a valutare i tempi medi di risposta delle funzioni di accesso si è misurato il tempo di CPU utilizzato dal programma realizzato per valutare la copertura lessicale della risorsa. Il test è stato eseguito accedendo con un client Java al server Lisp ItalWordNet, installato sulla stessa macchina (Windows NT, 256 MB RAM, processore Pentium III). Il tempo medio di risposta per la chiamata API alla funzionalità di overview (utilizzata dal programma di test) è stato di 417 ms, inclusi i tempi di lettura/scrittura su socket. 2.5 Valutazione di copertura del lessico La valutazione di copertura è stata effettuata in automatico utilizzando 3 diversi corpora, tutti relativi al dominio economico finanziario, rispetto al data base 'plugin' che ingloba i data base generico e finanziario. I tre corpus utilizzati sono stati i seguenti: test_parole: 137 testi dal corpus Parole (So sgm, ricevuto da ILC, lo stesso utilizzato per l'annotazione della TreeBank), test_rco1: 999 notizie di agenzia, fonte Radiocor, prodotte nel Giugno Il corpus non è distribuibile. test_rco2: 298 notizie di agenzia, fonte Radiocor, prodotte nel Marzo 2001 (onde avere una copertura differita nel tempo, al fine di evidenziare eventuali shift nella terminologia usata) Per ciascuno dei tre corpus, analizzato separatamente, sono state estratte in maniera automatica due liste di termini. La prima comprende tutti i termini che compaiono nel corpus, con associata la relativa PoS, la seconda ha lo stesso formato ma comprende i soli termini che compaiono nei 10

11 pattern di classificazione effettivamente utilizzati dal sistema di classificazione Quinary (QClassifier) nella classificazione dei testi del corpus. L'utilizzo di questa seconda lista permette di valutare la copertura su un subset giudicato più rilevante, nel senso che comprende sicuramente termini di qualche interesse per un applicazione reale. La PoS ricavata è quella determinata dal sistema di classificazione durante l'analisi; la determinazione è basata sui tool LinguisticX della InXight, inclusi nel sistema di classificazione, che utilizzano tecnologie statistiche. Come vedremo, alcuni buchi nella copertura sono stati causati da erronee assegnazioni di part of speech; è rilevante notare tuttavia, che tali errori sono 'endogeni' nell'uso di qualsiasi tool di tagging e il sistema della InXight non è peggiore della media e quindi la valutazione della rilevanza del fenomeno è comunque utile. Le 6 liste sono quindi state analizzate da un semplice programma Java che andava a verificare la presenza del termine in ItalWordNet, producendo in output una lista di termini che compaiono nel corpus (con PoS congruente) e una lista di termini mancanti (o mancanti rispetto alla PoS assegnata). I 6 test (uno per ognuna delle due liste dei tre corpus) sono stati effettuati sul corpus as is, ovvero senza eliminare preventivamente (cosa che era stata fatta per i test di fase 1.2) l insieme di token corrispondenti a errori tipografici (es. CAPACVIT`), sigle ed altri elementi spuri. Questo al fine di avere una valutazione non solo della copertura rispetto ad un testo ideale ma anche rispetto a testi reali, contenti un normale rumore dovuto ad errori o altro. Alcuni elementi che sono stati però eliminati manualmente in fase di analisi dei risultati, relativi a errori del sistema di classificazione dovuti a malfunzionamenti noti nella fase di preprocessing e già in via di correzione (principalmente errate separazioni in specifici token composti quali 'settembre-ottobre', che sono trattati dal sistema salvo in alcuni casi verificati durante il test) 3, e, nel caso di due dei corpus, la presenza di numeri legati ad un errore nella procedura di estrazione. Nella tabella che segue i dati della colonna 'Pruned' sono i dati dopo la rimozione manuale dei suddetti errori. Nella stessa tabella, la colonna 'Pruned2' riporta quanto rimasto dopo un ulteriore filtro manuale che ha rimosso nomi propri e termini non Italiani 4. E' da notare che sono però stati rimossi solo termini inglesi e francesi non in uso corrente, lasciando invece TUTTI i termini non italiani ma che sono oramai entrati in uso comune (es. pay-tv, web, trader) e quelli che, pur non essendo parte del lessico dell'italiano medio, fanno però ormai parte della terminologia accettata nel mondo finanziario (stock-option, buyback, strike ) e che sarebbe quindi lecito aspettarsi di trovare in un lessico specifico per il mondo economico finanziario 5. Totali Matched Not Matched Time 6 Pruned % Pruned2 3 La motivazione legata all'eliminazione di tali elementi spurii ma non di quelli introdotti, ad esempio, dall'attribuzione della part of speech, è che mentre i primi sono stati assimilati ad errori software correggibili (e di fatto in fase di correzione) i secondi sono di fatto endogeni dato lo stato dell'arte attuale della tecnologia e quindi non è sensato assumerne l'assenza. 4 Nel primo corpus si verifica un alta percentuale di termini non Italiani, a causa di un paio di notizie che includevano parti sostanziali in francese. 5 Tanto che infatti alcuni termini appaiono nel sistema, anche se con coperture abbastanza anomale: ad esempio è presente webmaster ma non web. 6 Tempo medio, in millisecondi, per una richiesta sui dati. 11

12 Rco1 texts % % Rco1 matches % % Rco2 texts % % Rco2 matches % % Parole texts % % Parole matches % % Tabella 3 Sui risultati ottenuti (ovvero sulle liste di termini 'pruned2') è stata poi effettuata un'ulteriore analisi manuale, in modo da determinare le principali classi di errori. In particolare sono stati identificati tutti gli errori causati da: Errori di battitura (colonna 'typo'). Notabilmente assenti nel corpus derivato da Parole, non a caso verificato manualmente a monte. Errori legati alla presenza di termini composti, ove la composizione fosse arbitraria e quindi non con valenza terminologica ad esempio 'economico-finanziario' ma non 'pro-soluto' o 'pay-tv' (colonna 'compound'). Errori dovuti ad errata assegnazione di part of speech o di estrazione della radice del lemma da parte del sistema di analisi (Qclassifier); es. 'espositori' ove il lemma 'espositore' esiste (colonna pos1) Errori dovuti a mancato riconoscimento a causa della necessità di derivazioni complesse. (colonna pos2). I casi più comuni sono 1. participi usati in forma aggettivale: es. 'indicizzato' (dove esiste indicizzare). 2. Diminutivi: es. pochino 3. Verbi riflessivi: es. posizionarsi (dove esiste posizionare) si noti peraltro che per alcuni verbi in IWN viene fornita anche la voce riflessiva 4. Nomi o aggettivi di derivazione verbale: es posizionamento, marginalizzazione dove esiste la voce verbale anche qui peraltro esistono casi in IWN in cui è presente anche la voce derivata 5. Verbi derivati via prefissi: es predefinire anche qui notare che altri esistono es preavvisare. Occorre notare che la problematica sottesa da questa casistica è non sorprendentemente rilevante, se non in termini quantitativi, in termini qualitativi, visto che i termini in questione possono essere spesso oggetto di analisi e portano informazione spesso rilevante. Inoltre, se il caso 1 è spesso gestito/gestibile a monte (ad es. nel caso dell'analizzatore utilizzato il sistema determina la root form sulla base della part of speech, che è spesso corretta ovvero ad es. 'indicizzato' è davvero usato in forma aggettivale, ma determina anche il lemma del verbo, e quindi il problema è aggirabile), nei casi 3,4,5 lo è molto meno. I risultati sono riassunti nella tabella seguente; la colonna 'Pruned3' riporta la mancata copertura sottratti gli errori appena descritti. Matched Pruned2 Compound Typo Pos1 Pos2 Pruned3 Rco1 texts % % 12

13 Rco1 matches % % Rco2 texts % % Rco2 matches % % Parole texts % % Parole matches % % Tabella 4 Gli errori non coperti dalla casistica precedente (ovvero quelli riportati nella colonna pruned3) riguardano principalmente avverbi, sigle o abbreviazioni (es. TLC telecomunicazioni o IT information technology) entrate nell'uso comune, termini di derivazione straniera. A titolo di esempio riportiamo: i 25 termini della colonna 'pruned3' del test effettuato sul corpus 'Parole matches': Anche Fotografico Intanto Multimedia Quasi Cassaintegrato Infine Invece Nickel Quinquennale Circa Inoltre Israelitico Oltre Rating Destagionalizzato Inossidabile Lavorativo Pay-Tv Tlc Ferroso Inottemperanza Manifatturiero Pro-Soluto Trentennale Tabella 5 7 e i 274 termini della colonna 'pruned3' del test effettuato sul corpus Rco1 texts: 7 E' da notare come tutti gli avverbi segnalati come mancanti in questa tabella in realtà non fossero previsti - gli avverbi previsti sono quelli in mente derivati dagli aggettivi. 13

14 A.D. Cw Indietro Networking Redine Abbastanza Da Industriare Neutro-Negativo Regolatoria Addirittura Daccapo Infine Newsletter Report Adesso Davvero Information Nordcoreano Ricentrarsi Allora Daytrader Ingrosso Nordcoreano Ricomprese Almeno Debacle Innanzitutto Number Ridenominare Altrimenti Desk Inoltre Odg Riequilibrio Anche Destagionalizzati Insider Offshore Rilento Anticompetitive Devise Insomma Oltre Rimarcare Antiriciclaggio Diesel Intanto Oltrefrontiera Riofferta Appena Dietro Intenzionato Oltreoceano Risospesa Apprezzatori Difatto Intercoreani Online Risospeso Aprilegiugno Digitalizzazione Intergovernativo Options Risponditore Assai Digitazione Intergruppo Oramai Risultanza Asset Diligence Intermarket Ormai Roaming Attivita Dilutivo Interoperativi Osta Roe Azero Discount Interoperativo Overbidding Sanzionatori Bank Disdettato Interoperativo Parimenti Scalettati Banking Dismettere Intorno Parita Segmentare Benefit Dismissione Intraday Paritario Sempre Benino Dismissioni Introduction Peraltro Sharing Blue-Chips Dopo Invece Perfino Shortlist Board Dopodomani IT Persino Sim Borsini Itinere Pesos Spin-Off Buyback Ebitda Joint Piuttosto Split Cadauna Ebusiness JV Player Spread Call Ecco Kilobytes Plenario Start-Up Canosani Econometrici Lab Plus Stazionare Cartolarizzazione Economy Lariano Pochino Stereo Cash-Flow Ennesimo Lead Pole Stilare Catering Entertainment Leveraged Poltronissima Stock-Options Chaebol Entita Macro Post Strike Chaebol Esprit Made Pound Strip Chip Extracaratteristica Made Pre Suddetto Circa Fino Mai Predefinire Supplente Clicca Finora Manovrina Preferred Switching Close Flat Mappatura Pregressa Taiwanese Collocatore Flow Martedi Previo Tanto Commerce Frattempo Master Price-Cap Tech Commodities Global Max Procapite Telco Competitor Global Maxiplusvalenze Processing Tempistico Composite Golden Megawatt Procinto Tlc Comunque Graficisti Merchant Proforma Tracking Consecutivo Hi-Tech Microchip Prosegure Trading Consensus High Microdanni Pure Trentennale Consumer Hit Mini-Stretta Purtroppo Turnover Consuntivati Hoc Modus Put Tuttora Contempo Hub Mol Quale Ultraprotetto Contraltare Illiquida Monitorando Quali Unbundling Controdeduzione Immobiliaria Multicanale Quasi Unifamiliare Contropa Impugnativa Multimediale Quinquennale Utilities Coordinator Incirca Multiutility Range Validazione Corporation Income Neanche Rating Viceministro Crash Incubatore Neoministri Ratio Web Customizzati Neppure Rc Wireless Tabella 6 14

15 La copertura sembra in definitiva ragionevole. La mancanza maggiore al di la della problematica evidenziata sulla terminologia 'derivazionale' - è su terminologia specialistica e in particolare modo per termini 'nuovi', ma il difetto si può ritenere purtroppo inevitabile, come in qualsiasi risorsa linguistica non legata ad una lingua morta. Della cosa occorre peraltro tenere il dovuto conto per il futuro in quanto indica chiaramente (se mai fosse necessario) la necessità di un attività continuativa di manutenzione dopo la conclusione del progetto. 2.6 Valutazione di usabilità dell'interfaccia di editing L' applicazione di accesso al sistema permette anche l'estensione della banca dati di ItalWordnet. L'interfaccia di editing risulta abbastanza agevole da usare, anche se leggermente meno intuitiva dell'interfaccia di browsing 8. E' da sottolineare peraltro che sarebbero utili strumenti che permettano il tracking delle modifiche, e possibilmente l'export selettivo (e di contro l'import di quanto prodotto) in modo da poter facilitare un aggiornamento distribuito su diversi siti. E' ovvio che una risorsa quale IWN non può che essere soggetta ad una gestione in qualche modo centralizzata per garantirne la coerenza, ma sarebbe opportuno che la centralizzazione si riducesse alle attività di 'merge' controllate, permettendo la distribuzione delle attività di inserimento ed estensione. 3 Valutazione sperimentale Obiettivo prioritario della attività era quello di permettere una valutazione della risorsa ItalWordNet in un caso di possibile uso concreto, in modo da poter verificare copertura linguistica e reale utilizzabilità. Il caso prescelto in fase di pianificazione era stato l estensione di un sistema di classificazione esistente presso Quinary ed attualmente in uso in produzione presso un importante fornitore di informazione finanziaria Italiano. La scelta fatta era legata principalmente ai seguenti fattori: 1. La rilevanza della tematica, ovvero, ovviamente, la potenziale utilità della risorsa ItalWordNet nel caso specifico. 2. La piena disponibilità e controllo da parte di Quinary dell attuale sistema di classificazione (sviluppato internamente) e la conseguente possibilità da un lato di estendere ed integrare il sistema, dall altro di poter effettuare valutazioni comparate sui benefici ottenuti o comunque ottenibili. Per quanto attiene la rilevanza della tematica, l attuale sistema di classificazione, che verrà descritto con qualche maggiore dettaglio in un successivo paragrafo, è basato su tecnologie euristiche di pattern matching, ove le entità oggetto del match (le feature di classificazione) sono di fatto entità linguistiche concettuali. Il sistema attuale è interamente knowledge based, nel senso di essere basato su: 8 Essendo però destinata per definizione a personale competente, tale minor intuitività è decisamente qui meno rilevante. 15

16 strutture definenti conoscenza di dominio tra le diverse entità di interesse per il mondo finanziario (ad es. leganti i concetti di mercato azionario e di indice di mercato), una codifica esplicita delle regole di mapping tra feature linguistiche ed entità concettuali (via pattern matching) regole esplicite di mapping tra quelle che sono le entità concettuali rilevate nei testi e le voci di classificazione finale. Mentre il primo e l ultimo punto sono legati ad aspetti sostanzialmente non lessicali e linguistici, il secondo punto è invece in toto condizionato da aspetti linguistici. Nell attuale sistema la codifica dei pattern che permettono di effettuare un match di entità concettuali è totalmente effettuata in modo manuale. L idea era quindi quella di verificare quanto simili attività possano essere supportate o addirittura almeno in prospettiva sostituite da strumenti linguistici, e in particolare supportati dall utilizzo della risorsa ItalWordNet. 3.1 Il sistema di classificazione attuale Il sistema di classificazione considerato è il sistema QClassifier, derivato da quanto sviluppato nei progetti Cobalt (LRE-xxx) e Facile (LE 2440) ([Gilardoni 94],[Ciravegna 99]), entrambi parzialmente sponsorizzati dalla Comunità Europea. Il sistema è attualmente in uso presso un rilevante fornitore di informazione finanziaria a livello nazionale, dove è utilizzato per classificare in tempo reale e in maniera totalmente unsupervised le notizie prodotte dall agenzia. Il sistema è basato su un approccio totalmente knowledge-based, e utilizza tecniche di pattern matching integrate con strumenti di rappresentazione della conoscenza per permettere di sfruttare una rappresentazione ricca del dominio. Il processo di classificazione opera sostanzialmente in due fasi. Nella prima fase il testo, dopo aver subito un pretrattamento (zoning e preprocessing) che permette l identificazione della struttura del testo (frasi e periodi, inclusa l identificazione di aree strutturalmente rilevanti quali il titolo) la suddivisione in frasi e quindi in token, l aggancio di informazioni linguistiche di base (part of speech e informazioni morfologiche) e l identificazione di entità speciali (numeri, date, nomi propri etc.) viene matchato contro un insieme di concetti, sulla base di un insieme di pattern para-linguistici. Il risultato della prima fase è l identificazione nel testo in esame di una serie di concetti esplicitamente menzionati nel testo. Ad esempio un testo contenente ha chiuso il 2000 con un utile netto consolidato pari a 91.7 miliardi porterà all identificazione dei due concetti COMPANY_YEAR_RESULTS (da: ha chiuso il 2000 con un utile.. ) e INCOME_STM_ITEMS (da utile netto consolidato ). 16

17 Tokenized Tagged Text MorphoSyn info, Entities recognition Preprocessor Text Zoner Marked Up Text Shallow Analyzer Concept Matches Control Module Categories Enriched Marked Up Text Figura 1 Nella seconda fase, i risultati del match vengono considerati da una serie di regole euristiche che determinano la classificazione, sulla base di criteri redazionali: ad esempio la notizia che conteneva il frammento dell esempio era classificata come ANNUALE sulla base della presenza dei due match suddetti e dell assenza di concetti legati a commenti di borsa (onde evitare la classificazione ANNUALE nel caso di notizie dove il riferimento agli utili è solo un sidebar essendo il cuore della notizia centrato sull andamento della borsa in generale). Il sistema è attualmente strutturato in modo da sfruttare pesantemente una rappresentazione concettuale esplicita e ricca del dominio. L insieme dei concetti è strutturato come una rete semantica, e la struttura gerarchica può venire sfruttata sia nelle regole euristiche di classificazione sia nelle strutture di pattern legate ai concetti. company_results company_industrial_results new_company_plants company_orders impact_on_sector form_companies_agreement new_product_and_processes form_joint_ventures merging_and_acquisition company_financial_situation_data Figura 2 Occorre però notare che la rete semantica strutturante l insieme dei concetti, denota entità di dominio e non entità linguistiche, ed è costruita e strutturata ai fini classificatori ed indipendentemente dagli aspetti linguistici. Ad esempio esiste un concetto AZIONE che denota il 17

18 noto strumento finanziario. Ma ovviamente non esiste il concetto CANE, in quanto non rilevante sul dominio, e neppure, analogamente, il concetto di azione come azione di gioco etc. Per analoghi motivi, esistono nella attuale KB i concetti di AZIONE_DI_RISPARMIO, AZIONE_ORDINARIA e AZIONE_PRIVILEGIATA (tutti ISA AZIONE ) ma non quelli di AZIONE_QUOTATA, non tanto perché il concetto non abbia ragione in astratto di esistere ma perché non ha ragione di esistere ai fini classificatori specifici - ovviamente lo avrebbe, ed andrebbe aggiunto, qualora occorresse per qualche ragione distinguere le azioni quotate da quelle non quotate. Le scelte sono in questo caso guidate da criteri pragmatici rispetto ai desiderata di discriminazione; ovvero il problema della sense disambiguation è parzialmente risolto alla radice non comprendendo sensi non rilevanti. Il criterio di concettualizzazione ovvero di inserimento nella conoscenza del sistema è quindi legato sostanzialmente a due aspetti: la rilevanza ai fini discriminatori (come dall esempio di cui sopra) ovvero in funzione della possibilità di definire regole euristiche, e l utilità ai fini di partizionamento della conoscenza, legata al fatto che pattern lessicali agganciati ad un concetto possono far riferimento ad altri concetti. Questo secondo aspetto va a coprire la necessità di partizionamento della conoscenza in modo da permettere una migliore gestibilità del sistema. L approccio scelto, basato sulla codifica manuale di pattern di match e regole euristiche, permette di raggiungere ([Gilardoni 95],[Ciravegna 2000]) gradi di accuratezza elevati, con valori di recall e precision 9 attorno al 90%, tanto da permettere un funzionamento totalmente autonomo, come provato dal sistema in produzione presso Il Sole 24 Ore Radiocor, funzionante in modo totalmente unattended. L'ovvio svantaggio di un simile approccio è dovuto ai tempi di sviluppo, legati alle attività di analisi e codifica manuali, con impatto negativo sia sui tempi di rilascio di nuove applicazioni ovvero con copertura di domini diversi sia sui costi complessivi. L'utilizzo di tecniche di modellazione basate su un sistema di rappresentazione ricco permettono di ridurre i tempi ed alleviare gli oneri, ma strumenti di ausilio nella codifica e nell'analisi sono fortemente desiderati. 3.2 Il caso sperimentale L idea alla base del caso sperimentale era verificare come l'utilizzo di una risorsa come IWN potesse supportare l'attività dell'ingegnere del linguaggio nella costruzione o nell'estensione di un'applicazione di classificazione, o, idealmente quali attività potessero essere sostituite in toto da strumenti costruiti sopra IWN. Il primo aspetto, ovvero il supporto nella codifica della conoscenza, è ottenibile anche solo da un utilizzo diretto della risorsa in consultazione. Il processo di codifica è attualmente basata su un 9 L accuratezza dei sistmi di information retrieval è stata storicamente misurata in termini delle due grandezze denominate precision e recall, che misurano rispettivamente il rumore introdotto e l accuratezza. Formalmente, denominati POS l insieme dei testi classificabili rispetto ad una query (nel nostro caso, associati ad una chiave di classificazione), ACT l insieme dei testi classificati dal sistema, e COR l insieme POS ACT di quelli classificati correttamente, si ha: Recall (REC) = COR/POS Precision (PRE) = COR/ACT 18

19 processo iterativo di analisi di esempi di testi, con l'identificazione di concetti rilevanti e dei relativi pattern lessicali, di test su insieme allargato di testi (con la relativa problematica di identificazione di quelli rilevanti), e quindi di espansione e raffinamento della rete di concetti identificata. A titolo di esempio sul processo, possiamo considerare le attività legate alla definizione della conoscenza necessaria ad identificare testi legati ad un ipotetica categoria 'compravendita di azioni'. Il primo step è ovviamente quello di caratterizzare la categoria rispetto ai desiderata. In generale la cosa è ottenuta interagendo con un esperto di dominio (es. un giornalista di una redazione economica) e caratterizzando la categoria in termini di concetti finanziari e di esempi (ed eventualmente controesempi). Nel caso in esempio la caratterizzazione informale potrebbe essere: "tutte le notizie che menzionano la compravendita di azioni o quote azionarie, dove si menzionino esplicitamente gli attori o le azioni (ovvero non notizie generali che parlano del volume di scambi in borsa o di livelli di prezzi)". Un esempio potrebbe essere: "In base all'accordo, la SingTel acquistera' il 14,48% delle azioni della Time", oppure " I titoli venduti al di fuori degli Stati Uniti..". A questo punto il processo richiede la costruzione di un pattern di 'seed', generalizzato sulla base degli esempi e dell'intuizione/conoscenza dell'ingegnere del linguaggio. Nel nostro caso la radice potrebbe essere, semplicemente: "comprare (V) NEAR azione (N)" e l'immediata generalizzazione: "(comprare +V 10 OR vendere +V) NEAR (azione +N OR titolo +N)" Il pattern di seed attraverso l'analisi di esempi è poi esteso a coprire i casi significativi. Al termine dell'analisi il risultato sarà qualcosa del tipo 11 : Defconcept share_ pattern: ( ((blue (chip OR chips)) OR blue-chip OR blue-chips) OR ((NOT (campo di) azione +N) OR (titolo +N (NOT (di stato OR del tesoro OR quinquennale OR trentennale OR decennale))) Defconcept share_ purchase pattern: ((((NOT non) (comprare +V OR acquisizione OR acquistare +V OR riacquistare +V OR vendere +V OR vendita OR cessione)) (NEAR 6 (#$concept-global share_ ))). Ora, è evidente che almeno in linea di principio le attività di espansione del pattern seed potrebbero essere in parte automatizzate o quantomeno supportate dall'utilizzo di IWN I tag '+V', '+N' indicano l'uso del lemma come verbo o nome rispettivamente, ammettendo le diverse varianti morfologiche; quindi un pattern come il suddetto coprirà "Compreranno azioni", "Hanno comprato azioni" etc. 11 L'esempio è reale ma semplificato. Nel caso del sistema in uso presso il fornitore di notizie finanziarie esiste effettivamente un concetto di share_, mentre il concetto di compravendita è per ragioni qui non rilevanti spaccato nei due aspetti di acquisto e vendita; inoltre i pattern sono stati notevolmente semplificati sia come sintassi che come contenuti. 19

20 3.2.1 Navigazione nella rete un esempio. Per verificare il processo, è stata considerato il pattern iniziale 'comprare azioni', e sono stati analizzati i possibili 'percorsi' derivabili utilizzando IWN. Premessa generale sui risultati: per ogni lemma cercato in ItalWordNet abbiamo riportato tutti i synset ricavati dalla relazione di sinonimia, iperonimia, iponimia e antonimia (se presenti) e altre relazioni che potevano essere utili. Per ogni synset abbiamo riportato il senso, i sinonimi, la definizione (se presente), i concetti dell ontologia a cui il synset è legato e i campi semantici (valorizzati solo nel DB economico). Nelle tabelle dei risultati le righe in grigio riportano synset già ritornati da ricerche precedenti (riportati ugualmente per completezza). La multiword comprare azioni non esiste in ItalWordnet. Esiste però acquisto di azioni : senso valori Definizione concetti ontologia Campi semantici acquisto di azioni SINONIMI 1 acquisto di azioni#1 object possession - Exchange dynamic IPERONIMI 1 compera#1 acquisto#1 object possession - Commerce dynamic IPONIMI 1 acquisto di azioni proprie#1 object possession Exchange 1 acquisto di azioni improprie#1 Tabella 7 dynamic object possession dynamic Exchange L' iperonimo è assolutamente generico, anche se già indica la variante 'comprare' rispetto ad 'acquistare'. I due iponimi sono significativi 13 ma giudicati non rilevanti ai fini specifici applicativi (ovvero in questo momento non interessa la distinzione). Scomposto comprare azioni in comprare verbo e azione nome sono stati analizzati i due lemmi. senso valori Definizione concetti ontologia campi semantici comprare SINONIMI 1 comperare#1 acquistare#1 ottenere in proprietà dando del possession, dynamic comprare#1 denaro 2 comperare#2 compare#2 corrompere con denaro cause 3 acquistare#5 comprare#3 possession - dynamic commerce, economy 12 Un diverso utilizzo di IWN nell'ambito del processo visto, ma che non è stata qui considerato, è legato all'identificazione da un corpus, tramite tecniche statistiche, dei synset utilizzati nel corpus; se il corpus è anche taggato rispetto alle categorie rilevanti ai fini classificatori, diventa possibile identificare le possibili 'seed' concettuali legate in qualche modo alla classificazione, fornendo quindi supporto anche nell'identificazione degli elementi rilevanti. 13 Occorre peraltro notare che mentre 'azioni proprie' ha un preciso senso in campo finanziario, 'azioni improprie' non è chiaro se sia stato inserito per complementarietà (ma allora il termine non risulta usato) o con altro significato (difficile da determinare in assenza di glosse od esempi). 20

Costruzione di risorse terminologiche: criteri, risultati e prodotti disponibili. Rita Marinelli Rita.Marinelli@ilc.cnr.it

Costruzione di risorse terminologiche: criteri, risultati e prodotti disponibili. Rita Marinelli Rita.Marinelli@ilc.cnr.it Costruzione di risorse terminologiche: criteri, risultati e prodotti disponibili Rita Marinelli Rita.Marinelli@ilc.cnr.it ILC: database terminologici Sono state sviluppate tre risorse terminologiche appartengono

Dettagli

Relazione Pinakes3 Analisi modello di business (BOZZA) di Valeriano Sandrucci 08/09/07

Relazione Pinakes3 Analisi modello di business (BOZZA) di Valeriano Sandrucci 08/09/07 Relazione Pinakes3 Analisi modello di business (BOZZA) di Valeriano Sandrucci 08/09/07 1. Introduzione...3 1.2. Application vs Tool... 3 2. Componenti logiche di un modello... 6 3. Ontologie e Semantic

Dettagli

ITALIANO: competenza 1 - TERZO BIENNIO. classe V scuola primaria e classe I scuola secondaria COMPETENZE ABILITA CONOSCENZE

ITALIANO: competenza 1 - TERZO BIENNIO. classe V scuola primaria e classe I scuola secondaria COMPETENZE ABILITA CONOSCENZE ITALIANO: competenza 1 - TERZO BIENNIO classe V scuola primaria e classe I scuola secondaria COMPETENZE ABILITA CONOSCENZE Interagire e comunicare verbalmente in contesti di diversa natura Quando ascolta,

Dettagli

Processi (di sviluppo del) software. Fase di Analisi dei Requisiti. Esempi di Feature e Requisiti. Progettazione ed implementazione

Processi (di sviluppo del) software. Fase di Analisi dei Requisiti. Esempi di Feature e Requisiti. Progettazione ed implementazione Processi (di sviluppo del) software Fase di Analisi dei Requisiti Un processo software descrive le attività (o task) necessarie allo sviluppo di un prodotto software e come queste attività sono collegate

Dettagli

PIANI DI STUDIO D'ISTITUTO ISTITUTO COMPRENSIVO BASSA ANAUNIA SCUOLA MEDIA DI DENNO A.S. 2012-2013 ITALIANO_CLASSE SECONDA

PIANI DI STUDIO D'ISTITUTO ISTITUTO COMPRENSIVO BASSA ANAUNIA SCUOLA MEDIA DI DENNO A.S. 2012-2013 ITALIANO_CLASSE SECONDA PIANI DI STUDIO D'ISTITUTO ISTITUTO COMPRENSIVO BASSA ANAUNIA SCUOLA MEDIA DI DENNO A.S. 2012-2013 ITALIANO_CLASSE SECONDA PSI_ITALIANO QUARTO BIENNIO_CLASSE SECONDA COMPETENZA ABILITA CONOSCENZE Competenza

Dettagli

Progetto Finale: Modelli semantici dei dati in domini applicativi specifici

Progetto Finale: Modelli semantici dei dati in domini applicativi specifici Progetto Finale: Modelli semantici dei dati in domini applicativi specifici Roberto Basili, Marco Pennacchiotti Corso di Fondamenti di Informatica a.a. 2003-2004 Definizioni Generali e Regole d esame Il

Dettagli

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence Introduzione Definizione di Business Intelligence: insieme di processi per raccogliere

Dettagli

MICROSOFT ACCESS. Fabrizio Barani 1

MICROSOFT ACCESS. Fabrizio Barani 1 MICROSOFT ACCESS Premessa ACCESS è un programma di gestione di banche dati, consente la creazione e modifica dei contenitori di informazioni di un database (tabelle), l inserimento di dati anche mediante

Dettagli

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE Il sistema di ricerca della biblioteca virtuale permette di accedere in maniera rapida ai materiali didattici di interesse degli studenti presenti all interno del

Dettagli

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE di K A T H A G E D O R N, A R G U S A S S O C I A T E S MARZO 2 0 0 0 traduzione di: BARBARA WIEL MARIN DICEMBRE 2009 1 GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

Dettagli

Gruppo italiano di Meccanica Applicata. Istruzioni per la compilazione del modulo per il monitoraggio della didattica del gruppo GMA

Gruppo italiano di Meccanica Applicata. Istruzioni per la compilazione del modulo per il monitoraggio della didattica del gruppo GMA Gruppo italiano di Meccanica Applicata Istruzioni per la compilazione del modulo per il monitoraggio della didattica del gruppo GMA Maggio 2003 Indice del documento Pag. In generale 1 1 - Sezione 1 Informazioni

Dettagli

Code Architects S.r.l. SWOP Semantic Web-service Oriented Platform B2SO201

Code Architects S.r.l. SWOP Semantic Web-service Oriented Platform B2SO201 UNIONE EUROPEA FONDO EUROPEO DI SVILUPPO REGIONALE. REGIONE PUGLIA AREA POLITICHE PER LO SVILUPPO IL LAVORO E L INNOVAZIONE Modello M14 Allegati RTA POR PUGLIA 2007-2013 - Asse I Linea 1.1 Azione 1.1.2

Dettagli

SOLUZIONE Web.Orders online

SOLUZIONE Web.Orders online SOLUZIONE Web.Orders online Gennaio 2005 1 INDICE SOLUZIONE Web.Orders online Introduzione Pag. 3 Obiettivi generali Pag. 4 Modulo di gestione sistema Pag. 5 Modulo di navigazione prodotti Pag. 7 Modulo

Dettagli

aided content analysis)

aided content analysis) T-Lab Stefano Nobile L analisi del contenuto computerizzata (computer aided content analysis) I software in commercio per l analisi l del contenuto computerassistita possono essere distinti in due grandi

Dettagli

Lo strumento. di Business Intelligence alla portata di tutti

Lo strumento. di Business Intelligence alla portata di tutti B USINESS I NTELLIGENCE Lo strumento di Business Intelligence alla portata di tutti Modulo INFOREADER INFOREADER è il modulo di INFOBUSINESS che consente di abilitare la postazione di lavoro alla visualizzazione

Dettagli

SINPAWEB corso per Tecnico della programmazione e dello sviluppo di siti internet e pagine web co.reg 58036 matricola 2012LU1072

SINPAWEB corso per Tecnico della programmazione e dello sviluppo di siti internet e pagine web co.reg 58036 matricola 2012LU1072 Provincia di Lucca Servizio Istruzione, Formazione e Lavoro. Sviluppo Economico SINPAWEB corso per Tecnico della programmazione e dello sviluppo di siti internet e pagine web co.reg 58036 matricola 2012LU1072

Dettagli

Legge 808/85 Vademecum per la compilazione della domanda di finanziamento. Divisione VIII Industria dell'aerospazio e della difesa

Legge 808/85 Vademecum per la compilazione della domanda di finanziamento. Divisione VIII Industria dell'aerospazio e della difesa Ministero dello Sviluppo Economico Dipartimento per l Impresa e l Internazionalizzazione Direzione generale per la politica industriale e la competitività Divisione VIII Industria dell'aerospazio e della

Dettagli

Sistemi Informativi e WWW

Sistemi Informativi e WWW Premesse Sistemi Informativi e WWW WWW: introduce un nuovo paradigma di diffusione (per i fornitori) e acquisizione (per gli utilizzatori) delle informazioni, con facilità d uso, flessibilità ed economicità

Dettagli

&RUVRGLLQWURGX]LRQH DOO LQIRUPDWLFD. Microsoft Word. Tutorial

&RUVRGLLQWURGX]LRQH DOO LQIRUPDWLFD. Microsoft Word. Tutorial &RUVRGLLQWURGX]LRQH DOO LQIRUPDWLFD Microsoft Word Tutorial Sommario Introduzione Formattazione del documento Formattazione della pagina Layout di pagina particolari Personalizzazione del documento Integrazione

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

KNOWLEDGE MANAGEMENT. Knowledge Management. Knowledge: : cos è. Dispense del corso di Gestione della Conoscenza d Impresa

KNOWLEDGE MANAGEMENT. Knowledge Management. Knowledge: : cos è. Dispense del corso di Gestione della Conoscenza d Impresa KNOWLEDGE MANAGEMENT Pasquale Lops Giovanni Semeraro Dispense del corso di Gestione della Conoscenza d Impresa 1/23 Knowledge Management La complessità crescente della società, l esubero di informazioni

Dettagli

Indice del volume. 1 La comunicazione 2. 1 Per una corretta pronuncia. 2 Quale italiano? La nostra lingua, 2 Scrivere senza errori 39

Indice del volume. 1 La comunicazione 2. 1 Per una corretta pronuncia. 2 Quale italiano? La nostra lingua, 2 Scrivere senza errori 39 Parte I Premesse teoriche per un uso consapevole della lingua 1 Dal latino all italiano Come leggere i messaggi pubblicitari 1 La comunicazione 2 1 Cos è la comunicazione: significante, significato, segno

Dettagli

Ingegneria del Software Requisiti e Specifiche

Ingegneria del Software Requisiti e Specifiche Ingegneria del Software Requisiti e Specifiche Obiettivi. Affrontare i primi passi della produzione del software: la definizione dei requisiti ed il progetto architetturale che porta alla definizione delle

Dettagli

Introduzione alla Business Intelligence

Introduzione alla Business Intelligence SOMMARIO 1. DEFINIZIONE DI BUSINESS INTELLIGENCE...3 2. FINALITA DELLA BUSINESS INTELLIGENCE...4 3. DESTINATARI DELLA BUSINESS INTELLIGENCE...5 4. GLOSSARIO...7 BIM 3.1 Introduzione alla Pag. 2/ 9 1.DEFINIZIONE

Dettagli

RISORSE LINGUISTICHE PER LA LINGUA ITALIANA SCRITTA

RISORSE LINGUISTICHE PER LA LINGUA ITALIANA SCRITTA RISORSE LINGUISTICHE PER LA LINGUA ITALIANA SCRITTA NICOLETTA CALZOLARI Istituto di Linguistica Computazionale del CNR - Pisa glottolo@ilc.cnr.it Introduzione Il costo, lo sforzo, la varietà di competenze

Dettagli

BANCA CENTRALE EUROPEA

BANCA CENTRALE EUROPEA 14.12.2010 Gazzetta ufficiale dell Unione europea C 337/1 I (Risoluzioni, raccomandazioni e pareri) PARERI BANCA CENTRALE EUROPEA PARERE DELLA BANCA CENTRALE EUROPEA del 19 novembre 2010 in merito ad una

Dettagli

La metodologia di valutazione dei siti Web della Pubblica Amministrazione. La metodologia di valutazione

La metodologia di valutazione dei siti Web della Pubblica Amministrazione. La metodologia di valutazione La metodologia di valutazione dei siti Web della Pubblica Amministrazione P. Atzeni, P. Merialdo, P. Russo, G. Sindoni, G. Sissa Paolo Merialdo Dipartimento di Informatica e Automazione Università Roma

Dettagli

QUADRO DI RIFERIMENTO COMPETENZA LINGUISTICA LINGUA MADRE (ITALIANO) Esame di Qualifica Professionale

QUADRO DI RIFERIMENTO COMPETENZA LINGUISTICA LINGUA MADRE (ITALIANO) Esame di Qualifica Professionale QUADRO DI RIFERIMENTO COMPETENZA LINGUISTICA LINGUA MADRE (ITALIANO) Esame di Qualifica Professionale Esame di Diploma Professionale I riferimenti per la costruzione delle prove sono: lo Standard Formativo

Dettagli

Quick Introduction T-LAB 9.1. Strumenti per l Analisi dei Testi. Marzo 2014. Copyright 2001-2014 T-LAB by Franco Lancia All rights reserved.

Quick Introduction T-LAB 9.1. Strumenti per l Analisi dei Testi. Marzo 2014. Copyright 2001-2014 T-LAB by Franco Lancia All rights reserved. T-LAB 9.1 Marzo 2014 Quick Introduction Strumenti per l Analisi dei Testi Copyright 2001-2014 T-LAB by Franco Lancia All rights reserved. Website: http://www.tlab.it/ E-mail: info@tlab.it T-LAB is a registered

Dettagli

Automatic Ontology-Based Knowledge Extraction from Web Documents

Automatic Ontology-Based Knowledge Extraction from Web Documents Automatic Ontology-Based Knowledge Extraction from Web Documents 5 gennaio 2009 1 Introduzione Al ne di ottenere un eettivo WEB semantico bisogna essere in grado di costruire servizi che consentano l'estrazione

Dettagli

Easy Time. Software per la Rilevazione Presenze. Via Vic.le Terracina Infermeria, 10-80125 Napoli (NA)

Easy Time. Software per la Rilevazione Presenze. Via Vic.le Terracina Infermeria, 10-80125 Napoli (NA) Easy Time Software per la Rilevazione Presenze Easy Time... 1 Software per la... 1 Rilevazione Presenze... 1 2M... Errore. Il segnalibro non è definito. 1. PRESENTAZIONE... 3 2. DESCRIZIONE... 3 3. ANAGRAFICA

Dettagli

La cultura della gestione della conoscenza è diventata

La cultura della gestione della conoscenza è diventata RAGONAMENT 41 La rete per insegnare D FABRZO EMER Tecnologie e modelli per l e-teaching La cultura della gestione della conoscenza è diventata il punto focale dell apprendimento. Questa innovazione comporta

Dettagli

Linee guida per lo sviluppo e la gestione di un sito Web

Linee guida per lo sviluppo e la gestione di un sito Web Linee guida per lo sviluppo e la gestione di un sito Web Paolo Atzeni Università Roma Tre Dipartimento di Informatica e Automazione atzeni@dia.uniroma3.it http://www.dia.uniroma3.it/ atzeni/ Roma, 25 settembre

Dettagli

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Facoltà di Ingegneria Corso di Laurea Specialistica in Ingegneria Informatica SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Relatore Chiarissimo

Dettagli

Data Warehouse: una sola lingua. Iolanda Salinari

Data Warehouse: una sola lingua. Iolanda Salinari Data Warehouse: una sola lingua Iolanda Salinari 2 Il Glossario: uno strumento prezioso Uno dei fattori critici per la realizzazione del data warehouse è costituito dalle difficoltà che si incontrano per

Dettagli

LA MISURA DEL SERVIZIO DI ASSISTENZA AGLI UTENTI

LA MISURA DEL SERVIZIO DI ASSISTENZA AGLI UTENTI LA MISURA DEL SERVIZIO DI ASSISTENZA AGLI UTENTI Gruppo di monitoraggio INAIL Abstract È illustrata l esperienza INAIL di monitoraggio di contratti di servizi informatici in cui è prevista l assistenza

Dettagli

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria sede di Modena Corso di Laurea VOD in Ingegneria Informatica

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria sede di Modena Corso di Laurea VOD in Ingegneria Informatica Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria sede di Modena Corso di Laurea VOD in Ingegneria Informatica PROGETTO E REALIZZAZIONE DELL ALGORITMO DI ANNOTAZIONE AUTOMATICA TUCUXI

Dettagli

Altri strumenti di comunicazione degli Enti locali

Altri strumenti di comunicazione degli Enti locali Altri strumenti di comunicazione degli Enti locali 18-19 lezione - 3 novembre 2011 La Guida ai Servizi realizzata da molte Pubbliche Amministrazioni rappresenta uno degli strumenti cartacei più tradizionali

Dettagli

Strumenti per lo sviluppo del software

Strumenti per lo sviluppo del software Lo sviluppo del software Strumenti per lo sviluppo del software Lo sviluppo del software è l attività centrale del progetto e ha lo scopo di produrre il codice sorgente che, una volta compilato e messo

Dettagli

Analisi dei Requisiti e Specifica

Analisi dei Requisiti e Specifica Università di Bergamo Facoltà di Ingegneria INGEGNERIA DEL SOFTWARE Paolo Salvaneschi A3_2 V2.1 Analisi dei Requisiti e Specifica Tecniche e linguaggi Il contenuto del documento è liberamente utilizzabile

Dettagli

Indice. Introduzione alle funzionalità Requisiti Minimi

Indice. Introduzione alle funzionalità Requisiti Minimi Manuale operativo Indice Introduzione alle funzionalità Requisiti Minimi Lato Cliente Home I miei Album I miei Ordini I miei Dati Carrello Sistema di Pagamento via Paypal Contattaci Lato Amministratore

Dettagli

SisTabWeb Web. Sistema Tabelle. for Enterprise

SisTabWeb Web. Sistema Tabelle. for Enterprise SisTabWeb Web Sistema Tabelle for Enterprise Overview La condivisione del patrimonio dati a livello aziendale diventa essenziale nel momento in cui il sistema informativo, elemento chiave per l'efficienza

Dettagli

Opendata e ontologie Due esempi d'uso

Opendata e ontologie Due esempi d'uso Opendata e ontologie Due esempi d'uso Stefano Penge (a), Andrea Sterbini (b), Maurizio Mazzoneschi (a), Giorgio Consorti (a) (a) Lynx s.r.l. (b) Dipartimento di Informatica, Sapienza Università di Roma

Dettagli

della scuola secondaria di primo grado Non ci sono venti favorevoli per chi non sa dove andare Seneca

della scuola secondaria di primo grado Non ci sono venti favorevoli per chi non sa dove andare Seneca Istituto Comprensivo di Mozzate Viale Libertà, 3 22076 Mozzate (CO) tel. 0331 831491- fax 0331 262484 codice meccanografico COIC83400P c.f. 80017540131 email: COIC83400P@istruzione.it - info@comprensivomozzate.it

Dettagli

Progettare un Content Management System con le mappe mentali

Progettare un Content Management System con le mappe mentali Progettare un Content Management System con le mappe mentali Ing. Alberto Scocco, Pubblicato su VoiceComm News, n. 4 2002, Ed. ITER Milano Le mappe mentali per il knowledge management in un CMS Un Content

Dettagli

L ottimizzazione dei processi con Microsoft Office System: come generare e misurare il valore per le aziende

L ottimizzazione dei processi con Microsoft Office System: come generare e misurare il valore per le aziende MICROSOFT BUSINESS DESKTOP MICROSOFT ENTERPRISE CLUB Disponibile anche sul sito: www.microsoft.com/italy/eclub/ L ottimizzazione dei processi con Microsoft Office System: come generare e misurare il valore

Dettagli

[CATALOGO CORSI 2012]

[CATALOGO CORSI 2012] 2012 IAL Innovazione Apprendimento Lavoro Lombardia [CATALOGO CORSI 2012] [Digitare qui il sunto del documento. Di norma è una breve sintesi del contenuto del documento. [Digitare qui il sunto del documento.

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testualilezione 2 Le principali tecniche di analisi testuale Facendo riferimento alle tecniche di data mining,

Dettagli

Manuale d uso. 1. Introduzione

Manuale d uso. 1. Introduzione Manuale d uso 1. Introduzione Questo manuale descrive il prodotto Spazio 24.7 e le sue funzionalità ed è stato elaborato al fine di garantire un più agevole utilizzo da parte del Cliente. Il manuale d

Dettagli

CAPITOLO 5. Gestione dell'ambito del progetto

CAPITOLO 5. Gestione dell'ambito del progetto CAPITOLO 5 Gestione dell'ambito del progetto 5 La gestione dell ambito di progetto comprende i processi necessari ad assicurare che il progetto includa tutto il lavoro richiesto, e soltanto il lavoro richiesto,

Dettagli

SenTaClAus - Sentiment Tagging & Clustering Analysis on web & social contents

SenTaClAus - Sentiment Tagging & Clustering Analysis on web & social contents Via Marche 10 56123 Pisa Phone +39.050.552574 Fax +39.1782239361 info@netseven.it - www.netseven.it P.IVA 01577590506 REGIONE TOSCANA POR CReO FESR 2007 2013 LINEA D INTERVENTO 1.5.a - 1.6 BANDO UNICO

Dettagli

Documentazione Demo online

Documentazione Demo online READ-IT Documentazione Demo online ILC-CNR ItaliaNLP Lab Sommario 1 MISURAZIONE DELLA LEGGIBILITÀ DI UN TESTO 2 1.1 Analisi globale della leggibilità 3 1.1.1 Valutazione globale della leggibilità del documento

Dettagli

INFOSTAT-COVIP. Piattaforma per la raccolta delle informazioni MANUALE UTENTE

INFOSTAT-COVIP. Piattaforma per la raccolta delle informazioni MANUALE UTENTE INFOSTAT-COVIP Piattaforma per la raccolta delle informazioni MANUALE UTENTE febbraio 2015 I N D I C E 1. ISTRUZIONI OPERATIVE PER L'UTILIZZO DEI SERVIZI INFOSTAT-COVIP... 3 2. HOME PAGE... 4 3. ACCESSO

Dettagli

Overview. Enterprise Project Control System. Principali caratteristiche e funzionalità del Sistema. Piemme S.r.l

Overview. Enterprise Project Control System. Principali caratteristiche e funzionalità del Sistema. Piemme S.r.l Enterprise Project Control System Overview Principali caratteristiche e funzionalità del Sistema Bridge è stato realizzato da PIEMME s.r.l. di Genova Via Carducci 5/4 sn Tel. 010 4075751 «Bridge», per

Dettagli

Software per la gestione di musei di arte contemporanea1

Software per la gestione di musei di arte contemporanea1 Software per la gestione di musei di arte contemporanea1 Identificativo del progetto: CA Nome documento: System Design(SD) Identificativo del documento: 6 CA_SD_E1_R1 Data del documento: 21/05/2012 Prima

Dettagli

UNIVERSITÀ DEGLI STUDI DI FIRENZE. Relazione elaborato di progettazione e produzione multimediale

UNIVERSITÀ DEGLI STUDI DI FIRENZE. Relazione elaborato di progettazione e produzione multimediale UNIVERSITÀ DEGLI STUDI DI FIRENZE Relazione elaborato di progettazione e produzione multimediale AllPainters.Net SISTEMA PER LA GENERAZIONE DI SITI GRATUITI PER PITTORI Autori: - Bandini Roberto - Ercoli

Dettagli

Ministero dello Sviluppo Economico

Ministero dello Sviluppo Economico Ministero dello Sviluppo Economico INDAGINE SULLA CUSTOMER SATISFACTION DELL "HELPDESK REACH 214 Sintesi dei risultati Roma, febbraio 215 Indagine sulla customer satisfaction dell Helpdesk REACH - 214

Dettagli

Capitolo 1 Introduzione

Capitolo 1 Introduzione Capitolo 1 Introduzione ZoomText 9.1 è una potente applicazione che favorisce l utilizzo del computer a individui con difficoltà visive. Utilizza due tecnologie versatili ingrandimento dello schermo e

Dettagli

Tecnopolis CSATA s.c.r.l. APQ in Materia di Ricerca Scientifica nella Regione Puglia

Tecnopolis CSATA s.c.r.l. APQ in Materia di Ricerca Scientifica nella Regione Puglia BANDO ACQUISIZIONI Prodotti Software ALLEGATO 6.3 Capitolato Tecnico Piattaforma per l Analisi e la Progettazione di alto livello del Software Allegato 6.3: capitolato tecnico Pag. 1 1 Ambiente di Analisi

Dettagli

Speed 3.0. Speed 3.0 Gestione dell ufficio spedizioni. Titolo: Procedura di gestione dell ufficio spedizioni. Presentazione prodotto. Pag.

Speed 3.0. Speed 3.0 Gestione dell ufficio spedizioni. Titolo: Procedura di gestione dell ufficio spedizioni. Presentazione prodotto. Pag. Pag. 1 di 28 Procedura di gestione dell ufficio spedizioni Pag. 2 di 28 Sommario Introduzione 3 Principali funzioni di Speed 5 5 Ordini clienti 6 Abbinamento ordini cliente / trasportatore 8 Automazione

Dettagli

Testo Esercizio. Un modello è ragionevole quando contiene queste tre caratteristiche.

Testo Esercizio. Un modello è ragionevole quando contiene queste tre caratteristiche. Testo Esercizio Un negozio di musica vende anche libri e riviste musicali. Si intende automatizzare l intero processo, dall approvvigionamento alla vendita. Si analizzino i requisiti e se ne rappresentino

Dettagli

Dynamic 08 Software per la lettura ottica

Dynamic 08 Software per la lettura ottica Dynamic 08 Software per la lettura ottica Dynamic 08 G.Q.S. S.r.l. 2008 All rights reserved G.Q.S. Srl Global Quality Service Via Bernini, 5/7 Corsico (MILANO) Cos è Dynamic 08 Dynamic 08 è un software

Dettagli

MANUALE D'USO (VER. 0.5)

MANUALE D'USO (VER. 0.5) MANUALE D'USO (VER. 0.5) NOTA BENE PER ESEGUIRE XGATE È NECESSARIO CHE SIA INSTALLATO SUL COMPUTER IL FRAMEWORK.NET VERSIONE 2.0 PREFAZIONE Questa applicazione è stata creata per facilitare l'approccio

Dettagli

LA VERIFICA DELLA QUALITA DELLE SPECIFICHE FUNZIONALI WORKSHOP "MONITORAGGIO DEI CONTRATTI DI GRANDE RILIEVO" DICEMBRE 1999

LA VERIFICA DELLA QUALITA DELLE SPECIFICHE FUNZIONALI WORKSHOP MONITORAGGIO DEI CONTRATTI DI GRANDE RILIEVO DICEMBRE 1999 LA VERIFICA DELLA QUALITA DELLE SPECIFICHE FUNZIONALI WORKSHOP "MONITORAGGIO DEI CONTRATTI DI GRANDE RILIEVO" DICEMBRE 1999 Autore: Ing. Enrico Rossi Gruppo di Monitoraggio: Consip S.p.A. Telefono: 06/77700223

Dettagli

Il ciclo di vita del software

Il ciclo di vita del software Il ciclo di vita del software Il ciclo di vita del software Definisce un modello per il software, dalla sua concezione iniziale fino al suo sviluppo completo, al suo rilascio, alla sua successiva evoluzione,

Dettagli

WHITE PAPER CRM Novembre 2003

WHITE PAPER CRM Novembre 2003 WHIT E PAPER Novembre 2003 CUSTOMER RELATIONSHIP MANAGEMENT Parlare di CUSTOMER RELATIONSHIP MANAGEMENT significa parlare di come l Azienda gestisce il suo business. Se vogliamo dare una definizione di

Dettagli

Email marketing ed invio newsletter. Invio di messaggi vocali personalizzati

Email marketing ed invio newsletter. Invio di messaggi vocali personalizzati Sistema online professionale per gestire il tuo mailing Email marketing ed invio newsletter SMS marketing Invio massivo di fax Invio di lettere cartacee (prioritaria o raccomandata) Invio di messaggi vocali

Dettagli

Appunti lezione Database del 07/10/2015

Appunti lezione Database del 07/10/2015 Appunti lezione Database del 07/10/2015 Nelle lezioni precedenti si è visto come qualunque applicazione informativa è almeno formata da tre livelli o layers che ogni progettista conosce e sa gestire: Livello

Dettagli

BANCA DATI PREPARATI PERICOLOSI. Manuale operativo ISS FORMULA v.1.25. Configurazione minima richiesta:

BANCA DATI PREPARATI PERICOLOSI. Manuale operativo ISS FORMULA v.1.25. Configurazione minima richiesta: BANCA DATI PREPARATI PERICOLOSI Manuale operativo ISS FORMULA v.1.25. Configurazione minima richiesta Installazione del programma Definizioni Finestra iniziale del programma Come compilare Configurazione

Dettagli

USO OTTIMALE DI ACTIVE DIRECTORY DI WINDOWS 2000

USO OTTIMALE DI ACTIVE DIRECTORY DI WINDOWS 2000 VERITAS StorageCentral 1 USO OTTIMALE DI ACTIVE DIRECTORY DI WINDOWS 2000 1. Panoramica di StorageCentral...3 2. StorageCentral riduce il costo totale di proprietà per lo storage di Windows...3 3. Panoramica

Dettagli

CORSO DI FORMAZIONE PER: TECNICO DELLE ATTIVITA' DI PROGETTAZIONE, SVILUPPO E AGGIORNAMENTO DI SITI WEB

CORSO DI FORMAZIONE PER: TECNICO DELLE ATTIVITA' DI PROGETTAZIONE, SVILUPPO E AGGIORNAMENTO DI SITI WEB Avviso Pubblico PROV-BR 02/2013 PO FSE 2007/2013 ASSE II OCCUPABILITA' Formazione per Inserimento-Reinserimento Lavorativo Approvato con D.D. n.85 del 24/01/2014, pubblicata sul BURP n. 17 del 06/02/2014

Dettagli

List Suite 2.0. Sviluppo Software Il Telefono Sas 10/06/2010

List Suite 2.0. Sviluppo Software Il Telefono Sas 10/06/2010 2010 List Suite 2.0 Sviluppo Software Il Telefono Sas 10/06/2010 List Suite 2.0 List Suite 2.0 è un tool software in grado di archiviare, analizzare e monitorare il traffico telefonico, effettuato e ricevuto

Dettagli

La metodologia del test con gli utenti adottata per Sapienza Università di Roma

La metodologia del test con gli utenti adottata per Sapienza Università di Roma La metodologia del test con gli utenti adottata per Sapienza Università di Roma Questo paper ha la finalità di illustrare come gli utenti web dell Università Sapienza di Roma abbiano partecipato al percorso

Dettagli

Design of Experiments

Design of Experiments Design of Experiments Luigi Amedeo Bianchi 1 Introduzione Cominciamo spiegando cosa intendiamo con esperimento, ossia l investigare un processo cambiando i dati in ingresso, osservando i cambiamenti che

Dettagli

Manuale delle funzioni client per lo scambio dei dati tra cassa ed enti esterni

Manuale delle funzioni client per lo scambio dei dati tra cassa ed enti esterni Manuale delle funzioni client per lo scambio dei dati tra cassa ed enti esterni Edilnet Soldo Edilnet Web Sistema On Line Denunce Operai Sportello virtuale per gli utenti aperto h24 Cfp Informatica Srl

Dettagli

Manuale PartnerZone. (Riservato a rivenditori e agenzie) Versione Luglio 2010

Manuale PartnerZone. (Riservato a rivenditori e agenzie) Versione Luglio 2010 (Riservato a rivenditori e agenzie) Versione Luglio 2010 SOMMARIO Introduzione... 3 Accesso... 3 Le voci di menù... 4 HELPDESK... 4 Scheda anagrafica cliente... 5 Bottoni funzionali... 5 Nuovo intervento...

Dettagli

C.R.M. Custom Relationship Management

C.R.M. Custom Relationship Management Web Solution C.R.M. Custom Relationship Management Overview La soluzione CRM Portal Builder è una piattaforma innovativa per la gestione delle relazioni con i clienti, basata su una struttura modulare

Dettagli

Il tuo manuale d'uso. KASPERSKY ADMINISTRATION KIT http://it.yourpdfguides.com/dref/5068309

Il tuo manuale d'uso. KASPERSKY ADMINISTRATION KIT http://it.yourpdfguides.com/dref/5068309 Può anche leggere le raccomandazioni fatte nel manuale d uso, nel manuale tecnico o nella guida di installazione di KASPERSKY ADMINISTRATION KIT. Troverà le risposte a tutte sue domande sul manuale d'uso

Dettagli

Deliverable D6.1: Scelta della piattaforma software e progetto dell'organizzazione interna del portale (Documento)

Deliverable D6.1: Scelta della piattaforma software e progetto dell'organizzazione interna del portale (Documento) PARLI Deliverable D6.1 1 Progetto PRIN 2008: Portale per l Accesso alle Risorse Linguistiche per l Italiano Cristina Bosco (Unità 1, Università di Torino) Deliverable D6.1: Scelta della piattaforma software

Dettagli

Progettare Ipermedia. Presentazione

Progettare Ipermedia. Presentazione Progettare Ipermedia Presentazione L aspetto progettuale riveste notevole importanza in un percorso didattico impostato sulla produzione di ipermedia così come è importante pianificarne lo sviluppo su

Dettagli

UN MODELLO DI QUALITÀ PER I SITI WEB

UN MODELLO DI QUALITÀ PER I SITI WEB UN MODELLO DI QUALITÀ PER I SITI WEB fonte prof Polillo - 1 - Cos'è un modello di qualità l Una selezione delle caratteristiche che fanno di un sito web un buon sito l Scopo: valutare un sito orientarci

Dettagli

Come utilizzare il nuovo LEGGI D ITALIA Pubblica Amministrazione

Come utilizzare il nuovo LEGGI D ITALIA Pubblica Amministrazione Come utilizzare il nuovo LEGGI D ITALIA Pubblica Amministrazione 1 Cos è il nuovo Sistema LEGGI D ITALIA Pubblica Amministrazione è la nuova soluzione on line integrata e intelligente, realizzata su misura

Dettagli

Statistiche Release 4.0

Statistiche Release 4.0 Piattaforma Applicativa Gestionale Statistiche Release 4.0 - COPYRIGHT 2000-2005 by ZUCCHETTI S.p.A. Tutti i diritti sono riservati.questa pubblicazione contiene informazioni protette da copyright. Nessuna

Dettagli

E-Mail. Scheduling. Modalità d invio. E-Mail

E-Mail. Scheduling. Modalità d invio. E-Mail BI BI Terranova, azienda leader in Italia per le soluzioni Software rivolte al mercato delle Utilities, propone la soluzione Software di Business Intelligence RETIBI, sviluppata per offrire un maggiore

Dettagli

INFORMATICA CORSI DELL'INDIRIZZO TECNICO CLASSI PRIME AMMINISTRAZIONE - FINANZA E MARKETING

INFORMATICA CORSI DELL'INDIRIZZO TECNICO CLASSI PRIME AMMINISTRAZIONE - FINANZA E MARKETING INFORMATICA CORSI DELL'INDIRIZZO TECNICO CLASSI PRIME AMMINISTRAZIONE - FINANZA E MARKETING Modulo propedeutico Le lezioni teoriche sono sviluppate sui seguenti argomenti: Struttura dell elaboratore: CPU,

Dettagli

PeCo-Graph. Manuale per l utente

PeCo-Graph. Manuale per l utente PeCo-Graph Manuale per l utente 1. INTRODUZIONE...2 2. INSTALLAZIONE...3 2.1 REQUISITI...3 2.2 INSTALLAZIONE ED AVVIO...3 3. FUNZIONALITÀ ED UTILIZZO DEL PROGRAMMA...4 3.1 FUNZIONALITÀ...4 3.2 USO DEL

Dettagli

Gestione informatizzata dell iter, dalla domanda alla visita ispettiva

Gestione informatizzata dell iter, dalla domanda alla visita ispettiva ACCREDITAMENTO Gestione informatizzata dell iter, dalla domanda alla visita ispettiva Manuale d uso per il Valutatore versione 15 Aggiornamento del 15 Dicembre 2011 pag. 2 di111 Sommario Sommario...2 1.

Dettagli

Elementi fondamentali di Word2010Core

Elementi fondamentali di Word2010Core Liceo Scientifico Statale E. Fermi Cosenza Elementi fondamentali di Word2010Core Profilo pubblico L utente di livello Core di Microsoft Office Word 2010 dovrebbe essere in grado di esplorare il programma

Dettagli

LA SOLUZIONE PER LA GESTIONE DINAMICA DELLE INFORMAZIONI IN UN PORTALE

LA SOLUZIONE PER LA GESTIONE DINAMICA DELLE INFORMAZIONI IN UN PORTALE LA SOLUZIONE PER LA GESTIONE DINAMICA DELLE INFORMAZIONI IN UN PORTALE WEBVISION APPARTIENE ALLA FAMIGLIA DEI CONTENT MANAGEMENT SYSTEM PER LA GESTIONE DINAMICA DELLE INFORMAZIONI E DEL LORO LAYOUT ALL

Dettagli

Optimization and control: CFD as a design tool

Optimization and control: CFD as a design tool Relazione di attività del PhD student Samuele Zampini Supervisore: Prof. Maurizio Quadrio, Dipartimento di Scienze e Tecnologie Aereospaziali Optimization and control: CFD as a design tool Attività di

Dettagli

TECNICO SUPERIORE PER LO SVILUPPO DEL SOFTWARE

TECNICO SUPERIORE PER LO SVILUPPO DEL SOFTWARE ISTRUZIONE E FORMAZIONE TECNICA SUPERIORE SETTORE I.C.T. Information and Communication Technology TECNICO SUPERIORE PER LO SVILUPPO DEL SOFTWARE STANDARD MINIMI DELLE COMPETENZE TECNICO PROFESSIONALI DESCRIZIONE

Dettagli

Verifica di Accessibilità del sito www.aots.sanita.fvg.it

Verifica di Accessibilità del sito www.aots.sanita.fvg.it Verifica di Accessibilità del sito www.aots.sanita.fvg.it NOTE: Verifica effettuata in base ai requisiti descritti nell allegato A del Decreto Ministeriale 8 luglio 2005, ai sensi della legge n.4 del 9

Dettagli

SISTEMA EDITORIALE WEBMAGAZINE V.2.2

SISTEMA EDITORIALE WEBMAGAZINE V.2.2 SISTEMA EDITORIALE WEBMAGAZINE V.2.2 1 - Il funzionamento di Web Magazine Web Magazine è un applicativo pensato appositamente per la pubblicazione online di un giornale, una rivista o un periodico. E'

Dettagli

Modalità e criteri di segmentazione nel Corporate & Investment Banking

Modalità e criteri di segmentazione nel Corporate & Investment Banking UNIVERSITA CATTOLICA DEL SACRO CUORE 20123 MILANO LARGO A. GEMELLI, 1 Modalità e criteri di segmentazione nel Corporate & Investment Banking a cura di: Renato Fiocca Glauco T. Savorgnani Daniela Corsaro

Dettagli

Database Modulo 3 DEFINIRE LE CHIAVI

Database Modulo 3 DEFINIRE LE CHIAVI Database Modulo 3 DEFINIRE LE CHIAVI Nell organizzazione di un archivio informatizzato è indispensabile poter definire univocamente le informazioni in esso inserite. Tale esigenza è abbastanza ovvia se

Dettagli

Guida per l utilizzo del Data Base

Guida per l utilizzo del Data Base Guida per l utilizzo del Data Base Specifico per catalogare e gestire la vostra collezione di modelli ferroviari Requisiti di sistema e installazione Collezione Treni 2011 è progettato per funzionare con

Dettagli

ARCA PER WINDOWS Presentazione commerciale Versione 3.0.6

ARCA PER WINDOWS Presentazione commerciale Versione 3.0.6 ARCA PER WINDOWS Presentazione commerciale Versione 3.0.6 SOFTWARE PER LA RILEVAZIONE DELLE PRESENZE ARCA PER WINDOWS Arca per Windows è la famiglia di prodotti per la rilevazione delle presenze che, nelle

Dettagli

Il bilancio delle banche e l analisi delle performance. Corso di Economia delle Aziende di Credito Prof. Umberto Filotto a.a.

Il bilancio delle banche e l analisi delle performance. Corso di Economia delle Aziende di Credito Prof. Umberto Filotto a.a. Il bilancio delle banche e l analisi delle performance Corso di Economia delle Aziende di Credito Prof. Umberto Filotto a.a. 2010/2011 Premessa Il bilancio bancario presenta caratteristiche distintive

Dettagli

XFACILE / XTOTEM Pagina 1. Presentazione

XFACILE / XTOTEM Pagina 1. Presentazione XFACILE / XTOTEM Pagina 1 Presentazione XFACILE / XTOTEM Pagina 2 Presentazione XFACILE XTOTEM è un sistema studiato per gestire Siti Internet e Pannelli Informativi. Con XTOTEM si possono disegnare e

Dettagli