Sezione 2 Risultati della validazione della risorsa e del software ItalWordnet C. Bagnasco, C. Biasuzzi, M. Ferraro, L. Gilardoni (Quinary)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Sezione 2 Risultati della validazione della risorsa e del software ItalWordnet C. Bagnasco, C. Biasuzzi, M. Ferraro, L. Gilardoni (Quinary)"

Transcript

1 Sezione 2 Risultati della validazione della risorsa e del software ItalWordnet C. Bagnasco, C. Biasuzzi, M. Ferraro, L. Gilardoni (Quinary) 1 INTRODUZIONE VALUTAZIONE GENERALE E DI COPERTURA Ambiente e modalità di valutazione Corrispondenza del modello alle specifiche Valutazione di usabilità dell'interfaccia di browsing Valutatori senza conoscenza pregressa del modello: risultati della valutazione Valutatore con competenze di problematiche linguistiche ma senza competenze specifiche su IWN Valutatore di estrazione marketing/economica Valutazione di integrabilità del software Valutazione di copertura del lessico Valutazione di usabilità dell'interfaccia di editing VALUTAZIONE SPERIMENTALE Il sistema di classificazione attuale Il caso sperimentale Navigazione nella rete un esempio Strumenti di supporto CONCLUSIONI RIFERIMENTI BIBLIOGRAFICI...29

2 1 Introduzione Oggetto delle attività legate alla linea 1.4 era la validazione della risorsa ItalWordNet. Le attività sono state pianificate in modo da coprire due aspetti: una ri-validazione generale e di copertura, sulla falsariga di quanto già effettuato preliminarmente in fase di sviluppo, al fine di verificare le ultime modifiche/estensioni al prototipo - pianificate come attività della linea 1.3 e/o apportate per rispondere ad eventuali anomalie riscontrate nelle precedenti fasi di valutazione e fornire una valutazione generale finale una validazione sperimentale basata su un caso d uso della risorsa. Questo documento contiene nei successivi due capitoli i risultati delle due attività di validazione, e nel terzo una descrizione sintetica complessiva dei risultati dell attività di valutazione. 2 Valutazione Generale e di copertura Durante la linea 1.4 è stata effettuata una validazione finale della risorsa e del software ItalWordNet dal punto di vista generale e di copertura dei contenuti, sulla falsariga di quanto già effettuato in fase precedente sulle versioni intermedie al fine di controllare l evoluzione rispetto a quanto reso disponibile al termine della fase 1.3. In particolare, sono stati effettuati: valutazione qualitativa delle funzionalità di interfaccia, verificando il comportamento del sistema sia in modo esaustivo (disamina puntuale di tutte le funzionalità esistenti) sia in modo mirato, sulla base di specifici scenari di utilizzo, al fine di verificarne la completezza. verifica delle funzionalità dell API, sia in termini di adeguatezza via analisi qualitativa di documentazione e codice, sia operativamente attraverso l utilizzo per i sistemi usati per i test di copertura e la validazione sperimentale. verifiche di copertura, sia sugli stessi data set utilizzati durante le valutazioni preliminari in fase 1.2 e 1.3 al fine di verificare l evoluzione del sistema, sia su nuovi data set. Tutti i test sono stati effettuati presso la sede di Quinary, utilizzando il materiale reso disponibile in fase iniziale e i successivi aggiornamenti sul sito ftp di progetto. E da notare che il processo di valutazione è stato necessariamente ma anche proficuamente un processo incrementale, dove una serie di anomalie riscontrate in corso d opera sono state in corso d opera affrontate tramite successivi rilasci di estensioni e/o patches al prototipo. In questo documento non vengono riportati i dettagli su quanto risolto in corso d'opera ma si rimarca come tale attività abbia avuto una certa rilevanza, ad ulteriore dimostrazione dell utilità del processo di valutazione. 2.1 Ambiente e modalità di valutazione Il software ItalWordNet è stato installato su due Personal Computer (PC) connessi in rete: 2

3 un PC con 256 Mb di RAM e processore Intel PentiumIII, in ambiente Microsoft Windows NT 4.0, Service Pack 6 un PC con 128 Mb di RAM e processore Intel PentiumIII, in ambiente Microsoft Windows NT 4.0, Service Pack 6 Sul primo PC è stato installato il server, il client e l interfaccia grafica per il test delle API. Sul secondo PC è stato installato il client e l interfaccia grafica per il test delle API. Il software è stato scaricato dal sito ILC (ftp.ilc.pi.cnr.it) in diverse riprese. Valutazioni preliminari sono state effettuate su una prima versione come rilasciata al termine della fase 1.3 (28/5), su successive versioni (30/7,11/10) rilasciate a seguito della segnalazione di alcune incongruenze e/o errori minori, e su un ultima versione congelata alla data del 26/10. I test quantitativi di cui si riportano i risultati nel seguito fanno riferimento all'ultima versione. Il software è stato testato da due collaboratori di Quinary, entrambi sviluppatori software con conoscenza pregressa del modello di ItalWordNet, mentre i contenuti e l'interfaccia, come dettagliato in seguito, sono stati oggetto di valutazione da parte di collaboratori di Quinary senza pregressa conoscenza del sistema. 2.2 Corrispondenza del modello alle specifiche Il modello, così come presentato dall interfaccia di browsing, corrisponde in termini di informazioni reperibili e relazioni esplorabili al modello definito nel documento finale della linea 1.1. Utilizzando l'interfaccia è possibile accedere a db diversi; in particolare, sia al modello generico che al modello economico, sia ad entrambi attraverso il modello 'plugin' realizzato. Il modello plugin ha inserito le entry del dominio economico sul db generico, mascherando, come descritto altrove, le entry sovrapposte. Tutte le valutazioni sono state effettuate sul modello 'plugin' che ingloba db generico ed economico. E' da sottolineare che, in accordo a quanto previsto dal capitolato e dalle specifiche definite nella linea 1.1, i campi semantici, contenenti la caratterizzazione delle entry in termini di dominio, sono presenti esclusivamente per i termini del db economico. Come vedremo più in dettaglio nel seguito, questa limitazione, ancorché prevista, è significativa e potrebbe essere oggetto di utile estensione al sistema. La copertura in termini di relazioni e informazioni agganciate alle entry appare in generale soddisfacente, soprattutto per le relazioni principali. E' tuttavia da notare come alcune relazioni non siano valorizzate (si veda la tabella 1), il che potrebbe indicare la necessità di una revisione critica che elimini alcune relazioni portando ad una semplificazione del modello. Descrizione Totale Nomi Verbi Aggettivi Avverbi Nomi Propri # synset # sensi # lemmi # rel. interne # rel. esterne Tabella 1 3

4 Relazione Totale Nomi Verbi Agg. Avv. Nomi Propri NEAR_SYNONYM XPOS_NEAR_SYNONYM HAS_HYPERONYM/HAS_HYPONYM HAS_XPOS_HYPERONYM HAS_XPOS_HYPONYM ANTONYM COMPL_ANTONYM 2 2 GRAD_ANTONYM XPOS_ANTONYM 0 XPOS_NEAR_ANTONYM HAS_HOLONYM/HAS_MERONYM HAS_MERO_PART/HAS_HOLO_PART HAS_MERO_MEMBER/ HAS_HOLO_MEMBER HAS_MERO_MADEOF/HAS_HOLO_MADEOF HAS_MERO_PORTION/ HAS_HOLO_PORTION HAS_MERO_LOCATION/ HAS_HOLO_LOCATION CAUSES IS_CAUSED_BY RESULTS_IN/IS_RESULT_OF FOR_PURPOSE_OF/IS_PURPOSE_OF 4 4 IS_MEANS_FOR/HAS_MEANS HAS_SUBEVENT IS_SUBEVENT_OF INVOLVED ROLE INVOLVED_AGENT ROLE_AGENT INVOLVED_PATIENT ROLE_PATIENT INVOLVED_INSTRUMENT ROLE_INSTRUMENT INVOLVED_LOCATION ROLE_LOCATION INVOLVED_DIRECTION ROLE_DIRECTION INVOLVED_SOURCE_DIRECTION ROLE_SOURCE_DIRECTION INVOLVED_TARGET_DIRECTION ROLE_TARGET_DIRECTION INVOLVED_RESULT ROLE_RESULT CO_ROLE CO_AGENT_PATIENT/CO_PATIENT_AGENT 2 2 CO_AGENT_INSTRUMENT/CO_INSTRUMENT_AGENT CO_AGENT_RESULT/CO_RESULT_AGENT 2 2 CO_PATIENT_INSTRUMENT/CO_INSTRUMENT_PATIENT 1 1 CO_PATIENT_RESULT/CO_RESULT_PATIENT 2 2 CO_INSTRUMENT_RESULT/CO_RESULT_INSTRUMENT 2 2 BE_IN_STATE STATE_OF IN_MANNER IS_MANNER_FOR DERIVATION LIABLE_TO HAS_LIABILITY IS_A_VALUE_OF 1 1 4

5 HAS_VALUE 1 1 PERTAINS_TO HAS_PERTAINED HAS_INSTANCE BELONGS_TO_CLASS FUZZYNYM XPOS_FUZZYNYM Tabella 2 Per quanto riguarda la correttezza delle relazioni, una verifica non potrebbe che essere manuale e puntuale; tuttavia anche se durante la fase di valutazione sono state riscontrate alcune relazioni quantomeno discutibili 1, il fenomeno appare di dimensione accettabile ed è qualitativamente giudicato rientrare nella norma di simili sistemi (e.g. paragonabile, almeno come ordine di grandezza, con il tasso di variazioni riscontrabili tra una versione e la successiva di Wordnet inglese). Anche le scelte effettuate in fase di costruzione, quali per esempio quelle relative all'inserimento dei nomi propri (cfr. deliverable linea 3, sez ) o ai criteri di costruzione del db economico in generale (cfr. deliverable linea 3, sez ) appaiono congruenti. L'unico criterio che lascia qualche perplessità, soprattutto rispetto ad utilizzi del database per trattamenti automatici, riguarda la gestione degli aggettivi (si veda in proposito deliverable linea1, sezioni ,2) che porta a situazioni quali quella per i colori dove, ad esempio, l'aggettivo 'rosso' ha l'aggettivo 'cremisi' sia come iponimo che come near-synonym, o a situazioni quali quelle evidenziate nel deliverable della linea3, sezione 1.1.3, dove l'iperonimia ha due valenze sostanzialmente diverse caso rosso/colorato, ignorante/privo ma sostanzialmente indistinguibili in automatico e quindi di dubbia utilità. Definizioni, glosse ed esempi non sono sempre valorizzate; solo il 45 % dei synsets ha una definizione. 2.3 Valutazione di usabilità dell'interfaccia di browsing Gli attributi che sono stati considerati per valutare l usabilità dell interfaccia per l'utente esterno di ItalWordNet appartengono all insieme di attributi che, nell ambito degli studi sulle interfacce uomo - macchina, vengono solitamente considerati per valutare globalmente l' usabilità di un sistema software (Nielsen 1995). La valutazione è stata fatta principalmente sull'interfaccia di browsing, con alcune verifiche sull'interfaccia di editing. Le verifiche sono state effettuate da personale con competenze sul sistema, ma, come dettagliato in seguito, sono stati anche effettuate sessioni con personale senza 1 Ad esempio alcuni synset legati da relazioni di iponimia e iperonimia destano perplessità e andrebbero quantomeno spiegati. E per esempio il caso di essere (definizione: ha funzione di copula ) come iperonimo di vendere, o di abbacchiare e soprattutto regalare come iponimi di vendere ( regalare nel senso di vendere a prezzo stracciato?). In altri casi alcuni synset sembrano invece perfettamente identici; ad esempio i due sensi di rivendere o i sens1 1 e 3 del verbo spacciare. O la differenza tra azioni a risparmio e azioni di risparmio. Ulteriori casi puntuali verranno riportati, a titolo di esempio, nella sezione 3. 5

6 pregressa conoscenza. In seguito vengono riportati i risultati riassuntivi delle sessioni di valutazione, sui quali concorda la totalità degli sperimentatori. Ulteriori osservazioni, formulate dai valutatori senza conoscenza pregressa del modello, vengono riportate nei successivi paragrafi. consistenza nella presentazione e nell'interazione. La presentazione grafica per i diversi tipi di oggetti è consistente è comprensibile. Gli unici dubbi riguardano: la corrispondenza, non sempre facile da effettuare tra le voci di menu associate ai bottoni Nome, Verbo Aggettivo e l insieme di relazioni che appaiono nella porzione di finestre dedicata al browsing delle relazioni. l'uso 'non standard' di elementi visuali dall'aspetto di bottoni con funzionalità di menu: ad esempio le voci di cui alla nota precedente agganciano dei menu mentre il bottone 'pulisci' sulla stessa linea e con lo stesso aspetto è un vero 'action button'. In entrambi i casi tuttavia la problematicità reale dell'aspetto è minima. Tutte le funzionalità fornite dall'interfaccia hanno un comportamento consistente; alcune voci (in particolare nell'interfaccia di editing i campi corrispondenti ai campi semantici e alla top ontology) non sono attive ma la cosa è correttamente presentata disabilitando le corrispondenti voci di menu o bottoni. E' da rimarcare tuttavia che nella versione finale del client ItalWordnet permangono due 'viste' in zona 'relazioni' che non sono mai valorizzate: 'Wordnet Inglese1.5' e 'Terminologia'; il collegamento tra Wordnet Italiano e ILI continua inoltre ad essere monodirezionale (Italiano- >ILI) e non e' possibile, inoltre, 'navigare' tra le relazioni dei synset ILI gestione degli errori. La versione finale dell interfaccia non presenta errori bloccanti: è stato verificato che errori bloccanti precedentemente riscontrati nelle precedenti versione sono stati corretti dagli sviluppatori. Le procedure di conferma per ricerche troppo lunghe non sempre sono effettuate in modo coerente (ad esempio, non viene chiesta conferma per ricerche onerose nella Top Ontology). Il sistema finale sembra comunque avere buone caratteristiche di robustezza. tempi di risposta. I tempi di risposta dell interfaccia sono soddisfacenti. I tempi più lunghi (diversi minuti) riguardano alcune ricerche nella Top Ontology, o effettuate sulla base di stringhe parzialmente specificate (cioè contenenti il carattere *). facilità d'uso. E risultato semplice imparare ad utilizzare l interfaccia di browsing e non si sono riscontrati particolari problemi nel ricordare, a distanza di tempo, le modalità di utilizzo. La cosa è leggermente più problematica per le interfacce di editing, che peraltro sono riservate ad utenti per definizione esperti. L'unica vera critica fattibile all'interfaccia e l'impossibilità di navigare nei synset partendo dalle relazioni. Ovvero dato un synset posso vedere quelli correlati nella finestra delle relazioni, ma per poter da li 'seguire le catene' occorre riportare manualmente il lemma nel campo di ricerca. adeguatezza dell'help in linea e della documentazione sul funzionamento dell interfaccia. La documentazione e l help in linea non sono disponibili. Per quanto riguarda la documentazione fornita con le API, si veda il paragrafo 1.4. task match. Le funzionalità fornite per esplorare l'organizzazione dei termini nella rete semantica sono adeguate. 6

7 2.3.1 Valutatori senza conoscenza pregressa del modello: risultati della valutazione Come accennato in precedenza, sono state effettuate due sessioni di uso da parte di utenti che non hanno mai visto il sistema raccogliendone il feedback. I due utenti sono caratterizzati in modo diverso: - Una persona con competenze su problematiche linguistiche (ma non un linguista, ovvero comunque sempre con taglio industriale) e di classificazione ma senza competenze specifiche WordNet (al di la ovviamente di sapere cos è) - Una persona totalmente al di fuori delle problematiche e di estrazione marketing/economica. In generale, i due utenti hanno valutato positivamente l interfaccia ed hanno espresso alcune osservazioni sul modello e sulla copertura. Anche se al di fuori dello scope di questa sezione di valutazione, queste osservazioni vengono riportate, poiché danno un utile indicazione delle aspettative che può avere un utente con competenze linguistiche ed un generico utente finale rispetto ad una risorsa linguistica. I risultati delle due sezioni di valutazione sono dettagliati nel seguito Valutatore con competenze di problematiche linguistiche ma senza competenze specifiche su IWN La sessione di valutazione è iniziatata senza fornire spiegazioni particolari riguardo al modello ed alla sua interfaccia. Al valutatore è stato consegnato per consultazione il documento: Specifiche Tecniche di SI-TAL Manuale Operativo. A richiesta, sono state fornite informazioni sulla semantica delle relazioni. consistenza nella presentazione e nell interazione La presentazione grafica è giudicata nel complesso consistente. Sono però state fatte le seguenti osservazioni ci si aspetta di poter selezionare iponimi ed iperonimi nella finestra della relazione, per proseguire da lì la navigazione. è fuorviante che le finestre non vengano ripulite ogni volta che si ricerca un nuovo lemma i termini appartenenti a dizionari specializzati (in questo caso, al dominio economico) dovrebbero essere evidenziati graficamente i menù associati ai bottoni Nome, Verbo e Aggettivo sono fuorvianti: si pensa diano informazioni diverse da quelle ottenibili navigando nelle finestre a partire dai synset gestione degli errori. Non si sono verificati errori durante l interazione tempi risposta I tempi di risposta sono stati giudicati ragionevoli, tranne che per le ricerche sull ontologia. In questo caso, sarebbe utile avere un warning sulla lunghezza del tempo di attesa, che dovrebbe essere quantificato. facilità uso. L interfaccia è facile da usare. Viene però giudicato fastidioso lo scorrimento del mouse sui sensi 7

8 task match. Le funzionalità di browsing sono state giudicate adeguate. Le funzionalità di editing non sono state testate. Osservazioni su copertura e comprensibilità del modello Per quanto riguarda la copertura, il valutatore ha rilevato che non sono presenti i termini utilizzati nella new economy (web, portale, sms, wap, utms), mentre sono invece presenti i nomi delle opere liriche. Lo sbilanciamento nella copertura è stato giudicato fuorviante: un help in linea dovrebbe informare l utilizzatore sulle caratteristiche della copertura. Il valutatore ha anche notato la presenza di un numero esiguo di avverbi e, in molti casi, la mancata valorizzazione di informazioni legate alle varianti. E stata anche notata la mancanza di glosse, che rende difficile discriminare tra i sensi. In questo caso il valutatore ha però sottolineato che è comunque possibile comprendere le differenze tra i sensi esaminando le relazioni. Per quanto riguarda invece la comprensibilità del modello, l utilizzatore giudica poco comprensibili i criteri di classificazione dei Basic Concept rispetto alla Top Ontology (alcuni esempi di note: può essere intuitivo che cascata e spedire siano legate con location, mentre il legame con location non si capisce per convertire, risucchiare, salare, citare ; perché fiume è un place, mentre cascata è una location?"). La riccchezza del modello e le informazioni associabili alle varianti (uso tratti) aveva inoltre suggerito la possibilità di rappresentare casi in cui le parole non sono usate nel loro senso comune, che non sono invece stati trovati all interno del dizionario. Il valutatore ha sottolineato che la possibilità di rappresentare modi di dire darebbe valore aggiunto in un sistema di analisi linguistica (esempi forniti: Caporetto nel senso di disfatta; il senso di carne nel modo di dire: non mettiamo troppa carne al fuoco ). Il valutatore non ha poi compreso il significato di alcune relazioni tra i verbi (ad esempio IS_SUBEVENT_OF, HAS_SUBEVENT, IS_CAUSED), mentre ha percepito che alcune altre (INVOLVED_AGENT, INVOLVED_LOCATION, INVOLVED_INSTRUMENT) potrebbero essere utili in un analisi linguistica, poiché possono aiutare a legare semanticamente parti del discorso che potrebbero anche essere lontane. Come ultimo punto, sono state rilevate alcune anomalie (percezione di duplicazioni di sensi, iponimi comuni) nei casi in cui un lemma è presente sia nella risorsa generica che in quella specifica (è il caso di accordo, agreement, FIAT, comprare). Valutazione finale In generale, la valutazione qualitativa dell interfaccia e della risorsa è stata positiva. Risorsa e interfaccia sono stati percepiti come funzionali all utilizzo in linguistica: il valutatore ha espresso dubbi sulla possibilità dell utilizzo della stessa da parte di un generico utente finale, a causa della complessità del modello. Si noti che, il valutatore di estrazione economica (potenziale utente finale) ha dato in questo caso giudizio opposto.. Secondo il valutatore, una possibile utile applicazione potrebbe essere quella di integrare la risorsa in una interfaccia in cui si visualizza un documento, si selezionano parole e queste vengono cercate in automatico. Dato un tipo di documento (economico, oppure legale) la ricerca si potrebbe poi effettuare in un dizionario di dominio. In questo modo la risorsa sarebbe utilizzabile come helpn-line, al posto del dizionario dei sinonimi Valutatore di estrazione marketing/economica La sessione di valutazione è stata preceduta da una breve spiegazione sulle funzionalità dello strumento e sulle caratteristiche principali del modello. La persona che ha fornito le spiegazioni ha poi assistito alla sessione di interazione con il sistema, fornendo supporto quando necessario. 8

9 consistenza nella presentazione e nell interazione Sono state fatte le seguenti osservazioni: ci si aspetta di poter selezionare iponimi ed iperonimi nella finestra delle relazioni, per proseguire da lì la navigazione. quando un lemma o una forma flessa non viene accettato, l interfaccia dovrebbe fornire una spiegazione: il generico messaggio di warning dovrebbe dare informazioni sul formato accettato i termini appartenenti al dominio economico dovrebbero essere evidenziati graficamente gestione degli errori. Non si sono verificati errori durante l interazione tempi risposta I tempi di risposta sono stati giudicati molto brevi. facilità uso. L interfaccia di browsing è stata giudicata facile da usare. Il valutatore ha cercato anche di utilizzare l interfaccia di editing, per inserire un nuovo nome proprio, ma non è riuscito nell intento. Il valutatore ha sottolineato che questa operazione dovrebbe essere facile, perchè la necessità di estendere il dizionario con nomi propri è comune per un utente finale 2. task match. Le funzionalità di browsing sono state giudicate adeguate. Osservazioni su copertura e comprensibilità del modello Il valutatore ha in generale, giudicato favorevolmente la copertura del lessico generico. Ha però rilevato la mancanza di alcuni temini specifici, ancorchè di recente introduzione nel linguaggio comune umts, gsm). E stata anche notata la mancanza di glosse, che rende difficile discriminare tra i sensi e la valorizzazione numericamente non omogenea delle relazioni. Per quanto riguarda invece la comprensibilità del modello, il valutatore giudica intuitiva ed utile l organizzazione in gruppi di sinonimi, ma di fatto sottolinea di riuscire a seguire e comprendere solo le relazioni principali tra i lemmi (iperonimia, iponimia, antinomia). Viene giudicata necessaria la presenza di un help in linea, che dovrebbe fornire alcune informazioni sul modello. Un altra informazione giudicata necessaria riguarda le fonti dalle quali sono stati estratti i nomi propri: ad esempio,mentre si può supporre che le azioni presenti siano quelle della Borsa di Milano, non si sa da dove provengano i nomi dei fondi. Anche questo valutatore ha infine rilevato alcune anomalie (percezione di duplicazioni di sensi, iponimi comuni) nel caso di un lemma è presente sia nella risorsa generica che in quella specifica (fondo). Valutazione qualitativa finale 2 L'utilizzo di ItalWordnet anche come repository di nomi propri è però un argomento delicato. E' opinione degli autori della valutazione che ItalWordnet non dovrebbe trasformarsi in un gazetter, sia per la difficoltà di manutenzione sia per la migliore adeguatezza di strumenti diversi a questo scopo. In questo senso potrebbe apparire sensato gestire classi specifiche di nomi propri (ad es. nomi comuni Paolo o nomi geografici rilevanti Italia, ma non San Casciano in Val di Pesa) o nomi che hanno assunto un significato specifico nel lessico (ad es. Don Chisciotte). Il problema è però che la cosa dovrebbe essere gestita in modo omogeneo. Se un utente trova i nomi delle azioni si aspetta anche quelli dei fondi, se trova le opere liriche si aspetta anche i Beatles. 9

10 La risorsa e l interfaccia sono state giudicate in modo molto positivo. 2.4 Valutazione di integrabilità del software Le API di IWN sono state testate sia utilizzando l interfaccia Tcl/Tk sviluppata da IRST, che integrando le chiamate di funzioni in un modulo software Java utilizzato per la realizzazione dei test di copertura, che integrando una semplice funzionalità di accesso e presentazione all'interno di un esistente sistema di classificazione realizzato in lisp, come dettagliato in seguito. Tutte le API testate funzionano correttamente e forniscono una copertura adeguata in termine di funzionalità di ricerca. Non immediata da utilizzare (se non da sistemi lisp) è però la sintassi LISPlike di output delle API: la presenza di parentesi graffe e di stringhe con apici quotati rende difficile l interpretazione dei risultati e necessario lo sviluppo di parser specifici; in caso di future estensioni si suggerisce di estendere l'api permettendo la comunicazione di strutture XML analoghe a quelle già utilizzate per l'export. La documentazione delle API, è abbastanza dettagliata da permettere l utilizzo delle funzioni. Al fine di rendere possibile la distribuzione ad utenti finali, è però necessario integrarla con alcuni esempi di utilizzo all interno di alcuni linguaggi di programmazione; sono anche state riscontrati alcuni minori disallineamenti tra la documentazione ed il codice sul formato di alcune informazioni ritornate. Al fine di iniziare a valutare i tempi medi di risposta delle funzioni di accesso si è misurato il tempo di CPU utilizzato dal programma realizzato per valutare la copertura lessicale della risorsa. Il test è stato eseguito accedendo con un client Java al server Lisp ItalWordNet, installato sulla stessa macchina (Windows NT, 256 MB RAM, processore Pentium III). Il tempo medio di risposta per la chiamata API alla funzionalità di overview (utilizzata dal programma di test) è stato di 417 ms, inclusi i tempi di lettura/scrittura su socket. 2.5 Valutazione di copertura del lessico La valutazione di copertura è stata effettuata in automatico utilizzando 3 diversi corpora, tutti relativi al dominio economico finanziario, rispetto al data base 'plugin' che ingloba i data base generico e finanziario. I tre corpus utilizzati sono stati i seguenti: test_parole: 137 testi dal corpus Parole (So sgm, ricevuto da ILC, lo stesso utilizzato per l'annotazione della TreeBank), test_rco1: 999 notizie di agenzia, fonte Radiocor, prodotte nel Giugno Il corpus non è distribuibile. test_rco2: 298 notizie di agenzia, fonte Radiocor, prodotte nel Marzo 2001 (onde avere una copertura differita nel tempo, al fine di evidenziare eventuali shift nella terminologia usata) Per ciascuno dei tre corpus, analizzato separatamente, sono state estratte in maniera automatica due liste di termini. La prima comprende tutti i termini che compaiono nel corpus, con associata la relativa PoS, la seconda ha lo stesso formato ma comprende i soli termini che compaiono nei 10

11 pattern di classificazione effettivamente utilizzati dal sistema di classificazione Quinary (QClassifier) nella classificazione dei testi del corpus. L'utilizzo di questa seconda lista permette di valutare la copertura su un subset giudicato più rilevante, nel senso che comprende sicuramente termini di qualche interesse per un applicazione reale. La PoS ricavata è quella determinata dal sistema di classificazione durante l'analisi; la determinazione è basata sui tool LinguisticX della InXight, inclusi nel sistema di classificazione, che utilizzano tecnologie statistiche. Come vedremo, alcuni buchi nella copertura sono stati causati da erronee assegnazioni di part of speech; è rilevante notare tuttavia, che tali errori sono 'endogeni' nell'uso di qualsiasi tool di tagging e il sistema della InXight non è peggiore della media e quindi la valutazione della rilevanza del fenomeno è comunque utile. Le 6 liste sono quindi state analizzate da un semplice programma Java che andava a verificare la presenza del termine in ItalWordNet, producendo in output una lista di termini che compaiono nel corpus (con PoS congruente) e una lista di termini mancanti (o mancanti rispetto alla PoS assegnata). I 6 test (uno per ognuna delle due liste dei tre corpus) sono stati effettuati sul corpus as is, ovvero senza eliminare preventivamente (cosa che era stata fatta per i test di fase 1.2) l insieme di token corrispondenti a errori tipografici (es. CAPACVIT`), sigle ed altri elementi spuri. Questo al fine di avere una valutazione non solo della copertura rispetto ad un testo ideale ma anche rispetto a testi reali, contenti un normale rumore dovuto ad errori o altro. Alcuni elementi che sono stati però eliminati manualmente in fase di analisi dei risultati, relativi a errori del sistema di classificazione dovuti a malfunzionamenti noti nella fase di preprocessing e già in via di correzione (principalmente errate separazioni in specifici token composti quali 'settembre-ottobre', che sono trattati dal sistema salvo in alcuni casi verificati durante il test) 3, e, nel caso di due dei corpus, la presenza di numeri legati ad un errore nella procedura di estrazione. Nella tabella che segue i dati della colonna 'Pruned' sono i dati dopo la rimozione manuale dei suddetti errori. Nella stessa tabella, la colonna 'Pruned2' riporta quanto rimasto dopo un ulteriore filtro manuale che ha rimosso nomi propri e termini non Italiani 4. E' da notare che sono però stati rimossi solo termini inglesi e francesi non in uso corrente, lasciando invece TUTTI i termini non italiani ma che sono oramai entrati in uso comune (es. pay-tv, web, trader) e quelli che, pur non essendo parte del lessico dell'italiano medio, fanno però ormai parte della terminologia accettata nel mondo finanziario (stock-option, buyback, strike ) e che sarebbe quindi lecito aspettarsi di trovare in un lessico specifico per il mondo economico finanziario 5. Totali Matched Not Matched Time 6 Pruned % Pruned2 3 La motivazione legata all'eliminazione di tali elementi spurii ma non di quelli introdotti, ad esempio, dall'attribuzione della part of speech, è che mentre i primi sono stati assimilati ad errori software correggibili (e di fatto in fase di correzione) i secondi sono di fatto endogeni dato lo stato dell'arte attuale della tecnologia e quindi non è sensato assumerne l'assenza. 4 Nel primo corpus si verifica un alta percentuale di termini non Italiani, a causa di un paio di notizie che includevano parti sostanziali in francese. 5 Tanto che infatti alcuni termini appaiono nel sistema, anche se con coperture abbastanza anomale: ad esempio è presente webmaster ma non web. 6 Tempo medio, in millisecondi, per una richiesta sui dati. 11

12 Rco1 texts % % Rco1 matches % % Rco2 texts % % Rco2 matches % % Parole texts % % Parole matches % % Tabella 3 Sui risultati ottenuti (ovvero sulle liste di termini 'pruned2') è stata poi effettuata un'ulteriore analisi manuale, in modo da determinare le principali classi di errori. In particolare sono stati identificati tutti gli errori causati da: Errori di battitura (colonna 'typo'). Notabilmente assenti nel corpus derivato da Parole, non a caso verificato manualmente a monte. Errori legati alla presenza di termini composti, ove la composizione fosse arbitraria e quindi non con valenza terminologica ad esempio 'economico-finanziario' ma non 'pro-soluto' o 'pay-tv' (colonna 'compound'). Errori dovuti ad errata assegnazione di part of speech o di estrazione della radice del lemma da parte del sistema di analisi (Qclassifier); es. 'espositori' ove il lemma 'espositore' esiste (colonna pos1) Errori dovuti a mancato riconoscimento a causa della necessità di derivazioni complesse. (colonna pos2). I casi più comuni sono 1. participi usati in forma aggettivale: es. 'indicizzato' (dove esiste indicizzare). 2. Diminutivi: es. pochino 3. Verbi riflessivi: es. posizionarsi (dove esiste posizionare) si noti peraltro che per alcuni verbi in IWN viene fornita anche la voce riflessiva 4. Nomi o aggettivi di derivazione verbale: es posizionamento, marginalizzazione dove esiste la voce verbale anche qui peraltro esistono casi in IWN in cui è presente anche la voce derivata 5. Verbi derivati via prefissi: es predefinire anche qui notare che altri esistono es preavvisare. Occorre notare che la problematica sottesa da questa casistica è non sorprendentemente rilevante, se non in termini quantitativi, in termini qualitativi, visto che i termini in questione possono essere spesso oggetto di analisi e portano informazione spesso rilevante. Inoltre, se il caso 1 è spesso gestito/gestibile a monte (ad es. nel caso dell'analizzatore utilizzato il sistema determina la root form sulla base della part of speech, che è spesso corretta ovvero ad es. 'indicizzato' è davvero usato in forma aggettivale, ma determina anche il lemma del verbo, e quindi il problema è aggirabile), nei casi 3,4,5 lo è molto meno. I risultati sono riassunti nella tabella seguente; la colonna 'Pruned3' riporta la mancata copertura sottratti gli errori appena descritti. Matched Pruned2 Compound Typo Pos1 Pos2 Pruned3 Rco1 texts % % 12

13 Rco1 matches % % Rco2 texts % % Rco2 matches % % Parole texts % % Parole matches % % Tabella 4 Gli errori non coperti dalla casistica precedente (ovvero quelli riportati nella colonna pruned3) riguardano principalmente avverbi, sigle o abbreviazioni (es. TLC telecomunicazioni o IT information technology) entrate nell'uso comune, termini di derivazione straniera. A titolo di esempio riportiamo: i 25 termini della colonna 'pruned3' del test effettuato sul corpus 'Parole matches': Anche Fotografico Intanto Multimedia Quasi Cassaintegrato Infine Invece Nickel Quinquennale Circa Inoltre Israelitico Oltre Rating Destagionalizzato Inossidabile Lavorativo Pay-Tv Tlc Ferroso Inottemperanza Manifatturiero Pro-Soluto Trentennale Tabella 5 7 e i 274 termini della colonna 'pruned3' del test effettuato sul corpus Rco1 texts: 7 E' da notare come tutti gli avverbi segnalati come mancanti in questa tabella in realtà non fossero previsti - gli avverbi previsti sono quelli in mente derivati dagli aggettivi. 13

14 A.D. Cw Indietro Networking Redine Abbastanza Da Industriare Neutro-Negativo Regolatoria Addirittura Daccapo Infine Newsletter Report Adesso Davvero Information Nordcoreano Ricentrarsi Allora Daytrader Ingrosso Nordcoreano Ricomprese Almeno Debacle Innanzitutto Number Ridenominare Altrimenti Desk Inoltre Odg Riequilibrio Anche Destagionalizzati Insider Offshore Rilento Anticompetitive Devise Insomma Oltre Rimarcare Antiriciclaggio Diesel Intanto Oltrefrontiera Riofferta Appena Dietro Intenzionato Oltreoceano Risospesa Apprezzatori Difatto Intercoreani Online Risospeso Aprilegiugno Digitalizzazione Intergovernativo Options Risponditore Assai Digitazione Intergruppo Oramai Risultanza Asset Diligence Intermarket Ormai Roaming Attivita Dilutivo Interoperativi Osta Roe Azero Discount Interoperativo Overbidding Sanzionatori Bank Disdettato Interoperativo Parimenti Scalettati Banking Dismettere Intorno Parita Segmentare Benefit Dismissione Intraday Paritario Sempre Benino Dismissioni Introduction Peraltro Sharing Blue-Chips Dopo Invece Perfino Shortlist Board Dopodomani IT Persino Sim Borsini Itinere Pesos Spin-Off Buyback Ebitda Joint Piuttosto Split Cadauna Ebusiness JV Player Spread Call Ecco Kilobytes Plenario Start-Up Canosani Econometrici Lab Plus Stazionare Cartolarizzazione Economy Lariano Pochino Stereo Cash-Flow Ennesimo Lead Pole Stilare Catering Entertainment Leveraged Poltronissima Stock-Options Chaebol Entita Macro Post Strike Chaebol Esprit Made Pound Strip Chip Extracaratteristica Made Pre Suddetto Circa Fino Mai Predefinire Supplente Clicca Finora Manovrina Preferred Switching Close Flat Mappatura Pregressa Taiwanese Collocatore Flow Martedi Previo Tanto Commerce Frattempo Master Price-Cap Tech Commodities Global Max Procapite Telco Competitor Global Maxiplusvalenze Processing Tempistico Composite Golden Megawatt Procinto Tlc Comunque Graficisti Merchant Proforma Tracking Consecutivo Hi-Tech Microchip Prosegure Trading Consensus High Microdanni Pure Trentennale Consumer Hit Mini-Stretta Purtroppo Turnover Consuntivati Hoc Modus Put Tuttora Contempo Hub Mol Quale Ultraprotetto Contraltare Illiquida Monitorando Quali Unbundling Controdeduzione Immobiliaria Multicanale Quasi Unifamiliare Contropa Impugnativa Multimediale Quinquennale Utilities Coordinator Incirca Multiutility Range Validazione Corporation Income Neanche Rating Viceministro Crash Incubatore Neoministri Ratio Web Customizzati Neppure Rc Wireless Tabella 6 14

15 La copertura sembra in definitiva ragionevole. La mancanza maggiore al di la della problematica evidenziata sulla terminologia 'derivazionale' - è su terminologia specialistica e in particolare modo per termini 'nuovi', ma il difetto si può ritenere purtroppo inevitabile, come in qualsiasi risorsa linguistica non legata ad una lingua morta. Della cosa occorre peraltro tenere il dovuto conto per il futuro in quanto indica chiaramente (se mai fosse necessario) la necessità di un attività continuativa di manutenzione dopo la conclusione del progetto. 2.6 Valutazione di usabilità dell'interfaccia di editing L' applicazione di accesso al sistema permette anche l'estensione della banca dati di ItalWordnet. L'interfaccia di editing risulta abbastanza agevole da usare, anche se leggermente meno intuitiva dell'interfaccia di browsing 8. E' da sottolineare peraltro che sarebbero utili strumenti che permettano il tracking delle modifiche, e possibilmente l'export selettivo (e di contro l'import di quanto prodotto) in modo da poter facilitare un aggiornamento distribuito su diversi siti. E' ovvio che una risorsa quale IWN non può che essere soggetta ad una gestione in qualche modo centralizzata per garantirne la coerenza, ma sarebbe opportuno che la centralizzazione si riducesse alle attività di 'merge' controllate, permettendo la distribuzione delle attività di inserimento ed estensione. 3 Valutazione sperimentale Obiettivo prioritario della attività era quello di permettere una valutazione della risorsa ItalWordNet in un caso di possibile uso concreto, in modo da poter verificare copertura linguistica e reale utilizzabilità. Il caso prescelto in fase di pianificazione era stato l estensione di un sistema di classificazione esistente presso Quinary ed attualmente in uso in produzione presso un importante fornitore di informazione finanziaria Italiano. La scelta fatta era legata principalmente ai seguenti fattori: 1. La rilevanza della tematica, ovvero, ovviamente, la potenziale utilità della risorsa ItalWordNet nel caso specifico. 2. La piena disponibilità e controllo da parte di Quinary dell attuale sistema di classificazione (sviluppato internamente) e la conseguente possibilità da un lato di estendere ed integrare il sistema, dall altro di poter effettuare valutazioni comparate sui benefici ottenuti o comunque ottenibili. Per quanto attiene la rilevanza della tematica, l attuale sistema di classificazione, che verrà descritto con qualche maggiore dettaglio in un successivo paragrafo, è basato su tecnologie euristiche di pattern matching, ove le entità oggetto del match (le feature di classificazione) sono di fatto entità linguistiche concettuali. Il sistema attuale è interamente knowledge based, nel senso di essere basato su: 8 Essendo però destinata per definizione a personale competente, tale minor intuitività è decisamente qui meno rilevante. 15

16 strutture definenti conoscenza di dominio tra le diverse entità di interesse per il mondo finanziario (ad es. leganti i concetti di mercato azionario e di indice di mercato), una codifica esplicita delle regole di mapping tra feature linguistiche ed entità concettuali (via pattern matching) regole esplicite di mapping tra quelle che sono le entità concettuali rilevate nei testi e le voci di classificazione finale. Mentre il primo e l ultimo punto sono legati ad aspetti sostanzialmente non lessicali e linguistici, il secondo punto è invece in toto condizionato da aspetti linguistici. Nell attuale sistema la codifica dei pattern che permettono di effettuare un match di entità concettuali è totalmente effettuata in modo manuale. L idea era quindi quella di verificare quanto simili attività possano essere supportate o addirittura almeno in prospettiva sostituite da strumenti linguistici, e in particolare supportati dall utilizzo della risorsa ItalWordNet. 3.1 Il sistema di classificazione attuale Il sistema di classificazione considerato è il sistema QClassifier, derivato da quanto sviluppato nei progetti Cobalt (LRE-xxx) e Facile (LE 2440) ([Gilardoni 94],[Ciravegna 99]), entrambi parzialmente sponsorizzati dalla Comunità Europea. Il sistema è attualmente in uso presso un rilevante fornitore di informazione finanziaria a livello nazionale, dove è utilizzato per classificare in tempo reale e in maniera totalmente unsupervised le notizie prodotte dall agenzia. Il sistema è basato su un approccio totalmente knowledge-based, e utilizza tecniche di pattern matching integrate con strumenti di rappresentazione della conoscenza per permettere di sfruttare una rappresentazione ricca del dominio. Il processo di classificazione opera sostanzialmente in due fasi. Nella prima fase il testo, dopo aver subito un pretrattamento (zoning e preprocessing) che permette l identificazione della struttura del testo (frasi e periodi, inclusa l identificazione di aree strutturalmente rilevanti quali il titolo) la suddivisione in frasi e quindi in token, l aggancio di informazioni linguistiche di base (part of speech e informazioni morfologiche) e l identificazione di entità speciali (numeri, date, nomi propri etc.) viene matchato contro un insieme di concetti, sulla base di un insieme di pattern para-linguistici. Il risultato della prima fase è l identificazione nel testo in esame di una serie di concetti esplicitamente menzionati nel testo. Ad esempio un testo contenente ha chiuso il 2000 con un utile netto consolidato pari a 91.7 miliardi porterà all identificazione dei due concetti COMPANY_YEAR_RESULTS (da: ha chiuso il 2000 con un utile.. ) e INCOME_STM_ITEMS (da utile netto consolidato ). 16

17 Tokenized Tagged Text MorphoSyn info, Entities recognition Preprocessor Text Zoner Marked Up Text Shallow Analyzer Concept Matches Control Module Categories Enriched Marked Up Text Figura 1 Nella seconda fase, i risultati del match vengono considerati da una serie di regole euristiche che determinano la classificazione, sulla base di criteri redazionali: ad esempio la notizia che conteneva il frammento dell esempio era classificata come ANNUALE sulla base della presenza dei due match suddetti e dell assenza di concetti legati a commenti di borsa (onde evitare la classificazione ANNUALE nel caso di notizie dove il riferimento agli utili è solo un sidebar essendo il cuore della notizia centrato sull andamento della borsa in generale). Il sistema è attualmente strutturato in modo da sfruttare pesantemente una rappresentazione concettuale esplicita e ricca del dominio. L insieme dei concetti è strutturato come una rete semantica, e la struttura gerarchica può venire sfruttata sia nelle regole euristiche di classificazione sia nelle strutture di pattern legate ai concetti. company_results company_industrial_results new_company_plants company_orders impact_on_sector form_companies_agreement new_product_and_processes form_joint_ventures merging_and_acquisition company_financial_situation_data Figura 2 Occorre però notare che la rete semantica strutturante l insieme dei concetti, denota entità di dominio e non entità linguistiche, ed è costruita e strutturata ai fini classificatori ed indipendentemente dagli aspetti linguistici. Ad esempio esiste un concetto AZIONE che denota il 17

18 noto strumento finanziario. Ma ovviamente non esiste il concetto CANE, in quanto non rilevante sul dominio, e neppure, analogamente, il concetto di azione come azione di gioco etc. Per analoghi motivi, esistono nella attuale KB i concetti di AZIONE_DI_RISPARMIO, AZIONE_ORDINARIA e AZIONE_PRIVILEGIATA (tutti ISA AZIONE ) ma non quelli di AZIONE_QUOTATA, non tanto perché il concetto non abbia ragione in astratto di esistere ma perché non ha ragione di esistere ai fini classificatori specifici - ovviamente lo avrebbe, ed andrebbe aggiunto, qualora occorresse per qualche ragione distinguere le azioni quotate da quelle non quotate. Le scelte sono in questo caso guidate da criteri pragmatici rispetto ai desiderata di discriminazione; ovvero il problema della sense disambiguation è parzialmente risolto alla radice non comprendendo sensi non rilevanti. Il criterio di concettualizzazione ovvero di inserimento nella conoscenza del sistema è quindi legato sostanzialmente a due aspetti: la rilevanza ai fini discriminatori (come dall esempio di cui sopra) ovvero in funzione della possibilità di definire regole euristiche, e l utilità ai fini di partizionamento della conoscenza, legata al fatto che pattern lessicali agganciati ad un concetto possono far riferimento ad altri concetti. Questo secondo aspetto va a coprire la necessità di partizionamento della conoscenza in modo da permettere una migliore gestibilità del sistema. L approccio scelto, basato sulla codifica manuale di pattern di match e regole euristiche, permette di raggiungere ([Gilardoni 95],[Ciravegna 2000]) gradi di accuratezza elevati, con valori di recall e precision 9 attorno al 90%, tanto da permettere un funzionamento totalmente autonomo, come provato dal sistema in produzione presso Il Sole 24 Ore Radiocor, funzionante in modo totalmente unattended. L'ovvio svantaggio di un simile approccio è dovuto ai tempi di sviluppo, legati alle attività di analisi e codifica manuali, con impatto negativo sia sui tempi di rilascio di nuove applicazioni ovvero con copertura di domini diversi sia sui costi complessivi. L'utilizzo di tecniche di modellazione basate su un sistema di rappresentazione ricco permettono di ridurre i tempi ed alleviare gli oneri, ma strumenti di ausilio nella codifica e nell'analisi sono fortemente desiderati. 3.2 Il caso sperimentale L idea alla base del caso sperimentale era verificare come l'utilizzo di una risorsa come IWN potesse supportare l'attività dell'ingegnere del linguaggio nella costruzione o nell'estensione di un'applicazione di classificazione, o, idealmente quali attività potessero essere sostituite in toto da strumenti costruiti sopra IWN. Il primo aspetto, ovvero il supporto nella codifica della conoscenza, è ottenibile anche solo da un utilizzo diretto della risorsa in consultazione. Il processo di codifica è attualmente basata su un 9 L accuratezza dei sistmi di information retrieval è stata storicamente misurata in termini delle due grandezze denominate precision e recall, che misurano rispettivamente il rumore introdotto e l accuratezza. Formalmente, denominati POS l insieme dei testi classificabili rispetto ad una query (nel nostro caso, associati ad una chiave di classificazione), ACT l insieme dei testi classificati dal sistema, e COR l insieme POS ACT di quelli classificati correttamente, si ha: Recall (REC) = COR/POS Precision (PRE) = COR/ACT 18

19 processo iterativo di analisi di esempi di testi, con l'identificazione di concetti rilevanti e dei relativi pattern lessicali, di test su insieme allargato di testi (con la relativa problematica di identificazione di quelli rilevanti), e quindi di espansione e raffinamento della rete di concetti identificata. A titolo di esempio sul processo, possiamo considerare le attività legate alla definizione della conoscenza necessaria ad identificare testi legati ad un ipotetica categoria 'compravendita di azioni'. Il primo step è ovviamente quello di caratterizzare la categoria rispetto ai desiderata. In generale la cosa è ottenuta interagendo con un esperto di dominio (es. un giornalista di una redazione economica) e caratterizzando la categoria in termini di concetti finanziari e di esempi (ed eventualmente controesempi). Nel caso in esempio la caratterizzazione informale potrebbe essere: "tutte le notizie che menzionano la compravendita di azioni o quote azionarie, dove si menzionino esplicitamente gli attori o le azioni (ovvero non notizie generali che parlano del volume di scambi in borsa o di livelli di prezzi)". Un esempio potrebbe essere: "In base all'accordo, la SingTel acquistera' il 14,48% delle azioni della Time", oppure " I titoli venduti al di fuori degli Stati Uniti..". A questo punto il processo richiede la costruzione di un pattern di 'seed', generalizzato sulla base degli esempi e dell'intuizione/conoscenza dell'ingegnere del linguaggio. Nel nostro caso la radice potrebbe essere, semplicemente: "comprare (V) NEAR azione (N)" e l'immediata generalizzazione: "(comprare +V 10 OR vendere +V) NEAR (azione +N OR titolo +N)" Il pattern di seed attraverso l'analisi di esempi è poi esteso a coprire i casi significativi. Al termine dell'analisi il risultato sarà qualcosa del tipo 11 : Defconcept share_ pattern: ( ((blue (chip OR chips)) OR blue-chip OR blue-chips) OR ((NOT (campo di) azione +N) OR (titolo +N (NOT (di stato OR del tesoro OR quinquennale OR trentennale OR decennale))) Defconcept share_ purchase pattern: ((((NOT non) (comprare +V OR acquisizione OR acquistare +V OR riacquistare +V OR vendere +V OR vendita OR cessione)) (NEAR 6 (#$concept-global share_ ))). Ora, è evidente che almeno in linea di principio le attività di espansione del pattern seed potrebbero essere in parte automatizzate o quantomeno supportate dall'utilizzo di IWN I tag '+V', '+N' indicano l'uso del lemma come verbo o nome rispettivamente, ammettendo le diverse varianti morfologiche; quindi un pattern come il suddetto coprirà "Compreranno azioni", "Hanno comprato azioni" etc. 11 L'esempio è reale ma semplificato. Nel caso del sistema in uso presso il fornitore di notizie finanziarie esiste effettivamente un concetto di share_, mentre il concetto di compravendita è per ragioni qui non rilevanti spaccato nei due aspetti di acquisto e vendita; inoltre i pattern sono stati notevolmente semplificati sia come sintassi che come contenuti. 19

20 3.2.1 Navigazione nella rete un esempio. Per verificare il processo, è stata considerato il pattern iniziale 'comprare azioni', e sono stati analizzati i possibili 'percorsi' derivabili utilizzando IWN. Premessa generale sui risultati: per ogni lemma cercato in ItalWordNet abbiamo riportato tutti i synset ricavati dalla relazione di sinonimia, iperonimia, iponimia e antonimia (se presenti) e altre relazioni che potevano essere utili. Per ogni synset abbiamo riportato il senso, i sinonimi, la definizione (se presente), i concetti dell ontologia a cui il synset è legato e i campi semantici (valorizzati solo nel DB economico). Nelle tabelle dei risultati le righe in grigio riportano synset già ritornati da ricerche precedenti (riportati ugualmente per completezza). La multiword comprare azioni non esiste in ItalWordnet. Esiste però acquisto di azioni : senso valori Definizione concetti ontologia Campi semantici acquisto di azioni SINONIMI 1 acquisto di azioni#1 object possession - Exchange dynamic IPERONIMI 1 compera#1 acquisto#1 object possession - Commerce dynamic IPONIMI 1 acquisto di azioni proprie#1 object possession Exchange 1 acquisto di azioni improprie#1 Tabella 7 dynamic object possession dynamic Exchange L' iperonimo è assolutamente generico, anche se già indica la variante 'comprare' rispetto ad 'acquistare'. I due iponimi sono significativi 13 ma giudicati non rilevanti ai fini specifici applicativi (ovvero in questo momento non interessa la distinzione). Scomposto comprare azioni in comprare verbo e azione nome sono stati analizzati i due lemmi. senso valori Definizione concetti ontologia campi semantici comprare SINONIMI 1 comperare#1 acquistare#1 ottenere in proprietà dando del possession, dynamic comprare#1 denaro 2 comperare#2 compare#2 corrompere con denaro cause 3 acquistare#5 comprare#3 possession - dynamic commerce, economy 12 Un diverso utilizzo di IWN nell'ambito del processo visto, ma che non è stata qui considerato, è legato all'identificazione da un corpus, tramite tecniche statistiche, dei synset utilizzati nel corpus; se il corpus è anche taggato rispetto alle categorie rilevanti ai fini classificatori, diventa possibile identificare le possibili 'seed' concettuali legate in qualche modo alla classificazione, fornendo quindi supporto anche nell'identificazione degli elementi rilevanti. 13 Occorre peraltro notare che mentre 'azioni proprie' ha un preciso senso in campo finanziario, 'azioni improprie' non è chiaro se sia stato inserito per complementarietà (ma allora il termine non risulta usato) o con altro significato (difficile da determinare in assenza di glosse od esempi). 20

Costruzione di risorse terminologiche: criteri, risultati e prodotti disponibili. Rita Marinelli Rita.Marinelli@ilc.cnr.it

Costruzione di risorse terminologiche: criteri, risultati e prodotti disponibili. Rita Marinelli Rita.Marinelli@ilc.cnr.it Costruzione di risorse terminologiche: criteri, risultati e prodotti disponibili Rita Marinelli Rita.Marinelli@ilc.cnr.it ILC: database terminologici Sono state sviluppate tre risorse terminologiche appartengono

Dettagli

Relazione Pinakes3 Analisi modello di business (BOZZA) di Valeriano Sandrucci 08/09/07

Relazione Pinakes3 Analisi modello di business (BOZZA) di Valeriano Sandrucci 08/09/07 Relazione Pinakes3 Analisi modello di business (BOZZA) di Valeriano Sandrucci 08/09/07 1. Introduzione...3 1.2. Application vs Tool... 3 2. Componenti logiche di un modello... 6 3. Ontologie e Semantic

Dettagli

aided content analysis)

aided content analysis) T-Lab Stefano Nobile L analisi del contenuto computerizzata (computer aided content analysis) I software in commercio per l analisi l del contenuto computerassistita possono essere distinti in due grandi

Dettagli

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE Il sistema di ricerca della biblioteca virtuale permette di accedere in maniera rapida ai materiali didattici di interesse degli studenti presenti all interno del

Dettagli

Progetto Finale: Modelli semantici dei dati in domini applicativi specifici

Progetto Finale: Modelli semantici dei dati in domini applicativi specifici Progetto Finale: Modelli semantici dei dati in domini applicativi specifici Roberto Basili, Marco Pennacchiotti Corso di Fondamenti di Informatica a.a. 2003-2004 Definizioni Generali e Regole d esame Il

Dettagli

Processi (di sviluppo del) software. Fase di Analisi dei Requisiti. Esempi di Feature e Requisiti. Progettazione ed implementazione

Processi (di sviluppo del) software. Fase di Analisi dei Requisiti. Esempi di Feature e Requisiti. Progettazione ed implementazione Processi (di sviluppo del) software Fase di Analisi dei Requisiti Un processo software descrive le attività (o task) necessarie allo sviluppo di un prodotto software e come queste attività sono collegate

Dettagli

Opendata e ontologie Due esempi d'uso

Opendata e ontologie Due esempi d'uso Opendata e ontologie Due esempi d'uso Stefano Penge (a), Andrea Sterbini (b), Maurizio Mazzoneschi (a), Giorgio Consorti (a) (a) Lynx s.r.l. (b) Dipartimento di Informatica, Sapienza Università di Roma

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testualilezione 2 Le principali tecniche di analisi testuale Facendo riferimento alle tecniche di data mining,

Dettagli

Quick Introduction T-LAB 9.1. Strumenti per l Analisi dei Testi. Marzo 2014. Copyright 2001-2014 T-LAB by Franco Lancia All rights reserved.

Quick Introduction T-LAB 9.1. Strumenti per l Analisi dei Testi. Marzo 2014. Copyright 2001-2014 T-LAB by Franco Lancia All rights reserved. T-LAB 9.1 Marzo 2014 Quick Introduction Strumenti per l Analisi dei Testi Copyright 2001-2014 T-LAB by Franco Lancia All rights reserved. Website: http://www.tlab.it/ E-mail: info@tlab.it T-LAB is a registered

Dettagli

INFOSTAT-COVIP. Piattaforma per la raccolta delle informazioni MANUALE UTENTE

INFOSTAT-COVIP. Piattaforma per la raccolta delle informazioni MANUALE UTENTE INFOSTAT-COVIP Piattaforma per la raccolta delle informazioni MANUALE UTENTE febbraio 2015 I N D I C E 1. ISTRUZIONI OPERATIVE PER L'UTILIZZO DEI SERVIZI INFOSTAT-COVIP... 3 2. HOME PAGE... 4 3. ACCESSO

Dettagli

Documentazione Demo online

Documentazione Demo online READ-IT Documentazione Demo online ILC-CNR ItaliaNLP Lab Sommario 1 MISURAZIONE DELLA LEGGIBILITÀ DI UN TESTO 2 1.1 Analisi globale della leggibilità 3 1.1.1 Valutazione globale della leggibilità del documento

Dettagli

Legge 808/85 Vademecum per la compilazione della domanda di finanziamento. Divisione VIII Industria dell'aerospazio e della difesa

Legge 808/85 Vademecum per la compilazione della domanda di finanziamento. Divisione VIII Industria dell'aerospazio e della difesa Ministero dello Sviluppo Economico Dipartimento per l Impresa e l Internazionalizzazione Direzione generale per la politica industriale e la competitività Divisione VIII Industria dell'aerospazio e della

Dettagli

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE di K A T H A G E D O R N, A R G U S A S S O C I A T E S MARZO 2 0 0 0 traduzione di: BARBARA WIEL MARIN DICEMBRE 2009 1 GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

Dettagli

UNIVERSITÀ DEGLI STUDI DI FIRENZE. Relazione elaborato di progettazione e produzione multimediale

UNIVERSITÀ DEGLI STUDI DI FIRENZE. Relazione elaborato di progettazione e produzione multimediale UNIVERSITÀ DEGLI STUDI DI FIRENZE Relazione elaborato di progettazione e produzione multimediale AllPainters.Net SISTEMA PER LA GENERAZIONE DI SITI GRATUITI PER PITTORI Autori: - Bandini Roberto - Ercoli

Dettagli

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence Introduzione Definizione di Business Intelligence: insieme di processi per raccogliere

Dettagli

La metodologia di valutazione dei siti Web della Pubblica Amministrazione. La metodologia di valutazione

La metodologia di valutazione dei siti Web della Pubblica Amministrazione. La metodologia di valutazione La metodologia di valutazione dei siti Web della Pubblica Amministrazione P. Atzeni, P. Merialdo, P. Russo, G. Sindoni, G. Sissa Paolo Merialdo Dipartimento di Informatica e Automazione Università Roma

Dettagli

MICROSOFT ACCESS. Fabrizio Barani 1

MICROSOFT ACCESS. Fabrizio Barani 1 MICROSOFT ACCESS Premessa ACCESS è un programma di gestione di banche dati, consente la creazione e modifica dei contenitori di informazioni di un database (tabelle), l inserimento di dati anche mediante

Dettagli

Linee guida per lo sviluppo e la gestione di un sito Web

Linee guida per lo sviluppo e la gestione di un sito Web Linee guida per lo sviluppo e la gestione di un sito Web Paolo Atzeni Università Roma Tre Dipartimento di Informatica e Automazione atzeni@dia.uniroma3.it http://www.dia.uniroma3.it/ atzeni/ Roma, 25 settembre

Dettagli

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File system verso DBSM Vantaggi di un DBMS Modelli dei dati Utenti

Dettagli

Tecnopolis CSATA s.c.r.l. APQ in Materia di Ricerca Scientifica nella Regione Puglia

Tecnopolis CSATA s.c.r.l. APQ in Materia di Ricerca Scientifica nella Regione Puglia BANDO ACQUISIZIONI Prodotti Software ALLEGATO 6.3 Capitolato Tecnico Piattaforma per l Analisi e la Progettazione di alto livello del Software Allegato 6.3: capitolato tecnico Pag. 1 1 Ambiente di Analisi

Dettagli

Code Architects S.r.l. SWOP Semantic Web-service Oriented Platform B2SO201

Code Architects S.r.l. SWOP Semantic Web-service Oriented Platform B2SO201 UNIONE EUROPEA FONDO EUROPEO DI SVILUPPO REGIONALE. REGIONE PUGLIA AREA POLITICHE PER LO SVILUPPO IL LAVORO E L INNOVAZIONE Modello M14 Allegati RTA POR PUGLIA 2007-2013 - Asse I Linea 1.1 Azione 1.1.2

Dettagli

Overview. Enterprise Project Control System. Principali caratteristiche e funzionalità del Sistema. Piemme S.r.l

Overview. Enterprise Project Control System. Principali caratteristiche e funzionalità del Sistema. Piemme S.r.l Enterprise Project Control System Overview Principali caratteristiche e funzionalità del Sistema Bridge è stato realizzato da PIEMME s.r.l. di Genova Via Carducci 5/4 sn Tel. 010 4075751 «Bridge», per

Dettagli

Il ciclo di vita del software

Il ciclo di vita del software Il ciclo di vita del software Il ciclo di vita del software Definisce un modello per il software, dalla sua concezione iniziale fino al suo sviluppo completo, al suo rilascio, alla sua successiva evoluzione,

Dettagli

Introduzione ai sistemi di basi di dati

Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Alessandro.bardine@gmail.com alessandro.bardine@iet.unipi.it Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

Ingegneria del Software Progettazione

Ingegneria del Software Progettazione Ingegneria del Software Progettazione Obiettivi. Approfondire la fase di progettazione dettagliata che precede la fase di realizzazione e codifica. Definire il concetto di qualità del software. Presentare

Dettagli

La cultura della gestione della conoscenza è diventata

La cultura della gestione della conoscenza è diventata RAGONAMENT 41 La rete per insegnare D FABRZO EMER Tecnologie e modelli per l e-teaching La cultura della gestione della conoscenza è diventata il punto focale dell apprendimento. Questa innovazione comporta

Dettagli

Lo strumento. di Business Intelligence alla portata di tutti

Lo strumento. di Business Intelligence alla portata di tutti B USINESS I NTELLIGENCE Lo strumento di Business Intelligence alla portata di tutti Modulo INFOREADER INFOREADER è il modulo di INFOBUSINESS che consente di abilitare la postazione di lavoro alla visualizzazione

Dettagli

SisTabWeb Web. Sistema Tabelle. for Enterprise

SisTabWeb Web. Sistema Tabelle. for Enterprise SisTabWeb Web Sistema Tabelle for Enterprise Overview La condivisione del patrimonio dati a livello aziendale diventa essenziale nel momento in cui il sistema informativo, elemento chiave per l'efficienza

Dettagli

***** Il software IBM e semplice *****

***** Il software IBM e semplice ***** Il IBM e semplice ***** ***** Tutto quello che hai sempre voluto sapere sui prodotti IBM per qualificare i potenziali clienti, sensibilizzarli sulle nostre offerte e riuscire a convincerli. IBM and Business

Dettagli

&RUVRGLLQWURGX]LRQH DOO LQIRUPDWLFD. Microsoft Word. Tutorial

&RUVRGLLQWURGX]LRQH DOO LQIRUPDWLFD. Microsoft Word. Tutorial &RUVRGLLQWURGX]LRQH DOO LQIRUPDWLFD Microsoft Word Tutorial Sommario Introduzione Formattazione del documento Formattazione della pagina Layout di pagina particolari Personalizzazione del documento Integrazione

Dettagli

1. Rappresentazione della conoscenza 2. Ontologie 3. Usi delle ontologie 4. Progettazione di un ontologia 5. Esempio di progettazione di una

1. Rappresentazione della conoscenza 2. Ontologie 3. Usi delle ontologie 4. Progettazione di un ontologia 5. Esempio di progettazione di una 1. Rappresentazione della conoscenza 2. Ontologie 3. Usi delle ontologie 4. Progettazione di un ontologia 5. Esempio di progettazione di una ontologia 1 Rappresentazione della conoscenza Il problema di

Dettagli

Verifica di Accessibilità del sito www.aots.sanita.fvg.it

Verifica di Accessibilità del sito www.aots.sanita.fvg.it Verifica di Accessibilità del sito www.aots.sanita.fvg.it NOTE: Verifica effettuata in base ai requisiti descritti nell allegato A del Decreto Ministeriale 8 luglio 2005, ai sensi della legge n.4 del 9

Dettagli

Design of Experiments

Design of Experiments Design of Experiments Luigi Amedeo Bianchi 1 Introduzione Cominciamo spiegando cosa intendiamo con esperimento, ossia l investigare un processo cambiando i dati in ingresso, osservando i cambiamenti che

Dettagli

SOLUZIONE Web.Orders online

SOLUZIONE Web.Orders online SOLUZIONE Web.Orders online Gennaio 2005 1 INDICE SOLUZIONE Web.Orders online Introduzione Pag. 3 Obiettivi generali Pag. 4 Modulo di gestione sistema Pag. 5 Modulo di navigazione prodotti Pag. 7 Modulo

Dettagli

Sistemi Informativi e WWW

Sistemi Informativi e WWW Premesse Sistemi Informativi e WWW WWW: introduce un nuovo paradigma di diffusione (per i fornitori) e acquisizione (per gli utilizzatori) delle informazioni, con facilità d uso, flessibilità ed economicità

Dettagli

www.nltk.org link.nltk un workbench linguistico su Plone Giovanni Toffoli Incontro presso IASI-LEKS del 2 Luglio 2010

www.nltk.org link.nltk un workbench linguistico su Plone Giovanni Toffoli Incontro presso IASI-LEKS del 2 Luglio 2010 www.nltk.org link.nltk un workbench linguistico su Plone Giovanni Toffoli Che cosa è link.nltk link.nltk è un'estensione per Plone che include: un workbench per creare, raffinare e valutare risorse linguistiche

Dettagli

Automatic Ontology-Based Knowledge Extraction from Web Documents

Automatic Ontology-Based Knowledge Extraction from Web Documents Automatic Ontology-Based Knowledge Extraction from Web Documents 5 gennaio 2009 1 Introduzione Al ne di ottenere un eettivo WEB semantico bisogna essere in grado di costruire servizi che consentano l'estrazione

Dettagli

Introduzione alla Business Intelligence

Introduzione alla Business Intelligence SOMMARIO 1. DEFINIZIONE DI BUSINESS INTELLIGENCE...3 2. FINALITA DELLA BUSINESS INTELLIGENCE...4 3. DESTINATARI DELLA BUSINESS INTELLIGENCE...5 4. GLOSSARIO...7 BIM 3.1 Introduzione alla Pag. 2/ 9 1.DEFINIZIONE

Dettagli

capitolo 3 LE LINEE GUIDA

capitolo 3 LE LINEE GUIDA capitolo 3 LE LINEE GUIDA Il presente capitolo illustra i principali elementi metodologici ed operativi che caratterizzano le Linee guida proposte per la valutazione dei prodotti didattici per l e-learning.

Dettagli

Servizio di Conservazione a norma Service Level Agreement Sistema di Gestione per la Qualità - DQ_07.06 UNIMATICA S.p.A.

Servizio di Conservazione a norma Service Level Agreement Sistema di Gestione per la Qualità - DQ_07.06 UNIMATICA S.p.A. Servizio di Conservazione a norma Service Level Agreement Sistema di Gestione per la Qualità - DQ_07.06 pag. 1 di 12 Revisione Data Motivo Revisione Redatto da Approvato da 1.0 03/10/2009 Emissione Andrea

Dettagli

LA MISURA DEL SERVIZIO DI ASSISTENZA AGLI UTENTI

LA MISURA DEL SERVIZIO DI ASSISTENZA AGLI UTENTI LA MISURA DEL SERVIZIO DI ASSISTENZA AGLI UTENTI Gruppo di monitoraggio INAIL Abstract È illustrata l esperienza INAIL di monitoraggio di contratti di servizi informatici in cui è prevista l assistenza

Dettagli

Access - Lezione 02. Basi di dati. Parte seconda. (Per andare direttamente su un argomento, fare clic con il mouse sul titolo nell indice sottostante)

Access - Lezione 02. Basi di dati. Parte seconda. (Per andare direttamente su un argomento, fare clic con il mouse sul titolo nell indice sottostante) Access - Lezione 02 Basi di dati Parte seconda (Per andare direttamente su un argomento, fare clic con il mouse sul titolo nell indice sottostante) 1.0 Operazioni di base 1.1 Impostare e pianificare un

Dettagli

Software per la gestione di musei di arte contemporanea1

Software per la gestione di musei di arte contemporanea1 Software per la gestione di musei di arte contemporanea1 Identificativo del progetto: CA Nome documento: System Design(SD) Identificativo del documento: 6 CA_SD_E1_R1 Data del documento: 21/05/2012 Prima

Dettagli

Entrate... 11 Uscite... 11 Trasferimento... 11 Movimenti ricorrenti... 11 Movimenti suddivisi... 12

Entrate... 11 Uscite... 11 Trasferimento... 11 Movimenti ricorrenti... 11 Movimenti suddivisi... 12 Data ultima revisione del presente documento: domenica 8 maggio 2011 Indice Sommario Descrizione prodotto.... 3 Licenza e assunzione di responsabilità utente finale:... 4 Prerequisiti:... 5 Sistema Operativo:...

Dettagli

Indice. Introduzione alle funzionalità Requisiti Minimi

Indice. Introduzione alle funzionalità Requisiti Minimi Manuale operativo Indice Introduzione alle funzionalità Requisiti Minimi Lato Cliente Home I miei Album I miei Ordini I miei Dati Carrello Sistema di Pagamento via Paypal Contattaci Lato Amministratore

Dettagli

List Suite 2.0. Sviluppo Software Il Telefono Sas 10/06/2010

List Suite 2.0. Sviluppo Software Il Telefono Sas 10/06/2010 2010 List Suite 2.0 Sviluppo Software Il Telefono Sas 10/06/2010 List Suite 2.0 List Suite 2.0 è un tool software in grado di archiviare, analizzare e monitorare il traffico telefonico, effettuato e ricevuto

Dettagli

WHITE PAPER CRM Novembre 2003

WHITE PAPER CRM Novembre 2003 WHIT E PAPER Novembre 2003 CUSTOMER RELATIONSHIP MANAGEMENT Parlare di CUSTOMER RELATIONSHIP MANAGEMENT significa parlare di come l Azienda gestisce il suo business. Se vogliamo dare una definizione di

Dettagli

SenTaClAus - Sentiment Tagging & Clustering Analysis on web & social contents

SenTaClAus - Sentiment Tagging & Clustering Analysis on web & social contents Via Marche 10 56123 Pisa Phone +39.050.552574 Fax +39.1782239361 info@netseven.it - www.netseven.it P.IVA 01577590506 REGIONE TOSCANA POR CReO FESR 2007 2013 LINEA D INTERVENTO 1.5.a - 1.6 BANDO UNICO

Dettagli

E-Mail. Scheduling. Modalità d invio. E-Mail

E-Mail. Scheduling. Modalità d invio. E-Mail BI BI Terranova, azienda leader in Italia per le soluzioni Software rivolte al mercato delle Utilities, propone la soluzione Software di Business Intelligence RETIBI, sviluppata per offrire un maggiore

Dettagli

Documentazione Tecnica Manuale Utente. Documentazione Tecnica Manuale Utente

Documentazione Tecnica Manuale Utente. Documentazione Tecnica Manuale Utente Documentazione Tecnica Manuale Utente Paragrafo-Pagina di Pagine 1-1 di 13 Versione 3 del 24/07/2015 SOMMARIO 1 A Chi è destinato... 1-3 2 Pre requisiti... 2-3 3 Obiettivi... 3-3 4 Durata della formazione...

Dettagli

Ingegneria dei Requisiti

Ingegneria dei Requisiti Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Ingegneria dei Requisiti E. TINELLI Contenuti I requisiti del software Documento dei requisiti I processi

Dettagli

INTERAZIONE UOMO-MACCHINA

INTERAZIONE UOMO-MACCHINA INTERAZIONE UOMO-MACCHINA Metodi di valutazione dell ingegneria semiotica: SIM e CEM Barbara Rita Barricelli Stefano Valtolina Dipartimento di Informatica Università degli studi di Milano Ingegneria semiotica

Dettagli

Manuale d uso. 1. Introduzione

Manuale d uso. 1. Introduzione Manuale d uso 1. Introduzione Questo manuale descrive il prodotto Spazio 24.7 e le sue funzionalità ed è stato elaborato al fine di garantire un più agevole utilizzo da parte del Cliente. Il manuale d

Dettagli

Ministero dello Sviluppo Economico

Ministero dello Sviluppo Economico Ministero dello Sviluppo Economico INDAGINE SULLA CUSTOMER SATISFACTION DELL "HELPDESK REACH 214 Sintesi dei risultati Roma, febbraio 215 Indagine sulla customer satisfaction dell Helpdesk REACH - 214

Dettagli

INFORMATICA CORSI DELL'INDIRIZZO TECNICO CLASSI PRIME AMMINISTRAZIONE - FINANZA E MARKETING

INFORMATICA CORSI DELL'INDIRIZZO TECNICO CLASSI PRIME AMMINISTRAZIONE - FINANZA E MARKETING INFORMATICA CORSI DELL'INDIRIZZO TECNICO CLASSI PRIME AMMINISTRAZIONE - FINANZA E MARKETING Modulo propedeutico Le lezioni teoriche sono sviluppate sui seguenti argomenti: Struttura dell elaboratore: CPU,

Dettagli

Microsoft DCCN. Digital Commerce & Campaign Network. Guida operativa per i Partner

Microsoft DCCN. Digital Commerce & Campaign Network. Guida operativa per i Partner Microsoft DCCN Digital Commerce & Campaign Network Guida operativa per i Partner Edizione Marzo 2012 Introduzione La straordinaria evoluzione dei comportamenti dei consumatori nell era digitale ha senza

Dettagli

Email marketing ed invio newsletter. Invio di messaggi vocali personalizzati

Email marketing ed invio newsletter. Invio di messaggi vocali personalizzati Sistema online professionale per gestire il tuo mailing Email marketing ed invio newsletter SMS marketing Invio massivo di fax Invio di lettere cartacee (prioritaria o raccomandata) Invio di messaggi vocali

Dettagli

Capitolo 1 Introduzione

Capitolo 1 Introduzione Capitolo 1 Introduzione ZoomText 9.1 è una potente applicazione che favorisce l utilizzo del computer a individui con difficoltà visive. Utilizza due tecnologie versatili ingrandimento dello schermo e

Dettagli

Dynamic 08 Software per la lettura ottica

Dynamic 08 Software per la lettura ottica Dynamic 08 Software per la lettura ottica Dynamic 08 G.Q.S. S.r.l. 2008 All rights reserved G.Q.S. Srl Global Quality Service Via Bernini, 5/7 Corsico (MILANO) Cos è Dynamic 08 Dynamic 08 è un software

Dettagli

GUIDA OPERATIVA APPLICAZIONE PER LA VISUALIZZAZIONE DELLE FORNITURE DEI DATI CATASTALI

GUIDA OPERATIVA APPLICAZIONE PER LA VISUALIZZAZIONE DELLE FORNITURE DEI DATI CATASTALI GUIDA OPERATIVA APPLICAZIONE PER LA VISUALIZZAZIONE DELLE FORNITURE DEI DATI CATASTALI 29 Aprile 2013 DOC. ES-31-IS-0C PAG. 2 DI 53 INDICE PREMESSA 3 1. INSTALLAZIONE DELL'APPLICAZIONE 4 2. AVVIO DELL'APPLICAZIONE

Dettagli

Ingegneria del Software. Caso di Studio: Piazza Multicanale. Analisi dei requisiti

Ingegneria del Software. Caso di Studio: Piazza Multicanale. Analisi dei requisiti Ingegneria del Software Caso di Studio: Piazza Multicanale Analisi dei requisiti Realizzato da: Addante Michele Daddario Fabio De Vito Francesco Cania 431652 Lagrotta Pietro 474964 1 Indice Parte I: Determinazione

Dettagli

[CATALOGO CORSI 2012]

[CATALOGO CORSI 2012] 2012 IAL Innovazione Apprendimento Lavoro Lombardia [CATALOGO CORSI 2012] [Digitare qui il sunto del documento. Di norma è una breve sintesi del contenuto del documento. [Digitare qui il sunto del documento.

Dettagli

Archiviazione elettronica dei documenti

Archiviazione elettronica dei documenti Archiviazione Archiviazione Archiviazione Produttore Multimedia It s.n.c. Distributore TeamSystem s.r.l. Caratteristiche Tecniche Linguaggio di programmazione VISUAL BASIC, VISUAL C++ Sistema operativo

Dettagli

Professional IS / Standard. Manuale per l utente

Professional IS / Standard. Manuale per l utente Professional IS / Standard Manuale per l utente 1 2 3 4 5 Verifica preliminare Accesso e uscita Visualizzazione delle informazioni sui dispositivi Download e installazione dei pacchetti Appendice Leggere

Dettagli

Accessibilità e Usabilità Web. Katuscia Cerbioni

Accessibilità e Usabilità Web. Katuscia Cerbioni Accessibilità e Usabilità Web Katuscia Cerbioni Qualche definizione: Accessibilità Accessibilità In informatica: capacità di un dispositivo, di un servizio o di una risorsa di essere fruibile con facilità

Dettagli

Informatica di base. Introduzione all'informatica, Win 95/98, Word

Informatica di base. Introduzione all'informatica, Win 95/98, Word Scheda: 1 Informatica di base Introduzione all'informatica, Win 95/98, Word Il corso si rivolge a coloro che si avvicinano per la prima volta al computer e intendono utilizzarlo per ragioni di lavoro,

Dettagli

Easy Time. Software per la Rilevazione Presenze. Via Vic.le Terracina Infermeria, 10-80125 Napoli (NA)

Easy Time. Software per la Rilevazione Presenze. Via Vic.le Terracina Infermeria, 10-80125 Napoli (NA) Easy Time Software per la Rilevazione Presenze Easy Time... 1 Software per la... 1 Rilevazione Presenze... 1 2M... Errore. Il segnalibro non è definito. 1. PRESENTAZIONE... 3 2. DESCRIZIONE... 3 3. ANAGRAFICA

Dettagli

LA SOLUZIONE MODULARE ESPANDIBILE PER LA CREAZIONE E GESTIONE DI SITI INTERNET. Documentazione

LA SOLUZIONE MODULARE ESPANDIBILE PER LA CREAZIONE E GESTIONE DI SITI INTERNET. Documentazione LA SOLUZIONE MODULARE ESPANDIBILE PER LA CREAZIONE E GESTIONE DI SITI INTERNET Documentazione INTRODUZIONE IMPORTANZA DEL SITO WEB Tramite il sito web sarai facilmente raggiungibile da ogni parte del mondo

Dettagli

Ri.Um. Gestione Risorse Umane

Ri.Um. Gestione Risorse Umane RiUm Ri.Um. Gestione Risorse Umane SOMMARIO 1. INTRODUZIONE 4 1.1. COS E RI.UM.... 4 1.2. PREREQUISITI... 4 2. RI.UM. 5 2.1. AVVIO... 5 2.2. CONSULTAZIONE TABELLE... 6 2.3. GESTIONE TABELLE... 6 2.3.1

Dettagli

Modalità e criteri di segmentazione nel Corporate & Investment Banking

Modalità e criteri di segmentazione nel Corporate & Investment Banking UNIVERSITA CATTOLICA DEL SACRO CUORE 20123 MILANO LARGO A. GEMELLI, 1 Modalità e criteri di segmentazione nel Corporate & Investment Banking a cura di: Renato Fiocca Glauco T. Savorgnani Daniela Corsaro

Dettagli

SINPAWEB corso per Tecnico della programmazione e dello sviluppo di siti internet e pagine web co.reg 58036 matricola 2012LU1072

SINPAWEB corso per Tecnico della programmazione e dello sviluppo di siti internet e pagine web co.reg 58036 matricola 2012LU1072 Provincia di Lucca Servizio Istruzione, Formazione e Lavoro. Sviluppo Economico SINPAWEB corso per Tecnico della programmazione e dello sviluppo di siti internet e pagine web co.reg 58036 matricola 2012LU1072

Dettagli

Progettare Ipermedia. Presentazione

Progettare Ipermedia. Presentazione Progettare Ipermedia Presentazione L aspetto progettuale riveste notevole importanza in un percorso didattico impostato sulla produzione di ipermedia così come è importante pianificarne lo sviluppo su

Dettagli

Misurare il successo Guida alla valutazione dei service desk per le medie imprese:

Misurare il successo Guida alla valutazione dei service desk per le medie imprese: WHITE PAPER SULLE BEST PRACTICE Misurare il successo Guida alla valutazione dei service desk per le medie imprese: Come scegliere la soluzione ottimale per il service desk e migliorare il ROI Sommario

Dettagli

Sviluppo di applicazioni web con il pattern Model-View-Controller. Gabriele Pellegrinetti

Sviluppo di applicazioni web con il pattern Model-View-Controller. Gabriele Pellegrinetti Sviluppo di applicazioni web con il pattern Model-View-Controller Gabriele Pellegrinetti 2 MVC: come funziona e quali sono vantaggi che derivano dal suo utilizzo? La grande diffusione della tecnologia

Dettagli

KNOWLEDGE MANAGEMENT. Knowledge Management. Knowledge: : cos è. Dispense del corso di Gestione della Conoscenza d Impresa

KNOWLEDGE MANAGEMENT. Knowledge Management. Knowledge: : cos è. Dispense del corso di Gestione della Conoscenza d Impresa KNOWLEDGE MANAGEMENT Pasquale Lops Giovanni Semeraro Dispense del corso di Gestione della Conoscenza d Impresa 1/23 Knowledge Management La complessità crescente della società, l esubero di informazioni

Dettagli

REPLY PROFILO AZIENDALE 2007

REPLY PROFILO AZIENDALE 2007 REPLY PROFILO AZIENDALE 2007 REPLY Company Profile 2007 1 CARATTERI IDENTIFICATIVI DEL GRUPPO Reply è una società di Consulenza, System Integration e Application Management, leader nella progettazione

Dettagli

Ingegneria del Software UML - Unified Modeling Language

Ingegneria del Software UML - Unified Modeling Language Ingegneria del Software UML - Unified Modeling Language Obiettivi. Presentare un approccio visuale alla progettazione. Illustrare i vantaggi dell utilizzo di diagrammi nella fase di progettazione. Rispondere

Dettagli

Italiano Lingua Seconda. A s c o l t o. Verifica (Indicatori) Abilità Capacità Conoscenze Competenze parziali e indicazioni didatticometodologiche

Italiano Lingua Seconda. A s c o l t o. Verifica (Indicatori) Abilità Capacità Conoscenze Competenze parziali e indicazioni didatticometodologiche Italiano Lingua Seconda Competenze al termine del 1 biennio L alunna, l alunno è in grado di comprendere gli elementi principali di un discorso chiaro in lingua standard, anche trasmesso attraverso canali

Dettagli

IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web

IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web GLI INTERROGATIVI 1. Perché Internet è diventato il più grande contenitore di informazioni del mondo? 2. Perché non è sempre facile reperire

Dettagli

COME MISURARE UN SERVICE DESK IT

COME MISURARE UN SERVICE DESK IT OSSERVATORIO IT GOVERNANCE COME MISURARE UN SERVICE DESK IT A cura di Donatella Maciocia, consultant di HSPI Introduzione Il Service Desk, ovvero il gruppo di persone che è l interfaccia con gli utenti

Dettagli

Modulo 1 Concetti generali 4 settimane

Modulo 1 Concetti generali 4 settimane OBIETTIVI SPECIFICI DEL PRIMO BIENNIO - CLASSE PRIMA settore ECONOMICO: NUCLEI FONDANTI, CONOSCENZE E COMPETENZE NB per ciascuno dei moduli di insegnamento/apprendimento viene indicato il tempo di trattazione

Dettagli

Data Warehouse: una sola lingua. Iolanda Salinari

Data Warehouse: una sola lingua. Iolanda Salinari Data Warehouse: una sola lingua Iolanda Salinari 2 Il Glossario: uno strumento prezioso Uno dei fattori critici per la realizzazione del data warehouse è costituito dalle difficoltà che si incontrano per

Dettagli

IRTUALW. Infinity Portal Infinite possibilità di farti raggiungere PORTAL FORNITORI CLIENTI PROTOCOLLAZIONE KNOWLEDGE BASE CLASSIFICAZIONE VERSIONING

IRTUALW. Infinity Portal Infinite possibilità di farti raggiungere PORTAL FORNITORI CLIENTI PROTOCOLLAZIONE KNOWLEDGE BASE CLASSIFICAZIONE VERSIONING I N F I N I T Y Z U C C H E T T I Infinity Portal Infinite possibilità di farti raggiungere MARKETING SALES SUPPORT CMS KNOWLEDGE BASE E COMMERCE B2B E COMMERCE B2C AD HOC INFINITY ACQUISIZIONE PROTOCOLLAZIONE

Dettagli

La metodologia del test con gli utenti adottata per Sapienza Università di Roma

La metodologia del test con gli utenti adottata per Sapienza Università di Roma La metodologia del test con gli utenti adottata per Sapienza Università di Roma Questo paper ha la finalità di illustrare come gli utenti web dell Università Sapienza di Roma abbiano partecipato al percorso

Dettagli

BANCA DATI PREPARATI PERICOLOSI. Manuale operativo ISS FORMULA v.1.25. Configurazione minima richiesta:

BANCA DATI PREPARATI PERICOLOSI. Manuale operativo ISS FORMULA v.1.25. Configurazione minima richiesta: BANCA DATI PREPARATI PERICOLOSI Manuale operativo ISS FORMULA v.1.25. Configurazione minima richiesta Installazione del programma Definizioni Finestra iniziale del programma Come compilare Configurazione

Dettagli

I.Stat Guida utente Versione 1.7 Dicembre 2010

I.Stat Guida utente Versione 1.7 Dicembre 2010 I.Stat Guida utente Versione 1.7 Dicembre 2010 1 Sommario INTRODUZIONE 3 I concetti principali di I.Stat 4 Organizzazione dei dati 4 Ricerca 5 GUIDA UTENTE 6 Per iniziare 6 Selezione della lingua 7 Individuazione

Dettagli

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Facoltà di Ingegneria Corso di Laurea Specialistica in Ingegneria Informatica SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Relatore Chiarissimo

Dettagli

AOT Lab Dipartimento di Ingegneria dell Informazione Università degli Studi di Parma. Unified Process. Prof. Agostino Poggi

AOT Lab Dipartimento di Ingegneria dell Informazione Università degli Studi di Parma. Unified Process. Prof. Agostino Poggi AOT Lab Dipartimento di Ingegneria dell Informazione Università degli Studi di Parma Unified Process Prof. Agostino Poggi Unified Process Unified Software Development Process (USDP), comunemente chiamato

Dettagli

1. Hard Real Time Linux (Laurea VO o specialistica)

1. Hard Real Time Linux (Laurea VO o specialistica) 20/9/06 Elenco Tesi Disponibili Applied Research & Technology Dept. La Società MBDA La MBDA Italia è un azienda leader nella realizzazione di sistemi di difesa che con i suoi prodotti è in grado di soddisfare

Dettagli

WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence

WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence 1 WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence WOSM è un sistema di media monitoring unico al mondo. Restituisce percorsi di lettura dei dati trasversali, fruibili,

Dettagli

PUNTO DI SVOLTA DEL CREDITO. doccredit

PUNTO DI SVOLTA DEL CREDITO. doccredit PUNTO DI SVOLTA DEL CREDITO doccredit Scenario Il mutato scenario economico e finanziario ha evidenziato i limiti degli strumenti tradizionali e minato le caratteristiche dei loro servizi. In particolare

Dettagli

Altri strumenti di comunicazione degli Enti locali

Altri strumenti di comunicazione degli Enti locali Altri strumenti di comunicazione degli Enti locali 18-19 lezione - 3 novembre 2011 La Guida ai Servizi realizzata da molte Pubbliche Amministrazioni rappresenta uno degli strumenti cartacei più tradizionali

Dettagli

Applicazione: Sistema Orchestra

Applicazione: Sistema Orchestra Riusabilità del software Catalogo delle applicazioni Progr_ne/Controllo Applicazione: Sistema Orchestra Amministrazione: Scuola Superiore della Pubblica Amministrazione Responsabile dei sistemi informativi

Dettagli

Appunti lezione Database del 07/10/2015

Appunti lezione Database del 07/10/2015 Appunti lezione Database del 07/10/2015 Nelle lezioni precedenti si è visto come qualunque applicazione informativa è almeno formata da tre livelli o layers che ogni progettista conosce e sa gestire: Livello

Dettagli

TECNICO SUPERIORE PER IL SISTEMA INFORMATIVO AZIENDALE

TECNICO SUPERIORE PER IL SISTEMA INFORMATIVO AZIENDALE ISTRUZIONE E FORMAZIONE TECNICA SUPERIORE SETTORE INDUSTRIA E ARTIGIANATO TECNICO SUPERIORE PER IL SISTEMA INFORMATIVO AZIENDALE STANDARD MINIMI DELLE COMPETENZE TECNICO PROFESSIONALI DESCRIZIONE DELLA

Dettagli

Indice REGIONE BASILICATA

Indice REGIONE BASILICATA DIPARTIMENTO PROGRAMMAZIONE UFFICIO SISTEMA INFORMATIVO REGIONALE E Via Vincenzo Verrastro n 4 fax 0971/668954 REGI ONE BASI UFFICIO S. I. LICA R. S. TA Piano dei Test Id Sistema APPROVAZIONI Redatto da:

Dettagli

Applicazione: OIL Online Interactive helpdesk

Applicazione: OIL Online Interactive helpdesk Riusabilità del software - Catalogo delle applicazioni: Gestione ICT Applicazione: OIL Online Interactive helpdesk Amministrazione: Consiglio Nazionale delle Ricerche (CNR) Responsabile dei sistemi informativi

Dettagli

Manutenzione delle piattaforme software di Fondazione Sistema Toscana

Manutenzione delle piattaforme software di Fondazione Sistema Toscana www.fondazionesistematoscana.it Manutenzione delle piattaforme software di Fondazione Sistema Toscana CIG: 6117136451 Specifiche Tecniche Sommario 1. Oggetto del servizio... 2 1.1 Documenti di riferimento...4

Dettagli

UN MODELLO DI QUALITà PER I SITI WEB - Sintesi delle linee guida e best practice 1

UN MODELLO DI QUALITà PER I SITI WEB - Sintesi delle linee guida e best practice 1 UN MODELLO DI QUALITà PER I SITI WEB - Sintesi delle linee guida e best practice 1 Per ogni caratteristica di qualità del modello, vengono qui elencate le principali linee guida e best practice menzionate

Dettagli