Analisi, progettazione e sviluppo di un software di Information Retrieval con Tecnologie J2EE

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Analisi, progettazione e sviluppo di un software di Information Retrieval con Tecnologie J2EE"

Transcript

1 Scuola Politecnica e delle Scienze di Base Corso di Laurea Triennale in Ingegneria Informatica Tesi di Laurea Triennale in Ingegneria Informatica Analisi, progettazione e sviluppo di un software di Information Retrieval con Tecnologie J2EE Anno Accademico relatore Ch.mo Prof. Ing. Vincenzo Moscato Correlatore Ch.mo Dott. Antonio Agliata Candidato Pasquale Ragozzino N

2 A chi, ogni giorno, incessantemente, non ha mai dubitato ed esitato.

3 Indice Introduzione 5 1. Sistemi di Information Retrieval Cosa sono i sistemi di Information Retrieval Document Repository Indexer Query Processor Scopo di un motore di Information Retrieval Fasi di un motore di Information Retrieval Definizione formale di IR Fasi dell'ir Indicizzazione Tipologie di motori di Information Retrieaval Il modello Booleano Il modello Vettoriale Il modello Probabilistico Apache Lucene library Cos è Apache Lucene Indicizzazione con Lucene Ricerca con Lucene 16 3

4 2.2 Esempio d implementazione di un motore di Information Retrieval Tecnologie utilizzate Esempio di sviluppo di un motore di IR Progetto Indexer Progetto Searcher Ottimizzazione della ricerca con l algoritmo di Edit Distance Vocabolario dei sinonimi Thesaurus Somiglianza lessicale Somiglianza semantica Conclusioni Sviluppi futuri 24 Bibliografia 25 Ringraziamenti 26 4

5 Introduzione Questa tesi di laurea riguarda l Information Retrieval, ovvero quella disciplina che si occupa di studiare, progettare e realizzare sistemi informativi finalizzati al reperimento di documenti, immagini, video, suoni, riguardanti le richieste dell utente finale. Questa tematica ha suscitato l interesse di numerose comunità Open Source come Apache, poiché, nella società moderna, l Information Retrieval rappresenta e rappresenterà sempre maggiormente il modo più veloce ed efficace per memorizzare e ricercare informazioni su qualsivoglia argomento. Inoltre la branca dell IR abbraccia diverse discipline quali la letteratura, la psicologia, la filosofia, la linguistica, la scienza dell informazione e l informatica, segno inequivocabile che la materia è ostica e di difficile lettura ed interpretazione. I dati resi disponibili al reperimento possono essere di tre diverse tipologie : - Dati Strutturati ; - Dati Non-strutturati ; - Dati Semistrutturati. I primi sono dati conservati in un database, organizzati secondo schemi e tabelle rigide; questa è la tipologia di dati più indicata per i modelli di gestione relazionale delle informazioni. I secondi sono quei dati che non hanno nessun tipo di schema organizzativo ( ad esempio file testuali elaborati con uno dei softwares di scrittura disponibili ) e che per questo motivo, necessitano di essere gestiti con motori di IR. Mentre nei terzi s incontrano alcune delle caratteristiche dei dati strutturati e alcune delle caratteristiche dei non-strutturati. Un esempio esplicativo di quest ultima tipologia di organizzazione di dati è il file compilato con 5

6 sintassi XML. Nonostante non vi siano limiti strutturali all inserimento dei dati, le informazioni vengono, comunque, organizzate secondo logiche strutturate e interoperabili. In questo caso, i sistemi di gestione dei dati possono organizzare i documenti sia attraverso i modelli relazionali, sia attraverso modelli di information retrieval. Nel caso specifico dello sviluppo di un motore di IR d esempio, vengono trattati dati semistrutturati e non-strutturati per cui l uso di un IR rispetto ad un DBMS è risultato più vantaggioso e funzionale ; il motivo sta nella natura dei dati trattati ( Curriculum Vitae ) che hanno una struttura tale da rendere il caricamento di quest ultimi complesso e dispendioso nelle tabelle di un DBMS. Al contrario un IR si incaricherà di parserizzare il file e di renderlo persistente grazie all uso di strutture dati ( indici ) molto più funzionali ed accessibili dal sistema, per favorire la ricerca dei risultati da parte dell utente. Infine, quest elaborato, descriverà il funzionamento e l impiego di una delle librerie più potenti ( scritta in Java ) e flessibili per lo sviluppo di un motore di IR, dal nome Apache Lucene. La parte conclusiva dell elaborato, racchiude tutti quelli che sono i possibili sviluppi futuri e le conclusioni generali in merito alla sperimentazione avuta. 6

7 Capitolo 1: Sistemi di Information Retrieval Il termine Information Retrieval fu coniato nel 1952 dall informatico americano Calvin Mooers il quale, citando la legge da lui stesso formulata ( Legge di Mooer s ), dichiarò che: Un sistema di reperimento delle informazioni tenderà a non essere usato, quando, trovare le informazioni è più noioso e doloroso che non trovarle. I primi motori di IR erano utilizzati in modalità batch, attualmente invece, vengono utilizzati in Real-Time con modalità interattive a vari fini, come ad esempio la ricerca di contenuti documentali, la ricerca sul Web di contenuti di varia natura, il reperimento di informazioni aziendali ecc. Lo sviluppo e l evoluzione degli IR sono dovuti a molti fattori quali il basso costo e le capacità sempre più elevate dei dispositivi di memorizzazione, i softwares per la creazione di documenti digitali, strumenti e softwares per l acquisizione in digitale dei documenti cartacei, il web stesso, ecc. In generale un IR si occuperà di rendere semplice e funzionale la reperibilità di files mediante strutture dati ( indici ) facilmente accessibili e di semplificare la ricerca di tali files, opportunamente lavorati. 1.1 Cosa sono i sistemi di Information Retrieval L'IR è un campo interdisciplinare che nasce dalla fusione di discipline eterogenee. Esso coinvolge la psicologia cognitiva, l'architettura informativa, la filosofia, il design, il comportamento umano sull'informazione, la linguistica, la semiotica, la scienza dell informazione e l informatica. Nello specifico un motore di IR si occuperà di soddisfare l'information need dell'utente che ne fa uso, con tecniche e metodologie atte a restituire il contenuto voluto e cercato. In particolare l information need è il bisogno informativo dell utente 7

8 il quale anche se sembra banale, non lo è se l applicazione sviluppata non mette a disposizione i giusti strumenti per esprimerlo al meglio. Le componenti fondamentali di un sistema di IR sono tre: il document repository, l'indexer e il query processor Document-Repository Il document-repository è la componente che si occupa di raccogliere documenti e files contenuti in genere, assieme alla struttura che li interconnette, e li indicizza per rendere disponibile il tutto all'utente che fa uso del sistema Indexer L'indexer, si occupa di costruire opportune strutture dati per memorizzare le informazioni necessarie al recupero dei documenti ricevuti in input dal document-repository. Le strutture di cui in generale, i motori di ricerca si avvalgono sono il lessico, contenente i termini distinti che compaiono nella collezione di documenti e il posting file, il quale nella sua forma meno complessa, contiene tutte le liste dei documenti in cui i termini del lessico compaiono. 8

9 1.1.3 Query Processor Il query processor invece, si occupa del reperimento dei documenti nell'indice preventivamente creato dall'indexer e di restituirli all'utente ordinati in base alla loro presunta rilevanza e all'information need. Il concetto di rilevanza è di fondamentale importanza nei sistemi di IR ed è fonte di studi approfonditi e continui, inoltre, un approccio ibrido per la restituzione dei contenuti richiesti, è quello più utilizzato in quanto si sfrutta un motore di IR per l informazione non strutturata e una base di dati per i suoi metacaratteri descrittivi. 1.2 Scopo di un motore di Information Retrieval Lo scopo di un IR non è solo quello di progettare le tecniche di reperimento dei dati bensì anche quello di ricercare materiale ( generalmente dati non-strutturati ma in alcuni casi anche dati strutturati ) al fine di soddisfare l'information need dell utente che usufruisce di tale sistema; inoltre un IR aiuta l'utente ad esprimere in maniera chiara e consona il suo l'information need, oltre che della presentazione dei risultati ottenuti in forma adeguata. A tal proposito vi sono due tipi di approccio alla presentazione dei risultati: il clustering e la classificazione. Il primo dispone i risultati in gruppi secondo una serie di parametri, mentre il secondo dispone i risultati per tipo. Infine l'ir è ampiamente utilizzato anche nel mondo del data mining per l'elaborazione e la gestione di grosse moli di dati ed informazioni. 1.3 Fasi di un motore di Information Retrieval Definizione formale di IR Formalmente un modello di Information Retrieval è una quadrupla ( D, Q, F, R ), dove: - D è un insieme di viste logiche dei documenti della collezione; - Q è un insieme di viste logiche ( query ) dei bisogni informativi dell utente; - F è un sistema per modellare documenti, query e le relazioni tra loro; - R (q i, d j ) è una funzione di ranking che associa un numero reale positivo ad una query q i e un documento d j, definendo un ordinamento tra i documenti con riferimento alla query q i. 9

10 1.3.2 Fasi dell'ir Viste le attuali esigenze di operare sul Web, gli algoritmi che gestiscono la ricerca "per rilevanza" dei contenuti desiderati, risulterebbero poco efficienti e computazionalmente complessi da eseguire in real-time. La soluzione adoperata dai moderni IR è quella di utilizzare delle strutture dati dette indici. Le fasi principali di un IR sono fondamentalmente due: - Indicizzazione che non avviene in real-time, ma gli indici sono creati dai crawlers e dagli spiders e sono composti da valori del tipo [ term, id ]; - Ricerca che viene effettuata dall'utente e che grazie alla costruzione degli indici, ha complessità sub-lineare evitando anche l'appesantimento del Web, visto che solitamente gil indici sono in locale. Nel paragrafo successivo verrà descritta in dettaglio solo la fase di indicizzazione, mentre per quella di ricerca, vi sarà una panoramica nei capitoli e paragrafi seguenti Indicizzazione La fase di indicizzazione è la più importante delle fasi di un progetto di sviluppo di un motore di IR efficace ed efficiente, ma prima di effettuare questa operazione, è necessario compiere una serie di operazioni preliminari con lo scopo di ottimizzare i documenti/testi/dati da rendere disponibili alla struttura che si occuperà della ricerca. Il trattamento dei testi ha come scopo l individuazione degli elementi caratterizzanti un testo e la generazione di una rappresentazione formale ( in genere un array ). Il trattamento dei testi può essere più o meno complesso e si divide in due fasi fondamentali: Tokenizzazione: identificazione dei singoli elementi token ( parole, spazi ); Lemmatizzazione: identificazione della radice dei termini ( vadano andare ); La tokenizzazione può essere effettuata secondo diversi principi che risulteranno essere più o meno validi a seconda del sistema e del contesto dell IR da sviluppare. La lemmatizzazione, invece, è composta da più fasi, ed è di diversa natura a seconda della lingua e del testo da analizzare. In particolar modo sono di fondamentale importanza alcune fasi che 10

11 rendono il testo, preventivamente tokenizzato, più efficientemente indicizzabile. Si utilizza, per esempio, un vocabolario di Stop Words, contenente tutte quelle parole che hanno una frequenza di comparsa nel documento molto elevata. Un esempio possono essere le congiunzioni, la punteggiatura, le preposizioni ecc. Questi dizionari possono avere natura statica ( implementati in strutture dati personalizzate a seconda del contesto e del caso di studio ), oppure natura dinamica e di apprendimento ( in base ad un limite di frequenza è possibile decidere se includere le parole nel dizionario delle Stop Words o meno ). A valle della costruzione di tale dizionario, secondo uno dei metodi più comodo e consono al contesto di sviluppo, verrà effettuata un operazione di rimozione o non inclusione delle parole appartenenti allo stesso, al fine di ottimizzare il testo per la fase successiva di Stemming. Questa fase prevede che i tokens precedentemente lavorati, vengano ridotti dalla forma flessa o estesa, nella loro forma radice ( Es. andai, andare, andato and ). Gli algoritmi di Stemming sono tutt'oggi materia di studio e sviluppo e tra quelli di maggior impiego e utilizzo vi è sicuramente quello di Porter. Nel 1968 Julie Beth Lovins progetta e sviluppa il primo algoritmo di stemming che, nel 1980, dopo diversi miglioramenti, viene standardardizzato per la lingua inglese sotto il nome di "algoritmo di Martin Porter". Solo dopo le fasi di Tokenizzazione e Lemmatizzazione è possibile passare alla fase di Indicizzazione dei term lavorati e memorizzati. 11

12 La creazione dell'indice restituisce delle coppie di valori del tipo [ term, docid ], dove term rappresenta i termini del documento e docid, il documento stesso. E' buon uso, oltre che comodo e funzionale, costruire una matrice term/docid che rappresenterà il rapporto di frequenza e comparsa tra termini e documenti. d1 d2 d3... t t t In particolar modo, se nella matrice compare uno "0", allora il term non è presente nel documento, nel caso invece ci sia un "1", il termine sarà presente all'interno del documento. Grazie a questa matrice possiamo definire due parametri, ossia il Document Frequency ( DM ) e il Term Frequency ( TF ) corrispondenti relativamente al numero di documenti in cui appare il termine e il numero di occorrenze di termini presente nel documento. 1.4 Tipologie di motori di Information Retrieval Diverse sono le tipologie dei motori di IR che operano sui dati/file da ricercare; esse variano in base al modo in cui vengono interrogati i sitemi, oppure dal modo in cui vengono acceduti ecc. In particolarmodo abbiamo tre tipologie diverse di motori di IR che sono rispettivamente: - Il modello Booleano; - Il modello Vettoriale; - Il modello Probabilistico Il modello Booleano Il modello standard booleano dell'information Retrieval è un modello di base, in cui l'informazione associata ad un documento è composta da due valori possibili: un documento può 12

13 essere rilevante ( 1 ) o irrilevante ( 0 ), in base alla presenza o assenza di un termine richiesto all'interno del medesimo. Viene usato un sistema di "match" esatto per il recupero delle informazioni e le query sono fatte combinando i termini con gli operatori booleani AND, OR, NOT, quindi il sistema restituisce tutti i documenti che soddisfano tale query Il modello Vettoriale Il modello vettoriale prevede la rappresentazione di query e documenti mediante vettori pesati, in uno spazio vettoriale. Lo spazio ha una dimensionalità pari al numero "N" di termini nel vocabolario. La similarità tra le query e il documento, sfrutta le misure geometriche di similarità tra vettori. Alcuni vantaggi qualificano il modello Vettoriale tra i più efficienti modelli di IR attualmente utilizzati, infatti, il peso dei termini e la ricerca gerarchica grazie alla clusterizzazione dei documenti, migliora la qualità delle risposte e rispetta quindi l IN utente Il modello Probabilistico Il modello probabilistico, come quello vettoriale, risulta uno dei più utilizzati sia a livello teorico che a livello sperimentale. Questo modello, in particolare, rappresenta l incertezza e il costo della decisione presa dall IR nel reperire un documento. Il costo e l incertezza sono modellati con gli strumenti del calcolo delle probabilità e della statistica delle decisioni. 13

14 Capitolo 2: Apache Lucene library Lucene è una libreria di API ( application programming interface ) con licenza Open Source, utilizzata per il reperimento di informazioni, inizialmente sviluppata in Java e successivamente in C#, C++, Perl, Phyton, Ruby, PHP. Sebbene inizialmente il suo ideatore e sviluppatore, Doug Cutting, aveva ideato questa collezioni di API per l indicizzazione e la ricerca full-text di documenti e files, è attualmente utilizzata per la realizzazione e lo sviluppo di motori di ricerca sia nel World Wide Web che nelle intranet aziendali o private. L uso sempre più vasto e svariato di questa libreria, ha portato ad assumere la percezione del prodotto come di un motore di ricerca dotato di web-spider e parser HTML. In realtà non è così, infatti Lucene, richiede che tali strumenti siano forniti da terzi esternamente. I dati gestiti da Lucene sono rappresentati come documenti ( document ) e campi ( fields <nome,valore> ) testuali. Questa genericità, permette, di sviluppare motori di ricerca e di IR a prescindere dal tipo di file da trattare. Infatti Lucene ci permette di trattare ed indicizzare file testuali di tipo PDF, DOC, HTML, così come altri tipi di files dai quali sia possibile trarre ed estrarre informazioni. Alcuni esempi di utilizzo di Lucene si possono riscontrare nel codice di alcuni grandi Siti Web quali, Wikipedia, CNET, Alfresco ecc. 14

15 2.1 Cos è Apache Lucene Analisi, progettazione e sviluppo di un software di Information Retrieval con tecnologie J2EE Apache Lucene è un progetto maturo e open-source che consente di aggiungere alla propria applicazione funzionalità come la ricerca e l'indicizzazione, nascondendo la complessità di tali operazioni allo sviluppatore, in quanto, fornisce tramite un interfaccia, semplici ma potenti funzionalità che richiedono solo una minima conoscenza su argomenti quali la ricerca full-text. Inoltre opera senza fare assunzioni su ciò che indicizza e ciò che ricerca. Si può pensare a Lucene come ad uno strato situato sotto quello su cui poggia l applicazione Indicizzazione con Lucene L indicizzazione, come già descritto nei paragrafi precedenti, non è altro che un processo il quale elabora i dati originali in collezioni di riferimenti ordinati al fine di agevolarne la ricerca rapida. È utilizzato anche per eliminare il lento processo di scansione sequenziale di un testo. Il risultato di tale operazione è un indice ( Lucene index ), memorizzato per esempio, sul file 15

16 system e interrogabile in fase di ricerca mediante delle particolari query ( query Lucene ). Si può pensare a un indice come ad una serie di dati che consentono un accesso diretto alle parole memorizzate al suo interno; ne è un esempio l indice analitico di un libro che permette di individuare rapidamente le pagine che contengono un determinato termine. Nel caso di Lucene, un indice è una struttura dati appositamente progettata e archiviata sul file system sotto forma di file. La classe Lucene che si occupa dell indicizzazione è Analyzer ( analizzatore ) che incapsula, al suo interno, il processo di analisi, e marca pezzi di testo eseguendo su di esso una serie di operazioni quali: estrazione delle parole, rimozione degli accenti, della punteggiatura e dei termini comuni ( Es. il, un, dei, etc... ), trasformazione in forma minuscola dei caratteri, stemming e lemmatizzazione come descritto nei paragrafi precedenti Ricerca con Lucene Per effettuare una ricerca su di un indice precostituito è necessario aprire l indice in questione mediante un IndexSearcher, su cui, in seguito, effettuare le ricerche desiderate mediante delle opportune query. La query in Lucene è una perfetta astrazione del concetto classico di query per il recupero di informazioni da un database; tale astrazione a sua volta è fornita da un QueryParser, il quale ha come obiettivo quello di acquisire la keyword di ricerca ( una o più parole, anche generiche ), analizzarla con lo stesso Analyzer usato per la creazione dell indice ed infine rendere la stringa di ricerca come una query che rispetti una determinata sintassi. L ultimo passo consiste nel restituire l oggetto query che sarà passato all IndexSearcher per poter effettuare la ricerca sull indice ed immagazzinare i risultati di tale ricerca all interno di un oggetto ScoreDoc. 16

17 2.2 Esempio d implementazione di un motore di Information Retrieval In questo paragrafo verrà presentata una rapida descrizione dello sviluppo di un motore di IR d esempio progettato e sviluppato per testare quanto illustrato finora. In particolar modo verranno discussi i due progetti INDEXER e SEARCHER che implementano il motore di IR d esempio preso in esame e verranno inoltre presentate le tecnologie utilizzate per operare tale sviluppo. I progetti sono entrambi dei Web Application Java adoperati rispettivamente per indicizzare e per ricercare nel repository dei CV in base all IN utente Tecnologie utilizzate Di seguito una breve descrizione delle tecnologie adoperate, farà da introduzione allo sviluppo vero e proprio del motore di IR d esempio citato precedentemente. - Apache Lucene, di cui si è già abbondantemente discusso nei paragrafi precedenti; - Apache Tomcat, application server che ci permette lo sviluppo delle pagine JSP ( Java Server Pages ) o delle Servlet e l esecuzione di applicazioni web sviluppate in Java ; - Xaamp, piattaforma software, che mette a disposizione gli strumenti come, MySql e Apache HttpServer, per la creazione di pagine sviluppate con linguaggi di programmazione lato Server come PHP; - Eclipse Luna, IDE per la programmazione e lo sviluppo di software di varia natura e uso Esempio di sviluppo di un motore di IR In questo paragrafo verrà implementato un esempio di motore di IR e per comodità il progetto verrà diviso in due parti : - Indexer, che si occuperà dell indicizzazione dei documenti in ingresso al sistema ; - Searcher, che metterà a disposizione un interfaccia utente per la ricerca dei files. 17

18 Progetto Indexer In questa fase del progetto di costruzione di un motore di IR verrà implementata la parte relativa all indicizzazione dei termini nei documenti uplodati nel sistema. In particolare, i documenti trattati, saranno dei Curriculum Vitae in formato europeo ( per comodità con estenzioni *PDF o *DOC ). Tali CV verranno parserizzati ( verrà analizzato il flusso continuo di dati in ingresso, letti per esempio da un file, in modo da determinare la sua struttura grazie ad una data grammatica formale ) prima di essere passati alla classe Lucene che si occuperà della loro tokenizzazione e successiva indicizzazione. Questa fase produrrà un documento formattato secondo alcuni parametri comodi per le fasi successive e con lo scopo di accedere il file per essere elaborato. Successivamente il file storato in un oggetto di tipo Document verrà dapprima spostato in una struttura dati di tipo String ( necessaria per operare sul testo ), dopodichè il testo, opportunamente formattato, verrà matchato con un dizionario di Stop Words opportunamente creato per il caso d uso specifico e disposto in una struttura dati di tipo ArrayList <String> e se esistono corrispondenze di valore tra il testo e il dizionario stesso, verranno esclusi tali termini dalla struttura dati finale, che sarà poi utilizzata per l indicizzazione. Solo ora si otterrà una serie di term privi di Stop Words e tokenizzati. A questo punto i term verrano dapprima lemmatizzati e 18

19 successivamente indicizzati. La lemmatizzazione, in questo specifico caso d uso, consiste nella correzione del testo presente nella struttura dati contenente i token confrontandoli con un ulteriore dizionario ( in questo caso un dizionario della lingua italiana senza voci verbali coniugate per risalire alla radice dei verbi ) sfruttando un algoritmo di Distanza di Edit. Quest ultimo si occupa di effettuare una correzione o associazione di termini in base a quelli presenti nel dizionario, sostituendo i term con i termini che hanno distanza minima con gli stessi termini del dizionario. Questo algoritmo è illustrato in dettaglio nel paragrafo successivo. Infine, i term risultanti dalle operazioni precedenti, saranno indicizzati sfruttando la classe Analyzer di Lucene, la quale, mette a disposizione metodi e funzionalità per una corretta creazione dell indice Progetto Searcher Nella seconda ed ultima fase del progetto, verrà implementata un interfaccia grafica e la sezione che si occupa della ricerca, sfruttando ancora una volta i metodi e le classi di Apache Lucene. In particolare vi è una pagina di ricerca sviluppata con HTML5 e CSS3, che mette a disposizione una input per la digitazione del testo da ricercare e una veste grafica di esempio per il compimento di varie operazioni. A tale strumento è applicata una funzione, sottoforma di Servlet JSP con chiamata asicrona AJAX, per il suggerimento di parole da cercare al posto delle parole digitate nella barra di ricerca ( simil Google ). L algoritmo che gestisce il suggerimento di parole in alternativa al testo digitato nella input è la Distanza di Edit o Distanza di Levenshtein, il quale unitamente alla chiamata AJAX, da ausilio 19

20 all utente che digita il testo in merito alla correzione ortografica o al senso del testo digitato. 2.3 Ottimizzazione della ricerca con l algoritmo di Edit Distance In questo paragrafo è descritto dettagliatamente l algoritmo distanza di edit di Vladmir Levenshtein ( scienziato russo che ne 1965 introdusse il concetto di distanza di edit tra stringhe ) il quale è sfruttato per controllare la similitudine e l associazione tra testi, ma che è possibile sfruttare anche per immagini, suoni ecc. In generale la distanza di Levenshtein tra due stringhe A e B è il numero minimo di modifiche elementari che consentono di trasformare la stringa A in quella B. Per modifica elementare si intende : - cancellazione di un carattere contenuto nel termine ; - sostituzione di un carattere con un altro ; - inserimento ex-novo di un carattere nella stringa. Un esempio esplicativo dell algoritmo di edit è la trasformazione del termine "casa" in "carato": 1. casa -> cara ( sostituzione di S in R ); 2. cara -> carat ( inserimento di T ); 3. carat -> carato ( inserimento di O ). Percui, nel caso preso in esempio, non è possibile passare dalla prima parola alla seconda con meno di 3 operazioni, quindi la distanza di Levenshtein è 3. A supporto di questo esempio è sopra riportato lo sviluppo in Java dell algoritmo e un Main di prova per testarlo. 20

21 2.4 Vocabolario dei sinonimi Analisi, progettazione e sviluppo di un software di Information Retrieval con tecnologie J2EE Le difficoltà nell implementazione di un valido motore di IR stanno non tanto nelle fasi descritte fin qui, le quali sono ben definite e facili da implementare grazie all uso di algoritmi ben strutturati e studiati, ma sta nella restituzione e reperimento della IN utente. Diversamente dalle altre lingue mondiali, l italiano ha una sintassi e una morfologia estremamente complessa e articolata, percui, una parola può avere molti significati in base al contesto, alla posizione, all uso, ecc. Inoltre il vocabolario dei sinonimi in italiano, complica ancor di più la restituzione di un risultato valido e preciso all utente. E proprio su questo punto che attualmente vi è un forte studio per l ottimizzazione e l efficienza di strumenti già esistenti ma che vanno sicuramente perfezionati. Uno degli strumenti che permette di poter restituire risultati validi e quindi rispettare l IN dell utente è il Thesaurus, il quale si occupa di confrontare tuple di termini e restituire il sinonimo associato ai termini cercati dall utente. Il Thesaurus fa parte della più grande famiglia degli algoritmi di prossimità semantica, i quali sono di fondamentale utilità per aumentare le capacità di analisi testuale e per il soddisfacimento dell IN utente Thesaurus In sintesi un Thesaurus è sostanzialmente un dizionario dei sinonimi ( nel nostro specifico caso d uso in italiano ), nel quale nello specifico, vengono memorizzari i valori di somiglianza tra coppie di termini. Inoltre esistono diverse tecniche per la costruzione dei Thesaurus che si distinguono principalmente in due gruppi principali : - Somiglianza lessicale: si basano sull analisi della radice comune dei termini fornendo un indice che rappresenta quanto due parole derivino da una radice comune. - Somiglianza semantica: si basano sull analisi delle relazioni concettuali dei termini fornendo un indice che rappresenta quanto due termini sono concettualmente legati. 21

22 2.4.2 Somiglianza lessicale Esistono due tecniche per individuare le affinità semantiche tra coppie di termini di un documento: l individuazione di una radice comune tra i termini ( troncamento ) e l analisi tra stringhe. Nell utilizzo della prima metodologia si riscontrano ambiguità nella determinazione della radice comune e nell impossibilità di analizzare correttamente le forme irregolari dei termini. Nel confronto tra stringhe, invece, la procedura è più semplice ma più dispendiosa e consiste nel trovare una rappresentazione numerica al grado di somiglianza tra le parole Somiglianza semantica La somiglianza semantica si basa sulla ricerca di termini nel documento che possono essere considerati vocaboli simili. Due parole sono sinonimi se il loro utilizzo in un determinato contesto è neutrale ai fini del significato. Si possono analizzare diverse tipologie di correlazioni semantiche; i termini gatto e micio, ad esempio, sono sinonimi, ma anche i termini gatto e felino oppure gatto e animale, se pur in forma minore, sono dei sinonimi. In questi ultimi due casi si parla di iponimia della parola gatto in quanto i termini felino e animale sono concetti più generali rispetto al termine gatto. Oltre ai sinonimi vi sono anche altre correlazioni tra i termini, come esistono tra le parole cane e gatto. L individuazione di questi legami di termini è una fase molto complessa che non può prescindere dall intervento umano; la valutazione automatica di relazioni come quelle che esistono tra i termini cane e gatto, infatti, deve essere valutata manualmente in base al contesto di utilizzo. Per valutare le dipendenze di somiglianza semantica che esistono tra i termini di un documento si può pensare di prendere in considerazione come unità fondamentale, una frase. E logico pensare che se due termini compaiono assieme in diverse frasi è plausibile che queste parole siano correlate tra loro. Su questa idea di base si sviluppano le principali tecniche di analisi automatica della somiglianza semantica di termini. 22

Indicizzazione terza parte e modello booleano

Indicizzazione terza parte e modello booleano Reperimento dell informazione (IR) - aa 2014-2015 Indicizzazione terza parte e modello booleano Gruppo di ricerca su Sistemi di Gestione delle Informazioni (IMS) Dipartimento di Ingegneria dell Informazione

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testualilezione 2 Le principali tecniche di analisi testuale Facendo riferimento alle tecniche di data mining,

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

F O R M A T O E U R O P E O

F O R M A T O E U R O P E O F O R M A T O E U R O P E O P E R I L C U R R I C U L U M V I T A E INFORMAZIONI PERSONALI Nome Indirizzo Laura Bacci, PMP Via Tezze, 36 46100 MANTOVA Telefono (+39) 348 6947997 Fax (+39) 0376 1810801

Dettagli

Applicazione: Share - Sistema per la gestione strutturata di documenti

Applicazione: Share - Sistema per la gestione strutturata di documenti Riusabilità del software - Catalogo delle applicazioni: Gestione Documentale Applicazione: Share - Sistema per la gestione strutturata di documenti Amministrazione: Regione Piemonte - Direzione Innovazione,

Dettagli

Applicazione: DoQui/Index - Motore di gestione dei contenuti digitali

Applicazione: DoQui/Index - Motore di gestione dei contenuti digitali Riusabilità del software - Catalogo delle applicazioni: Applicativo verticale Applicazione: DoQui/Index - Motore di gestione dei contenuti digitali Amministrazione: Regione Piemonte - Direzione Innovazione,

Dettagli

SIASFi: il sistema ed il suo sviluppo

SIASFi: il sistema ed il suo sviluppo SIASFI: IL SISTEMA ED IL SUO SVILUPPO 187 SIASFi: il sistema ed il suo sviluppo Antonio Ronca Il progetto SIASFi nasce dall esperienza maturata da parte dell Archivio di Stato di Firenze nella gestione

Dettagli

DBMS (Data Base Management System)

DBMS (Data Base Management System) Cos'è un Database I database o banche dati o base dati sono collezioni di dati, tra loro correlati, utilizzati per rappresentare una porzione del mondo reale. Sono strutturati in modo tale da consentire

Dettagli

APPLICAZIONE WEB PER LA GESTIONE DELLE RICHIESTE DI ACQUISTO DEL MATERIALE INFORMATICO. Francesco Marchione e Dario Richichi

APPLICAZIONE WEB PER LA GESTIONE DELLE RICHIESTE DI ACQUISTO DEL MATERIALE INFORMATICO. Francesco Marchione e Dario Richichi APPLICAZIONE WEB PER LA GESTIONE DELLE RICHIESTE DI ACQUISTO DEL MATERIALE INFORMATICO Francesco Marchione e Dario Richichi Istituto Nazionale di Geofisica e Vulcanologia Sezione di Palermo Indice Introduzione...

Dettagli

Curriculum Vitae Europass

Curriculum Vitae Europass Curriculum Vitae Europass Informazioni personali Cognome/i nome/i Castelli Flavio Email flavio.castelli@gmail.com Sito web personale http://www.flavio.castelli.name Nazionalità Italiana Data di nascita

Dettagli

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina Cosa è il DSS L elevato sviluppo dei personal computer, delle reti di calcolatori, dei sistemi database di grandi dimensioni, e la forte espansione di modelli basati sui calcolatori rappresentano gli sviluppi

Dettagli

FORM Il sistema informativo di gestione della modulistica elettronica.

FORM Il sistema informativo di gestione della modulistica elettronica. Studio FORM FORM Il sistema informativo di gestione della modulistica elettronica. We believe in what we create This is FORM power La soluzione FORM permette di realizzare qualsiasi documento in formato

Dettagli

AOT Lab Dipartimento di Ingegneria dell Informazione Università degli Studi di Parma. Unified Process. Prof. Agostino Poggi

AOT Lab Dipartimento di Ingegneria dell Informazione Università degli Studi di Parma. Unified Process. Prof. Agostino Poggi AOT Lab Dipartimento di Ingegneria dell Informazione Università degli Studi di Parma Unified Process Prof. Agostino Poggi Unified Process Unified Software Development Process (USDP), comunemente chiamato

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello della Web Application 5 3 Struttura della web Application 6 4 Casi di utilizzo della Web

Dettagli

Copyright Università degli Studi di Torino, Progetto Atlante delle Professioni 2009 IT PROCESS EXPERT

Copyright Università degli Studi di Torino, Progetto Atlante delle Professioni 2009 IT PROCESS EXPERT IT PROCESS EXPERT 1. CARTA D IDENTITÀ... 2 2. CHE COSA FA... 3 3. DOVE LAVORA... 4 4. CONDIZIONI DI LAVORO... 5 5. COMPETENZE... 6 Quali competenze sono necessarie... 6 Conoscenze... 8 Abilità... 9 Comportamenti

Dettagli

Informatica Applicata

Informatica Applicata Ing. Irina Trubitsyna Concetti Introduttivi Programma del corso Obiettivi: Il corso di illustra i principi fondamentali della programmazione con riferimento al linguaggio C. In particolare privilegia gli

Dettagli

Le Reti Informatiche

Le Reti Informatiche Le Reti Informatiche modulo 10 Prof. Salvatore Rosta www.byteman.it s.rosta@byteman.it 1 Nomenclatura: 1 La rappresentazione di uno schema richiede una serie di abbreviazioni per i vari componenti. Seguiremo

Dettagli

Linguistica Generale

Linguistica Generale Linguistica Generale Docente: Paola Monachesi Aprile-Maggio 2003 Contents 1 La linguistica e i suoi settori 2 2 La grammatica come mezzo per rappresentare la competenza linguistica 2 3 Le componenti della

Dettagli

P.L.I.D.A. Progetto Lingua Italiana Dante Alighieri Certificazione di competenza della lingua italiana

P.L.I.D.A. Progetto Lingua Italiana Dante Alighieri Certificazione di competenza della lingua italiana P.L.I.D.A. Progetto Lingua Italiana Dante Alighieri Certificazione di competenza della lingua italiana CRITERI DI VALUTAZIONE PER LE PROVE SCRITTE L obiettivo del valutatore, nella correzione delle prove

Dettagli

Introduzione alla Programmazione ad Oggetti in C++

Introduzione alla Programmazione ad Oggetti in C++ Introduzione alla Programmazione ad Oggetti in C++ Lezione 1 Cosa è la Programmazione Orientata agli Oggetti Metodologia per costruire prodotti software di grosse dimensioni che siano affidabili e facilmente

Dettagli

Università di Torino Facoltà di Scienze MFN Corso di Studi in Informatica. Programmazione I - corso B a.a. 2009-10. prof.

Università di Torino Facoltà di Scienze MFN Corso di Studi in Informatica. Programmazione I - corso B a.a. 2009-10. prof. Università di Torino Facoltà di Scienze MFN Corso di Studi in Informatica Programmazione I - corso B a.a. 009-10 prof. Viviana Bono Blocco 9 Metodi statici: passaggio parametri, variabili locali, record

Dettagli

Introduzione al GIS (Geographic Information System)

Introduzione al GIS (Geographic Information System) Introduzione al GIS (Geographic Information System) Sommario 1. COS E IL GIS?... 3 2. CARATTERISTICHE DI UN GIS... 3 3. COMPONENTI DI UN GIS... 4 4. CONTENUTI DI UN GIS... 5 5. FASI OPERATIVE CARATTERIZZANTI

Dettagli

Elaidon Web Solutions

Elaidon Web Solutions Elaidon Web Solutions Realizzazione siti web e pubblicità sui motori di ricerca Consulente Lorenzo Stefano Piscioli Via Siena, 6 21040 Gerenzano (VA) Telefono +39 02 96 48 10 35 elaidonwebsolutions@gmail.com

Dettagli

Business Intelligence

Business Intelligence aggregazione dati Business Intelligence analytic applications query d a t a w a r e h o u s e aggregazione budget sales inquiry data mining Decision Support Systems MIS ERP data management Data Modeling

Dettagli

INTRODUZIONE, LINGUAGGIO, HANDS ON. Giuseppe Cirillo g.cirillo@unina.it

INTRODUZIONE, LINGUAGGIO, HANDS ON. Giuseppe Cirillo g.cirillo@unina.it INTRODUZIONE, LINGUAGGIO, HANDS ON Giuseppe Cirillo g.cirillo@unina.it Il linguaggio C 1972-Dennis Ritchie 1978-Definizione 1990-ANSI C 1966 Martin Richars (MIT) Semplificando CPL usato per sviluppare

Dettagli

ITALIANO TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA PRIMARIA

ITALIANO TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA PRIMARIA ITALIANO TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA PRIMARIA L allievo partecipa a scambi comunicativi (conversazione, discussione di classe o di gruppo) con compagni e insegnanti

Dettagli

Master Universitario di II livello in PROJECT MANAGEMENT: MANAGING COMPLEXITY a.a. 2014/2015 MANIFESTO DEGLI STUDI

Master Universitario di II livello in PROJECT MANAGEMENT: MANAGING COMPLEXITY a.a. 2014/2015 MANIFESTO DEGLI STUDI Master Universitario di II livello in PROJECT MANAGEMENT: MANAGING COMPLEXITY a.a. 201/2015 MANIFESTO DEGLI STUDI Art. 1 - Attivazione e scopo del Master 1 E' attivato per l'a.a. 201/2015 presso l'università

Dettagli

Neomobile incentra l infrastruttura IT su Microsoft ALM, arrivando a 40 nuovi rilasci a settimana

Neomobile incentra l infrastruttura IT su Microsoft ALM, arrivando a 40 nuovi rilasci a settimana Storie di successo Microsoft per le Imprese Scenario: Software e Development Settore: Servizi In collaborazione con Neomobile incentra l infrastruttura IT su Microsoft ALM, arrivando a 40 nuovi rilasci

Dettagli

ORACLE BUSINESS INTELLIGENCE STANDARD EDITION ONE A WORLD CLASS PERFORMANCE

ORACLE BUSINESS INTELLIGENCE STANDARD EDITION ONE A WORLD CLASS PERFORMANCE ORACLE BUSINESS INTELLIGENCE STANDARD EDITION ONE A WORLD CLASS PERFORMANCE Oracle Business Intelligence Standard Edition One è una soluzione BI completa, integrata destinata alle piccole e medie imprese.oracle

Dettagli

Università degli Studi di Bergamo Policy sull accesso aperto (Open Access) alla letteratura scientifica

Università degli Studi di Bergamo Policy sull accesso aperto (Open Access) alla letteratura scientifica Università degli Studi di Bergamo Policy sull accesso aperto (Open Access) alla letteratura scientifica Indice 1 Definizioni 2 Premesse 3 Commissione di Ateneo per l Accesso aperto 4 Gruppo di lavoro 5

Dettagli

UML Component and Deployment diagram

UML Component and Deployment diagram UML Component and Deployment diagram Ing. Orazio Tomarchio Orazio.Tomarchio@diit.unict.it Dipartimento di Ingegneria Informatica e delle Telecomunicazioni Università di Catania I diagrammi UML Classificazione

Dettagli

GOOGLE, WIKIPEDIA E VALUTAZIONE SITI WEB. A cura delle biblioteche Umanistiche e Giuridiche

GOOGLE, WIKIPEDIA E VALUTAZIONE SITI WEB. A cura delle biblioteche Umanistiche e Giuridiche GOOGLE, WIKIPEDIA E VALUTAZIONE SITI WEB A cura delle biblioteche Umanistiche e Giuridiche ISTRUZIONI PER Usare in modo consapevole i motori di ricerca Valutare un sito web ed utilizzare: Siti istituzionali

Dettagli

La gestione documentale con il programma Filenet ed il suo utilizzo tramite la tecnologia.net. di Emanuele Mattei (emanuele.mattei[at]email.

La gestione documentale con il programma Filenet ed il suo utilizzo tramite la tecnologia.net. di Emanuele Mattei (emanuele.mattei[at]email. La gestione documentale con il programma Filenet ed il suo utilizzo tramite la tecnologia.net di Emanuele Mattei (emanuele.mattei[at]email.it) Introduzione In questa serie di articoli, vedremo come utilizzare

Dettagli

Corso di Programmazione ad Oggetti

Corso di Programmazione ad Oggetti Corso di Programmazione ad Oggetti Introduzione alla programmazione ad oggetti a.a. 2008/2009 Claudio De Stefano 1 La programmazione modulare Un programma può essere visto come un insieme di moduli che

Dettagli

Studio di retribuzione 2014

Studio di retribuzione 2014 Studio di retribuzione 2014 TECHNOLOGY Temporary & permanent recruitment www.pagepersonnel.it EDITORIALE Grazie ad una struttura costituita da 100 consulenti e 4 uffici in Italia, Page Personnel offre

Dettagli

Piazza delle Imprese alimentari. Viale delle Manifatture. Via della Produzione

Piazza delle Imprese alimentari. Viale delle Manifatture. Via della Produzione Piazza delle Imprese alimentari Viale delle Manifatture Via della Produzione PASSEPARTOUT MEXAL è una soluzione gestionale potente e completa per le imprese che necessitano di un prodotto estremamente

Dettagli

Adriana Volpato. P.D.P. Piano Didattico Personalizzato sc. Primaria

Adriana Volpato. P.D.P. Piano Didattico Personalizzato sc. Primaria Adriana Volpato P.D.P. Piano Didattico Personalizzato sc. Primaria 19 Dicembre 2011 STRUMENTO didattico educativo individua gli strumenti fa emergere il vero alunno solo con DIAGNOSI consegnata si redige

Dettagli

REGOLAMENTO DIDATTICO DEL CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA ELETTRICA Second level degree in electrical engineering

REGOLAMENTO DIDATTICO DEL CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA ELETTRICA Second level degree in electrical engineering REGOLAMENTO DIDATTICO DEL CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA ELETTRICA Second level degree in electrical engineering ( MODIFICATO IL 29 giugno 2009) Classe 31/S Politecnico di Bari I A Facoltà

Dettagli

ALFABETIZZAZIONE DI BASE Programma del Corso livello base

ALFABETIZZAZIONE DI BASE Programma del Corso livello base Un po di Storia ISP & Web Engineering ALFABETIZZAZIONE DI BASE Programma del Corso livello base Breve cenno sulla storia dell informatica: dagli albori ai giorni nostri; L evoluzione di Windows: dalla

Dettagli

DynDevice ECM. La Suite di applicazioni web per velocizzare, standardizzare e ottimizzare il flusso delle informazioni aziendali

DynDevice ECM. La Suite di applicazioni web per velocizzare, standardizzare e ottimizzare il flusso delle informazioni aziendali DynDevice ECM La Suite di applicazioni web per velocizzare, standardizzare e ottimizzare il flusso delle informazioni aziendali Presentazione DynDevice ECM Cos è DynDevice ICMS Le soluzioni di DynDevice

Dettagli

Sistemi Web-Based - Terminologia. Progetto di Sistemi Web-Based Prof. Luigi Laura, Univ. Tor Vergata, a.a. 2010/2011

Sistemi Web-Based - Terminologia. Progetto di Sistemi Web-Based Prof. Luigi Laura, Univ. Tor Vergata, a.a. 2010/2011 Sistemi Web-Based - Terminologia Progetto di Sistemi Web-Based Prof. Luigi Laura, Univ. Tor Vergata, a.a. 2010/2011 CLIENT: il client è il programma che richiede un servizio a un computer collegato in

Dettagli

Estensione di un servizo di messaggistica per telefonia mobile (per una società di agenti TuCSoN)

Estensione di un servizo di messaggistica per telefonia mobile (per una società di agenti TuCSoN) Estensione di un servizo di messaggistica per telefonia mobile (per una società di agenti TuCSoN) System Overview di Mattia Bargellini 1 CAPITOLO 1 1.1 Introduzione Il seguente progetto intende estendere

Dettagli

UNIVERSITA DI PISA FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA ELETTRONICA ANNO ACCADEMICO 2004-2005 TESI DI LAUREA

UNIVERSITA DI PISA FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA ELETTRONICA ANNO ACCADEMICO 2004-2005 TESI DI LAUREA UNIVERSITA DI PISA FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA ELETTRONICA ANNO ACCADEMICO 2004-2005 TESI DI LAUREA SVILUPPO DI METODI DECONVOLUTIVI PER L INDIVIDUAZIONE DI SORGENTI INDIPENDENTI

Dettagli

La natura del linguaggio e il processo di acquisizione

La natura del linguaggio e il processo di acquisizione La natura del linguaggio e il processo di acquisizione Il bambino nasce con un patrimonio genetico e con una predisposizione innata per il linguaggio. Affinché ciò avvenga normalmente è necessario che

Dettagli

InitZero s.r.l. Via P. Calamandrei, 24-52100 Arezzo email: info@initzero.it

InitZero s.r.l. Via P. Calamandrei, 24-52100 Arezzo email: info@initzero.it izticket Il programma izticket permette la gestione delle chiamate di intervento tecnico. E un applicazione web, basata su un potente application server java, testata con i più diffusi browser (quali Firefox,

Dettagli

FileMaker Server 12. Guida introduttiva

FileMaker Server 12. Guida introduttiva FileMaker Server 12 Guida introduttiva 2007 2012 FileMaker, Inc. Tutti i diritti riservati. FileMaker, Inc. 5201 Patrick Henry Drive Santa Clara, California 95054 FileMaker e Bento sono marchi di FileMaker,

Dettagli

GESTIRE LA BIBLIOGRAFIA

GESTIRE LA BIBLIOGRAFIA GESTIRE LA BIBLIOGRAFIA STRUMENTI DI GESTIONE BIBLIOGRAFICA I software di gestione bibliografica permettono di raccogliere, catalogare e organizzare diverse tipologie di materiali, prendere appunti, formattare

Dettagli

Sommersi dalle informazioni?

Sommersi dalle informazioni? Sommersi dalle informazioni? Centro Dir. Colleoni Viale Colleoni, 1 Pal. Taurus 1 20041 Agrate Brianza (MI) T: +39 039 5966 039 F: +39 039 5966 040 www.tecnosphera.it DOCUMENT MANAGEMENT GESTIONE DOCUMENTALE

Dettagli

Lezione su Informatica di Base

Lezione su Informatica di Base Lezione su Informatica di Base Esplora Risorse, Gestione Cartelle, Alcuni tasti di scelta Rapida Domenico Capano D.C. Viterbo: Lunedì 21 Novembre 2005 Indice Una nota su questa lezione...4 Introduzione:

Dettagli

Suite o servizio: Arkottica migliora l organizzazione aziendale

Suite o servizio: Arkottica migliora l organizzazione aziendale Suite o servizio: Arkottica migliora l organizzazione aziendale Gestisci. Organizza. Risparmia. Una lunga storia, uno sguardo sempre rivolto al futuro. InfoSvil è una società nata nel gennaio 1994 come

Dettagli

Nota dell ASLI sull insegnamento dell italiano nella scuola secondaria di secondo grado Premessa

Nota dell ASLI sull insegnamento dell italiano nella scuola secondaria di secondo grado Premessa Nota dell ASLI sull insegnamento dell italiano nella scuola secondaria di secondo grado Premessa L insegnamento della lingua materna nella scuola secondaria superiore si dimostra particolarmente importante

Dettagli

SOFTWARE GESTIONE SMS DA INTERFACCE CL MANUALE D INSTALLAZIONE ED USO

SOFTWARE GESTIONE SMS DA INTERFACCE CL MANUALE D INSTALLAZIONE ED USO CLSMS SOFTWARE GESTIONE SMS DA INTERFACCE CL MANUALE D INSTALLAZIONE ED USO Sommario e introduzione CLSMS SOMMARIO INSTALLAZIONE E CONFIGURAZIONE... 3 Parametri di configurazione... 4 Attivazione Software...

Dettagli

ITALIANO - ASCOLTARE E PARLARE

ITALIANO - ASCOLTARE E PARLARE O B I E T T I V I M I N I M I P E R L A S C U O L A P R I M A R I A E S E C O N D A R I A D I P R I M O G R A D O ITALIANO - ASCOLTARE E PARLARE Ascoltare e comprendere semplici consegne operative Comprendere

Dettagli

Gestore Comunicazioni Obbligatorie. Progetto SINTESI. Comunicazioni Obbligatorie. Modulo Applicativo COB. - Versione Giugno 2013 -

Gestore Comunicazioni Obbligatorie. Progetto SINTESI. Comunicazioni Obbligatorie. Modulo Applicativo COB. - Versione Giugno 2013 - Progetto SINTESI Comunicazioni Obbligatorie Modulo Applicativo COB - Versione Giugno 2013-1 Versione Giugno 2013 INDICE 1 Introduzione 3 1.1 Generalità 3 1.2 Descrizione e struttura del manuale 3 1.3 Requisiti

Dettagli

Business Intelligence

Business Intelligence Breve panoramica sulla Business Intelligence con software Open Source Roberto Marchetto, 14 Gennaio 2009 L'articolo ed eventuali commenti sono disponibili su www.robertomarchetto.com (Introduzione) Il

Dettagli

Ing. Andrea Saccà. Stato civile: Celibe Nazionalità: Italiana Data di nascita: 9 Ottobre 1978 Luogo di nascita: Roma Residenza: Roma

Ing. Andrea Saccà. Stato civile: Celibe Nazionalità: Italiana Data di nascita: 9 Ottobre 1978 Luogo di nascita: Roma Residenza: Roma Indirizzo: Via dell'automobilismo, 109 00142 Roma (RM) Sito Web : http://www.andreasacca.com Telefono: 3776855061 Email : sacca.andrea@gmail.com PEC : andrea.sacca@pec.ording.roma.it Ing. Andrea Saccà

Dettagli

Dal punto di vista organizzativo sono possibili due soluzioni per il sistema di rete.

Dal punto di vista organizzativo sono possibili due soluzioni per il sistema di rete. Premessa. La traccia di questo anno integra richieste che possono essere ricondotte a due tipi di prove, informatica sistemi, senza lasciare spazio ad opzioni facoltative. Alcuni quesiti vanno oltre le

Dettagli

REALIZZARE UN MODELLO DI IMPRESA

REALIZZARE UN MODELLO DI IMPRESA REALIZZARE UN MODELLO DI IMPRESA - organizzare e gestire l insieme delle attività, utilizzando una piattaforma per la gestione aziendale: integrata, completa, flessibile, coerente e con un grado di complessità

Dettagli

Ambienti di sviluppo integrato

Ambienti di sviluppo integrato Ambienti di sviluppo integrato Un ambiente di sviluppo integrato (IDE - Integrated Development Environment) è un ambiente software che assiste i programmatori nello sviluppo di programmi Esso è normalmente

Dettagli

Processi di business sovra-regionali relativi ai sistemi regionali di FSE. Versione 1.0 24 Giugno 2014

Processi di business sovra-regionali relativi ai sistemi regionali di FSE. Versione 1.0 24 Giugno 2014 Processi di business sovra-regionali relativi ai sistemi regionali di FSE Versione 1.0 24 Giugno 2014 1 Indice Indice... 2 Indice delle figure... 3 Indice delle tabelle... 4 Obiettivi del documento...

Dettagli

Elementi di Informatica e Programmazione

Elementi di Informatica e Programmazione Elementi di Informatica e Programmazione Le Reti di Calcolatori (parte 2) Corsi di Laurea in: Ingegneria Civile Ingegneria per l Ambiente e il Territorio Università degli Studi di Brescia Docente: Daniela

Dettagli

Manipolazione di testi: espressioni regolari

Manipolazione di testi: espressioni regolari Manipolazione di testi: espressioni regolari Un meccanismo per specificare un pattern, che, di fatto, è la rappresentazione sintetica di un insieme (eventualmente infinito) di stringhe: il pattern viene

Dettagli

Destinazione: IRLANDA. art. 1 SOGGETTO PROPONENTE E OGGETTO. indice una selezione

Destinazione: IRLANDA. art. 1 SOGGETTO PROPONENTE E OGGETTO. indice una selezione AVVISO DI SELEZIONE PER L ATTUAZIONE DEL PROGRAMMA LEONARDO DA VINCI Progetto M.E.D. Progetto nr. LLP-LdV-PLM-11-IT-254 Titolo M.E.D. (N. LLPLink 2011-1-IT1-LEO02-01757) Destinazione: IRLANDA art. 1 SOGGETTO

Dettagli

Utilizzato con successo nei più svariati settori aziendali, con Passepartout Mexal BP ogni utente può disporre di funzionalità

Utilizzato con successo nei più svariati settori aziendali, con Passepartout Mexal BP ogni utente può disporre di funzionalità PASSEPARTOUT MEXAL BP è una soluzione gestionale potente e completa per le imprese che necessitano di un prodotto estremamente flessibile, sia dal punto di vista tecnologico sia funzionale. Con più di

Dettagli

GLI ASSI CULTURALI. Allegato 1 - Gli assi culturali. Nota. rimessa all autonomia didattica del docente e alla programmazione collegiale del

GLI ASSI CULTURALI. Allegato 1 - Gli assi culturali. Nota. rimessa all autonomia didattica del docente e alla programmazione collegiale del GLI ASSI CULTURALI Nota rimessa all autonomia didattica del docente e alla programmazione collegiale del La normativa italiana dal 2007 13 L Asse dei linguaggi un adeguato utilizzo delle tecnologie dell

Dettagli

How to Develop Accessible Linux Applications

How to Develop Accessible Linux Applications How to Develop Accessible Linux Applications Sharon Snider Copyright 2002 IBM Corporation v1.1, 2002-05-03 Diario delle Revisioni Revisione v1.1 2002-05-03 Revisionato da: sds Convertito in DocBook XML

Dettagli

Intalio. Leader nei Sistemi Open Source per il Business Process Management. Andrea Calcagno Amministratore Delegato

Intalio. Leader nei Sistemi Open Source per il Business Process Management. Andrea Calcagno Amministratore Delegato Intalio Convegno Open Source per la Pubblica Amministrazione Leader nei Sistemi Open Source per il Business Process Management Navacchio 4 Dicembre 2008 Andrea Calcagno Amministratore Delegato 20081129-1

Dettagli

IT-BOOK. Domini Hosting Web marketing E-mail e PEC

IT-BOOK. Domini Hosting Web marketing E-mail e PEC 5 giugno 09 IT-BOOK Configurazioni e cartatteristiche tecniche possono essere soggette a variazioni senza preavviso. Tutti i marchi citati sono registrati dai rispettivi proprietari. Non gettare per terra:

Dettagli

I MIGLIORI SI RICONOSCONO DAI RISULTATI

I MIGLIORI SI RICONOSCONO DAI RISULTATI I MIGLIORI SI RICONOSCONO DAI RISULTATI LO STRUMENTO PER GESTIRE A 360 LE ATTIVITÀ DELLO STUDIO, CON IL MOTORE DI RICERCA PIÙ INTELLIGENTE, L UNICO CHE TI CAPISCE AL VOLO. www.studiolegale.leggiditalia.it

Dettagli

Scrivere uno script php che, dato un array associativo PERSONE le cui chiavi sono i

Scrivere uno script php che, dato un array associativo PERSONE le cui chiavi sono i Esercizi PHP 1. Scrivere uno script PHP che produca in output: 1. La tabellina del 5 2. La tavola Pitagorica contenuta in una tabella 3. La tabellina di un numero ricevuto in input tramite un modulo. Lo

Dettagli

Utilizzato con successo nei più svariati settori aziendali, Passepartout Mexal BP è disponibile in diverse versioni e configurazioni:

Utilizzato con successo nei più svariati settori aziendali, Passepartout Mexal BP è disponibile in diverse versioni e configurazioni: Passepartout Mexal BP è una soluzione gestionale potente e completa per le imprese che necessitano di un prodotto estremamente flessibile, sia dal punto di vista tecnologico sia funzionale. Con più di

Dettagli

Università degli Studi di Parma. Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica

Università degli Studi di Parma. Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica Università degli Studi di Parma Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica A.A. 2007-08 CORSO DI INGEGNERIA DEL SOFTWARE Prof. Giulio Destri http://www.areasp.com (C) 2007 AreaSP for

Dettagli

Talento LAB 4.1 - UTILIZZARE FTP (FILE TRANSFER PROTOCOL) L'UTILIZZO DI ALTRI SERVIZI INTERNET. In questa lezione imparerete a:

Talento LAB 4.1 - UTILIZZARE FTP (FILE TRANSFER PROTOCOL) L'UTILIZZO DI ALTRI SERVIZI INTERNET. In questa lezione imparerete a: Lab 4.1 Utilizzare FTP (File Tranfer Protocol) LAB 4.1 - UTILIZZARE FTP (FILE TRANSFER PROTOCOL) In questa lezione imparerete a: Utilizzare altri servizi Internet, Collegarsi al servizio Telnet, Accedere

Dettagli

GIS più diffusi. Paolo Zatelli. Dipartimento di Ingegneria Civile ed Ambientale Università di Trento. GIS più diffusi

GIS più diffusi. Paolo Zatelli. Dipartimento di Ingegneria Civile ed Ambientale Università di Trento. GIS più diffusi GIS più diffusi GIS più diffusi Paolo Zatelli Dipartimento di Ingegneria Civile ed Ambientale Università di Trento Paolo Zatelli Università di Trento 1 / 19 GIS più diffusi Outline 1 Free Software/Open

Dettagli

GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno

GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno La Vista CAS L ambiente di lavoro Le celle Assegnazione di una variabile o di una funzione / visualizzazione

Dettagli

Allegato A. Il profilo culturale, educativo e professionale dei Licei

Allegato A. Il profilo culturale, educativo e professionale dei Licei Allegato A Il profilo culturale, educativo e professionale dei Licei I percorsi liceali forniscono allo studente gli strumenti culturali e metodologici per una comprensione approfondita della realtà, affinché

Dettagli

HORIZON SQL CONFIGURAZIONE DI RETE

HORIZON SQL CONFIGURAZIONE DI RETE 1-1/9 HORIZON SQL CONFIGURAZIONE DI RETE 1 CARATTERISTICHE DI UN DATABASE SQL...1-2 Considerazioni generali... 1-2 Concetto di Server... 1-2 Concetto di Client... 1-2 Concetto di database SQL... 1-2 Vantaggi...

Dettagli

Il World Wide Web: nozioni introduttive

Il World Wide Web: nozioni introduttive Il World Wide Web: nozioni introduttive Dott. Nicole NOVIELLI novielli@di.uniba.it http://www.di.uniba.it/intint/people/nicole.html Cos è Internet! Acronimo di "interconnected networks" ("reti interconnesse")!

Dettagli

Manuale d uso Apache OpenMeetings (Manuale Utente + Manuale Amministratore)

Manuale d uso Apache OpenMeetings (Manuale Utente + Manuale Amministratore) Manuale d uso Apache OpenMeetings (Manuale Utente + Manuale Amministratore) Autore: Matteo Veroni Email: matver87@gmail.com Sito web: matteoveroni@altervista.org Fonti consultate: http://openmeetings.apache.org/

Dettagli

Oggetto: INSEGNAMENTO/ APPRENDIMENTO DELLE LINGUE STRANIERE E DSA

Oggetto: INSEGNAMENTO/ APPRENDIMENTO DELLE LINGUE STRANIERE E DSA Oggetto: INSEGNAMENTO/ APPRENDIMENTO DELLE LINGUE STRANIERE E DSA PREMESSA A tutt oggi i documenti ufficiali a cui ogni docente di lingue straniere è chiamato a far riferimento nel suo lavoro quotidiano,

Dettagli

White Paper. Operational DashBoard. per una Business Intelligence. in real-time

White Paper. Operational DashBoard. per una Business Intelligence. in real-time White Paper Operational DashBoard per una Business Intelligence in real-time Settembre 2011 www.axiante.com A Paper Published by Axiante CAMBIARE LE TRADIZIONI C'è stato un tempo in cui la Business Intelligence

Dettagli

Anno di corso: 2004/2005. Istruzioni. Istruzioni per lo svolgimento dei progetti didattici. versione 1.1

Anno di corso: 2004/2005. Istruzioni. Istruzioni per lo svolgimento dei progetti didattici. versione 1.1 versione 1.1 per lo svolgimento dei progetti didattici Corso di Laboratorio di Programmazione II Prof. Luca Forlizzi Anno Accademico 2004-2005 GENERALITÀ...3 Scopo del documento...3 Struttura del documento...3

Dettagli

SIS Piemonte. Parlare del futuro, fare delle previsioni. Specializzata: Paola Barale. Supervisore di tirocinio: Anna Maria Crimi. a.a.

SIS Piemonte. Parlare del futuro, fare delle previsioni. Specializzata: Paola Barale. Supervisore di tirocinio: Anna Maria Crimi. a.a. SIS Piemonte Parlare del futuro, fare delle previsioni Specializzata: Paola Barale Supervisore di tirocinio: Anna Maria Crimi a.a. 2003-2004 1 1. Contesto Liceo linguistico, secondo anno 2. Livello A2

Dettagli

Pagine romane (I-XVIII) OK.qxd:romane.qxd 7-09-2009 16:23 Pagina VI. Indice

Pagine romane (I-XVIII) OK.qxd:romane.qxd 7-09-2009 16:23 Pagina VI. Indice Pagine romane (I-XVIII) OK.qxd:romane.qxd 7-09-2009 16:23 Pagina VI Prefazione Autori XIII XVII Capitolo 1 Sistemi informativi aziendali 1 1.1 Introduzione 1 1.2 Modello organizzativo 3 1.2.1 Sistemi informativi

Dettagli

Cross Software ltd Malta Pro.Sy.T Srl. Il gestionale come l'avete sempre sognato... Pag. 1

Cross Software ltd Malta Pro.Sy.T Srl. Il gestionale come l'avete sempre sognato... Pag. 1 Il gestionale come l'avete sempre sognato... Pag. 1 Le funzionalità di X-Cross La sofisticata tecnologia di CrossModel, oltre a permettere di lavorare in Internet come nel proprio ufficio e ad avere una

Dettagli

Le variabili. Olga Scotti

Le variabili. Olga Scotti Le variabili Olga Scotti Cos è una variabile Le variabili, in un linguaggio di programmazione, sono dei contenitori. Possono essere riempiti con un valore che poi può essere riletto oppure sostituito.

Dettagli

explora consulting s.r.l. Via Case Rosse, 35-84131 SALERNO - tel 089 848073 fax 089 384582 www.exploraconsulting.it info@exploraconsulting.

explora consulting s.r.l. Via Case Rosse, 35-84131 SALERNO - tel 089 848073 fax 089 384582 www.exploraconsulting.it info@exploraconsulting. explora consulting s.r.l. Via Case Rosse, 35-84131 SALERNO - tel 089 848073 fax 089 384582 www.exploraconsulting.it info@exploraconsulting.it Procedura di gestione per Laboratori di Analisi Cliniche Pag.

Dettagli

Lezione n 1! Introduzione"

Lezione n 1! Introduzione Lezione n 1! Introduzione" Corso sui linguaggi del web" Fondamentali del web" Fondamentali di una gestione FTP" Nomenclatura di base del linguaggio del web" Come funziona la rete internet?" Connessione"

Dettagli

Mini manuale di Audacity.

Mini manuale di Audacity. Mini manuale di Audacity. Questo mini manuale è parte del corso on-line Usare il software libero di Altrascuola. Il corso è erogato all'interno del portale per l'e-learning Altrascuola con la piattaforma

Dettagli

Didattiche con la LIM

Didattiche con la LIM Didattiche con la LIM Modelli e prospettive Luca Ferrari Dipartimento di Scienze dell Educazione, Università di Bologna Index 1. Scenario 2. Definizione e caratteristiche 3. Un modello didattico problematico

Dettagli

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Alessandro Rezzani Abstract L articolo descrive una delle tecniche di riduzione della dimensionalità del data set: il metodo dell analisi delle componenti principali (Principal

Dettagli

Corso SOL Gestione catalogo libro moderno 21-22 settembre 2009

Corso SOL Gestione catalogo libro moderno 21-22 settembre 2009 Corso SOL Gestione catalogo libro moderno 21-22 settembre 2009 Introduzione generale Autenticazione dell operatore https://sebina1.unife.it/sebinatest Al primo accesso ai servizi di Back Office, utilizzando

Dettagli

{formazione, elisabetta.oliveri, rossella.scaioli}@itc.cnr.it. antonietta.folino@unical.it

{formazione, elisabetta.oliveri, rossella.scaioli}@itc.cnr.it. antonietta.folino@unical.it Terminologia, lessici specialistici e strutture tassonomiche nel dominio dell efficienza energetica e dell applicazione di fonti rinnovabili agli usi finali civili Elisabetta Oliveri 1, Concetta Baroniello

Dettagli

RedDot Content Management Server Content Management Server Non sottovalutate il potenziale della comunicazione online: usatela! RedDot CMS vi permette di... Implementare, gestire ed estendere progetti

Dettagli

Quando A e B coincidono una coppia ordinata é determinata anche dalla loro posizione.

Quando A e B coincidono una coppia ordinata é determinata anche dalla loro posizione. Grafi ed Alberi Pag. /26 Grafi ed Alberi In questo capitolo richiameremo i principali concetti di due ADT che ricorreranno puntualmente nel corso della nostra trattazione: i grafi e gli alberi. Naturale

Dettagli

BPEL: Business Process Execution Language

BPEL: Business Process Execution Language Ingegneria dei processi aziendali BPEL: Business Process Execution Language Ghilardi Dario 753708 Manenti Andrea 755454 Docente: Prof. Ernesto Damiani BPEL - definizione Business Process Execution Language

Dettagli

FileMaker Server 13. Pubblicazione Web personalizzata con PHP

FileMaker Server 13. Pubblicazione Web personalizzata con PHP FileMaker Server 13 Pubblicazione Web personalizzata con PHP 2007-2013 FileMaker, Inc. Tutti i diritti riservati. FileMaker, Inc. 5201 Patrick Henry Drive Santa Clara, California 95054 Stati Uniti FileMaker

Dettagli

PROPOSTE SISTEMA DI CITIZEN RELATIONSHIP MANAGEMENT (CRM) REGIONALE

PROPOSTE SISTEMA DI CITIZEN RELATIONSHIP MANAGEMENT (CRM) REGIONALE PROPOSTE SISTEMA DI CITIZEN RELATIONSHIP MANAGEMENT (CRM) REGIONALE Versione 1.0 Via della Fisica 18/C Tel. 0971 476311 Fax 0971 476333 85100 POTENZA Via Castiglione,4 Tel. 051 7459619 Fax 051 7459619

Dettagli

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys.

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys. METODO DEI MINIMI QUADRATI GIUSEPPE GIUDICE Sommario Il metodo dei minimi quadrati è trattato in tutti i testi di statistica e di elaborazione dei dati sperimentali, ma non sempre col rigore necessario

Dettagli

Definizione e struttura della comunicazione

Definizione e struttura della comunicazione Definizione e struttura della comunicazione Sono state date molteplici definizioni della comunicazione; la più semplice e comprensiva è forse questa: passaggio di un'informazione da un emittente ad un

Dettagli