Opinion Analysis da Sorgenti Web

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Opinion Analysis da Sorgenti Web"

Transcript

1 Facoltà di Ingegneria Corso di Studi in Ingegneria Informatica Elaborato finale in Sistemi multimediali Opinion Analysis da Sorgenti Web Anno Accademico 2011/2012 Candidato: Mario Falanga matr. N

2

3 Indice Introduzione 5 Capitolo 1. Opinion Analysis Dal Web dei dati al Web degli utenti Web-Opinions: coordinate generali Cosa si intende per sentiment? 8 Capitolo 2. Stato dell arte Binary scores & Qualitative scores Adverbs and Adjectives scoring Unary AAC Binary AAC Assegnare un valore ad un AAC Valutare l opinione generale su un argomento all interno di un documento Sentiment Analyzer Feature Term Extraction Trattamento di un sentiment Sentiment Analysis 19 Capitolo 3. Oasys Architettura generale Scored Opinion-Expressing Word Bank Pseudo-Expected Value Word scoring Pseudo Standard-Deviation Adjective scoring Scoring documents Topic-Focused Algorithm Distance-Weighted topic focused Template-based Algorithm Hybrid Evaluation Method (HEM) Qualitative Adjective scoring Algorithm Implementazione e Prestazioni Precision Recall Performance 31 III

4 Capitolo 4. Conclusioni 32 Bibliografia 33 IV

5 Introduzione La continua diffusione sul web dei social network, forum e blog ha messo a disposizione una grande quantità di dati su cui ciascun utente può esprimere la propria opinione. Saper interpretare la qualità e la contestualità di questi dati è fondamentale per raccogliere informazioni sulle tendenze degli utenti; si possono in questo modo pianificare determinate strategie di marketing piuttosto che altre, migliorare le funzionalità di uno smartphone in base alle esigenze dei consumatori, monitorare il gradimento di una riforma, ecc. In questa tesi si mettono in luce tutti gli aspetti principali dell Opinion Analysis. Il capitolo 1 chiarisce il concetto di Opinion Analysis, mostrando l utilità delle tecniche a supporto, definisce la keyword sentiment e l importanza di una sua corretta classificazione. Il capitolo 2 è dedicato allo stato dell arte, ovvero alle tecniche utilizzate nell ambito dell estrazione, classificazione e associazione di un sentiment ad un documento. Si passa da un approccio binario (Binary Scoring), basato sulle sole due classi di giudizio positive & negative, ad una tecnica basata sull analisi della semantica di avverbi e aggettivi (Adverbs and Adjectives Scoring), passando per un sistema, il Sentiment Analyzer, che classifica prima il sentiment delle parole, poi quello delle frasi ed infine combina i risultati per valutare l opinione espressa da un documento su un certo argomento. Nel capitolo 3 si parla dell approccio, a mio avviso, più completo: OASYS, dove si propone un architettura in grado di assegnare sia sentiments numerici (quantitative scores) che non (qualitative scores), ottenendo ottimi risultati in termini di efficienza. 5

6 Capitolo 1 Opinion Analysis Il web è una gigantesca biblioteca che comprende informazioni di ogni genere, raccolte però in documenti che spesso risultano troppo dispersivi rispetto al reale obiettivo dell utente. Con l ampia gamma di fonti disponibili sul web e con la rapida diffusione di sistemi community-oriented, che promuovono contenuti generati dagli utenti, c è stato un interesse crescente sia commerciale che governativo riguardo il tentativo di analizzare automaticamente e monitorare la marea di atteggiamenti, pensieri e opinioni prevalenti su internet. 1.1 Dal Web dei dati al Web degli utenti L avvento del Web 1.0 ha portato alla creazione della realtà informatica che viviamo quotidianamente: news, musica e qualsiasi altro tipo di informazione è messa in digitale e resa disponibile in tutto il mondo. I vantaggio sono palesi : Facilità d uso; Scalabilità; Mercati globali alla portata di tutti; Gli utenti potevano usufruire di un numero sempre crescente di contenuti. Con il Web 2.0 si introduce quella componente detta human in the loop o interaction. 6

7 Ecco che l uomo entra nel ciclo sempre più prepotentemente: nascono così i social network, le community, i blog, ecc. 1.2 Web-Opinions: coordinate generali Il Web ha cambiato radicalmente il modo in cui i consumatori esprimono le loro opinioni. È possibile ora scrivere recensioni di prodotti, dove esprimere il proprio parere, su siti commerciali, forum e gruppi di discussione. Queste, dunque, rappresentano nuove fonti di informazione per il marketing. Ad esempio, una grande società informatica vuole poter valutare il tasso di gradimento dei suoi prodotti tramite i giudizi espressi dagli utenti su forum, blog e recensioni, oppure Apple potrebbe essere interessata all impatto dell iphone 5 nel mondo o ancora, il governo italiano vuole misurare l indice di gradimento della riforma sulle pensioni o su quella relativa alla riduzione dei fondi universitari. È chiaro, quindi, che ci sono numerosi domini applicativi in cui la capacità di comprendere opinioni espresse nei documenti diventa fondamentale. Supponiamo che un utente sia interessato all acquisto di una fotocamera digitale e che sia indeciso tra due tipologie; dunque, saranno di fondamentale importanza le documentazioni contenenti le opinioni sui due prodotti. Per un cliente potenziale, anche se è in grado di leggere tutti i commenti su prodotti diversi, spesso risulta più conveniente avere un confronto visivo delle opinioni dei consumatori sui due prodotti : (Figura 1: Confronto di due fotocamere digitali, Opinion Observer: Analyzing and Comparing Opinions on the web ) 7

8 È chiaro che gli strumenti a supporto dell opinion analysis sono diversi e attualmente in fase di sviluppo. È opportuno, quindi, individuare quelle informazioni chiave che consentono di estrarre valutazioni significative dai documenti in rete. In una prima approssimazione si può esprimere un opinione con un valore binario (ad es. 0 vuol dire bello e 1 significa brutto, riferito ad un film). Se però siamo interessati al giudizio della popolazione italiana sulla manovra Monti potremmo necessitare di un analisi qualitativa più che quantitativa (ad es. favorevole, neutrale, non favorevole). 1.3 Cosa si intende per sentiment? Tra la miriade di informazioni disponibili, dunque, diventa utile il sentimento, o opinione, che le persone esprimono nei confronti di un soggetto (un soggetto è un argomento di interesse o una caratteristica di un tema). Dunque, si prospetta non più una classificazione dei documenti per argomento ma per sentimento generale (ad es. se una recensione è positiva o negativa). Etichettare un articolo con il suo sentimento fornirebbe sintesi succinte ai lettori che hanno maggiori possibilità di trovare quindi risultati coerenti con i loro criteri di ricerca. Ci sono stati diversi studi riguardo l analisi automatica dei testi in termini di: Sentiment classifiers Affect analysis Automatic survey analysis Opinion Analysis Questi metodi tipicamente cercano di estrarre i principali sentimenti, sia positivi che negativi, impliciti in un documento. Gli aspetti più complessi della sentiment analysis sono due: in primo luogo, anche se il giudizio complessivo riguardo un argomento è utile, solo una parte dell informazione è di interesse, ad esempio se un utente è generalmente soddisfatto del proprio notebook, potrebbe essere insoddisfatto della durata della batteria o della capacità della RAM. Per i produttori, questi singoli punti di forza o debolezza sono importantissimi per valutare il 8

9 grado di soddisfazione del cliente. In secondo luogo, l associazione di un opinione (estratta) a un argomento specifico è difficile. Molti algoritmi di estrazione di sentimenti ottengono scarsi risultati relativamente a queste due problematiche; questi, infatti, risolvono i due punti precedenti assumendo, o che il tema del documento è noto a priori, oppure semplicemente associando un opinione ad un termine di un argomento appartenente allo stesso contesto. Tali approcci richiedono, però, un argomento specifico o un genere classificabile che è difficile da individuare; infatti, un documento può discutere di argomenti eterogenei e quindi può essere difficile da classificare univocamente. La classificazione dei sentiments è utile anche in business intelligence applications e recommender systems, dove utente e feedback potrebbero essere facilmente riassunti (user-feedback summary); in più, risposte libere a sondaggi fornite in linguaggio naturale potrebbero essere processate usando una categorizzazione dei sentimenti; inoltre, l estrazione dei sentimenti da un documento potrebbe essere utile anche in applicazioni per il message-filtering in cui si può utilizzare una determinata sentiment information per riconoscere ed eventualmente scartare notizie inutili ed effettuare la user-feedback summary detta in precedenza. Un aspetto molto stimolante dell opinion analysis è che, mentre gli argomenti sono spesso identificabili solo attraverso delle keywords, il sentimento può essere espresso in maniera più sottile perché richiede più comprensione rispetto ad una classificazione per argomento. In letteratura ci sono numerose tecniche per effettuare l opinion analysis, ovviamente le soluzioni migliori sono quelle seguite da organizzazioni sondaggistiche che sollecitano direttamente le persone a dare le loro opinioni, purtroppo si tratta di tecniche economicamente troppo costose. Un alternativa è quella di analizzare le opinioni espresse in varie tipologie di documenti come riviste cinematografiche, quotidiani, recensioni,ecc. 9

10 Capitolo 2 Stato dell arte In questa sezione vengono illustrate varie tecniche di opinion analysis condotte nel corso degli anni: dall associazione di valori binari ad un analisi qualitativa, dall interpretazione mediante avverbi (adverbs scoring) al sentiment analyzer (Jeonghee Yi, Tetsuya Nasukawa, Razvan Bunescu, Wayne Niblack, 2003) fino al più moderno OASYS (Carmine Cesarano, Bonnie Dorr, Antonio Picariello, Diego Reforgiato, Amelia Sagoff, V.S. Subrahmanian, 2005). 2.1 Binary scores & Qualitative scores In molti articoli un primo approccio all opinion analysis viene effettuato in termini binari, ovvero, come già anticipato prima, si valuta una recensione o un documento solo rispetto a due valori (ad es. positivo e negativo). Questo approccio è illustrato in Thumbs up? Sentiment Classification using machine learning techiniques (2002, Pang, Lee & Vaithyanathan). Tale lavoro prende in esame le riviste cinematografiche, sia per la grande varietà di documenti reperibili on-line, sia per la semplicità del dominio applicativo: la maggior parte dei recensori riassumono il loro giudizio generale con degli indicatori di valutazione machine-extractable (numero di stelle, numero di cerchi pieni o vuoti, valori numerici). 10

11 I valori estratti sono poi ricondotti a due sole categorie: positivo e negativo, talvolta neutrale; questo perché risulta più semplice per gli utenti distinguere recensioni negative da recensioni positive. Ovviamente, bisogna tenere conto che spesso i giudizi sono espressi in una forma più complessa ma, almeno per questo dominio applicativo, riconducibili ad aggettivi più semplici che consentono di utilizzare le sole classi positive & negative. Nel documento di riferimento è pubblicato un sondaggio fatto a due studenti cui viene chiesto di individuare degli indicatori per valutare un film come positivo o negativo. I risultati sono i seguenti : (Figura 2: Indicatori proposti dagli utenti) L accuracy è la percentuale di documenti classificati correttamente mentre per ties si intende la percentuale in cui i due sentiment sono giudicati equiprobabili. E chiaro che vorremmo la prima molto alta e il secondo molto basso ma, mentre per l accuracy i risultati possono essere soddisfacenti, lo stesso non si può dire per ties. Gli indicatori proposti dagli autori consentono di ottenere i seguenti risultati: (Figura 3: Indicatori proposti dal sistema) I risultati sono più soddisfacenti. Dunque, la soluzione proposta è quella di utilizzare tecniche corpus-based piuttosto che una moltitudine di aggettivi che non contribuiscono a dare un giudizio netto; in parole semplici si propone di utilizzare un linguaggio ristretto che sia il più rappresentativo possibile della varietà dei termini propria del dominio applicativo che si sta prendendo in 11

12 considerazione. Quindi, l obiettivo del lavoro è stato quello di valutare se è sufficiente utilizzare una sentiment classification basata sui soli valori positivo e negativo o se altre tecniche devono essere sviluppate. VANTAGGI algoritmi semplici; giudizi univoci; sentiment classification immediata. SVANTAGGI Il problema principale è che non tutti gli indicatori di giudizio possono essere ricondotti a due soli valori o comunque non tutti i domini di interesse possono essere valutati con i soli indicatori positivo e negativo. 2.2 Adverbs and Adjectives scoring Questo approccio è illustrato in Sentiment Analysis: adjectives and adverbs are better than adjectives alone (2007, Benamara, Cesarano, Picariello, Reforgiato, Subrahmanian). Viene proposta un tipo di analisi AAC-based (AAC: adverbs and adjectives combination) che usa una tecnica basata sulla semantica degli avverbi di grado; si definiscono quindi una serie di assiomi generali basati su una classificazione linguistica di tali avverbi in cinque categorie. L attenzione viene spostata da due sole categorie di giudizio ( positivo e negativo ) ad una scelta più ampia; in particolare, viene studiato come valutare l influenza che un avverbio ha su un determinato aggettivo mediante l assegnazione di un valore compreso tra 0 e 1: 0 vuol dire che l avverbio non ha alcuna influenza sull aggettivo; 1 vuol dire che l avverbio è strettamente collegato all aggettivo per esprimere un dato giudizio. La classificazione degli avverbi di grado è la seguente : 1. AFF (Avverbi di affermazione o certezza) : assolutamente, certamente, ecc.; 2. DOUBT (Avverbi di dubbio) possibilmente, apparentemente, forse, ecc.; 12

13 3. STRONG (Avverbi di forte intensificazione): estremamente, immensamente; 4. WEAK (Avverbi di debole intensificazione): poco, debolmente, leggermente; 5.0 NEG (Avverbi di negazione); 5.1 MIN (Minimizers, letteralmente minimizzatori ma si preferisce preservare l originalità del termine) : si tratta di avverbi che tendono a ridurre la positività di un affermazione che esprime un dato giudizio e quindi vi si assegna un valore negativo. Agli aggettivi, invece, si assegnano i valori tra -1 (massimo negativo) e +1 (massimo positivo). Esistono due titpi di combinazioni AAC : Unary AAC Binary AAC Unary AAC Sono espresse nella forma : <adverb> <adjective> esempi sono : il film è stato veramente bello, il cacao è poco dolce, ecc Sia f una funzione di tipo unary AAC che prende in ingresso una coppia avverbioaggettivo e fornisce in uscita un numero tra -1 e +1. Con sc(adv) e sc(adj) si vuole indicare, rispettivamente il valore assegnato ad un avverbio e ad un aggettivo. A seconda delle classi cui appartengono gli avverbi f deve soddisfare i seguenti assiomi: Per le categorie 1-3: a. Se sc(adj) > 0 & adv AFF STRONG, allora f (adv, adj) sc(adj); b. Se sc(adj) < 0 & adv AFF STRONG, allora f (adv, adj) sc(adj); Per la categoria 4: a. Se sc(adj) > 0 & adv WEAK, allora f(adv,adj) sc(adj); 13

14 b. Se sc(adj) < 0 & adv WEAK, allora f(adv,adj) sc(adj). Per la categoria 2: a. Se sc(adj) > 0, adv DOUBT & adv (AFF U STRONG ), allora f(adv,adj) f(adv,adj); b. Se sc(adj) < 0, adv DOUBT & adv (AFF U STRONG ), allora f(adv,adj) f(adv,adj). Per la categoria 5.1: a. Se sc(adj) > 0 & adv MIN, allora f(adv,adj) sc(adj); Binary AAC b. Se sc(adj) < 0 & adv MIN, allora f(adv,adj) sc(adj). Sono espresse nella forma : <adverb 1, adverb 2> <adjective>. Dove <adverb 1> può essere un avverbio di forte intensificazione o di dubbio e <adverb 2> può essere un avverbio di forte o debole intensificazione ( ad es. molto molto bene, possibilmente meno costoso ). Per queste associazioni si procede così: si calcola il valore di f(adv2,adj), questo consente di calcolare AAC1, cioè l associazione unaria AAC adv 2 adj. Applicando poi la funzione f alla coppia (adv1,aac1) si ottiene il risultato cercato Assegnare un valore ad un AAC Sono proposti tre algoritmi per quantificare numericamente un AAC e quindi classificare una certa opinione. Gli algoritmi sono mostrati per associazioni unarie ma si possono estendere anche ad AAC binarie come precedentemente descritto. 1. VARIABLE SCORING Se adv AFF U STRONG, allora : f (adv, adj) = sc(adj) + (1 sc(adj)) X sc(adv), se sc(adj) > 0, f (adv, adj) = sc(adj) (1 sc(adj)) X sc(adv), se sc(adj) < 0, Se adv WEAK U DOUBT, allora : f (adv, adj) = sc(adj) (1 sc(adj)) X sc(adv), se sc(adj) > 0, 14

15 f (adv, adj) = sc(adj) + (1 sc(adj)) X sc(adv), se sc(adj) < ADJECTIVE PRIORITY SCORING Si sceglie un peso r [0,1] che rappresenta quanto l avverbio modifica il significato dell aggettivo cui è associato. Più grande è r, maggiore è l influenza dell avverbio. Se adv AFF U STRONG, allora : f (adv, adj) = min (1, sc(adj) + r X sc(adv) ), se sc(adj) > 0, f (adv, adj) = min (1, sc(adj) - r X sc(adv) ), se sc(adj) < 0. Se adv WEAK U DOUBT, allora : f (adv, adj) = max (0, sc(adj) - r X sc(adv) ), se sc(adj) > 0, f (adv, adj) = max (0, sc(adj) + r X sc(adv) ), se sc(adj) < 0 3. ADVERB FIRST SCORING L algoritmo è simile a quello presentato in adjective priority scoring con la differenza che r si applica all aggettivo invece che all avverbio. Se adv AFF U STRONG, allora : f (adv, adj) = min (1, sc(adv) + r X sc(adj) ), se sc(adj) > 0, f (adv, adj) = max (0, sc(adv) - r X sc(adv) ), se sc(adj) < 0. Se adv WEAK U DOUBT, allora : f (adv, adj) = max (0, sc(adv) - r X sc(adj) ), se sc(adj) > 0, f (adv, adj) = min (1, sc(adv) + r X sc(adj) ), se sc(adj) < 0. ESEMPIO Prendiamo in esame la seguente affermazione : La tua macchina è veramente bella Veramente AFF ; sc(bella) = 0.8 ; sc(veramente) = 0.7 ; r =

16 Gli ultimi 3 punti sono valori di esempio calcolati su una media di 10 sondaggi. Variable Scoring f ( veramente, bella ) = ( ) X 0.7 = 0.94 Adjective Priority Scoring f ( veramente, bella ) = X 0.7 = 0.87 Adverb First Scoring f ( veramente, bella ) = X 0.8 = Valutare l opinione generale su un argomento all interno di un documento a) Sia t un certo argomento ; b) Sia d un documento inerente all argomento t ; c) Sia Rel(t) l insieme delle affermazioni in d che si riferiscono direttamente o indirettamente all argomento t ; d) Per ogni frase s in Rel(t), sia Appl+(s) (risp. Appl-(s)) l insieme delle AAC in s che sono positive (risp. negative) per l argomento t. La forza dell opinione espressa è data da: Strenght ( t, s ) = VANTAGGI Sono definite più calassi di giudizio rispetto all approccio binario; Efficienza. SVANTAGGI Difficoltà nell associare i valori numerici ottenuti alla semantica di un sentiment; Troppo vincolato alla sintassi del linguaggio. 16

17 2.3 Sentiment Analyzer Tale tecnica è presentata in Sentiment Analyzer: Extracting Sentiments about a Given Topic using Natural Language Processing Techniques (2003, Yi, Nasukawa, Bunescu, Niblack). Il Sentiment Analyzer (SA) ha il compito di estrarre opinioni da documenti sul web, ma invece di classificare il sentiment di un intero documento, esso : estrae le principali proprietà di un argomento; estrae un giudizio per ogni singola frase; crea un associazione tra l argomento e il sentiment. SA si articola in due fasi principali : 1) Feature Term Extraction; 2) Sentiment Analysis Feature Term Extraction Un feature term per un argomento è un termine che soddisfa una delle seguenti relazioni: Part of con un dato argomento (ad es. la batteria di un notebook, la RAM, il display, ecc.); Attribute-of con un dato argomento (ad es. peso, prezzo, ecc.); Attribute-of con una proprietà di un dato argomento (ad es. numero di pollici del display, durata della batteria, ecc,) Gli algoritmi utilizzati per effettuare la term extraction sono due: Mixture Model e Likelihood Test; si tratta di algoritmi molto complessi il cui trattamento esula dallo scopo di questa tesi, ci limitiamo a dire che il primo è basato sulla combinazione lineare del weblanguage e un topic-specific language, il secondo fa uso dei logaritmi Trattamento di un sentiment In questo articolo un sentiment è definito come quella componente che sposta un opinione dal suo stato neutro, cioè definisce la polarità di un giudizio su un dato soggetto, ad es. Il film è stato fantastico ha una polarità positiva (+), la macchina è troppo piccola per le 17

18 nostre esigenze ha polarità negativa (-). Si definisce target il soggetto cui è riferito il giudizio, nel nostro caso il film e la macchina. SA usa la semantica dei sentiment definita nel sentiment lexicon e i modelli di opinione definiti nel sentiment pattern database. a. SENTIMENT LEXICON Contiene regole del tipo : <lexical_entry> <POS> <sent_category> lexical entry è un termine che esprime un giudizio; POS (part-of-speech) sono delle sigle che identificano il lexical entry; (ad es. JJ per aggettivo, NN per sostantivo); sent_category (sentiment category) definisce la polarità del lexical_entry (+ oppure -). Un esempio è il seguente : bellissimo JJ +. b. SENTIMENT PATTERN DATABASE Un entry del database ha la seguente forma : <predicate> <sent_category> <target> predicate è in genere un verbo; sent_category espresso nella forma + - [ ] source source è un elemento della frase che trasferisce il sentiment al target, esso può essere un aggettivo, un complemento, una preposizione, ecc. Se viene specificato il simbolo [ ] allora al target viene assegnato il giudizio opposto del source. target è l elemento della frase cui è riferito il sentiment. 18

19 2.3.3 Sentiment Analysis Una prima fase preliminare consiste nell estrarre le frasi di interesse dai documenti esaminati; dopodiché si applica la sentiment analysis alle cosiddette Kernel sentences, cioè quelle frasi ritenute cruciali per l analisi e che tipicamente contengono solo un verbo o a frammenti di testo. SA estrae informazioni nella seguente forma : Per verbi che hanno una connotazione positiva o negativa : < target, verb, > Per i trans-verbs (quei verbi che non esprimono da soli un sentiment positivo o negativo come essere, offrire, ecc ) : < target, verb, source > In questi due casi si parla di T-expressions. Per frammenti di testo, si estrae la seguente: < adjective, target > In questo caso si parla di B-expressions. Esempio : 1) La macchina è troppo costosa L informazione estratta sarà : < Macchina, essere, troppo costosa > 2) Mi piace la macchina L informazione estratta sarà : < Macchina, piacere, >. 1) Sentiment Phrases and Sentiment Assignment A questo punto SA indentifica tutti quegli elementi di una frase che esprimono un sentiment distinguendo aggettivi, soggetto, oggetto e preposizioni : Aggettivi: si identificano tutti quegli aggettivi definiti nel sentiment lexicon Soggetto, oggetto e preposizioni: si effettua la Feature Term Extraction. Il sentiment di una frase è determinato, dunque, dal sentiment espresso dagli elementi estratti. 19

20 Ad es. bella macchina esprime un opinione positiva perché bella ha un sentiment positivo. 2) Sentiment Pattern Analysis Per ogni frase trovata al passo precedente, SA determina il target e la polarità finale del sentiment basandosi sul sentiment pattern database. In pratica si procede così: per prima cosa SA definisce la T-expression e cerca il pattern associato, dopodiché il target e l assegnazione del sentiment vengono determinati dal sentiment pattern. Esempio : Sono rimasto soddisfatto dalle prestazioni del mio nuovo PC T-expression: < prestazioni del PC, soddisfare, > Pattern: < impress > + PP ( preposition phrase dal ) Si evince che al target prestazioni del PC è associato un sentimento positivo. Per quanto riguarda l analisi relativa a frammenti di testo, SA crea le B-expressions e determina il sentiment espresso in baso al sentiment della frase. Esempio : Molte funzionalità per un cellulare B-expression: < molte, funzionalità > : (funzionalità, +) Si evince che il sentiment è positivo. 3) Analisi senza sentiment pattern Spesso un analisi basata su sentiment pattern non è possibile; alcuni casi sono i seguenti: Non ci sono pattern specifici disponibili nel sentiment database; La frase non è completa; Mancanza della punteggiatura, errori di ortografia, ecc. VANTAGGI Elevata precisione (86%, 91%) per documenti Web e articoli Elevata accuracy (90%, 93%) per documenti Web e articoli 20

21 SVANTAGGI Algoritmi molto complessi Spesso è difficile generare un concetto globale di sentiment estratto da un documento. 21

22 Capitolo 3 OASYS Oasys è introdotto nell articolo OASYS: an Opinion Analysis System (2005, Cesarano, Dorr, Picariello, Sagoff, Reforgiato, Subrahmanian). In questo documento vengono presentate metodologie che consentono di effettuare sia il quantitative che il qualitative scoring delle opinioni espresse in un documento su un determinato argomento. Viene proposta un architettura generale in cui la maggior parte degli algoritmi definiti in precedenza possono essere implementati; tale architettura è costituita da diverse parti che implementano funzioni di tipo multiple quantitative scoring. Vengono aggiunte altre classi, oltre alle solite positive e negative, basate sull intensity. Per esempio, cattivo e terribile sottolineano due differenti intensità di giudizio negativo ed è proprio queste variazione che OASYS vuole catturare. I principali aspetti di OASYS che lo distinguono dai precedenti algoritmi sono : classificazione non binaria dei sentiment; i valori da associare alle opinioni espresse in un documento sono continui, non binari; sviluppo di tecniche di tipo multiple quantitative & qualitative scoring; sviluppo di un modello che combina insieme tecniche di multiple scoring. 22

23 3.1 Architettura Generale Supponiamo che un utente voglia determinare le opinioni espresse in un documento D riguardo un argomento t. L architettura è costituita dai seguenti componenti : User specification: l utente specifica una serie di risorse (directories, dominio applicativo, URLs), un argomento t e un intervallo temporale di interesse. Web spider: è un programma progettato per analizzare i siti web ed estrarre dati utili: ha il compito di recuperare i documenti nelle apposite directory che sono rilevanti per l argomento t e che sono stati scritti o modificati durante l intervallo di tempo selezionato. Questi documenti determinano l insieme D. Scored opinion expressing word bank: si tratta di un insieme di parole che, direttamente o indirettamente, esprimono un opinione, cui vengono assegnati dei valori. Più basso è lo score, più è positiva la parola. Quantitative opinion analysis algorithms: si tratta di algoritmi che, per ogni documento d D, valutano la forza del sentiment rispetto all argomento t : il livello Scored opinion expressing word bank viene utilizzato per quantificare tale forza. Gli algoritmi proposti per assegnare un valore all opinione espressa sono divisi in tre famiglie, cui si aggiunge un hybrid algorithm che prende i risultati di ogni algoritmo e li combina per ottenere maggiore efficienza. Qualitative scoring module: il sistema può restituire sia il valore numerico del sentiment, sia un espressione qualitativa dell opinione. I valori qualitativi vengono ottenuti assegnando un aggettivo ai diversi intervalli numerici 3.2 Scored Opinion-Expressing Word Bank Viene creato selezionando un set di 100 documenti di prova che costituiscono, dunque, l insieme D. Ogni documento è stato letto da 16 persone ognuna delle quali gli ha assegnato un valore da 0 a 1: un valore alto identifica un documento molto critico, un valore basso ne identifica uno positivo. 23

24 DEFINIZIONI w è una parola del documento d. numb(w,d) tiene conto del numero di occorrenze della parola w, o di un sinonimo di w, in d. H{ h1,,hm} è un insieme di m utenti, ciascuno dei quali assegna un valore hi(d), non negativo, al documento d. (avsc^k)(d) è la media dei valori che si ottiene eliminando i primi e gli ultimi k valori dall insieme costituito dagli m valori hi(d) ordinati in ordine crescente. Esempio: Supponiamo che per un dato documento siano stati raccolti i seguenti valori: 0.6, 0.7, 0.1, 0.8, 0.9, 0.5, 0.7, 0.8, 0.6; ordinandola : 0.1, 0.5, 0.6, 0.6, 0.7, 0.7, 0.8, 0.8, 0.9; se k= 2, si ottiene la seguente lista: 0.6, 0.6, 0.7, 0.7, 0.8 la cui media è : 0,68. In sostanza k viene selezionato per eliminare i valori anomali, nel nostro esempio un utente ha selezionato uno score molto basso che sembra essere in contraddizione rispetto ai valori degli altri utenti. oew( d ) indica l insieme di tutte le parole o aggettivi che esprimono un opinione in d. oew( D ) indica l insieme di tutte le parole o aggettivi che esprimono un opinione in D. In generale esistono due tecniche per assegnare un valore ad una parola che esprime un opinione: Pseudo-Expected Value Word scoring; Pseudo Standard-Deviation Adjective scoring. 24

25 3.2.1 Pseudo-Expected Value Word scoring Si parte dalla seguente espressione: Essa determina il numero di occorrenze di una parola w in d rispetto al numero totale delle occorrenze di w in Dtest; l espressione denota cioè il numero relativo di comparse della parola w. Si assegna uno score alla parola in questo modo : Si noti che l espressione precedente ci fornisce una famiglia di tecniche che assegnano uno score al variare di k Pseudo Standard-Deviation Adjective scoring Si tratta di una tecnica basata sull uso della deviazione standard. Sia Dtest un insieme di documenti e H={h1,..,hm} una serie di utenti, ognuno dei quali assegna un valore hi(d) ad un documento. Sia μ la media di tutti i valori hi e sia σ la deviazione standard. Si definisce (sdsc^k)( d ) la media dell insieme {hi(d) abs(hi(d) μ) k σ}. In questo approccio, dunque, si comincia valutando gli scores assegnati ai documenti dagli utenti. Si calcolano media e deviazione standard di questi valori; dopodiché, si scartano quei contributi che differiscono dalla media per più di k-deviazioni standard e si calcola la media dei rimanenti valori. La formula per assegnare un valore ad una parola è la seguente: 25

26 3.3 Scoring documents In questo paragrafo vengono mostrati tre algoritmi per assegnare uno score ad un documento d in D, sulla base dei risultati trovati precedentemente. Gli algoritmi presentati sono i seguenti : Topic-Focused (TF^wsf) Algorithm; Distance-weighted topic focused (DWTF^wsf); Template-Based (TB^wsf) Algorithm Topic-Focused Algorithm L algoritmo cerca tutte le frasi che esprimono, direttamente o indirettamente, un opinione riguardo l argomento t di interesse. Si assegna, poi, un valore wsf( s ) ad ogni frase s sommando gli scores di tutte le parole w,che esprimono un opinione, e che compaiono in s. L algoritmo restituisce il valore medio degli scores di tutte le frasi. Ovviamente i risultati saranno differenti a seconda dell algoritmo di words scoring usato. Pseudocodice : 26

27 3.3.2 Distance-Weighted topic focused L algoritmo esamina tutte le frasi in un documento e vi assegna un valore iniziale (ad es. la media degli scores degli aggettivi nella frase oppure la somma). Si divide, poi, il documento in due insiemi OpinionS e NotOpinionS, il primo contiene le frasi che esprimono un opinione sull atgomento t, il secondo le frasi che non esprimono sentiments. Per ogni s OpinionS e per ogni sn NotOpinionS, si trova la distanza tra le frasi e la si moltiplica per una costante β 1, scelta a piacere. Si moltiplica, quindi, il valore assegnato alla frase sn per e^ (-β* Distance( s, sn)) che attenua l influenza di sn su s. L algoritmo è questo: 27

28 3.3.3 Template-based Algorithm L algoritmo fa uso di una serie di modelli ed esamina solo le frasi che rispettano quel template; in particolare, esso analizza solo quelle frasi che esprimono il parere di qualcuno che non sia l'autore del documento. L approccio è simile al Distance-weighted topic focused : Hybrid Evaluation Method (HEM) HEM ha accesso ad un ampio corpus di documenti (Dtest) valutati da diverse persone con una scala numerica arbitraria. Ogni documento nel corpus è associato ad un vettore di lunghezza m con i valori delle valutazioni delle m persone. Supponiamo di utilizzare uno dei tre metodi precedentemente illustrati per assegnare degli scores ad un documento, ad es s1,s2,s3,s4. In questo caso assoceremo al documento d il vettore (s1,s2,s3,s4).si itera il procedimento per tutti i documenti in Dtest. L algoritmo cerca, poi, gli r-vettori più vicini al vettore di partenza associato al documento d per un certo intero r> 0.Il valore restituito per il documento d è la media degli scores assegnati ai vari documenti valutati : 28

29 3.4 Qualitative Adjective scoring Algorithm Tutti gli algoritmi appena illustrati mostrano un approccio quantitativo alla valutazione di un sentiment, in questo paragrafo si vuole dimostrare come ottenere invece dei risultati di tipo qualitativo per la valutazione di un documento. L algoritmo di QualScore utilizza una scala di valutazione qualitativa costituita da una serie di aggettivi a1,a2,.an disposti in ordine decrescente di positività di giudizio (ad es. positivo, duro, terribile,ecc ) cui si associano dei range di score numerici. Ad es. usando i valori 0.4 e 0.7 si può valutare un documento come positivo se lo score è compreso tra 0 e 0.4,duro se compreso tra 0.4 e 0.7, terribile se maggiore di

30 3.5 Implementazione e Prestazioni Il linguaggio Java è stato usato per implementare le user specifications, il web spider e gli algoritmi per assegnare uno score ad un documento. Oracle è usato per memorizzare e indicizzare nuovi articoli. Il sistema viene eseguito su un server Pentium IV a 3 GHZ con Windows 2003 di 1 GB di RAM. Lo Scored Opinion Expressing Word Bank è costituito da un insieme di 352 articoli riguardo 12 argomenti affrontati da diverse riviste americane. 100 articoli sono stati poi valutati da 16 studenti per creare il word bank. Gli algoritmi sono applicati a dei weblogs Precision Per ogni documento i e argomento j, si confronta il risultato ottenuto mediante l hybrid algorithm ( hybrid(d ij) ) e la media delle valutazione degli studenti ( user(d ij)). Si definisce Acceptedδ, l insieme: che rappresenta il set di tutti quei documenti per cui i valori ottenuti con i due approcci (hybrid e user) sono abbastanza vicini. Definiamo, dunque, la precisione come : con n numero totale dei documenti. (Figura 4 :andamento della precisione al variare di δ, Oasys: An Opinion Analysis System ) 30

31 3.5.2 Recall Per misurare la recall, si suddivide l intervallo [0,1] in tanti sotto intervalli. Per ogni intervallo int, sia Retr(int) l insieme dei documenti classificati dal sistema, il cui valore ricade all interno di int. Sia User(int) l insieme dei documenti classificati dagli utenti il cui valore cade in int. Ridefiniamo l insieme Acceptedδ: Acceptedδ(int) = {d ij : Hybrid(d ij)-user(d ij) <δ con d ij Retr(int) } Si definisce la recall così: I risultati sono i seguenti : (Figura 5: Recall) Performance Il sistema impiega un secondo per ogni weblog per calcolare il vettore contenente gli scores e per assegnare il risultato al weblog con l hybrid algorithm. ( (Figura 6: Performance) 31

32 Capitolo 4 Conclusioni Questo lavoro mostra diverse tecniche per classificare il giudizio espresso da un documento, ciascuna con i suoi vantaggi e svantaggi. L approccio che, però, risulta essere il migliore sia in termini di efficienza, sia in termini di scalabilità e semplicità, è quello mostrato nel capitolo 3: OASYS. In OASYS ci si concentra sull intensità di un opinione che un documento esprime riguardo un certo argomento. Si mostra un architettura che implementa differenti funzioni che consentono di assegnare uno score ad un documento mediante l uso di algoritmi, che automatizzano il processo, ma anche usando il giudizio delle persone; ciò contribuisce a non avere risultati troppo distanti dalla realtà. Quindi, OASYS consente di effettuare un analisi quantitativa più precisa rispetto all approccio binario e al Sentiment Analyzer e consente di associare direttamente ai valori numerici dei risultati di tipo qualitativo (qualitative scoring). Inoltre, rispetto all Adverb Scoring non si è strettamente legati alla sintassi della lingua. 32

33 Bibliografia [1] Carmine Cesarano, Bonnie Dorr, Antonio Picariello, Diego Reforgiato, Amelia Sagoff, V.S. Subrahmanian, 2005 OASYS: An Opinion Analysis System. [2] Farah Benamara, Carmine Cesarano, Antonio Picariello, Diego Reforgiato, 2007 Sentiment Analysis: Adjectives and Adverbs are better than Adjectives Alone. [3] Yohei Seki, David Kirk Evans, Lun-Wei Ku, Hsin-Hsi Chen, Noriko Kando, Chin- Yew Lin, 2007 Overview of Opinion Analysis Pilot Task at NTCIR-6. [4] Bing Liu, Minqing Hu, Junsheng Cheng, 2005 Opinion Observer: Analyzing and Comparing Opinions on the Web. [5] Bo Pang, Lillian Lee, Shivakumar Vaithyanathan, 2002 Thumbs up? Sentiment Classification using Machine Learning Techniques. [6] Lun-Wei Ku, Yu-Ting Liang, Hsin-His Chen, 2006 Opinion Extraction, Summarization and Tracking in News and Blog Corpora. [7] Jeonghee Yi, Tetsuya Nasukawa, Razvan Bunescu, Wayne Niblack, 2003 Sentiment Analyzer. [8] Carmine Cesarano, Antonio Picariello, Diego Reforgiato, V.S. Subrahmanian, 2007 The OASYS 2.0 Opinion Analysis System: A Demo. [9] Salvetti, Lewis, Reichenbach, C Automatic opinion polarity classification of movie reviews colorado research in linguistics. [10] Deerwester, Dumais, Landauer, Furnas, Harshman, 1990 Indexing by latent semantic analysis, journal of the american society of information science. 33

Introduzione alla Business Intelligence

Introduzione alla Business Intelligence SOMMARIO 1. DEFINIZIONE DI BUSINESS INTELLIGENCE...3 2. FINALITA DELLA BUSINESS INTELLIGENCE...4 3. DESTINATARI DELLA BUSINESS INTELLIGENCE...5 4. GLOSSARIO...7 BIM 3.1 Introduzione alla Pag. 2/ 9 1.DEFINIZIONE

Dettagli

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence Introduzione Definizione di Business Intelligence: insieme di processi per raccogliere

Dettagli

Informatica per le discipline umanistiche 2 lezione 12

Informatica per le discipline umanistiche 2 lezione 12 Informatica per le discipline umanistiche 2 lezione 12 Nella lezione precedente: In realtà non tutto il data mining è dettato dagli interessi economici (commercial) data mining Abbiamo visto risvolti commerciali

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testuali Il text mining: una definizione Data mining per dati destrutturati ovvero documenti codificati in linguaggio

Dettagli

ACRL Association of College and Research Libraries

ACRL Association of College and Research Libraries ACRL Association of College and Research Libraries Standard delle competenze per il possesso dell informazione (information literacy) nell educazione superiore Standard, indicatori di performance, obiettivi

Dettagli

WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence

WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence 1 WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence WOSM è un sistema di media monitoring unico al mondo. Restituisce percorsi di lettura dei dati trasversali, fruibili,

Dettagli

Intelligenza Artificiale

Intelligenza Artificiale Intelligenza Artificiale Anno accademico 2008-2009 Information Retrieval: Text Categorization Una definizione formale Sia D il dominio dei documenti Sia C = {c 1,,c C } un insieme di categorie predefinite

Dettagli

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO -

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - 1 CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - Corsi di Laurea in Informatica, Ing. Informatica, Ing. di Internet (a.a. 2015-2016) Roberto Basili 2 Overview WM&R: Motivazioni e prospettive

Dettagli

Mining Positive and Negative Association Rules:

Mining Positive and Negative Association Rules: Mining Positive and Negative Association Rules: An Approach for Confined Rules Alessandro Boca Alessandro Cislaghi Premesse Le regole di associazione positive considerano solo gli item coinvolti in una

Dettagli

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Concetti preliminari: struttura del dataset negli

Dettagli

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO -

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - 1 CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - Corsi di Laurea in Informatica, Ing. Informatica, Ing. di Internet (a.a. 2013-2014) Roberto Basili 2 Overview WM&R: Motivazioni e prospettive

Dettagli

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,

Dettagli

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria sede di Modena Corso di Laurea VOD in Ingegneria Informatica

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria sede di Modena Corso di Laurea VOD in Ingegneria Informatica Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria sede di Modena Corso di Laurea VOD in Ingegneria Informatica PROGETTO E REALIZZAZIONE DELL ALGORITMO DI ANNOTAZIONE AUTOMATICA TUCUXI

Dettagli

Corso di Laurea Ingegneria Informatica Fondamenti di Informatica

Corso di Laurea Ingegneria Informatica Fondamenti di Informatica Corso di Laurea Ingegneria Informatica Fondamenti di Informatica Dispensa 05 La rappresentazione dell informazione Carla Limongelli Ottobre 2011 http://www.dia.uniroma3.it/~java/fondinf/ La rappresentazione

Dettagli

Introduzione. Il principio di localizzazione... 2 Organizzazioni delle memorie cache... 4 Gestione delle scritture in una cache...

Introduzione. Il principio di localizzazione... 2 Organizzazioni delle memorie cache... 4 Gestione delle scritture in una cache... Appunti di Calcolatori Elettronici Concetti generali sulla memoria cache Introduzione... 1 Il principio di localizzazione... 2 Organizzazioni delle memorie cache... 4 Gestione delle scritture in una cache...

Dettagli

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria).

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria). Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria). Aprile 20 Indice Serie numeriche. Serie convergenti, divergenti, indeterminate.....................

Dettagli

Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF

Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF Maria Grazia Pepe - Elisabetta Viti (Biblioteca nazionale centrale di Firenze) 6. Incontro ISKO Italia Firenze 20 maggio 2013 SOMMARIO

Dettagli

Rappresentazione e Memorizzazione dei Dati

Rappresentazione e Memorizzazione dei Dati Rappresentazione e Memorizzazione dei Dati Giuseppe Nicosia CdL in Matematica (Laurea Triennale) Facoltà di Scienze MM.FF.NN. Università di Catania Bit e loro Memorizzazione Definizioni Algoritmo: una

Dettagli

Algoritmi di scheduling - Parte 2

Algoritmi di scheduling - Parte 2 Algoritmi di scheduling - Parte 2 Automazione I 12/11/2013 Vincenzo Suraci STRUTTURA DEL NUCLEO TEMATICO ALGORITMO DEADLINE MONOTONIC PRIORITY ORDERING (DMPO) ALGORITMO TIMELINE SCHEDULING (TS) SCHEDULING

Dettagli

Corso di Calcolo Numerico

Corso di Calcolo Numerico Corso di Calcolo Numerico Dott.ssa M.C. De Bonis Università degli Studi della Basilicata, Potenza Facoltà di Ingegneria Corso di Laurea in Ingegneria Meccanica Sistemi di Numerazione Sistema decimale La

Dettagli

QUADRO DI RIFERIMENTO COMPETENZA LINGUISTICA LINGUA MADRE (ITALIANO) Esame di Qualifica Professionale

QUADRO DI RIFERIMENTO COMPETENZA LINGUISTICA LINGUA MADRE (ITALIANO) Esame di Qualifica Professionale QUADRO DI RIFERIMENTO COMPETENZA LINGUISTICA LINGUA MADRE (ITALIANO) Esame di Qualifica Professionale Esame di Diploma Professionale I riferimenti per la costruzione delle prove sono: lo Standard Formativo

Dettagli

WebRatio. L altra strada per il BPM. Web Models s.r.l. www.webratio.com contact@webratio.com 1 / 8

WebRatio. L altra strada per il BPM. Web Models s.r.l. www.webratio.com contact@webratio.com 1 / 8 WebRatio L altra strada per il BPM Web Models s.r.l. www.webratio.com contact@webratio.com 1 / 8 Il BPM Il BPM (Business Process Management) non è solo una tecnologia, ma più a grandi linee una disciplina

Dettagli

Moodle è un prodotto open source che realizza una piattaforma software di e-learning.

Moodle è un prodotto open source che realizza una piattaforma software di e-learning. Manuale sintetico Moodle è un prodotto open source che realizza una piattaforma software di e-learning. Moodle fornisce un supporto all attività didattica attraverso una serie di strumenti molto ampia

Dettagli

Fondamenti di Informatica 7. Linguaggi di programmazione

Fondamenti di Informatica 7. Linguaggi di programmazione I linguaggi di alto livello Fondamenti di Informatica 7. Linguaggi di programmazione Introduzione alla programmazione Caratteristiche dei linguaggi di programmazione I linguaggi di programmazione di alto

Dettagli

Breve descrizione del prodotto

Breve descrizione del prodotto Breve descrizione del prodotto 1. Il software AquaBrowser Library...2 1.1 Le funzioni di Search Discover Refine...3 1.2 Search: la funzione di ricerca e di presentazione dei risultati...3 1.2.1 La configurazione

Dettagli

Uno sguardo a Lucene. Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011

Uno sguardo a Lucene. Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011 Uno sguardo a Lucene Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011 Outline Uno sguardo a Lucene Descrizione delle principali caratteristiche Realizzazione di un semplice

Dettagli

La gestione del documento

La gestione del documento Operatore giuridico d impresa Informatica Giuridica A.A 2002/2003 II Semestre La gestione del documento prof. Monica Palmirani Il documento A differenza del dato il documento è solitamente un oggetto non

Dettagli

Venexia. Fammi la tua domanda...

Venexia. Fammi la tua domanda... Venexia Fammi la tua domanda... Venexia chi sei? Risposta: Io sono Venexia e appartengo alla settima generazione d intelligenze artificiali sviluppate dagli ilabs. Domande collegate: puoi raccontarmi la

Dettagli

Introduzione all Information Retrieval

Introduzione all Information Retrieval Corso di Web Mining & Retrieval Introduzione all Information Retrieval (a.a. 2008-2009) Roberto Basili 1 Outline Accesso e Ricerca delle informazioni distribuite Il processo di base dell IR Rilevanza Applicazioni

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

Introduzione. è uguale a 0, spostamento di dati da una parte della memoria del calcolatore ad un altra.

Introduzione. è uguale a 0, spostamento di dati da una parte della memoria del calcolatore ad un altra. Appunti di Calcolatori Elettronici Modello di macchina multilivello Introduzione... 1 Linguaggi, livelli e macchine virtuali... 3 La struttura a livelli delle macchine odierne... 4 Evoluzione delle macchine

Dettagli

Tecnico Superiore per la filiera delle nuove produzioni vegetali e florovivaistiche

Tecnico Superiore per la filiera delle nuove produzioni vegetali e florovivaistiche Fondazione Minoprio - corso ITS Tecnico Superiore per la filiera delle nuove produzioni vegetali e florovivaistiche I social media Facebook La maggior parte dei proprietari di piccole aziende hanno dichiarato

Dettagli

Il guadagno informativo negli alberi decisionali: un nuovo approccio

Il guadagno informativo negli alberi decisionali: un nuovo approccio Il guadagno informativo negli alberi decisionali: un nuovo approccio Sommario Descrizione del problema... 2 Il guadagno informativo di Nanni... 3 Il software Weka... 3 Cos è Weka... 3 Il guadagno Informativo

Dettagli

Analisi delle opinioni dei clienti in ambito automotive: due casi studio

Analisi delle opinioni dei clienti in ambito automotive: due casi studio Analisi delle opinioni dei clienti in ambito automotive: due casi studio Negli ultimi anni le decisioni strategiche o di business di un azienda si affidano sempre più alla tecnologia: nuovi strumenti di

Dettagli

@Giusi Castagnetta tutti i diritti riservati. Seo e contenuti video

@Giusi Castagnetta tutti i diritti riservati. Seo e contenuti video @Giusi Castagnetta tutti i diritti riservati Seo e contenuti video SEO facile Quando cerchiamo qualcosa sui motori di ricerca, ci aspettiamo di trovare per primi i risultati migliori, cioè quelli più pertinenti

Dettagli

Misurazione e scale attitudinali

Misurazione e scale attitudinali Misurazione e scale attitudinali 1. Il problema della misurazione nelle ricerche di mercato La ricerca di mercato richiede una o più misurazioni funzionali all oggetto di studio, come ad esempio la probabilità

Dettagli

Il Software che muove le tue Idee Web Reputation

Il Software che muove le tue Idee Web Reputation Il Software che muove le tue Idee Web Reputation Dove Analisi Web Reputation Ti sei mai chiesto cosa dice di te il web? Dove.. Siti, Blog, Google news, News, Hai mai provato a ricercare su google il tuo

Dettagli

COMUNICARE LA CITTÀ COME DESTINAZIONE TURISTICA CULTURALE. UN METODO PER VALUTARE LA QUALITÀ. Luisa Mich, Nicola Zeni

COMUNICARE LA CITTÀ COME DESTINAZIONE TURISTICA CULTURALE. UN METODO PER VALUTARE LA QUALITÀ. Luisa Mich, Nicola Zeni COMUNICARE LA CITTÀ COME DESTINAZIONE TURISTICA CULTURALE. UN METODO PER VALUTARE LA QUALITÀ DELLA COMUNICAZIONE ONLINE Luisa Mich, Nicola Zeni Schema [Il problema] L efficacia della comunicazione [L approccio]

Dettagli

Analisi ed Estrazione di Informazioni da un Account Email a beneficio delle Imprese

Analisi ed Estrazione di Informazioni da un Account Email a beneficio delle Imprese Analisi ed Estrazione di Informazioni da un Account Email a beneficio delle Imprese Matteo Renzi Relatore: Prof.ssa Sonia Bergamaschi Correlatore: Jim Spohrer 1 Problema numero medio di email scambiate

Dettagli

Un Blog chiuso come strumento di comunicazione interna in un gruppo di lavoro

Un Blog chiuso come strumento di comunicazione interna in un gruppo di lavoro Un Blog chiuso come strumento di comunicazione interna in un gruppo di lavoro Paolo Ferrario Nelle organizzazioni di servizio si tengono con frequenza incontri di lavoro, seminari di formazione, riunioni

Dettagli

ONLINE BRAND REPUTATION MSC CROCIERE

ONLINE BRAND REPUTATION MSC CROCIERE ONLINE BRAND REPUTATION MSC CROCIERE SOMMARIO 1. ANALISI PRELIMINARE FONTI E OUTLOOK GENERALE... 3 2. ANALISI QUANTITATIVA... 5 2.1 DEFINIZIONE DEI CLUSTER... 5 2.2 DISTRIBUZIONE DEI CLUSTER PER BRAND...

Dettagli

Il questionario. Claudio Pizzi Dipartimento di Economia Università Ca Foscari Venezia

Il questionario. Claudio Pizzi Dipartimento di Economia Università Ca Foscari Venezia Il questionario Claudio Pizzi Dipartimento di Economia Università Ca Foscari Venezia 1 Il questionario Il questionario è uno strumento per la rilevazione delle informazioni attraverso un piano strutturato

Dettagli

information online: Unintended retrieval of complementary

information online: Unintended retrieval of complementary Searching for cancer-related related information online: Unintended retrieval of complementary and alternative medicine information Muhammad Walji, Smitha Sagaram, Funda Meric-Bernstam, Craig W.Johnson,

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

Tecniche di DM: Link analysis e Association discovery

Tecniche di DM: Link analysis e Association discovery Tecniche di DM: Link analysis e Association discovery Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Architettura di un generico algoritmo di DM. 2 2 Regole di associazione:

Dettagli

Corso di Informatica di Base. Laboratorio 2

Corso di Informatica di Base. Laboratorio 2 Corso di Informatica di Base Laboratorio 2 Motori di Ricerca Sara Casolari Cercare nel posto giusto Andare in posti noti Esempio: per reperire informazioni sui contributi pensionistici chiediamo all INPS

Dettagli

Iniziativa Comunitaria Equal II Fase IT G2 CAM - 017 Futuro Remoto. Strumenti di Valutazione di un Prodotto Finanziario

Iniziativa Comunitaria Equal II Fase IT G2 CAM - 017 Futuro Remoto. Strumenti di Valutazione di un Prodotto Finanziario AREA FINANZA DISPENSA FINANZA Iniziativa Comunitaria Equal II Fase IT G2 CAM - 017 Futuro Remoto Strumenti di Valutazione di un Prodotto Finanziario ORGANISMO BILATERALE PER LA FORMAZIONE IN CAMPANIA Strumenti

Dettagli

ITALIANO: competenza 1 - TERZO BIENNIO. classe V scuola primaria e classe I scuola secondaria COMPETENZE ABILITA CONOSCENZE

ITALIANO: competenza 1 - TERZO BIENNIO. classe V scuola primaria e classe I scuola secondaria COMPETENZE ABILITA CONOSCENZE ITALIANO: competenza 1 - TERZO BIENNIO classe V scuola primaria e classe I scuola secondaria COMPETENZE ABILITA CONOSCENZE Interagire e comunicare verbalmente in contesti di diversa natura Quando ascolta,

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

4, 5 ANNO DELLA SCUOLA PRIMARIA

4, 5 ANNO DELLA SCUOLA PRIMARIA ASCOLTO E PARLATO Intervenire nel dialogo e nella conversazione in modo pertinente. Interagire nello scambio comunicativo formulando domande e risposte adeguate al contesto. Esprimere il proprio punto

Dettagli

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 5 Tecniche OCR Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com http://www.onairweb.com/corsopr

Dettagli

La ricerca estensiva Perché?

La ricerca estensiva Perché? RICERCA ESTENSIVA La ricerca estensiva Perché? Per misurare e validare in termini estensivi la percezione e decodifica da parte dei soggetti destinatari; ma anche per segmentarli in modo appropriato Per

Dettagli

PROGETTAZIONE CORSO DI STUDIO (materia: ITALIANO; classe 3^)

PROGETTAZIONE CORSO DI STUDIO (materia: ITALIANO; classe 3^) Ministero dell Istruzione, dell Università e della Ricerca Istituto Comprensivo Statale di Calolziocorte Via F. Nullo,6 23801 CALOLZIOCORTE (LC) e.mail: lcic823002@istruzione.it - Tel: 0341/642405/630636

Dettagli

Sommario. Opinion Mining. Introduzione. Introduzione (cont d) Introduzione. Task: Determinare l orientamento dei termini

Sommario. Opinion Mining. Introduzione. Introduzione (cont d) Introduzione. Task: Determinare l orientamento dei termini Introduzione Sommario Opinion Mining Stefano Baccianella Task: Determinare l orientamento dei Task: Determinare la soggettività dei Proposte di soluzione al problema Università di Pisa - A.A. 2006/2007

Dettagli

Algoritmi e Strutture Dati

Algoritmi e Strutture Dati schifano@fe.infn.it Laurea di Informatica - Università di Ferrara 2011-2012 [1] Strutture dati Dinamiche: Le liste Una lista è una sequenza di elementi di un certo tipo in cui è possibile aggiungere e/o

Dettagli

ITI Galilei Salerno Corso Database ed SQL

ITI Galilei Salerno Corso Database ed SQL ITI Galilei Salerno Corso Database ed SQL prof Carmine Napoli Introduzione Database: Si definisce Database un insieme di dati, di solito di notevoli dimensioni, raccolti, memorizzati ed organizzai in modo

Dettagli

SEO: le fondamenta del marketing digitale

SEO: le fondamenta del marketing digitale SEO: le fondamenta del marketing digitale e-book a cura di Andrea Roversi, Note introduttive Alleghiamo in questo e-book alcuni principi guida legati al SEO (Search Engine Optimization). Lo sviluppo accurato

Dettagli

Data Mining e Analisi dei Dati

Data Mining e Analisi dei Dati e Analisi dei Dati Rosaria Lombardo Dipartimento di Economia, Seconda Università di Napoli La scienza che estrae utili informazioni da grandi databases è conosciuta come E una disciplina nuova che interseca

Dettagli

Ingegneria del Software Interattivo. - Oltre l esperimento - Parte quarta: L usabilità. L osservazione nell ingegneria dell usabilità

Ingegneria del Software Interattivo. - Oltre l esperimento - Parte quarta: L usabilità. L osservazione nell ingegneria dell usabilità Ingegneria del Software Interattivo - Oltre l esperimento - Docente: Daniela Fogli Parte quarta: L usabilità 1. L ingegneria dell usabilità 2. I metodi di valutazione di usabilità dei sistemi interattivi

Dettagli

ONLINE BRAND REPUTATION SETTORE RISTORAZIONE

ONLINE BRAND REPUTATION SETTORE RISTORAZIONE ONLINE BRAND REPUTATION SETTORE RISTORAZIONE SOMMARIO 1. ANALISI PRELIMINARE PANEL DI OSSERVAZIONE, FONTI, PRIME EVIDENZE... 3 2. ANALISI QUALITATIVA... 4 3. FOCUS ROADHOUSE GRILL... 6 3.1 Roadhouse Grill

Dettagli

FONDAMENTI di INFORMATICA Prof. Lorenzo Mezzalira

FONDAMENTI di INFORMATICA Prof. Lorenzo Mezzalira FONDAMENTI di INFORMATICA Prof. Lorenzo Mezzalira Appunti del corso 1 Introduzione all informatica: algoritmi, linguaggi e programmi Indice 1. Introduzione 2. Risoluzione automatica di problemi - Algoritmi

Dettagli

Descrittori per i contorni: lunghezza, orientazione, del segmento congiungente punti estremi, numero di concavità

Descrittori per i contorni: lunghezza, orientazione, del segmento congiungente punti estremi, numero di concavità Texture analysis Introduzione Una regione di una immagine può essere rappresentata mediante le sue caratteristiche esterne i contorni Descrittori per i contorni: lunghezza, orientazione, del segmento congiungente

Dettagli

1. Spiegare le differenze fra le seguenti modalità di binding degli indirizzi:

1. Spiegare le differenze fra le seguenti modalità di binding degli indirizzi: 1. Spiegare le differenze fra le seguenti modalità di binding degli indirizzi: compile time, load time, execution time. Quale delle modalità precedenti necessita di un supporto hardware per poter essere

Dettagli

Automatic Text Processing

Automatic Text Processing Automatic Text Processing Ing. Leonardo Rigutini Dipartimento di Ingegneria dell Informazione Università di Siena Via Roma 53 53100 SIENA ITALY rigutini@dii.unisi.it Outlines L era dell informazione Information

Dettagli

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire La società Volocom Trasformare le informazioni in conoscenza 2 La società Volo.com dal 2001 è uno dei leader nei settori del Knowledge Management e nella gestione delle informazioni per la rassegna stampa

Dettagli

Introduzione alla scienza della comunicazione (E. T. Jaynes)

Introduzione alla scienza della comunicazione (E. T. Jaynes) Introduzione alla scienza della comunicazione (E T Jaynes) S Bonaccorsi Department of Mathematics University of Trento Corso di Mathematical model for the Physical, Natural and Social Sciences Outline

Dettagli

PIANO DI STUDIO PERSONALIZZATO CLASSI SECONDE E TERZE PRIMO BIENNIO

PIANO DI STUDIO PERSONALIZZATO CLASSI SECONDE E TERZE PRIMO BIENNIO PIANO DI STUDIO PERSONALIZZATO CLASSI SECONDE E TERZE PRIMO BIENNIO ITALIANO INDICATORE DISCIPLINARE Sviluppare le abilità di base come l ascoltare, il parlare, il leggere e lo scrivere per maturare padronanza

Dettagli

Interpretazione astratta

Interpretazione astratta Interpretazione astratta By Giulia Costantini (819048) e Giuseppe Maggiore (819050) Contents Interpretazione astratta... 2 Idea generale... 2 Esempio di semantica... 2 Semantica concreta... 2 Semantica

Dettagli

Indicizzazione terza parte e modello booleano

Indicizzazione terza parte e modello booleano Reperimento dell informazione (IR) - aa 2014-2015 Indicizzazione terza parte e modello booleano Gruppo di ricerca su Sistemi di Gestione delle Informazioni (IMS) Dipartimento di Ingegneria dell Informazione

Dettagli

Analisi e catalogazione automatica dei Curriculum Vitae

Analisi e catalogazione automatica dei Curriculum Vitae Analisi e catalogazione automatica dei Curriculum Vitae CV Manager è lo strumento di Text Mining che automatizza l analisi, la catalogazione e la ricerca dei Curriculum Vitae L esigenza Quanto tempo viene

Dettagli

ONLINE BRAND REPUTATION CAR RENTAL

ONLINE BRAND REPUTATION CAR RENTAL ONLINE BRAND REPUTATION CAR RENTAL SOMMARIO 1. ANALISI PRELIMINARE PANEL DI OSSERVAZIONE, FONTI, PRIME EVIDENZE... 3 2. SENTIMENT ANALYSIS... 6 3. RILEVAZIONE DROMETAURO INDEX... 8 4. MAPPA BRANDIMENT...

Dettagli

PIANI DI STUDIO D'ISTITUTO ISTITUTO COMPRENSIVO BASSA ANAUNIA SCUOLA MEDIA DI DENNO A.S. 2012-2013 ITALIANO_CLASSE SECONDA

PIANI DI STUDIO D'ISTITUTO ISTITUTO COMPRENSIVO BASSA ANAUNIA SCUOLA MEDIA DI DENNO A.S. 2012-2013 ITALIANO_CLASSE SECONDA PIANI DI STUDIO D'ISTITUTO ISTITUTO COMPRENSIVO BASSA ANAUNIA SCUOLA MEDIA DI DENNO A.S. 2012-2013 ITALIANO_CLASSE SECONDA PSI_ITALIANO QUARTO BIENNIO_CLASSE SECONDA COMPETENZA ABILITA CONOSCENZE Competenza

Dettagli

ISTITUTO COMPRENSIVO DI MUSSOLENTE SCUOLA PRIMARIA ITALIANO CLASSE PRIMA

ISTITUTO COMPRENSIVO DI MUSSOLENTE SCUOLA PRIMARIA ITALIANO CLASSE PRIMA ISTITUTO COMPRENSIVO DI MUSSOLENTE SCUOLA PRIMARIA ITALIANO CLASSE PRIMA OBIETTIVI SPECIFICI DI APPRENDIMENTO PER LA CLASSE PRIMA E RELATIVI COMUNICAZIONE ORALE MANTENERE L ATTENZIONE SUL MESSAGGIO ORALE,

Dettagli

Ingegneria dei Requisiti

Ingegneria dei Requisiti Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Ingegneria dei Requisiti E. TINELLI Contenuti I requisiti del software Documento dei requisiti I processi

Dettagli

Corso di Sistemi di Elaborazione delle informazioni

Corso di Sistemi di Elaborazione delle informazioni Corso di Sistemi di Elaborazione delle informazioni Sistemi Operativi Francesco Fontanella La Complessità del Hardware Il modello di Von Neumann è uno schema di principio. Attualmente in commercio esistono:

Dettagli

Sistemi Informativi Multimediali 1 - Introduzione

Sistemi Informativi Multimediali 1 - Introduzione Che cos è un sistema informativo multimediale? Sistemi Informativi li 1 - Introduzione Augusto Celentano Università Ca Foscari di Venezia Un sistema informativo multimediale (MMDBMS) è un framework che

Dettagli

PROGETTO - Ingegneria del Software. Università degli Studi di Milano Polo di Crema. Corso di laurea in Scienze Matematiche, Fisiche e Naturali

PROGETTO - Ingegneria del Software. Università degli Studi di Milano Polo di Crema. Corso di laurea in Scienze Matematiche, Fisiche e Naturali Università degli Studi di Milano Polo di Crema Corso di laurea in Scienze Matematiche, Fisiche e Naturali INFORMATICA Corso di Ingegneria del Software progetto IL SISTEMA CALENDAR Presentato al dott. Paolo

Dettagli

Salute. Social media. La salute nell era dei social media. Fiducia. Community. Collegamento in rete. Sostenibilità

Salute. Social media. La salute nell era dei social media. Fiducia. Community. Collegamento in rete. Sostenibilità La salute nell era dei social media Estratto dai risultati dello studio condotto da Swisscom nell ottobre 2011 Health 2.0 Prevenzione Sicurezza Sostenibilità Nutrizione Paziente informato Forum salute

Dettagli

DESCRIZIONE E VALUTAZIONE DELLE MODALITA E DEI RISULTATI DELLA RILEVAZIONE DELL OPINIONE DEGLI STUDENTI FREQUENTANTI E DEI LAUREANDI

DESCRIZIONE E VALUTAZIONE DELLE MODALITA E DEI RISULTATI DELLA RILEVAZIONE DELL OPINIONE DEGLI STUDENTI FREQUENTANTI E DEI LAUREANDI UNIVERSITA DEGLI STUDI Niccolò Cusano TELEMATICA ROMA NUCLEO DI VALUTAZIONE Via Don Carlo Gnocchi, 3 00166 Roma DESCRIZIONE E VALUTAZIONE DELLE MODALITA E DEI RISULTATI DELLA RILEVAZIONE DELL OPINIONE

Dettagli

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 1 - Introduzione generale Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com http://www.onairweb.com/corsopr

Dettagli

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG 16 gennaio 2015 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG Introduzione Le attività dei blogger I social influencer

Dettagli

Misurare i SOCIAL MEDIA

Misurare i SOCIAL MEDIA www.blogmeter.it Misurare i SOCIAL MEDIA Vincenzo Cosenza @vincos 1 Agenda Il panorama dei social media nel mondo e in Italia Il ROI dei Social Media Un framework per la misurazione e le tecniche di misurazione.

Dettagli

jeenuin Jeenuin Uno strumentoinnovativoper l ascoltosemantico 17 Ottobre 2013 www.jeenuin.com

jeenuin Jeenuin Uno strumentoinnovativoper l ascoltosemantico 17 Ottobre 2013 www.jeenuin.com jeenuin www.jeenuin.com Jeenuin Uno strumentoinnovativoper l ascoltosemantico 17 Ottobre 2013 La missione di Jeenuin jeenuin www.jeenuin.com Fornire un servizio di Web intelligence di nuova generazione:

Dettagli

Ricerca Operativa 2. Introduzione al metodo del Simplesso

Ricerca Operativa 2. Introduzione al metodo del Simplesso Ricerca Operativa 2. Introduzione al metodo del Simplesso Luigi De Giovanni Giacomo Zambelli 1 Problemi di programmazione lineare Un problema di ottimizzazione vincolata è definito dalla massimizzazione

Dettagli

Indice. 1 La statistica, i dati e altri concetti fondamentali ---------------------------------------------------- 3

Indice. 1 La statistica, i dati e altri concetti fondamentali ---------------------------------------------------- 3 LEZIONE ELEMENTI DI STATISTICA DESCRITTIVA PROF. CRISTIAN SIMONI Indice 1 La statistica, i dati e altri concetti fondamentali ---------------------------------------------------- 3 1.1. Popolazione --------------------------------------------------------------------------------------------

Dettagli

Sintassi 1. (1) Sintassi: si occupa della combinazione di parole in frasi e della struttura delle frasi stesse.

Sintassi 1. (1) Sintassi: si occupa della combinazione di parole in frasi e della struttura delle frasi stesse. LINGUISTICA GENERALE, Linguistica di base D, a.a 2010/11, Ada alentini Mat. 8 Sintassi 1 (1) Sintassi: si occupa della combinazione di parole in frasi e della struttura delle frasi stesse. A. Il livello

Dettagli

Hardware Efficient Un singolo server può generare metadata per centinaia di telecamere simultaneamente

Hardware Efficient Un singolo server può generare metadata per centinaia di telecamere simultaneamente Vi-Search consente di raccogliere i veri benefits della tua rete di videosorveglianza permettendoti il recupero automatico e l analisi delle preziose informazioni contenute nelle registrazioni. Vi-Search

Dettagli

Da una a più variabili: derivate

Da una a più variabili: derivate Da una a più variabili: derivate ( ) 5 gennaio 2011 Scopo di questo articolo è di evidenziare le analogie e le differenze, relativamente al calcolo differenziale, fra le funzioni di una variabile reale

Dettagli

2012 Extreme srl riproduzione riservata

2012 Extreme srl riproduzione riservata Web & Social Media: il BIG DATA* Le aziende devono gestire il BIG DATA perché è attraverso di esso che sviluppano relazioni con i clienti, riscontrano e gestiscono la customer satisfaction, studiano e

Dettagli

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Facoltà di Ingegneria Corso di Laurea Specialistica in Ingegneria Informatica SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Relatore Chiarissimo

Dettagli

Introduzione. File System Distribuiti. Nominazione e Trasparenza. Struttura dei DFS. Strutture di Nominazione

Introduzione. File System Distribuiti. Nominazione e Trasparenza. Struttura dei DFS. Strutture di Nominazione File System Distribuiti Introduzione Nominazione e Trasparenza Accesso ai File Remoti Servizio Con/Senza Informazione di Stato Replica dei File Un esempio di sistema Introduzione File System Distribuito

Dettagli

File System Distribuiti

File System Distribuiti File System Distribuiti Introduzione Nominazione e Trasparenza Accesso ai File Remoti Servizio Con/Senza Informazione di Stato Replica dei File Un esempio di sistema 20.1 Introduzione File System Distribuito

Dettagli

LA TUA CITTA A PORTATA DÌ CLICK. www.mycityweb.info

LA TUA CITTA A PORTATA DÌ CLICK. www.mycityweb.info LA TUA CITTA A PORTATA DÌ CLICK www.mycityweb.info IDEA INNOVATIVO SERVIZIO WEB/APP PER LA RICERCA DINEGOZI, RISTORANTI, PRODOTTI/SERVIZI ALL INTERNO DELL ECOSISTEMA CITTADINO. AVVICINARE LE PERSONE AI

Dettagli

PIANO DI LAVORO ANNUALE a.s. 2014/2015 ITALIANO CLASSE PRIMA COMPETENZE

PIANO DI LAVORO ANNUALE a.s. 2014/2015 ITALIANO CLASSE PRIMA COMPETENZE Istituto Comprensivo di Calderara di Reno Scuola Secondaria di Primo Grado Due Risorgimenti PIANO DI LAVORO ANNUALE a.s. 2014/2015 ITALIANO CLASSE PRIMA COMPETENZE CONTENUTI LETTURA Conoscere le strategie

Dettagli

E-LEARNING. Utilizzare le tecnologie di rete per progettare, distribuire, scegliere, gestire e ampliare l apprendimento.

E-LEARNING. Utilizzare le tecnologie di rete per progettare, distribuire, scegliere, gestire e ampliare l apprendimento. E-LEARNING Utilizzare le tecnologie di rete per progettare, distribuire, scegliere, gestire e ampliare l apprendimento. E-LEARNING Electronic Learning E- LEARNING EXPERIENCE: possibilità di interazione,

Dettagli

Question Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes

Question Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes Question Answering e semantica Tecnologie emergenti per le imprese Cos è QuestIT? QuestIT nasce nell ambito di attività di ricerca in Intelligenza Artificiale presso il Dipartimento di Ingegneria dell

Dettagli

TECNICO DELLA PIANIFICAZIONE ECONOMICA E AMBIENTALE DELLE AREE PORTUALI

TECNICO DELLA PIANIFICAZIONE ECONOMICA E AMBIENTALE DELLE AREE PORTUALI TECNICO DELLA PIANIFICAZIONE ECONOMICA E AMBIENTALE DELLE AREE PORTUALI LEZIONE 10/10/05 STATISTICA Antigone Marino La costruzione del questionario Il questionario di indagine è lo strumento di misura

Dettagli

E-LEARNING E- LEARNING E-LEARNING. Learning. Electronic. Perché E-learning? EXPERIENCE: possibilità di interazione, partecipazione e

E-LEARNING E- LEARNING E-LEARNING. Learning. Electronic. Perché E-learning? EXPERIENCE: possibilità di interazione, partecipazione e E-LEARNING E-LEARNING Electronic Learning Utilizzare le tecnologie di rete per progettare, distribuire, scegliere, gestire e ampliare l apprendimento. E- LEARNING EXPERIENCE: possibilità di interazione,

Dettagli

Documentazione Demo online

Documentazione Demo online READ-IT Documentazione Demo online ILC-CNR ItaliaNLP Lab Sommario 1 MISURAZIONE DELLA LEGGIBILITÀ DI UN TESTO 2 1.1 Analisi globale della leggibilità 3 1.1.1 Valutazione globale della leggibilità del documento

Dettagli

Code Architects S.r.l. SWOP Semantic Web-service Oriented Platform B2SO201

Code Architects S.r.l. SWOP Semantic Web-service Oriented Platform B2SO201 UNIONE EUROPEA FONDO EUROPEO DI SVILUPPO REGIONALE. REGIONE PUGLIA AREA POLITICHE PER LO SVILUPPO IL LAVORO E L INNOVAZIONE Modello M14 Allegati RTA POR PUGLIA 2007-2013 - Asse I Linea 1.1 Azione 1.1.2

Dettagli