POLITECNICO DI MILANO

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "POLITECNICO DI MILANO"

Transcript

1 POLITECNICO DI MILANO FACOLTÀ DI INGEGNERIA DELL INFORMAZIONE Corso di Laurea Specialistica in Ingegneria Informatica METODOLOGIA PER L AGGIORNAMENTO CONTINUO DI UNA RETE SEMANTICA ORIENTATA ALLA SENTIMENT ANALYSIS NEI SOCIAL MEDIA Relatore: Chiar.ma Prof.ssa Chiara FRANCALANCI Correlatore: Dott. Ing. Donato BARBAGALLO Tesi di Laurea di: Daniele GARBUGLI Matr Anno Accademico

2 Daniele Garbugli METODOLOGIA PER L AGGIORNAMENTO CONTINUO DI UNA RETE SEMANTICA ORIENTATA ALLA SENTIMENT ANALYSIS NEI SOCIAL MEDIA Tesi di laurea magistrale Milano, Marzo 2011 Relatore: Prof.ssa Chiara FRANCALANCI Correlatore: Dr. Donato BARBAGALLO i

3 Abstract Blogs, forums and social networks are by now a widespread reality in the Internet world. Tens of millions of users use these tools to express their opinions and feelings, producing huge volumes of non-structured textual data. These data represent a priceless source of value for anyone that would like to know the Web reputation for a brand of any type, from products to services, from cities to people. We need sophisticated applications of Natural Language Processing to be able to deduce useful information from the huge amount of raw data; one of them is Sentiment Analysis that recognizes positive or negative sentiment enclosed in a message written in natural language. Moreover, the identification of the sentiment polarity in a document has to be associated to the ability of understanding to which components and qualities of the subject we could assign the judgment expressed by the author. An effective analysis of Web reputation of a brand requires the tool of sentiment analysis to be able to understand users average judgment about the different features that describe the brand and that in the whole form an attractivity model. This thesis deals with the problem of outlining a methodology to define the attractivity model of a brand; we want the model to respect requirements of completeness and accuracy and to be always updated, consistent with its dynamism and the dynamism of the domain it belongs to. The identification of the brand's features requires both a deep knowledge of the domain by an expert and the automatic work performed by the tool which, starting from volume of speech, has to extract new brand's ii

4 Abstract features and suggest to the user their positioning in the model in order to enhance future analysis. These two tasks are peculiar also to another kind of analysis that is dealt with in this thesis, that is the topic trend detection; it consists of two steps: first of all the detection of words that have recently shown a burst, than the attempt at proposing to the user the interpretation of the argument which hides behind these words and the event that could have generate the burst. This research work aims also to define some tools that help the user to understand these kind of information. iii

5 Sommario Blog, forum e social network sono ormai da anni una realtà consolidata del mondo Internet. Decine di milioni di utenti utilizzano questi strumenti per esprimere le proprie opinioni e le proprie sensazioni, producendo imponenti volumi di dati testuali non strutturate. Questi dati rappresentano una fonte inestimabile di valore per chiunque voglia conoscere la reputazione online di un brand di qualunque natura, dai prodotti ai servizi, dalle città alle persone. Per riuscire a ricavare informazioni utili dall enorme mole di dati servono sofisticate applicazioni di Natural Language Processing: una su tette la Sentiment Analysis, che ha come obiettivo il riconoscimento della positività o negatività (sentiment) racchiusi in un messaggio scritto in linguaggio naturale. Il riconoscimento della polarità del sentiment in un documento deve inoltre essere accompagnato dalla capacità di comprendere a quale soggetto tale sentiment va attribuito. E ancora più interessante sarebbe riuscire a capire a quali componenti e qualità del soggetto si può attribuire il giudizio espresso dall autore. Un efficace analisi della Web reputation di un brand richiede che il tool di sentiment analysis riesca a comprendere il giudizio medio degli utenti sulle varie caratteristiche che descrivono il brand e che nel loro complesso formano il suo modello di attrattività. Scopo di questa tesi è di tracciare una metodologia per definire il modello di attrattività di un brand; si vuole che tale modello rispetti i requisiti di completezza e correttezza e che sia sempre aggiornato, in linea con la dinamicità sua e del dominio in cui si colloca. Il riconoscimento delle caratteristiche del brand richiede sia la conoscenza di dominio di un esperto, sia il lavoro automatico del tool che, iv

6 Sommario partendo dai volumi di parlato, deve riconoscere nuove feature del brand e suggerire all utente la collocazione nel modello per migliorare le analisi successive. Questi due task sono propri anche di un altro tipo di analisi che è oggetto di studio in questa tesi, ovvero la topic trend detection; essa consiste di due fasi: prima il rilevamento di parole che recentemente hanno evidenziato un picco di occorrenze, poi il tentativo di suggerire all utente una chiave di lettura per comprendere l argomento che si cela dietro queste parole e l evento che ha scatenato il picco. Questo lavoro di tesi intende anche definire una serie di strumenti che facilitino questo tipo di comprensione all utente. v

7 Ringraziamenti Milano, Marzo 2011 Daniele Garbugli vi

8 Indice Abstract...ii Sommario... iv Ringraziamenti... vi Indice... vii Lista delle Figure... x Lista delle Tabelle... xiii Capitolo 1 Introduzione... 1 Capitolo 2 Stato dell arte La modellazione di dominio Il concetto di modello e di dominio La costruzione del modello L analisi di frequenza Tool di mercato La categorizzazione Definizione del problema Approcci risolutivi Capitolo 3 Il progetto La sentiment analysis Tool di mercato Il progetto: obiettivi, funzionalità e innovazione Analisi degli influencer Analisi dei trend Gestione delle crisi L interfaccia mashup L approccio alla data quality vii

9 Indice Capitolo 4 Studio di fattibilità per un progetto di sentiment analysis Analisi dei costi Analisi manuale del sentiment Analisi automatica del sentiment Analisi a confronto Conclusioni Capitolo 5 Metodologia di definizione e raffinamento del modello Vocabolario Terminologia dell analista Terminologia del progettista Metodologia di definizione del modello Definizione di categorie, sottocategorie e qualità Creazione di elenchi di tag per la rete semantica Importazione massiva di tag nella rete semantica La scelta di tag identificatori Analisi del rumore Crawling: ricerca di post tramite keywords Word Sense Disambiguation Categorizzazione di post Analisi di copertura Ricerca semiautomatica di nuovi tag Analisi ciclica Capitolo 6 Revisione del modello e analisi dei topic trend Le tipologie di parole da analizzare La selezione di tag candidati: l analisi di frequenza La metrica I parametri Clustering per tipologia di parola viii

10 Indice 6.3 Algoritmi di categorizzazione di tag Analisi a livello di post Analisi a livello di n-grammi Schema complessivo Analisi dei trend Clustering Mashup con servizi esterni Funzionalità per l utente Proposta di mockup dell interfaccia grafica Capitolo 7 Test e risultati Test sull analisi di frequenza: il caso del vulcano Il dataset Il test I risultati Conclusioni Test sulla categorizzazione di tag: il caso del vulcano Analisi a livello di post Analisi a livello di n-grammi Conclusioni Test congiunti per la topic trend detection Il dataset Il test I risultati Conclusioni Capitolo 8 Conclusioni e sviluppi futuri Bibliografia ix

11 Lista delle Figure Figura 2.1: Tag cloud dal sito in data 12 febbraio Figura 2.2: Passi dell algoritmo di hot topic detection proposto da Bai et al. [7] Figura 2.3: Curva di popolarità per le keyowrd Saddam Hussein. Saddam fu incarcerato il 5 Novembre 2006 e fu giustiziato il 30 Dicembre Le regioni evidenziate in rosso indicano un burst Figura 2.4: Interfaccia grafica del tool GTD Explorer Figura 3.1: Diverse forme di visualizzazione dei risultati dell analisi del sentiment del tool Sysomos Figura 3.2: Ricerca di UCG con filtro sul sentiment dei risultati su Liquida Figura 3.3: Metodologia di Blogmeter per l analisi del passaparola online Figura 3.4: Metodologia di Blogmeter per l analisi del passaparola online Figura 3.5: Screenshot dell interfaccia mashup di WISPO Figura 3.6: Architettura del modulo di clear ing e pruning di WISPO Figura 3.7: Architettura complessiva di WISPO Figura 4.1: Confronto fra le curve di cost della soluzione manuale e automatica per un progetto di sentiment analysis Figura 5.1: Relazione fra le entità gestite dall analista Figura 5.2: Workflow della metodologia di definizione del modello di attrattività Figura 5.3: Esempio di calcolo del rapporto segnale-rumore (SNR) Figura 5.4: Esempio di copertura di un modello x

12 Lista delle Figure Figura 6.1: Casistiche di caratterizzazione di una parola della Bag Of Word Figura 6.2: Relazione fra le tipologie di tag Figura 6.3: Finestre temporali per la metrica Frequency Burst Figura 6.4: Grafico dell andamento del fattore di crescita F al variare del fattore di regolarizzazione c e al crescere della frequenza P del tag nella finestra piccola Figura 6.5: Clustering deile parole della Bag Of Word Figura 6.6: Schema generale di funzionamento della categorizzazione basata su n-grammi Figura 6.7: Relazione della rete semantica sfruttate per ricavare il set di keyword che descrivono un tag Figura 6.8: Categorie allo stesso livello e insieme delle keyword che le descrivono Figura 6.9: Dal tag candidato alla relativa BOW con frequenze Figura 6.10: Struttura dell impianto definito da Chidamber e Kemerer Figura 6.11: Possibile conseguenza della non monotonicità della metrica Figura 6.12: Schema riassuntivo dell attività per l aggiornamento e il raffinamento del modello Figura 6.13: Esempio di schermata di Klout Figura 6.14: Proposta di mockup dell interfaccia grafica per il tool di topic trend detection di WISPO Figura 7.1: Distribuzione dei tweet del dataset dal 12 al 16 aprile Figura 7.2: Andamento del fattore di crescita del burst al crescere della frequenza del tag nella finestra piccola, fissato c=3 (fattore di regolarizzazione) e valore della metrica a 0, Figura 7.3: Distribuzione temporale della parola volcano nei post tra il 14 e il 16 aprile xi

13 Lista delle Figure Figura 7.4: Grafico dei risultati del test di categorizzazione con analisi a livello di post Figura 7.5: Grafici dei risultati dell analisi di frequenza basata su n- grammi, per n crescente e per le quattro metriche M1, M2, M3, M4. L ultima colonna rappresenta la categoria Services&Transport Figura 7.6: Rappresentazione più immediata dei risultati dei 16 grafici. Il nero indica la vittoria della categoria services&transport, il grigio denota non una vittoria ma quasi un pari merito con la categoria vincente e il bianco simboleggia la sconfitta della categoria corretta xii

14 Lista delle Tabelle Tabella 2.1: Alcuni siti Internet che utilizzano i tag per gestire i loro item Tabella 2.2: Alcuni siti Internet che utilizzano i tag per gestire i loro item Tabella 2.3: riassunto dei metodi per problemi di classificazione con machine learning semi-supervisionato Tabella 2.4: Riassunto dell indagine sui metodi di machine learning e classificazione non supervisionata o che utilizza altre sorgenti di conoscenza oltre all eventuale corpus già etichettato Tabella 3.1: Confronto fra le performance di alcuni tool di sentiment analysis Tabella 6.1: Applicazione dei viewpoint alle metriche Tabella 6.2: Resoconto delle proprietà di validazione sulla metrica M Tabella 7.1: Risultati dell analisi di frequenza sul caso di studio del vulcano Tabella 7.2: Risultati del test di categorizzazione con analisi a livello di post Tabella 7.3: Numero di keyword per ogni categoria di primo livello del modello Tabella 7.4: Numero di keyword per ogni categoria di primo livello del modello Tabella 7.5: Valutazione soggettiva sull utilità dei tre servizi per la comprensione dei topic trend xiii

15 Capitolo 1 Introduzione Il Web2.0 è una tecnologia abilitante per molte applicazioni che prima non erano possibili; applicazioni che se da un lato offrono nuove opportunità, dall altro lanciano nuove sfide da affrontare. Uno degli elementi caratterizzanti il Web2.0 è la miriade di informazioni che gli utenti di Internet spontaneamente condividono in blog, forum, siti di review e social network: sono i cosiddetti User Generated Contents (UGC). Si tratta spesso di esperienze, sensazioni e opinioni personali in merito ad un particolare soggetto; queste nel loro complesso, oltre a rappresentare un ampio campione statistico di giudizi sul soggetto, sono anche le stesse informazioni che andranno a influenzare gli altri naviganti, secondo le dinamiche tipiche del passaparola. Per questi motivi molte aziende ed enti stanno decidendo sempre più spesso di affidarsi ad applicazioni di sentiment analysis per monitorare la reputazione online di cui gode il loro brand, in alternativa ai tradizionali sondaggi dispendiosi in termini di tempi e costi. Conoscere il giudizio della gente su un brand è il primo passo per raggiungere la consapevolezza degli ambiti in cui esso è forte e su quali invece necessita di miglioramenti; è il punto di partenza per un adeguata politica di marketing, inteso nel senso più ampio del termine, spaziando dal marketing di prodotto, allo sviluppo del settore turistico, fino alla promozione dell immagine della persona. La social media intelligence offre gli strumenti per leggere le informazioni strutturate e non strutturate che Internet mette a disposizione, al fine di 1

16 Capitolo 1. Introduzione analizzare un brand in tutte le sue sfaccettature, confrontarlo con i competitor e adottare appropriate operazioni di marketing. Il passo preliminare all analisi è la definizione del modello di attrattività del brand, ovvero un astrazione dal dominio a cui il brand appartiene per estrarre le caratteristiche su cui si desidera conoscere il sentiment. Primo obiettivo di questo lavoro di tesi è delineare una metodologia per costruire il modello del brand e tenerlo aggiornato nel tempo in un ottica di apprendimento continuo sul dominio; parallelamente al modello va anche tenuta aggiornata la conoscenza di base utilizzata dal tool di sentiment analysis (nella fattispecie una rete semantica) per comprendere i testi in linguaggio naturale che racchiudono il sentiment. L intenzione è quella di garantire un giusto bilanciamento fra lavoro automatico del tool e contributo manuale dell uomo, ovvero un compromesso fra rapidità e correttezza dell analisi. Saranno trattati nel dettaglio due aspetti chiave della metodologia. Prima l analisi di frequenza, attraverso cui riconoscere direttamente dai volumi di parlato nuove feature che potrebbero essere unite al modello. Poi dei metodi di categorizzazione, che permettano di suggerire all utente la miglior collocazione delle feature nel modello. Il riconoscimento di nuove feature rilevanti avviene tramite un analisi dei topic trend, ovvero gli argomenti di discussione più in voga del momento nella blogsfera. Questo tipo di analisi, nota come topic trend detection, rappresenta il secondo ambito di studio di questa tesi, anche se in realtà condivide parte delle metodologie delineate per la definizione e aggiornamento del modello. Allo stato attuale, la letteratura e i tool di mercato che si occupano di questo tema non danno molto risalto alla comprensione dei trend, limitandosi a segnalarne l esistenza sotto forma di parole più ricorrenti nell ultimo periodo (picchi). In questa tesi si cercherà proprio di suggerire una serie di strumenti da integrare nell interfaccia grafica del tool, che aiutino l utente a comprendere quale argomento effettivamente si nasconde dietro al picco di una parola e qual è l evento che ha alimentato la discussione sul Web. La capacità di cogliere in tempo reale questi trend è molto importante per l utilizzatore del tool, perché permette di rilevare rapidamente eventuali crisi (ovvero polarità negativa sul sentiment) e prendere le migliori decisioni per risolverle prima che la situazione si aggravi. Tra l altro, per gli stessi motivi per cui Internet rappresenta un ottimo strumento per recepire le 2

17 Capitolo 1. Introduzione crisi, esso costituisce anche un canale privilegiato per la loro gestione, in quanto permette di comunicare con molti utenti in poco tempo [52]. La tesi è strutturata come segue. Il capitolo 2 presenta una rassegna dello stato dell arte relativamente a tre argomenti ampiamente sviluppati nei capitoli successivi, che sono la modellazione di dominio, l analisi di frequenza e il problema della categorizzazione di parole. Sul primo argomento si è constatata una carenza di letteratura a riguardo. Sul problema dell analisi di frequenza è emersa l attitudine comune di focalizzare la ricerca di topic trend partendo dalla frequenza con cui occorrono le singole parole. Sul tema della categorizzazione si è notata una tendenza a passare da metodi supervisionati che richiedono training, a metodi non supervisionati completamente automatizzati, anche se questa totale automatizzazione non è praticamente mai raggiunta in quanto è sempre richiesto almeno un minimo intervento umano. Il capitolo 3 racconta il progetto di sentiment analysis in cui si colloca questo lavoro di tesi. Dopo una descrizione del problema della sentimenta analysis e dei tool di mercato più diffusi che la implementano, si passa alla descrizione del progetto in sé, focalizzando l attenzione sui suoi aspetti innovativi e sulle funzionalità che mira ad implementare. Il capitolo 4 offre alcuni spunti per affrontare il problema dello studio di fattibilità che deve precedere un progetto di sentiment analysis per un cliente. Si pone l accento sulle principali variabili che occorre tenere in considerazione, dando particolare rilievo alla prospettiva dei costi, e sulle possibili alternative che si prospettano sulla base dei risultati ottenuti dallo studio. Il capitolo 5 va finalmente nel dettaglio della metodologia per la definizione e aggiornamento del modello di attrattività del brand. La descrizione è preceduta da una breve introduzione sul linguaggio che viene utilizzato nel corso del restante lavoro. Il capitolo 6 entra ancora più nel dettaglio su una parte della metodologia definita. Si parte con l analisi di frequenza, ovvero la ricerca di keyword rilevanti e che per questo si candidano per l analisi successiva. Tale analisi è la categorizzazione delle parole; per questo task sono proposte due possibili soluzioni implementative: la prima si basa su una variante di una metrica tradizionale, mentre per la seconda una nuova metrica viene formulata e validata in modo formale. L ultimo paragrafo 3

18 Capitolo 1. Introduzione affronta il tema della topic trend detection che mette insieme le soluzioni sviluppate nei due paragrafi precedenti con altre funzionalità, il tutto finalizzato al task di rendere intelligibili i picchi trovati sulle parole; il paragrafo si conclude con una proposta di mockup dell interfaccia grafica del tool di topic trend detection. Nel capitolo 7 si descrivono i test svolti sulle varie metriche e gli algoritmi definiti nel corso dei vari capitoli, ovvero sull analisi di frequenza, sulla categorizzazione e sulla topic trend detection. Infine il capitolo 8 riassume tutto il lavoro svolto e trae le dovute conclusioni, accompagnate da suggerimenti per sviluppi futuri rispetto a questo lavoro di tesi.. 4

19 Capitolo 2 Stato dell arte In questo capitolo si discuterà lo stato dell arte relativamente alle principali tematiche affrontate nel corso della tesi, in modo da avere sempre un termine di paragone tra metodologie, metriche e algoritmi proposti e quelli già sviluppati negli ultimi decenni. Molte di queste tematiche richiederebbero una trattazione molto ampia, ma non essendo la completezza scopo di questa tesi, ci si limiterà ad affrontare con più attenzione solo quegli aspetti che si legano maggiormente alle scelte intraprese nel corso del lavoro di tesi. 1.1 La modellazione di dominio La maggior parte degli studi sulla sentiment analysis si sono concentrati sul core di questo problema, ovvero la stima del sentiment di un documento scritto in linguaggio naturale. In meno hanno rivolto la loro attenzione anche alla questione del modello costruito attorno all oggetto (brand) di cui si vuole studiare la reputazione sul Web. Per capire bene la questione del modello, occorre prima comprendere bene la terminologia che sarà adottata, per poi affrontare un indagine su come la questione è stata affrontata in letteratura Il concetto di modello e di dominio 5

20 Capitolo 2. Stato dell arte Con modello del brand si intende una descrizione sufficientemente formale del brand, comprendente l insieme delle caratteristiche che si vogliono monitorare; si potrebbe parlare di modello di attrattività, visto che, dalla prospettiva dei clienti, tali caratteristiche rappresentano i temi su cui essi saranno soliti esprimere dei giudizi in quanto li ritengono importanti; per un motivo analogo si parla spesso anche di modello di successo, mettendo l accento sul fatto che le caratteristiche analizzate sono quelle che determinano il successo del brand [44], proprio nella misura in cui il fatto che se ne discuta implica la loro importanza. Un brand si colloca sempre in un ben determinato dominio, per cui trovare un modello del brand significa anche costruire una rappresentazione del dominio in cui esso si colloca. Per dominio qui si intende una parte del mondo reale costituita da elementi che presentano una qualche correlazione; solitamente infatti si parla di dominio di qualcosa che è proprio l elemento che tiene unito il tutto. Ad esempio nel dominio della città rientrano aspetti come i trasporti, l arte, l accommodation e l intrattenimento. Tutti questi aspetti vengono inseriti nel modello che descrive il dominio; tuttavia la loro selezione non è univoca, ma dipende dalle particolari esigenze dell applicazione che sfrutterà tale modello, per questo si parla spesso anche di dominio applicativo. Ad ogni dominio corrisponde un certo vocabolario, e più il dominio è ristretto, più il linguaggio che lo caratterizza sarà specifico; ad esempio nel dominio della salute rientrano tutti i termini tecnici della medicina, mentre per tornare all esempio del dominio delle città, nel suo vocabolario confluiranno per esempio l elenco dei musei, delle strade e dei ristoranti La costruzione del modello Alcuni studi, pur non parlando esplicitamente di modello, provano comunque a determinare gli elementi che caratterizzano un particolare dominio applicativo e lo fanno tramite sistemi di feature extraction, metodologie bottom-up per fare mining sui documenti in cui sono espressi giudizi sul brand al fine di dedurre le caratteristiche principali oggetto di discussione. Uno di questi studi è quello di Balahur [9] che prende come input una query dell utente il quale dichiara il nome del brand di cui vuole conoscere la Web reputation. Il sistema, sfruttando la conoscenza raccolta dalle reti semantiche WordNet e ConceptNet, scopre in modo 6

21 Capitolo 2. Stato dell arte automatico una serie di feature tipiche del brand specificato dall utente; queste andranno ad aggiungersi ad altre che sarebbero productindependent. Un approccio diverso è seguito da Spangler [52] che tenta di dedurre dai volumi di parlato le caratteristiche più importanti del brand, senza ricorrere a nessuna conoscenza a priori. Il tutto si svolge in due fasi: nella prima si realizzano vari tipi di clustering (che Spangler chiama tassonomie) dei documenti secondo diversi criteri quali vicinanza semantica, correlazione temporale e tipologia di sentiment espresso; a seconda dei casi le categorie possono essere stabilite a priori dall analista oppure possono essere dedotte direttamente dai documenti. Nella seconda fase l analista deve comprendere che cosa effettivamente contengono le categorie delle varie tassonomie per poi cercare correlazioni tra categorie di tassonomie diverse; il tutto si realizza con il supporto di algoritmi automatici di text summarization e metriche di similitudine tra documenti. Il risultato finale è un insieme di categorie ben distinte appartenenti a diverse tassonomie e che descrivono il brand di interesse. Quello che si può notare dallo studio effettuato è che la logica dominante che guida l identificazione delle variabili del modello di attrattività è di tipo bottom-up, in quanto la loro selezione è sostanzialmente automatica e parte direttamente dall analisi dei documenti. Ciò su cui in letteratura si è sostanzialmente concordi è che un sistema di sentiment analysis è fortemente dipendente sia dal dominio che dal linguaggio utilizzato [32]. Tuttavia ci sono stati sforzi per cercar di costruire classificatori di sentiment che siano facilmente adattabili a nuovi domini, ovvero senza grandi sforzi per rifare il training [3,5,53,54] 1.2 L analisi di frequenza Una delle prerogative del Web2.0 è che i contenuti a cui gli utenti accedono sono da loro stessi generati, per questo si parla di User Generated Content (UGC), da Baeza-Yates ritenuti il trend prevalente sul Web [6]. Nella maggior parte dei casi questi contenuti sono testi (blog, forum, social network, enciclopedie collaborative, etc.) e anche quando si tratta di foto o video, questi sono spesso corredati da descrizioni testuali, 7

22 Capitolo 2. Stato dell arte magari espresse semplicemente come elenchi di keyword descrittive comunemente dette tag. Un tag è una parola o un insieme di poche parole che un utente assegna ad un item per descriverlo ed identificarne il contenuto, ovvero il soggetto dell item, le persone coinvolte, il tipo di item e le tematiche connesse. Una definizione esaustiva di tag data da Sen et al [49] ne mette in luce tutti gli aspetti e le funzioni essenziali: descrivere un item; permettere l organizzazione di item, ovvero la loro classificazione; su questa scia è nato il concetto di folksonomia, ovvero la categorizzazione di informazioni generata dagli utenti tramite tag scelti liberamente; facilitare la ricerca di contenuti non necessariamente testuali; consentire un esperienza di social navigation [8], ossia scoprire nuove informazioni grazie al contributo di altri utenti della community. Si evince dunque l aspetto fortemente collaborativo che caratterizza l attività di tagging [28], tipico degli strumenti del Web 2.0. Il tagging si applica a praticamente qualunque tipologia di item. Alcuni siti che fanno un ampio uso di questo strumento e i relativi item sono riportati in tabella 2.1 La pratica del tagging è oramai così diffusa da produrre una quantità enorme di metadati attraverso cui svolgere operazioni di categorizzazione e ricerca; ad esempio Dubinko [20] svolge analisi su un set di 86,8 milioni di tag raccolti su Flickr in 472 giorni. Per questo motivo si è sviluppato un ramo di ricerca focalizzato sull analisi di tag per comprendere quali sono i temi dominanti discussi dagli utenti. La maggior rilevanza di un argomento in un determinato periodo si esprime in termini di burst, ovvero di un aumento della frequenza con cui esso si ripresenta nel volume di parlato; e scendendo ad un livello di analisi più basso, questo a suo volta si traduce in termini di burst delle parole che tipicamente sono utilizzate per parlare di quell argomento. Per questo è possibile mettere sullo stesso piano l analisi dei tag che descrivono gli item e l analisi delle parole che costituiscono un testo; in entrambi i casi c è un item che riguarda un certo argomento e c è un insieme di parole (tag) associate all item e caratterizzanti l argomento. 8

23 Capitolo 2. Stato dell arte Servizio Web Descrizione Flikr Delicious Gmail sito per lo storage e la condivisione di foto ciascuna descritta da una serie di tag direttamente scelti dall utente servizio di social bookmarking dove cioè ad essere taggati sono i siti Internet Web mail che consente all utente di associare un tag (detto label) alle sulla base di regole predeterminate Item taggati Foto Siti Web Technorati motore di ricerca dedicato al mondo dei blog Blog Last.fm Foursquare CiteULike social music Website che consente agli utenti di taggare artisti, album e pezzi social network che consente la geolocalizzazione, ovvero il tagging sui luoghi servizio Web per la condivisione, organizzazione e ricerca di articoli scientifici taggati dai rispettivi autori Artisti, album, brani musicali Mappe Articoli scientifici Tabella 2.1: Alcuni siti Internet che utilizzano i tag per gestire i loro item. Il problema di rilevare i cosiddetti hot topics (o hot events) viene quindi affrontato come ricerca dei burst sulle parole utilizzate in relazione a quell argomento, poco importa che si tratti di tag associati ad item o direttamente delle parole che costituiscono un documento. Uno degli approcci orientati al term burst maggiormente citato in letteratura è quello proposto da Kleinberg [31] che si ispira ai modelli markoviani. Il suo metodo di ricerca di argomenti dominanti in intervalli di tempo limitati parte proprio dalla ricerca di burst sulle parole che costituiscono i documenti. La sequenza di arrivo dei documenti (text stream) viene espressa in termini probabilistici come una distribuzione esponenziale; il modello del flusso di documenti è realizzato con un automa ad infiniti stati che corrispondono ciascuno ad un diverso rate di emissione e l inizio di un burst è dunque rappresentato da una transizione da uno stato più basso ad uno più alto. Si associa un costo alla transizione in modo da scoraggiare burst troppo brevi; per cui il problema della ricerca dei burst diventa un problema di ottimizzazione in 9

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testuali Il text mining: una definizione Data mining per dati destrutturati ovvero documenti codificati in linguaggio

Dettagli

Misurare i SOCIAL MEDIA

Misurare i SOCIAL MEDIA www.blogmeter.it Misurare i SOCIAL MEDIA Vincenzo Cosenza @vincos 1 Agenda Il panorama dei social media nel mondo e in Italia Il ROI dei Social Media Un framework per la misurazione e le tecniche di misurazione.

Dettagli

Web Reputation. PMI & Web Marketing

Web Reputation. PMI & Web Marketing Web Reputation PMI & Web Marketing Cosa puoi fare per la tua reputazione Con il termine identità digitale si intende tutta quella serie di informazioni presenti in rete, la cui considerazione complessiva

Dettagli

SENTIMENT ANALYSIS SUL WEB CORSO DI PUBBLICITÀ E STRATEGIE DI COMUNICAZIONE INTEGRATA

SENTIMENT ANALYSIS SUL WEB CORSO DI PUBBLICITÀ E STRATEGIE DI COMUNICAZIONE INTEGRATA SENTIMENT ANALYSIS SUL WEB CORSO DI PUBBLICITÀ E STRATEGIE DI COMUNICAZIONE INTEGRATA 2 INDICE 1. BRAND E SOCIAL NETWORK 2. L AVVENTO DEI BIG DATA 3. LA SENTIMENT ANALYSIS 4. METODOLOGIE 1 BRAND E SOCIAL

Dettagli

Augure Influencers Ranking Tutto sulla metodologia AIR

Augure Influencers Ranking Tutto sulla metodologia AIR Augure Influencers Ranking Tutto sulla metodologia AIR V1.0 Ottobre 2014 Oualid Abderrazek Product Marketing Augure Influencers Ranking 2 Contents 1. Contesto...4 2. L algoritmo...4 a. Esposizione...5

Dettagli

Intelligenza Artificiale

Intelligenza Artificiale Intelligenza Artificiale Anno accademico 2008-2009 Information Retrieval: Text Categorization Una definizione formale Sia D il dominio dei documenti Sia C = {c 1,,c C } un insieme di categorie predefinite

Dettagli

Le nuove tecnologie dell informazione: verso il Social Semantic Web. Roberto Boselli Alessandria 04-05-2007

Le nuove tecnologie dell informazione: verso il Social Semantic Web. Roberto Boselli Alessandria 04-05-2007 Le nuove tecnologie dell informazione: verso il Social Semantic Web Roberto Boselli Alessandria 04-05-2007 Outline Web 2.0 e Semantic Web Social Software Semantica e Ontologie SEDIMENTO 2 Obiettivi Aggiungere

Dettagli

Seeding e Tracking Come inseminare e misurare i contenuti virali

Seeding e Tracking Come inseminare e misurare i contenuti virali Seeding e Tracking Come inseminare e misurare i contenuti virali OmnicomExpo, Roma 14 maggio 2009 Viralbeat Viral Beat è un centro media 2.0, specializzato nell attivazione di campagne di seeding strategico.

Dettagli

Promuovere con successo un attività utilizzando Internet

Promuovere con successo un attività utilizzando Internet Promuovere con successo un attività utilizzando Internet Il piano operativo Quando si opera su Web non ci si deve lanciare in operazioni disorganizzate valutando solamente i costi. È fondamentale studiare

Dettagli

Informatica per le discipline umanistiche 2 lezione 12

Informatica per le discipline umanistiche 2 lezione 12 Informatica per le discipline umanistiche 2 lezione 12 Nella lezione precedente: In realtà non tutto il data mining è dettato dagli interessi economici (commercial) data mining Abbiamo visto risvolti commerciali

Dettagli

Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet

Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet Il Social Media Marketing è strettamente correlato al SEO (Search Engine Optimization).

Dettagli

Come gestire i Social Network

Come gestire i Social Network marketing highlights Come gestire i Social Network A cura di: Dario Valentino I Social Network sono ritenuti strumenti di Marketing imprescindibili per tutte le aziende che svolgono attività sul Web. Questo

Dettagli

Marketing 2.0 Web & social media marketing

Marketing 2.0 Web & social media marketing 1 Marketing 2.0 Web & social media marketing Progetto per lo sviluppo di traffico UTILE sul proprio dominio. Walter Garzena Introduzione 2 Il Web-Marketing 2.0 è caratterizzato da un elevata dinamicità

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

Indicizzazione terza parte e modello booleano

Indicizzazione terza parte e modello booleano Reperimento dell informazione (IR) - aa 2014-2015 Indicizzazione terza parte e modello booleano Gruppo di ricerca su Sistemi di Gestione delle Informazioni (IMS) Dipartimento di Ingegneria dell Informazione

Dettagli

Come internet e i social media possono diventare strumento prezioso per le associazioni di volontariato. Firenze, 4 maggio 2015

Come internet e i social media possono diventare strumento prezioso per le associazioni di volontariato. Firenze, 4 maggio 2015 Come internet e i social media possono diventare strumento prezioso per le associazioni di volontariato Firenze, 4 maggio 2015 Un sito statico è un sito web che non permette l interazione con l utente,

Dettagli

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da

Dettagli

2012 Extreme srl riproduzione riservata

2012 Extreme srl riproduzione riservata Web & Social Media: il BIG DATA* Le aziende devono gestire il BIG DATA perché è attraverso di esso che sviluppano relazioni con i clienti, riscontrano e gestiscono la customer satisfaction, studiano e

Dettagli

Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF

Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF Maria Grazia Pepe - Elisabetta Viti (Biblioteca nazionale centrale di Firenze) 6. Incontro ISKO Italia Firenze 20 maggio 2013 SOMMARIO

Dettagli

Blog. Per un blog di successo: Sfrutta i Motori di Ricerca (MdR) e le Directory per ottenere visibilità e monitorare la blogosfera.

Blog. Per un blog di successo: Sfrutta i Motori di Ricerca (MdR) e le Directory per ottenere visibilità e monitorare la blogosfera. BLOG, Motori di Ricerca e Motori Motori Motori Motori Motori Motori Motori di di di di di di di Ricerca Ricerca Ricerca Ricerca Ricerca Ricerca Ricerca e e e e e e e www.qualitascuola.com/bdc www.qualitascuola.com/bdc

Dettagli

MONIWEB Analisi dell immagine in Web 2.0

MONIWEB Analisi dell immagine in Web 2.0 MONIWEB Analisi dell immagine in Web 2.0 Eikon Strategic Consulting. Nessuna parte di questo documento puo essere usato o riprodotto senza permesso scritto INDICE Cos è il Web 2.0? Web 2.0 e la sua influenza

Dettagli

WEB MARKETING 2.0. La nuova proposta di implementazione di un progetto Marketing 2.0

WEB MARKETING 2.0. La nuova proposta di implementazione di un progetto Marketing 2.0 WEB MARKETING 2.0 La nuova proposta di implementazione di un progetto Marketing 2.0 È un stato di evoluzione del Web, caratterizzato da strumenti e piattaforme che enfatizzano la collaborazione e la condivisione

Dettagli

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire La società Volocom Trasformare le informazioni in conoscenza 2 La società Volo.com dal 2001 è uno dei leader nei settori del Knowledge Management e nella gestione delle informazioni per la rassegna stampa

Dettagli

Guida all elaborazione della Tesi

Guida all elaborazione della Tesi Università degli Studi di Torino Scuola di Medicina Dipartimento di Scienze della Sanità Pubblica e Pediatriche Corso di Laurea in Infermieristica Sedi Torino (Città della Salute, TO2, TO4) Guida all elaborazione

Dettagli

Search Engine Optimization per Calciomercato.it

Search Engine Optimization per Calciomercato.it www.mamadigital.com Search Engine Optimization per Calciomercato.it Mamadigital srl - Sede legale e operativa: Via Conegliano, 18-00182 Roma C.F. e P. iva 09738901009 Phone: +39 0670614560 Fax: +39 0670391132

Dettagli

SOCIAL NETWORK MANUALE OPERATIVO

SOCIAL NETWORK MANUALE OPERATIVO SOCIAL NETWORK MANUALE OPERATIVO 1 INTRODUZIONE I social media sono diventati uno strumento essenziale di comunicazione e marketing e vengono utilizzati da utenti di ogni fascia di età: dai teenager agli

Dettagli

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE di K A T H A G E D O R N, A R G U S A S S O C I A T E S MARZO 2 0 0 0 traduzione di: BARBARA WIEL MARIN DICEMBRE 2009 1 GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

Dettagli

Basi di Dati Multimediali. Fabio Strocco

Basi di Dati Multimediali. Fabio Strocco Basi di Dati Multimediali Fabio Strocco September 19, 2011 1 Contents 2 Introduzione Le basi di dati (o database) hanno applicazioni in molti campi, in cui è necessario memorizzare, analizzare e gestire

Dettagli

10 ingredienti da tenere sempre in cucina ovvero,

10 ingredienti da tenere sempre in cucina ovvero, 10 ingredienti da tenere sempre in cucina ovvero, la SEO Checklist per andare a cena con Google Licenza Creative Commons - Non commerciale - Non opere derivate 3.0 Unported (CC BY-NC-ND 3.0) introduzione

Dettagli

Prato cresce con il digitale. Migliorare la propria posizione sul web

Prato cresce con il digitale. Migliorare la propria posizione sul web Prato cresce con il digitale Migliorare la propria posizione sul web Prato cresce con il digitale Come rendere il sito visibile dai motori di ricerca Programma 1. 2. 3. 4. 5. 6. 7. Cos'è una SERP Cosa

Dettagli

L ERA DIGITALE E LE NUOVE TENDENZE DELLA COMUNICAZIONE

L ERA DIGITALE E LE NUOVE TENDENZE DELLA COMUNICAZIONE PRESENTAZIONE N #2 L ERA DIGITALE E LE NUOVE TENDENZE DELLA COMUNICAZIONE 30 novembre 2015 SOMMARIO #1. LO SCENARIO NELL ERA DIGITALE #2. DALLA RECLAME ALLA WEB REPUTATION #3. DALL OUTBOUND MARKETING ALL

Dettagli

Francesco Fabbri Social Business Intelligence in Amadori Quando l'ascolto e la comprensione della rete si traducono in vantaggio competitivo per il

Francesco Fabbri Social Business Intelligence in Amadori Quando l'ascolto e la comprensione della rete si traducono in vantaggio competitivo per il Francesco Fabbri Social Business Intelligence in Amadori Quando l'ascolto e la comprensione della rete si traducono in vantaggio competitivo per il Business Agenda La Social BI in Amadori:Ambito & Obiettivi

Dettagli

WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence

WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence 1 WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence WOSM è un sistema di media monitoring unico al mondo. Restituisce percorsi di lettura dei dati trasversali, fruibili,

Dettagli

Estratto del capitolo 5 Edizione italiana a cura di Studio Pleiadi

Estratto del capitolo 5 Edizione italiana a cura di Studio Pleiadi Estratto del capitolo 5 Edizione italiana a cura di Studio Pleiadi 1. Come funzionano i motori di ricerca Una panoramica generale sul funzionamento dei motori di ricerca risultati). 2. Come le persone

Dettagli

Indagini statistiche attraverso i social networks

Indagini statistiche attraverso i social networks Indagini statistiche attraverso i social networks Agostino Di Ciaccio Dipartimento di Scienze Statistiche Università degli Studi di Roma "La Sapienza" SAS Campus 2012 1 Diffusione dei social networks Secondo

Dettagli

Audiovisivo 2.0: scenari e strumenti della rete

Audiovisivo 2.0: scenari e strumenti della rete Audiovisivo 2.0: scenari e strumenti della rete Associazione Documentaristi Emilia Romagna 12 aprile 2012 obiettivi come i nuovi strumenti digitali possono diventare veri e propri alleati per la formazione

Dettagli

Strumenti per i Social Media a supporto del Marketing Digitale. 23 Novembre 2015 Antonio Parlato

Strumenti per i Social Media a supporto del Marketing Digitale. 23 Novembre 2015 Antonio Parlato Strumenti per i Social Media a supporto del Marketing Digitale 23 Novembre 2015 Antonio Parlato Contesto Social Convivenza Utenti e Brand Nuovi canali, nuove figure professionali (spesso incomprensibili)

Dettagli

PRESS, WEB, SOCIAL: l'ascolto multicanale per una comunicazione integrata

PRESS, WEB, SOCIAL: l'ascolto multicanale per una comunicazione integrata Gianfranco Bozzetto Business Development Mimesi Viviana Venneri Responsabile Marketing Blogmeter PRESS, WEB, SOCIAL: l'ascolto multicanale per una comunicazione integrata Un habitat complesso per le aziende

Dettagli

Introduzione all Information Retrieval

Introduzione all Information Retrieval Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information

Dettagli

FACEBOOK IN TOURISM Destinazioni turistiche e Social Network

FACEBOOK IN TOURISM Destinazioni turistiche e Social Network + FACEBOOK IN TOURISM Destinazioni turistiche e Social Network A cura di Roberta Garibaldi e Roberto Peretta Ed. FrancoAngeli 2011 I contenuti generati dagli utenti hanno oggi una riconosciuta importanza

Dettagli

Cercare informazioni sul Web

Cercare informazioni sul Web Fluency Cercare informazioni sul Web Capitolo 4 Guardare nel posto giusto cosa cerco mondo fisico Web per avere informazioni su contributi pensionistici INPS www.inps.it per trovare un percorso tra due

Dettagli

SEMINARIO. Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista. Di Marco Alessia

SEMINARIO. Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista. Di Marco Alessia SEMINARIO Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista Di Marco Alessia ARGOMENTI TRATTATI Saranno affrontati separatamente due diversi argomenti, fondamentali per la realizzazione di

Dettagli

Chi, Cosa, Come, Quando e Dove parlano di te

Chi, Cosa, Come, Quando e Dove parlano di te Chi, Cosa, Come, Quando e Dove parlano di te Analizzare il listening per monitorare il sentiment e pianificare correttamente l attività di Social Media e Digital Pr Agenda Ci presentiamo! MM One Group

Dettagli

I brand automotive in rete. 1 gennaio 31 marzo 2014

I brand automotive in rete. 1 gennaio 31 marzo 2014 I brand automotive in rete 1 gennaio 31 marzo 2014 Indice SINTESI BRAND & TEMI FONTI SENTIMENT FACEBOOK TWITTER Blogmeter 2014 www.blogmeter.it 2 Perimetro di analisi 01 gennaio 31 marzo 2014 Periodo di

Dettagli

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG 16 gennaio 2015 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG Introduzione Le attività dei blogger I social influencer

Dettagli

Le Basi di dati: generalità. Unità di Apprendimento A1 1

Le Basi di dati: generalità. Unità di Apprendimento A1 1 Le Basi di dati: generalità Unità di Apprendimento A1 1 1 Cosa è una base di dati In ogni modello di organizzazione della vita dell uomo vengono trattate informazioni Una volta individuate e raccolte devono

Dettagli

Chi, Cosa, Come, Quando e Dove parlano di te

Chi, Cosa, Come, Quando e Dove parlano di te Chi, Cosa, Come, Quando e Dove parlano di te Analizzare il listening per monitorare il sentiment e pianificare correttamente l attività di Social Media e Digital Pr Mauro Cunial, Amministratore Delegato

Dettagli

TECNICHE DI VALUTAZIONE DEL RISCHIO

TECNICHE DI VALUTAZIONE DEL RISCHIO Per conto di AICQ CN 1 - Autore Giovanni Mattana - Consigliere di Giunta AICQ CN Presidente della Commissione UNI per i Sistemi di Qualità La norma è intesa come un supporto per la Iso 31000 e fornisce

Dettagli

Francesco Fabbri Social Business Intelligence in Amadori: i vantaggi della Text Analytics, la soluzione C2B

Francesco Fabbri Social Business Intelligence in Amadori: i vantaggi della Text Analytics, la soluzione C2B Francesco Fabbri Social Business Intelligence in Amadori: i vantaggi della Text Analytics, la soluzione C2B Agenda La Social BI per Amadori:Ambito & Obiettivi Il Progetto - WebMonitoring - Il Motore -

Dettagli

MY.SO: una panoramica

MY.SO: una panoramica MY.SO: una panoramica Principali funzionalità di MY.SO Funzionalità Gestione dei profili utente Gestione delle relazioni di amicizia Wall e sistema di messaggistica interno News Feed e Mini-feed Album

Dettagli

cos è l architettura dell informazione?

cos è l architettura dell informazione? Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 3. Architettura dell informazione cos è l architettura dell informazione? E la progettazione di spazi informativi

Dettagli

Cosa contraddistingue Mimesi

Cosa contraddistingue Mimesi Cosa contraddistingue Mimesi Mimesi ha tra i suoi azionisti Digital Magics, uno dei più grandi incubatori di start-up nel mercato italiano Mimesi fa parte del gruppo DBInformaton, leader nei servizi di

Dettagli

Comunicazione Social per il Non Profit

Comunicazione Social per il Non Profit WEB 2.0 Comunicazione Social per il Non Profit Federica Vangelisti Marzo - Giugno 2014 Cos e` il Web 2.0? E` l insieme delle applicazioni online che permettono un elevato livello di interazione tra l utente,

Dettagli

Indicazioni pratiche per realizzare una campagna marketing digitale

Indicazioni pratiche per realizzare una campagna marketing digitale Indicazioni pratiche per realizzare una campagna marketing digitale La fase strategia SEO: la scelta delle keyword Questa fase è fondamentale, qualunque attività SEO risulta essere priva di senso se non

Dettagli

A cura di Claudia Zarabara scrivi@claudiazarabara.it Gennaio 2013

A cura di Claudia Zarabara scrivi@claudiazarabara.it Gennaio 2013 Web e Social Network: non solo comunicazione ma condivisione A cura di Claudia Zarabara scrivi@claudiazarabara.it Gennaio 2013 Dal Web 1.0 al Web 2.0 WEB 1.0 USO LA RETE WEB 2.0 SONO IN RETE WEB 2.0 SIAMO

Dettagli

COMUNICARE LA CITTÀ COME DESTINAZIONE TURISTICA CULTURALE. UN METODO PER VALUTARE LA QUALITÀ. Luisa Mich, Nicola Zeni

COMUNICARE LA CITTÀ COME DESTINAZIONE TURISTICA CULTURALE. UN METODO PER VALUTARE LA QUALITÀ. Luisa Mich, Nicola Zeni COMUNICARE LA CITTÀ COME DESTINAZIONE TURISTICA CULTURALE. UN METODO PER VALUTARE LA QUALITÀ DELLA COMUNICAZIONE ONLINE Luisa Mich, Nicola Zeni Schema [Il problema] L efficacia della comunicazione [L approccio]

Dettagli

ANNARITA: Il database Object Relational dell Anagrafe Nazionale delle Ricerche

ANNARITA: Il database Object Relational dell Anagrafe Nazionale delle Ricerche ANNARITA: Il database Object Relational dell Anagrafe Nazionale delle Ricerche Alex Manzo CILEA, Roma Abstract Nell ottica di un potenziamento e arricchimento dei dati dell Anagrafe Nazionale delle Ricerche

Dettagli

Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale

Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale Esperienze di Apprendimento Automatico per il corso di lippi@dsi.unifi.it Dipartimento Sistemi e Informatica Università di Firenze Dipartimento Ingegneria dell Informazione Università di Siena Introduzione

Dettagli

Università della Svizzera italiana

Università della Svizzera italiana Università della Svizzera italiana Il sito dell Università della Svizzera italiana e l accessibilità Vs.1.0 11 / 12 / 2007 TEC-LAB WEB-SERVICE 1. INTRODUZIONE Avere accesso al web, per un utente disabile,

Dettagli

Monitoraggio e gestione dell IDoc per i sistemi SAP

Monitoraggio e gestione dell IDoc per i sistemi SAP Libelle EDIMON Monitoraggio e gestione dell IDoc per i sistemi SAP Versione documento: 3.0 Un operazione IDoc correttamente funzionante e senza interruzioni è una parte essenziale dell esecuzione dei processi

Dettagli

Web 2.0: applicativi in medicina Roma, 9-10 dicembre 2013

Web 2.0: applicativi in medicina Roma, 9-10 dicembre 2013 Corso Web 2.0: applicativi in medicina Roma, 9-10 dicembre 2013 biblioire@ifo.it Fabio D Orsogna Francesca Servoli int. 6225 Che cos è un BLOG? Un blog è un particolare tipo di sito web, ma con delle

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO -

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - 1 CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - Corsi di Laurea in Informatica, Ing. Informatica, Ing. di Internet (a.a. 2013-2014) Roberto Basili 2 Overview WM&R: Motivazioni e prospettive

Dettagli

Tilde WCM. Data. Moduli base. Versione 1.0. 29 Settembre 2011. giovedì 29 settembre 11

Tilde WCM. Data. Moduli base. Versione 1.0. 29 Settembre 2011. giovedì 29 settembre 11 Tilde WCM Moduli base Versione 1.0 29 Settembre 2011 Data IL CMS TILDE Il CMS o Content Management System, è lo strumento maggiormente utilizzato in qualsiasi progetto web. Ormai viene attivato su qualsiasi

Dettagli

Indice dei contenuti

Indice dei contenuti Gesttiione Knowlledge Base Serrviiziio dii Conttactt Centterr 055055 Manualle dii consullttaziione Indice dei contenuti 1. Introduzione... 4 2. Modalità di accesso alle informazioni... 5 2.1. Accesso diretto

Dettagli

Web & Social Big Data Monitoring and Analysis. www.web-live.it

Web & Social Big Data Monitoring and Analysis. www.web-live.it Web & Social Big Data Monitoring and Analysis www.web-live.it 1 Ascolto e analisi del web e dei social Le 7 buone ragioni 1. Valutare e misurare l efficacia della propria comunicazione 2. Scoprire le tendenze

Dettagli

Il catalogo MANAGEMENT Si rivolge a: Imprenditori con responsabilità diretta. Quadri sulla gestione

Il catalogo MANAGEMENT Si rivolge a: Imprenditori con responsabilità diretta. Quadri sulla gestione 6 Il catalogo MANAGEMENT Si rivolge a: Imprenditori con responsabilità diretta Quadri sulla gestione Impiegati con responsabilità direttive Dirigenti di imprese private e organizzazioni pubbliche, interessati

Dettagli

CICLO DI SEMINARI AVANZATI SUI METODI E LE TECNICHE DELLA RICERCA QUALITATIVA PROGRAMMI DEI SEMINARI

CICLO DI SEMINARI AVANZATI SUI METODI E LE TECNICHE DELLA RICERCA QUALITATIVA PROGRAMMI DEI SEMINARI Il Master di Secondo Livello in QR-M&S RICERCA QUALITATIVA PER IL MARKETING E IL SOCIALE Quarta Edizione - A.A. 2012-2013 propone un CICLO DI SEMINARI AVANZATI SUI METODI E LE TECNICHE DELLA RICERCA QUALITATIVA

Dettagli

Software. Definizione, tipologie, progettazione

Software. Definizione, tipologie, progettazione Software Definizione, tipologie, progettazione Definizione di software Dopo l hardware analizziamo l altra componente fondamentale di un sistema di elaborazione. La macchina come insieme di componenti

Dettagli

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Obiettivi. Presentare l evoluzione dei sistemi informativi: da supporto alla operatività a supporto al momento decisionale Definire

Dettagli

Laurea Magistrale in Linguistica Teorica, Applicata e delle Lingue Moderne. Tirocini già attivati e docenti di riferimento

Laurea Magistrale in Linguistica Teorica, Applicata e delle Lingue Moderne. Tirocini già attivati e docenti di riferimento Laurea Magistrale in Linguistica Teorica, Applicata e delle Lingue Moderne Tirocini già attivati e docenti di riferimento Ciascuno dei tirocini proposti è valevole ai fini del riconoscimento dei 6 CFU

Dettagli

Mining Positive and Negative Association Rules:

Mining Positive and Negative Association Rules: Mining Positive and Negative Association Rules: An Approach for Confined Rules Alessandro Boca Alessandro Cislaghi Premesse Le regole di associazione positive considerano solo gli item coinvolti in una

Dettagli

anthericacms Il sistema professionale per la gestione dei contenuti del tuo sito web Versione 2.0

anthericacms Il sistema professionale per la gestione dei contenuti del tuo sito web Versione 2.0 anthericacms Il sistema professionale per la gestione dei contenuti del tuo sito web Versione 2.0 Email: info@antherica.com Web: www.antherica.com Tel: +39 0522 436912 Fax: +39 0522 445638 Indice 1. Introduzione

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

CONTENT MANAGMENT SYSTEMS

CONTENT MANAGMENT SYSTEMS CONTENT MANAGMENT SYSTEMS ESTRATTO DA: Ileana D'Incecco, Progettare la comunicazione web per organizzazioni non-profit con strumenti open source: ideazione e realizzazione del sito web della Casa delle

Dettagli

STRUMENTI ONLINE PER STUDIARE LA CONCORRENZA, RICERCARE FONTI DI VISIBILITÀ E CONOSCERE I TREND DI MERCATO

STRUMENTI ONLINE PER STUDIARE LA CONCORRENZA, RICERCARE FONTI DI VISIBILITÀ E CONOSCERE I TREND DI MERCATO STRUMENTI ONLINE PER STUDIARE LA CONCORRENZA, RICERCARE FONTI DI VISIBILITÀ E CONOSCERE I TREND DI MERCATO Argomenti: 1. Volume di traffico e ricerche (trend del momento) 2. Analisi competitor (semplice

Dettagli

Internet e Storia. Internet. INTERNET, uno strumento per la didattica della storia

Internet e Storia. Internet. INTERNET, uno strumento per la didattica della storia INTERNET, uno strumento per la didattica della storia Internet e Storia Internet Internet è come la più grande rete mondiale ed anche detta rete delle reti che collega centinaia di milioni di computer.

Dettagli

Panorama Necto Introduzione delle caratteristiche funzionali

Panorama Necto Introduzione delle caratteristiche funzionali Reggio Emilia, 14/04/15 Panorama Necto Introduzione delle caratteristiche funzionali La piattaforma Necto mette a disposizione una serie di strumenti di Business Intelligence utili per agganciare, visualizzare,

Dettagli

Introduzione alla Business Intelligence

Introduzione alla Business Intelligence SOMMARIO 1. DEFINIZIONE DI BUSINESS INTELLIGENCE...3 2. FINALITA DELLA BUSINESS INTELLIGENCE...4 3. DESTINATARI DELLA BUSINESS INTELLIGENCE...5 4. GLOSSARIO...7 BIM 3.1 Introduzione alla Pag. 2/ 9 1.DEFINIZIONE

Dettagli

WEB 2.0 PER CRESCERE. Sfruttare le potenzialità del Web 2.0 per far conoscere la Lunigiana

WEB 2.0 PER CRESCERE. Sfruttare le potenzialità del Web 2.0 per far conoscere la Lunigiana WEB 2.0 PER CRESCERE Sfruttare le potenzialità del Web 2.0 per far conoscere la Lunigiana Web 2.0 L'insieme di tutte quelle applicazioni online che permettono uno spiccato livello di interazione tra il

Dettagli

Webinar. Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca

Webinar. Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Webinar Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Webinar Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Scenario Scenario: I risultati

Dettagli

La ricerca estensiva Perché?

La ricerca estensiva Perché? RICERCA ESTENSIVA La ricerca estensiva Perché? Per misurare e validare in termini estensivi la percezione e decodifica da parte dei soggetti destinatari; ma anche per segmentarli in modo appropriato Per

Dettagli

ACRL Association of College and Research Libraries

ACRL Association of College and Research Libraries ACRL Association of College and Research Libraries Standard delle competenze per il possesso dell informazione (information literacy) nell educazione superiore Standard, indicatori di performance, obiettivi

Dettagli

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO -

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - 1 CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - Corsi di Laurea in Informatica, Ing. Informatica, Ing. di Internet (a.a. 2015-2016) Roberto Basili 2 Overview WM&R: Motivazioni e prospettive

Dettagli

Case history Miss Broadway

Case history Miss Broadway E giunto il momento per i brand di non preoccuparsi più dei social media, ma solo di goderne i benefici. Case history Miss Broadway Paglieri Sell System Miss Broadway http://www.missbroadway.it/ http://www.facebook.com/miss.broadway.makeup

Dettagli

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Dettagli

PRESENTAZIONE Time & Mind

PRESENTAZIONE Time & Mind PRESENTAZIONE Time & Mind Febbraio 2008 Time & Mind srl C.so Svizzera, 185 10149 Torino T +39 011 19505938 www.timeandmind.com - info@timeandmind.com Ecosistemi Digitali al servizio delle aziende L agenzia

Dettagli

Alfresco ECM. La gestione documentale on-demand

Alfresco ECM. La gestione documentale on-demand Alfresco ECM La gestione documentale on-demand Alfresco 3.2 La gestione documentale on-demand Oltre alla possibilità di agire sull efficienza dei processi, riducendone i costi, è oggi universalmente conosciuto

Dettagli

Vision. highlights. la soddisfazione di ampliare i confini dell azienda. Un portale che fa!

Vision. highlights. la soddisfazione di ampliare i confini dell azienda. Un portale che fa! la soddisfazione di ampliare i confini dell azienda Un portale che fa! Il portale aziendale è un luogo di lavoro. Gemino è un Portal Application ricco di contenuti applicativi pronti all uso! highlights

Dettagli

Introduzione alle tecniche di Data Mining. Prof. Giovanni Giuffrida

Introduzione alle tecniche di Data Mining. Prof. Giovanni Giuffrida Introduzione alle tecniche di Data Mining Prof. Giovanni Giuffrida Programma Contenuti Introduzione al Data Mining Mining pattern frequenti, regole associative Alberi decisionali Clustering Esempio di

Dettagli

Uno standard per il processo KDD

Uno standard per il processo KDD Uno standard per il processo KDD Il modello CRISP-DM (Cross Industry Standard Process for Data Mining) è un prodotto neutrale definito da un consorzio di numerose società per la standardizzazione del processo

Dettagli

SMART TOURISM 2.0: 90 ORE DI TEORIA 300 ORE DI STAGE GARANTITO. TIME VISION Agenzia Formativa accreditata Regione Campania

SMART TOURISM 2.0: 90 ORE DI TEORIA 300 ORE DI STAGE GARANTITO. TIME VISION Agenzia Formativa accreditata Regione Campania SMART TOURISM 2.0: Esperto in tecnologie e strategie digitali per la promozione turistica 90 ORE DI TEORIA 300 ORE DI STAGE GARANTITO Corso di Formazione promosso e organizzato da TIME VISION Agenzia Formativa

Dettagli

SOLUZIONE DI PROTOCOLLO INFORMATICO E DI GESTIONE ELETTRONICA DEI DOCUMENTI

SOLUZIONE DI PROTOCOLLO INFORMATICO E DI GESTIONE ELETTRONICA DEI DOCUMENTI Sede amministrativa Via E. Ramarini, 7 00015 Monterotondo Scalo Roma Tel. + 39 06 90.60.181 Fax. + 39 06.90.69.208 info@bucap.it www.bucap.it Sede legale Via Innocenzo XI, 8 00165 Roma Se d SOLUZIONE DI

Dettagli

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE Il sistema di ricerca della biblioteca virtuale permette di accedere in maniera rapida ai materiali didattici di interesse degli studenti presenti all interno del

Dettagli

Pubblichiamo il documento contenente gli indicatori approvati dal Collegio dei Docenti del nostro Istituto Comprensivo che sarà allegato alla scheda

Pubblichiamo il documento contenente gli indicatori approvati dal Collegio dei Docenti del nostro Istituto Comprensivo che sarà allegato alla scheda Pubblichiamo il documento contenente gli indicatori approvati dal Collegio dei Docenti del nostro Istituto Comprensivo che sarà allegato alla scheda di valutazione delle classi di Scuola Primaria C. Goldoni

Dettagli

Il social network dei blog italiani La mappa dei blogosfera italiana Febbraio 2005

Il social network dei blog italiani La mappa dei blogosfera italiana Febbraio 2005 liani 2005 Il social network dei blog italiani La mappa dei blogosfera italiana Febbraio 2005 1 Il Social Network dei blog italiani Introduzione...4 La dimensione della blogosfera...5 Percorsi della blogosfera...7

Dettagli

Indice generale. Introduzione...xi. Ringraziamenti...xii. Il marketing su Google: come e soprattutto perché funziona...1

Indice generale. Introduzione...xi. Ringraziamenti...xii. Il marketing su Google: come e soprattutto perché funziona...1 Indice generale Introduzione...xi Perché dovete leggere questo libro... xii A chi è rivolto... xii Ringraziamenti...xii Capitolo 1 Capitolo 2 Il marketing su Google: come e soprattutto perché funziona...1

Dettagli

SOLUZIONI WEB. per il BUSINESS. www.italiainfiera.it. www.italiainfiera.it

SOLUZIONI WEB. per il BUSINESS. www.italiainfiera.it. www.italiainfiera.it SOLUZIONI WEB per il BUSINESS Italiainfiera, società di consulenza per il marketing e la comunicazione on line, opera professionalmente dal 1999 fornendo competenze altamente qualificate alle aziende interessate

Dettagli