POLITECNICO DI MILANO

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "POLITECNICO DI MILANO"

Transcript

1 POLITECNICO DI MILANO FACOLTÀ DI INGEGNERIA DELL INFORMAZIONE Corso di Laurea Specialistica in Ingegneria Informatica METODOLOGIA PER L AGGIORNAMENTO CONTINUO DI UNA RETE SEMANTICA ORIENTATA ALLA SENTIMENT ANALYSIS NEI SOCIAL MEDIA Relatore: Chiar.ma Prof.ssa Chiara FRANCALANCI Correlatore: Dott. Ing. Donato BARBAGALLO Tesi di Laurea di: Daniele GARBUGLI Matr Anno Accademico

2 Daniele Garbugli METODOLOGIA PER L AGGIORNAMENTO CONTINUO DI UNA RETE SEMANTICA ORIENTATA ALLA SENTIMENT ANALYSIS NEI SOCIAL MEDIA Tesi di laurea magistrale Milano, Marzo 2011 Relatore: Prof.ssa Chiara FRANCALANCI Correlatore: Dr. Donato BARBAGALLO i

3 Abstract Blogs, forums and social networks are by now a widespread reality in the Internet world. Tens of millions of users use these tools to express their opinions and feelings, producing huge volumes of non-structured textual data. These data represent a priceless source of value for anyone that would like to know the Web reputation for a brand of any type, from products to services, from cities to people. We need sophisticated applications of Natural Language Processing to be able to deduce useful information from the huge amount of raw data; one of them is Sentiment Analysis that recognizes positive or negative sentiment enclosed in a message written in natural language. Moreover, the identification of the sentiment polarity in a document has to be associated to the ability of understanding to which components and qualities of the subject we could assign the judgment expressed by the author. An effective analysis of Web reputation of a brand requires the tool of sentiment analysis to be able to understand users average judgment about the different features that describe the brand and that in the whole form an attractivity model. This thesis deals with the problem of outlining a methodology to define the attractivity model of a brand; we want the model to respect requirements of completeness and accuracy and to be always updated, consistent with its dynamism and the dynamism of the domain it belongs to. The identification of the brand's features requires both a deep knowledge of the domain by an expert and the automatic work performed by the tool which, starting from volume of speech, has to extract new brand's ii

4 Abstract features and suggest to the user their positioning in the model in order to enhance future analysis. These two tasks are peculiar also to another kind of analysis that is dealt with in this thesis, that is the topic trend detection; it consists of two steps: first of all the detection of words that have recently shown a burst, than the attempt at proposing to the user the interpretation of the argument which hides behind these words and the event that could have generate the burst. This research work aims also to define some tools that help the user to understand these kind of information. iii

5 Sommario Blog, forum e social network sono ormai da anni una realtà consolidata del mondo Internet. Decine di milioni di utenti utilizzano questi strumenti per esprimere le proprie opinioni e le proprie sensazioni, producendo imponenti volumi di dati testuali non strutturate. Questi dati rappresentano una fonte inestimabile di valore per chiunque voglia conoscere la reputazione online di un brand di qualunque natura, dai prodotti ai servizi, dalle città alle persone. Per riuscire a ricavare informazioni utili dall enorme mole di dati servono sofisticate applicazioni di Natural Language Processing: una su tette la Sentiment Analysis, che ha come obiettivo il riconoscimento della positività o negatività (sentiment) racchiusi in un messaggio scritto in linguaggio naturale. Il riconoscimento della polarità del sentiment in un documento deve inoltre essere accompagnato dalla capacità di comprendere a quale soggetto tale sentiment va attribuito. E ancora più interessante sarebbe riuscire a capire a quali componenti e qualità del soggetto si può attribuire il giudizio espresso dall autore. Un efficace analisi della Web reputation di un brand richiede che il tool di sentiment analysis riesca a comprendere il giudizio medio degli utenti sulle varie caratteristiche che descrivono il brand e che nel loro complesso formano il suo modello di attrattività. Scopo di questa tesi è di tracciare una metodologia per definire il modello di attrattività di un brand; si vuole che tale modello rispetti i requisiti di completezza e correttezza e che sia sempre aggiornato, in linea con la dinamicità sua e del dominio in cui si colloca. Il riconoscimento delle caratteristiche del brand richiede sia la conoscenza di dominio di un esperto, sia il lavoro automatico del tool che, iv

6 Sommario partendo dai volumi di parlato, deve riconoscere nuove feature del brand e suggerire all utente la collocazione nel modello per migliorare le analisi successive. Questi due task sono propri anche di un altro tipo di analisi che è oggetto di studio in questa tesi, ovvero la topic trend detection; essa consiste di due fasi: prima il rilevamento di parole che recentemente hanno evidenziato un picco di occorrenze, poi il tentativo di suggerire all utente una chiave di lettura per comprendere l argomento che si cela dietro queste parole e l evento che ha scatenato il picco. Questo lavoro di tesi intende anche definire una serie di strumenti che facilitino questo tipo di comprensione all utente. v

7 Ringraziamenti Milano, Marzo 2011 Daniele Garbugli vi

8 Indice Abstract...ii Sommario... iv Ringraziamenti... vi Indice... vii Lista delle Figure... x Lista delle Tabelle... xiii Capitolo 1 Introduzione... 1 Capitolo 2 Stato dell arte La modellazione di dominio Il concetto di modello e di dominio La costruzione del modello L analisi di frequenza Tool di mercato La categorizzazione Definizione del problema Approcci risolutivi Capitolo 3 Il progetto La sentiment analysis Tool di mercato Il progetto: obiettivi, funzionalità e innovazione Analisi degli influencer Analisi dei trend Gestione delle crisi L interfaccia mashup L approccio alla data quality vii

9 Indice Capitolo 4 Studio di fattibilità per un progetto di sentiment analysis Analisi dei costi Analisi manuale del sentiment Analisi automatica del sentiment Analisi a confronto Conclusioni Capitolo 5 Metodologia di definizione e raffinamento del modello Vocabolario Terminologia dell analista Terminologia del progettista Metodologia di definizione del modello Definizione di categorie, sottocategorie e qualità Creazione di elenchi di tag per la rete semantica Importazione massiva di tag nella rete semantica La scelta di tag identificatori Analisi del rumore Crawling: ricerca di post tramite keywords Word Sense Disambiguation Categorizzazione di post Analisi di copertura Ricerca semiautomatica di nuovi tag Analisi ciclica Capitolo 6 Revisione del modello e analisi dei topic trend Le tipologie di parole da analizzare La selezione di tag candidati: l analisi di frequenza La metrica I parametri Clustering per tipologia di parola viii

10 Indice 6.3 Algoritmi di categorizzazione di tag Analisi a livello di post Analisi a livello di n-grammi Schema complessivo Analisi dei trend Clustering Mashup con servizi esterni Funzionalità per l utente Proposta di mockup dell interfaccia grafica Capitolo 7 Test e risultati Test sull analisi di frequenza: il caso del vulcano Il dataset Il test I risultati Conclusioni Test sulla categorizzazione di tag: il caso del vulcano Analisi a livello di post Analisi a livello di n-grammi Conclusioni Test congiunti per la topic trend detection Il dataset Il test I risultati Conclusioni Capitolo 8 Conclusioni e sviluppi futuri Bibliografia ix

11 Lista delle Figure Figura 2.1: Tag cloud dal sito in data 12 febbraio Figura 2.2: Passi dell algoritmo di hot topic detection proposto da Bai et al. [7] Figura 2.3: Curva di popolarità per le keyowrd Saddam Hussein. Saddam fu incarcerato il 5 Novembre 2006 e fu giustiziato il 30 Dicembre Le regioni evidenziate in rosso indicano un burst Figura 2.4: Interfaccia grafica del tool GTD Explorer Figura 3.1: Diverse forme di visualizzazione dei risultati dell analisi del sentiment del tool Sysomos Figura 3.2: Ricerca di UCG con filtro sul sentiment dei risultati su Liquida Figura 3.3: Metodologia di Blogmeter per l analisi del passaparola online Figura 3.4: Metodologia di Blogmeter per l analisi del passaparola online Figura 3.5: Screenshot dell interfaccia mashup di WISPO Figura 3.6: Architettura del modulo di clear ing e pruning di WISPO Figura 3.7: Architettura complessiva di WISPO Figura 4.1: Confronto fra le curve di cost della soluzione manuale e automatica per un progetto di sentiment analysis Figura 5.1: Relazione fra le entità gestite dall analista Figura 5.2: Workflow della metodologia di definizione del modello di attrattività Figura 5.3: Esempio di calcolo del rapporto segnale-rumore (SNR) Figura 5.4: Esempio di copertura di un modello x

12 Lista delle Figure Figura 6.1: Casistiche di caratterizzazione di una parola della Bag Of Word Figura 6.2: Relazione fra le tipologie di tag Figura 6.3: Finestre temporali per la metrica Frequency Burst Figura 6.4: Grafico dell andamento del fattore di crescita F al variare del fattore di regolarizzazione c e al crescere della frequenza P del tag nella finestra piccola Figura 6.5: Clustering deile parole della Bag Of Word Figura 6.6: Schema generale di funzionamento della categorizzazione basata su n-grammi Figura 6.7: Relazione della rete semantica sfruttate per ricavare il set di keyword che descrivono un tag Figura 6.8: Categorie allo stesso livello e insieme delle keyword che le descrivono Figura 6.9: Dal tag candidato alla relativa BOW con frequenze Figura 6.10: Struttura dell impianto definito da Chidamber e Kemerer Figura 6.11: Possibile conseguenza della non monotonicità della metrica Figura 6.12: Schema riassuntivo dell attività per l aggiornamento e il raffinamento del modello Figura 6.13: Esempio di schermata di Klout Figura 6.14: Proposta di mockup dell interfaccia grafica per il tool di topic trend detection di WISPO Figura 7.1: Distribuzione dei tweet del dataset dal 12 al 16 aprile Figura 7.2: Andamento del fattore di crescita del burst al crescere della frequenza del tag nella finestra piccola, fissato c=3 (fattore di regolarizzazione) e valore della metrica a 0, Figura 7.3: Distribuzione temporale della parola volcano nei post tra il 14 e il 16 aprile xi

13 Lista delle Figure Figura 7.4: Grafico dei risultati del test di categorizzazione con analisi a livello di post Figura 7.5: Grafici dei risultati dell analisi di frequenza basata su n- grammi, per n crescente e per le quattro metriche M1, M2, M3, M4. L ultima colonna rappresenta la categoria Services&Transport Figura 7.6: Rappresentazione più immediata dei risultati dei 16 grafici. Il nero indica la vittoria della categoria services&transport, il grigio denota non una vittoria ma quasi un pari merito con la categoria vincente e il bianco simboleggia la sconfitta della categoria corretta xii

14 Lista delle Tabelle Tabella 2.1: Alcuni siti Internet che utilizzano i tag per gestire i loro item Tabella 2.2: Alcuni siti Internet che utilizzano i tag per gestire i loro item Tabella 2.3: riassunto dei metodi per problemi di classificazione con machine learning semi-supervisionato Tabella 2.4: Riassunto dell indagine sui metodi di machine learning e classificazione non supervisionata o che utilizza altre sorgenti di conoscenza oltre all eventuale corpus già etichettato Tabella 3.1: Confronto fra le performance di alcuni tool di sentiment analysis Tabella 6.1: Applicazione dei viewpoint alle metriche Tabella 6.2: Resoconto delle proprietà di validazione sulla metrica M Tabella 7.1: Risultati dell analisi di frequenza sul caso di studio del vulcano Tabella 7.2: Risultati del test di categorizzazione con analisi a livello di post Tabella 7.3: Numero di keyword per ogni categoria di primo livello del modello Tabella 7.4: Numero di keyword per ogni categoria di primo livello del modello Tabella 7.5: Valutazione soggettiva sull utilità dei tre servizi per la comprensione dei topic trend xiii

15 Capitolo 1 Introduzione Il Web2.0 è una tecnologia abilitante per molte applicazioni che prima non erano possibili; applicazioni che se da un lato offrono nuove opportunità, dall altro lanciano nuove sfide da affrontare. Uno degli elementi caratterizzanti il Web2.0 è la miriade di informazioni che gli utenti di Internet spontaneamente condividono in blog, forum, siti di review e social network: sono i cosiddetti User Generated Contents (UGC). Si tratta spesso di esperienze, sensazioni e opinioni personali in merito ad un particolare soggetto; queste nel loro complesso, oltre a rappresentare un ampio campione statistico di giudizi sul soggetto, sono anche le stesse informazioni che andranno a influenzare gli altri naviganti, secondo le dinamiche tipiche del passaparola. Per questi motivi molte aziende ed enti stanno decidendo sempre più spesso di affidarsi ad applicazioni di sentiment analysis per monitorare la reputazione online di cui gode il loro brand, in alternativa ai tradizionali sondaggi dispendiosi in termini di tempi e costi. Conoscere il giudizio della gente su un brand è il primo passo per raggiungere la consapevolezza degli ambiti in cui esso è forte e su quali invece necessita di miglioramenti; è il punto di partenza per un adeguata politica di marketing, inteso nel senso più ampio del termine, spaziando dal marketing di prodotto, allo sviluppo del settore turistico, fino alla promozione dell immagine della persona. La social media intelligence offre gli strumenti per leggere le informazioni strutturate e non strutturate che Internet mette a disposizione, al fine di 1

16 Capitolo 1. Introduzione analizzare un brand in tutte le sue sfaccettature, confrontarlo con i competitor e adottare appropriate operazioni di marketing. Il passo preliminare all analisi è la definizione del modello di attrattività del brand, ovvero un astrazione dal dominio a cui il brand appartiene per estrarre le caratteristiche su cui si desidera conoscere il sentiment. Primo obiettivo di questo lavoro di tesi è delineare una metodologia per costruire il modello del brand e tenerlo aggiornato nel tempo in un ottica di apprendimento continuo sul dominio; parallelamente al modello va anche tenuta aggiornata la conoscenza di base utilizzata dal tool di sentiment analysis (nella fattispecie una rete semantica) per comprendere i testi in linguaggio naturale che racchiudono il sentiment. L intenzione è quella di garantire un giusto bilanciamento fra lavoro automatico del tool e contributo manuale dell uomo, ovvero un compromesso fra rapidità e correttezza dell analisi. Saranno trattati nel dettaglio due aspetti chiave della metodologia. Prima l analisi di frequenza, attraverso cui riconoscere direttamente dai volumi di parlato nuove feature che potrebbero essere unite al modello. Poi dei metodi di categorizzazione, che permettano di suggerire all utente la miglior collocazione delle feature nel modello. Il riconoscimento di nuove feature rilevanti avviene tramite un analisi dei topic trend, ovvero gli argomenti di discussione più in voga del momento nella blogsfera. Questo tipo di analisi, nota come topic trend detection, rappresenta il secondo ambito di studio di questa tesi, anche se in realtà condivide parte delle metodologie delineate per la definizione e aggiornamento del modello. Allo stato attuale, la letteratura e i tool di mercato che si occupano di questo tema non danno molto risalto alla comprensione dei trend, limitandosi a segnalarne l esistenza sotto forma di parole più ricorrenti nell ultimo periodo (picchi). In questa tesi si cercherà proprio di suggerire una serie di strumenti da integrare nell interfaccia grafica del tool, che aiutino l utente a comprendere quale argomento effettivamente si nasconde dietro al picco di una parola e qual è l evento che ha alimentato la discussione sul Web. La capacità di cogliere in tempo reale questi trend è molto importante per l utilizzatore del tool, perché permette di rilevare rapidamente eventuali crisi (ovvero polarità negativa sul sentiment) e prendere le migliori decisioni per risolverle prima che la situazione si aggravi. Tra l altro, per gli stessi motivi per cui Internet rappresenta un ottimo strumento per recepire le 2

17 Capitolo 1. Introduzione crisi, esso costituisce anche un canale privilegiato per la loro gestione, in quanto permette di comunicare con molti utenti in poco tempo [52]. La tesi è strutturata come segue. Il capitolo 2 presenta una rassegna dello stato dell arte relativamente a tre argomenti ampiamente sviluppati nei capitoli successivi, che sono la modellazione di dominio, l analisi di frequenza e il problema della categorizzazione di parole. Sul primo argomento si è constatata una carenza di letteratura a riguardo. Sul problema dell analisi di frequenza è emersa l attitudine comune di focalizzare la ricerca di topic trend partendo dalla frequenza con cui occorrono le singole parole. Sul tema della categorizzazione si è notata una tendenza a passare da metodi supervisionati che richiedono training, a metodi non supervisionati completamente automatizzati, anche se questa totale automatizzazione non è praticamente mai raggiunta in quanto è sempre richiesto almeno un minimo intervento umano. Il capitolo 3 racconta il progetto di sentiment analysis in cui si colloca questo lavoro di tesi. Dopo una descrizione del problema della sentimenta analysis e dei tool di mercato più diffusi che la implementano, si passa alla descrizione del progetto in sé, focalizzando l attenzione sui suoi aspetti innovativi e sulle funzionalità che mira ad implementare. Il capitolo 4 offre alcuni spunti per affrontare il problema dello studio di fattibilità che deve precedere un progetto di sentiment analysis per un cliente. Si pone l accento sulle principali variabili che occorre tenere in considerazione, dando particolare rilievo alla prospettiva dei costi, e sulle possibili alternative che si prospettano sulla base dei risultati ottenuti dallo studio. Il capitolo 5 va finalmente nel dettaglio della metodologia per la definizione e aggiornamento del modello di attrattività del brand. La descrizione è preceduta da una breve introduzione sul linguaggio che viene utilizzato nel corso del restante lavoro. Il capitolo 6 entra ancora più nel dettaglio su una parte della metodologia definita. Si parte con l analisi di frequenza, ovvero la ricerca di keyword rilevanti e che per questo si candidano per l analisi successiva. Tale analisi è la categorizzazione delle parole; per questo task sono proposte due possibili soluzioni implementative: la prima si basa su una variante di una metrica tradizionale, mentre per la seconda una nuova metrica viene formulata e validata in modo formale. L ultimo paragrafo 3

18 Capitolo 1. Introduzione affronta il tema della topic trend detection che mette insieme le soluzioni sviluppate nei due paragrafi precedenti con altre funzionalità, il tutto finalizzato al task di rendere intelligibili i picchi trovati sulle parole; il paragrafo si conclude con una proposta di mockup dell interfaccia grafica del tool di topic trend detection. Nel capitolo 7 si descrivono i test svolti sulle varie metriche e gli algoritmi definiti nel corso dei vari capitoli, ovvero sull analisi di frequenza, sulla categorizzazione e sulla topic trend detection. Infine il capitolo 8 riassume tutto il lavoro svolto e trae le dovute conclusioni, accompagnate da suggerimenti per sviluppi futuri rispetto a questo lavoro di tesi.. 4

19 Capitolo 2 Stato dell arte In questo capitolo si discuterà lo stato dell arte relativamente alle principali tematiche affrontate nel corso della tesi, in modo da avere sempre un termine di paragone tra metodologie, metriche e algoritmi proposti e quelli già sviluppati negli ultimi decenni. Molte di queste tematiche richiederebbero una trattazione molto ampia, ma non essendo la completezza scopo di questa tesi, ci si limiterà ad affrontare con più attenzione solo quegli aspetti che si legano maggiormente alle scelte intraprese nel corso del lavoro di tesi. 1.1 La modellazione di dominio La maggior parte degli studi sulla sentiment analysis si sono concentrati sul core di questo problema, ovvero la stima del sentiment di un documento scritto in linguaggio naturale. In meno hanno rivolto la loro attenzione anche alla questione del modello costruito attorno all oggetto (brand) di cui si vuole studiare la reputazione sul Web. Per capire bene la questione del modello, occorre prima comprendere bene la terminologia che sarà adottata, per poi affrontare un indagine su come la questione è stata affrontata in letteratura Il concetto di modello e di dominio 5

20 Capitolo 2. Stato dell arte Con modello del brand si intende una descrizione sufficientemente formale del brand, comprendente l insieme delle caratteristiche che si vogliono monitorare; si potrebbe parlare di modello di attrattività, visto che, dalla prospettiva dei clienti, tali caratteristiche rappresentano i temi su cui essi saranno soliti esprimere dei giudizi in quanto li ritengono importanti; per un motivo analogo si parla spesso anche di modello di successo, mettendo l accento sul fatto che le caratteristiche analizzate sono quelle che determinano il successo del brand [44], proprio nella misura in cui il fatto che se ne discuta implica la loro importanza. Un brand si colloca sempre in un ben determinato dominio, per cui trovare un modello del brand significa anche costruire una rappresentazione del dominio in cui esso si colloca. Per dominio qui si intende una parte del mondo reale costituita da elementi che presentano una qualche correlazione; solitamente infatti si parla di dominio di qualcosa che è proprio l elemento che tiene unito il tutto. Ad esempio nel dominio della città rientrano aspetti come i trasporti, l arte, l accommodation e l intrattenimento. Tutti questi aspetti vengono inseriti nel modello che descrive il dominio; tuttavia la loro selezione non è univoca, ma dipende dalle particolari esigenze dell applicazione che sfrutterà tale modello, per questo si parla spesso anche di dominio applicativo. Ad ogni dominio corrisponde un certo vocabolario, e più il dominio è ristretto, più il linguaggio che lo caratterizza sarà specifico; ad esempio nel dominio della salute rientrano tutti i termini tecnici della medicina, mentre per tornare all esempio del dominio delle città, nel suo vocabolario confluiranno per esempio l elenco dei musei, delle strade e dei ristoranti La costruzione del modello Alcuni studi, pur non parlando esplicitamente di modello, provano comunque a determinare gli elementi che caratterizzano un particolare dominio applicativo e lo fanno tramite sistemi di feature extraction, metodologie bottom-up per fare mining sui documenti in cui sono espressi giudizi sul brand al fine di dedurre le caratteristiche principali oggetto di discussione. Uno di questi studi è quello di Balahur [9] che prende come input una query dell utente il quale dichiara il nome del brand di cui vuole conoscere la Web reputation. Il sistema, sfruttando la conoscenza raccolta dalle reti semantiche WordNet e ConceptNet, scopre in modo 6

21 Capitolo 2. Stato dell arte automatico una serie di feature tipiche del brand specificato dall utente; queste andranno ad aggiungersi ad altre che sarebbero productindependent. Un approccio diverso è seguito da Spangler [52] che tenta di dedurre dai volumi di parlato le caratteristiche più importanti del brand, senza ricorrere a nessuna conoscenza a priori. Il tutto si svolge in due fasi: nella prima si realizzano vari tipi di clustering (che Spangler chiama tassonomie) dei documenti secondo diversi criteri quali vicinanza semantica, correlazione temporale e tipologia di sentiment espresso; a seconda dei casi le categorie possono essere stabilite a priori dall analista oppure possono essere dedotte direttamente dai documenti. Nella seconda fase l analista deve comprendere che cosa effettivamente contengono le categorie delle varie tassonomie per poi cercare correlazioni tra categorie di tassonomie diverse; il tutto si realizza con il supporto di algoritmi automatici di text summarization e metriche di similitudine tra documenti. Il risultato finale è un insieme di categorie ben distinte appartenenti a diverse tassonomie e che descrivono il brand di interesse. Quello che si può notare dallo studio effettuato è che la logica dominante che guida l identificazione delle variabili del modello di attrattività è di tipo bottom-up, in quanto la loro selezione è sostanzialmente automatica e parte direttamente dall analisi dei documenti. Ciò su cui in letteratura si è sostanzialmente concordi è che un sistema di sentiment analysis è fortemente dipendente sia dal dominio che dal linguaggio utilizzato [32]. Tuttavia ci sono stati sforzi per cercar di costruire classificatori di sentiment che siano facilmente adattabili a nuovi domini, ovvero senza grandi sforzi per rifare il training [3,5,53,54] 1.2 L analisi di frequenza Una delle prerogative del Web2.0 è che i contenuti a cui gli utenti accedono sono da loro stessi generati, per questo si parla di User Generated Content (UGC), da Baeza-Yates ritenuti il trend prevalente sul Web [6]. Nella maggior parte dei casi questi contenuti sono testi (blog, forum, social network, enciclopedie collaborative, etc.) e anche quando si tratta di foto o video, questi sono spesso corredati da descrizioni testuali, 7

22 Capitolo 2. Stato dell arte magari espresse semplicemente come elenchi di keyword descrittive comunemente dette tag. Un tag è una parola o un insieme di poche parole che un utente assegna ad un item per descriverlo ed identificarne il contenuto, ovvero il soggetto dell item, le persone coinvolte, il tipo di item e le tematiche connesse. Una definizione esaustiva di tag data da Sen et al [49] ne mette in luce tutti gli aspetti e le funzioni essenziali: descrivere un item; permettere l organizzazione di item, ovvero la loro classificazione; su questa scia è nato il concetto di folksonomia, ovvero la categorizzazione di informazioni generata dagli utenti tramite tag scelti liberamente; facilitare la ricerca di contenuti non necessariamente testuali; consentire un esperienza di social navigation [8], ossia scoprire nuove informazioni grazie al contributo di altri utenti della community. Si evince dunque l aspetto fortemente collaborativo che caratterizza l attività di tagging [28], tipico degli strumenti del Web 2.0. Il tagging si applica a praticamente qualunque tipologia di item. Alcuni siti che fanno un ampio uso di questo strumento e i relativi item sono riportati in tabella 2.1 La pratica del tagging è oramai così diffusa da produrre una quantità enorme di metadati attraverso cui svolgere operazioni di categorizzazione e ricerca; ad esempio Dubinko [20] svolge analisi su un set di 86,8 milioni di tag raccolti su Flickr in 472 giorni. Per questo motivo si è sviluppato un ramo di ricerca focalizzato sull analisi di tag per comprendere quali sono i temi dominanti discussi dagli utenti. La maggior rilevanza di un argomento in un determinato periodo si esprime in termini di burst, ovvero di un aumento della frequenza con cui esso si ripresenta nel volume di parlato; e scendendo ad un livello di analisi più basso, questo a suo volta si traduce in termini di burst delle parole che tipicamente sono utilizzate per parlare di quell argomento. Per questo è possibile mettere sullo stesso piano l analisi dei tag che descrivono gli item e l analisi delle parole che costituiscono un testo; in entrambi i casi c è un item che riguarda un certo argomento e c è un insieme di parole (tag) associate all item e caratterizzanti l argomento. 8

23 Capitolo 2. Stato dell arte Servizio Web Descrizione Flikr Delicious Gmail sito per lo storage e la condivisione di foto ciascuna descritta da una serie di tag direttamente scelti dall utente servizio di social bookmarking dove cioè ad essere taggati sono i siti Internet Web mail che consente all utente di associare un tag (detto label) alle sulla base di regole predeterminate Item taggati Foto Siti Web Technorati motore di ricerca dedicato al mondo dei blog Blog Last.fm Foursquare CiteULike social music Website che consente agli utenti di taggare artisti, album e pezzi social network che consente la geolocalizzazione, ovvero il tagging sui luoghi servizio Web per la condivisione, organizzazione e ricerca di articoli scientifici taggati dai rispettivi autori Artisti, album, brani musicali Mappe Articoli scientifici Tabella 2.1: Alcuni siti Internet che utilizzano i tag per gestire i loro item. Il problema di rilevare i cosiddetti hot topics (o hot events) viene quindi affrontato come ricerca dei burst sulle parole utilizzate in relazione a quell argomento, poco importa che si tratti di tag associati ad item o direttamente delle parole che costituiscono un documento. Uno degli approcci orientati al term burst maggiormente citato in letteratura è quello proposto da Kleinberg [31] che si ispira ai modelli markoviani. Il suo metodo di ricerca di argomenti dominanti in intervalli di tempo limitati parte proprio dalla ricerca di burst sulle parole che costituiscono i documenti. La sequenza di arrivo dei documenti (text stream) viene espressa in termini probabilistici come una distribuzione esponenziale; il modello del flusso di documenti è realizzato con un automa ad infiniti stati che corrispondono ciascuno ad un diverso rate di emissione e l inizio di un burst è dunque rappresentato da una transizione da uno stato più basso ad uno più alto. Si associa un costo alla transizione in modo da scoraggiare burst troppo brevi; per cui il problema della ricerca dei burst diventa un problema di ottimizzazione in 9

Misurare i SOCIAL MEDIA

Misurare i SOCIAL MEDIA www.blogmeter.it Misurare i SOCIAL MEDIA Vincenzo Cosenza @vincos 1 Agenda Il panorama dei social media nel mondo e in Italia Il ROI dei Social Media Un framework per la misurazione e le tecniche di misurazione.

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testuali Il text mining: una definizione Data mining per dati destrutturati ovvero documenti codificati in linguaggio

Dettagli

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da

Dettagli

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire

La società Volocom. Trasformare le informazioni in conoscenza. Conoscere per agire La società Volocom Trasformare le informazioni in conoscenza 2 La società Volo.com dal 2001 è uno dei leader nei settori del Knowledge Management e nella gestione delle informazioni per la rassegna stampa

Dettagli

Seeding e Tracking Come inseminare e misurare i contenuti virali

Seeding e Tracking Come inseminare e misurare i contenuti virali Seeding e Tracking Come inseminare e misurare i contenuti virali OmnicomExpo, Roma 14 maggio 2009 Viralbeat Viral Beat è un centro media 2.0, specializzato nell attivazione di campagne di seeding strategico.

Dettagli

Le nuove tecnologie dell informazione: verso il Social Semantic Web. Roberto Boselli Alessandria 04-05-2007

Le nuove tecnologie dell informazione: verso il Social Semantic Web. Roberto Boselli Alessandria 04-05-2007 Le nuove tecnologie dell informazione: verso il Social Semantic Web Roberto Boselli Alessandria 04-05-2007 Outline Web 2.0 e Semantic Web Social Software Semantica e Ontologie SEDIMENTO 2 Obiettivi Aggiungere

Dettagli

SENTIMENT ANALYSIS SUL WEB CORSO DI PUBBLICITÀ E STRATEGIE DI COMUNICAZIONE INTEGRATA

SENTIMENT ANALYSIS SUL WEB CORSO DI PUBBLICITÀ E STRATEGIE DI COMUNICAZIONE INTEGRATA SENTIMENT ANALYSIS SUL WEB CORSO DI PUBBLICITÀ E STRATEGIE DI COMUNICAZIONE INTEGRATA 2 INDICE 1. BRAND E SOCIAL NETWORK 2. L AVVENTO DEI BIG DATA 3. LA SENTIMENT ANALYSIS 4. METODOLOGIE 1 BRAND E SOCIAL

Dettagli

Web Reputation. PMI & Web Marketing

Web Reputation. PMI & Web Marketing Web Reputation PMI & Web Marketing Cosa puoi fare per la tua reputazione Con il termine identità digitale si intende tutta quella serie di informazioni presenti in rete, la cui considerazione complessiva

Dettagli

PEOPLE CENTERED TECHNOLOGY. Information Hub: modelli, esperienze, idee

PEOPLE CENTERED TECHNOLOGY. Information Hub: modelli, esperienze, idee PEOPLE CENTERED TECHNOLOGY Information Hub: modelli, esperienze, idee Agenda Chi siamo La nostra vision Almawave people centered technologies Il valore di Big data e LinkedOpen Data 54 sedi Italia, Brasile,

Dettagli

Ci becchiamo su Facebook: social network ed educazione, si può fare? Elena Pacetti Università di Bologna elena.pacetti@unibo.it

Ci becchiamo su Facebook: social network ed educazione, si può fare? Elena Pacetti Università di Bologna elena.pacetti@unibo.it Ci becchiamo su Facebook: social network ed educazione, si può fare? Elena Pacetti Università di Bologna elena.pacetti@unibo.it Ciascuno di noi ha oggi a disposizione uno spazio potenzialmente illimitato

Dettagli

SenTaClAus - Sentiment Tagging & Clustering Analysis on web & social contents

SenTaClAus - Sentiment Tagging & Clustering Analysis on web & social contents Via Marche 10 56123 Pisa Phone +39.050.552574 Fax +39.1782239361 info@netseven.it - www.netseven.it P.IVA 01577590506 REGIONE TOSCANA POR CReO FESR 2007 2013 LINEA D INTERVENTO 1.5.a - 1.6 BANDO UNICO

Dettagli

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE di K A T H A G E D O R N, A R G U S A S S O C I A T E S MARZO 2 0 0 0 traduzione di: BARBARA WIEL MARIN DICEMBRE 2009 1 GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

Dettagli

Search Engine Optimization per Calciomercato.it

Search Engine Optimization per Calciomercato.it www.mamadigital.com Search Engine Optimization per Calciomercato.it Mamadigital srl - Sede legale e operativa: Via Conegliano, 18-00182 Roma C.F. e P. iva 09738901009 Phone: +39 0670614560 Fax: +39 0670391132

Dettagli

Webinar. Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca

Webinar. Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Webinar Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Webinar Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Scenario Scenario: I risultati

Dettagli

Indicizzazione terza parte e modello booleano

Indicizzazione terza parte e modello booleano Reperimento dell informazione (IR) - aa 2014-2015 Indicizzazione terza parte e modello booleano Gruppo di ricerca su Sistemi di Gestione delle Informazioni (IMS) Dipartimento di Ingegneria dell Informazione

Dettagli

Linkedin IN PILLOLE. rimani aggiornato dal tuo network. Leonardo Bellini

Linkedin IN PILLOLE. rimani aggiornato dal tuo network. Leonardo Bellini Linkedin IN PILLOLE rimani aggiornato dal tuo network Leonardo Bellini Sommario Benvenuto Personalizzare la diffusione delle attività Alla scoperta di Pulse Influencer e autori su LinkedIn I vantaggi di

Dettagli

Blog. Per un blog di successo: Sfrutta i Motori di Ricerca (MdR) e le Directory per ottenere visibilità e monitorare la blogosfera.

Blog. Per un blog di successo: Sfrutta i Motori di Ricerca (MdR) e le Directory per ottenere visibilità e monitorare la blogosfera. BLOG, Motori di Ricerca e Motori Motori Motori Motori Motori Motori Motori di di di di di di di Ricerca Ricerca Ricerca Ricerca Ricerca Ricerca Ricerca e e e e e e e www.qualitascuola.com/bdc www.qualitascuola.com/bdc

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet

Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet Il Social Media Marketing è strettamente correlato al SEO (Search Engine Optimization).

Dettagli

Strumenti per i Social Media a supporto del Marketing Digitale. 23 Novembre 2015 Antonio Parlato

Strumenti per i Social Media a supporto del Marketing Digitale. 23 Novembre 2015 Antonio Parlato Strumenti per i Social Media a supporto del Marketing Digitale 23 Novembre 2015 Antonio Parlato Contesto Social Convivenza Utenti e Brand Nuovi canali, nuove figure professionali (spesso incomprensibili)

Dettagli

2012 Extreme srl riproduzione riservata

2012 Extreme srl riproduzione riservata Web & Social Media: il BIG DATA* Le aziende devono gestire il BIG DATA perché è attraverso di esso che sviluppano relazioni con i clienti, riscontrano e gestiscono la customer satisfaction, studiano e

Dettagli

Come internet e i social media possono diventare strumento prezioso per le associazioni di volontariato. Firenze, 4 maggio 2015

Come internet e i social media possono diventare strumento prezioso per le associazioni di volontariato. Firenze, 4 maggio 2015 Come internet e i social media possono diventare strumento prezioso per le associazioni di volontariato Firenze, 4 maggio 2015 Un sito statico è un sito web che non permette l interazione con l utente,

Dettagli

Spettabile. Termine attività PREMESSA

Spettabile. Termine attività PREMESSA Spettabile Ogetto: Regione Lazio - Bando per l educazione permanente degli adulti. Misura 1.a di Sistema. Delibera Giunta Regionale n. 30 dell 11/01/2001 - (Pubblicato nel BUR Lazio n.5 del 20 febbraio

Dettagli

Francesco Fabbri Social Business Intelligence in Amadori Quando l'ascolto e la comprensione della rete si traducono in vantaggio competitivo per il

Francesco Fabbri Social Business Intelligence in Amadori Quando l'ascolto e la comprensione della rete si traducono in vantaggio competitivo per il Francesco Fabbri Social Business Intelligence in Amadori Quando l'ascolto e la comprensione della rete si traducono in vantaggio competitivo per il Business Agenda La Social BI in Amadori:Ambito & Obiettivi

Dettagli

Corso di Informatica di Base. Laboratorio 2

Corso di Informatica di Base. Laboratorio 2 Corso di Informatica di Base Laboratorio 2 Motori di Ricerca Sara Casolari Cercare nel posto giusto Andare in posti noti Esempio: per reperire informazioni sui contributi pensionistici chiediamo all INPS

Dettagli

Informatica per le discipline umanistiche 2 lezione 12

Informatica per le discipline umanistiche 2 lezione 12 Informatica per le discipline umanistiche 2 lezione 12 Nella lezione precedente: In realtà non tutto il data mining è dettato dagli interessi economici (commercial) data mining Abbiamo visto risvolti commerciali

Dettagli

Intelligenza Artificiale

Intelligenza Artificiale Intelligenza Artificiale Anno accademico 2008-2009 Information Retrieval: Text Categorization Una definizione formale Sia D il dominio dei documenti Sia C = {c 1,,c C } un insieme di categorie predefinite

Dettagli

Search Marketing. Un investimento misurato dalla pianificazione al ritorno. Luigi Sciolti

Search Marketing. Un investimento misurato dalla pianificazione al ritorno. Luigi Sciolti Search Marketing Un investimento misurato dalla pianificazione al ritorno. Luigi Sciolti 1 About us Luigi Sciolti: Consulente Web Marketing Web Designer e Web Developer Fondatore di UP Vision. UP Vision:

Dettagli

Francesco Fabbri Social Business Intelligence in Amadori: i vantaggi della Text Analytics, la soluzione C2B

Francesco Fabbri Social Business Intelligence in Amadori: i vantaggi della Text Analytics, la soluzione C2B Francesco Fabbri Social Business Intelligence in Amadori: i vantaggi della Text Analytics, la soluzione C2B Agenda La Social BI per Amadori:Ambito & Obiettivi Il Progetto - WebMonitoring - Il Motore -

Dettagli

Augure Influencers Ranking Tutto sulla metodologia AIR

Augure Influencers Ranking Tutto sulla metodologia AIR Augure Influencers Ranking Tutto sulla metodologia AIR V1.0 Ottobre 2014 Oualid Abderrazek Product Marketing Augure Influencers Ranking 2 Contents 1. Contesto...4 2. L algoritmo...4 a. Esposizione...5

Dettagli

WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence

WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence 1 WOSM (World Open Source Monitoring): Il migliore sistema al mondo di media intelligence WOSM è un sistema di media monitoring unico al mondo. Restituisce percorsi di lettura dei dati trasversali, fruibili,

Dettagli

Come gestire i Social Network

Come gestire i Social Network marketing highlights Come gestire i Social Network A cura di: Dario Valentino I Social Network sono ritenuti strumenti di Marketing imprescindibili per tutte le aziende che svolgono attività sul Web. Questo

Dettagli

@Giusi Castagnetta tutti i diritti riservati. Seo e contenuti video

@Giusi Castagnetta tutti i diritti riservati. Seo e contenuti video @Giusi Castagnetta tutti i diritti riservati Seo e contenuti video SEO facile Quando cerchiamo qualcosa sui motori di ricerca, ci aspettiamo di trovare per primi i risultati migliori, cioè quelli più pertinenti

Dettagli

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO -

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - 1 CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - Corsi di Laurea in Informatica, Ing. Informatica, Ing. di Internet (a.a. 2015-2016) Roberto Basili 2 Overview WM&R: Motivazioni e prospettive

Dettagli

MISURARE E VALUTARE LE INIZIATIVE SUL WEB. Alberto Rota Ariadne Srl

MISURARE E VALUTARE LE INIZIATIVE SUL WEB. Alberto Rota Ariadne Srl MISURARE E VALUTARE LE INIZIATIVE SUL WEB Alberto Rota Ariadne Srl Obiettivi della presentazione Conoscere le basi della Web Analytics: definizioni, obiettivi e strumenti Conoscere le principali metriche

Dettagli

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO -

CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - 1 CORSO DI WEB MINING E RETRIEVAL - INTRODUZIONE AL CORSO - Corsi di Laurea in Informatica, Ing. Informatica, Ing. di Internet (a.a. 2013-2014) Roberto Basili 2 Overview WM&R: Motivazioni e prospettive

Dettagli

Breve descrizione del prodotto

Breve descrizione del prodotto Breve descrizione del prodotto 1. Il software AquaBrowser Library...2 1.1 Le funzioni di Search Discover Refine...3 1.2 Search: la funzione di ricerca e di presentazione dei risultati...3 1.2.1 La configurazione

Dettagli

Prato cresce con il digitale. Migliorare la propria posizione sul web

Prato cresce con il digitale. Migliorare la propria posizione sul web Prato cresce con il digitale Migliorare la propria posizione sul web Prato cresce con il digitale Come rendere il sito visibile dai motori di ricerca Programma 1. 2. 3. 4. 5. 6. 7. Cos'è una SERP Cosa

Dettagli

SMART TOURISM 2.0: 90 ORE DI TEORIA 300 ORE DI STAGE GARANTITO. TIME VISION Agenzia Formativa accreditata Regione Campania

SMART TOURISM 2.0: 90 ORE DI TEORIA 300 ORE DI STAGE GARANTITO. TIME VISION Agenzia Formativa accreditata Regione Campania SMART TOURISM 2.0: Esperto in tecnologie e strategie digitali per la promozione turistica 90 ORE DI TEORIA 300 ORE DI STAGE GARANTITO Corso di Formazione promosso e organizzato da TIME VISION Agenzia Formativa

Dettagli

SOLUZIONI WEB. per il BUSINESS. www.italiainfiera.it. www.italiainfiera.it

SOLUZIONI WEB. per il BUSINESS. www.italiainfiera.it. www.italiainfiera.it SOLUZIONI WEB per il BUSINESS Italiainfiera, società di consulenza per il marketing e la comunicazione on line, opera professionalmente dal 1999 fornendo competenze altamente qualificate alle aziende interessate

Dettagli

Chi, Cosa, Come, Quando e Dove parlano di te

Chi, Cosa, Come, Quando e Dove parlano di te Chi, Cosa, Come, Quando e Dove parlano di te Analizzare il listening per monitorare il sentiment e pianificare correttamente l attività di Social Media e Digital Pr Mauro Cunial, Amministratore Delegato

Dettagli

WEB MARKETING 2.0. La nuova proposta di implementazione di un progetto Marketing 2.0

WEB MARKETING 2.0. La nuova proposta di implementazione di un progetto Marketing 2.0 WEB MARKETING 2.0 La nuova proposta di implementazione di un progetto Marketing 2.0 È un stato di evoluzione del Web, caratterizzato da strumenti e piattaforme che enfatizzano la collaborazione e la condivisione

Dettagli

COMUNICARE LA CITTÀ COME DESTINAZIONE TURISTICA CULTURALE. UN METODO PER VALUTARE LA QUALITÀ. Luisa Mich, Nicola Zeni

COMUNICARE LA CITTÀ COME DESTINAZIONE TURISTICA CULTURALE. UN METODO PER VALUTARE LA QUALITÀ. Luisa Mich, Nicola Zeni COMUNICARE LA CITTÀ COME DESTINAZIONE TURISTICA CULTURALE. UN METODO PER VALUTARE LA QUALITÀ DELLA COMUNICAZIONE ONLINE Luisa Mich, Nicola Zeni Schema [Il problema] L efficacia della comunicazione [L approccio]

Dettagli

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG 16 gennaio 2015 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG Introduzione Le attività dei blogger I social influencer

Dettagli

www.nomedominio.xyz www.nomedominio.xyz 0

www.nomedominio.xyz www.nomedominio.xyz 0 www.nomedominio.xyz www.nomedominio.xyz 0 www.nomedominio.xyz 1 Introduzione I moderni siti web sono il baricentro di strategie comunicative e di marketing che aziende e professionisti non possono ignorare,

Dettagli

STRUMENTI ONLINE PER STUDIARE LA CONCORRENZA, RICERCARE FONTI DI VISIBILITÀ E CONOSCERE I TREND DI MERCATO

STRUMENTI ONLINE PER STUDIARE LA CONCORRENZA, RICERCARE FONTI DI VISIBILITÀ E CONOSCERE I TREND DI MERCATO STRUMENTI ONLINE PER STUDIARE LA CONCORRENZA, RICERCARE FONTI DI VISIBILITÀ E CONOSCERE I TREND DI MERCATO Argomenti: 1. Volume di traffico e ricerche (trend del momento) 2. Analisi competitor (semplice

Dettagli

Metodi e Modelli per le Decisioni

Metodi e Modelli per le Decisioni Metodi e Modelli per le Decisioni Corso di Laurea in Informatica e Corso di Laurea in Matematica Roberto Cordone DI - Università degli Studi di Milano Lezioni: Giovedì 13.30-15.30 Venerdì 15.30-17.30 Ricevimento:

Dettagli

Marketing 2.0 Web & social media marketing

Marketing 2.0 Web & social media marketing 1 Marketing 2.0 Web & social media marketing Progetto per lo sviluppo di traffico UTILE sul proprio dominio. Walter Garzena Introduzione 2 Il Web-Marketing 2.0 è caratterizzato da un elevata dinamicità

Dettagli

Tilde WCM. Data. Moduli base. Versione 1.0. 29 Settembre 2011. giovedì 29 settembre 11

Tilde WCM. Data. Moduli base. Versione 1.0. 29 Settembre 2011. giovedì 29 settembre 11 Tilde WCM Moduli base Versione 1.0 29 Settembre 2011 Data IL CMS TILDE Il CMS o Content Management System, è lo strumento maggiormente utilizzato in qualsiasi progetto web. Ormai viene attivato su qualsiasi

Dettagli

Search Engine Optimization (SEO) up-grade ottobre 2013

Search Engine Optimization (SEO) up-grade ottobre 2013 marketing highlights Search Engine Optimization (SEO) up-grade ottobre 2013 A cura di: dott. Fabio Pinello dott. Dario Valentino La Search Engine Optimization (SEO) individua le attività da mettere in

Dettagli

MY.SO: una panoramica

MY.SO: una panoramica MY.SO: una panoramica Principali funzionalità di MY.SO Funzionalità Gestione dei profili utente Gestione delle relazioni di amicizia Wall e sistema di messaggistica interno News Feed e Mini-feed Album

Dettagli

Estratto del capitolo 5 Edizione italiana a cura di Studio Pleiadi

Estratto del capitolo 5 Edizione italiana a cura di Studio Pleiadi Estratto del capitolo 5 Edizione italiana a cura di Studio Pleiadi 1. Come funzionano i motori di ricerca Una panoramica generale sul funzionamento dei motori di ricerca risultati). 2. Come le persone

Dettagli

PicoWeb è un sistema di monitoraggio Web e Social, in tempo reale, basato su tecnologia proprietaria che aiuta l'utente finale a fare ordine nella

PicoWeb è un sistema di monitoraggio Web e Social, in tempo reale, basato su tecnologia proprietaria che aiuta l'utente finale a fare ordine nella PicoWeb è un sistema di monitoraggio Web e Social, in tempo reale, basato su tecnologia proprietaria che aiuta l'utente finale a fare ordine nella gran mole di dati disomogenei provenienti dalla rete.

Dettagli

Chi, Cosa, Come, Quando e Dove parlano di te

Chi, Cosa, Come, Quando e Dove parlano di te Chi, Cosa, Come, Quando e Dove parlano di te Analizzare il listening per monitorare il sentiment e pianificare correttamente l attività di Social Media e Digital Pr Agenda Ci presentiamo! MM One Group

Dettagli

Collana ebook Web Marketing PMI SEO PER IL B2B. Come acquisire il maggior numero di clienti ottimizzando un sito web per il B2B

Collana ebook Web Marketing PMI SEO PER IL B2B. Come acquisire il maggior numero di clienti ottimizzando un sito web per il B2B Collana ebook Web Marketing PMI SEO PER IL B2B Come acquisire il maggior numero di clienti ottimizzando un sito web per il B2B WEB MARKETING RESEARCH ACADEMY SEARCH MARKETING STRATEGIES Ebook realizzato

Dettagli

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,

Dettagli

Indagini statistiche attraverso i social networks

Indagini statistiche attraverso i social networks Indagini statistiche attraverso i social networks Agostino Di Ciaccio Dipartimento di Scienze Statistiche Università degli Studi di Roma "La Sapienza" SAS Campus 2012 1 Diffusione dei social networks Secondo

Dettagli

Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF

Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF Maria Grazia Pepe - Elisabetta Viti (Biblioteca nazionale centrale di Firenze) 6. Incontro ISKO Italia Firenze 20 maggio 2013 SOMMARIO

Dettagli

A cura di Claudia Zarabara scrivi@claudiazarabara.it Gennaio 2013

A cura di Claudia Zarabara scrivi@claudiazarabara.it Gennaio 2013 Web e Social Network: non solo comunicazione ma condivisione A cura di Claudia Zarabara scrivi@claudiazarabara.it Gennaio 2013 Dal Web 1.0 al Web 2.0 WEB 1.0 USO LA RETE WEB 2.0 SONO IN RETE WEB 2.0 SIAMO

Dettagli

Architettura dell informazione. Sistemi di ricerca

Architettura dell informazione. Sistemi di ricerca Architettura dell informazione Sistemi di ricerca Sistemi di ricerca Il sistema di ricerca è un elemento centrale della navigazione supplementare. La ricerca è uno degli strumenti preferiti dagli utenti

Dettagli

Ringraziamenti. Seo: un mondo da scoprire 3

Ringraziamenti. Seo: un mondo da scoprire 3 Sommario Ringraziamenti XIII prefazione di nereo sciutto introduzione 1 XV Seo: un mondo da scoprire 3 Breve introduzione ai motori di ricerca 3 Il posizionamento nei motori di ricerca 4 Oltre i motori

Dettagli

Promuovere con successo un attività utilizzando Internet

Promuovere con successo un attività utilizzando Internet Promuovere con successo un attività utilizzando Internet Il piano operativo Quando si opera su Web non ci si deve lanciare in operazioni disorganizzate valutando solamente i costi. È fondamentale studiare

Dettagli

Social media analysis

Social media analysis Social media analysis Alessia D Angelo Social Media Analyst & Account Università di Torino 5 giugno 2014 Chi siamo Leader in Italia nella social media intelligence 500+ progetti realizzati 80 clienti Tecnologie

Dettagli

Basi di Dati Multimediali. Fabio Strocco

Basi di Dati Multimediali. Fabio Strocco Basi di Dati Multimediali Fabio Strocco September 19, 2011 1 Contents 2 Introduzione Le basi di dati (o database) hanno applicazioni in molti campi, in cui è necessario memorizzare, analizzare e gestire

Dettagli

FACEBOOK IN TOURISM Destinazioni turistiche e Social Network

FACEBOOK IN TOURISM Destinazioni turistiche e Social Network + FACEBOOK IN TOURISM Destinazioni turistiche e Social Network A cura di Roberta Garibaldi e Roberto Peretta Ed. FrancoAngeli 2011 I contenuti generati dagli utenti hanno oggi una riconosciuta importanza

Dettagli

ANNARITA: Il database Object Relational dell Anagrafe Nazionale delle Ricerche

ANNARITA: Il database Object Relational dell Anagrafe Nazionale delle Ricerche ANNARITA: Il database Object Relational dell Anagrafe Nazionale delle Ricerche Alex Manzo CILEA, Roma Abstract Nell ottica di un potenziamento e arricchimento dei dati dell Anagrafe Nazionale delle Ricerche

Dettagli

Il social network dei blog italiani La mappa dei blogosfera italiana Febbraio 2005

Il social network dei blog italiani La mappa dei blogosfera italiana Febbraio 2005 liani 2005 Il social network dei blog italiani La mappa dei blogosfera italiana Febbraio 2005 1 Il Social Network dei blog italiani Introduzione...4 La dimensione della blogosfera...5 Percorsi della blogosfera...7

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

Comunicazione Social per il Non Profit

Comunicazione Social per il Non Profit WEB 2.0 Comunicazione Social per il Non Profit Federica Vangelisti Marzo - Giugno 2014 Cos e` il Web 2.0? E` l insieme delle applicazioni online che permettono un elevato livello di interazione tra l utente,

Dettagli

ONLINE BRAND REPUTATION SETTORE RISTORAZIONE

ONLINE BRAND REPUTATION SETTORE RISTORAZIONE ONLINE BRAND REPUTATION SETTORE RISTORAZIONE SOMMARIO 1. ANALISI PRELIMINARE PANEL DI OSSERVAZIONE, FONTI, PRIME EVIDENZE... 3 2. ANALISI QUALITATIVA... 4 3. FOCUS ROADHOUSE GRILL... 6 3.1 Roadhouse Grill

Dettagli

Cosa contraddistingue Mimesi

Cosa contraddistingue Mimesi Cosa contraddistingue Mimesi Mimesi ha tra i suoi azionisti Digital Magics, uno dei più grandi incubatori di start-up nel mercato italiano Mimesi fa parte del gruppo DBInformaton, leader nei servizi di

Dettagli

SenTaClAus - Sentiment Tagging & Clustering Analysis on web & social contents

SenTaClAus - Sentiment Tagging & Clustering Analysis on web & social contents Via Marche 10 56123 Pisa Phone +39.050.552574 Fax +39.1782239361 info@netseven.it - www.netseven.it P.IVA 01577590506 REGIONE TOSCANA POR CReO FESR 2007 2013 LINEA D INTERVENTO 1.5.a - 1.6 BANDO UNICO

Dettagli

Cercare informazioni sul Web

Cercare informazioni sul Web Fluency Cercare informazioni sul Web Capitolo 4 Guardare nel posto giusto cosa cerco mondo fisico Web per avere informazioni su contributi pensionistici INPS www.inps.it per trovare un percorso tra due

Dettagli

cos è l architettura dell informazione?

cos è l architettura dell informazione? Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 3. Architettura dell informazione cos è l architettura dell informazione? E la progettazione di spazi informativi

Dettagli

Giocare responsabilmente si può - L impegno di Lottomatica per un gioco responsabile e sicuro

Giocare responsabilmente si può - L impegno di Lottomatica per un gioco responsabile e sicuro Giocare responsabilmente si può - L impegno di Lottomatica per un gioco responsabile e sicuro Lottomatica: il progetto Lottomatica da 7 anni realizza un Programma di Gioco Responsabile attraverso il quale

Dettagli

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web Il World Wide Web Il Web Claudio Fornaro ver. 1.3 1 Il World Wide Web (ragnatela di estensione mondiale) o WWW o Web è un sistema di documenti ipertestuali collegati tra loro attraverso Internet Attraverso

Dettagli

L ERA DIGITALE E LE NUOVE TENDENZE DELLA COMUNICAZIONE

L ERA DIGITALE E LE NUOVE TENDENZE DELLA COMUNICAZIONE PRESENTAZIONE N #2 L ERA DIGITALE E LE NUOVE TENDENZE DELLA COMUNICAZIONE 30 novembre 2015 SOMMARIO #1. LO SCENARIO NELL ERA DIGITALE #2. DALLA RECLAME ALLA WEB REPUTATION #3. DALL OUTBOUND MARKETING ALL

Dettagli

IL SERVIZIO DI RICERCA SUI DISPOSITIVI MOBILI

IL SERVIZIO DI RICERCA SUI DISPOSITIVI MOBILI IL SERVIZIO DI RICERCA SUI DISPOSITIVI MOBILI I motori di ricerca non sono più solamente lo strumento per arrivare ai siti web, ma sono anche e sempre più il principale strumento di accesso alle informazioni

Dettagli

Strategia PERSONAL BRANDING. Relatore: Giovanni Dalla Bona

Strategia PERSONAL BRANDING. Relatore: Giovanni Dalla Bona Strategia PERSONAL BRANDING Relatore: Giovanni Dalla Bona TODAY, IN THE AGE OF THE INDIVIDUAL, YOU HAVE TO BE YOUR OWN BRAND. HERE'S WHAT IT TAKES TO BE THE CEO OF ME INC. Tom Peters (1997) YOUR BRAND

Dettagli

Comunicazione AGESCI e social network 2015 Vademecum di buone pratiche

Comunicazione AGESCI e social network 2015 Vademecum di buone pratiche Comunicazione AGESCI e social network 2015 Vademecum di buone pratiche Premessa Il presente documento è frutto di un incontro tra gli incaricati regionali alla comunicazione, avvenuto ad ottobre 2015,

Dettagli

La ricerca estensiva Perché?

La ricerca estensiva Perché? RICERCA ESTENSIVA La ricerca estensiva Perché? Per misurare e validare in termini estensivi la percezione e decodifica da parte dei soggetti destinatari; ma anche per segmentarli in modo appropriato Per

Dettagli

INTRODUZIONE: ALL INCLUSIVE

INTRODUZIONE: ALL INCLUSIVE INTRODUZIONE: ALL INCLUSIVE è l insieme di servizi, strumenti e tecniche che rendono un sito web accessibile e ottimizzato per assicurare che venga rinvenuto nelle prime posizioni sui motori di ricerca.

Dettagli

Formazione sistema editoriale CMS

Formazione sistema editoriale CMS Ufficio Società dell'informazione Nome del Progetto Acronimo del Progetto Formazione sistema editoriale CMS Documento Data di stesura Maggio 2010 Versione 1.2 Sommario 1 Scopo... 3 2 Campo di applicazione...

Dettagli

Web & Social Big Data Monitoring and Analysis. www.web-live.it

Web & Social Big Data Monitoring and Analysis. www.web-live.it Web & Social Big Data Monitoring and Analysis www.web-live.it 1 Ascolto e analisi del web e dei social Le 7 buone ragioni 1. Valutare e misurare l efficacia della propria comunicazione 2. Scoprire le tendenze

Dettagli

Audiovisivo 2.0: scenari e strumenti della rete

Audiovisivo 2.0: scenari e strumenti della rete Audiovisivo 2.0: scenari e strumenti della rete Associazione Documentaristi Emilia Romagna 12 aprile 2012 obiettivi come i nuovi strumenti digitali possono diventare veri e propri alleati per la formazione

Dettagli

SOCIAL NETWORK MANUALE OPERATIVO

SOCIAL NETWORK MANUALE OPERATIVO SOCIAL NETWORK MANUALE OPERATIVO 1 INTRODUZIONE I social media sono diventati uno strumento essenziale di comunicazione e marketing e vengono utilizzati da utenti di ogni fascia di età: dai teenager agli

Dettagli

Guida avanzata al web marketing

Guida avanzata al web marketing SEO e SEM Guida avanzata al web marketing Black Hat SEO Marco Maltraversi I motori di ricerca, le directory e l influenza dei social network >> SEO e SEM per un web marketing veramente efficace >> Abilità

Dettagli

Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web

Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web 16 febbraio 2015 Indice 1 Individuazione dei dataset 1 2 Dataset Repositories

Dettagli

Promuovi la tua attività gratuitamente su INTERNET: il Social Media Marketing

Promuovi la tua attività gratuitamente su INTERNET: il Social Media Marketing Promuovi la tua attività gratuitamente su INTERNET: il Social Media Marketing Nethics siti internet e SMM C.so Stati Uniti 72 - Susa (TO) manutenzione@nethics.it - Tel.: 0122/881266 Programma del corso

Dettagli

Manuale Piattaforma Didattica

Manuale Piattaforma Didattica Manuale Piattaforma Didattica Ver. 1.2 Sommario Introduzione... 1 Accesso alla piattaforma... 1 Il profilo personale... 3 Struttura dei singoli insegnamenti... 4 I Forum... 5 I Messaggi... 7 I contenuti

Dettagli

BASI DI DATI INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO PER L ANNO ACCADEMICO 2013 2014 Prof. Gigliola Vaglini, Ing. Francesco Pistolesi

BASI DI DATI INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO PER L ANNO ACCADEMICO 2013 2014 Prof. Gigliola Vaglini, Ing. Francesco Pistolesi BASI DI DATI INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO PER L ANNO ACCADEMICO 2013 2014 Prof. Gigliola Vaglini, Ing. Francesco Pistolesi 1 Descrizione dei requisiti delle fasi di progettazione Si desidera

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testualilezione 2 Le principali tecniche di analisi testuale Facendo riferimento alle tecniche di data mining,

Dettagli

GUIDA LINKEDIN. Introduzione all uso di LinkedIn per i business

GUIDA LINKEDIN. Introduzione all uso di LinkedIn per i business GUIDA LINKEDIN Introduzione all uso di LinkedIn per i business INDICE DELLA GUIDA Introduzione LinkedIn in numeri Il profilo e la sua importanza Perchè serve alle aziende Differenze tra pagina e profilo

Dettagli

Gestione servizio SuperSite Versione 7

Gestione servizio SuperSite Versione 7 Gestione servizio SuperSite Versione 7 Il servizio SuperSite di Aruba, grazie ai vari strumenti messi a disposizione dell utente, consente di creare un sito web personalizzato, in modo facile e veloce.

Dettagli

anthericacms Il sistema professionale per la gestione dei contenuti del tuo sito web Versione 2.0

anthericacms Il sistema professionale per la gestione dei contenuti del tuo sito web Versione 2.0 anthericacms Il sistema professionale per la gestione dei contenuti del tuo sito web Versione 2.0 Email: info@antherica.com Web: www.antherica.com Tel: +39 0522 436912 Fax: +39 0522 445638 Indice 1. Introduzione

Dettagli

Tecniche di DM: Link analysis e Association discovery

Tecniche di DM: Link analysis e Association discovery Tecniche di DM: Link analysis e Association discovery Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Architettura di un generico algoritmo di DM. 2 2 Regole di associazione:

Dettagli

BASE STANDARD PREMIER. PREZZO 400 / mese 1000 / mese 2500 / mese SEO (SEARCH ENGINE OPTIMIZATION)

BASE STANDARD PREMIER. PREZZO 400 / mese 1000 / mese 2500 / mese SEO (SEARCH ENGINE OPTIMIZATION) BASE STANDARD PREMIER PREZZO 400 / mese 1000 / mese 2500 / mese SEO (SEARCH ENGINE OPTIMIZATION) PREVIA ANALISI SEO INTERNO Numero di parole, frasi, keyword o criteri di ricerca consigliati per ciascun

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli