Analisi della Costruzione Partecipativa di un Wiki con un Applicazione a Wikipedia

Documenti analoghi
La Social Network Analysis applicata alla ricerca semantica

Archivio WebQuest I Grafi e le Reti

La Metodologia adottata nel Corso

Analisi di una Rete Sociale

Generazione Automatica di Asserzioni da Modelli di Specifica

Università degli Studi di Salerno

LA PROGETTAZIONE DI UN NUOVO STRUMENTO PER IL WEB

UNIVERSITA DEGLI STUDI ROMA TRE

AREA FORMAZIONE PROGRAMMAZIONE E SVILUPPO RELAZIONE VALUTAZIONE DI FINE CORSO QUESTIONARI DI GRADIMENTO CORSI DI INFORMATICA 2004.

La progettazione centrata sull utente nei bandi di gara

SCENARIO. Personas ALICE Lucchin / BENITO Condemi de Felice. All rights reserved.

Come iscriversi al M5S. Gruppi di Lavoro PROSPETTO ORGANIZZATIVO COMUNICAZIONE. Come funzionano le consultazioni via web

Realizzazione di Web Service per l estrazione di informazioni da siti web enciclopedici

IL CICLO DI VITA DEL PROGETTO. Elementi essenziali di progetto. Fasi e tappe Gli Approcci

Il portale italiano delle classificazioni

Amministrazione gruppi (Comunità)


INGEGNERIA DEL SOFTWARE

Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale.

PRESENTAZIONE SINTETICA PROGETTO JOOMLA! UN SITO WEB OPEN SOURCE PER LE PUBBLICHE AMMINISTRAZIONI

L EFFICACIA DELLE MISURE DI POLITICA ATTIVA DEL LAVORO REALIZZATE IN PROVINCIA DI TORINO NEL

Amministrazione gruppi (all interno della Scuola)

Posizionamento ottimale di sensori per il monitoraggio degli inquinanti nelle reti idriche

Olga Scotti. Basi di Informatica. Excel

Innovazione didattica in matematica: PP&S su piattaforma e-learning in ambiente di calcolo evoluto

Che volontari cerchiamo? Daniela Caretto Lecce, aprile

Amministrazione classi

Abitantionline. Il social network per la casa e il costruito. Per chi è Cosa offre Lancio e partner. creato

monitoraggio aslromag.info analisi anno 2013

Politiche giovanili in Piemonte Sistema informativo regionale on line

UN FUTURO PER MILANO: CITTÀ DEL TERZIARIO? PIÙ DEL 75% DELL OFFERTA DI UFFICI E OGGI DI BASSA QUALITÀ

Programma 1 WP7: Il portale di Allenza

UNIVERSITÀ DEGLI STUDI DI MILANO FACOLTÀ DI STUDI UMANISTICI Corso di laurea triennale in Scienze umanistiche per la comunicazione

ELABORAZIONE QUESTIONARIO DI GRADIMENTO FORMAZIONE DIRIGENTI E DOCENTI

GIOCHI MATEMATICI PER LA SCUOLA SECONDARIA DI I GRADO ANNO SCOLASTICO

N ######/02 Seconda prova scritta *$$$$$21115* *$$$$$21115* *$$$$$21115* *$$$$$21115* A T T E N Z I O N E

Le Università della Terza Età Distretto Lions 108 Ib4 Anno accademico

Social Network & Social Network Analisys. Social media management Proff. Giovanni Ciofalo, Stefano Epifani a.a. 2014/2015

DEFINIZIONE. Ogni aggiornamento è generalmente inserito in ordine cronologico inverso.

PROFILO RIASSUNTIVO DELLE AREE

Insegnare con il blog. Materiale tratto da:

OSINT, acronimo di Open Source INTelligence, uno dei modi per acquisire dati utili per l intelligence:

PROGETTO ACCOGLIENZA Classi prime Anno scolastico 2012/2013

OFI ITC. Come nasce questo sito 05/06/2015. Severini Piertommaso Valenti Andrea Zallocco Riccardo

12. Evoluzione del Software

REGOLAMENTO DI VALUTAZIONE DEL PERSONALE DIPENDENTE

Nuova funzione di ricerca del sito WIKA.

Sintesi dei risultati del Questionario per gli Assegnisti di Ricerca

Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria

11. Evoluzione del Software

Achab Learning & Presentation System Il progetto di Achab, per lo sviluppo e la pubblicazione di presentazioni e corsi di formazione online

Thinkalize. Il nuovo creatore dell innovazione.

SPECTER OPS. L'obiettivo del giocatore agente è quello che il suo agente completi 3 su 4 missioni obiettivo qualsiasi

Il sistema monetario

Be Community Manager. per Hotel

RINNOVO DELLA CONSULTA DEGLI STUDENTI DELL ISIA DI FIRENZE TRIENNIO 2010/2013. Elenco e Programmi dei candidati

Open Publishing Made Easy!

Conoscere e prevenire il rischio sismico nel territorio sannita

Sistemi per l apprendimento orientato al problem solving con valutazione automatica di risposte aperte

Documento programmatico per Tuscania 2009

RELAZIONE FINALE DEL PROGETTO DI.SCOL.A.

COME SVILUPPARE UN EFFICACE PIANO DI INTERNET MARKETING

LA BUSSOLA DELLA TRASPARENZA: COSA È?

GESTIONE AVANZATA DEI MATERIALI

Scuole di ogni ordine e grado

Bandi regionali. Misura I.3.1 Servizi informatici innovativi e Misura I.3.2 Adozione tecnologie dell Informazione e della Comunicazione

Prof.ssa Maria Francesca Costabile

PROGETTO DI SISTEMI AD AGENTI

Metodologie Informatiche Applicate al Turismo

Attività federale di marketing

Protocollo di tracciamento e valutazione degli studenti dei corsi di italiano ICoNLingua A.A

Corso di Valutazione Economica dei Progetti e dei Piani. Marta Berni AA

Progetto Atipico. Partners

ENI AWARD 2016 REGOLAMENTO

Role plaing esperienziale: ATTUAZIONE DI UN PROGETTO DI NURSING

Lauree magistrali Tirocini e stage: cosa sono Il tirocinio formativo e di orientamento è un periodo di formazione in strutture organizzative (enti,

La qualità della comunicazione web

Il servizio di registrazione contabile. che consente di azzerare i tempi di registrazione delle fatture e dei relativi movimenti contabili

Per i giovani e il loro futuro, per le scuole secondarie di primo grado d Italia CENPIS STUDIO PSICOLOGIA E PSICOSOMATICA

COMUNE DI SOLBIATE ARNO

Bachelor of Science in Ingegneria elettronica

Guadagnare, lavorare e innovare: il ruolo del riciclo nella green economy

TEACHMOOD Laboratorio ICT Regione Piemonte l'ufficio Scolastico Regionale open source 30 corsi on-line la piattaforma moodle Teachmood,

Identificativo: SS BAA Data: Testata: IL SOLE 24 ORE

Creazione di un modello di data mining di tipo OLAP con l'algoritmo Microsoft Clustering

I motori di ricerca. Che cosa sono. Stefania Marrara Corso di Sistemi Informativi

IL COSTO DELL IGNORANZA NELLA SOCIETA DELL INFORMAZIONE

Michele Balzarini. Relazione conclusiva Erasmus staff training presso l Università di Warwick. giugno 2014

Linee di Attività. FORUM PA maggio

Network Monitoring. Introduzione all attività di Network Monitoring introduzione a Nagios come motore ideale

condivivere DA SOLO PUOI CRESCERE NEL MERCATO. INSIEME, PUOI CAMBIARLO.

VALORI ECONOMICI DELL AGRICOLTURA 1

Funzioni in C. Violetta Lonati

Esperienza della Rete delle Scuole di Spoleto per Educarsi al Futuro

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

PROGRAMMAZIONE E GESTIONE DI UN PROGETTO DI SERVIZIO SOCIALE

Turismo Virtual Turismo Virtual Turismo Virtual

Studio e realizzazione di nuove tecniche per l interazione uomo-calcolatore

PROGETTO LINGUA ITALIANA DANTE ALIGHIERI

LABORATORIO a cura di Pier Cesare Rivoltella e Andrea Garavaglia La Formazione a distanza di Terza Generazione

Transcript:

POLITECNICO DI MILANO Facoltà di Ingegneria dell'informazione Corso di Laurea in Ingegneria Informatica Analisi della Costruzione Partecipativa di un Wiki con un Applicazione a Wikipedia Tesi di laurea di: Riccardo Tasso Matr: 708301 Relatore: Marco Colombetti Correlatore: David Laniado Anno accademico 2007-2008 Sessione di laurea del 20 aprile 2009

La tecnologia dei wiki Nuova prospettiva del World Wide Web Il visitatore è anche autore Più autori collaborano alla costruzione di una conoscenza comune 2

Wikipedia Progetto di costruzione di un'enciclopedia Online Multilingua A contenuto libero Il più grande esempio di wiki sul Web Versione in italiano: 500.000 voci Versione in inglese: 2.800.000 voci Enorme successo in breve tempo Uno dei 10 siti Web più visitati al mondo Tra i primi risultati dei motori di ricerca Nascita di una comunità molto attiva 3

Il lato oscuro di Wikipedia Quanto è affidabile il contenuto di Wikipedia? Chi scrive su Wikipedia? Quali sono i suoi fini? 4

Lavori di ricerca su Wikipedia Studi qualitativi Studi quantitativi La crescita Gli utenti La misura dei contributi La struttura dei collegamenti interni I contenuti La qualità 5

Obiettivi Progettare un metodo di analisi della comunità di un wiki: Automatico Generale Modulare Studiare la comunità di Wikipedia: Per applicare il metodo a un caso reale Per capirne le caratteristiche generali Per capire come partecipano i suoi contributori 6

Il processo di analisi di un wiki 7

Estrazione di informazioni dalla Revision History Valutazione dell'operato di un utente a partire dai suoi interventi (revision) Informazioni ricavabili direttamente: Timestamp Numero di versione Autore Informazioni non ricavabili direttamente: Distanza tra due versioni: d(i, j) Qualità di un intervento 8

La qualità di un intervento La qualità di un intervento è stimabile dalle modifiche che apportano gli interventi successivi rispetto a quelle precedenti Dante Alighieri è stato un poeta italiano. Dante Alighieri è stato un poeta, scrittore e politico italiano. Dante Alighieri è stato un poeta, scrittore e politico italiano. Egli nacque a Firenze nel 1265... 9

La qualità di un intervento q i, j, k = d i, k d j, k d i, j 10

Calcolo del contributo dei partecipanti Livelli di granularità: Globale Singola pagina Metriche: Conteggio degli interventi (edit count) Longevità dell'intervento (edit longevity) Longevità dell'intervento valutata rispetto alla sua versione più simile Problemi: Come contare il contributo degli utenti anonimi? 11

Calcolo del contributo dei partecipanti Conteggio degli interventi: Semplice Attualmente usato su Wikipedia Poco preciso Longevità dell'intervento: Tiene conto della dimensione di un intervento: distanza dalla versione precedente Tiene conto della qualità di un intervento: valor medio dei voti ricevuti dalle 10 versioni successive rispetto alle 10 versioni precedenti 12

Calcolo del contributo dei partecipanti Longevità dell'intervento valutato rispetto alla sua versione più simile 13

Selezione dei coautori Pagine apparentemente molto simili possono essere state costruite in modo completamente diverso Pagina: HIV Numero di Edit: 1282 Numero di Utenti: 415 Pagina: C++ Numero di Edit: 1225 Numero di Utenti: 434 14

Selezione dei coautori Scegliere, in modo automatico, gli utenti che hanno contribuito maggiormente alla costruzione di una pagina Idee dell'algoritmo: Esaminare gli utenti ordinati per contributo (decrescente) Vincolo 1: selezionare il più piccolo insieme che raggiunge una certa percentuale di contributo (50%) Vincolo 2: selezionare un utente solo se ha contribuito oltre una certa quantità (10) 15

Modellazione di una Rete Sociale Social Network Analysis Insieme di metodi per l'analisi di strutture sociali che consentono un'investigazione precisa degli aspetti relazionali di queste strutture (Scott, 2000) Perché una Rete Sociale di Wikipedia? Per studiare le caratteristiche della comunità nel suo insieme Per studiare i ruoli degli individui all'interno della comunità Idea: ricondursi alle reti di coautori Di articoli scientifici Di software open source 16

Rete Sociale della versione italiana di Wikipedia (2005) Rete dei coautori di Wikipedia al 13.12.2005 Algoritmo di visualizzazione: Spring Layout Nodi verdi: Amministratori Nodi blu: Bot 17

Misure effettuate sulle Reti Sociali Reti studiate: Wikipedia in italiano al 13.12.2005 Wikipedia in italiano al 22.05.2007 Wikipedia in italiano al 17.03.2008 Wikipedia in inglese al 06.02.2007 Misure relative alla costruzione della rete: Numero di articoli esaminati Articoli con almeno un autore Articoli con più di un autore Numero di autori Articoli per autore Autori per articolo 18

Misure effettuate sulle Reti Sociali Proprietà macroscopiche della rete: Numero di autori (nodi) Collaboratori per autori (grado medio) Studio delle componenti connesse Coefficiente di clustering Distanza media tra due nodi Diametro Studio delle Sociometric Star: Degree Centrality Closeness Centrality Betweenness Centrality Eigenvector Centrality 19

Risultati Sperimentali Calcolo dei contributi a livello globale: Il conteggio degli interventi è una metrica poco precisa e da particolare risalto ai Bot La metrica di longevità di un intervento favorisce i manutentori del wiki (a causa dei revert) La metrica di longevità di un intervento valutata rispetto alla sua versione più simile trova i contributori in modo più preciso (ma spesso non è molto diversa dalla precedente) Processo di selezione dei coautori: Pagine apparentemente simili possono essere costruite in modo molto diverso tra loro Insiemi di pagine dello stesso tipo (Featured) possono avere caratteristiche comuni molto diverse da quelle totali 20

Risultati Sperimentali Costruzione della Rete Sociale: Confronto tra le versioni in italiano e in inglese di Wikipedia: la prima è molto più piccola in proporzione la comunità inglese è più piccola rispetto a quella italiana Confronto tra versioni del medesimo wiki in istanti differenti: la crescita della comunità è confermata gli individui più centrali sono rimasti gli stessi Le metriche di calcolo del contributo proposte non mostrano particolari differenze tra le reti costruite a livello macroscopico Le misure di centralità studiate mettono in evidenza quasi sempre gli stessi autori i ruoli all'interno della comunità sono poco distinti 21

Risultati Sperimentali Costruzione della Rete Sociale: La misura di Eigenvector Centrality mostra però significative differenze rispetto alle altre gli utenti centrali tendono a non collegarsi tra di loro Vale il modello di preferential attachment nuovi autori tendono a collegarsi a quelli con un maggior numero di collaboratori Caratteristiche in comune tra le diverse versioni analizzate: Basso coefficiente di clustering bassa distanza media tra nodi piccolo diametro Lo scopo delle personalità più importanti di Wikipedia pare essere quello di non lasciare alcuna delle sue aree senza il loro intervento 22

Conclusioni Definizione di un metodo per l'analisi della comunità di un wiki: Automatico Generale Modulare Estrazione dei dati Calcolo dei contributi (confronto tra diverse metriche) Selezione dei coautori Modellazione di una Rete Sociale Ciascun sottoproblema: È stato studiato dal punto di vista formale / teorico È stato affrontato progettando opportuni moduli software in grado di implementare le considerazioni teoriche È stato applicato a quattro differenti versioni di Wikipedia I risultati hanno: Dimostrato la fattibilità dell'analisi Mostrato interessanti caratteristiche di Wikipedia 23

Sviluppi Futuri Costruzione di una Rete Sociale solo per certi sottoinsiemi di pagine Utilizzo delle informazioni contenute nel peso degli archi della rete Tecniche di clustering e community detection Studio dell'evoluzione della rete nel tempo Costruzione di una rete bipartita Due tipologie di nodi: autori e pagine Applicazione del metodo ad altri wiki 24