METODI E APPLICAZIONI PER SOCIAL NETWORK A.A SIMONE ALGHISI

Похожие документы
Metodi e Applicazioni per Social Network. Presentazione progetto

Social Network Analysis: Soundcloud. By Alessandro Sperotti Matricola

Grafi: visite. Una breve presentazione. F. Damiani - Alg. & Lab. 04/05 (da C. Demetrescu et al - McGraw-Hill)

Strutture dati per rappresentare grafi

Algoritmi e Strutture Dati

Modello dei grafi casuali

TEST NON PARAMETRICO DI MANN-WHITNEY

Caterina Fenu, Giuseppe Rodriguez

Esercizi Capitolo 11 - Strutture di dati e progettazione di algoritmi

Grafi aleatori e reti nel mondo reale

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Algoritmi e Strutture Dati

Statistica di base per l analisi socio-economica

Introduzione ai grafi. Introduzione ai grafi p. 1/2

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

Algoritmi e Strutture Dati

ISTOGRAMMI E DISTRIBUZIONI:

Alberi e alberi binari I Un albero è un caso particolare di grafo

Algoritmi e Strutture Dati

Flusso a Costo Minimo

Progettazione di Algoritmi

Lezione n.15 Random Graphs, Small-Worlds, Scale-Free Networks Materiale didattico: Peer-to-Peer Systems and Applications Capitolo 6

Problemi, istanze, soluzioni

Agostinetti Piero (425902/IM)

Istituzioni di Statistica e Statistica Economica

RETI DI CALCOLATORI II

Grafi, Social Network e Ricerca su Web Prof. Maurizio Naldi

GUIDA ALLA NAVIGAZIONE DELL'AREA RISERVATA INTEGRATA NEL PORTALE COMUNALE

Metodologie Informatiche Applicate al Turismo

Algoritmi e Strutture Dati

Scale di Misurazione Lezione 2

Statistica Inferenziale

LA METAFORA DELL UFFICIO

Minimo albero di copertura

08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA

Quarto allenamento. Olimpiadi Italiane di Informatica - Selezione territoriale

ISTRUZIONI PER L UTILIZZO DEL SITO PAN FUMETTERIE

Definizioni syntax-directed

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Variabili casuali. - di Massimo Cristallo -

Progettazione di Algoritmi

«Sciente e Tecnologie dei Beni Culturali»

Grafi: definizioni e visite

DOCUMENTO DI SUPPORTO ALLA RENDICONTAZIONE DELLE SPESE SUL SISTEMA SYNERGIE CTE

R. Cusani, F. Cuomo: Telecomunicazioni - DataLinkLayer: Gestione degli errori, Aprile 2010

Tipi di comunicazione

Social Network & Social Network Analisys. Social media management Proff. Giovanni Ciofalo, Stefano Epifani a.a. 2014/2015

Analisi interazione domanda/offerta: modelli di assegnazione

PSICOMETRIA Voto X frequenza

SEDE OPERATIVA Via A. De Gasperi, 127/A Merate (LC) TEL. 039/ Manuale

Misure di dispersione (o di variabilità)

L indagine statistica

SCHEDA DIDATTICA N 7

INTRODUZIONE ALLA TEORIA DEI GIOCHI

Heap e code di priorità

Tutorato 1 - Statistica descrittiva

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

ITIS A. Volta Flavia Lollis pag. 1

Esercizi sulle equazioni differenziali a cura di Sisto Baldo, Elisabetta Ossanna e Sandro Innocenti

Statistica a lungo termine: calcolo dell onda di progetto

ISCRIZIONI. Impostazioni form ECDL

Транскрипт:

1 METODI E APPLICAZIONI PER SOCIAL NETWORK A.A. 2016-2017 SIMONE ALGHISI

9 GAG

4 NASCITA DI 9GAG - L IDEA When? 2008. Where? Hong Kong. What? Una piattaforma incentrata sulla condivisione e creazione di "Meme". (Immagini ironiche di situazioni quotidiane) Idea: Ognuno può inviare le proprie creazioni e sottoporle al giudizio degli utenti che le vedranno. Le categorie: 1. Hot, in cui sono visualizzati tutti gli elementi che hanno ricevuto più approvazioni e commenti. I più famosi, insomma. 2. Trending, categoria di immagini che seguono un certo trend di apprezzamenti e sono pronte ad andare nella categoria Hot. 3. Vote, categoria di immagini appena inviate e da sottoporre a voto. (UP! or DOWN" ).

6 NETWORK CREATION NODI: utenti iscritti al sito. LINK: i commenti che un utente lascia sul post di un altro utente. (Link diretti) IL PROBLEMA: I realizzatori del post possono commentarsi il loro stesso post, esistono quindi i cappi! (dovranno essere gestiti con un apposita funzione di detection e remotion). COME La costruzione del grafo è stata strutturata sulla creazione di due liste: una lista con gli edge della network e una lista con gli attributi di ogni arco, rispettivamente "link" e "attributi".

7 NETWORK VISUALIZATION Utilizzando Gephi: Si calcola il degree di ogni nodo e le componenti fortemente connesse. Si colorano I nodi e gli edge a seconda dell appartenenza ad una componente fortemente connessa e la loro dimensione in base al degree. Viene utilizzata una "Circular Layout" orientandola secondo la componente, successivamente "ForceAtlas2" senza Lin-log per espanderla leggermente.

8

9 OSSERVAZIONI 1. Pur avendo ordinato il layout a seconda della componente, i nodi con degree maggiore si trovano vicini tra di loro. Quindi: nodi con alto degree sono nella stessa componente di nodi con alto degree e rispettivamente nodi con basso degree stanno nella componente di nodi con lo stesso degree. 2. Vi sono dei "weak ties",ovvero dei link che attraversano la network partendo da una componente e finendo in un altra. Rendono la rete connessa e compatta. 3. L anello più esterno della network è formato dai "commenti di commenti" e caratterizza i nodi più esterni e lontani rispetto ad una network.

10 LE SEZIONI Suddivisione della network in subgraphs edge-generated per sezione: 15,4% 6,2% 6,9% 6,7% 9,3% 3,9% 11,7% 2,9% 8,8% Comic 10,0% Wtf Geeky Gif Cosplay 10,3% Meme Cute Design 7,9% Food Funny Sport Savage N.B: La somma in percentuale non è 100% poiché alcuni edge hanno più sezioni attribuite.

11 RECIPROCITÀ Sono stati estratti tutti gli archi reciproci ed è stata calcolata la reciprocità stampando in un file tutti gli archi (v,w) per cui nel grafo vi è contenuto un altro arco (w,v) per poi visualizzarne in Gephi il risultato

12

13 CONSIDERAZIONI Qualsiasi arco nel grafo risulta essere reciproco. Si notano circa 4 grandi gruppi (formati attraverso la modularity di Gephi) che comprendono la maggior parte dei nodi e una costellazione di sempre più piccoli nodi tutt attorno.

14 NETWORK ANALISYS Una volta caricato il grafo si calcolano le metriche fondamentali della network fino ad arrivare a quelle più complesse Si riportano di seguito i passaggi del notebook per il calcolo delle metriche MISURE DEL GRAFO:

15 NETWORK ANALISYS IN-DEGREE: OUT-DEGREE:

16 NETWORK ANALISYS MAX DEGREE e MEDIA:

17 GIANT CONNECTED COMPONENT Si calcolano le metriche relative alle componenti connesse rintracciate nella network. Poiché la network è orientata esistono due tipi di componenti connesse: A. Componenti debolmente connesse. B. Componenti fortemente connesse.

18 GIANT WEAKLY CONNECTED COMPONENT Si noti come la Giant Weakly Connected Component non si discosti di molto dalla network complessiva

19 GIANT STRONGLY CONNECTED COMPONENT

20 CONSIDERAZIONI Più della metà dei weak ties non sono derivati dalla costruzione della network ma sono bensì interni alle varie sezioni del grafo. Si nota perciò come le varie sezioni (comic,gif,geek,sport ) interagiscano tra di loro dato che gli utenti stessi spaziano tra le varie sezione e rendono la network fortemente connessa. I weak ties si trovano quindi dentro le sezioni stesse e non tra le varie sezioni. Ciò può essere indice di assortatività: dato che utenti provenienti da diverse sezioni si trovano alla fine ad interagire con utenti di tutt altre sezioni.

21 RECIPROCITY & TRANSITIVITY Le metriche riguardanti la reciprocità (probabilità di trovare un arco reciproco nella network) e la transitività (chiusura di triadi fra nodi,"l amico di un mio amico è anche mio amico") servono a capire se ci si trova di fronte ad un information network oppure ad una social network.

22 RECIPROCITY & TRANSITIVITY Dal confronto con i dati delle grandi network (come Facebook,Twitter) riportati nelle analizzate dai paper visti durante il corso, risulta evidente come questa network sia ancora in uno stadio embrionale e abbia ancora molta possibilità di crescita e sviluppo in tale senso.

23 IN-DEGREE DISTRIBUTION & ECDF MEDIA: 2.70208 VARIANZA: 960.1621

24 OUT-DEGREE DISTRIBUTION & ECDF MEDIA: 2.70208 VARIANZA: 33.9426

25 DEGREE DISTRIBUTION & ECDF MEDIA: 5.40416 VARIANZA: 1034.337

26 CONSIDERAZIONI In tutti e tre i casi la media è molto bassa (2<media>5) mentre la varianza molto alta crea una coda lunga a destra. (distribuzione power law, tipica delle real network) Questi risultati rassicurano sul fatto che la network in esame non sia una network artificiale ma una network reale composta da persone che interagiscono veramente tra di loro. Seguendo la legge di Pareto: la maggior parte del degree è caratteristica della minor parte di popolazione.

27 SCALA LOGLOG La "retta di Barabasi" caratterizza le real network

28 9GAG VS REAL NETWORK Random Network 9GAG Network Le distribuzioni sono molto diverse, questo rafforza l identificazione della network in esame come una real network.

29 9GAG = REAL NETWORK? Real Network 9GAG Network In questo caso le distribuzioni sono simili!

30 CONCLUSIONI Il grafo studiato: è una REAL NETWORK. (distr.power law, paretiana, hub ) Il grafo è sparso. La network ha reciprocity, transitivity e average clustering tali da non poter essere paragonati ad una grande network ma c è potenziale La network (dal punto di vista non-orientato) risulta essere molto connessa!

31