1 METODI E APPLICAZIONI PER SOCIAL NETWORK A.A. 2016-2017 SIMONE ALGHISI
9 GAG
4 NASCITA DI 9GAG - L IDEA When? 2008. Where? Hong Kong. What? Una piattaforma incentrata sulla condivisione e creazione di "Meme". (Immagini ironiche di situazioni quotidiane) Idea: Ognuno può inviare le proprie creazioni e sottoporle al giudizio degli utenti che le vedranno. Le categorie: 1. Hot, in cui sono visualizzati tutti gli elementi che hanno ricevuto più approvazioni e commenti. I più famosi, insomma. 2. Trending, categoria di immagini che seguono un certo trend di apprezzamenti e sono pronte ad andare nella categoria Hot. 3. Vote, categoria di immagini appena inviate e da sottoporre a voto. (UP! or DOWN" ).
6 NETWORK CREATION NODI: utenti iscritti al sito. LINK: i commenti che un utente lascia sul post di un altro utente. (Link diretti) IL PROBLEMA: I realizzatori del post possono commentarsi il loro stesso post, esistono quindi i cappi! (dovranno essere gestiti con un apposita funzione di detection e remotion). COME La costruzione del grafo è stata strutturata sulla creazione di due liste: una lista con gli edge della network e una lista con gli attributi di ogni arco, rispettivamente "link" e "attributi".
7 NETWORK VISUALIZATION Utilizzando Gephi: Si calcola il degree di ogni nodo e le componenti fortemente connesse. Si colorano I nodi e gli edge a seconda dell appartenenza ad una componente fortemente connessa e la loro dimensione in base al degree. Viene utilizzata una "Circular Layout" orientandola secondo la componente, successivamente "ForceAtlas2" senza Lin-log per espanderla leggermente.
8
9 OSSERVAZIONI 1. Pur avendo ordinato il layout a seconda della componente, i nodi con degree maggiore si trovano vicini tra di loro. Quindi: nodi con alto degree sono nella stessa componente di nodi con alto degree e rispettivamente nodi con basso degree stanno nella componente di nodi con lo stesso degree. 2. Vi sono dei "weak ties",ovvero dei link che attraversano la network partendo da una componente e finendo in un altra. Rendono la rete connessa e compatta. 3. L anello più esterno della network è formato dai "commenti di commenti" e caratterizza i nodi più esterni e lontani rispetto ad una network.
10 LE SEZIONI Suddivisione della network in subgraphs edge-generated per sezione: 15,4% 6,2% 6,9% 6,7% 9,3% 3,9% 11,7% 2,9% 8,8% Comic 10,0% Wtf Geeky Gif Cosplay 10,3% Meme Cute Design 7,9% Food Funny Sport Savage N.B: La somma in percentuale non è 100% poiché alcuni edge hanno più sezioni attribuite.
11 RECIPROCITÀ Sono stati estratti tutti gli archi reciproci ed è stata calcolata la reciprocità stampando in un file tutti gli archi (v,w) per cui nel grafo vi è contenuto un altro arco (w,v) per poi visualizzarne in Gephi il risultato
12
13 CONSIDERAZIONI Qualsiasi arco nel grafo risulta essere reciproco. Si notano circa 4 grandi gruppi (formati attraverso la modularity di Gephi) che comprendono la maggior parte dei nodi e una costellazione di sempre più piccoli nodi tutt attorno.
14 NETWORK ANALISYS Una volta caricato il grafo si calcolano le metriche fondamentali della network fino ad arrivare a quelle più complesse Si riportano di seguito i passaggi del notebook per il calcolo delle metriche MISURE DEL GRAFO:
15 NETWORK ANALISYS IN-DEGREE: OUT-DEGREE:
16 NETWORK ANALISYS MAX DEGREE e MEDIA:
17 GIANT CONNECTED COMPONENT Si calcolano le metriche relative alle componenti connesse rintracciate nella network. Poiché la network è orientata esistono due tipi di componenti connesse: A. Componenti debolmente connesse. B. Componenti fortemente connesse.
18 GIANT WEAKLY CONNECTED COMPONENT Si noti come la Giant Weakly Connected Component non si discosti di molto dalla network complessiva
19 GIANT STRONGLY CONNECTED COMPONENT
20 CONSIDERAZIONI Più della metà dei weak ties non sono derivati dalla costruzione della network ma sono bensì interni alle varie sezioni del grafo. Si nota perciò come le varie sezioni (comic,gif,geek,sport ) interagiscano tra di loro dato che gli utenti stessi spaziano tra le varie sezione e rendono la network fortemente connessa. I weak ties si trovano quindi dentro le sezioni stesse e non tra le varie sezioni. Ciò può essere indice di assortatività: dato che utenti provenienti da diverse sezioni si trovano alla fine ad interagire con utenti di tutt altre sezioni.
21 RECIPROCITY & TRANSITIVITY Le metriche riguardanti la reciprocità (probabilità di trovare un arco reciproco nella network) e la transitività (chiusura di triadi fra nodi,"l amico di un mio amico è anche mio amico") servono a capire se ci si trova di fronte ad un information network oppure ad una social network.
22 RECIPROCITY & TRANSITIVITY Dal confronto con i dati delle grandi network (come Facebook,Twitter) riportati nelle analizzate dai paper visti durante il corso, risulta evidente come questa network sia ancora in uno stadio embrionale e abbia ancora molta possibilità di crescita e sviluppo in tale senso.
23 IN-DEGREE DISTRIBUTION & ECDF MEDIA: 2.70208 VARIANZA: 960.1621
24 OUT-DEGREE DISTRIBUTION & ECDF MEDIA: 2.70208 VARIANZA: 33.9426
25 DEGREE DISTRIBUTION & ECDF MEDIA: 5.40416 VARIANZA: 1034.337
26 CONSIDERAZIONI In tutti e tre i casi la media è molto bassa (2<media>5) mentre la varianza molto alta crea una coda lunga a destra. (distribuzione power law, tipica delle real network) Questi risultati rassicurano sul fatto che la network in esame non sia una network artificiale ma una network reale composta da persone che interagiscono veramente tra di loro. Seguendo la legge di Pareto: la maggior parte del degree è caratteristica della minor parte di popolazione.
27 SCALA LOGLOG La "retta di Barabasi" caratterizza le real network
28 9GAG VS REAL NETWORK Random Network 9GAG Network Le distribuzioni sono molto diverse, questo rafforza l identificazione della network in esame come una real network.
29 9GAG = REAL NETWORK? Real Network 9GAG Network In questo caso le distribuzioni sono simili!
30 CONCLUSIONI Il grafo studiato: è una REAL NETWORK. (distr.power law, paretiana, hub ) Il grafo è sparso. La network ha reciprocity, transitivity e average clustering tali da non poter essere paragonati ad una grande network ma c è potenziale La network (dal punto di vista non-orientato) risulta essere molto connessa!
31