La Social Network Analysis applicata alla ricerca semantica Ernesto Lastres Sistemi Territoriali S.r.l. Cascina (Pisa), Italy Il Progetto ODINet è realizzato con il determinante contributo della Regione Toscana a valere sul Programma Operativo Regionale cofinanziato dal FESR per l obiettivo Competitività regionale e occupazione anni 2007-2013.
Rete o Grafo La rete esprime la connettività, cioè come le cose sono collegate Studio del grafo come oggetto matematico/informatico Nella grafo possiamo individuare molte misure (indicatori di rete) che possono caratterizzare i dati (nella rete). Sono difficilmente estraibili se non con tecniche di analisi di reti I problemi sulle reti sono notoriamente molto complessi
Cos è una rete sociale? Una Rete Sociale (Social Network) consiste in un gruppo di entità/oggetti connessi tra loro da legami di tipo sociale, tematico, infrastrutturale, ecc. Lo scopo dell'analisi delle Reti Sociali è quello di individuare e analizzare i legami (connessioni) tra le entità per individuare i nodi con un ruolo o significatività particolare secondo un criterio dato: Centralità Coesione Vicinanza Influenza reciproca
Le Reti Sociali Workshop ODINet, CNR Pisa, 24 Marzo 2015 Relazioni Patrimoniali e Famigliari Attori Persone Famiglie Immobili Società Terreni Macchine Barche Relazioni Amicizia Uso Scambio Proprietà Collaborazione Condivisione Appartenenza Contratto
La Nostra Rete Sociale Attori Concetti Termini (literals) Datasets Cartelle Siti Web Persone e Organizzazioni Relazioni Tematiche (keywords) Semantiche (concettuali) Links (URL/RDF) Sociali Autore Pubblicatore Utilizzatore Feedback
Cosa differenza la rete sociale da altri tipi di rete? es. Rete Idrica o una Rete Stradale
Small World e 6 Gradi di Separazione Small World Network Sono reti che hanno pochi archi e tanti nodi connessi Ci sono tantissimi nodi con un solo arco e pochi con molti archi (distribuzione esponenziale) Pochi gradi di separazione tra due nodi qualsiasi Queste reti hanno un riscontro in tanti aspetti del mondo reale Società Economia Sistemi biologici Mercati Trasporti,. Per questo motivo le proprietà di queste reti vengono studiate molto L ~ log( V ) Workshop ODINet, CNR Pisa, 24 Marzo 2015
Degree Indici di Centralità Il più semplice di tutti. Indice locale in funzione di quanti archi ha il nodo in ingresso e/o uscita Eigenvector È una misura di quanto centrale è il nodo in relazione alla sua influenza (link) con i vicini. Il PageRank di Google è una variante di questo indice Betweenness Indica quanto centrale è il nodo in relazione al passaggio di informazione che lo attraversa proveniente dal resto del grafo Closeness Indica mediamente quanto vicino (in gradi di separazione) è il nodo dal resto del grafo Workshop ODINet, CNR Pisa, 24 Marzo 2015
Indici di Centralità alta bassa alta Eigenvector bassa Betweenness Workshop ODINet, CNR Pisa, 24 Marzo 2015
SNA nel Ranking dei Dati PageRank (quello di Google), ma applicato al grafo di dataset e concetti Assunzione: Un dataset è più rilevante per una ricerca se ha più link entranti provenienti da entità «importanti» del grafo. Come funziona: conta il numero e l importanza dei link a un entità del grafo per fare una stima di quanto un dataset è importante nel contesto di una ricerca Se l amico della mia amica è un tipo importante probabilmente qualcosa «arriverà» a me.
La Social Network Analysis e ODINet Creazione di un grafo di conoscenza formato dai concetti delle ontologie tematiche di riferimento e dai dataset Indici di centralità e di flusso in funzione di un criterio Individuare nodi (sia dataset che concetti) della rete con le caratteristiche indicate. Ottenere indici di centralità Dare rilevanza ai risultati in funzione dei criteri di ricerca prefissati Ordinare i risultati
Grazie per l attenzione Workshop ODINet, CNR Pisa, 24 Marzo 2015