Structural analysis of behavioral networks from the Internet

Documenti analoghi
Informatica per la comunicazione" - lezione 8 -

11. Analisi statistica degli eventi idrologici estremi


Lo scenario: la definizione di Internet

Prof. Filippo Lanubile

Prova di Esame - Rete Internet (ing. Giovanni Neglia) Lunedì 24 Gennaio 2005, ore 15.00

Tirocinio per la Laurea Triennale

Nel seguito sono riportati due esercizi che si possono risolvere con la formula di Erlang e le relative risoluzioni.

APPALTI e CONCESSIONI

La riforma del servizio di distribuzione del

PkBox Client Smart API

La Videosorveglianza Criteri per il dimensionamento dello storage

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Prova di Esame - Rete Internet (ing. Giovanni Neglia) Lunedì 24 Gennaio 2005, ore 15.00

INFORMATICA PROGETTO ABACUS. Tema di : SISTEMI DI ELABORAZIONE E TRASMISSIONE DELLE INFORMAZIONI

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

La Social Network Analysis applicata alla ricerca semantica

Prova di autovalutazione Prof. Roberta Siciliano

Progetto promosso e finanziato dalla. Unione Regionale delle Camere di Commercio del Molise

Il confronto fra proporzioni

1. Distribuzioni campionarie

Worm Detection Using Data Mining

Regolamento REACH Lo scambio di informazioni: il punto di vista delle imprese del commercio chimico

GESTIONE INDUSTRIALE DELLA QUALITÀ A

Metodi statistici per le ricerche di mercato

Reti di Telecomunicazione Lezione 6

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

3. Introduzione all'internetworking

Analisi dell evoluzione dell informazione online in Italia

VALORE DELLE MERCI SEQUESTRATE

MODELLISTICA DI IMPIANTI E SISTEMI 2

RETI DI COMPUTER Reti Geografiche. (Sez. 9.8)

La distribuzione Normale. La distribuzione Normale

LA CORRELAZIONE LINEARE

Network Monitoring. Introduzione all attività di Network Monitoring introduzione a Nagios come motore ideale

VERIFICA DELLE IPOTESI

Relazioni statistiche: regressione e correlazione

Reti di calcolatori ed indirizzi IP

E naturale chiedersi alcune cose sulla media campionaria x n

The Directed Closure Process in Hybrid Social-Information Networks

LA MAPPA CONCETTUALE Lezione n. 16

Statistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica

Università degli Studi di Pisa Dipartimento di Informatica. NAT & Firewalls

Una architettura peer-topeer per la visualizzazione 3D distribuita

Line Monitoring System

Statistica. Lezione 6

Indici di dispersione

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica inferenziale

Reti di Telecomunicazione Lezione 8

DISTRIBUZIONI DI PROBABILITÀ

PROGRAMMA SVOLTO NELLA SESSIONE N.

Dossier 7 Il possesso e l acquisto di beni durevoli ( )

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

STUDIO DI SETTORE UK27U ATTIVITÀ EDIZIONE DI GIOCHI PER COMPUTER ATTIVITÀ EDIZIONE DI ALTRI SOFTWARE A

STATISTICA IX lezione

NodeXL: l amo delle Reti Sociali

Protocollo SNMP e gestione remota delle apparecchiature

Agenti Mobili Intelligenti e Sicurezza Informatica Utilizzare un nuovo paradigma applicativo per la realizzazione di sistemi informatici sicuri.

Capitolo 11 Test chi-quadro

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

La dispersione dei prezzi al consumo. I risultati di un indagine empirica sui prodotti alimentari.

Il Ministero dello Sviluppo Economico

Capitolo 15 Reti di calcolatori e sistemi distribuiti

Pensionati e pensioni nelle regioni italiane

Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto

Rete Internet Prova in Itinere Mercoledì 23 Aprile 2008

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Che cosa e come valutano le prove di matematica e con quali risultati. nell A.S

Istituzioni di Statistica e Statistica Economica

Parte II: Reti di calcolatori Lezione 9

Esercizi di dimensionamento dei sistemi di commutazione telefonica

Topologia delle reti. Rete Multipoint: ogni nodo è connesso agli altri tramite nodi intermedi (rete gerarchica).

Analisi della performance temporale della rete

Corso di Informatica

DETERMINAZIONE N. 3/DCOU/2013 IL DIRETTORE DELLA DIREZIONE CONSUMATORI E UTENTI DELL AUTORITÀ PER L ENERGIA ELETTRICA E IL GAS

Analisi di dati di frequenza

Metodi e tecniche per la rilevazione e il contrasto di botnet in reti universitarie

ANALISI DEL MUTUATARIO

Reti di calcolatori. Lezione del 10 giugno 2004

La propagazione delle onde luminose può essere studiata per mezzo delle equazioni di Maxwell. Tuttavia, nella maggior parte dei casi è possibile

Calcolatori Elettronici A a.a. 2008/2009

PROBABILITA MISURARE L INCERTEZZA Lanciamo due dadi, facciamo la somma dei punteggi ottenuti. Su quale numero mi conviene scommettere?

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI

Corso di Psicometria Progredito

WEBALIZER GUIDA ALLA LETTURA DELLE STATISTICHE

SPC e distribuzione normale con Access

Gestione della Sicurezza Informatica

Peer to Peer non solo file sharing

3. Confronto tra medie di due campioni indipendenti o appaiati

Riccardo Paterna

uadro Soluzione software e hardware Per le rilevazione presenze Gestione Aziendale Fa quadrato attorno alla tua azienda

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Un architettura per lo streaming multimediale in ambiente distribuito

Interconnessione di reti

ALLEGATO 1. ALL. 1 NEWSLETTER N aicq sicev

Archivio WebQuest I Grafi e le Reti

Nota interpretativa. La definizione delle imprese di dimensione minori ai fini dell applicazione dei principi di revisione internazionali

Transcript:

M. R. Meiss, F. Menczer, A. Vespignani Structural analysis of behavioral networks from the Internet De Santis Roberto

La rete delle reti Successo di Internet Rete vista in termini di Fisicità Sistema complesso Applicazioni e reti virtuali 2

Com'è fatta la rete Internet? Problemi inerenti allo studio di Internet Mancanza di una componente di controllo centralizzato o che permetta di avere una visione globale Collezione di vari elementi di visione locale Traceroute Risultati Topologia controversa, ma nota a grandi linee Proprietà interessanti 3

Utilizzi della rete e comportamenti Struttura topologica della rete fisica e della rete virtuale sono indipendenti l'una dall'altra Perchè studiare le reti comportamentali? Miglioramento nella progettazione delle reti future Modellare meglio il traffico di Internet 4

Rilevare i comportamenti Server log Non basato su user-to-user interaction Flussi di rete IP, porte Cisco NetFlow Problema della privacy Campionamento dei pacchetti con frequenza 1:100 5

Scenario: la rete Abilene Progetto di Internet2 fine anni '90 Prestazioni elevate: 10Gbps sulle dorsali Università e centri di ricerca: centinaia di migliaia di utenti Mai congestionata 6

I dati raccolti: forma e preparazione Dati sottoforma di record (circa 30GB al giorno) Dettagli su sorgente e destinatario Tipo e quantità di dati scambiati Identificazione dei ruoli: client e server C = {i 1, i 2,, i Nc } S = {j 1, j 2,, j Ns } 7

Behavioral, functional, application graphs 8

Flussi osservati Osservazione di 24 ore il 14 Aprile 2005 625 milioni di flussi 258 milioni (41,3%) relativi al Web 82 milioni (13,1%) relativi ad applicazioni P2P 285 milioni (45,6%) relativi ad altro traffico (incluso network monitoring) Web 41,3% P2P 13,1% Altro 45,6% 9

Host osservati 15 milioni di host (considerando tutti i flussi): 5,82 milioni di client 11,1 milioni di server Considerando solo il flusso web: 3,97 milioni di client 0,68 milioni di server Considerando solo il flusso P2P: 0,71 milioni di client 0,14 milioni di server 10

Distribuzione degli edge rispetto ai traffici Behavioral graph Traffico web: 50.1 milioni di edge (38,0%) Traffico P2P: 7.89 milioni di edge (6,0%) Traffico di altro tipo: 54.9 milioni di edge (41,6%) Web 44% Altro 49% P2P 7% 11

Degree overlap tra client e server Alcuni nodi fungono sia da client, sia da server Nel behavioral graph tali nodi compaiono due volte Grado di overlap tra gli insiemi C ed S: O= ( C S ) ( C S ) Valori rilevati nel behavioral graph Generico: O = 0,14 Traffico web: O = 0,013 Traffico P2P: O = 0,097 12

Statistiche sul traffico 1.85 TB di informazioni scambiate (in media 124 kb per host) Tenere in considerazione il campionamento 1:100 Web 25% P2P 6% Altro 69% 13

Confronto tra flusso e traffico Distribuzione del flusso Distribuzione del traffico Web 41,3% P2P 13,1% Altro 45,6% P2P 6% Web 25% Altro 69% 14

Studio della struttura del behavioral graph Degree di un nodo N d N =i+j dove i e j sono rispettivamente il numero di archi uscenti ed entranti Strength di un nodo N i s N = k =1 dove w N, N k j w N, N k + k=1 w N k, N è il peso dell'arco da N a N k Il degree di un nodo rispecchia la quantità di altri nodi con cui ha scambiato dati, mentre la strength si riferisce alla quantità di dati scambiati 15

Distribuzioni di degree e strength Decisioni individuali in una popolazione molto larga Distribuzione normale? Degree Strength Distribuzioni di tipo long-tailed (10 ordini di grandezza per strength) Distribuzione approssimabile con power-law per entrambe P(n) n γ 16

Distribuzione power-law P(n) n -γ A seconda del valore di γ si ha una certa rapidità di convergenza a 0 Valore atteso <n>= n P(n) dn Varianza <n 2 >= n 2 P(n) dn Se 2<γ<3 la varianza diverge, la media è ben definita Il valore atteso <n> non è più un parametro in grado di predire il numero di collegamenti nel sistema su ogni nodo (degree) Alta probabilità di avere client connessi con un numero arbitrario di server (degree) o che abbia scaricato un'arbitraria quantità di dati (strength) Se γ<2 la media diverge: né il valore medio di collegamenti (degree), né la quantità media di dati trasmessi sono caratteristiche predicibili nel sistema Forte eterogeneità Scale-free network 18

Traffico web: degree e strength Degree Strength 19

Traffico P2P: degree e strength Degree Strength 20

Relazione tra degree e strength Relazione tra numero di host contattati e quantità di informazioni scambiata Comportamento atteso: strength che aumenta in funzione del degree 21

Relazione tra degree e strength Power-law (crescente) <s(k)> k β Server web: β 1 Client web: β=1.2±0,1 22

Conclusioni Il comportamento degli utenti raramente segue una distribuzione normale Comportamenti differenti a seconda dell'applicazione In alcuni casi il comportamento può diventare un parametro identificativo dell'applicazione Attuale politiche di sicurezza con soglie basate sul data rate per il rilevamento di anomalie nel traffico Informazioni importanti per network design e capacity planning dei collegamenti 23

Grazie per l'attenzione! 24