PARTE 2 - COMUNICAZIONI INFORMATICHE (Internet e Web) Importanza delle comunicazioni Tutti vogliono comunicare Oggi un computer che non è in grado di comunicare è uno strumento utilizzabile a metà (per alcuni, anche meno )? Informatica, A.A. 2010/2011 - Comunicazioni informatiche 2 1
Internet: Cosa non è... Non è una singola rete, ma un insieme di reti esteso in tutto il mondo Non è governata da un gruppo né da un ente né da un unica azienda Non è gestita in modo centralizzato perché tutte le singole reti che compongono Internet hanno una gestione autonoma E soprattutto (qualsiasi cosa pensino i giornalisti): Non è sinonimo di World Wide Web Informatica, A.A. 2010/2011 - Comunicazioni informatiche 3 Il successo continuo e costante di Internet Tutti gli host collegati a Internet devono essere identificati in modo univoco Numero di host collegati a Internet 1969 4 1979 200 1989 100.000 Gennaio 1993 1.313.000 Gennaio 1994 2.217.000 Gennaio 1995 4.852.000 Gennaio 1996 9.472.000 Gennaio 1997 16.146.000 Gennaio 1998 29.670.000 Gennaio 1999 43.230.000 Gennaio 2000 72.340.000 Gennaio 2001 109.574.000 Gennaio 2002 147.344.000 Gennaio 2003 171.638.000 Gennaio 2004 233.101.000 Gennaio 2005 317.646.000 Gennaio 2006 394.992.000 Gennaio 2007 433.194.000 Gennaio 2008 541.677.000 Gennaio 2009 625.226.000 Gennaio 2010 732.740.000 Informatica, A.A. 2010/2011 - Comunicazioni informatiche 4 2
Indirizzi IP Per fornire un servizio di comunicazione universale (ovvero, poter far comunicare ogni nodo della rete con ciascun altro nodo) occorre un metodo che permetta di identificare univocamente ogni nodo TELEFONIA: (prefisso stato) (prefisso area) (numero) Es. 0039 059 2056233 INTERNET: Un numero binario di 32 bit, ovvero 4 byte, ciascuno separato da un punto Es. 00101011.10100101.11100011.00110011 Informatica, A.A. 2010/2011 - Comunicazioni informatiche 5 Indirizzi IP (cont.) L indirizzo IP è suddiviso in 4 campi, ciascuno dei quali è formato da 8 bit, separati da un punto Poiché la notazione binaria non è facilmente utilizzabile, si preferisce adottare la notazione decimale puntata o dotted notation, Esempio di indirizzo IP: 130.192.5.189 Nella versione attuale del protocollo IP ci sono circa 4 miliardi di indirizzi IP disponibili Informatica, A.A. 2010/2011 - Comunicazioni informatiche 6 3
Oltre all IP: Hostname Dato lo scopo dei servizi Internet rivolto verso l utente, anche la scelta dell indirizzo IP in formato decimale non sembra la più adatta Come attribuire valori mnemonici agli host collegati in rete? Usare l hostname: nome del computer dominio di appartenenza Informatica, A.A. 2010/2011 - Comunicazioni informatiche 7 Esempio 1 di Hostname: nome dell host + dominio sun3.dii.unimo.it Nome dell host ITalia Dipartimento di Ingegneria dell Informazione UNIiversità di MOdena Dominio di appartenenza dell organizzazione Dominio della nazione Informatica, A.A. 2010/2011 - Comunicazioni informatiche 8 4
Esempio 2 di Hostname: nome del servizio + dominio Nome del servizio www.unimo.it ITalia UNIiversità di MOdena Dominio di appartenenza dell organizzazione Dominio della nazione Informatica, A.A. 2010/2011 - Comunicazioni informatiche 9 Top Level Domain (TLD) storici Nome del Dominio Significato COM EDU GOV MIL NET ORG ARPA Organizzazioni commerciali (free registration) Istituzioni USA per l istruzione Istituzioni governative USA Istituzioni militari USA Maggiori centri di supporto per la rete (free registration) Organizzazioni senza scopo di lucro (free registration) Dominio della rete ARPANET (amministrazione) INT Organizzazioni internazionali Codici internazionali Codice nazionale (it, ch, fr, jp, uk,... ) 240 nomi nazionali (schema geografico): TLD [Caso interessante: Tuvalu con dominio.tv] Informatica, A.A. 2010/2011 - Comunicazioni informatiche 10 5
Domain Name System (DNS) Realizza uno spazio dei nomi gerarchico e permette la traduzione del nome mnemonico di un host in un indirizzo IP e viceversa. Es. Hostname: sun3.dii.ing.unimo.it Indirizzo IP: 134.56.26.68 (10000110.00111000.00011010.01000100) Implementa un meccanismo efficiente (mediante multipli name servers), distribuito su scala geografica, per risolvere un hostname in un indirizzo IP e viceversa Informatica, A.A. 2010/2011 - Comunicazioni informatiche 11 Modalità di accesso a Internet Wired Accesso istituzionale mediante Accesso residenziale mediante modem e Internet Service Provider Wireless Accesso WiFi Accesso alla rete GSM, GPRS, UMTS Informatica, A.A. 2010/2011 - Comunicazioni informatiche 12 6
Accesso ad Internet istituzionale mediante Local Area Network () Una è una rete di host concentrata in un area limitata, come l interno di un edificio o di un campus universitario Accesso istituzionale: l host dell utente è su una (la tecnologia Ethernet è la più diffusa) La fornisce l accesso ad Internet attraverso un router ROUTER Local Area Network Informatica, A.A. 2010/2011 - Comunicazioni informatiche 13 Accesso ad Internet residenziale mediante Internet Service Provider Centrale telefonica Internet Service Provider (ISP) Server Macchina con Indirizzo IP MODEM Rete digitale della compagnia telefonica Router INTERNET Informatica, A.A. 2010/2011 - Comunicazioni informatiche 14 7
Internet Service Provider Il provider possiede più server sempre attivi e collegati ad Internet una batteria di modem collegati a numeri di telefono Servizi offerti Base: accesso ad Internet (mediante telefonata ai suoi numeri) Accessori: email, sito Web, chat-line, mailing list,... Costi a consumo o flat (tariffa fissa mensile) Tecnologie adottate ADSL: Asymmetric Digital Subscriber Line (per privati) HDSL: High-Bit-Rate Digital Subscriber Line (per aziende) Informatica, A.A. 2010/2011 - Comunicazioni informatiche 15 Modalità di accesso wireless WiFi Un accesso condiviso wireless, mediante una stazione base, connette gli host mobili ad un router di Internet Wireless (W o WiFi): i cavi sono rimpiazzati da interfacce e ricevitore operanti in un campo radio (es., famiglia IEEE 802.11) La stazione base è detta anche hot spot e definisce un area di copertura della rete WiFi INTERNET Router Stazione Base (access point)) host mobili Informatica, A.A. 2010/2011 - Comunicazioni informatiche 16 8
Modalità di accesso wireless su scala geografica Accesso wireless su di un area aperta accesso wireless sfruttando una rete cellulare telefonica (TIM, Vodafone, 3, sono esempi di offerte in Italia) e da lì ad un router dell ISP Sono sempre più disponibili dispositivi che si collegano alla porta USB del computer Informatica, A.A. 2010/2011 - Comunicazioni informatiche 17 Cos è INTERNET? DAL PUNTO DI VISTA ORGANIZZATIVO: Un insieme di circa 20000 Autonomous Systems alcuni su scala nazionale altri su scala continentale e intercontinentale Informatica, A.A. 2010/2011 - Comunicazioni informatiche 18 9
Autonomous Systems Il traffico Internet si distribuisce tra circa 30000 Autonomous Systems (AT&T, UUNET, @Home, BBN Planet, Sprint, Earthlink, RoadRunner, ) NOTA IMPORTANTE: Nessun Autonomous System gestisce più del 5% del traffico di Internet La stragrande maggioranza degli Autonomous System gestisce molto meno dell 1% del traffico di Internet Informatica, A.A. 2010/2011 - Comunicazioni informatiche 19 Esempio (connessione intercontinentale) Rete WAN (Network provider intercontinentale) Rete WAN (Network provider nazionale) Sede di Los Angeles Sede di New York Wide Area Network Rete WAN (Network provider nazionale) Informatica, A.A. 2010/2011 - Comunicazioni informatiche 20 10
Connessioni di un grande provider: Cogent Communications Informatica, A.A. 2010/2011 - Comunicazioni informatiche 21 Architettura Internet: gerarchia lasca (2 livelli: nazionale e internazionale) Last mile PC utente Autonomous System del Provider Nazionale (Telecom, FastWeb, ) Autonomous System backbone (>10Gbps) backbone Internet exchange Point Autonomous System del Provider Internazionale backbone Autonomous System del Provider Nazionale First mile Computer Server Informatica, A.A. 2010/2011 - Comunicazioni informatiche New York 22 11
Comunicazione in Internet [vista 1] Logicamente comunicano i due host terminali Host A Rete WAN (Network provider) Rete WAN (Network provider) Rete WAN (Network provider) Messaggio = insieme di bit Host B Informatica, A.A. 2010/2011 - Comunicazioni informatiche 23 Architettura Internet In realtà, Internet consiste in milioni di host (computer, PDA, TV, ), dispositivi che instradano i messaggi (router) e link di comunicazione (cavi, fibra ottica, satellitari, ) Host A Rete WAN (Network provider) Host B Informatica, A.A. 2010/2011 - Comunicazioni informatiche 24 12
Comunicazione in Internet [vista 2] Quindi, in realtà il messaggio deve attraversare vari nodi intermedi (router) Host A Rete WAN (Network provider) Rete WAN (Network provider) Rete WAN (Network provider) Host B Informatica, A.A. 2010/2011 - Comunicazioni informatiche 25 Come si fa? Il sistema è molto complesso Il sistema è costituito da componenti estremamente eterogenee: diversi tipi di computer diversi tipi di connessione a Internet (da casa: modem, ADSL; dall ufficio: rete ) diversi tipi di rete (doppino telefonico, cavo in fibra ottica, wireless) Vi sono milioni di nodi Vi sono decine di servizi: posta elettronica, World Wide Web, chat, connessione remota, MMS, ecc. Informatica, A.A. 2010/2011 - Comunicazioni informatiche 26 13
Soluzione: livelli Il layering è il tipico modo informatico per far fronte alla complessità di un problema: Scomporre il problema in sottoproblemi Usare astrazioni per mascherare la complessità L astrazione porta naturalmente al layering Ad ogni livello c è un protocollo che specifica come risolvere il problema In Internet vi possono essere diverse soluzioni alternative (e quindi diversi protocolli) per ciascun livello Informatica, A.A. 2010/2011 - Comunicazioni informatiche 27 Pila di protocolli per Internet Applicazioni Internet (affidabilità) Applicazioni Internet (prestazioni) Livello 5 TCP UDP Livello 4 IP Host-to-Network Livello 3 Livello 1-2 Detto: Stack TCP/IP Informatica, A.A. 2010/2011 - Comunicazioni informatiche 28 14
Stack TCP/IP Applicativo: supporta le tantissime applicazioni disponibili su Internet: Web, e-mail, chat, videostreaming, peer-to-peer,... Trasporto: supporta i trasferimenti da procceso di un host a processo di un altro host. Ci sono due protocolli di trasporto: TCP, UDP Rete: trasferisce i pacchetti dall host mittente a qualsiasi altro host conness a Internet: livello IP (protocollo unico di livello 3) H2N: come ci si connette a Internet e come si trasferiscono messaggi su reti locali o tra computer e provider (vari protocolli disponibili) applicativo trasporto rete link fisico Host-to-Network (H2N) Informatica, A.A. 2010/2011 - Comunicazioni informatiche 29 Principali applicazioni Internet Login remoto a un altro computer (Telnet) Trasferimento di file (FTP) Posta elettronica (SMTP) World Wide Web (HTTP) Chat (IRC) Tutte usano i protocolli di Internet Tutte usano il modello client/server Informatica, A.A. 2010/2011 - Comunicazioni informatiche 30 15
Servizi o Applicazioni Internet Tipicamente, ciascun nuovo servizio Internet definisce: 1. Un software per il client (compresa un interfaccia utente) 2. Un software per il server 3. Un nuovo protocollo (insieme di regole e formati di messaggi) per comunicare tra client e server Informatica, A.A. 2010/2011 - Comunicazioni informatiche 31 Servizi Internet: Modello client-server 1. Trasmissione di una richiesta dal processo client al processo server (request) 2. Elaborazione della richiesta da parte del server 3. Trasmissione di una risposta al client (reply) 1 Client 2 Server 3 Computer Processo Informatica, A.A. 2010/2011 - Comunicazioni informatiche 32 16
WORLD WIDE WEB La killer application di Internet I motivi alla base del successo del Web ( perché è risultata la killer application ) Digitalizzazione dell informazione (Qualsiasi informazione codificata come sequenza di 0 e 1) Diffusione di Internet (dagli anni 70) (Trasporto dell informazione ovunque, in tempi rapidissimi e a costi bassissimi) Diffusione dei PC (dagli anni 80) (Accesso, memorizzazione ed elaborazione dell informazione da parte di chiunque a costi bassissimi) Interfacce user friendly Informatica, A.A. 2010/2011 - Comunicazioni informatiche 34 17
Ingredienti del Web Meccanismi di comunicazione e naming propri di Internet Stack di protocolli TCP/IP e Sistema DNS Sistema client-server Solo tre nuovi standard URL: Sistema di indirizzamento delle risorse HTML: Linguaggio di markup ipertestuale HTTP: Protocollo per le richieste risorse Informatica, A.A. 2010/2011 - Comunicazioni informatiche 35 Campi dell URL schema :// host.domain / pathname http :// www.dsi.unimo.it / docenti/orari/esami.html schema: indica il modo con cui accedere alla risorsa, cioè quale protocollo bisogna usare per interagire con il server che controlla la risorsa. Il metodo di accesso più comune è HTTP (protocollo nativo del WWW per il recupero di risorse Web) host.domain: è l hostname del nodo nel quale risiede la risorsa Web pathname: identifica la risorsa presso il server Web Informatica, A.A. 2010/2011 - Comunicazioni informatiche 36 18
Linguaggio di markup: HTML Due problemi Cosa presento Come lo presento Nel Web, contenuto del testo e regole di presentazione del testo sono inseriti nello stesso file Per permettere la corretta visualizzazione dell informazione su qualsiasi computer connesso a Internet è stato definito un nuovo linguaggio di markup per la formattazione delle pagine A tutt oggi il linguaggio di markup, HyperText Markup Language (HTML), rimane il linguaggio del Web Informatica, A.A. 2010/2011 - Comunicazioni informatiche 37 Istruzioni HTML La descrizione dei contenuti dell ipertesto viene effettuata inserendo all interno del testo stesso alcune istruzioni dette marcatori o markup o tag che producono le visualizzazioni e le azioni specificate. Le istruzioni HTML sono racchiuse tra parentesi angolari, nella forma <tag>, e vengono terminate da un tag di chiusura nella forma </tag>. Es. <CENTER> <B> <FONT="Arial"> <FONT COLOR="#336633"> <FONT SIZE=+1> Informazioni generali </FONT> </FONT> </FONT> </B> </CENTER> Informatica, A.A. 2010/2011 - Comunicazioni informatiche 38 19
L importanza del tag àncora L istruzione più innovativa dell HTML è l àncora delimitata dai tag <A> </A>, in quanto tale elemento permette di trasformare un normale testo in ipertesto multimediale. Un àncora può far riferimento ad una sezione della stessa pagina oppure ad una qualsiasi risorsa (testuale, multimediale, eseguibile) presente sul Web, denotata mediante un URL che va inserito all interno del tag àncora. <A HREF="http://www.unimo.it/studenti/erasmus.ht ml > Programma Erasmus </A> Il testo Programma Erasmus viene visualizzato in modo differente e risulta un link simbolico selezionabile via mouse. Informatica, A.A. 2010/2011 - Comunicazioni informatiche 39 Tipica risorsa Web Pagina HTML (contenitore) + embedded objects (file di qualunque tipo: testo, foto, link, ) Pagina HTML Ad ogni oggetto corrisponde un file Informatica, A.A. 2010/2011 - Comunicazioni informatiche 40 20
Richiesta per una risorsa Web Client Web (browser) Risposta HTTP Richiesta HTTP Server Web Informatica, A.A. 2010/2011 - Comunicazioni informatiche 41 Protocollo HTTP HyperText Trasmission Protocol (HTTP) è il protocollo che permette il reperimento delle risorse Web E un protocollo applicativo di tipo request/reply Tutti i client Web e i server Web devono supportare il protocollo HTTP per poter scambiare richieste e risposte. Per questa ragione i client e i server Web sono chiamati anche client HTTP e server HTTP Informatica, A.A. 2010/2011 - Comunicazioni informatiche 42 21
Protocollo HTTP Il browser richiede l apertura di una connessione verso il server Web Se possibile, il server Web accetta la connessione dal client. Una volta aperta la connessione, vengono scambiati vari messaggi HTTP di tipo testuale tra browser e Web server per mettersi d accordo Dopodiché, il client chiede il primo file che tipicamente è il file contenitore Ottenuto il file contenitore, il client verifica se ci sono embedded objects e li richiede uno alla volta (possono esserci anche 60-80 file di embedded objects) Al termine, vi è la chiusura della connessione Informatica, A.A. 2010/2011 - Comunicazioni informatiche 43 Richiesta di una risorsa Web (cosa succede ad ogni click del mouse?) http://www.unimo.it/index.html INTERNET oggetto Web (6) Client Web Connessione TCP (4) (browser) richiesta URL (5) (index.html) (1) (3) 144.55.62.18 www.unimo.it? name server locale Fase di lookup: (1) - (2) - (3) Fase di connessione TCP: (4) Fase di richiesta: (5) - (6) (2) root name server Ipotesi: una pagina HTML senza embedded objects server Web (indirizzo IP: 144.55.62.18) name server autoritativo per www.unimo.it Informatica, A.A. 2010/2011 - Comunicazioni informatiche 44 22
Il tag àncora consente l ipermedialità su scala geografica con conseguenze Conseguenza dirompente dal punto di vista storico e sociale: l informazione non è più organizzata in rigidi schemi (es., biblioteca), ma è accessibile (anche) mediante link decisi da singole persone, aziende, organizzazioni, Ogni link inserito tra una pagina Web e un altra determina una nuova modalità di accesso all informazione Informatica, A.A. 2010/2011 - Comunicazioni informatiche 45 23