APPROFONDIMENTO ICT Iniziativa Comunitaria Equal II Fase IT G2 CAM - 017 Futuro Remoto Approfondimento INTERNET: IL FUNZIONAMENTO DELL INFRASTRUTTURA E DELLA RETE ORGANISMO BILATERALE PER LA FORMAZIONE IN CAMPANIA
INTERNET: IL FUNZIONAMENTO DELL INFRASTRUTTURA E DELLA RETE L ARCHITETTURA DELLA RETE La struttura del sistema è tale che la sede fisica del "sito" con cui ci si collega è irrilevante: in pratica non c è alcuna differenza, né funzionale, né di costo, fra collegarsi con un "sito" (o un utente) a pochi metri di distanza o all altro capo del pianeta. È anche costruito in modo che non si sia un singolo percorso da un punto all altro del sistema, ma che fra i nodi ci siano molti diversi percorsi possibili e il sistema possa scegliere, secondo la situazione, la strada più adatta. sistema centralizzato sistema decentralizzato rete distribuita In un sistema centralizzato, tutti i segnali passano da un unico punto. In un sistema decentralizzato, un punto "vicino" può essere raggiunto attraverso un nodo periferico, ma un punto "remoto" può essere raggiunto solo passando dal centro (evidentemente da "distanza" non è determinata tanto dallo spazio fisico quanto dalla struttura del sistema). In una rete distribuita, l informazione può percorrere molte strade diverse e scegliere in ogni momento il percorso più adatto per arrivare a destinazione, indipendentemente dalla distanza. Questo è il modello su cui è costruita la struttura dell internet. LA COMMUTAZIONE A PACCHETTI Le trasmissioni via internet avvengono con un sistema "a pacchetti" per cui ogni messaggio viene scomposto in parti che viaggiano separatamente e vengono ricomposte all arrivo. Una tecnologia chiamata TCP/IP (Transmission Control Protocol - Internet Protocol) permette a tutti i sistemi connessi di interagire fra loro, senza una "gerarchia" rigida: cioè ogni "nodo" connesso può raggiungerne un altro scegliendo percorsi diversi secondo la situazione. Nel caso che un nesso intermedio non sia accessibile in quel momento, la comunicazione arriverà per un altra via all indirizzo stabilito (questa flessibilità rende il sistema più simile a una macchina analogica, come il cervello umano, che a un computer). Esiste una gerarchia internazionale di organizzazioni il cui compito è definire i domain internet, cioè il sistema su cui si basano gli indirizzi; ma non gestire le reti (che, come abbiamo detto, sono completamente autonome e indipendenti). Gli scambi all interno del sistema sono sostanzialmente gratuiti, perché basati sulla reciprocità: ogni "nodo" collegato dà e riceve servizio. Questo sistema ha permesso alla rete di sopravvivere e crescere anche dopo la fine dei finanziamenti pubblici su cui si era originalmente basata la cosiddetta backbone ("spina dorsale") americana e dalle reti universitarie che ne sono state, fino a qualche anno fa, la struttura portante. Possono essere a pagamento le due estremità del sistema: il collegamento fra l utente e il "nodo" di cui si serve (Internet Service Provider); e, al polo opposto, il servizio offerto da qualcuno sul "sito" con cui ci colleghiamo (anche se in pratica, una volta ottenuto 2
l accesso alla rete tramite un provider o un organizzazione di cui si fa parte, quasi tutti i siti cui vogliamo accedere sono gratuiti). Ma la struttura della rete, in quanto tale, è basata su scambi gratuiti di reciproco servizio. C è un limite tecnico allo sviluppo della rete, perché la potenzialità quantitativa del "protocollo" TCP/IP, anche se enormemente grande rispetto alle esigenze che si potevano immaginare vent anni fa, non è infinita. Si stanno elaborando le soluzioni tecniche necessarie per superare il limite. Non so quale sarà la soluzione definitiva (il problema non è tanto definire la tecnologia, quanto farla condividere a milioni di impianti tecnici in tutto il mondo) ma ormai gli interessi in gioco, culturali, organizzativi, strutturali ed economici sono tali che sicuramente si troverà. La struttura fisica della rete è ancora basata in larga misura sui cavi. Questo utilizzo continuerà, ma (come nella telefonia) ci sarà molto probabilmente una forte crescita delle comunicazioni "via etere", soprattutto con l uso dei satelliti. La connessione dei singoli utenti rimarrà prevalentemente basata sui cavi telefonici, ma già oggi è possibile trasmettere dati con connessioni wireless, per esempio con la telefonia cellulare. ARCHITETTURA CLIENT SERVER L'organizzazione di Internet può essere paragonata a quella di un servizio postale che si occupa di trasmettere e ricevere corrispondenza. E il comportamento di un computer che offre un servizio sulla rete è molto simile a quello di un negozio che vende per posta. Nel caso del negozio c'è catalogo che rappresenta l'interfaccia verso il cliente e viene inviato a moltissime persone. Per acquistare qualcosa useremo l'apposito modulo per le ordinazioni che si trova nel catalogo e lo inviamo per posta alla libreria. La libreria, ricevuto l'ordine, spedisce il libro richiesto all'indirizzo indicato sul modulo, e in questo modo, dopo qualche giorno, il libro che avevamo scelto sarà sulla nostra scrivania. Anche nel caso di Internet, le cose funzionano in modo simile: c'è un computer cliente - il client - che chiede delle informazioni e un computer fornitore - il server - che gliele procura. E' proprio su questo principio, chiamato architettura client-server, che si basano tutte le applicazioni usate su Internet LA LINGUA DI INTERNET: IL PROTOCOLLO TCP-IP Internet è una sorta di meta-rete costituita da molte reti telematiche connesse tra loro. Non ha importanza quale sia la tecnologia che le unisce: cavi, fibre ottiche, ponti radio, satelliti, o altro. Non è neanche rilevante di che tipo siano i computer connessi: dal piccolo personal computer al grosso elaboratore, o mainframe. Punto di forza di Internet, e motivo del suo velocissimo espandersi, è la sua capacità di 'parlare' un linguaggio universale, adatto alla quasi totalità degli elaboratori esistenti. Per definire questo linguaggio bisogna considerare che i computer, come noto, pur usando tutti lo stesso alfabeto - il codice binario - 'parlano' spesso linguaggi differenti e incompatibili. Fuori di metafora, computer diversi usano sistemi operativi, codici di caratteri, strutture di dati spesso incompatibili tra loro. Per permettere la comunicazione tra l'uno e l'altro è necessario quindi definire un insieme di regole condivise da tutti i computer. Questa funzione, nell'ambito della telematica, viene svolta dai protocolli. Nel mondo diplomatico per 'protocollo' si intende una serie di regole di comportamento e di etichetta rigidamente codificate, che permettono a persone provenienti da diversi universi culturali di interagire senza creare pericolose incomprensioni. Protocolli sono detti anche gli accordi o i trattati internazionali. 3
Queste accezioni del termine possono essere accolte per metafora anche nell'ambito della telematica: un protocollo di comunicazione definisce le regole comuni che un computer deve conoscere per elaborare e inviare i bit attraverso un determinato mezzo di trasmissione fisica verso un altro computer. Un protocollo dunque deve specificare in che modo va codificato il segnale, in che modo far viaggiare i dati da un nodo all'altro, in che modo assicurarsi che la trasmissione sia andata a buon fine, e così via. Nel caso di Internet, l'insieme di protocolli che permettono il funzionamento di questo complesso sistema di comunicazione telematico, viene comunemente indicato con la sigla TCP/IP, che è un acronimo per Transmission Control Protocol/Internet Protocol. GLI INDIRIZZI SU INTERNET Per fare in modo che la comunicazione tra due computer su Internet vada a buon fine, oltre ad un protocollo comune è necessario che ogni singolo computer abbia un indirizzo univoco, che lo identifichi senza alcuna ambiguità, e che indichi la via per raggiungerlo tra i milioni di suoi simili presenti sulla rete. A questo fine ogni computer presente su Internet è dotato di un indirizzo costituito da una sequenza di quattro numeri, da 0 a 255, separati da un punto come ad esempio: 151.100.20.17. Per capire la logica con cui è composto questo indirizzo pensate a quando scriviamo un indirizzo su una lettera: Roma, Via Verdi, n. 51, Paolo Rossi. In questo indirizzo ci sono quattro informazioni: la città, la via, il numero civico e un nome. Ognuno di questi campi corrisponde ad una comunità sempre più ristretta: la città contiene un insieme di strade ed ognuna di queste strade a sua volta contiene dei palazzi - individuati da numeri civici - dove finalmente possiamo individuare una singola persona con il suo nome e cognome. Per comporre un indirizzo in Internet invece che di comunità di uomini si parla di comunità di computer, ovvero di reti. Anche in questo caso però ci sono delle reti-città che contengono al loro interno delle reti-strade che a loro volta contengono reti-palazzi che finalmente si possono considerare come comunità di singoli computer. I singoli computer che troviamo alla fine di questa catena sono chiamati host. Ognuna di queste sotto-reti, che usualmente vengono chiamate domini, possiede l'equivalente di un ufficio postale, chiamato gateway o router, che si incarica di spedire e di ricevere i pacchetti di dati che provengono dal suo dominio. Per indirizzare un pacchetto di dati quindi il computer usa un IP Address, composto da quattro campi numerici che svolgono un ruolo simile a quello che abbiamo visto nel caso della cartolina: 151. 100. 20. 17 come Roma - Via Verdi - n.51 - Sig.Rossi Nel caso del nostro esempio, 151 indica l'indirizzo del dominio-città di Internet. Il secondo numero, il 100, indica il dominio-strada, mentre il 20 indica il dominio-palazzo e il 17 rappresenta il nome e cognome del singolo computer. 4
DSN E DOMINI Fortunatamente Internet usa un sistema chiamato DNS - ovvero Domain Name Service - per trasformare l'indirizzo numerico usato dai computer in qualcosa di più comprensibile ad un uomo. Attraverso il DNS ogni host di Internet può essere dotato di un nome (domain name). È evidente che per un utente utilizzare dei nomi simbolici è molto più semplice e intuitivo che maneggiare delle inespressive sequenze di numeri. Ad esempio, all'host 151.100.20.152 corrisponde il seguente nome: crilet.let.uniroma1.it. Ricordate quindi che dietro ad ogni indirizzo che vedete su Internet e nel Web si nasconde un IP address numerico come quello che abbiamo visto. Un dominio (o più propriamente nome a dominio) è l entità Internet di base, che permette di identificare univocamente un individuo, un organizzazione o una struttura commerciale. I nomi di dominio sono i nomi delle macchine presenti su Internet; corrispondono agli indirizzi IP che sono la struttura portante del traffico delle informazioni sulla Rete. I domini sono strutturati gerarchicamente; esistono dei domini generali, detti domini di primo livello (o TLD, dall inglese Top Level Domain), a loro volta divisi in due categorie: gtlds (global TLD), ossia i domini di uso generale (es. i vari.com,.net,.org,.edu), i primi ad essere stati creati; cctlds (country code TLD), cioè i domini regionali, ossia associati ad una specifica nazione (in questo caso vengono utilizzate le lettere indicanti la nazione, es..it,.uk,.es etc...) Ad ogni dominio di primo livello possono essere associati altri domini, che prendono il nome di domini di secondo livello (es. mariorossi.it è il dominio di una persona o azienda che presumibilmente si trova in Italia e che si chiama Mario Rossi). Discorso analogo per i domini di terzo livello (es. marketing.mariorossi.it, il dominio relativo al settore marketing dell azienda "Mario Rossi") e così via. Analogamente a quanto avviene per le persone fisiche, anche in Internet esiste un registro in cui iscrivere i domini. In realtà ne esiste più di uno, poichè ogni dominio di primo livello ha il proprio registro e le proprie regole. Non bisogna confondere il dominio con il sito internet. Un sito internet è raggiungibile inserendo l indirizzo nell apposito spazio all interno del browser, ma non è sempre vero che ad ogni dominio corrisponda un sito web! Infatti il dominio individua un indirizzo IP, una macchina sulla quale possono essere in esecuzione uno o più programmi server, e quindi svolgere una o più funzioni, fra le quali le principali sono: web server: è possibile accedere con un browser e visualizzare le pagine del sito; mail server: accedendo alla macchina (server), sarà possibile gestire il proprio server di posta elettronica; ftp server: la macchina (server) mette a disposizione degli utenti uno spazio per prelevare/depositare vari tipi di file. 5