Informatica e laboratorio Corso di Laurea in Geologia Internet, World Wide Web, ipertesti, posta elettronica
World Wide Web: la ragnatela globale Il World Wide Web, o WWW, o Web, o W3 è la rete costituita da server che forniscono accesso alle loro informazioni su Internet tramite il protocollo http Comunemente Internet equivale al WWW Internet è l infrastruttura di rete che connette le più svariate reti di calcolatori in tutto il mondo utilizzando il protocollo TCP/IP il protocollo TCP/IP è il veicolo per il trasporto delle informazioni codificate secondo altri protocolli, stabiliti dalle applicazioni utilizzate dagli utenti per generare le informazioni
World Wide Web: la ragnatela globale L insieme dei server e i collegamenti tra essi mediante il protocollo HTTP formano una ragnatela virtuale il web Sul web gli host si collegano ai server usando un programma client detto browser (colui che curiosa)
Il successo del web I protocolli precedentemente usati per il trasferimento dei file (FTP) prevedevano che i documenti fossero copiati sulla macchina per essere consultati le fasi di download e consultazione erano distinte Tramite il web è possibile consultare direttamente i documenti online il trasferimento dei documenti viene effettuato automaticamente, in modo trasparente all utente
Il successo del web Consente di accedere in modo uniforme a informazioni di varia natura immagini, animazioni, suoni, filmati... (multimedialità) Con l introduzione di componenti attive (form, applet, javascript, php, ) è anche possibile utilizzare i browser web per trasmettere informazioni dall utente al server
La struttura ipertestuale È possibile "navigare" tra le pagine di documenti che si trovano sul medesimo computer o su computer diversi, magari a migliaia di chilometri l'uno dall'altro i riferimenti ad altri documenti sono specificati tramite link È semplice da usare mediante l uso di interfacce grafiche (browser) con modalità di interazione point and click
Le basi tecnologiche Le tecnologie che hanno permesso l ampia diffusione del web sono: gestione degli ipertesti e della multimedialità disponibilità di client multiprotocollo (i browser) efficaci convenzioni per l identificazione delle risorse URL utilizzo di un protocollo nella connessione browserserver web particolarmente semplice
Ipertesti L'ipertesto è un testo che può essere letto sequenzialmente oppure seguendo i "link (rimandi) associati alle sue diverse parti II lettore può scegliere il percorso di lettura che preferisce, assecondando liberamente i suoi interessi
Ipertesti esempio
Ipertesti In ogni punto del documento può comparire un punto di ancoraggio (anchor) per relazioni (link) ad un altra parte del medesimo documento (hyperlink) ad un altro documento il linea viene visualizzato dai browser in modo diverso dal testo (in genere sottolineato) la selezione (point and click) viene interpretata dal browser come una richiesta di visualizzare il documento specificato dalla relazione
Ipertesti esempio
Multimedialità Indica l insieme delle tecnologie finalizzate alla gestione integrata di informazioni basate su media differenti testi singole immagini immagini in movimento (animazioni, filmati) suoni programmi
Come funziona il WWW Il funzionamento del World Wide Web non differisce molto da quello delle altre applicazioni Internet Anche in questo caso il sistema si basa su una interazione tra un computer client ed un server
Architettura client server In un architettura client server ci sono due calcolatori connessi alla rete: un client che sottopone richieste al server un server in grado di rispondere alle richieste formulate da un client Ovviamente la comunicazione fra client e server può avvenire solo se i due hanno stabilito un protocollo comune di comunicazione
Il protocollo HTTP Il protocollo di comunicazione usato dal web e che regola la trasmissione dei documenti ipertestuali si chiama HyperText Transfer Protocol (HTTP) Si basa sul protocollo TCP/IP I documenti devono però essere in uno specifico formato HyperText Markup Language (HTML)
Web: client server Un web server è un server su cui è in esecuzione un programma (detto server web) in grado di scambiare messaggi con un web client tramite il protocollo HTTP Un web client è un programma (browser) in grado di dialogare con un web server (usando il protocollo HTTP)
Connessione diretta ad Internet Per visitare un sito Web con un browser, si deve specificarne l indirizzo, esplicitamente o selezionando un link Il client invia la richiesta di connessione, formulata nel modo specificato da HTTP Ricevuta la richiesta, il server Web trasmette le informazioni al computer e il browser provvede a visualizzarle
Collegamento via modem Se si è collegati tramite un modem, allora le informazioni fra client e server passano attraverso il provider
Connessione browser server web La connessione si realizza in cinque fasi: l utente utilizza il browser per preparare una richiesta il browser invia la richiesta (request) il server riceve la richiesta e opera per soddisfarla recupera il documento richiesto il server invia la risposta (response) il browser riceve la risposta, la interpreta e la presenta all utente interpretando le direttive di formattazione contenute nel documento
Lo stato della richiesta Lo stato della richiesta corrente è visualizzato nella barra di stato del browser alla base del browser, indica quale percentuale del documento è già stata trasferita Se l indirizzo, è sbagliato il browser segnalerà un messaggio di errore Se il web server non è funzionante o non è raggiungibile per qualche ragione, il browser lo segnala con un messaggio
I browser Tutti i browser implementano il protocollo HTTP, ma in genere sono multiprotocollo: sono in grado di comunicare con altri tipi di server In genere fungono anche da client per gopher accesso ad archivi remoti SMTP/POP/IMAP distribuzione e accesso alla posta elettronica FTP, telnet trasferimento file e collegamento remoto NNTP news
L identificazione delle risorse Per poter essere utilizzate le varie risorse disponibili sulla rete (i documenti sui server) devono essere identificabili in modo univoco I browser identificano le risorse tramite indirizzi detti URL (Uniform Resource Locator) Un indirizzo URL è così composto protocollo://server:porta_tcp:/file_path_completo
Esempio di indirizzo URL Dato che la porta associata al protocollo HTTP è fissa e nota (la 80) non è necessario specificarla Il nome dei file index.html è il default se non viene specificato il nome del file completo, viene automaticamente cercato un file dal nome index.html
Terminologia utile Utilizzando e configurando i browser ci si imbatte spesso in alcuni termini che sono importanti per un uso corretto del web proxy motore di ricerca cookie applet javascript
I proxy Un proxy è un server (computer + programma) che svolge la funzione di "agente" per gli utenti di altri computer Configurando il proprio browser in modo che usi un proxy, le richieste di un documento non saranno fatte dal proprio computer direttamente al sito remoto, ma dal proxy server, che si preoccupa poi di fornirci il documento
Funzione dei proxy Il proxy dispone di una propria "cache", una memoria nella quale memorizza tutti i documenti recuperati negli ultimi tempi Se un utente richiede di caricare un documento che è già presente nella cache, il proxy provvede a spedirglielo direttamente senza contattare il sito remoto, e quindi in tempi più brevi Se il documento non è presente nella cache, il proxy contatta il sito remoto, recupera il documento, lo spedisce all utente e lo memorizza nella cache nel caso altri lo richiedano
I motori di ricerca Un motore di ricerca è un server che fornisce un servizio di ricerca di documenti sulla rete per parole chiave Il motore di ricerca periodicamente legge i documenti sulla rete e li indicizza in base a delle parole chiave L utente specifica delle parole chiave e in risposta il motore di ricerca gli fornisce una lista di link ai documenti contenenti quella parola chiave
I motori di ricerca I motori di ricerca più famosi http://www.google.com/ http://www.altavista.com/ http://www.yahoo.com/ http://www.excite.com/ http://www.lycos.it/ http://www.virgilio.it/ http://arianna.iol.it/
Motori di ricerca esempio
Una maschera di ricerca
Cookie Meccanismo per la conservazione delle informazioni sullo stato della connessione mediante il valore di alcuni parametri E' possibile utilizzare i cookie per fare in modo che, ogni volta che il browser carica qualcosa da un sito, spedisca un cookie con le preferenze dell utente Il sito remoto potrà spedire delle pagine personalizzate
Uso dei cookie Facendo shopping in un sito di vendita via Internet, si possono inserire i prodotti che interessano nel "carrello della spesa il server spedirà al browser un cookie, che contiene l'indicazione della scelta d'ora in poi, ogni volta che si visiterà una pagina dello stesso sito, il browser segnalerà al server che quel certo oggetto è già stato selezionato, rispedendogli il "cookie"
Applet, JavaScript Consentono di inserire dei programmi all interno di page web applet: sono programmi eseguibili scritti in Java possono essere eseguiti direttamente all interno di un browser mediante l interprete Java che si interfaccia con il browser JavaScript: è un linguaggio di scripting il codice del programma è contenuto direttamente nella pagina web e viene interpretato ed eseguito dal browser al momento del caricamento del documento
Posta elettronica Sistema di messaggistica e scambio di file che riproduce alcuni aspetti del sistema postale rende pressochè trasparente la comunicazione fra applicativi/reti/protocolli diversi è forse il servizio di rete più popolare, anche per la facilità d uso Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Protocolli di posta elettronica SMTP (Simple Mail Transfer Protocol): per inviare messaggi POP (Post Office Protocol): per ricevere messaggi Protocolli utili per la gestione della posta quando il programma di posta locale, in realtà, non risiede sul computer dell utente ma su quello del suo provider Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Condizioni generali Ogni utente ha un indirizzo name@server.domain name può essere la login di un utente reale o di una lista di distribuzione server, generalmente, è un server su cui gira il programma di gestione della posta domain è l indirizzo dell organizzazione presso la quale si trova il server Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Condizioni generali Ad esempio RM34765@mailstudenti.unimi.it Per ogni parametro sono possibili alias Il carattere @ si legge at Gli indirizzi sono case insensitive: possono essere scritti usando indifferentemente le lettere minuscole o maiuscole Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Formato del messaggio (SMTP) Date: ora e data di spedizione From: login del mittente (automatica) To: uno o più indirizzi Subject: oggetto del messaggio (una linea vuota) Il messaggio vero e proprio (per definizione del protocollo SMTP solo in formato ASCII) Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Formato del messaggio (SMTP) Altri campi dell intestazione sono Reply to: indirizzo cui inviare la risposta Cc: carbon copy, equivale a per conoscenza Bcc: non mostra gli indirizzi dei co destinatari Encrypted: tecnica crittografica usata Received: gateway che ha inoltrato il mess. Message ID: identificativo univoco del mess. Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Formato del messaggio (SMTP) Attachments (allegati) immagini, testo formattato con word processor, file audio sono spediti come allegato (attachment) con una codifica ASCII ad hoc (MIME) il file viene ricopiato in coda al messaggio ed arriva al destinatario con la stessa forma (nome, tipo,...) Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Formato del messaggio (SMTP) Attachments permettono la distribuzione mirata ed attiva di novità, aggiornamenti, ecc. ma anche la distribuzione indiscriminata di spam e di virus alternativa alla distribuzione universale (a meno di siti riservati) e passiva attraverso la pubblicazione sul web Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Software lato server Il software lato server è il programma che si occupa di instradare e distribuire i messaggi è presente su alcune macchine che svolgono la funzione di server di posta elettronica sendmail, comunemente in ambiente Unix/Linux exchange, comunemente in ambiente Microsoft Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Software lato server sendmail e gli altri permettono di comunicare effettivamente sull internetwork, rendendo i protocolli e il percorso dei messaggi sostanzialmente trasparente ali utenti finali risolvere gli indirizzi con il nome effettivo del server del destinatario (tabelle di alias) accumulare i messaggi non ancora consultati (utenti scollegati, interruzione della rete,...) Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Software lato client Il software lato client, sul nostro computer, è il programma che permette di ricevere e leggere messaggi e attachment cancellare/salvare i messaggi e attachments rispondere ai messaggi oppure inoltrarli per conoscenza tenere alias mnemonici degli indirizzi più usati e di liste di distribuzione Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Software lato client Pine (Unix/Linux, formato testo) KMail,... (Linux, formato grafico) Eudora (Win, Mac) i browser Navigator e Internet Explorer, direttamente (tutti i sistemi operativi per cui ne esiste una versione) Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
L ufficio postale Il protocollo SMTP implementa alcuni servizi dell ufficio postale sistema distributivo trasparente notifica di utente ignoto/mancata consegna effettiva lettura non garantita fermo posta: non perdiamo messaggi restando scollegati autenticazione del mittente non garantita (chi scrive?) Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni
Protocolli di posta elettronica POP Post Office Protocol per la gestione della posta quando il programma di post locale non risiede sul computer dell utente ma su quello del suo provider gestisce l accesso dell utente alla casella di posta, fornendo funzioni di autenticazione utente e di gestione della casella di posta Tratto dal gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni