http://mb.unisalento.it/index.htm



Documenti analoghi
Internet WWW ISP Protocolli di Rete

Reti di Calcolatori. Vantaggi dell uso delle reti. Cosa è una rete? Punto di vista logico: sistema di dati ed utenti distribuito

Come leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci

Reti di Calcolatori. Il Livello delle Applicazioni

WEBALIZER GUIDA ALLA LETTURA DELLE STATISTICHE

Reti di Telecomunicazione Lezione 6

Upload del CMS sul server scelto

Architettura del. Sintesi dei livelli di rete. Livelli di trasporto e inferiori (Livelli 1-4)

ESERCITAZIONE Semplice creazione di un sito Internet

Topologia delle reti. Rete Multipoint: ogni nodo è connesso agli altri tramite nodi intermedi (rete gerarchica).

Cercare documenti Web

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Internet e posta elettronica. A cura di Massimiliano Buschi

Architettura client-server

Applicazioni web centrati sui dati (Data-centric web applications)

Dal protocollo IP ai livelli superiori

Lo scenario: la definizione di Internet

Altro esempio di HTML

InterNet: rete di reti

LA VISIBILITÀ DI UN SITO INTERNET È LA CHIAVE FONDAMENTALE DEL SUCCESSO ON LINE WETHINKSOLUTIONS FORYOURBUSINESS

Lezione n 1! Introduzione"

Modulo 1: Motori di ricerca

Siti web centrati sui dati (Data-centric web applications)

Capitolo 5. Cercare informazioni sul Web

Introduzione al SEO. Cimini Simonelli Testa

Comprendere cosa è Internet e sapere quali sono i suoi principali impieghi. 25/09/2011 prof. Antonio Santoro

Finalità delle Reti di calcolatori. Le Reti Informatiche. Una definizione di Rete di calcolatori. Hardware e Software nelle Reti

Manuale Operativo per l utilizzo della piattaforma E-Learning@AQ. Versione 1.1


Reti di calcolatori. Reti di calcolatori

Definire all'interno del codice un vettore di interi di dimensione DIM, es. int array[] = {1, 5, 2, 4, 8, 1, 1, 9, 11, 4, 12};

A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.

Analisi dei requisiti e casi d uso

INFORMATICA DISTRIBUITA. lez 4 Livello applicazione

Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A Pietro Frasca. Parte II Lezione 5

MODELLO CLIENT/SERVER. Gianluca Daino Dipartimento di Ingegneria dell Informazione Università degli Studi di Siena

Gestione delle informazioni necessarie all attività di validazione degli studi di settore. Trasmissione degli esempi da valutare.

WoWords. Guida all uso: creare ed utilizzare le frasi. In questa guida è descritto come creare ed utilizzare le frasi nel software WoWords.

Metodi Computazionali


Protocolli applicativi: FTP

ARP (Address Resolution Protocol)

Banca dati Professioniste in rete per le P.A. Guida all uso per le Professioniste

MANUALE MOODLE STUDENTI. Accesso al Materiale Didattico

Introduzione. Classificazione di Flynn... 2 Macchine a pipeline... 3 Macchine vettoriali e Array Processor... 4 Macchine MIMD... 6

Algoritmi e strutture dati. Codici di Huffman

Informatica per la comunicazione" - lezione 10 -

GUIDA TECNICA ALLA RENDICONTAZIONE SU SIRIO

prof. Mario Dalessandro

Appunti sulla Macchina di Turing. Macchina di Turing

Manuale Modulo Statistiche 1.0 Webalizer

Internet. Internet. Internet Servizi e Protocolli applicativi. Internet. Organizzazione distribuita

Nelle reti di calcolatori, le porte (traduzione impropria del termine. port inglese, che in realtà significa porto) sono lo strumento

CORSO DI RETI SSIS. Lezione n.2. 2 Novembre 2005 Laura Ricci

VADEMECUM PER UNA STRATEGIA SEO VINCENTE

Comunicazione nel tempo

I Problemi e la loro Soluzione. Il Concetto Intuitivo di Calcolatore. Risoluzione di un Problema. Esempio

Università Politecnica delle Marche. Progetto Didattico

Introduzione a Internet e al World Wide Web

Automazione Industriale (scheduling+mms) scheduling+mms.

marketing highlights Google Analytics A cura di: dott. Fabio Pinello

ALGORITMI e PROGRAMMI Programmazione: Lavoro che si fa per costruire sequenze di istruzioni (operazioni) adatte a svolgere un dato calcolo

Lezione 8. Motori di Ricerca

Il funzionamento delle reti

Nuova funzione di ricerca del sito WIKA.

SISTEMA INFORMATIVO INPDAP CREDITO: C1 - PRESTAZIONI CREDITIZIE DOMANDE WEB PRESTITI PLURIENNALI AI PENSIONATI: MANUALE UTENTE

TCP/IP: INDIRIZZI IP SIMBOLICI

Scienze della comunicazione L 20 LABORATORIO INFORMATICA APPLICATA. Le reti di calcolatori

DESIGN PATTERN ESERCITAZIONE UML E DP INGEGNERIA DEL SOFTWARE. A quali pattern si riferiscono i tre schemi?

Modello di connessione

Il seguente Syllabus è relativo al Modulo 7, Reti informatiche, e fornisce i fondamenti per il test di tipo pratico relativo a questo modulo

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

Informatica per la comunicazione" - lezione 8 -

Internet. Introduzione alle comunicazioni tra computer

Gli attributi di STUDENTE saranno: Matricola (chiave primaria), Cognome, Nome.

Comunicazioni e informazioni

Esercitazione su UML Ingegneria del Software - San Pietro

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Ipertesto. Reti e Web. Ipertesto. Ipertesto. Ipertestualità e multimedialità

SISTEMA INFORMATIVO INPDAP CREDITO: C1 - PRESTAZIONI CREDITIZIE DOMANDE WEB PICCOLI PRESTITI: MANUALE UTENTE

Cercare è per metà trovare

GUIDA ALLA CONFIGURAZIONE E ALL UTILIZZO

REGOLAMENTO DELLA CERTIFICAZIONE DEI SITI INTERNET

Gestione Iter Manuale Sistemista. Gestione Iter Manuale Sistemista

Reti e Internet: introduzione

Sistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate

Introduzione. Informatica B. Daniele Loiacono

UTILIZZO DEL SOFTWARE MONITOR

INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI

VALORE DELLE MERCI SEQUESTRATE

B+Trees. Introduzione

Descrizione di un algoritmo

Cosa è un foglio elettronico

Il progetto Insieme a Scuola di Internet

Breve guida alla ricerca bibliografica on-line. A cura di Tilde Tocci

Introduzione allo studio sulla pericolosità meteorologica a scala nazionale: la sensibilità del mercato assicurativo ai

Compilatore risorse display grafico LCD serie IEC-line

Gestione dell account AdWords di Google Guida pratica

URI. Introduzione. Pag. 1

Internet Internet è universalmente nota come la Rete delle reti: un insieme smisurato di computer collegati tra loro per scambiarsi dati e servizi.

Transcript:

Appunti Fondamenti di Informatica 7/05/015 I motori di ricerca Algoritmi e strutture dati I motori di ricerca sono tra i servizi internet maggiormente utilizzati. Come in un libro sono generalmente presenti un sommario iniziale che ne riassume la struttura e un indice analitico per il rapido reperimento delle informazioni, anche un motore di ricerca contiene un indice analitico, quello delle pagine web. Le pagine web sono individuate mediante un URL (Uniform Resource Locator) che identifica il percorso che i pacchetti del mittente devono effettuare sulla rete per accedere alla risorsa richiesta. Un esempio di URL è http://mb.unisalento.it/index.htm - http (Hypertext Transfer Protocol) è il protocollo per il trasferimento di ipertesti, un insieme di regole che stabiliscono il modo in cui trattare l informazione (altri protocolli sono UDP e FTP); -.it identifica lo Stato; -.unisalento indica l istituzione universitaria; - mb individua il computer dell istituzione in cui sono presenti le informazioni richieste; - index.htm è il file richiesto..it è un doio di primo livello mentre.unisalento.it è un doio di secondo livello. Se non è presente alcuna indicazione sul file da selezionare, il file richiesto di default è index.htm. All URL corrisponde un codice, detto indirizzo IP, che identifica univocamente il computer sulla rete e che in questo caso è 193.04.73.118 Per comprendere il funzionamento dell URL consideriamo la mappa del mondo. Essa può essere suddivisa in aree, ognuna delle quali può essere suddivisa in regioni, a loro volta divisibili in sottoregioni. Allo stesso modo il codice che identifica il doio può essere considerato come diviso in 56 zone, a loro volta suddivise in 56 sottozone, anch esse divisibili in 56 sottozone.

Un motore di ricerca come Google può essere rappresentato da un computer costituito da due software: il crawler e l indexer. mb unisalento crawler indexer G MIUR Mentre non sono presenti computer sufficientemente intelligenti per trattare in modo completo la semantica, è abbastanza semplice esaare la sintassi dei contenuti di una pagina web. Ad esempio, sono presenti algoritmi in grado di riconoscere la radice di un verbo escludendone le flessioni. I crawler o spider individuano i link contenuti in una pagina web ed esaano le pagine da essi indirizzate, ricercando altri link e ripetendo il procedimento. Ad oggi il crawler di Google effettua una scansione di internet mediamente in una settimana. L indexer prende in input una pagina passata dal crawler ed esclude gli aspetti sintattici trascurabili includendo le parole rilevanti all interno di un indice analitico, un database dove a ogni parola è associato l elenco di tutte le pagine web (indicate mediante URL) in cui è stata individuata e il numero di riferimenti alla parola presenti al loro interno. La dimensione dell indice creato è molto più piccola rispetto all insieme delle pagine stesse. Un parametro valutato dal motore di ricerca per l ordinamento delle pagine è il ranking, sul quale influiscono il numero di volte che una parola compare nella pagina web o il pagamento di uno specifico servizio. La SEO (Search Engine Optimization) è l ottimizzazione delle pagine web finalizzata a una migliore rilevazione da parte dei motori di ricerca. Poiché l indice analitico creato è posto in ordine alfabetico, il motore di ricerca deve essere in grado di effettuare l ordinamento di parole su liste molto grandi. Gli algoritmi di ordinamento Il concetto di algoritmo prevede la descrizione di un problema in modo operativo. Un algoritmo particolarmente ricorrente è quello dell ordinamento. Consideriamo un vettore di interi: A = {1, 7, 5,, 9} Per ordinare il vettore A, tra gli oltre duecento algoritmi esistenti, scegliamo il Bubble Sort o algoritmo di ordinamento a bolle. Il nome dell algoritmo deriva

dall analogia con il fenomeno fisico della precipitazione dei componenti più pesanti e del galleggiamento di quelli più leggeri in un recipiente pieno d acqua. Allo stesso modo, per ogni coppia di elementi del vettore, partendo dal basso, confrontiamo i due valori considerati e poniamo in una posizione superiore il più piccolo tra i due: 1 7 1 5 7 5 9 9 1 7 5 9 Confrontando il e il 9, quest ultimo, più pesante, resta in basso, mentre resta nella posizione superiore. Proseguendo con i confronti si completa il primo ciclo di ordinamento. Dopo tale processo la posizione più alta è occupata dal imo tra tutti i valori del vettore. Da un problema di dimensione 5 si passa, quindi, a un problema di dimensione 4. Consideriamo il vettore composto dagli elementi restanti e confrontando le coppie di interi operiamo un secondo ciclo di ordinamento. 1 1 7 5 5 5 5 7 9 9 1 5 7 9 Procedendo in questo modo, il vettore risulta ordinato dopo 4 passaggi. Esaiamo un generico vettore di interi composto da n elementi: n elementi n-1 elementi n- elementi. max. max 1 n-1 Effettuando i confronti tra le coppie e ponendo il numero inferiore nella posizione più elevata, il problema dell ordinamento risulta completamente risolto dopo n-1 passaggi. Poiché tramite i codici qualunque grandezza può essere trasformata in numeri, l ordinamento di parole o dei pixel di un immagine è ricondotto all ordinamento di un insieme di numeri. L ordinamento per colore dei pixel di una fotografia permette di ottenere l istogramma della fotografia, utilizzato per correggerne l esposizione.

Definendo come operazione la composizione di un confronto e di uno scambio, OP = CFR + SCAMBIO il numero di operazioni di cui si necessita per completare l ordinamento su un array di n elementi è n 1 + n + n 3 + n 4 +... + 1 Tale problema è definito somma triangolare e la sua soluzione è n Avendo 10 6 elementi all interno del vettore, l algoritmo Bubble Sort per il suo ordinamento richiede circa 10 1 operazioni. È questo il motivo per cui, in relazione al problema dell ordinamento, si parla di complessità computazionale, teoria che permette di valutare il tempo necessario per lo svolgimento di tutte le operazioni. Esistono algoritmi, detti indecidibili, che non terano mai. Ne è un esempio l algoritmo che permette di sapere se un deterato programma funziona o non funziona. Altri algoritmi sono invece decidibili e calcolabili. Il imo valore teorico del numero di operazioni necessarie per il completamento dell ordinamento di un vettore di n elementi è f ( n) = nlog n Se il vettore è composto da 10 6 elementi, il suo valore è circa 0*10 6, molto ore di quello relativo all algoritmo Bubble Sort.

Si riporta il codice C relativo all algoritmo iterativo di ordinamento Bubble Sort di un vettore composto da 5 interi. Lorenzo Cazzella Walter Enzo Re