Parte 7. Ricerca di informazione sul Web e. ! Strumenti per la gestione e ricerca di informazione. " Paradigmi basati su ontologie
|
|
- Vittorio Colli
- 8 anni fa
- Visualizzazioni
Transcript
1 Ricerca di informazione sul Web! Strumenti per la gestione e ricerca di informazione " Paradigmi basati su ontologie # Directories gerarchiche " Ricerche per similarità # What s related (Alexa/Netscape) " Basati sull interazione di una comunità di utenti: # Collaborative filtering, Yahoo answers # Mailing Lists, blogs, wikis " Basati sulla personalizzazione dei risultati # Recommenders systems " Motori di ricerca basati su keywords # Motori di ricerca generici (utilizzati dall 85% degli utenti) # Motori di ricerca focalizzati # Meta-search engines Parte 7 Ricerca di informazione sul Web e Motori di ricerca
2 Directories gerarchiche! Esempio: dmoz.org " Directory libera costruita da editor non pagati " Da dmoz.org: The Open Directory Project is the largest human-edited directory of the Web. It is constructed and maintained by a vast, global community of volunteer editors Macchine Motore Radice Moto Links Directories gerarchiche! Ogni nodo corrisponde ad un argomento! I nodi contengono i links ai documenti rilevanti per l argomento (anche i nodi intermedi possono contenere documenti)! Un nodo è figlio di un altro nodo se corrisponde ad un sotto-argomento del padre " Creano ontologie semantiche! Cercare equivale a seguire un cammino dalla radice ad un nodo dell albero " Si cerca da argomenti generali a quelli specifici
3 Recommender systems! Un Recommender system suggerisce all utente l informazione che gli interessa in modo automatico! Filtrano sorgenti di informazione e trovano cose che l utente avrebbe difficiltà a trovare da solo! Usano profili utente (o gruppi di utenti): " Creazione esplicita: utente fornisce un insieme di oggetti che gradisce o fornisce i voti o il rank di oggetti " Creazione implicita: osservando le azioni, gli acquisti, la rete sociale e/o il contenuto del computer di un utente.! Ancora principalmente usati solo a livello di ricerca Wiki! Un wiki è un sito Web che permette agli utenti di aggiungere, rimuovere o modificare il contenuto. " Ottimi per la gestione di informazione a livello aziendale " Pagine sono connesse tra loro e possono contenere dati multimediali " Permette la creazione di documenti con molti autori " Wikipedia (enciclopedia open-source) è il più famoso! Wiki sono strumenti democratici e possono avere problemi di autorevolezza " In pratica Wikipedia è uno strumento straordinario per l accesso ad informazione di alta qualità
4 La struttura dei motori di ricerca! Il crawler prende le pagine dal Web! L indicizzatore memorizza le parole in liste inverse! Il ranker decide l importanza delle pagine! Un Web server: " riceve le query degli utenti " le passa alla lista inversa " ritorna i risultati all utente Motori di ricerca! Ve ne sono probabilmente + di 3000! I 20 più usati coprono il 98% di tutte le ricerche! Accesso tramite maschere di ricerca! Ricerca per keyword
5 Crawling! Crawlers sono spesso chiamati con nomi diversi: " Spiders " softboats Un tipico motore di ricerca Utente Web Server Frontend (CGI) Online Offline WWW Pagine Web Query Risultati Ranker PageRank Scores Query Crawler Grafo del Web Indicizzatore Keywords Lista Inversa
6 L architettura di un crawler documento keywords WWW richiesta http HTML parser All Indicizzatore Coda di fetch HTML links Al grafo del Web Crawler Come funziona un crawler Web Link Pagina Web Pagina Seme
7 Massimizzare l efficienza! Allocare un numero di fetcher e di parser adattivo rispetto alle condizioni di lavoro momentanee.! Disporre di + centri di crawling nel mondo DOMANDA cosa succede scaricando dall Italia una parte significativa del Web statunitense? RISPOSTA Saturo la connettività internazionale. Crawler multi-threads WWW documenti Coda pagine i-esimo fetcher j-esimo Fi scaricate Pj F1 Crawler F2 richieste HTTP Links HTML Fn Coda di fetch All Pm P2 parser P1 keywords Indicizzatore
8 Dati su cui il Crawler lavora! Coda delle pagine dei fetch *! Coda delle pagine da analizzare (HTML parsing ed estrazione links)! Indice delle pagine già visitate *! Numero pagine scaricate! Tabella Hash: sito Web / pagine scaricate! data ed ora di scaricamento pagine (crawler continuo)! Statistiche momentanee: pagine richieste ad un sito, ad una certa area geografica, ecc. * dati critici da memorizzare Crawling continuo o discreto! Crawling continuo: il crawler non si ferma mai, quando incontra una pagina già visitata, decide se rivisitarla in base al tempo trascorso dall ultimo download.! Crawling discreto: una sessione di crawling ogni 1-4 settimane. Ogni volta il database delle pagine è ricostruito da zero.
9 L etica dei crawlers! si può usare un robot se i risultati da esso conseguiti saranno pubblicamente disponibili.! Non è accettato l'uso di robot per fini personali, a meno che non si tratti di robot che scaricano piccolo numero di pagine e che girano raramente.! Si deve scaricare solo ciò che il proprietario vuole sia osservato dai robots.! Un robot deve identificarsi. ==> Standard per l esclusione dei robots. Le trappole dei Crawler! Siti enormi: Amazon, Geocities, etc. In genere sono esclusi a priori.! Trappole appositamente costruite: siti che includono links ad URLs create dinamicamente ogni volta con contenuto diverso (parole casuali).! Attualmente i crawlers escono dalle trappole fissando un numero massimo di pagine scaricabili da uno stesso sito.
10 Esempi di Robots.txt - 1! nessun robot può accedere alla directory cgi-bin User-Agent: * Disallow: /cgi-bin! nessun robot deve accedere alle directories pippo e cgi-bin User-Agent: * Disallow: /cgi-bin Disallow: /pippo Il file Robots.txt Il file /robots.txt indica, stramite una sintassi standard cosa non può essere letto e da cui. In realtà non è possibile costringere i robots a rispettare lo standard di esclusione. Vi sono robots che non "firmano" le loro richieste http o si fingono Web browsers. ==> Molti Web masters si difendono escludendo le connessioni da determinati indirizzi IP.
11 Esempi di Robots.txt -3! nessun robot può accedere alla directory cgi-bin. Il robot "nasty-crawler" non può accedere nemmeno a /stuff/pippo. Il robot even-more-nasty-crawler non può accedere a nessuna pagina User-Agent: * Disallow: /cgi-bin User-Agent: nasty-crawler Disallow: /stuff/pippo User-Agent: even-more-nasty-crawler Disallow: / Esempi di Robots.txt -2! nessun robot può accedere a nessuna pagina User-Agent: * Disallow: /! tutti i robots possono accedere ad ogni pagina User-Agent: * Disallow:! tutti i robots accedono ad ogni pagina, tranne "nasty-crawler" che non accede a nessuna User-Agent: nasty-crawler Disallow: /
12 Un Crawler, non un Killer! È necessario sempre porre limiti ragionevoli al:! numero di pagine contemporaneamente scaricate da uno stesso server! numero di pagine contemporaneamente scaricate da una stessa area geografica! tempo tra 2 richieste consecutive ad un server Sistemi Gestione Documentale! altrimenti al crawler verrà velocemente negato l accesso a molti siti M. Diligenti
13 Ranking nei Motori di Ricerca Ranking nei Motori di Ricerca Indicizzazione! Realizzata tramite indici inversi! La abbiamo studiata nelle lezioni precedenti
14 Graph Models per il Web! Il Web è un grafo diretto, etichettato,ciclico (digraph). I nodi sono le pagine, gli hyperlinks le connessioni. Questo modello influenza applicazioni in molti campi:! Ranking di pagine " PageRank, Brin, Page: Google " Hubs, Authorities: Kleinberg, Clever! Clustering: Bipartite subgraphs, Kumar, et al.! Crawling Ranking per il Web! Classici IR usa solo il contenuto dei documenti! Il contenuto dei documenti non basta per il Web " Il problema dello Spam: facile clonare o truccare il testo " Difficile stabilire l autorità di un testo " Documenti sono formattati, non tutto il test nel Web ha la stessa rilevanza! I documenti Web sono connessi tra di loro, possiamo usare questa informazione nel ranking?
15 PageRank, un Random surfer! Modella un navigatore (random surfer) che naviga il Web " Il surfer che segue un link a caso che esce da una pagina con prob 1-d " Con prob d, si stanca della sua navigazione attuale e salta ad una pagina a caso del Web! Modello Markoviano (stato al tempo t dipende solo dallo stato e l azione compiuta al tempo t-1)! Modello probabilistico: in grafo senza pozzi la somma di tutti i PageRank at tempo t vale 1:! p"w x p (t)=1! x p (t) modella la probabilità che il surfer si trovi sulla pagina p al tempo t M. Diligenti PageRank! Ogni link equivale ad una citazione. Pagine che ricevono più citazioni sono più rilevanti! Ricevere citazioni da pagine a loro volta rilevanti ha più peso che riceverle da pagine secondarie " Definizione ricorsiva " N numero pagine nel Web, p una pagina Web, d un parametro t.c. 0<d<1 e h p la hubness di una pagina vale a dire il numero di link uscenti dalla pagina stessa e x p (t) il page rank di una pagina p al tempo t, allora: M. Diligenti
16 Page Rank e ranking! PageRank di una pagina è indipendente dalla query Semplice misura della rilevanza assoluta di una pagina! Il ranking delle pagine si ottiene Calcolando uno score che modella l'importanza di un documento per una query Ordinando i documenti per score M. Diligenti Page Rank, forma matriciale! Si dimostra che converge indipendentemente dalla scelta dei valori iniziali " In forma matriciale X(t+1)=(1-d)W T X(t) +d/n1 " Dove W è simile alla matrice di adiacenza del grafo del Web ma con 1/h p per ogni connessione uscente da p " Soluzione nel punto fisso dove X(t+1)=X(t) X * =(I-(1-d)W T ) -1 d/n1 M. Diligenti
17 Page Rank: esercizi! Calcolare il PageRank per i nodi dei seguenti grafi Page Rank e ranking! Come calcolare lo score per l'ordinamento M. Diligenti Non esiste un modo standard, ogni motore di ricerca ha la sua implementazione segreta Score(D,Q) = f(x D, CS(D,Q)) dove: D è un documento Q una query x D il valore del page rank per la pagina D a convergenza: x D =lim t->inf x D (t) CS(D, Q) una funzione di similarità tra D ed Q (es. similarità coseno) Score dipende dalla rilevanza assoluta di un documento e della sua importanza relativamente alla query
18 Hubs e Authorities (Kleinberg `98)! Basata su links. Come il PageRank, non analizza il contenuto delle pagine.! Usa due variabili per pagina " Autority: misura l autorevolezza di una pagina " Hubness: misura quanto una pagina è una buona sorgente di links a pagine autorevoli! Definizione ricorsiva: a p =! q"padri(p) h q h p =! q"figli(p) a q M. Diligenti Ranking e Google (Page, Brin `98)! Usa pesantemente l informazione inclusa nel grafo del Web " PageRank " Usa il testo nei links della pagina (ancore o anchor text)! Primo motore a usare l informazione contenuta nei link
19 Limiti dei motori di ricerca Limiti dei motori di ricerca Hubs e Authorities (Kleinberg `98) Hub Authority
20 Informazione nascosta! L Hidden web: il Web dietro maschere di ricerca o firewalls.! Parti di Web non raggiungibili dal resto delle pagine.! Pagine a cui i robot non possono accedere a causa dei Robots exclusion standard! Il dynamic web che varia + velocemente della frequenza di aggiornamento dei databases dei motori di ricerca. I crawler scoprono tutto? I motori di ricerca collezionano le pagine facendo crawling. Ma riesce il crawling a trovare tutte l informazione presente sul Web?
21 Copertura dei motori di ricerca (Lawrence, Giles, Nature Giugno 99)! Copertura del miglior motore di ricerca:16%! Copertura combinata degli 11 motori di ricerca:42% del PIW! Stesso esperimento pubblicato su Science nell Aprile 98 " Miglior motore di ricerca:34% " Copertura di 6 motori di ricerca combinati: 60% Web nascosto e la Bow Tie Parte del Web non è raggiungibile dal core del Web!!!
22 Copertura/ tutto il Web Copertura/copertura combinata
23 Freschezza dell informazione dei motori di ricerca (Ricerca Nec)! Una nuova pagina è indicizzata in media dopo 57 giorni " Questi esperimenti evidenziano che l indicizzazione di pagine nuove o modificate può necessitare settimane o mesi Freschezza: Links non validi " Northern Light: 9.8% " Snap: 2.8% " AltaVista: 6.7% " HotBot: 2.2% " Microsoft: 2.6% " Infoseek: 5.5% " Google: 7.0% " Yahoo: 2.9% " Excite: 2.7% " Lycos: 14.0% " EuroSeek: 2.6% Media: 5.3%
24 Perché i motori non indicizzano tutto il Web? Limiti tecnologici " a) Banda/tempo per effettuare il download " b) Spazio su disco per memorizzare l informazione " c) Scalabilità dell indicizzatore e delle tecniche di information retrieval Vi e un punto in cui non economicamente conveniente indicizzare di più. ==> Soluzione: Motori di ricerca specializzati (Niche search engines), portali verticali. Bias nell indicizzazione Siti con più links entranti hanno più probabilità M. di Diligenti essere indicizzati Sistemi Gestione Documentale
Per siti più strutturati le informazioni sono mantenute mediante particolari organizzazioni di dati: human-powered directories
Motori di ricerca Search Non confondiamo i motori di ricerca (search engine) con le funzioni di ricerca all interno dei siti. Le funzioni di ricerca all interno sono in genere costituite da script che
DettagliCome leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci
Come leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci I motori di ricerca in internet: cosa sono e come funzionano Roberto Ricci, Servizio Sistema
DettagliCercare documenti Web
Pagine web (struttura html) Cercare documenti Web Motori di Ricerca I MOTORI DI RICERCA Sulla rete Web vi sono strumenti specifici chiamati motori di ricerca (research engines) per la ricerca di siti e
DettagliCapitolo 5. Cercare informazioni sul Web
Capitolo 5 Cercare informazioni sul Web Cercare nel posto giusto Posti logici e noti per reperire informazioni sui nostri contributi pensionistici, chiediamo all INPS Biblioteche on-line La maggior parte
DettagliParte 7. M. Diligenti
Parte 7 Ricerca di informazione sul Web e Motori di ricerca Ricerca di informazione sul Web Strumenti per la gestione e ricerca di informazione Paradigmi basati su ontologie Directories gerarchiche Ricerche
DettagliWEB MARKETING. Indicizzazione nei motori di ricerca. SCHEDA PRODOTTO Versione 1.1
WEB MARKETING nei motori di ricerca SCHEDA PRODOTTO Versione 1.1 1 1. INTRODUZIONE I motori di ricerca sono la funzione più utilizzata sul web e sono secondi solo alla posta elettronica nella lista delle
DettagliIntroduzione all Information Retrieval
Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information
DettagliNuova funzione di ricerca del sito WIKA.
Nuova funzione di ricerca del sito WIKA. Il sito WIKA dispone ora di una funzione di ricerca completamente riprogettata. Essa è uno strumento particolarmente importante in quanto deve fornire al navigatore
DettagliIntroduzione E. TINELLI LTW A. A. 2011-2012
Corso di Laurea Specialistica in Ingegneria Informatica Corso di Linguaggi e Tecnologie Web A. A. 2011-2012 Web Information Retrieval Eufemia TINELLI Introduzione Per Web information Retrieval si intende
DettagliMetodi Computazionali
Metodi Computazionali Elisabetta Fersini fersini@disco.unimib.it A.A. 2009/2010 Catene di Markov Applicazioni: Fisica dinamica dei sistemi Web simulazione del comportamento utente Biologia evoluzione delle
DettagliMotori di ricerca. Reti e Web. Motori di ricerca. Motori di ricerca - Interfaccia. Motori di ricerca
Reti e Web Si stima vi siano almeno 13 miliardi di pagine Web Sistemi per la ricerca e la catalogazione delle pagine Web motori di ricerca (Google, Yahoo!, Bing,...) cataloghi sistematici (Yahoo! directory)
DettagliMotori di ricerca. Andrea Marin
Andrea Marin Università Ca Foscari Venezia SVILUPPO INTERCULTURALE DEI SISTEMI TURISTICI SISTEMI INFORMATIVI E TECNOLOGIE WEB PER IL TURISMO - 1 a.a. 2012/2013 Section 1 Information Retrieval e Motori
DettagliModulo 1: Motori di ricerca
Contenuti Architettura di Internet Principi di interconnessione e trasmissione World Wide Web Posta elettronica Motori di ricerca Antivirus Personal firewall Tecnologie delle reti di calcolatori Servizi
DettagliConfigurazione della ricerca desktop di Nepomuk. Sebastian Trüg Anne-Marie Mahfouf Traduzione della documentazione in italiano: Federico Zenith
Configurazione della ricerca desktop di Nepomuk Sebastian Trüg Anne-Marie Mahfouf Traduzione della documentazione in italiano: Federico Zenith 2 Indice 1 Introduzione 4 1.1 Impostazioni di base....................................
DettagliAlfa Layer S.r.l. Via Caboto, 53 10129 Torino ALFA PORTAL
ALFA PORTAL La struttura e le potenzialità della piattaforma Alfa Portal permette di creare, gestire e personalizzare un Portale di informazione in modo completamente automatizzato e user friendly. Tramite
DettagliMetodi basati sugli autovettori per il Web Information Retrieval
Metodi basati sugli autovettori per il Web Information Retrieval HITS, PageRank e il metodo delle potenze LSI e SVD LSI è diventato famoso per la sua abilità nel permettere di manipolare i termini (all
DettagliCapitolo 4 Pianificazione e Sviluppo di Web Part
Capitolo 4 Pianificazione e Sviluppo di Web Part Questo capitolo mostra come usare Microsoft Office XP Developer per personalizzare Microsoft SharePoint Portal Server 2001. Spiega come creare, aggiungere,
DettagliI motori di ricerca. Che cosa sono. Stefania Marrara Corso di Sistemi Informativi
I motori di ricerca Stefania Marrara Corso di Sistemi Informativi a.a 2002/2003 Che cosa sono Un motore di ricerca è uno strumento per mezzo del quale è possibile ricercare alcuni termini (parole) all
DettagliMotori di Ricerca. Vale a dire: ci sono troppe informazioni, il problema è trovarle!
Motori di Ricerca "La Rete Internet equivale all unificazione di tutte le biblioteche del mondo, dove però qualcuno si è divertito a togliere tutti i libri dagli scaffali". Vale a dire: ci sono troppe
DettagliJoomla! 2.5:Utenti e permessi - Il wiki di Joomla.it
Pagina 1 di 6 Joomla! 2.5:Utenti e permessi Da Il wiki di Joomla.it. Traduzione (http://cocoate.com/it/j25it/utenti) dal libro Joomla! 2.5 - Beginner's Guide (http://cocoate.com/j25/users-permissions)
DettagliI MOTORI DI RICERCA motori di ricerca. motori di ricerca per termini motori di ricerca sistematici
I MOTORI DI RICERCA Il numero di siti Internet è infinito e ormai ha raggiunto una crescita esponenziale; inoltre, ogni sito è costituito da diverse pagine, alcune volte centinaia, e individuare un informazione
DettagliCercare informazioni sul Web
Fluency Cercare informazioni sul Web Capitolo 4 Guardare nel posto giusto cosa cerco mondo fisico Web per avere informazioni su contributi pensionistici INPS www.inps.it per trovare un percorso tra due
DettagliA intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.
Algoritmi di routing dinamici (pag.89) UdA2_L5 Nelle moderne reti si usano algoritmi dinamici, che si adattano automaticamente ai cambiamenti della rete. Questi algoritmi non sono eseguiti solo all'avvio
DettagliDATA BASE ON LINE (BANCA DATI MODULI SPERIMENTALI)
Progetto regionale antidispersione per favorire l adempimento dell obbligo d istruzione 2 a annualità DATA BASE ON LINE (BANCA DATI MODULI SPERIMENTALI) MANUALE DI UTILIZZO Indice Premessa 3 Ingresso nel
DettagliSTAMPA DI UNA PAGINA SEMPLICE
Pagina 11 copiati nel proprio sistema (disco fisso o floppy). Questa operazione è detta download o scaricamento. Il modo più semplice per effettuare un download di un file (a meno che non sia specificato
DettagliESERCITAZIONE Semplice creazione di un sito Internet
ESERCITAZIONE Semplice creazione di un sito Internet Sistemi e Tecnologie Informatiche - Prof. Gregorio Cosentino 1 Internet Una rete globale che connette milioni di computer in tutto il mondo, anarchica
DettagliI 200 Parametri dell'algoritmo di Google. Ecco elecanti i 200 parametri che google usa per valutare il ranking di un sito web.
1 2 I 200 Parametri dell'algoritmo di Google Ecco elecanti i 200 parametri che google usa per valutare il ranking di un sito web. DOMINIO 13 Parametri: Età del Dominio; Tempo di registrazione del Dominio;
DettagliNovità di Access 2010
2 Novità di Access 2010 In questo capitolo: Gestire le impostazioni e i file di Access nella visualizzazione Backstage Personalizzare l interfaccia utente di Access 2010 Creare database utilizzando modelli
DettagliAltro esempio di HTML
HTML (Hyper Text Markup Language) Linguaggio per descrivere una pagina di ipertesto Specifica come dovra apparire quando sara visualizzata, quali collegamenti contiene e dove portano Comando in HTML: riguarda
DettagliSoftware per Helpdesk
Software per Helpdesk Padova - maggio 2010 Antonio Dalvit - www.antoniodalvit.com Cosa è un helpdesk? Un help desk è un servizio che fornisce informazioni e assistenza ad utenti che hanno problemi nella
DettagliClient - Server. Client Web: il BROWSER
Client - Server Client Web: il BROWSER Il client Web è un applicazione software che svolge il ruolo di interfaccia fra l utente ed il WWW, mascherando la complessità di Internet. Funzioni principali Inviare
DettagliNOVITÀ SITI COMMERCIALISTA
NOVITÀ E-COMMERCE Sono state introdotte, nella versione 2011B, una serie di implementazioni grazie alle quali sarà ora possibile disporre all interno del proprio sito E-commerce delle seguenti funzionalità:
DettagliCosa è un foglio elettronico
Cosa è un foglio elettronico Versione informatica del foglio contabile Strumento per l elaborazione di numeri (ma non solo...) I valori inseriti possono essere modificati, analizzati, elaborati, ripetuti
DettagliAnalisi dei requisiti e casi d uso
Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................
DettagliSITO DI PUBBLICAZIONE ANNUNCI
IL DOCUMENTO 1. Sito di pubblicazione annunci... 3 1.1 Home page... 3 1.2 Consultazione annuncio... 4 1.3 Inserisci annuncio... 6 1.4 Avvisami... 7 1.5 Ricarica... 8 1.6 Edicola... 8 1.7 Help... 9 1.8
DettagliE completamente personalizzabile potrete variare colori, i Vs. dati i riferimenti per i contatti, i prodotti in tempo reale.
Catalogo On Line dinamico sul Web multilingua, consente di gestire un catalogo anche ad utenti poco esperti grazie alla semplicità d'uso del pannello amministratore che permette la gestione dei clienti,
DettagliMODELLISTICA DI IMPIANTI E SISTEMI 2
MODELLISTICA DI IMPIANTI E SISTEMI 2 Indice 1 Dalla traccia al modello 2 1.1 BAS................................................ 4 I Traccia Si consideri il problema della gestione efficiente dei servizi
DettagliCorso di recupero di sistemi Lezione 8
Corso di recupero di sistemi Lezione 8 a.s. 2011/2012 - Prof. Fabio Ciao 24 aprile 2012 Reti TCP/IP Una rete TCP/IP è una rete locale o geografica che utilizza protocolli TCP/IP con i primi 2 livelli una
DettagliParte II: Reti di calcolatori Lezione 9
Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A. 2013-14 Pietro Frasca Parte II: Reti di calcolatori Lezione 9 Martedì 1-04-2014 1 Applicazioni P2P
DettagliCapitolo 13. Interrogare una base di dati
Capitolo 13 Interrogare una base di dati Il database fisico La ridondanza è una cosa molto, molto, molto brutta Non si devono mai replicare informazioni scrivendole in più posti diversi nel database Per
DettagliPageRank Formula semplificata
PageRank Formula semplificata Dove: PR[A] è il valore di PageRank della pagina A che vogliamo calcolare. N è il numero totale di pagine note. n è il numero di pagine che contengono almeno un link verso
DettagliFate doppio click sul file con nome postgresql-8.0.msi e impostate le varie voci come riportato nelle immagini seguenti:
,QVWDOOD]LRQHGL'LVNL L installazione di Diski e composta di due parti: il back-end e il front-end. Il back-end e il database relazionale orientato agli oggetti PostgreSQL. PostgreSQL e disponibile in diverse
DettagliSistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate
MODULO BASE Quanto segue deve essere rispettato se si vuole che le immagini presentate nei vari moduli corrispondano, con buona probabilità, a quanto apparirà nello schermo del proprio computer nel momento
DettagliSimple & Efficient. www.quick-software-line.com
Cosa è XML? extensible Markup Language Linguaggio è una definizione limitativa XML serve a descrivere con precisione qualsiasi informazione XML è estensibile. Ovvero non ha tag predefiniti come HTML XML
Dettagli(Esercizi Tratti da Temi d esame degli ordinamenti precedenti)
(Esercizi Tratti da Temi d esame degli ordinamenti precedenti) Esercizio 1 L'agenzia viaggi GV - Grandi Viaggi vi commissiona l'implementazione della funzione AssegnaVolo. Tale funzione riceve due liste
DettagliTassonomia Web Spam GIUGNO 2005
Prefazione: Questo documento si basa sull originale Web Spam Taxonomy firmato da alcuni ricercatori del dipartimento di Computer Science della Stanford University e pubblicato ad Aprile 2005. Tassonomia
DettagliCookie. Krishna Tateneni Jost Schenck Traduzione: Luciano Montanaro
Krishna Tateneni Jost Schenck Traduzione: Luciano Montanaro 2 Indice 1 Cookie 4 1.1 Politica............................................ 4 1.2 Gestione........................................... 5 3 1
DettagliApplicazioni web centrati sui dati (Data-centric web applications)
Applicazioni web centrati sui dati (Data-centric web applications) 1 ALBERTO BELUSSI ANNO ACCADEMICO 2009/2010 WEB La tecnologia del World Wide Web (WWW) costituisce attualmente lo strumento di riferimento
DettagliINTERNET a cura di Maria Rita Tritonj
INTERNET a cura di Maria Rita Tritonj Che cos è il BROWSER WEB? Il termine deriva dall inglese to browse = scartabellare, curiosare, sfogliare; esso indica il programma che permette di accedere e di navigare
Dettagliper immagini guida avanzata Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1
Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1 Una tabella Pivot usa dati a due dimensioni per creare una tabella a tre dimensioni, cioè una tabella
DettagliTipologie e strategie di traffico. www.acquisireclienti.com
Tipologie e strategie di traffico www.acquisireclienti.com Varie tipologie di traffico Traffico pay per click Adwords su Google e rete di ricerca Adwords sulla rete di contenuto Facebook Ads PPC di Yahoo/Bing
DettagliCRAWLER. Il primo problema da affrontare per tracciare il Web è la costruzione di Crawler scalabili
TRACCIARE IL WEB CRAWLER Il primo problema da affrontare per tracciare il Web è la costruzione di Crawler scalabili per scalabile si intende: quale è il numero P di pagine oltre il quale il Crawler si
DettagliIpertesti e Internet. Ipertesto. Ipertesto. Prof.ssa E. Gentile. a.a. 2011-2012
Corso di Laurea Magistrale in Scienze dell Informazione Editoriale, Pubblica e Sociale Ipertesti e Internet Prof.ssa E. Gentile a.a. 2011-2012 Ipertesto Qualsiasi forma di testualità parole, immagini,
DettagliMANUALE D USO DELLA PIATTAFORMA ITCMS
MANUALE D USO DELLA PIATTAFORMA ITCMS MANULE D USO INDICE 1. INTRODUZIONE... 2 2. ACCEDERE ALLA GESTIONE DEI CONTENUTI... 3 3. GESTIONE DEI CONTENUTI DI TIPO TESTUALE... 4 3.1 Editor... 4 3.2 Import di
Dettagli3. Introduzione all'internetworking
3. Introduzione all'internetworking Abbiamo visto i dettagli di due reti di comunicazione: ma ce ne sono decine di tipo diverso! Occorre poter far comunicare calcolatori che si trovano su reti di tecnologia
DettagliIl sofware è inoltre completato da una funzione di calendario che consente di impostare in modo semplice ed intuitivo i vari appuntamenti.
SH.MedicalStudio Presentazione SH.MedicalStudio è un software per la gestione degli studi medici. Consente di gestire un archivio Pazienti, con tutti i documenti necessari ad avere un quadro clinico completo
DettagliUno dei problemi principali di quando si cerca di copiare un sito web, è che non è possibile a causa di un divieto imposto dal file Robots.txt.
Come copiare interamente un sito web Eludendo le restrizioni imposte dal Robots.txt grazie a HTTrack Uno dei problemi principali di quando si cerca di copiare un sito web, è che non è possibile a causa
DettagliModelli di Programmazione Lineare e Programmazione Lineare Intera
Modelli di Programmazione Lineare e Programmazione Lineare Intera 1 Azienda Dolciaria Un azienda di cioccolatini deve pianificare la produzione per i prossimi m mesi. In ogni mese l azienda ha a disposizione
DettagliArgomenti trattati nel corso
Scenari applicativi Prof. Paolo Ciaccia http://www-db. db.deis.unibo.it/courses/si-ls/ 01_Scenarios Scenarios.pdf Sistemi Informativi LS Argomenti trattati nel corso Inizieremo parlando di QUERY CON PREFERENZE
DettagliUniversità Politecnica delle Marche. Progetto Didattico
Università Politecnica delle Marche Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica e dell Automazione Sede di Ancona Anno Accademico 2011-2012 Corso di Tecnologie WEB Docente prof. Alessandro
DettagliIl database management system Access
Il database management system Access Corso di autoistruzione http://www.manualipc.it/manuali/ corso/manuali.php? idcap=00&idman=17&size=12&sid= INTRODUZIONE Il concetto di base di dati, database o archivio
DettagliProduct Post - Manuale utente. Product Post Manuale utente
Product Post Manuale utente 1 Il Product Post Il Product Post, o scheda prodotto, è l oggetto pubblicitario di Kompass che permette agli inserzionisti di dare visibilità ai propri prodotti e servizi con
DettagliCosa succede quando si naviga
Programma corso Introduzione (spicciola) di architettura del web Creazione del sito e primi passi Sito statico o blog? Inserimento ed aggiornamento contenuti Personalizzazione grafica Iscrizione ai motori
DettagliNelle reti di calcolatori, le porte (traduzione impropria del termine. port inglese, che in realtà significa porto) sono lo strumento
I protocolli del livello di applicazione Porte Nelle reti di calcolatori, le porte (traduzione impropria del termine port inglese, che in realtà significa porto) sono lo strumento utilizzato per permettere
DettagliLUdeS Informatica 2 EXCEL. Seconda parte AA 2013/2014
LUdeS Informatica 2 EXCEL Seconda parte AA 2013/2014 STAMPA Quando si esegue il comando FILE STAMPA, Excel manda alla stampante tutte le celle del foglio di lavoro corrente che hanno un contenuto. Il numero
DettagliCorso di Sistemi di Elaborazione delle informazioni
Corso di Sistemi di Elaborazione delle informazioni Basi di Dati Claudio Marrocco I report I Report sono lo strumento più adatto per ottenere una copia stampata dei dati e delle informazioni ricavate dalle
DettagliReport di valutazione studiolegalebraggio.it
Roma, li 15/01/2013 Report di valutazione studiolegalebraggio.it Il presente documento è redatto allo scopo di mostrare e analizzare le performance del sito web a due mesi e mezzo dalla pubblicazione online,
DettagliTitolare del trattamento dei dati innanzi descritto è tsnpalombara.it
Decreto Legislativo 196/2003 Codice in materia di protezione dei dati personali COOKIE POLICY La presente informativa è resa anche ai sensi dell art. 13 del D.Lgs 196/03 Codice in materia di protezione
DettagliSistemi Operativi. Interfaccia del File System FILE SYSTEM : INTERFACCIA. Concetto di File. Metodi di Accesso. Struttura delle Directory
FILE SYSTEM : INTERFACCIA 8.1 Interfaccia del File System Concetto di File Metodi di Accesso Struttura delle Directory Montaggio del File System Condivisione di File Protezione 8.2 Concetto di File File
DettagliImpostare il browser per navigare in sicurezza Opzioni di protezione
Impostare il browser per navigare in sicurezza Opzioni di protezione Data la crescente necessità di sicurezza e tutela dei propri dati durante la navigazione in rete, anche gli stessi browser si sono aggiornati,
DettagliFITS UPLOAD. Software di upload automatico file di immagini astronomiche Versione 1.2
FITS UPLOAD Software di upload automatico file di immagini astronomiche Versione 1.2 FITS Upload è un software realizzato per eseguire automaticamente l upload dei file di immagini astronomiche alla conclusione
DettagliSiti web centrati sui dati (Data-centric web applications)
Siti web centrati sui dati (Data-centric web applications) 1 A L B E R T O B E L U S S I A N N O A C C A D E M I C O 2 0 1 2 / 2 0 1 3 WEB La tecnologia del World Wide Web (WWW) costituisce attualmente
DettagliOverview su Online Certificate Status Protocol (OCSP)
Overview su Online Certificate Status Protocol (OCSP) Introduzione di Nicola Ferrini MCT MCSA MCSE MCTS MCITP La revoca dei certificati digitali consiste nel rendere non più valido un certificato prima
DettagliAttività 9. La città fangosa Minimal Spanning Trees
Attività 9 La città fangosa Minimal Spanning Trees Sommario la nostra società ha molti collegamenti in rete: la rete telefonica, la rete energetica, la rete stradale. Per una rete in particolare, ci sono
Dettagli12. Implementazione di un File System. 12.1.1 Struttura a livelli. 12.2.1 Allocazione contigua
12. Implementazione di un File System 1 Struttura del file system Metodi di allocazione Gestione dello spazio libero Implementazione delle directory Prestazioni ed efficienza 2 Utente 12.1.1 Struttura
DettagliHTML il linguaggio per creare le pagine per il web
HTML il linguaggio per creare le pagine per il web Parte I: elementi di base World Wide Web Si basa sul protocollo HTTP ed è la vera novità degli anni 90 Sviluppato presso il CERN di Ginevra è il più potente
DettagliWEB Information Retrieval
WEB Information Retrieval Materiale tratto dal corso di Gabriella Pasi Materiale tratto da cap. 13 Modern Information Retrieval by Ricardo Baeza-Yates and Berthier Ribeiro-Neto http://www.sims.berkeley.edu/~hearst/irbook/
DettagliFile system II. Sistemi Operativi Lez. 20
File system II Sistemi Operativi Lez. 20 Gestione spazi su disco Esiste un trade-off,tra spreco dello spazio e velocità di trasferimento in base alla dimensione del blocco fisico Gestione spazio su disco
DettagliIl Web Server e il protocollo HTTP
Corso PHP Parte 2 Il Web Server e il protocollo HTTP E un programma sempre attivo che ascolta su una porta le richieste HTTP. All arrivo di una richiesta la esegue e restituisce il risultato al browser,
DettagliProxy. Krishna Tateneni Traduzione del documento: Luciano Montanaro Manutenzione della traduzione: Federico Zenith
Krishna Tateneni Traduzione del documento: Luciano Montanaro Manutenzione della traduzione: Federico Zenith 2 Indice 1 Proxy 4 1.1 Introduzione......................................... 4 1.2 Uso..............................................
DettagliManuale d uso Software di parcellazione per commercialisti Ver. 1.0.3 [05/01/2015]
Manuale d uso Software di parcellazione per commercialisti Ver. 1.0.3 [05/01/2015] Realizzato e distribuito da LeggeraSoft Sommario Premessa... 2 Fase di Login... 2 Menù principale... 2 Anagrafica clienti...
DettagliGNred Ver1.5 Manuale utenti
GNred Ver1.5 Manuale utenti [ultima modifica 09.06.06] 1 Introduzione... 2 1.1 Cos è un CMS?... 2 1.2 Il CMS GNred... 2 1.2.1 Concetti di base del CMS GNred... 3 1.2.2 Workflow... 3 1.2.3 Moduli di base...
DettagliProgetto: Servizio location based per la ricerca di punti di interesse
Mauro Gentile Matr. 701870 Progetto: Servizio location based per la ricerca di punti di interesse Il progetto consiste nello sviluppo di un servizio che fornisce informazioni relative a punti di interesse
DettagliDatabase. Si ringrazia Marco Bertini per le slides
Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliPresentazione della pratica online
Presentazione della pratica online Dalla prima pagina del sito del comune http://www.comune.ficulle.tr.it/, selezionate Sportello Unico Attività Produttive ed Edilizia Selezionate ora ACCEDI nella schermata
DettagliIstruzioni per l installazione del software per gli esami ICoNExam (Aggiornate al 15/01/2014)
Istruzioni per l installazione del software per gli esami ICoNExam (Aggiornate al 15/01/2014) Il software per gli esami ICON può essere eseguito su qualunque computer dotato di Java Virtual Machine aggiornata.
Dettagli3 Automazione Web-based con Saia S-Web
8 0 based con Saia S-Web Capitolo Pagina. based. Esempi tipici 8 CE MB MB exp Web server integrato PC con Micro- PDA con Micro- . web-based con Saia S-Web La tecnologia.web, direttamente integrata ed applicata,
DettagliAlgoritmi e strutture dati. Codici di Huffman
Algoritmi e strutture dati Codici di Huffman Memorizzazione dei dati Quando un file viene memorizzato, esso va memorizzato in qualche formato binario Modo più semplice: memorizzare il codice ASCII per
DettagliCome creare una pagina Facebook e collegarla al sito mosajco
Come creare una pagina Facebook e collegarla al sito mosajco Cos è una pagina Facebook? E la pagina gratuita dedicata alle attività che Facebook mette a disposizione di chi vuole far conoscere il proprio
DettagliPOLICY COOKIE Gentile visitatore,
POLICY COOKIE Gentile visitatore, GGS S.r.l. quale titolare del trattamento dei dati, desidera fornirle alcune informazioni sui cookies gestiti accedendo all indirizzo www.noly.it nel rispetto della Direttiva
DettagliWEB Information Retrieval
WEB Information Retrieval Gabriella Pasi Materiale tratto da cap. 13 Modern Information Retrieval by Ricardo Baeza-Yates and Berthier Ribeiro-Neto http://www.sims.berkeley.edu/~hearst/irbook/ Web Può essere
DettagliModulo 4 Il pannello amministrativo dell'hosting e il database per Wordpress
Copyright Andrea Giavara wppratico.com Modulo 4 Il pannello amministrativo dell'hosting e il database per Wordpress 1. Il pannello amministrativo 2. I dati importanti 3. Creare il database - Cpanel - Plesk
DettagliS earche ngineo ptimization
la nuova frontiera per lo sviluppo delle vendite Nel mercato si fa sempre più sentire la differenza tra chi si concentra solo sullo sviluppo commerciale tradizionale e chi invece abbraccia le nuove tecnologie
DettagliMAUALE PIATTAFORMA MOODLE
MAUALE PIATTAFORMA MOODLE La piattaforma moodle ci permette di salvare e creare contenuti didattici. Dal menù principale è possibile: inviare dei messaggi agli altri docenti che utilizzano la piattaforma:
DettagliPROCEDURA ON-LINE PER L EROGAZIONE DEI VOUCHER FORMATIVI SULL APPRENDISTATO PROFESSIONALIZZANTE. AVVISO PUBBLICO N. 1 del 16 Aprile 2012
PROCEDURA ON-LINE PER L EROGAZIONE DEI VOUCHER FORMATIVI SULL APPRENDISTATO PROFESSIONALIZZANTE AVVISO PUBBLICO N. 1 del 16 Aprile 2012 VOUCHER FORMATIVI APPRENDISTATO PROFESSIONALIZZANTE GUIDA OPERATIVA
Dettagliconnessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI
Documenti su Internet LINGUAGGI DI MARKUP Internet permette (tra l altro) di accedere a documenti remoti In generale, i documenti acceduti via Internet sono multimediali, cioè che possono essere riprodotti
DettagliCome funziona il WWW. Architettura client-server. Web: client-server. Il protocollo
Come funziona il WWW Il funzionamento del World Wide Web non differisce molto da quello delle altre applicazioni Internet Anche in questo caso il sistema si basa su una interazione tra un computer client
Dettagli1. RETI INFORMATICHE CORSO DI LAUREA IN INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO A.A. 2013/2014. 1.1 Lato client
RETI INFORMATICHE - SPECIFICHE DI PROGETTO A.A. 2013/2014 1. RETI INFORMATICHE CORSO DI LAUREA IN INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO A.A. 2013/2014 Il progetto consiste nello sviluppo di un
DettagliWWW.ICTIME.ORG. Introduzione al SEO. Cimini Simonelli Testa
WWW.ICTIME.ORG Introduzione al SEO Cimini Simonelli Testa v.1 28 Gennaio 2008 Cecilia Cimini Angelo Simonelli Francesco Testa Introduzione al SEO EDIZIONE Gennaio 2008 Questo manuale utilizza la Creative
Dettagli