Motori di Ricerca. Indicizzazione e Ranking. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Motori di Ricerca. Indicizzazione e Ranking. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it"

Transcript

1 Indicizzazione e Ranking Dip. di Scienze Umane e Sociali

2 Outline Introduzione 1 Introduzione

3 Outline Introduzione 1 Introduzione

4 Cos è un motore di ricerca? Come funziona la ricerca sul Web? Dove cerca un motore di ricerca? Cos è l indicizzazione delle pagine? Qual è l importanza del ranking dei risultati?

5 Quali sono gli obiettivi? Conoscere le tecnologie alla base del Web e della Ricerca per poterle sfruttare Capire la struttura del Web e i problemi legati alla ricerca delle informazioni Conoscere le tecniche usate per l indicizzazione delle pagine Conoscere gli algoritmi per l ordinamento dei risultati di una ricerca (ranking) Capire qual è la fonte principale di guadagno di un motore di ricerca Gestire le statistiche del proprio sito web Sapere come rendere rintracciabile il proprio sito web da un motore di ricerca

6 Internet e il Web Introduzione Cos è Internet? Cos è il Web?

7 Internet e il Web Cos è Internet? Cos è il Web? Mentre Internet è la rete fisica che connette milioni di computer a livello globale, il Web è una rete globale virtuale che connette immense quantità di informazioni. I motori di ricerca devono oggigiorno indicizzare miliardi di pagine web, e questo numero è solo una percentuale delle informazioni a cui è possibile accedere sul Web, la maggior parte della quale è localizzata in database non direttamente accessibili dai motori di ricerca.

8 Outline Introduzione 1 Introduzione

9 Le dimensioni del Web Il Web è indubbiamente il più grande contenitore di informazioni noto all uomo Nel 2000: 2.1 miliardi di pagine con un tasso di crescita di 7.3 milioni di pagine al giorno Nel 2010: 600 miliardi di pagine con un tasso di crescita di 200 milioni di pagine al giorno Questa statistica non include in deep web (circa 550 volte maggiore del Web) Questa stima esclude le pagine generate con spamdexing (circa 14% del totale)

10 Il problema della ricerca Come vengono gestiti i milioni di query ai motori di ricerca? Bisogna considerare che il Web è in costante cambiamento e in crescita Le pagine sono spesso scritte con linguaggi di scripting Esistono diversi formati per le pagine

11 Quali sono le dimensioni del Web? 92000TB = 92PB considerando anche il deep web Si stima che il Web abbia una dimensione di 170TB Ovviamente la maggior parte delle informazioni è irrilevante I motori di ricerca devono quindi continuamente scegliere quali informazioni considerare e quali no

12 Quante query vengono sottoposte ai motori di ricerca? Google nel 2010 riceveva circa 3.5 miliardi di query al giorno (circa 4000 al secondo) Ad esempio la ricerca Computer Science veniva fatta circa volte al mese E necessario gestire molto velocemente ed efficacemente le ricerche: mediamente, dopo 12 minuti l utente perde la pazienza se non ha trovato quello che cerca altre cause di irritazione sono legate alla velocità di download, risultati di ricerca non rilevanti, siti web che non permettono ricerche al proprio interno, help che non aiutano, siti web realizzati male, necessità di scorrere molte informazioni prima di trovare quella richiesta, pubblicità.

13 Come funziona ad alto livello un motore di ricerca? Input: query, ovvero un insieme di parole chiave La ricerca viene fatta in un archivio (l utente non deve avere conoscenze specifiche su come si interroga un DB) Output: un elenco ordinato di documenti considerati rilevanti per la query Il motore di ricerca identifica i risultati migliori e l utente decide se quei documenti soddisfano la sua richiesta I motori di ricerca si devono adattare a formati diversi (in continuo cambiamento) I motori di ricerca coprono solo parte del Web Cosa succede se uno dei Server di un motore di ricerca è offline?

14 Come funziona ad alto livello un motore di ricerca? Input: query, ovvero un insieme di parole chiave La ricerca viene fatta in un archivio (l utente non deve avere conoscenze specifiche su come si interroga un DB) Output: un elenco ordinato di documenti considerati rilevanti per la query Il motore di ricerca identifica i risultati migliori e l utente decide se quei documenti soddisfano la sua richiesta I motori di ricerca si devono adattare a formati diversi (in continuo cambiamento) I motori di ricerca coprono solo parte del Web Cosa succede se uno dei Server di un motore di ricerca è offline? Otteniamo comunque dei risultati perché non stiamo cercando risposte precise

15 Introduzione La struttura del Web

16 La struttura del Web Strongly connected components (SCC): circa 27.5% del Web IN e OUT circa 21.5% del Web Tendrils e tube circa 21.5% del Web Disconnected circa 8% del Web

17 La struttura del Web Riguardo alla navigabilità del Web, nel 75% dei casi non esiste un percorso diretto tra due pagine scelte a caso Quando il percorso esiste, ha una lunghezza pari a 16 Mediamente, un percorso indiretto ha una lunghezza pari a 7 E possibile applicare al Web la nozione di sei gradi di separazione

18 Cercare le informazioni sul Web Navigazione diretta Navigazione tramite parole chiave (supporto multi-lingua) problemi legati a singolare/plurale a chi assegnare parole chiave comuni Navigazione in web-directory Compilate da persone Utile per non esperti Complicato se le informazioni richieste sono molto specifiche Navigazione usando motori di ricerca

19 Navigazione con i motori di ricerca Questo tipo di navigazione avviene secondo i seguenti passi: Formulazione della query Selezione Navigazione Modifica o ri-formulazione della query

20 La ricerca dell informazione I problemi legati alla ricerca dell informazione sul Web: il Web è un sistema aperto in continua evoluzione la qualità delle informazioni è estremamente eterogenea (è necessario verificarne l attendibilità) la conoscenza del Web non è oggettiva non avendo uno scopo preciso, non sappiamo a priori se contiene l informazione cercata

21 La ricerca tradizionale e il Web I classici sistemi di Information Retrieval utilizzavano un full-text retrieval system per soddisfare l utente Nel mondo del Web: la ricerca viene effettuata su scale diverse (miliardi di documenti) il Web è dinamico (i sistemi di IR trattavano dati statici) il Web contiene duplicati (circa il 30% dei documenti) la qualità delle pagine è eterogenea gli argomenti trattati dal Web non hanno confini il Web è distribuito a livello globale (problemi logistici) gli utenti inviano query molto corte ha una struttura ipertestuale

22 La ricerca locale all interno di un sito Web Molti utenti preferiscono usare strumenti di ricerca anziché navigare in un sito E importante avere uno strumento di ricerca perché parte delle informazioni potrebbero far parte del deep web Il motore di ricerca di un sito deve servire all utente per svolgere i task nel sito Deve raggiungere parti del sito che i motori di ricerca non raggiungono

23 Documenti trovati, recall e precisione Recall: intersezione/numero di documenti rilevanti Precisione: intersezione/numero di documenti trovati Nel Web la recall non è importante E importante la precisione (i primi 10 documenti)

24 Outline Introduzione 1 Introduzione

25 Il motore di ricerca Introduzione Fornisce un elenco di pagine web rilevanti per l utente Per ogni risultato rilevante, presenta un riassunto della pagina il riassunto viene creato dinamicamente in funzione della query Presentano dei link sponsorizzati (a pagamento) gli ad links vengono solitamente separati dagli organic results l altra fonte di guadagno riguarda i servizi di ricerca forniti

26 Il motore di ricerca Principale punto di accesso per il Web: sia per l utente che ricerca le informazioni sia per l autore che vuole rendere visibile e accessibile la propria pagina Grazie al ruolo che ricopre: ha il potere di includere o escludere una pagina web dai propri archivio può influenzare il ranking delle pagine influenza, in generale, le informazioni che possono essere trovate dagli utenti Siti web e motori di ricerca sono in continua lotta per capire (da una parte) e nascondere (dall altra) i meccanismi usati per il ranking

27 La sintassi delle query Query base: insieme di parole chiave Query con più parole chiave forniscono risultati secondo il ranking proximity matching L ordine delle keywords conta Qual è il valore aggiunto di operatori come AND, OR,, +? Permettono di ottenere restrizioni maggiori sull insieme dei risultati OR invece estende l insieme dei documenti rilevanti E stato mostrato come 6.6 risultati su 10 sono uguali a quelli ottenuti con query di base con le stesse keywords Altri operatori come -, selezione di date, site influenzano molto l elenco dei risultati

28 La popolarità delle query Le parole chiave più cercate: Le parole chiave di un motore di ricerca possono essere usate per studiare trends: query riguardanti influenza e malattie per prevenirne la diffusione query per studiare gli interessi degli utenti (Google Trends)

29 Perché parliamo sempre di Google

30 Outline Introduzione 1 Introduzione

31 Architettura di un motore di ricerca

32 Il search index E un DB che contiene tutte le informazioni necessarie al motore di ricerca per: identificare le pagine rilevanti recuperare e ordinare le pagine Ha una struttura nota come inverted file Contiene un indice alfabetico di tutte le parole contenute nelle pagine web note (index file) per ogni parola c è un riferimento alle pagine web che la contengono (posting list) Es. chess [www.chess.com, ]

33 Il search index Il search index contiene anche collegamenti: link database (archivio separato) necessario per l analisi dei collegamenti richiesta dal processo di ranking tipicamente organizzato come inverted file normalmente contiene miliardi di entry viene compresso per ottimizzare l occupazione e l efficienza nell accesso alle informazioni

34 Il query engine Introduzione E il cuore algoritmico del motore di ricerca Il suo funzionamento viene mantenuto segreto dai motori di ricerca potrebbe essere usato dagli sviluppatori per aumentare il ranking delle pagine la manipolazione del query engine viene considerata spam perché peggiora la qualità del servizio del motore di ricerca è difficile distinguere l ottimizzazione dei risultati organici e lo spam

35 Il query engine Le query vengono processate in due fasi: 1 vengono cercate nel search index informazioni potenzialmente rilevanti keywords matching 2 viene effettuato il ranking delle pagine identificate al passo precedente ordinamento decrescente dalla pagina più rilevante vengono considerati: rilevanza dei contenuti, risultati dell analisi dei collegamenti e popolarità L ordinamento è un processo molto complesso. La rilevanza è specifica del contesto che l utente ha in mente quando effettua una ricerca

36 La search interface Interfaccia per l invio delle query Visualizzazione dei risultati della ricerca Navigazione dei risultati della ricerca E importante che l utente possa distinguere i link sponsorizzati dai risultati organici i link sponsorizzati vengono ordinati a seconda delle keywords acquistate i risultati organici vengono ordinati dal motore di ricerca Esempi: Google Yahoo!

37 Web crawling I crawler di Google visitano continuamente più di un trilione di pagine web Il search index creato dai crawler viene distribuito nei server di Google durante gli aggiornamenti (Google dance) durante la Google dance alcuni server potrebbero avere la versione vecchia del search index è il periodo migliore per aggiornare il proprio sito web se i crawler non visitano le pagine aggiornate bisogna aspettare il mese successivo Al termine dell aggiornamento, il lavoro dei crawler riparte Il Web è in continua crescita ed evoluzione, è quindi necessario avere crawler che coprano in maniera efficiente la maggior parte del Web

38 Algoritmi di crawling

39 Algoritmi di crawling La lista di URL non deve contenere solo indirizzi della parte strongly connected del Web Una buona lista iniziale viene compilata: selezionando gli indirizzi dalle directory (Yahoo! dir) utilizzando gli indirizzi già presenti nel search index La lista è dinamica: quando una pagina è stata visitata viene tolta dalla lista tutti i link contenuti nella pagina visitata vengono aggiunti alla lista Il processo termina quando: un numero di pagine specificato viene visitato dopo un determinato intervallo di tempo

40 Algoritmi di crawling I problemi da affrontare durante il crawling: identificare i duplicati delle pagine: diversi URL, contenuto identico viene associata alla pagina una breve descrizione del contenuto e si confrontano i contenuti in fase di analisi qualità delle pagine da visitare URL sintatticamente errati pagine dinamiche con script che ne modificano i contenuti run-time pagine con scripting vengono spesso tralasciate pagine con formati non standard possono non essere indicizzate decidere l ordine di visita delle pagine

41 Algoritmi di crawling Ordine di visita delle pagine da indicizzare Breadth-first: URL visitati nell ordine in cui appaiono nella lista (FIFO) Secondo la struttura degli URL: pagine con più link prima Secondo il dominio: partendo dai più importanti (es..com) Focused crawlers: visitano pagine che trattano argomenti particolari guidati da query le parole chiave vengono usate per la scelta dell ordine di visita delle pagine (best-first)

42 Algoritmi di crawling Quando eseguire il crawling Nuove operazioni di crawling vengono schedulate al termine delle precedenti Un aggiornamento continuo può portare ad aggiornare il search index in continuazione Opposto alla Google dance Può portare il vantaggio di non dover aspettare il termine del crawling per avere gli aggiornamenti delle pagine

43 Algoritmi di crawling Il refresh delle pagine web Prima ipotesi: visitare tutte le pagine con la stessa frequenza Seconda ipotesi: visitare più di frequente le pagine che cambiano spesso (news, e-commerce) E stato osservato che: siti web grandi tendono a cambiare più frequentemente siti web con domini.com e.net cambiano spesso ed ampiamente siti web con domini.edu e.gov cambiano raramente la cronologia dei cambiamenti di una pagina web aiuta a prevedere cambiamenti futuri

44 Algoritmi di crawling Se un crawler visita troppo spesso una pagina può portare problemi per i troppi accessi HTTP Le visite di un crawler devono essere schedulate efficacemente Robots exclusion protocol (robotstxt.org): usato per impedire a un crawler di visitare una pagina viene aggiunto il file robots.txt nella root directory del sito User-agent: GoogleBot (oppure Slurp o *) Disallow: /docs Disallow: /logs

45 Algoritmi di crawling Sitemap è un protocollo XML usato dagli webmaster per informare i crawler delle pagine disponibili per l indicizzazione Metadati aggiuntivi per ogni pagina data di ultima modifica frequenza delle modifiche priorità relativa della pagina nel sito I crawler usano sia sitemap che robots.txt per l indicizzazione, tuttavia possono essere non affidabili e contenere spam

46 Algoritmi di crawling Spider traps Esempi script che generano automaticamente un numero elevato di URL che puntano alla stessa pagina bloccano il crawler in un loop infinito, consumando inutilmente risorse computazionali URL con? che identificano query e che generano una lunga lista di collegamenti URL che generano una pagina web con un calendario pieno di link in ogni data

47 Il servizio di Google Nel 2003: cluster di computer per un totale di PC Nel 2009: PC Grande capacità di memorizzazione (ogni PC ha 16GB di RAM e 2TB di HD): indicizzare miliardi di pagine web memorizzare file multimediali (ad es. i contenuti di Youtube) La rete distribuita di questi computer è: più economica e affidabile di un servizio di server con high performance l affidabilità è data anche dal SW appositamente sviluppato da Google anche il consumo energetico e il raffreddamento vengono gestiti più facilmente I milioni di query vengono gestiti dai data center distribuiti a livello globale

48 Il servizio di Google Cosa succede quando viene inviata una query? 1 Viene scelto il Server (geograficamente) più vicino 2 Viene consultato l inverted index per il matching con ogni keyword (index server) 3 Le liste generate vengono intersecate 4 Viene calcolato il punteggio di ogni pagina per determinare l ordinamento 5 Viene generata la lista di collegamenti ai documenti rilevanti (titolo, URL, riassunto) 6 Viene inviata la lista all utente (document server) 7 Vengono fatto lo spell check e vengono aggiunti i link sponsorizzati

49 Il servizio di Google Le informazioni (index, ecc.) sono replicate in diversi Server Le fasi della query vengono eseguite in parallelo (PB di dati da analizzare) Se parte del cluster che sta elaborando la query è down, vengono utilizzati altri cluster L aggiornamento dell index viene fatta separatamente (offline) e viene aggiornato un cluster alla volta

50 Il servizio di Google L architettura distribuita di Google: Google File System Algoritmo MapReduce BigTable database system

51 Il servizio di Google Google File System: filesystem distribuito e fault-tolerant utilizzato dalle applicazioni Google supporta cluster (un master e più chunkserver) per accesso multiplo dei client file in chunk da 64MB replicati su più chunkserver i metadati sono memorizzati nel master essendoci molti più accessi in lettura che scrittura, i controlli di consistenza dei dati sono semplici

52 Il servizio di Google Algoritmo MapReduce: consiste di operazioni map e reduce che possono essere eseguite in parallelo l ordine di esecuzione non influisce sull output anche se vengono generati nuovi dati, quelli vecchi non vengono sovrascritti la map prende delle coppie key/value e produce dei valori intermedi per ogni coppia la reduce prende i valori prodotti dalla map e produce un singolo valore di output per ogni key mediamente vengono eseguite MapReduce al giorno (che elaborano 20PB di dati)

53 Il servizio di Google BigTable: tabelle tridimensionali ad esempio la webtable: righe: URL colonne: caratteristiche delle pagine celle: contenuti delle pagine le righe sono organizzate in tablet (ad esempio pagine con lo stesso dominio) le colonne sono organizzate in famiglie di pagine con caratteristiche simili time stamp per diverse versioni delle pagine usa GFS per memorizzare i dati e MapReduce per l elaborazione parallela

54 La rilevanza del contenuto delle pagine web Dipende sia dalla query che dall utente che effettua la ricerca Non ha molta influenza sul processo di ranking Vengono selezionate tutte le pagine che contengono le keyword della query Considera altre informazioni Posizione geografica Data Preferenze, cronologia (?)

55 Il pre-processing delle pagine La pagina viene divisa in parole Vengono considerati anche i tag HTML e i simboli speciali Anche i numeri vengono indicizzati (risultato di una partita 0:1) Vengono eliminate le stop words Conversione di tutte le keyword in minuscolo (o maiuscolo) Filtri di stemming per eliminare le varianti delle parole Diminuisce l elenco delle parole Aumenta l elenco dei risultati trovati Non è detto che ci siano più risultati rilevanti Anche se lo stemming non viene usato l utente può usare operatori di troncamento

56 L interpretazione della query Vengono cercate le parole chiave nella lista presente nell archivio del motore di ricerca Viene fatta l intersezione tra le liste di pagine web che contengono le parole chiave Per ridurre i tempi di risposta viene considerata l intersezione delle pagine e non l unione

57 Term frequency TF si basa sul fatto che la frequenza di un termine in un documento è un buon indicatore TF viene calcolato contando quante volte è ripetuta una parola nel documento la lunghezza del documento conta! Infatti TF viene normalizzato (n di parole o byte) termini troppo (o troppo poco) frequenti non sono utili per stabilire la rilevanza di una pagina

58 Term frequency Tecniche di spam per aumentare il TF keyword stuffing: ripetizione di parole chiave testo nascosto: tra tag HTML o di colore non visibile redirezione ad altre pagine page swapping: cambiare il contenuto di una pagina dopo che è stata indicizzata pagine duplicate con contenuto molto simile tra loro doorway e cloaking: pagina di spam al motore di ricerca, pagina reale all utente

59 Term frequency Introduzione Pagine con TF molto alto possono indicare che: il documento è molto corto (una parola) è presente qualche forma di spam Queste anomalie vengono facilmente identificate: pagine con TF troppo alto sono penalizzate Google avvisa gli webmaster dicendo: «Se tentate di spammarci aumentate la possibilità di essere esclusi dai nostri archivi»

60 Inverse document frequency Misura della rilevanza dei termini meno frequenti numero di documenti dell archivio/numero di documenti che contengono la parola chiave termini poco frequenti con IDF alto permettono di restringere l insieme dei documenti rilevanti non è facile spammare l IDF è inutile aggiungere pagine con termini poco frequenti perché non verrebbero cercate è difficile conoscere queste informazioni perché è necessaria una ampia conoscenza del Web

61 Calcolo del TF-IDF TF di ogni termine della ricerca IDF di ogni pagina che contiene il termine TF IDF = t Terms IF t IDF t TF-IDF viene usato dal motore di ricerca per stabilire il ranking dei risultati rilevanti Il calcolo è molto oneroso, quante pagine considerare nel ranking? Sempre per ridurre il tempo richiesto per rispondere a una query: risultati preconfezionati a query molto richieste raccogliere a lato utente le query delle sue ricerche più frequenti

62 La rilevanza del contenuto delle pagine web Ricerca per frasi esatte: la distanza tra le parole di una query viene memorizzata assieme alla pagina il peso dato per effettuare il ranking è segreto Sinonimi: possono essere riconosciuti con dei tesauri aumentano i risultati ma non necessariamente la precisione Google aveva introdotto l operatore

63 La rilevanza del contenuto delle pagine web Link testuali: link testuali significativi vengono considerati nel ranking la loro presenza viene pesata per evitare lo spam Analisi dell URL: vengono analizzate le keyword dell indirizzo non è nota la procedura usata Data dell ultimo aggiornamento

64 La rilevanza del contenuto delle pagine web Valutazione della struttura dei file HTML: i metadati che contengono le informazioni sono soggetti a spam i metadati vengono usati per dire al crawler di non visitare la pagina vengono pesate le parole a seconda del tag in cui sono contenute (i dettagli sono segreti) probabilmente il peso dei tag viene dato usando metodi di machine learning (es. Algoritmi Genetici)

65 La rilevanza del contenuto delle pagine web Spell checking: controllo per proporre all utente risultati presenti negli archivi il suggerimento viene dato proponendo parole chiave maggiormente cercate Ricerche simili e suggerimenti: vengono proposte grazie a tecniche di mining nei log delle ricerche un terzo degli utenti si lascia suggerire derivazione di concetti simili: utilizzo di dizionari di concetti costruiti offline vettore di termini in relazione tra loro costruito durante il crawling i termini dei primi risultati contenuti nel vettore di termini vengono usati per costruire i risultati simili frasi simili vengono generate usando i log del motore di ricerca i risultati simili vengono confrontati con i risultati originali per produrre una lista di concetti simili

66 Metriche Link-based Cosa differenzia il Web da una semplice collezione di documenti? I link che permettono di navigare il Web Se A linka B, significa che A raccomanda B Google interpreta i link come voti Possono essere interpretati come citazioni Numero di link per stabilire l autorevolezza e l importanza di una pagina

67 Metriche Link-based Google considera come metrica una normalizzazione del numero di link Problema dei link fake a una pagina Non viene semplicemente contato il numero di link in entrata Viene considerata l autorevolezza delle pagine che linkano Questo metodo per stabilire la qualità di una pagina è indipendente dalla query dell utente

68 Metriche Link-based Link analysis e rilevanza del contenuto obiettivo: ottenere il ranking finale delle pagine analisi dei link entranti a una pagina web calcolo del valore TF-IDF combinazione delle due metriche (il metodo è segreto)

69 PageRank Intuitivamente, rappresenta la probabilità che un utente ha di navigare una pagina web PageRank viene calcolato dal crawler mentre naviga le pagine I link uscenti da una pagina vengono scelti con probabilità uniforme Se non ci sono link uscenti o sono presenti loop si usa il teletrasporto (con una determinata probabilità) E proporzionato al tempo medio che un utente potrebbe passare su una pagina Viene calcolato offline (indipendente dalla query)

70 Altri metodi di PageRank Calcolo online con metodi di cash, credit history e cash flow (equivalente a PageRank con crawl sufficientemente lunghi) Metodi Monte Carlo: rank come numero di random walk che terminano in una pagina / numero totale di random walk (può essere aggiornato continuamente) Hyperlink-induced Topic search: nozione di pagine hub, pagine buone sono linkate da hub Approcci stocastici: combinano metodi Monte Carlo con le nozioni di hub e autorevolezza

71 PageRank e le nuove pagine web Vecchie pagine con più link entranti hanno PageRank maggiore Nuove pagine hanno difficoltà a migliorare il proprio ranking (Facebook è comunque un controesempio eccellente) Una possibilità è di aumentare il PageRank di alcune nuove pagine per promuovere la loro visibilità

72 Fonti di spam Link prodotti all interno di una community Link prodotti da blog (google bomb) Link farm Per evitare lo spamming può essere usato il TrustRank

73 Metriche basate sulla popolarità Tenere traccia di quanto vengono cliccate le pagine web Mediando su molti utenti si ottiene una metrica sulla popolarità La popolarità è una metrica in cui una comunità influisce sul singolo individuo La popolarità è soggetta a spam La popolarità è autorinforzante popolarità dipendente dall età della pagina E statisticamente significativa solo per query popolari

74 Metriche basate sulla popolarità Altre possibilità: tenere traccia del giudizio degli utenti considerare l importanza delle keyword nella query metodi di clustering e machine learning per il ranking uso di reti neurali per il ranking: RankNet

75 BrowseRank PageRank non approssima la reale navigazione degli utenti BrowseRank usa metriche e statistiche che si basano sul comportamento degli utenti BrowseRank può migliorare le performance di un motore di ricerca BrowseRank non è soggetto a spam come PageRank

76 Altri studi I motori di ricerca usano diverse misure e metriche per migliorare le loro performance Es. HeatMap e Eyetracking

77 Come guadagnano i motori di ricerca? Paid inclusion: non influenza il ranking ma le nuove pagine compaiono subito tra i risultati Banner ads: pagamento in funzione delle visualizzazioni (banner blindness) Link sponsorizzati: risultati non organici (pay per click) Behavioral targeting e contextual targeting (pubblicità in funzione delle query. E la privacy?) Click fraud e advertising fraud (da due punti di vista) Il concetto di click-through rate e Google AdSense

78 Outline Introduzione 1 Introduzione

79 Google Analytics Introduzione Google Analytics

80 Outline Introduzione 1 Introduzione

81 Tecniche di link building Directory links: Inserire i propri link in una directory è il metodo più facile per avere dei link di ritorno al proprio sito web I link vanno inseriti nella categoria appropriata per mantenerne la rilevanza I link nelle directory sono duraturi I link delle directory aiutano a migliorare il ranking Attenzione!

82 Tecniche di link building Article links: Sono link contestuali Gli article link normalmente sono unidirezionali Google assegna alta priorità a questi link Sono utili per generare traffico

83 Tecniche di link building Social bookmarking links: Metodo molto efficiente per costruire link unidirezionali verso il sito web I link dei social network vengono indicizzati velocemente dai motori di ricerca Sono link che possono generare molto traffico

84 Tecniche di link building Forum links: Sono link ad alta priorità per i motori di ricerca Rappresentano un modo molto semplice per rendere popolare un sito web Vengono riconosciuti dai motori di ricerca Sono utili per generare traffico Sono link unidirezionali e permanenti

85 Tecniche di link building Blog comment links: I link ai blog incrementano in page ranking Portano traffico diretto al sito web Rendono il sito web più visibile Sono link organici unidirezionali

86 Tecniche di link building Link wheel: Sono una combinazione di contenuti, link unidirezionali e pubblicità sui social media E uno dei metodi più potenti per creare link di ritorno verso un sito web Hanno effetto diretto sul ranking Generano dei link contestuali e generano traffico

87 Tecniche di link building Press release distribution, Hubpage e Squidoo: Press release è una piattaforma di pubblicità per i siti web Hubpage e Squidoo permettono l interazione con comunità di utenti Vengono generati authority links I link sono diretti Sono link altamente indicizzati dai motori di ricerca

88 Tecniche per migliorare il crawling I siti web vengono esplorati e indicizzati prima di comparire tra i risultati di un motore di ricerca: Lo spider di un motore di ricerca scopre la pagina Il motore di ricerca decide se inserire nel proprio indice la pagina Il contenuto viene messo nell indice appropriato Se il contenuto è rilevante (secondo gli algoritmi del motore di ricerca) allora viene visualizzato tra i risultati

89 Tecniche per migliorare il crawling I motori di ricerca esplorano in continuazione il Web: In generale i contenuti vengono identificati tramite link, ma è anche possibile sottomettere manualmente gli URL E possibile bloccare il crawling di alcune pagine E buona norma avere un architettura del sito che faciliti il crawling (sitemaps) Assicurarsi che i crawler non visitino duplicati delle pagine

90 Tecniche per migliorare il crawling Migliorare l efficienza del crawling: Puntare più link interni alle pagine più importanti del sito Avere link esterni Usare l attributo nofollow per prevenire il crawling Aggiornare spesso i contenuti Aggiungere una mappa del sito Monitorare le statistiche del crawling (Google Webmaster Tools)

Per siti più strutturati le informazioni sono mantenute mediante particolari organizzazioni di dati: human-powered directories

Per siti più strutturati le informazioni sono mantenute mediante particolari organizzazioni di dati: human-powered directories Motori di ricerca Search Non confondiamo i motori di ricerca (search engine) con le funzioni di ricerca all interno dei siti. Le funzioni di ricerca all interno sono in genere costituite da script che

Dettagli

10 ingredienti da tenere sempre in cucina ovvero,

10 ingredienti da tenere sempre in cucina ovvero, 10 ingredienti da tenere sempre in cucina ovvero, la SEO Checklist per andare a cena con Google Licenza Creative Commons - Non commerciale - Non opere derivate 3.0 Unported (CC BY-NC-ND 3.0) introduzione

Dettagli

SEMINARIO. Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista. Di Marco Alessia

SEMINARIO. Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista. Di Marco Alessia SEMINARIO Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista Di Marco Alessia ARGOMENTI TRATTATI Saranno affrontati separatamente due diversi argomenti, fondamentali per la realizzazione di

Dettagli

Guida avanzata al web marketing

Guida avanzata al web marketing SEO e SEM Guida avanzata al web marketing Black Hat SEO Marco Maltraversi I motori di ricerca, le directory e l influenza dei social network >> SEO e SEM per un web marketing veramente efficace >> Abilità

Dettagli

Tassonomia Web Spam GIUGNO 2005

Tassonomia Web Spam GIUGNO 2005 Prefazione: Questo documento si basa sull originale Web Spam Taxonomy firmato da alcuni ricercatori del dipartimento di Computer Science della Stanford University e pubblicato ad Aprile 2005. Tassonomia

Dettagli

Roberto Musa Consulenze Informatiche. P.IVA 03348400924 Via Sac. Lampis, 6 09031 Arbus (VS) Tel. 3495135913 E-mail: info@robertomusa.

Roberto Musa Consulenze Informatiche. P.IVA 03348400924 Via Sac. Lampis, 6 09031 Arbus (VS) Tel. 3495135913 E-mail: info@robertomusa. Il SEO (Search Engine Optimizing) è un attività atta a dar visibilità ad un sito che sta guadagnando negli ultimi anni sempre maggior risalto nelle strategie di web marketing delle aziende. Avere il sito

Dettagli

Ringraziamenti. Seo: un mondo da scoprire 3

Ringraziamenti. Seo: un mondo da scoprire 3 Sommario Ringraziamenti XIII prefazione di nereo sciutto introduzione 1 XV Seo: un mondo da scoprire 3 Breve introduzione ai motori di ricerca 3 Il posizionamento nei motori di ricerca 4 Oltre i motori

Dettagli

Tecniche di web marketing

Tecniche di web marketing Tecniche di web marketing Le tecniche Promotion Marketing Online S.E.M. Email Marketing Contextual Advertising Advergame 2/27 3/27 Promotion Marketing Online Riguarda la promozione dell'immagine dell'azienda

Dettagli

Indicazioni pratiche per realizzare una campagna marketing digitale

Indicazioni pratiche per realizzare una campagna marketing digitale Indicazioni pratiche per realizzare una campagna marketing digitale La fase strategia SEO: la scelta delle keyword Questa fase è fondamentale, qualunque attività SEO risulta essere priva di senso se non

Dettagli

WEB. Visibilita' sul web. Gabriele Murara

WEB. Visibilita' sul web. Gabriele Murara WEB Visibilita' sul web Gabriele Murara 1 Definizione Visibilità sul web: posizionamento di un sito internet tra i primi posti nei risultati di un motore di ricerca. Rappresenta la più intelligente forma

Dettagli

I 200 Parametri dell'algoritmo di Google. Ecco elecanti i 200 parametri che google usa per valutare il ranking di un sito web.

I 200 Parametri dell'algoritmo di Google. Ecco elecanti i 200 parametri che google usa per valutare il ranking di un sito web. 1 2 I 200 Parametri dell'algoritmo di Google Ecco elecanti i 200 parametri che google usa per valutare il ranking di un sito web. DOMINIO 13 Parametri: Età del Dominio; Tempo di registrazione del Dominio;

Dettagli

Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet

Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet Il Social Media Marketing è strettamente correlato al SEO (Search Engine Optimization).

Dettagli

La formula matematicha segreta utilizzata dai motori di ricerca per calcolare il ranking di un sito web per un dato termine di ricerca.

La formula matematicha segreta utilizzata dai motori di ricerca per calcolare il ranking di un sito web per un dato termine di ricerca. Algoritmo La formula matematicha segreta utilizzata dai motori di ricerca per calcolare il ranking di un sito web per un dato termine di ricerca. Attributo alt o 'alt text' Un attributo HTML che può essere

Dettagli

Introduzione E. TINELLI LTW A. A. 2011-2012

Introduzione E. TINELLI LTW A. A. 2011-2012 Corso di Laurea Specialistica in Ingegneria Informatica Corso di Linguaggi e Tecnologie Web A. A. 2011-2012 Web Information Retrieval Eufemia TINELLI Introduzione Per Web information Retrieval si intende

Dettagli

INFORMATICA MUSICALE. Docente. Renato Caruso

INFORMATICA MUSICALE. Docente. Renato Caruso INFORMATICA MUSICALE Docente Renato Caruso SEO: INTRO Spesso Internet è sinonimo di Google Spesso Internet è sinonimo di Facebook Spesso Computer è sinonimo di Facebook A cosa mi serve un portatile? C

Dettagli

Il PageRank è obsoleto? Via libera al TrustRank

Il PageRank è obsoleto? Via libera al TrustRank Il PageRank è obsoleto? Via libera al TrustRank Prefazione: Questo documento si basa sull originale Combating web spam with TrustRank firmato da alcuni ricercatori del dipartimento di Computer Science

Dettagli

SEO: le fondamenta del marketing digitale

SEO: le fondamenta del marketing digitale SEO: le fondamenta del marketing digitale e-book a cura di Andrea Roversi, Note introduttive Alleghiamo in questo e-book alcuni principi guida legati al SEO (Search Engine Optimization). Lo sviluppo accurato

Dettagli

@Giusi Castagnetta tutti i diritti riservati. Seo e contenuti video

@Giusi Castagnetta tutti i diritti riservati. Seo e contenuti video @Giusi Castagnetta tutti i diritti riservati Seo e contenuti video SEO facile Quando cerchiamo qualcosa sui motori di ricerca, ci aspettiamo di trovare per primi i risultati migliori, cioè quelli più pertinenti

Dettagli

Prato cresce con il digitale. Migliorare la propria posizione sul web

Prato cresce con il digitale. Migliorare la propria posizione sul web Prato cresce con il digitale Migliorare la propria posizione sul web Prato cresce con il digitale Come rendere il sito visibile dai motori di ricerca Programma 1. 2. 3. 4. 5. 6. 7. Cos'è una SERP Cosa

Dettagli

Documento dimostrativo versione : 8 luglio 2015

Documento dimostrativo versione : 8 luglio 2015 Pagina 1 Di 18 Report S.E.O. Il seguente report contiene l'analisi di presenza online e i suggerimenti per conseguire un miglioramento del posizionamento sui motori di ricerca e della visibilità del sito.

Dettagli

PageRank Formula semplificata

PageRank Formula semplificata PageRank Formula semplificata Dove: PR[A] è il valore di PageRank della pagina A che vogliamo calcolare. N è il numero totale di pagine note. n è il numero di pagine che contengono almeno un link verso

Dettagli

PUNTA IN ALTO! Guida al posizionamento sui motori di ricerca

PUNTA IN ALTO! Guida al posizionamento sui motori di ricerca PUNTA IN ALTO! Guida al posizionamento sui motori di ricerca Register.it - Guida al posizionamento sui motori di ricerca GUIDA AL POSIZIONAMENTO SUI MOTORI DI RICERCA La guida al posizionamento, realizzata

Dettagli

Motori di ricerca e Directory

Motori di ricerca e Directory Motori di ricerca e Directory Relatore: Andrea Baioni (abaioni@andreabaioni.it) Utilizzo dei Motori di Ricerca il 93% degli italiani online ritiene i motori di ricerca lo strumento più efficace per cercare

Dettagli

browser Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero

browser Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 7. Ricerca delle informazioni in rete, browsers, portali, motori di ricerca browser Un browser è un programma

Dettagli

Lezione 8. Motori di Ricerca

Lezione 8. Motori di Ricerca Lezione 8 Motori di Ricerca Basi di dati Un campo prevalente dell applicazione informatica è quello costituito dall archiviazione e dalla gestione dei dati (basi di dati). Sistema Informativo. Un sistema

Dettagli

Search Engine Optimization per Calciomercato.it

Search Engine Optimization per Calciomercato.it www.mamadigital.com Search Engine Optimization per Calciomercato.it Mamadigital srl - Sede legale e operativa: Via Conegliano, 18-00182 Roma C.F. e P. iva 09738901009 Phone: +39 0670614560 Fax: +39 0670391132

Dettagli

Indice generale. Parte I Il negozio... 1. Introduzione...xv. Capitolo 1 L e-commerce... 3

Indice generale. Parte I Il negozio... 1. Introduzione...xv. Capitolo 1 L e-commerce... 3 Introduzione...xv A chi può essere utile...xv A cosa può servire...xv Tredici capitoli e altrettanti buoni motivi per leggere questo libro...xvi Parte I Il negozio...xvi Parte II Il marketing...xvi Ringraziamenti...xvii

Dettagli

Un po di storia: la rete

Un po di storia: la rete Gabriella Pasi Università degli Studi di Milano Bicocca Il Web e i Motori di ricerca Un po di storia: la rete Metà degli anni 60: nasce ARPANET Fine anni 60: standardizzazione dei protocolli Anni 70: la

Dettagli

POR Regione Campania 2000-2006 Misura 3.14. Promozione della partecipazione Femminile al Mercato del Lavoro. Dispensa

POR Regione Campania 2000-2006 Misura 3.14. Promozione della partecipazione Femminile al Mercato del Lavoro. Dispensa DISPENSA I.C.T. POR Regione Campania 2000-2006 Misura 3.14 Promozione della partecipazione Femminile al Mercato del Lavoro Dispensa IL SEARCH ENGINE RANKING, PER CONQUISTARE LA PRIMA PAGINA DEI MOTORI

Dettagli

WWW.ICTIME.ORG. Introduzione al SEO. Cimini Simonelli Testa

WWW.ICTIME.ORG. Introduzione al SEO. Cimini Simonelli Testa WWW.ICTIME.ORG Introduzione al SEO Cimini Simonelli Testa v.1 28 Gennaio 2008 Cecilia Cimini Angelo Simonelli Francesco Testa Introduzione al SEO EDIZIONE Gennaio 2008 Questo manuale utilizza la Creative

Dettagli

BASE STANDARD PREMIER. PREZZO 400 / mese 1000 / mese 2500 / mese SEO (SEARCH ENGINE OPTIMIZATION)

BASE STANDARD PREMIER. PREZZO 400 / mese 1000 / mese 2500 / mese SEO (SEARCH ENGINE OPTIMIZATION) BASE STANDARD PREMIER PREZZO 400 / mese 1000 / mese 2500 / mese SEO (SEARCH ENGINE OPTIMIZATION) PREVIA ANALISI SEO INTERNO Numero di parole, frasi, keyword o criteri di ricerca consigliati per ciascun

Dettagli

Audioblog Blog i cui post sono prevalentemente vocali inviati spesso insieme a SMS da cellulari.

Audioblog Blog i cui post sono prevalentemente vocali inviati spesso insieme a SMS da cellulari. @/blog 1/5 Audioblog Blog i cui post sono prevalentemente vocali inviati spesso insieme a SMS da cellulari. Blog (o Web log) Il termine blog è la contrazione di web log, ovvero "traccia sulla rete". Il

Dettagli

Webinar. Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca

Webinar. Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Webinar Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Webinar Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Scenario Scenario: I risultati

Dettagli

Strumenti per la promozione online

Strumenti per la promozione online 1 Strumenti per la promozione online Giovanni Randazzo giovanni.randazzo@gmail.com Incontro 1 10 aprile 2013 aprile 3, 2013 2 Programma Incontro 1 10 aprile 17:30-21:00 Incontro 2 17 aprile 17:30-21:00

Dettagli

Motori di Ricerca. Vale a dire: ci sono troppe informazioni, il problema è trovarle!

Motori di Ricerca. Vale a dire: ci sono troppe informazioni, il problema è trovarle! Motori di Ricerca "La Rete Internet equivale all unificazione di tutte le biblioteche del mondo, dove però qualcuno si è divertito a togliere tutti i libri dagli scaffali". Vale a dire: ci sono troppe

Dettagli

DATABASE IN RETE E PROGRAMMAZIONE LATO SERVER

DATABASE IN RETE E PROGRAMMAZIONE LATO SERVER DATABASE IN RETE E PROGRAMMAZIONE LATO SERVER L architettura CLIENT SERVER è l architettura standard dei sistemi di rete, dove i computer detti SERVER forniscono servizi, e computer detti CLIENT, richiedono

Dettagli

Marketing editoriale e intermedialità Corso di Laurea in Com. Digitale - Università degli Studi di Milano

Marketing editoriale e intermedialità Corso di Laurea in Com. Digitale - Università degli Studi di Milano INDICE 1. I MOTORI DI RICERCA Differenze tra motori di ricerca e directory Come funziona un motore di ricerca Il Google PageRank 2. SEM E SEO Search Engine Marketing Search Engine Optimization La campagna

Dettagli

SPORTLANDIA TRADATE Cookie Policy

SPORTLANDIA TRADATE Cookie Policy SPORTLANDIA TRADATE Cookie Policy Informativa Privacy (art.13 D.Lgs. 196/2003): i dati che i partecipanti al Blog conferiscono all atto della loro iscrizione sono limitati all indirizzo e-mail e sono obbligatori

Dettagli

POSIZIONAMENTO sui MOTORI di RICERCA. Linee guida aziendali

POSIZIONAMENTO sui MOTORI di RICERCA. Linee guida aziendali POSIZIONAMENTO sui MOTORI di RICERCA Linee guida aziendali 3 LIVELLI di OTTIMIZZAZIONE LIVELLO A ottimizzazioni da fare per tutti i lavori web della J- Service. Parole chiave date dal cliente o estrapolate

Dettagli

Contenuti di un sito web alcune considerazioni

Contenuti di un sito web alcune considerazioni Contenuti di un sito web alcune considerazioni Contenuti unici, interessanti e di qualità Il principale problema che tutti i siti devono affrontare riguarda l aere contenuti unici, interessanti e di qualità.

Dettagli

Free SEO Checkup - SqueezeMind.it

Free SEO Checkup - SqueezeMind.it Free SEO Checkup - SqueezeMind.it Pre-Analisi SEO Gratuita per http://www.larius.eu Report Checkup Durante l'analisi abbiamo rilevato: 19 errori gravi 3 errori 12 test corretti Tag Title Il tag title è

Dettagli

La vetrina sul mondo

La vetrina sul mondo web marketing Paolo C. Pomi paolo@litrosoft.com http://litrosoft.com La vetrina sul mondo promozione:perfarconoscere per il brand e-commerce: per vendere i prodotti contenuti: per divulgare contenuti servizio:

Dettagli

Motori di ricerca. Reti e Web. Motori di ricerca. Motori di ricerca - Interfaccia. Motori di ricerca

Motori di ricerca. Reti e Web. Motori di ricerca. Motori di ricerca - Interfaccia. Motori di ricerca Reti e Web Si stima vi siano almeno 13 miliardi di pagine Web Sistemi per la ricerca e la catalogazione delle pagine Web motori di ricerca (Google, Yahoo!, Bing,...) cataloghi sistematici (Yahoo! directory)

Dettagli

Pubblicità sul web. Giulia Pizzolato

Pubblicità sul web. Giulia Pizzolato Pubblicità sul web Giulia Pizzolato Principali forme pubblicitarie sul web Pay-per-view Pay-per-click Mailing-list 1) Pay-per-view Si intende il classico acquisto da parte di un inserzionista di uno spazio

Dettagli

WEB Information Retrieval

WEB Information Retrieval WEB Information Retrieval Materiale tratto dal corso di Gabriella Pasi Materiale tratto da cap. 13 Modern Information Retrieval by Ricardo Baeza-Yates and Berthier Ribeiro-Neto http://www.sims.berkeley.edu/~hearst/irbook/

Dettagli

Privacy e motori di ricerca

Privacy e motori di ricerca E privacy 26 Firenze, 2 maggio Privacy e motori di ricerca La minaccia fantasma Claudio Agosti vecna@sikurezza.org http://www.sftpj.org Questo documento è distribuito sotto la licenza Gnu GPL 2 1 Copyright

Dettagli

*** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. ***

*** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. *** *** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. *** PREFAZIONE Questo progetto nasce perchè mi sono reso conto dell'importanza che i motori di ricerca hanno su Internet. Internet rappresenta

Dettagli

COOKIES PRIVACY POLICY DI BANCA PROFILO

COOKIES PRIVACY POLICY DI BANCA PROFILO COOKIES PRIVACY POLICY DI BANCA PROFILO Indice e sommario del documento Premessa... 3 1. Cosa sono i Cookies... 4 2. Tipologie di Cookies... 4 3. Cookies di terze parti... 5 4. Privacy e Sicurezza sui

Dettagli

Corso di Web programming Modulo T3 A2 - Web server

Corso di Web programming Modulo T3 A2 - Web server Corso di Web programming Modulo T3 A2 - Web server 1 Prerequisiti Pagine statiche e dinamiche Pagine HTML Server e client Cenni ai database e all SQL 2 1 Introduzione In questa Unità si illustra il concetto

Dettagli

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG 16 gennaio 2015 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG Introduzione Le attività dei blogger I social influencer

Dettagli

Motori di ricerca. Andrea Marin

Motori di ricerca. Andrea Marin Andrea Marin Università Ca Foscari Venezia SVILUPPO INTERCULTURALE DEI SISTEMI TURISTICI SISTEMI INFORMATIVI E TECNOLOGIE WEB PER IL TURISMO - 1 a.a. 2012/2013 Section 1 Information Retrieval e Motori

Dettagli

Corso basi di dati Introduzione alle ASP

Corso basi di dati Introduzione alle ASP Corso basi di dati Introduzione alle ASP Gianluca Di Tomassi Email: ditomass@dia.uniroma3.it Università di Roma Tre Web statico e Web interattivo In principio il Web era una semplice collezione di pagine

Dettagli

INFORMATIVA ESTESA SULL USO DEI COOKIE

INFORMATIVA ESTESA SULL USO DEI COOKIE INFORMATIVA ESTESA SULL USO DEI COOKIE Uso dei cookie cantiwinestyle.com o il Sito utilizza i Cookie per rendere i propri servizi semplici e efficienti per l utenza che visiona le pagine di cantiwinestyle.com

Dettagli

La ricerca delle informazioni nei siti web di Ateneo con Google Search Appliance Progetto, implementazione e sviluppi

La ricerca delle informazioni nei siti web di Ateneo con Google Search Appliance Progetto, implementazione e sviluppi La ricerca delle informazioni nei siti web di Ateneo con Google Search Appliance Progetto, implementazione e sviluppi Il progetto del sistema di ricerca delle informazioni L'esigenza del sistema di ricerca

Dettagli

Esempio Cookie Policy

Esempio Cookie Policy Esempio Cookie Policy INFORMATIVA ESTESA SULL USO DEI COOKIE Uso dei cookie cascinaladoria.it o il Sito utilizza i Cookie per rendere i propri servizi semplici e efficienti per l utenza che visiona le

Dettagli

Reti complesse Ranking

Reti complesse Ranking Reti complesse Ranking dellamico@disi.unige.it Applicazioni di rete 2 A.A. 2006-07 Outline 1 Ricerca sul web Ranking 2 L'ago nel pagliaio Ricerca sul web Ranking Immaginiamo di avere una biblioteca con

Dettagli

INFORMATION & COMMUNICATION TECHNOLOGY

INFORMATION & COMMUNICATION TECHNOLOGY GRAFICA PER IL WEB VIDEO PER IL WEB WEB COPYWRITING WEB ANALYTICS OTTIMIZZAZIONE E POSIZIONAMENTO SEO SEARCH MARKETING: CAMPAGNE E STUMENTI SEM FARE BUSINESS CON FACEBOOK STRATEGIE LINKEDIN PER L AZIENDA

Dettagli

A cura di: Ronnie Pavani. Resp. Web Marketing & S.e.o. TITANKA! Spa

A cura di: Ronnie Pavani. Resp. Web Marketing & S.e.o. TITANKA! Spa A cura di: Ronnie Pavani Resp. Web Marketing & S.e.o. TITANKA! Spa BE-Wizard! Academy - Roma 31 gennaio 2012 I fondamentali dell ottimizzazione La struttura piramidale del sito La struttura piramidale

Dettagli

La gestione del documento

La gestione del documento Operatore giuridico d impresa Informatica Giuridica A.A 2002/2003 II Semestre La gestione del documento prof. Monica Palmirani Il documento A differenza del dato il documento è solitamente un oggetto non

Dettagli

PROGETTI DISPONIBILI IL CORSO DI PROGETTO DI RETI E SISTEMI INFORMATICI

PROGETTI DISPONIBILI IL CORSO DI PROGETTO DI RETI E SISTEMI INFORMATICI PROGETTI DISPONIBILI IL CORSO DI PROGETTO DI RETI E SISTEMI INFORMATICI 1 Web Link Monitor... 2 2 Database Browser... 4 3 Network Monitor... 5 4 Ghost Site... 7 5 Copy Search... 9 6 Remote Audio Video

Dettagli

IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web

IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web GLI INTERROGATIVI 1. Perché Internet è il più grande contenitore di info del mondo? 2. Perché non è sempre facile reperire informazione utile

Dettagli

Questa pagina e tutti i capitoli della guida che trovate elencati a destra costituiscono il cuore di questo sito web.

Questa pagina e tutti i capitoli della guida che trovate elencati a destra costituiscono il cuore di questo sito web. Posizionamento sui motori di ricerca. Cos'è il "posizionamento"? Per posizionamento si intente un insieme di tecniche che hanno l'obiettivo di migliorare la posizione di un sito web nei risultati delle

Dettagli

Sito web e SEO. Come costruire un sito web vincente e farsi piacere ai motori di ricerca

Sito web e SEO. Come costruire un sito web vincente e farsi piacere ai motori di ricerca Come costruire un sito web vincente e farsi piacere ai motori di ricerca Raffaele Germano Digital Strategist Camera di Commercio Potenza Di cosa parleremo oggi Avere una presenza web: sito proprio o di

Dettagli

Navigazione. per associazione. ipertesti/ipermedia. l utente naviga nello spazio dei documenti alla ricerca dei nodi di interesse

Navigazione. per associazione. ipertesti/ipermedia. l utente naviga nello spazio dei documenti alla ricerca dei nodi di interesse Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 5. Database e Information Retrieval per associazione Navigazione ipertesti/ipermedia l utente naviga nello spazio

Dettagli

IL WHITE PAPER DELL EMAIL MARKETING Per l e-commerce

IL WHITE PAPER DELL EMAIL MARKETING Per l e-commerce IL WHITE PAPER DELL EMAIL MARKETING Per l e-commerce Editore Newsletter2Go L email marketing per l e-commerce Nel mondo altamente digitalizzato dei nostri giorni, l email è spesso l unico strumento di

Dettagli

SOMMARIO. Ringraziamenti. Seo: un mondo da scoprire 1

SOMMARIO. Ringraziamenti. Seo: un mondo da scoprire 1 SOMMARIO Ringraziamenti PREFAZIONE DI ENRICO MADRIGRANO INTRODUZIONE DI COSMANO LOMBARDO XVII XIX XXI Seo: un mondo da scoprire 1 SEO Power seconda edizione: perché? 1 Breve introduzione ai motori di ricerca

Dettagli

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web Il World Wide Web Il Web Claudio Fornaro ver. 1.3 1 Il World Wide Web (ragnatela di estensione mondiale) o WWW o Web è un sistema di documenti ipertestuali collegati tra loro attraverso Internet Attraverso

Dettagli

Search Engine Spam. Introduzione ed elementi di base

Search Engine Spam. Introduzione ed elementi di base UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II FACOLTÀ DI SOCIOLOGIA - CORSO DI LAUREA IN CULTURE DIGITALI E DELLA COMUNICAZIONE Search Engine Spam Introduzione ed elementi di base Elementi di informatica

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

Search Marketing. Un investimento misurato dalla pianificazione al ritorno. Luigi Sciolti

Search Marketing. Un investimento misurato dalla pianificazione al ritorno. Luigi Sciolti Search Marketing Un investimento misurato dalla pianificazione al ritorno. Luigi Sciolti 1 About us Luigi Sciolti: Consulente Web Marketing Web Designer e Web Developer Fondatore di UP Vision. UP Vision:

Dettagli

Guida base al posizionamento nei motori di ricerca

Guida base al posizionamento nei motori di ricerca Guida base al posizionamento nei motori di ricerca Indice: > Panoramica sul posizionamento. > Google > Analizzare i competitors > Analizzare le keywords > Ottimizzare un sito per i motori di ricerca >

Dettagli

CORSO GOOGLE ADWORDS

CORSO GOOGLE ADWORDS CORSO GOOGLE ADWORDS Corso: Google AdWords I concetti fondamentali del keyword e display advertising per imparare a creare e gestire campagne pubblicitarie Google AdWords in modo efficace. Argomenti del

Dettagli

Introduzione all Information Retrieval

Introduzione all Information Retrieval Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information

Dettagli

Adwords: la strategia mista. www.acquisireclienti.com

Adwords: la strategia mista. www.acquisireclienti.com Adwords: la strategia mista www.acquisireclienti.com La strategia mista Homepage con landing page Sottocartella con blog Sottocartella con landing page personalizzate per parola chiave La strategia mista

Dettagli

Analisi sito web tieloh-bike.de

Analisi sito web tieloh-bike.de Analisi sito web tieloh-bike.de Generato il Agosto 03 2015 14:46 PM Il punteggio e 34/100 SEO Content Title tieloh-bike Lunghezza : 11 Perfetto, il tuo title contiene tra 10 e 70 caratteri. Description

Dettagli

WEB MARKETING. Indicizzazione nei motori di ricerca. SCHEDA PRODOTTO Versione 1.1

WEB MARKETING. Indicizzazione nei motori di ricerca. SCHEDA PRODOTTO Versione 1.1 WEB MARKETING nei motori di ricerca SCHEDA PRODOTTO Versione 1.1 1 1. INTRODUZIONE I motori di ricerca sono la funzione più utilizzata sul web e sono secondi solo alla posta elettronica nella lista delle

Dettagli

WEB WRITING PER I MOTORI DI RICERCA. Alberto Rota Ariadne Srl

WEB WRITING PER I MOTORI DI RICERCA. Alberto Rota Ariadne Srl WEB WRITING PER I MOTORI DI RICERCA Alberto Rota Ariadne Srl Cosa vedremo oggi Un po di definizioni e una introduzione al funzionamento della ricerca Come Google è cambiato nel tempo Come Google raccoglie

Dettagli

Indicizzazione. Fasi del processo di IR. Indicizzazione: due aspetti. Corpus: Costruzione delle viste logiche dei documenti: Termine indice

Indicizzazione. Fasi del processo di IR. Indicizzazione: due aspetti. Corpus: Costruzione delle viste logiche dei documenti: Termine indice Fasi del processo di IR Indicizzazione Information need text input Pre-process documents Parse Query Index Rank Indicizzazione: due aspetti Costruzione delle viste logiche dei documenti: Per ogni documento

Dettagli

Search engine best practices

Search engine best practices 1 Search engine best practices Un giorno le macchine riusciranno a risolvere tutti i problemi, ma mai nessuna di esse potrà porne uno. [Albert Einstein] A cura di Leonardo Bellini Digital Marketing Lab

Dettagli

La guida. Posizionare il Sito significa invece fare in modo che quel Sito appaia tra i primi posti dei. Dare un titolo ad ogni pagina

La guida. Posizionare il Sito significa invece fare in modo che quel Sito appaia tra i primi posti dei. Dare un titolo ad ogni pagina A pparire ai primi posti dei risultati sui motori di ricerca significa incrementare notevolmente la visibilità del proprio nome e/o del nome del proprio Studio Legale, attirando l'attenzione di chi sta

Dettagli

Analisi sito web laducalemanagement.com

Analisi sito web laducalemanagement.com Analisi sito web laducalemanagement.com Generato il Maggio 11 2016 16:12 PM Il punteggio e 39/100 SEO Content Title LA DUCALE MANAGEMENT & PROMOTION S.C.R.L. di Emanuele Barbè Via Cararola 56 27029 VI

Dettagli

CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE

CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE A cura di Massimiliano Navacchia http://www.navacchia.it/ info@navacchia.it - cell. (+39) 3394676518

Dettagli

SEM e SEO Internet studies, 2013/2014 Emmanuel Mazzucchi e Francesca Comunello

SEM e SEO Internet studies, 2013/2014 Emmanuel Mazzucchi e Francesca Comunello SEM e SEO Internet studies, 2013/2014 Emmanuel Mazzucchi e Francesca Comunello Search marketing Selezionare per scrivere o eliminare il sottotitolo Vantaggi: - Alta profilazione utenti (parole chiave;

Dettagli

Wordpress corso base. Mario Marino Corso Base Wordpress

Wordpress corso base. Mario Marino Corso Base Wordpress Wordpress corso base Mario Marino Corso Base Wordpress introduzione Cosa sappiamo fare adesso e cosa vorremmo sapere fare alla fine del corso Parole chiave Sito / Blog Database CMS Client / Server Account

Dettagli

Uno sguardo a Lucene. Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011

Uno sguardo a Lucene. Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011 Uno sguardo a Lucene Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011 Outline Uno sguardo a Lucene Descrizione delle principali caratteristiche Realizzazione di un semplice

Dettagli

Posizionamento nei motori di ricerca

Posizionamento nei motori di ricerca Posizionamento nei motori di ricerca (Introduzione alla SEO 2012 Parte 1) Federico Andrioli Cos'è la SEO? (Search Engine Optimization) Primi nella SERP La pagina di un motore di ricerca con l'elenco

Dettagli

Corso di Informatica Modulo T3 B1 Programmazione web

Corso di Informatica Modulo T3 B1 Programmazione web Corso di Informatica Modulo T3 B1 Programmazione web 1 Prerequisiti Architettura client/server Elementi del linguaggio HTML web server SQL server Concetti generali sulle basi di dati 2 1 Introduzione Lo

Dettagli

INFORMAZIONI GENERALI SUI COOKIES

INFORMAZIONI GENERALI SUI COOKIES Con riferimento al provvedimento Individuazione delle modalità semplificate per l informativa e l acquisizione del consenso per l uso dei cookie 8 maggio 2014 (pubblicato sulla Gazzetta Ufficiale n. 126

Dettagli

Come leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci

Come leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci Come leggere ed interpretare la letteratura scientifica e fornire al pubblico informazioni appropriate sui farmaci I motori di ricerca in internet: cosa sono e come funzionano Roberto Ricci, Servizio Sistema

Dettagli

S earche ngineo ptimization

S earche ngineo ptimization la nuova frontiera per lo sviluppo delle vendite Nel mercato si fa sempre più sentire la differenza tra chi si concentra solo sullo sviluppo commerciale tradizionale e chi invece abbraccia le nuove tecnologie

Dettagli

TEORIA sulle BASI DI DATI

TEORIA sulle BASI DI DATI TEORIA sulle BASI DI DATI A cura del Prof. Enea Ferri Cos è un DATA BASE E un insieme di archivi legati tra loro da relazioni. Vengono memorizzati su memorie di massa come un unico insieme, e possono essere

Dettagli

Breve descrizione del prodotto

Breve descrizione del prodotto Breve descrizione del prodotto 1. Il software AquaBrowser Library...2 1.1 Le funzioni di Search Discover Refine...3 1.2 Search: la funzione di ricerca e di presentazione dei risultati...3 1.2.1 La configurazione

Dettagli

COOKIES POLICY. 2. Tipologie di Cookies utilizzati da parte del sito www.elleservizi.it e/o delle aziende e dei marchi che ne fanno parte

COOKIES POLICY. 2. Tipologie di Cookies utilizzati da parte del sito www.elleservizi.it e/o delle aziende e dei marchi che ne fanno parte COOKIES POLICY Questa cookies policy contiene le seguenti informazioni : 1. Cosa sono i Cookies. 2. Tipologie di Cookies. 3. Cookies di terze parti. 4. Privacy e Sicurezza sui Cookies. 5. Altre minacce

Dettagli

Corso di Informatica

Corso di Informatica Corso di Informatica CL3 - Biotecnologie Orientarsi nel Web Prof. Mauro Giacomini Dott. Josiane Tcheuko Informatica - 2006-2007 1 Obiettivi Internet e WWW Usare ed impostare il browser Navigare in internet

Dettagli

cos è l architettura dell informazione?

cos è l architettura dell informazione? Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 3. Architettura dell informazione cos è l architettura dell informazione? E la progettazione di spazi informativi

Dettagli

Corso Creare Siti WEB

Corso Creare Siti WEB Corso Creare Siti WEB INTERNET e IL WEB Funzionamento Servizi di base HTML CMS JOOMLA Installazione Aspetto Grafico Template Contenuto Articoli Immagini Menu Estensioni Sito di esempio: Associazione LaMiassociazione

Dettagli

I MOTORI DI RICERCA (I Parte)

I MOTORI DI RICERCA (I Parte) Introduzione I MOTORI DI RICERCA (I Parte) Una delle cose più incredibili che possiamo affermare riguardo ad Internet è che possiamo trovarci veramente di tutto. Qualsiasi argomento che ci viene in mente

Dettagli

anthericacms Il sistema professionale per la gestione dei contenuti del tuo sito web Versione 2.0

anthericacms Il sistema professionale per la gestione dei contenuti del tuo sito web Versione 2.0 anthericacms Il sistema professionale per la gestione dei contenuti del tuo sito web Versione 2.0 Email: info@antherica.com Web: www.antherica.com Tel: +39 0522 436912 Fax: +39 0522 445638 Indice 1. Introduzione

Dettagli

Come migliorare la propria visibilità online

Come migliorare la propria visibilità online Come migliorare la propria visibilità online 26 marzo 2012 Sala Anfiteatro Dipartimento Tecnologie Innovative SUPSI, Manno Giovanni Randazzo giovanni.randazzo@gmail.com Agenda Perché dovrei investire sul

Dettagli