Motori di Ricerca. Indicizzazione e Ranking. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Motori di Ricerca. Indicizzazione e Ranking. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it"

Transcript

1 Indicizzazione e Ranking Dip. di Scienze Umane e Sociali

2 Outline Introduzione 1 Introduzione

3 Outline Introduzione 1 Introduzione

4 Cos è un motore di ricerca? Come funziona la ricerca sul Web? Dove cerca un motore di ricerca? Cos è l indicizzazione delle pagine? Qual è l importanza del ranking dei risultati?

5 Quali sono gli obiettivi? Conoscere le tecnologie alla base del Web e della Ricerca per poterle sfruttare Capire la struttura del Web e i problemi legati alla ricerca delle informazioni Conoscere le tecniche usate per l indicizzazione delle pagine Conoscere gli algoritmi per l ordinamento dei risultati di una ricerca (ranking) Capire qual è la fonte principale di guadagno di un motore di ricerca Gestire le statistiche del proprio sito web Sapere come rendere rintracciabile il proprio sito web da un motore di ricerca

6 Internet e il Web Introduzione Cos è Internet? Cos è il Web?

7 Internet e il Web Cos è Internet? Cos è il Web? Mentre Internet è la rete fisica che connette milioni di computer a livello globale, il Web è una rete globale virtuale che connette immense quantità di informazioni. I motori di ricerca devono oggigiorno indicizzare miliardi di pagine web, e questo numero è solo una percentuale delle informazioni a cui è possibile accedere sul Web, la maggior parte della quale è localizzata in database non direttamente accessibili dai motori di ricerca.

8 Outline Introduzione 1 Introduzione

9 Le dimensioni del Web Il Web è indubbiamente il più grande contenitore di informazioni noto all uomo Nel 2000: 2.1 miliardi di pagine con un tasso di crescita di 7.3 milioni di pagine al giorno Nel 2010: 600 miliardi di pagine con un tasso di crescita di 200 milioni di pagine al giorno Questa statistica non include in deep web (circa 550 volte maggiore del Web) Questa stima esclude le pagine generate con spamdexing (circa 14% del totale)

10 Il problema della ricerca Come vengono gestiti i milioni di query ai motori di ricerca? Bisogna considerare che il Web è in costante cambiamento e in crescita Le pagine sono spesso scritte con linguaggi di scripting Esistono diversi formati per le pagine

11 Quali sono le dimensioni del Web? 92000TB = 92PB considerando anche il deep web Si stima che il Web abbia una dimensione di 170TB Ovviamente la maggior parte delle informazioni è irrilevante I motori di ricerca devono quindi continuamente scegliere quali informazioni considerare e quali no

12 Quante query vengono sottoposte ai motori di ricerca? Google nel 2010 riceveva circa 3.5 miliardi di query al giorno (circa 4000 al secondo) Ad esempio la ricerca Computer Science veniva fatta circa volte al mese E necessario gestire molto velocemente ed efficacemente le ricerche: mediamente, dopo 12 minuti l utente perde la pazienza se non ha trovato quello che cerca altre cause di irritazione sono legate alla velocità di download, risultati di ricerca non rilevanti, siti web che non permettono ricerche al proprio interno, help che non aiutano, siti web realizzati male, necessità di scorrere molte informazioni prima di trovare quella richiesta, pubblicità.

13 Come funziona ad alto livello un motore di ricerca? Input: query, ovvero un insieme di parole chiave La ricerca viene fatta in un archivio (l utente non deve avere conoscenze specifiche su come si interroga un DB) Output: un elenco ordinato di documenti considerati rilevanti per la query Il motore di ricerca identifica i risultati migliori e l utente decide se quei documenti soddisfano la sua richiesta I motori di ricerca si devono adattare a formati diversi (in continuo cambiamento) I motori di ricerca coprono solo parte del Web Cosa succede se uno dei Server di un motore di ricerca è offline?

14 Come funziona ad alto livello un motore di ricerca? Input: query, ovvero un insieme di parole chiave La ricerca viene fatta in un archivio (l utente non deve avere conoscenze specifiche su come si interroga un DB) Output: un elenco ordinato di documenti considerati rilevanti per la query Il motore di ricerca identifica i risultati migliori e l utente decide se quei documenti soddisfano la sua richiesta I motori di ricerca si devono adattare a formati diversi (in continuo cambiamento) I motori di ricerca coprono solo parte del Web Cosa succede se uno dei Server di un motore di ricerca è offline? Otteniamo comunque dei risultati perché non stiamo cercando risposte precise

15 Introduzione La struttura del Web

16 La struttura del Web Strongly connected components (SCC): circa 27.5% del Web IN e OUT circa 21.5% del Web Tendrils e tube circa 21.5% del Web Disconnected circa 8% del Web

17 La struttura del Web Riguardo alla navigabilità del Web, nel 75% dei casi non esiste un percorso diretto tra due pagine scelte a caso Quando il percorso esiste, ha una lunghezza pari a 16 Mediamente, un percorso indiretto ha una lunghezza pari a 7 E possibile applicare al Web la nozione di sei gradi di separazione

18 Cercare le informazioni sul Web Navigazione diretta Navigazione tramite parole chiave (supporto multi-lingua) problemi legati a singolare/plurale a chi assegnare parole chiave comuni Navigazione in web-directory Compilate da persone Utile per non esperti Complicato se le informazioni richieste sono molto specifiche Navigazione usando motori di ricerca

19 Navigazione con i motori di ricerca Questo tipo di navigazione avviene secondo i seguenti passi: Formulazione della query Selezione Navigazione Modifica o ri-formulazione della query

20 La ricerca dell informazione I problemi legati alla ricerca dell informazione sul Web: il Web è un sistema aperto in continua evoluzione la qualità delle informazioni è estremamente eterogenea (è necessario verificarne l attendibilità) la conoscenza del Web non è oggettiva non avendo uno scopo preciso, non sappiamo a priori se contiene l informazione cercata

21 La ricerca tradizionale e il Web I classici sistemi di Information Retrieval utilizzavano un full-text retrieval system per soddisfare l utente Nel mondo del Web: la ricerca viene effettuata su scale diverse (miliardi di documenti) il Web è dinamico (i sistemi di IR trattavano dati statici) il Web contiene duplicati (circa il 30% dei documenti) la qualità delle pagine è eterogenea gli argomenti trattati dal Web non hanno confini il Web è distribuito a livello globale (problemi logistici) gli utenti inviano query molto corte ha una struttura ipertestuale

22 La ricerca locale all interno di un sito Web Molti utenti preferiscono usare strumenti di ricerca anziché navigare in un sito E importante avere uno strumento di ricerca perché parte delle informazioni potrebbero far parte del deep web Il motore di ricerca di un sito deve servire all utente per svolgere i task nel sito Deve raggiungere parti del sito che i motori di ricerca non raggiungono

23 Documenti trovati, recall e precisione Recall: intersezione/numero di documenti rilevanti Precisione: intersezione/numero di documenti trovati Nel Web la recall non è importante E importante la precisione (i primi 10 documenti)

24 Outline Introduzione 1 Introduzione

25 Il motore di ricerca Introduzione Fornisce un elenco di pagine web rilevanti per l utente Per ogni risultato rilevante, presenta un riassunto della pagina il riassunto viene creato dinamicamente in funzione della query Presentano dei link sponsorizzati (a pagamento) gli ad links vengono solitamente separati dagli organic results l altra fonte di guadagno riguarda i servizi di ricerca forniti

26 Il motore di ricerca Principale punto di accesso per il Web: sia per l utente che ricerca le informazioni sia per l autore che vuole rendere visibile e accessibile la propria pagina Grazie al ruolo che ricopre: ha il potere di includere o escludere una pagina web dai propri archivio può influenzare il ranking delle pagine influenza, in generale, le informazioni che possono essere trovate dagli utenti Siti web e motori di ricerca sono in continua lotta per capire (da una parte) e nascondere (dall altra) i meccanismi usati per il ranking

27 La sintassi delle query Query base: insieme di parole chiave Query con più parole chiave forniscono risultati secondo il ranking proximity matching L ordine delle keywords conta Qual è il valore aggiunto di operatori come AND, OR,, +? Permettono di ottenere restrizioni maggiori sull insieme dei risultati OR invece estende l insieme dei documenti rilevanti E stato mostrato come 6.6 risultati su 10 sono uguali a quelli ottenuti con query di base con le stesse keywords Altri operatori come -, selezione di date, site influenzano molto l elenco dei risultati

28 La popolarità delle query Le parole chiave più cercate: Le parole chiave di un motore di ricerca possono essere usate per studiare trends: query riguardanti influenza e malattie per prevenirne la diffusione query per studiare gli interessi degli utenti (Google Trends)

29 Perché parliamo sempre di Google

30 Outline Introduzione 1 Introduzione

31 Architettura di un motore di ricerca

32 Il search index E un DB che contiene tutte le informazioni necessarie al motore di ricerca per: identificare le pagine rilevanti recuperare e ordinare le pagine Ha una struttura nota come inverted file Contiene un indice alfabetico di tutte le parole contenute nelle pagine web note (index file) per ogni parola c è un riferimento alle pagine web che la contengono (posting list) Es. chess [www.chess.com, ]

33 Il search index Il search index contiene anche collegamenti: link database (archivio separato) necessario per l analisi dei collegamenti richiesta dal processo di ranking tipicamente organizzato come inverted file normalmente contiene miliardi di entry viene compresso per ottimizzare l occupazione e l efficienza nell accesso alle informazioni

34 Il query engine Introduzione E il cuore algoritmico del motore di ricerca Il suo funzionamento viene mantenuto segreto dai motori di ricerca potrebbe essere usato dagli sviluppatori per aumentare il ranking delle pagine la manipolazione del query engine viene considerata spam perché peggiora la qualità del servizio del motore di ricerca è difficile distinguere l ottimizzazione dei risultati organici e lo spam

35 Il query engine Le query vengono processate in due fasi: 1 vengono cercate nel search index informazioni potenzialmente rilevanti keywords matching 2 viene effettuato il ranking delle pagine identificate al passo precedente ordinamento decrescente dalla pagina più rilevante vengono considerati: rilevanza dei contenuti, risultati dell analisi dei collegamenti e popolarità L ordinamento è un processo molto complesso. La rilevanza è specifica del contesto che l utente ha in mente quando effettua una ricerca

36 La search interface Interfaccia per l invio delle query Visualizzazione dei risultati della ricerca Navigazione dei risultati della ricerca E importante che l utente possa distinguere i link sponsorizzati dai risultati organici i link sponsorizzati vengono ordinati a seconda delle keywords acquistate i risultati organici vengono ordinati dal motore di ricerca Esempi: Google Yahoo!

37 Web crawling I crawler di Google visitano continuamente più di un trilione di pagine web Il search index creato dai crawler viene distribuito nei server di Google durante gli aggiornamenti (Google dance) durante la Google dance alcuni server potrebbero avere la versione vecchia del search index è il periodo migliore per aggiornare il proprio sito web se i crawler non visitano le pagine aggiornate bisogna aspettare il mese successivo Al termine dell aggiornamento, il lavoro dei crawler riparte Il Web è in continua crescita ed evoluzione, è quindi necessario avere crawler che coprano in maniera efficiente la maggior parte del Web

38 Algoritmi di crawling

39 Algoritmi di crawling La lista di URL non deve contenere solo indirizzi della parte strongly connected del Web Una buona lista iniziale viene compilata: selezionando gli indirizzi dalle directory (Yahoo! dir) utilizzando gli indirizzi già presenti nel search index La lista è dinamica: quando una pagina è stata visitata viene tolta dalla lista tutti i link contenuti nella pagina visitata vengono aggiunti alla lista Il processo termina quando: un numero di pagine specificato viene visitato dopo un determinato intervallo di tempo

40 Algoritmi di crawling I problemi da affrontare durante il crawling: identificare i duplicati delle pagine: diversi URL, contenuto identico viene associata alla pagina una breve descrizione del contenuto e si confrontano i contenuti in fase di analisi qualità delle pagine da visitare URL sintatticamente errati pagine dinamiche con script che ne modificano i contenuti run-time pagine con scripting vengono spesso tralasciate pagine con formati non standard possono non essere indicizzate decidere l ordine di visita delle pagine

41 Algoritmi di crawling Ordine di visita delle pagine da indicizzare Breadth-first: URL visitati nell ordine in cui appaiono nella lista (FIFO) Secondo la struttura degli URL: pagine con più link prima Secondo il dominio: partendo dai più importanti (es..com) Focused crawlers: visitano pagine che trattano argomenti particolari guidati da query le parole chiave vengono usate per la scelta dell ordine di visita delle pagine (best-first)

42 Algoritmi di crawling Quando eseguire il crawling Nuove operazioni di crawling vengono schedulate al termine delle precedenti Un aggiornamento continuo può portare ad aggiornare il search index in continuazione Opposto alla Google dance Può portare il vantaggio di non dover aspettare il termine del crawling per avere gli aggiornamenti delle pagine

43 Algoritmi di crawling Il refresh delle pagine web Prima ipotesi: visitare tutte le pagine con la stessa frequenza Seconda ipotesi: visitare più di frequente le pagine che cambiano spesso (news, e-commerce) E stato osservato che: siti web grandi tendono a cambiare più frequentemente siti web con domini.com e.net cambiano spesso ed ampiamente siti web con domini.edu e.gov cambiano raramente la cronologia dei cambiamenti di una pagina web aiuta a prevedere cambiamenti futuri

44 Algoritmi di crawling Se un crawler visita troppo spesso una pagina può portare problemi per i troppi accessi HTTP Le visite di un crawler devono essere schedulate efficacemente Robots exclusion protocol (robotstxt.org): usato per impedire a un crawler di visitare una pagina viene aggiunto il file robots.txt nella root directory del sito User-agent: GoogleBot (oppure Slurp o *) Disallow: /docs Disallow: /logs

45 Algoritmi di crawling Sitemap è un protocollo XML usato dagli webmaster per informare i crawler delle pagine disponibili per l indicizzazione Metadati aggiuntivi per ogni pagina data di ultima modifica frequenza delle modifiche priorità relativa della pagina nel sito I crawler usano sia sitemap che robots.txt per l indicizzazione, tuttavia possono essere non affidabili e contenere spam

46 Algoritmi di crawling Spider traps Esempi script che generano automaticamente un numero elevato di URL che puntano alla stessa pagina bloccano il crawler in un loop infinito, consumando inutilmente risorse computazionali URL con? che identificano query e che generano una lunga lista di collegamenti URL che generano una pagina web con un calendario pieno di link in ogni data

47 Il servizio di Google Nel 2003: cluster di computer per un totale di PC Nel 2009: PC Grande capacità di memorizzazione (ogni PC ha 16GB di RAM e 2TB di HD): indicizzare miliardi di pagine web memorizzare file multimediali (ad es. i contenuti di Youtube) La rete distribuita di questi computer è: più economica e affidabile di un servizio di server con high performance l affidabilità è data anche dal SW appositamente sviluppato da Google anche il consumo energetico e il raffreddamento vengono gestiti più facilmente I milioni di query vengono gestiti dai data center distribuiti a livello globale

48 Il servizio di Google Cosa succede quando viene inviata una query? 1 Viene scelto il Server (geograficamente) più vicino 2 Viene consultato l inverted index per il matching con ogni keyword (index server) 3 Le liste generate vengono intersecate 4 Viene calcolato il punteggio di ogni pagina per determinare l ordinamento 5 Viene generata la lista di collegamenti ai documenti rilevanti (titolo, URL, riassunto) 6 Viene inviata la lista all utente (document server) 7 Vengono fatto lo spell check e vengono aggiunti i link sponsorizzati

49 Il servizio di Google Le informazioni (index, ecc.) sono replicate in diversi Server Le fasi della query vengono eseguite in parallelo (PB di dati da analizzare) Se parte del cluster che sta elaborando la query è down, vengono utilizzati altri cluster L aggiornamento dell index viene fatta separatamente (offline) e viene aggiornato un cluster alla volta

50 Il servizio di Google L architettura distribuita di Google: Google File System Algoritmo MapReduce BigTable database system

51 Il servizio di Google Google File System: filesystem distribuito e fault-tolerant utilizzato dalle applicazioni Google supporta cluster (un master e più chunkserver) per accesso multiplo dei client file in chunk da 64MB replicati su più chunkserver i metadati sono memorizzati nel master essendoci molti più accessi in lettura che scrittura, i controlli di consistenza dei dati sono semplici

52 Il servizio di Google Algoritmo MapReduce: consiste di operazioni map e reduce che possono essere eseguite in parallelo l ordine di esecuzione non influisce sull output anche se vengono generati nuovi dati, quelli vecchi non vengono sovrascritti la map prende delle coppie key/value e produce dei valori intermedi per ogni coppia la reduce prende i valori prodotti dalla map e produce un singolo valore di output per ogni key mediamente vengono eseguite MapReduce al giorno (che elaborano 20PB di dati)

53 Il servizio di Google BigTable: tabelle tridimensionali ad esempio la webtable: righe: URL colonne: caratteristiche delle pagine celle: contenuti delle pagine le righe sono organizzate in tablet (ad esempio pagine con lo stesso dominio) le colonne sono organizzate in famiglie di pagine con caratteristiche simili time stamp per diverse versioni delle pagine usa GFS per memorizzare i dati e MapReduce per l elaborazione parallela

54 La rilevanza del contenuto delle pagine web Dipende sia dalla query che dall utente che effettua la ricerca Non ha molta influenza sul processo di ranking Vengono selezionate tutte le pagine che contengono le keyword della query Considera altre informazioni Posizione geografica Data Preferenze, cronologia (?)

55 Il pre-processing delle pagine La pagina viene divisa in parole Vengono considerati anche i tag HTML e i simboli speciali Anche i numeri vengono indicizzati (risultato di una partita 0:1) Vengono eliminate le stop words Conversione di tutte le keyword in minuscolo (o maiuscolo) Filtri di stemming per eliminare le varianti delle parole Diminuisce l elenco delle parole Aumenta l elenco dei risultati trovati Non è detto che ci siano più risultati rilevanti Anche se lo stemming non viene usato l utente può usare operatori di troncamento

56 L interpretazione della query Vengono cercate le parole chiave nella lista presente nell archivio del motore di ricerca Viene fatta l intersezione tra le liste di pagine web che contengono le parole chiave Per ridurre i tempi di risposta viene considerata l intersezione delle pagine e non l unione

57 Term frequency TF si basa sul fatto che la frequenza di un termine in un documento è un buon indicatore TF viene calcolato contando quante volte è ripetuta una parola nel documento la lunghezza del documento conta! Infatti TF viene normalizzato (n di parole o byte) termini troppo (o troppo poco) frequenti non sono utili per stabilire la rilevanza di una pagina

58 Term frequency Tecniche di spam per aumentare il TF keyword stuffing: ripetizione di parole chiave testo nascosto: tra tag HTML o di colore non visibile redirezione ad altre pagine page swapping: cambiare il contenuto di una pagina dopo che è stata indicizzata pagine duplicate con contenuto molto simile tra loro doorway e cloaking: pagina di spam al motore di ricerca, pagina reale all utente

59 Term frequency Introduzione Pagine con TF molto alto possono indicare che: il documento è molto corto (una parola) è presente qualche forma di spam Queste anomalie vengono facilmente identificate: pagine con TF troppo alto sono penalizzate Google avvisa gli webmaster dicendo: «Se tentate di spammarci aumentate la possibilità di essere esclusi dai nostri archivi»

60 Inverse document frequency Misura della rilevanza dei termini meno frequenti numero di documenti dell archivio/numero di documenti che contengono la parola chiave termini poco frequenti con IDF alto permettono di restringere l insieme dei documenti rilevanti non è facile spammare l IDF è inutile aggiungere pagine con termini poco frequenti perché non verrebbero cercate è difficile conoscere queste informazioni perché è necessaria una ampia conoscenza del Web

61 Calcolo del TF-IDF TF di ogni termine della ricerca IDF di ogni pagina che contiene il termine TF IDF = t Terms IF t IDF t TF-IDF viene usato dal motore di ricerca per stabilire il ranking dei risultati rilevanti Il calcolo è molto oneroso, quante pagine considerare nel ranking? Sempre per ridurre il tempo richiesto per rispondere a una query: risultati preconfezionati a query molto richieste raccogliere a lato utente le query delle sue ricerche più frequenti

62 La rilevanza del contenuto delle pagine web Ricerca per frasi esatte: la distanza tra le parole di una query viene memorizzata assieme alla pagina il peso dato per effettuare il ranking è segreto Sinonimi: possono essere riconosciuti con dei tesauri aumentano i risultati ma non necessariamente la precisione Google aveva introdotto l operatore

63 La rilevanza del contenuto delle pagine web Link testuali: link testuali significativi vengono considerati nel ranking la loro presenza viene pesata per evitare lo spam Analisi dell URL: vengono analizzate le keyword dell indirizzo non è nota la procedura usata Data dell ultimo aggiornamento

64 La rilevanza del contenuto delle pagine web Valutazione della struttura dei file HTML: i metadati che contengono le informazioni sono soggetti a spam i metadati vengono usati per dire al crawler di non visitare la pagina vengono pesate le parole a seconda del tag in cui sono contenute (i dettagli sono segreti) probabilmente il peso dei tag viene dato usando metodi di machine learning (es. Algoritmi Genetici)

65 La rilevanza del contenuto delle pagine web Spell checking: controllo per proporre all utente risultati presenti negli archivi il suggerimento viene dato proponendo parole chiave maggiormente cercate Ricerche simili e suggerimenti: vengono proposte grazie a tecniche di mining nei log delle ricerche un terzo degli utenti si lascia suggerire derivazione di concetti simili: utilizzo di dizionari di concetti costruiti offline vettore di termini in relazione tra loro costruito durante il crawling i termini dei primi risultati contenuti nel vettore di termini vengono usati per costruire i risultati simili frasi simili vengono generate usando i log del motore di ricerca i risultati simili vengono confrontati con i risultati originali per produrre una lista di concetti simili

66 Metriche Link-based Cosa differenzia il Web da una semplice collezione di documenti? I link che permettono di navigare il Web Se A linka B, significa che A raccomanda B Google interpreta i link come voti Possono essere interpretati come citazioni Numero di link per stabilire l autorevolezza e l importanza di una pagina

67 Metriche Link-based Google considera come metrica una normalizzazione del numero di link Problema dei link fake a una pagina Non viene semplicemente contato il numero di link in entrata Viene considerata l autorevolezza delle pagine che linkano Questo metodo per stabilire la qualità di una pagina è indipendente dalla query dell utente

68 Metriche Link-based Link analysis e rilevanza del contenuto obiettivo: ottenere il ranking finale delle pagine analisi dei link entranti a una pagina web calcolo del valore TF-IDF combinazione delle due metriche (il metodo è segreto)

69 PageRank Intuitivamente, rappresenta la probabilità che un utente ha di navigare una pagina web PageRank viene calcolato dal crawler mentre naviga le pagine I link uscenti da una pagina vengono scelti con probabilità uniforme Se non ci sono link uscenti o sono presenti loop si usa il teletrasporto (con una determinata probabilità) E proporzionato al tempo medio che un utente potrebbe passare su una pagina Viene calcolato offline (indipendente dalla query)

70 Altri metodi di PageRank Calcolo online con metodi di cash, credit history e cash flow (equivalente a PageRank con crawl sufficientemente lunghi) Metodi Monte Carlo: rank come numero di random walk che terminano in una pagina / numero totale di random walk (può essere aggiornato continuamente) Hyperlink-induced Topic search: nozione di pagine hub, pagine buone sono linkate da hub Approcci stocastici: combinano metodi Monte Carlo con le nozioni di hub e autorevolezza

71 PageRank e le nuove pagine web Vecchie pagine con più link entranti hanno PageRank maggiore Nuove pagine hanno difficoltà a migliorare il proprio ranking (Facebook è comunque un controesempio eccellente) Una possibilità è di aumentare il PageRank di alcune nuove pagine per promuovere la loro visibilità

72 Fonti di spam Link prodotti all interno di una community Link prodotti da blog (google bomb) Link farm Per evitare lo spamming può essere usato il TrustRank

73 Metriche basate sulla popolarità Tenere traccia di quanto vengono cliccate le pagine web Mediando su molti utenti si ottiene una metrica sulla popolarità La popolarità è una metrica in cui una comunità influisce sul singolo individuo La popolarità è soggetta a spam La popolarità è autorinforzante popolarità dipendente dall età della pagina E statisticamente significativa solo per query popolari

74 Metriche basate sulla popolarità Altre possibilità: tenere traccia del giudizio degli utenti considerare l importanza delle keyword nella query metodi di clustering e machine learning per il ranking uso di reti neurali per il ranking: RankNet

75 BrowseRank PageRank non approssima la reale navigazione degli utenti BrowseRank usa metriche e statistiche che si basano sul comportamento degli utenti BrowseRank può migliorare le performance di un motore di ricerca BrowseRank non è soggetto a spam come PageRank

76 Altri studi I motori di ricerca usano diverse misure e metriche per migliorare le loro performance Es. HeatMap e Eyetracking

77 Come guadagnano i motori di ricerca? Paid inclusion: non influenza il ranking ma le nuove pagine compaiono subito tra i risultati Banner ads: pagamento in funzione delle visualizzazioni (banner blindness) Link sponsorizzati: risultati non organici (pay per click) Behavioral targeting e contextual targeting (pubblicità in funzione delle query. E la privacy?) Click fraud e advertising fraud (da due punti di vista) Il concetto di click-through rate e Google AdSense

78 Outline Introduzione 1 Introduzione

79 Google Analytics Introduzione Google Analytics

80 Outline Introduzione 1 Introduzione

81 Tecniche di link building Directory links: Inserire i propri link in una directory è il metodo più facile per avere dei link di ritorno al proprio sito web I link vanno inseriti nella categoria appropriata per mantenerne la rilevanza I link nelle directory sono duraturi I link delle directory aiutano a migliorare il ranking Attenzione!

82 Tecniche di link building Article links: Sono link contestuali Gli article link normalmente sono unidirezionali Google assegna alta priorità a questi link Sono utili per generare traffico

83 Tecniche di link building Social bookmarking links: Metodo molto efficiente per costruire link unidirezionali verso il sito web I link dei social network vengono indicizzati velocemente dai motori di ricerca Sono link che possono generare molto traffico

84 Tecniche di link building Forum links: Sono link ad alta priorità per i motori di ricerca Rappresentano un modo molto semplice per rendere popolare un sito web Vengono riconosciuti dai motori di ricerca Sono utili per generare traffico Sono link unidirezionali e permanenti

85 Tecniche di link building Blog comment links: I link ai blog incrementano in page ranking Portano traffico diretto al sito web Rendono il sito web più visibile Sono link organici unidirezionali

86 Tecniche di link building Link wheel: Sono una combinazione di contenuti, link unidirezionali e pubblicità sui social media E uno dei metodi più potenti per creare link di ritorno verso un sito web Hanno effetto diretto sul ranking Generano dei link contestuali e generano traffico

87 Tecniche di link building Press release distribution, Hubpage e Squidoo: Press release è una piattaforma di pubblicità per i siti web Hubpage e Squidoo permettono l interazione con comunità di utenti Vengono generati authority links I link sono diretti Sono link altamente indicizzati dai motori di ricerca

88 Tecniche per migliorare il crawling I siti web vengono esplorati e indicizzati prima di comparire tra i risultati di un motore di ricerca: Lo spider di un motore di ricerca scopre la pagina Il motore di ricerca decide se inserire nel proprio indice la pagina Il contenuto viene messo nell indice appropriato Se il contenuto è rilevante (secondo gli algoritmi del motore di ricerca) allora viene visualizzato tra i risultati

89 Tecniche per migliorare il crawling I motori di ricerca esplorano in continuazione il Web: In generale i contenuti vengono identificati tramite link, ma è anche possibile sottomettere manualmente gli URL E possibile bloccare il crawling di alcune pagine E buona norma avere un architettura del sito che faciliti il crawling (sitemaps) Assicurarsi che i crawler non visitino duplicati delle pagine

90 Tecniche per migliorare il crawling Migliorare l efficienza del crawling: Puntare più link interni alle pagine più importanti del sito Avere link esterni Usare l attributo nofollow per prevenire il crawling Aggiornare spesso i contenuti Aggiungere una mappa del sito Monitorare le statistiche del crawling (Google Webmaster Tools)

Guida avanzata al web marketing

Guida avanzata al web marketing SEO e SEM Guida avanzata al web marketing Black Hat SEO Marco Maltraversi I motori di ricerca, le directory e l influenza dei social network >> SEO e SEM per un web marketing veramente efficace >> Abilità

Dettagli

Per siti più strutturati le informazioni sono mantenute mediante particolari organizzazioni di dati: human-powered directories

Per siti più strutturati le informazioni sono mantenute mediante particolari organizzazioni di dati: human-powered directories Motori di ricerca Search Non confondiamo i motori di ricerca (search engine) con le funzioni di ricerca all interno dei siti. Le funzioni di ricerca all interno sono in genere costituite da script che

Dettagli

SEMINARIO. Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista. Di Marco Alessia

SEMINARIO. Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista. Di Marco Alessia SEMINARIO Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista Di Marco Alessia ARGOMENTI TRATTATI Saranno affrontati separatamente due diversi argomenti, fondamentali per la realizzazione di

Dettagli

10 ingredienti da tenere sempre in cucina ovvero,

10 ingredienti da tenere sempre in cucina ovvero, 10 ingredienti da tenere sempre in cucina ovvero, la SEO Checklist per andare a cena con Google Licenza Creative Commons - Non commerciale - Non opere derivate 3.0 Unported (CC BY-NC-ND 3.0) introduzione

Dettagli

Ringraziamenti. Seo: un mondo da scoprire 3

Ringraziamenti. Seo: un mondo da scoprire 3 Sommario Ringraziamenti XIII prefazione di nereo sciutto introduzione 1 XV Seo: un mondo da scoprire 3 Breve introduzione ai motori di ricerca 3 Il posizionamento nei motori di ricerca 4 Oltre i motori

Dettagli

I 200 Parametri dell'algoritmo di Google. Ecco elecanti i 200 parametri che google usa per valutare il ranking di un sito web.

I 200 Parametri dell'algoritmo di Google. Ecco elecanti i 200 parametri che google usa per valutare il ranking di un sito web. 1 2 I 200 Parametri dell'algoritmo di Google Ecco elecanti i 200 parametri che google usa per valutare il ranking di un sito web. DOMINIO 13 Parametri: Età del Dominio; Tempo di registrazione del Dominio;

Dettagli

Tassonomia Web Spam GIUGNO 2005

Tassonomia Web Spam GIUGNO 2005 Prefazione: Questo documento si basa sull originale Web Spam Taxonomy firmato da alcuni ricercatori del dipartimento di Computer Science della Stanford University e pubblicato ad Aprile 2005. Tassonomia

Dettagli

Tecniche di web marketing

Tecniche di web marketing Tecniche di web marketing Le tecniche Promotion Marketing Online S.E.M. Email Marketing Contextual Advertising Advergame 2/27 3/27 Promotion Marketing Online Riguarda la promozione dell'immagine dell'azienda

Dettagli

Introduzione E. TINELLI LTW A. A. 2011-2012

Introduzione E. TINELLI LTW A. A. 2011-2012 Corso di Laurea Specialistica in Ingegneria Informatica Corso di Linguaggi e Tecnologie Web A. A. 2011-2012 Web Information Retrieval Eufemia TINELLI Introduzione Per Web information Retrieval si intende

Dettagli

Roberto Musa Consulenze Informatiche. P.IVA 03348400924 Via Sac. Lampis, 6 09031 Arbus (VS) Tel. 3495135913 E-mail: info@robertomusa.

Roberto Musa Consulenze Informatiche. P.IVA 03348400924 Via Sac. Lampis, 6 09031 Arbus (VS) Tel. 3495135913 E-mail: info@robertomusa. Il SEO (Search Engine Optimizing) è un attività atta a dar visibilità ad un sito che sta guadagnando negli ultimi anni sempre maggior risalto nelle strategie di web marketing delle aziende. Avere il sito

Dettagli

Strumenti per la promozione online

Strumenti per la promozione online 1 Strumenti per la promozione online Giovanni Randazzo giovanni.randazzo@gmail.com Incontro 1 10 aprile 2013 aprile 3, 2013 2 Programma Incontro 1 10 aprile 17:30-21:00 Incontro 2 17 aprile 17:30-21:00

Dettagli

PUNTA IN ALTO! Guida al posizionamento sui motori di ricerca

PUNTA IN ALTO! Guida al posizionamento sui motori di ricerca PUNTA IN ALTO! Guida al posizionamento sui motori di ricerca Register.it - Guida al posizionamento sui motori di ricerca GUIDA AL POSIZIONAMENTO SUI MOTORI DI RICERCA La guida al posizionamento, realizzata

Dettagli

WEB. Visibilita' sul web. Gabriele Murara

WEB. Visibilita' sul web. Gabriele Murara WEB Visibilita' sul web Gabriele Murara 1 Definizione Visibilità sul web: posizionamento di un sito internet tra i primi posti nei risultati di un motore di ricerca. Rappresenta la più intelligente forma

Dettagli

PageRank Formula semplificata

PageRank Formula semplificata PageRank Formula semplificata Dove: PR[A] è il valore di PageRank della pagina A che vogliamo calcolare. N è il numero totale di pagine note. n è il numero di pagine che contengono almeno un link verso

Dettagli

Indicazioni pratiche per realizzare una campagna marketing digitale

Indicazioni pratiche per realizzare una campagna marketing digitale Indicazioni pratiche per realizzare una campagna marketing digitale La fase strategia SEO: la scelta delle keyword Questa fase è fondamentale, qualunque attività SEO risulta essere priva di senso se non

Dettagli

@Giusi Castagnetta tutti i diritti riservati. Seo e contenuti video

@Giusi Castagnetta tutti i diritti riservati. Seo e contenuti video @Giusi Castagnetta tutti i diritti riservati Seo e contenuti video SEO facile Quando cerchiamo qualcosa sui motori di ricerca, ci aspettiamo di trovare per primi i risultati migliori, cioè quelli più pertinenti

Dettagli

browser Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero

browser Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 7. Ricerca delle informazioni in rete, browsers, portali, motori di ricerca browser Un browser è un programma

Dettagli

La formula matematicha segreta utilizzata dai motori di ricerca per calcolare il ranking di un sito web per un dato termine di ricerca.

La formula matematicha segreta utilizzata dai motori di ricerca per calcolare il ranking di un sito web per un dato termine di ricerca. Algoritmo La formula matematicha segreta utilizzata dai motori di ricerca per calcolare il ranking di un sito web per un dato termine di ricerca. Attributo alt o 'alt text' Un attributo HTML che può essere

Dettagli

Search Engine Optimization per Calciomercato.it

Search Engine Optimization per Calciomercato.it www.mamadigital.com Search Engine Optimization per Calciomercato.it Mamadigital srl - Sede legale e operativa: Via Conegliano, 18-00182 Roma C.F. e P. iva 09738901009 Phone: +39 0670614560 Fax: +39 0670391132

Dettagli

Marketing editoriale e intermedialità Corso di Laurea in Com. Digitale - Università degli Studi di Milano

Marketing editoriale e intermedialità Corso di Laurea in Com. Digitale - Università degli Studi di Milano INDICE 1. I MOTORI DI RICERCA Differenze tra motori di ricerca e directory Come funziona un motore di ricerca Il Google PageRank 2. SEM E SEO Search Engine Marketing Search Engine Optimization La campagna

Dettagli

WEB Information Retrieval

WEB Information Retrieval WEB Information Retrieval Materiale tratto dal corso di Gabriella Pasi Materiale tratto da cap. 13 Modern Information Retrieval by Ricardo Baeza-Yates and Berthier Ribeiro-Neto http://www.sims.berkeley.edu/~hearst/irbook/

Dettagli

Documento dimostrativo versione : 8 luglio 2015

Documento dimostrativo versione : 8 luglio 2015 Pagina 1 Di 18 Report S.E.O. Il seguente report contiene l'analisi di presenza online e i suggerimenti per conseguire un miglioramento del posizionamento sui motori di ricerca e della visibilità del sito.

Dettagli

Motori di ricerca. Reti e Web. Motori di ricerca. Motori di ricerca - Interfaccia. Motori di ricerca

Motori di ricerca. Reti e Web. Motori di ricerca. Motori di ricerca - Interfaccia. Motori di ricerca Reti e Web Si stima vi siano almeno 13 miliardi di pagine Web Sistemi per la ricerca e la catalogazione delle pagine Web motori di ricerca (Google, Yahoo!, Bing,...) cataloghi sistematici (Yahoo! directory)

Dettagli

INFORMATICA MUSICALE. Docente. Renato Caruso

INFORMATICA MUSICALE. Docente. Renato Caruso INFORMATICA MUSICALE Docente Renato Caruso SEO: INTRO Spesso Internet è sinonimo di Google Spesso Internet è sinonimo di Facebook Spesso Computer è sinonimo di Facebook A cosa mi serve un portatile? C

Dettagli

POSIZIONAMENTO sui MOTORI di RICERCA. Linee guida aziendali

POSIZIONAMENTO sui MOTORI di RICERCA. Linee guida aziendali POSIZIONAMENTO sui MOTORI di RICERCA Linee guida aziendali 3 LIVELLI di OTTIMIZZAZIONE LIVELLO A ottimizzazioni da fare per tutti i lavori web della J- Service. Parole chiave date dal cliente o estrapolate

Dettagli

Indice generale. Parte I Il negozio... 1. Introduzione...xv. Capitolo 1 L e-commerce... 3

Indice generale. Parte I Il negozio... 1. Introduzione...xv. Capitolo 1 L e-commerce... 3 Introduzione...xv A chi può essere utile...xv A cosa può servire...xv Tredici capitoli e altrettanti buoni motivi per leggere questo libro...xvi Parte I Il negozio...xvi Parte II Il marketing...xvi Ringraziamenti...xvii

Dettagli

Come migliorare la propria visibilità online

Come migliorare la propria visibilità online Come migliorare la propria visibilità online 26 marzo 2012 Sala Anfiteatro Dipartimento Tecnologie Innovative SUPSI, Manno Giovanni Randazzo giovanni.randazzo@gmail.com Agenda Perché dovrei investire sul

Dettagli

Webinar. Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca

Webinar. Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Webinar Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Webinar Usabilità a parole: valorizzare i contenuti delle PA per i motori di ricerca Scenario Scenario: I risultati

Dettagli

POR Regione Campania 2000-2006 Misura 3.14. Promozione della partecipazione Femminile al Mercato del Lavoro. Dispensa

POR Regione Campania 2000-2006 Misura 3.14. Promozione della partecipazione Femminile al Mercato del Lavoro. Dispensa DISPENSA I.C.T. POR Regione Campania 2000-2006 Misura 3.14 Promozione della partecipazione Femminile al Mercato del Lavoro Dispensa IL SEARCH ENGINE RANKING, PER CONQUISTARE LA PRIMA PAGINA DEI MOTORI

Dettagli

Guida base al posizionamento nei motori di ricerca

Guida base al posizionamento nei motori di ricerca Guida base al posizionamento nei motori di ricerca Indice: > Panoramica sul posizionamento. > Google > Analizzare i competitors > Analizzare le keywords > Ottimizzare un sito per i motori di ricerca >

Dettagli

Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet

Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet Social Media Marketing: Facebook, Google Plus e Twitter Creato by Stefano Basso il 21 aprile 2014 su comeguadagnareconinternet Il Social Media Marketing è strettamente correlato al SEO (Search Engine Optimization).

Dettagli

Prato cresce con il digitale. Migliorare la propria posizione sul web

Prato cresce con il digitale. Migliorare la propria posizione sul web Prato cresce con il digitale Migliorare la propria posizione sul web Prato cresce con il digitale Come rendere il sito visibile dai motori di ricerca Programma 1. 2. 3. 4. 5. 6. 7. Cos'è una SERP Cosa

Dettagli

WWW.ICTIME.ORG. Introduzione al SEO. Cimini Simonelli Testa

WWW.ICTIME.ORG. Introduzione al SEO. Cimini Simonelli Testa WWW.ICTIME.ORG Introduzione al SEO Cimini Simonelli Testa v.1 28 Gennaio 2008 Cecilia Cimini Angelo Simonelli Francesco Testa Introduzione al SEO EDIZIONE Gennaio 2008 Questo manuale utilizza la Creative

Dettagli

WEB WRITING PER I MOTORI DI RICERCA. Alberto Rota Ariadne Srl

WEB WRITING PER I MOTORI DI RICERCA. Alberto Rota Ariadne Srl WEB WRITING PER I MOTORI DI RICERCA Alberto Rota Ariadne Srl Cosa vedremo oggi Un po di definizioni e una introduzione al funzionamento della ricerca Come Google è cambiato nel tempo Come Google raccoglie

Dettagli

SEO: le fondamenta del marketing digitale

SEO: le fondamenta del marketing digitale SEO: le fondamenta del marketing digitale e-book a cura di Andrea Roversi, Note introduttive Alleghiamo in questo e-book alcuni principi guida legati al SEO (Search Engine Optimization). Lo sviluppo accurato

Dettagli

Search Engine Spam. Introduzione ed elementi di base

Search Engine Spam. Introduzione ed elementi di base UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II FACOLTÀ DI SOCIOLOGIA - CORSO DI LAUREA IN CULTURE DIGITALI E DELLA COMUNICAZIONE Search Engine Spam Introduzione ed elementi di base Elementi di informatica

Dettagli

Reti complesse Ranking

Reti complesse Ranking Reti complesse Ranking dellamico@disi.unige.it Applicazioni di rete 2 A.A. 2006-07 Outline 1 Ricerca sul web Ranking 2 L'ago nel pagliaio Ricerca sul web Ranking Immaginiamo di avere una biblioteca con

Dettagli

Sistemi Web! per il turismo! - lezione 9 -

Sistemi Web! per il turismo! - lezione 9 - Sistemi Web per il turismo - lezione 9 - I siti Web per il turismo Come li scopriamo sul Web? Negli esercizi in classe delle lezioni precedenti, come hanno gli studenti selezionato i siti Web da analizzare?

Dettagli

Motori di ricerca e Directory

Motori di ricerca e Directory Motori di ricerca e Directory Relatore: Andrea Baioni (abaioni@andreabaioni.it) Utilizzo dei Motori di Ricerca il 93% degli italiani online ritiene i motori di ricerca lo strumento più efficace per cercare

Dettagli

Il PageRank è obsoleto? Via libera al TrustRank

Il PageRank è obsoleto? Via libera al TrustRank Il PageRank è obsoleto? Via libera al TrustRank Prefazione: Questo documento si basa sull originale Combating web spam with TrustRank firmato da alcuni ricercatori del dipartimento di Computer Science

Dettagli

Guida avanzata al Web Marketing

Guida avanzata al Web Marketing SEO e SEM Guida avanzata al Web Marketing Marco Maltraversi bestseller 2 a edizione SEO Semantica: Microdati, Rich Snippets e Authorship Markup >> Abilità e trucchi Black Hat SEO: come scalare le classifiche

Dettagli

SOMMARIO. Ringraziamenti. Seo: un mondo da scoprire 1

SOMMARIO. Ringraziamenti. Seo: un mondo da scoprire 1 SOMMARIO Ringraziamenti PREFAZIONE DI ENRICO MADRIGRANO INTRODUZIONE DI COSMANO LOMBARDO XVII XIX XXI Seo: un mondo da scoprire 1 SEO Power seconda edizione: perché? 1 Breve introduzione ai motori di ricerca

Dettagli

Search Marketing. Un investimento misurato dalla pianificazione al ritorno. Luigi Sciolti

Search Marketing. Un investimento misurato dalla pianificazione al ritorno. Luigi Sciolti Search Marketing Un investimento misurato dalla pianificazione al ritorno. Luigi Sciolti 1 About us Luigi Sciolti: Consulente Web Marketing Web Designer e Web Developer Fondatore di UP Vision. UP Vision:

Dettagli

INFORMATION & COMMUNICATION TECHNOLOGY

INFORMATION & COMMUNICATION TECHNOLOGY GRAFICA PER IL WEB VIDEO PER IL WEB WEB COPYWRITING WEB ANALYTICS OTTIMIZZAZIONE E POSIZIONAMENTO SEO SEARCH MARKETING: CAMPAGNE E STUMENTI SEM FARE BUSINESS CON FACEBOOK STRATEGIE LINKEDIN PER L AZIENDA

Dettagli

Indicizzazione. Fasi del processo di IR. Indicizzazione: due aspetti. Corpus: Costruzione delle viste logiche dei documenti: Termine indice

Indicizzazione. Fasi del processo di IR. Indicizzazione: due aspetti. Corpus: Costruzione delle viste logiche dei documenti: Termine indice Fasi del processo di IR Indicizzazione Information need text input Pre-process documents Parse Query Index Rank Indicizzazione: due aspetti Costruzione delle viste logiche dei documenti: Per ogni documento

Dettagli

Ruolo di Internet per il. Territoriale

Ruolo di Internet per il. Territoriale 1 Ruolo di Internet per il Turismo ed Il Marketing Territoriale Mauro di Giacomo (Ares 2.0) Gargano Ottobre 2011 Secondo tutte le evidenze, il turismo e la promozione territoriale è stato uno dei settori

Dettagli

BASE STANDARD PREMIER. PREZZO 400 / mese 1000 / mese 2500 / mese SEO (SEARCH ENGINE OPTIMIZATION)

BASE STANDARD PREMIER. PREZZO 400 / mese 1000 / mese 2500 / mese SEO (SEARCH ENGINE OPTIMIZATION) BASE STANDARD PREMIER PREZZO 400 / mese 1000 / mese 2500 / mese SEO (SEARCH ENGINE OPTIMIZATION) PREVIA ANALISI SEO INTERNO Numero di parole, frasi, keyword o criteri di ricerca consigliati per ciascun

Dettagli

I MOTORI DI RICERCA (II Parte)

I MOTORI DI RICERCA (II Parte) I MOTORI DI RICERCA (II Parte) Ottimizzazione di un sito web (ricapitolazione I Parte) Per ottimizzazione di un sito web si intende quel processo indispensabile grazie al quale si rende appetibile ai motori

Dettagli

Servizi di ricerca nel Web (Web search)

Servizi di ricerca nel Web (Web search) Servizi di ricerca nel Web (Web search) Generalità Introduzione Il web è il più grande database mondiali di contenuti. É un contenitore di informazioni che vengono pubblicate, modificate, cancellate, inserite

Dettagli

www.andreabaioni.it Il SEO non è magia SEO è analisi e lavoro quotidiano Strategie e strumenti per il posizionamento sui motori di ricerca

www.andreabaioni.it Il SEO non è magia SEO è analisi e lavoro quotidiano Strategie e strumenti per il posizionamento sui motori di ricerca Strategie e strumenti per il posizionamento sui motori di ricerca Relatore:Andrea Baioni abaioni@andreabaioni.it Il SEO non è magia I motori di ricerca sono sempre più attenti alle dinamiche umane dei

Dettagli

Breve descrizione del prodotto

Breve descrizione del prodotto Breve descrizione del prodotto 1. Il software AquaBrowser Library...2 1.1 Le funzioni di Search Discover Refine...3 1.2 Search: la funzione di ricerca e di presentazione dei risultati...3 1.2.1 La configurazione

Dettagli

La vetrina sul mondo

La vetrina sul mondo web marketing Paolo C. Pomi paolo@litrosoft.com http://litrosoft.com La vetrina sul mondo promozione:perfarconoscere per il brand e-commerce: per vendere i prodotti contenuti: per divulgare contenuti servizio:

Dettagli

I MOTORI DI RICERCA (I Parte)

I MOTORI DI RICERCA (I Parte) Introduzione I MOTORI DI RICERCA (I Parte) Una delle cose più incredibili che possiamo affermare riguardo ad Internet è che possiamo trovarci veramente di tutto. Qualsiasi argomento che ci viene in mente

Dettagli

Uno sguardo a Lucene. Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011

Uno sguardo a Lucene. Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011 Uno sguardo a Lucene Diego De Cao, Roberto Basili Web Mining and Information Retrieval a.a. 2010/2011 Outline Uno sguardo a Lucene Descrizione delle principali caratteristiche Realizzazione di un semplice

Dettagli

Importanza dei Motori di Ricerca

Importanza dei Motori di Ricerca Importanza dei Motori di Ricerca Milano - 19 novembre 2012 Francesca Savoca Sales Account Search Engine Marketing Online Advertising Social Media Agenda 1/2 L importanza dei Motori di Ricerca Strumenti

Dettagli

Search Engine Optimization (SEO) up-grade ottobre 2013

Search Engine Optimization (SEO) up-grade ottobre 2013 marketing highlights Search Engine Optimization (SEO) up-grade ottobre 2013 A cura di: dott. Fabio Pinello dott. Dario Valentino La Search Engine Optimization (SEO) individua le attività da mettere in

Dettagli

SEM e SEO Internet studies, 2013/2014 Emmanuel Mazzucchi e Francesca Comunello

SEM e SEO Internet studies, 2013/2014 Emmanuel Mazzucchi e Francesca Comunello SEM e SEO Internet studies, 2013/2014 Emmanuel Mazzucchi e Francesca Comunello Search marketing Selezionare per scrivere o eliminare il sottotitolo Vantaggi: - Alta profilazione utenti (parole chiave;

Dettagli

Audioblog Blog i cui post sono prevalentemente vocali inviati spesso insieme a SMS da cellulari.

Audioblog Blog i cui post sono prevalentemente vocali inviati spesso insieme a SMS da cellulari. @/blog 1/5 Audioblog Blog i cui post sono prevalentemente vocali inviati spesso insieme a SMS da cellulari. Blog (o Web log) Il termine blog è la contrazione di web log, ovvero "traccia sulla rete". Il

Dettagli

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG

PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG PRESENTAZIONE N #9 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG 16 gennaio 2015 OLTRE LA SCRITTURA: IL COMPORTAMENTO NELLA RETE SUI BLOG Introduzione Le attività dei blogger I social influencer

Dettagli

L'algoritmo di Google rivelato

L'algoritmo di Google rivelato L algoritmo di ranking di Google rivelato pag. 1 L'algoritmo di Google rivelato () L algoritmo di ranking di Google rivelato pag. 2 A scanso di equivoci, vorrei fare una premessa. Prima di tutto nessun

Dettagli

CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE

CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE CONVERGENZE TRA ACCESSIBILITÀ, STANDARD E VISIBILITÀ NELLA RETE CONSIGLI E STRUMENTI UTILI PER LA PROMOZIONE A cura di Massimiliano Navacchia http://www.navacchia.it/ info@navacchia.it - cell. (+39) 3394676518

Dettagli

PROGETTI DISPONIBILI IL CORSO DI PROGETTO DI RETI E SISTEMI INFORMATICI

PROGETTI DISPONIBILI IL CORSO DI PROGETTO DI RETI E SISTEMI INFORMATICI PROGETTI DISPONIBILI IL CORSO DI PROGETTO DI RETI E SISTEMI INFORMATICI 1 Web Link Monitor... 2 2 Database Browser... 4 3 Network Monitor... 5 4 Ghost Site... 7 5 Copy Search... 9 6 Remote Audio Video

Dettagli

Indice. Prefazione Introduzione. Parte prima - Progettazione di un sito web 1

Indice. Prefazione Introduzione. Parte prima - Progettazione di un sito web 1 Indice Prefazione Introduzione XIII XV Parte prima - Progettazione di un sito web 1 Capitolo 1 Analisi dei requisiti 4 1.1 Introduzione 4 1.2 Tipologia dei requisiti del sito 5 1.2.1 Requisiti di architettura

Dettagli

Un po di storia: la rete

Un po di storia: la rete Gabriella Pasi Università degli Studi di Milano Bicocca Il Web e i Motori di ricerca Un po di storia: la rete Metà degli anni 60: nasce ARPANET Fine anni 60: standardizzazione dei protocolli Anni 70: la

Dettagli

Informatica per la comunicazione" - lezione 10 -

Informatica per la comunicazione - lezione 10 - Informatica per la comunicazione" - lezione 10 - Pagine dinamiche L accesso a una pagina web può innescare l esecuzione di programmi, ad esempio per eseguire la prenotazione di un biglie8o aereo Ques:

Dettagli

Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web

Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web Rapporto tecnico contenente la selezione dei dataset per l addestramento e la convalida del caso di studio relativo all analisi web 16 febbraio 2015 Indice 1 Individuazione dei dataset 1 2 Dataset Repositories

Dettagli

La gestione del documento

La gestione del documento Operatore giuridico d impresa Informatica Giuridica A.A 2002/2003 II Semestre La gestione del documento prof. Monica Palmirani Il documento A differenza del dato il documento è solitamente un oggetto non

Dettagli

Pedigree Documentazione aggiuntiva Corso di reperimento dell informazione a.a. 2005/2006 prof.sa Maristella Agosti

Pedigree Documentazione aggiuntiva Corso di reperimento dell informazione a.a. 2005/2006 prof.sa Maristella Agosti Pedigree Documentazione aggiuntiva Corso di reperimento dell informazione a.a. 25/26 prof.sa Maristella Agosti Argenton Matteo Buzzi Lorenzo Gatto Giorgio Molinaro Matteo Zorzan Emmanuele Prestazioni

Dettagli

Analisi sito web laducalemanagement.com

Analisi sito web laducalemanagement.com Analisi sito web laducalemanagement.com Generato il Maggio 11 2016 16:12 PM Il punteggio e 39/100 SEO Content Title LA DUCALE MANAGEMENT & PROMOTION S.C.R.L. di Emanuele Barbè Via Cararola 56 27029 VI

Dettagli

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web Il World Wide Web Il Web Claudio Fornaro ver. 1.3 1 Il World Wide Web (ragnatela di estensione mondiale) o WWW o Web è un sistema di documenti ipertestuali collegati tra loro attraverso Internet Attraverso

Dettagli

Copyright 2013 - CircleCap

Copyright 2013 - CircleCap SEO: checos'è? SEO è l acronimo inglese di «SearchEngine Optimization», che tradotto in italiano significa «Ottimizzazione (sui) motori di ricerca», cioè l insieme delle attività atte ad ottimizzare un

Dettagli

Search engine best practices

Search engine best practices 1 Search engine best practices Un giorno le macchine riusciranno a risolvere tutti i problemi, ma mai nessuna di esse potrà porne uno. [Albert Einstein] A cura di Leonardo Bellini Digital Marketing Lab

Dettagli

Free SEO Checkup - SqueezeMind.it

Free SEO Checkup - SqueezeMind.it Free SEO Checkup - SqueezeMind.it Pre-Analisi SEO Gratuita per http://www.larius.eu Report Checkup Durante l'analisi abbiamo rilevato: 19 errori gravi 3 errori 12 test corretti Tag Title Il tag title è

Dettagli

Posizionamento nei motori di ricerca

Posizionamento nei motori di ricerca Posizionamento nei motori di ricerca (Introduzione alla SEO 2012 Parte 1) Federico Andrioli Cos'è la SEO? (Search Engine Optimization) Primi nella SERP La pagina di un motore di ricerca con l'elenco

Dettagli

Presentazione Servizio SEO

Presentazione Servizio SEO Presentazione Servizio SEO SEO Search Engine Optimization Introduzione al servizio Il servizio è finalizzato a creare visibilità sui principali motori di ricerca per parole chiave rilevanti coi contenuti

Dettagli

Esempio Cookie Policy

Esempio Cookie Policy Esempio Cookie Policy INFORMATIVA ESTESA SULL USO DEI COOKIE Uso dei cookie cascinaladoria.it o il Sito utilizza i Cookie per rendere i propri servizi semplici e efficienti per l utenza che visiona le

Dettagli

WEB MARKETING. Indicizzazione nei motori di ricerca. SCHEDA PRODOTTO Versione 1.1

WEB MARKETING. Indicizzazione nei motori di ricerca. SCHEDA PRODOTTO Versione 1.1 WEB MARKETING nei motori di ricerca SCHEDA PRODOTTO Versione 1.1 1 1. INTRODUZIONE I motori di ricerca sono la funzione più utilizzata sul web e sono secondi solo alla posta elettronica nella lista delle

Dettagli

Navigazione. per associazione. ipertesti/ipermedia. l utente naviga nello spazio dei documenti alla ricerca dei nodi di interesse

Navigazione. per associazione. ipertesti/ipermedia. l utente naviga nello spazio dei documenti alla ricerca dei nodi di interesse Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 5. Database e Information Retrieval per associazione Navigazione ipertesti/ipermedia l utente naviga nello spazio

Dettagli

Lezione 8. Motori di Ricerca

Lezione 8. Motori di Ricerca Lezione 8 Motori di Ricerca Basi di dati Un campo prevalente dell applicazione informatica è quello costituito dall archiviazione e dalla gestione dei dati (basi di dati). Sistema Informativo. Un sistema

Dettagli

Search Engine Optimization: come valutare le esigenze?!

Search Engine Optimization: come valutare le esigenze?! Search Engine Optimization: come valutare le esigenze? Questa guida vuole fornirti un quadro riassuntivo dei passaggi da fare per valutare la seo di un sito web. Il primo passo per realizzare una strategia

Dettagli

Corso di Web programming Modulo T3 A2 - Web server

Corso di Web programming Modulo T3 A2 - Web server Corso di Web programming Modulo T3 A2 - Web server 1 Prerequisiti Pagine statiche e dinamiche Pagine HTML Server e client Cenni ai database e all SQL 2 1 Introduzione In questa Unità si illustra il concetto

Dettagli

Web marketing per le aziende: L ottimizzazione del sito web per i motori di ricerca

Web marketing per le aziende: L ottimizzazione del sito web per i motori di ricerca Web marketing per le aziende: L ottimizzazione del sito web per i motori di ricerca Tecniche e case study tratto dal settore immobiliare giova.lesa@gmail.com Table of contents 1. Obiettivo. 2. Perché parliamo

Dettagli

La navigazione di profondità

La navigazione di profondità La navigazione di profondità Ovvero: ottenere risultati soddisfacenti nelle ricerche online Marco Gualmini 23 febbraio 2008 Image cropped from: http://commons.wikimedia.org/wiki/image:hmcs_windsor_ssk_877.jpg

Dettagli

Gestione servizio SuperSite Versione 7

Gestione servizio SuperSite Versione 7 Gestione servizio SuperSite Versione 7 Il servizio SuperSite di Aruba, grazie ai vari strumenti messi a disposizione dell utente, consente di creare un sito web personalizzato, in modo facile e veloce.

Dettagli

CORSO GOOGLE ADWORDS

CORSO GOOGLE ADWORDS CORSO GOOGLE ADWORDS Corso: Google AdWords I concetti fondamentali del keyword e display advertising per imparare a creare e gestire campagne pubblicitarie Google AdWords in modo efficace. Argomenti del

Dettagli

Analisi sito web tieloh-bike.de

Analisi sito web tieloh-bike.de Analisi sito web tieloh-bike.de Generato il Agosto 03 2015 14:46 PM Il punteggio e 34/100 SEO Content Title tieloh-bike Lunghezza : 11 Perfetto, il tuo title contiene tra 10 e 70 caratteri. Description

Dettagli

Corso di Sistemi di Elaborazione delle informazioni

Corso di Sistemi di Elaborazione delle informazioni Corso di Sistemi di Elaborazione delle informazioni Reti di Calcolatori Francesco Fontanella Il DNS Gli indirizzi IP sono in formato numerico: sono difficili da ricordare; Ricordare delle stringhe di testo

Dettagli

Motori di ricerca. Andrea Marin

Motori di ricerca. Andrea Marin Andrea Marin Università Ca Foscari Venezia SVILUPPO INTERCULTURALE DEI SISTEMI TURISTICI SISTEMI INFORMATIVI E TECNOLOGIE WEB PER IL TURISMO - 1 a.a. 2012/2013 Section 1 Information Retrieval e Motori

Dettagli

A cura di: Ronnie Pavani. Resp. Web Marketing & S.e.o. TITANKA! Spa

A cura di: Ronnie Pavani. Resp. Web Marketing & S.e.o. TITANKA! Spa A cura di: Ronnie Pavani Resp. Web Marketing & S.e.o. TITANKA! Spa BE-Wizard! Academy - Roma 31 gennaio 2012 I fondamentali dell ottimizzazione La struttura piramidale del sito La struttura piramidale

Dettagli

Privacy e motori di ricerca

Privacy e motori di ricerca E privacy 26 Firenze, 2 maggio Privacy e motori di ricerca La minaccia fantasma Claudio Agosti vecna@sikurezza.org http://www.sftpj.org Questo documento è distribuito sotto la licenza Gnu GPL 2 1 Copyright

Dettagli

SPORTLANDIA TRADATE Cookie Policy

SPORTLANDIA TRADATE Cookie Policy SPORTLANDIA TRADATE Cookie Policy Informativa Privacy (art.13 D.Lgs. 196/2003): i dati che i partecipanti al Blog conferiscono all atto della loro iscrizione sono limitati all indirizzo e-mail e sono obbligatori

Dettagli

Parte 7. Ricerca di informazione sul Web e. ! Strumenti per la gestione e ricerca di informazione. " Paradigmi basati su ontologie

Parte 7. Ricerca di informazione sul Web e. ! Strumenti per la gestione e ricerca di informazione.  Paradigmi basati su ontologie Ricerca di informazione sul Web! Strumenti per la gestione e ricerca di informazione " Paradigmi basati su ontologie # Directories gerarchiche " Ricerche per similarità # What s related (Alexa/Netscape)

Dettagli

COOKIES POLICY. 2. Tipologie di Cookies utilizzati da parte del sito www.elleservizi.it e/o delle aziende e dei marchi che ne fanno parte

COOKIES POLICY. 2. Tipologie di Cookies utilizzati da parte del sito www.elleservizi.it e/o delle aziende e dei marchi che ne fanno parte COOKIES POLICY Questa cookies policy contiene le seguenti informazioni : 1. Cosa sono i Cookies. 2. Tipologie di Cookies. 3. Cookies di terze parti. 4. Privacy e Sicurezza sui Cookies. 5. Altre minacce

Dettagli

Percorsi Digital Marketing

Percorsi Digital Marketing Percorsi Digital Marketing Percorsi di di Digital Academy, in area Marketing Luglio 2015 Indice DIGITAL ACADEMY... 3 1 DIGITAL MARKETING ESSENTIALS... 3 2 SOCIAL MEDIA MARKETING... 4 3 SVILUPPARE CONTENUTI

Dettagli

SPECIFICHE STANDARD PER TUTTI I SITI

SPECIFICHE STANDARD PER TUTTI I SITI SPECIFICHE STANDARD PER TUTTI I SITI 1] Modulo SEO Regole generali Il sistema prende i tag di composizione automatica esclusivamente quando non ci sono modifiche manuali ai vari tags Ogni contenuto importante

Dettagli

*** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. ***

*** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. *** *** QUESTO DOCUMENTO E' INCOMPLETO ED IN FASE AMPLIAMENTO CONTINUO. *** PREFAZIONE Questo progetto nasce perchè mi sono reso conto dell'importanza che i motori di ricerca hanno su Internet. Internet rappresenta

Dettagli

Analisi sito web creator.pressreaders.eu

Analisi sito web creator.pressreaders.eu Analisi sito web creator.pressreaders.eu Generato il Dicembre 08 2015 18:52 PM Il punteggio e 51/100 SEO Content Title CREATOR - PRESSREADERS.EU Lunghezza : 25 Perfetto, il tuo title contiene tra 10 e

Dettagli