LARGE SCALE RECOMMENDER SYSTEMS

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "LARGE SCALE RECOMMENDER SYSTEMS"

Transcript

1 Scuola Politecnica e delle Scienze di Base Corso di Laurea in Ingegneria Informatica Elaborato finale in Basi di Dati LARGE SCALE RECOMMENDER SYSTEMS Anno Accademico 2013/2014 Candidato: Domenico Albano matr. N46/1087 1

2 Indice Introduzione 3 1 Recommender Systems Browsing di oggetti multimediali Content Based Filtering Collaborative Filtering Hybrid Filtering 10 2 Modellazione di un oggetto multimediale Cos è un oggetto multimediale Definizioni preliminari Oggetto Multimediale 15 3 Metriche di Similitudine tra oggetti Similitudine nei Recommender Systems Somiglianza basata sulle features Somiglianza basata sulla tassonomia Similarità semantica attraverso le parole Similarità basata sulle features e sulla tassonomia Somiglianza basata sul percorso d esplorazione Indice di similitudine globale 30 Conclusioni 31 Bibliografia 33 2

3 Introduzione La civiltà di oggi è in enorme progresso scientifico e tecnologico. La comunicazione e l interazione tra comunità è a portata di click da quando internet è diventato accessibile a tutti. Con l obbiettivo di facilitare e incrementare l accesso e l utilizzo di grandi archivi multimediali sono stati sviluppati innumerevoli tools e algoritmi. Tali tools, comunemente noti come Recommender Systems, immagazzinano e analizzano dati estrapolando informazione atte a descrivere preferenze e interessi degli utenti, garantendo a questi ultimi utili raccomandazioni. Come sappiamo grandissimi passi avanti si sono fatti nel campo dell informazione e soprattutto in quello del browsing di oggetti multimediali e tuttora studiosi di tutto il mondo si impegnano per garantire agli utenti una navigazione facile, semplice e immediata. È questo l obbiettivo dei Recommender Systems, aiutare l utente nella scelta di un capo d abbigliamento, un accessorio, un elettrodomestico, basandosi sui propri interessi, sfruttando algoritmi e metodi di computazione atti ad individuare il livello di somiglianza tra oggetti. A questo scopo vengono introdotti descrittori, sia di basso che di alto livello, e viene definita una strategia che combina entrambi nel processo di calcolo 3

4 della somiglianza tra una generica coppia di oggetti appartenenti alla collezione multimediale. Inoltre per aiutare ulteriormente la ricerca della similarità si fa affidamento anche sulle esperienze dei precedenti utilizzatori del sistema di navigazione, e quindi dei loro percorsi di ricerca nel database. Questo ultimo principio da un contributo essenziale nella consolidazione dei due precedenti metodi, permettendo di considerare ulteriori fattori per esempio l assistenza all utente nella navigazione proponendogli di visitare oggetti visitati precedentemente da altri utenti. I più grandi siti di E-commerce offrono milioni di prodotti in tutto il mondo tramite il web, ed il continuo svilupparsi e ingigantirsi di questi ha portato il bisogno di sistemi in grado di gestire gli interessi degli utenti ed una grandissima mole di dati in continuo aumento. Pertanto, si parla di Large Scale Recommender Systems ovvero Recommender Systems applicati a siti di E-commerce estremamente grandi. Nei prossimi capitoli parleremo in generale dei Recommender Systems, analizzandoli negli aspetti più pratici, affrontando i temi di Information Retrieval e Browsing e focalizzeremo l attenzione sul mondo multimediale, sviluppando i concetti di similarità tra oggetti in una collezione multimediale. 4

5 Capitolo 1: Recommender Systems 1.1 Browsing di oggetti multimediali Il continuo sviluppo di applicazioni atte all elaborazioni di documenti multimediali ha comportato un grandissimo sviluppo di tecniche di ricerca e navigazione : in letteratura di parla di Information Retrieval e Browsing. Il primo termine indica il problema della ricerca di informazioni relative ad uno specifico oggetto multimediale, ovvero il sistema si occupa di trovare tali informazioni a partire da un oggetto dato. Tali sistemi vengono denominati Information Retrieval (IR), essi permettono quindi all utente di formulare query e di ottenere risultati in base ai criteri stabiliti. Un esempio di sistemi che fanno uso di tali tecniche sono i motori di ricerca, che mettono, tuttavia, alla luce i limiti di tali metodi: l utente deve esplicitamente descrivere le caratteristiche dell informazione desiderata, ovvero c è bisogno di una query per avere un risultato, l utente deve essere perfettamente a conoscenza dei propri interessi. Con Browsing, invece, si intende un applicazione che dirige l utente durante una navigazione all interno di una collezione multimediale, offrendo suggerimenti utili sugli oggetti in base agli interessi dell utente, senza che egli ne faccia richiesta espressamente. 5

6 Pertanto in letteratura si parla di Information Filtering (filtraggio delle informazioni) e si divide in due categorie principali: Filtraggio basato sul contenuto(content-based Filtering); Filtraggio collaborativo(collaborative Filtering); Nel primo caso vengono raccomandati all utente oggetti simili a quelli che egli ha dimostrato gradire in precedenza, mentre nel secondo vengono raccomandati oggetti apprezzati da altri utenti che condividono gusti simili all utente in questione. Nei paragrafi successivi analizzeremo più accuratamente le due tecniche di filtraggio e alcuni esempi di sistemi appartenenti ad ambedue tipologie. 1.2 Content Based Filtering Il continuo crescere della varietà delle informazioni da poter esaminare costituisce un grosso scoglio da superare per i sistemi di raccolta di oggetti. La mancanza di un organizzazione non permette agli utenti di ricercare facilmente le informazioni di cui hanno bisogno, ma la progettazione di un sistema capace di effettuare un recupero efficiente dei soli documenti relativi ad una stessa categoria risulta essere abbastanza complicata. Il problema principale quindi per i sistemi è quello di individuare gli elementi necessari all utente senza includere nella lista documenti sbagliati. Per affrontare questo problema i ricercatori sono orientati verso la realizzazione di applicazioni in grado di apprendere gli interessi dell utente, attraverso i cosiddetti filtri content-based. Essi si dividono in 6

7 due categorie: basati su regole o basati sul profilo utente. Il primo caso prevede la stesura di regole atte a filtrare oggetti in modo da relegarli in categorie specifiche, un esempio sono i kill files utilizzati per filtrare in arrivo. Il secondo approccio invece è molto più interessante ed utile, esso si basa sulla sintetizzazione delle caratteristiche degli elementi graditi e non di un utente dato in modo da poter discriminare e privilegiare oggetti prima ancora di attendere che l utente effettui una ricerca. Le informazioni necessarie allo scopo vengono tipicamente ricavate a partire dall osservazione dei movimenti dell utente, dalla sua cronologia, o a volte sottoponendolo ad un questionario al momento della sua registrazione. In sostanza questa tecnica di filtraggio di informazioni fornisce suggerimenti in base alle correlazioni tra il contenuto degli elementi esaminabili e le preferenze dell utente. Purtroppo, essi hanno delle limitazioni: La caratteristiche dell informazione devono essere estratte e codificate e ciò non può essere sempre fatto in maniera automatizzata; All utente vengono mostrati solo oggetti simili ad oggetti graditi in passato, in questo modo vengono esclusi eventuali oggetti che potrebbero interessargli nel presente; Le raccomandazioni si basano su diversità molto limitate; Naturalmente i sistemi che sfruttano questo filtraggio si differenziano per gli algoritmi utilizzati e per le tecniche adottate, un esempio sono News Dude e InfoFinder. 7

8 1.3 Collaborative Filtering Questo filtraggio adotta un approccio complementare rispetto al contentbased filtering e tiene conto principalmente delle implicazioni sociali del procedimento di raccomandazione. Invece di suggerire oggetti simili a quelli che l utente ha mostrate di apprezzare in precedenza, vengono raccomandati elementi che altri utenti simili hanno trovato interessanti. In pratica questa tecnica implementa il cosiddetto passa parola ed gli utenti inconsapevolmente si influenzano e interagiscono tra loro. Tuttavia la base stessa di questo approccio è stato messo in discussione partendo dal fatto che persone che condividono interessi su alcuni temi possono non farlo su altri. Quindi per far funzionare bene questo sistema è necessario partizionare l insieme degli oggetti in modo che formino un gruppo omogeneo in relazione al gradimento. Il Collaborative Filtering supera alcuni limiti del Content-Based, infatti non è necessario che gli oggetti da filtrare debbano essere prima analizzati e codificati in modo da estrarne le caratteristiche descrittive. Inoltre il sistema può raccomandare tranquillamente oggetti appartenenti a categorie diverse senza ricadere in suggerimenti simili. In pratica il suggerimento è basato più sulla qualità dell oggetto che sulle sue proprietà più oggettive, ma, come sappiamo, ogni sistema ha delle sue pecche: Gli oggetti appena inseriti non possono essere suggeriti. Infatti i nuovi elementi saranno disponibili per dei suggerimenti solo quando molti utenti li avranno visualizzati; 8

9 Se un utente è nuovo, non avendo fatto ancora nessuna scelta, non potrà essere confrontato con gli altri utenti e, pertanto, non potrà ricevere suggerimenti; Se il numero di utenti non è abbastanza grande ci possono essere utenti inusuali che non condividono nessun interesse con gli altri e quindi non beneficiano del sistema. Il Collaborative Filtering si divide in attivo e passivo. L approccio presentato si basa su di un unico database, contenente le preferenze degli utenti e le raccomandazioni si basano su persone simili per gusti, pertanto si parla di passive Collaborative Filtering perché non c è diretta connessione né conoscenza tra la persona che sceglie e gli utenti che ne ricevono il suggerimento. Viene denominato attive Collaborative Filtering l approccio che si basa sulla pratica comune a molti di consigliare ad amici o colleghi documenti interessanti, quindi ogni utente può direttamente condividere i propri interessi con gli altri appartenenti al sistema. Il primo lavora meglio quando la convergenza di preferenze sullo stesso insieme di oggetti è più alta (perché il sistema è automatizzato), mentre l altro funziona meglio quando i documenti trovati sono divergenti, ovvero lavora meglio nel punto in cui l altro sistema si blocca. Gli algoritmi di predizione usati sono: basati sulla memoria (memorybased) e basati sul modello (model-based). Quelli basati sulla memoria mantengono un database di tutte le preferenze espresse agli users e eseguono qualche computazione su tutto il database in 9

10 corrispondenza di ogni suggerimento. Quelli basati sul modello compilano le preferenze degli utenti in un modello descrittivo di utenti, oggetti e voti e le raccomandazioni sono poi basate su tale modello. Quindi i primi rimandano le computazione al momento del suggerimento e sono più semplici ed intuitivi. Funzionano piuttosto bene nella pratica, ma in termini di costi in computazioni e in memoria peggiorano con l aumentare dei dati. Viceversa nei metodi basati sul modello, il modello stesso soppianta il problema di lunghe computazioni andando oltre alla capacità predittive del sistema, evidenziando correlazioni tra dati che in modo automatizzato non sarebbero visibili. Anche in termini di memoria rispetto a quelli memorybased abbiamo un grosso vantaggio. Il problema principale è che i requisiti di tempo per compilare i dati in un modello potrebbero essere proibitivi e aggiungere un nuovo voto potrebbe richiedere una ricompilazione completa, mantenere quindi aggiornati i modelli è molto dispendioso in termini di tempo. In conclusione il filtraggio collaborativo rappresenta una buona alternativa al filtraggio basato sul contenuto. L idea fondamentale su cui si basa è di associare l utente corrente ad un insieme di utenti che condividono un profilo comune, quindi la somiglianza è tra utenti e non tra oggetti. Alcuni sistemi che sfruttano questo approccio sono Ringo e Siteseer. 1.4 Hybrid Filtering Recenti studi hanno dimostrato che un approccio ibrido possa essere più efficiente in alcuni casi. Esso può essere ottenuto in diversi modi: facendo predizioni content-based e collaborative-based separatamente e poi 10

11 combinandole; aggiungendo le facoltà di un approccio content-based ad uno collaborative e viceversa; o unificando i due approcci in un unico modello. Questi metodi ibridi costituiscono una valida alternativa ai due approcci canonici. Essi vengono usati, quindi, per superare alcuni problemi comuni nei recommender systems come il cold start e lo sparisity problem. Netflix è un ottimo esempio di sistema ibrido. In questo sistema viene fatta ogni raccomandazione comparando le abituali ricerche e visualizzazioni di utenti simili (approccio collaborativo) e offrendo film che condividono caratteristiche con i film che un utente ha gradito in precedenza (approccio content-based). Come sappiamo in letteratura vengono proposte solo due modelli come base per i sistemi di raccomandazione: collaborativo e content-based. Ognuna di queste ha riscontrato delle pecche, come ad esempio il ben noto problema del cold-start (inizio freddo). Come comportarsi con gli utenti nuovi che non hanno ancora effettuato nessuna ricerca? Un sistema di raccomandazione ibrido unisce più tecniche insieme per realizzare una sinergia tra loro. Esistono sette tipi di ibridazione: Pesata: i punteggi delle diverse component di raccomandazione sono combinati numericamente; Switching: il sistema sceglie uno tra i componenti di raccomandazione disponibili e lo applica; Mixed: vengono presentati insieme i suggerimenti di ogni raccomandatore; 11

12 Feature Combination: le features derivate da differenti base di conoscenza sono combinate insieme e date ad un unico algoritmo di raccomandazione; Feature Augmentation: viene usata una tecnica di raccomandazione per computare una feature o un set di features, il risultato viene poi dato in input ad un altra tecnica di raccomandazione; Cascata: viene data una rigorosa priorità ai raccomandatori, quelli a priorità più bassa vengono messi da parte per dare spazio ai risultati di quelli a priorità maggiore; Meta-level: una tecnica di raccomandazione viene utilizzata e ne viene estratto un modello che viene dato in input ad un'altra tecnica; 12

13 Capitolo 2: Modellazione di un oggetto multimediale 2.1 Cos è un oggetto multimediale Un oggetto multimediale a livello fisico non è altro che una collezione di lunghe sequenze di bytes non strutturate chiamate BLOBs(binary large objects). Un sistema che contenga simili dati dovrebbe essere in grado di ricavare e gestire informazioni sia sulla struttura interna dei BLOBs sia sul loro contenuto semantico. Dal punto di vista logico un oggetto multimediale è articolato in una struttura gerarchica di componenti sintattici come, ad esempio, capitoli e paragrafi in un testo, shots e scene in un video e così via. La struttura determina come questi componenti siano interlacciati tra loro. Oltre alla struttura logica abbiamo quella concettuale di ciascun oggetto che fornisce informazioni semantiche sul suo contenuto. Il modo in cui vengono derivate e memorizzate queste informazioni riguardanti i BLOB è attraverso un generico sistema di Information Retrieval o Browsing. Senza dubbio, un modello per dati multimediali adatto ad un sistema che debba consentire l esplorazione e il recupero ottimale di elementi all interno del database dovrebbe essere in grado di gestire e descrivere sia 13

14 il contenuto concettuale degli oggetti che le loro caratteristiche di più basso livello. Di conseguenza abbiamo la necessità di definire un tale modello al fine di descrivere in maniera appropriata un generico elemento multimediale. 2.2 Definizioni preliminari Definizione: Alfabeto multimediale Un alfabeto multimediale A è un insieme finito di simboli multimediali MSymbol, dove con simbolo multimediale si intende un carattere alfanumerico, un pixel o un campione audio. A={MSymbols} Due simboli multimediali si dicono omogenei se della stessa tipologia. Definizione: Parola Multimediale Dato un alfabeto multimediale A, una parola multimediale MW A di lunghezza k su A è una composizione di k simboli multimediali omogenei su A. MW A ={s 1... s k } con s i A i 1,k Esempio: un testo o un immagine sono esempi di parole multimediali, composizione rispettivamente di caratteri alfanumerici e pixel. Una parola multimediale si dirà composta se potrà decomporsi in più parole multimediali dotate di significato, atomica in caso contrario. 14

15 Naturalmente a seconda del tipo di oggetto multimediale il concetto di decomposizione cambia. Nel caso di immagini una parola multimediale componente sarà una sotto-regione dell intera figura, nel caso di un video un sottoinsieme di frame dell intero film, nel caso di un testo una singola parola o frase. Ogni parola contribuisce con il suo significato a determinare il significato globale della parola multimediale. Definizione: Dizionario Multimediale Dato un alfabeto multimediale A, un dizionario multimediale MDictionary A su A è un insieme di parole multimediali sull alfabeto A. MDictionary A ={MW A s} 2.3 Oggetto Multimediale Adesso possiamo dare la definizione di oggetto multimediale: Definizione: Oggetto Multimediale Un oggetto multimediale MO A su un dato alfabeto multimediale A può essere definito come una quadrupla: MO A ={MW A, MOId, M f, M c } Dove MW A è una parola multimediale sull alfabeto A. Si tratta in pratica del dato multimediale vero e proprio di più basso livello: il testo inteso come sequenza di caratteri, l immagine intesa come insieme di pixel e così via; 15

16 MOId è il link fisico all oggetto multimediale, l URI(Uniform Resource Identifier) cioè una strina che identifica univocamente la risorsa. Un URI può essere classificato in URL o URN: URL(Uniform Resource Locator) è un URI che oltre ad essere un identificatore fornisce mezzi per agire su o per ottenere una rappresentazione della stessa descrivendo il suo meccanismo di accesso primario o la sua ubicazione in una rete; un URN(Uniform Resource Name) è un URI che identifica una risorsa con un nome in un particolare dominio di nomi; M f è un insieme di metadati contenente una descrizione di basso livello dell oggetto multimediale, un insieme di sue features fisiche rilevanti, anche noto come signature della risorsa. Ad esempio, considerando il caso di immagini la signature è costituita da tre diverse features: colore, forma, texture, shape; M c è un insieme di metadati contenente una descrizione a livello semantico dell oggetto multimediale, significativi dal punto di vista del suo contenuto semantico. Ad esempio, nel caso di applicazioni di browsing di un museo virtuale, possono considerarsi informazioni rilevanti dal punto di vista semantico tutte quelle relative all autore del dipinto, al suo soggetto, alla corrente artistica di riferimento etc; 16

17 Capitolo 3: Metriche di Similitudine tra oggetti 3.1 Similitudine nei Recommender Systems L elemento chiave nella progettazione di un effettivo Recommender System multimediale è la definizione di similarità per comparare oggetti multimediali, estrapolando features descrittive di basso e alto livello. La similarità viene vista come la somma pesata di due contributi, uno legato alla somiglianza di basso livello tra gli oggetti e uno legato alla somiglianza semantica degli stessi. Descriveremo in questo paragrafo tale strategia rispetto ad immagini. Le immagini vengono descritte attraverso 3 fondamentali features di basso livello: color, texture and shape. Gli algoritmi di image processing possono automaticamente estrarre queste e calcolare la distanza tra 2 immagini come la distanza tra le loro features nello spazio delle features. 3.2 Somiglianza basata sulle features Si considerino, dato un alfabeto multimediale A, due generici oggetti multimediali della stessa tipologia, MO A ={MW A, MOId, M f, M c } e MO A ={MW A, MOId, M f, M c }; per definire la similitudine di basso livello tra di essi è necessario considerarne le caratteristiche fisiche 17

18 rilevanti, contenute negli insiemi di metadati M f ={f 1,..,f n } e M f ={f 1,..,f n }. Per ciascuna coppia di elementi dei due insiemi si potrà calcolare la distanza tra feature fisica corrispondente nei due oggetti, d f1, d f2,, dove per distanza basata su una caratteristica di basso livello f i si intende una misura della differenza tra due oggetti multimediali valutata in termini della stessa f i. Definizione: Distanza basata su features La distanza basata sulle features tra due oggetti multimediali dello stesso tipo MO A e MO A si definisce come: d features (MO A, MO A ) = i α i d fi con i = 1,..., n, n essendo il numero complessivo delle features fisiche considerate e α i dei coefficienti di peso opportuni. Definizione: Similitudine basata sulle features La similitudine basata sulle features tra due oggetti multimediali dello stesso tipo MO A e MO A si definisce come: S features (MO A, MO A ) = 1 - d features (MO A, MO A ) Questa è la similitudine di basso livello generica, a seconda dei tipi di oggetto multimediali cambieranno le features appartenenti all insieme M f. Adesso vedremo in particolare quali entrano in gioco nelle immagini e nei testi. Similitudine di basso livello tra immagini Come abbiamo detto per le immagini le features di riferimento sono 3, color, texture e shape. Nel database l immagine, dopo l inserimento, viene analizzate e le viene immagazzinata una rappresentazione compatta dei 18

19 suoi contenuti in un vettore di features, la signature. Le immagini quindi sono confrontate in base a colore, texture e forma, le posizioni di questi attributi visuali sono rappresentate dalla locazione che non è un parametro significativo per la ricerca ma lo è congiuntamente ad uno degli altri 3 attributi. In parole povere la signature contiene informazioni su: Colore: rappresenta la distribuzione di colori all interno dell intera immagine, ovvero un istogramma con le percentuali per ogni colore; Texture: è un indice della regolarità o irregolarità dell immagine, come granularità e zone sfumate; Forma: rappresenta le forme che compaiono all interno dell immagine determinate tramite tecniche di segmentazione basate sul colore; Locazione: rappresenta la posizione delle componenti di forma, colore e texture all interno dell immagine stessa. Di seguito riportiamo una serie di immagini analizzandone la somiglianza. Immagini molto simili nel colore ma non nella locazione; 19

20 Immagini molto simili nella texture ma non nel colore; Similitudine di basso livello tra testi Per i testi il discorso è diverso, la misura della similitudine di basso livello è ottenuta considerando il numero di occorrenze delle parole chiave di un testo all interno dell altro e viceversa. Quindi, dati due testi A e B, viene calcolata con opportuni metodi di computazione l occorrenza di ciascuna parola chiave due e valutata la differenza di tali risultati, partendo dalla considerazione che sia quasi impossibile che due testi diversi abbiano lo stesso numero di occorrenze. La similitudine di basso livello viene poi calcolata come in precedenza. 3.3 Somiglianza basata sulla tassonomia Una tassonomia è una collezione di termini di un vocabolario controllato, organizzati in una struttura gerarchica. Le relazioni gerarchiche in tassonomia sono di tipo intero-parte, genere-specie, tipo-istanza. La tassonomia è quindi una gerarchia dove un nodo è un concetto o una classe di concetti e una connessione rappresenta un associazione diretta tra due 20

21 nodi padre/figlio. La struttura utilizzata per rappresentare tale organizzazione, quindi, è quella ad albero, a cui ogni nodo costituisce un concetto e ogni ramo un associazione. 3.4 Similarità semantica attraverso le parole Ormai grazie allo sviluppo di innumerevoli progetti computazionali linguistici di successo, molte sono le basi di conoscenza semantiche disponibili a noi. Le basi di conoscenza (knowledge base) possono essere costruite in una gerarchia in cui si individuano relazioni tra i termini del tipo is a o is a kind of (ISA). La struttura gerarchica ISA della base di conoscenza è importante nel determinare al distanza semantica tra le parole. Date due parole, si può analizzare la base di conoscenza gerarchica 21

22 per individuare la similitudine semantica tra di esse. Un metodo diretto per il calcolo della similitudine consiste nel trovare il percorso di lunghezza minima che collega i concetti contenenti le due parole. Nella figura sottostante possiamo notare che il percorso minimo tra le parole boy e girl è boy-male-person-female-girl pari a 4 mentre tra le parole boy e teacher sono 6 (boy-male-person-adult-professional-educator-teacher), pertanto possiamo affermare che a livello semantico boy e girl sono più simili di boy e teacher. Naturalmente questo metodo non è molto accurato, dato che dal grafico si nota che la parola animal dista 4 da quella boy minore della distanza tra boy e teacher, cosa che concettualmente non è accettabile. Per superare questo limite bisogna utilizzare un maggior numero di informazioni: in sostanza i concetti superiori della gerarchia devono avere una semantica più generale e una minore somiglianza gli uni dagli altri, mentre quelli negli strati inferiori abbiano una semantica più concreta ed una somiglianza più forte, e soprattutto bisognerebbe considerare anche la profondità di cammino minimo. Anche la densità locale delle reti semantiche è un fattore determinante. Quindi la similitudine tra 2 parole può considerarsi una funzione del percorso minimo tra le 2, la profondità e la densità della rete locale. Sono 3 i possibili casi in cui 2 parole possono trovarsi: Si trovano nello stesso concetto, quindi hanno lo stesso significato per cui si assegna alla lunghezza del percorso semantico tra di essere il valore nullo; Non sono nello stesso concetto ma contengono una o più parole coincidenti, in questo caso le parole condividono parzialmente le 22

23 stesse caratteristiche. Allora si assegna una lunghezza al percorso che le separa pari ad 1: tale scelta deriva dalla considerazione che quando i concetti relativi a due parole contengono una o più parole uguali le due sono tipicamente simili; Le due non sono nello stesso concetto né i loro concetti hanno parole in comune; La profondità viene derivata dal conteggio dei livelli dall elemento fino alla cima della gerarchia lessicale. Naturalmente maggiore sarà la profondità maggiori saranno le informazioni legate a quella parola. In generale la similitudine semantica è una funzione monotona crescente rispetto alla profondità, mentre, monotona decrescente rispetto al percorso semantico. Grazie a questo possiamo definire la descrizione semantica di un oggetto multimediale Definizione: Descrizione semantica di un oggetto multimediale Data una tassonomia T, una descrizione semantica M C di un oggetto multimediale MO A è una coppia ordinata definita come M C = (TA, NTA) Dove TA = (A 1,...,A m ) è una tupla ordinata di attributi che assumono i valori corrispondenti ai nodi di T e NTA = (A * 1,..., A * m ) è una tupla ordinata di attributi i cui valori non corrispondono ai nodi di T. Ad esempio nel caso della classificazioni tassonomiche di immagini con: M C = (Autore, Titolo, Corrente artistica, Soggetto) 23

24 TA = (Autore, Corrente artistica, Soggetto) NTA = (Titolo) Ovvero gli attributi Autore, Corrente artistica e Soggetto possono esprimere un legame semantico tra le immagini, infatti è probabile che due immagini relative ad uno stesso autore o appartenenti alla stessa corrente siano simili, al contrario del titolo che cambia da opera ad opera. Definizione: Similitudine basata sulla tassonomia Sia T una tassonomia e TA = (A 1,...,Aτ) la tupla di attributi tassonomici. La similitudine basata sulla tassonomia tra due oggetti MO A e MO A è: Dove α i k = t i (A k ) e α j k = t j (A k ) sono i valori individuabili tra i metadati M C e M C per l attributo A k, l è la lunghezza del percorso tra α i k e α j k e d è la profondità; α e β sono dei parametri che regolano il contributo di l e d. Definizione: Distanza basata sulla tassonomia La distanza basata sulla tassonomia tra due oggetti MO A e MO A definita come è d taxonomy (MO A, MO A ) = 1 - S T (MO A, MO A ) 24

25 3.5 Similarità basata su features e sulla tassonomia Come detto in precedenza la similitudine globale tra due oggetti multimediali è vista come la somma pesate di due contributi, uno legato alla similitudine di basso livello ad uno a quello alto. Di seguito riportiamo le definizioni. Definizione: Distanza basata sulle features a sulla tassonomia La distanza basata sui contributi di features e contenuto semantico tra due oggetti multimediale MO A e MO A è definita come: d M (MO A, MO A ) = α F d features (MO A, MO A ) + α T d taxonomy (MO A, MO A ) nel caso in cui i due oggetti siano dello stesso tipo, d M (MO A, MO A ) = d taxonomy (MO A, MO A ) nel caso in cui i due oggetti siano di tipologie differenti. α F e α T sono due pesi il cui valore può essere fissato in modo da tenere in maggiore considerazione il contenuto semantico rispetto alle features fisiche o viceversa. Definizione: Similitudine basata sulle features e sulla tassonomia La similitudine basata sui due contributi (basso e alto livello) tra due oggetti multimediali MO A e MO A è definita come: S M (MO A, MO A ) = 1 d M (MO A, MO A ) 25

26 3.6 Somiglianza basata sul percorso di esplorazione Come abbiamo accennato in precedenza per garantire dei suggerimenti intelligenti ad un utente possiamo avvalerci anche dei percorsi di altri utenti che in precedenza hanno navigato nella collezione multimediale confrontandoli con quelli del utente preso in considerazione. Definizione: Percorso d esplorazione Un percorso d esplorazione p di lunghezza k è la sequenza ordinata dei k oggetti richiesti da un utente nella stessa sessione di esplorazione: p = ( o 1, o 2,..., o k ) Sia P l insieme di tutti i percorsi d esplorazione dei visitatori passati. La nostra necessità adesso è stabilire la nozione di similitudine tra percorsi d esplorazione. Uno dei più famosi algoritmi proporti in letteratura per il confronto di sequenze di simboli dato un alfabeto è quello di Levenshtein, progettato per valutare la distanza tra due parole in termini di somma dei costi di operazioni base (inserimenti, cancellazioni e sostituzioni) necessaria a trasformare una stringa in un altra. 26

UNIVERSITÀ DEGLI STUDI DI FIRENZE. Relazione elaborato di progettazione e produzione multimediale

UNIVERSITÀ DEGLI STUDI DI FIRENZE. Relazione elaborato di progettazione e produzione multimediale UNIVERSITÀ DEGLI STUDI DI FIRENZE Relazione elaborato di progettazione e produzione multimediale AllPainters.Net SISTEMA PER LA GENERAZIONE DI SITI GRATUITI PER PITTORI Autori: - Bandini Roberto - Ercoli

Dettagli

Corso di Basi di Dati Multimediali

Corso di Basi di Dati Multimediali Corso di Basi di Dati Multimediali Lezione su: MMDBMS (Multimedia Data Base Manage System) Studente; Enrico Leone Matr. 961/142 Basi di Dati Multimediali Multimedia Database Manage System Deve supportare

Dettagli

STRATEGIE DI PERSONALIZZAZIONE PER SISTEMI DI COMMERCIO ELETTRONICO SUL WEB

STRATEGIE DI PERSONALIZZAZIONE PER SISTEMI DI COMMERCIO ELETTRONICO SUL WEB STRATEGIE DI PERSONALIZZAZIONE PER SISTEMI DI COMMERCIO ELETTRONICO SUL WEB L. Ardissono, A. Goy, G. Petrone e M. Segnan Dipartimento di Informatica Università di Torino Italia In questo articolo sono

Dettagli

PROGETTI DISPONIBILI IL CORSO DI PROGETTO DI RETI E SISTEMI INFORMATICI

PROGETTI DISPONIBILI IL CORSO DI PROGETTO DI RETI E SISTEMI INFORMATICI PROGETTI DISPONIBILI IL CORSO DI PROGETTO DI RETI E SISTEMI INFORMATICI 1 Web Link Monitor... 2 2 Database Browser... 4 3 Network Monitor... 5 4 Ghost Site... 7 5 Copy Search... 9 6 Remote Audio Video

Dettagli

capitolo 7 LA CHECKLIST PER LA VALUTV ALUTAZIONEAZIONE TECNICO-DIDATTICA TTICA

capitolo 7 LA CHECKLIST PER LA VALUTV ALUTAZIONEAZIONE TECNICO-DIDATTICA TTICA capitolo 7 LA CHECKLIST PER LA VALUTV ALUTAZIONEAZIONE TECNICO-DIDATTICA TTICA 7.1 ISTRUZIONI PER IL VALUTATORE Il processo di valutazione si basa su un campione del prodotto, precedentemente selezionato

Dettagli

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web Il World Wide Web Il Web Claudio Fornaro ver. 1.3 1 Il World Wide Web (ragnatela di estensione mondiale) o WWW o Web è un sistema di documenti ipertestuali collegati tra loro attraverso Internet Attraverso

Dettagli

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE di K A T H A G E D O R N, A R G U S A S S O C I A T E S MARZO 2 0 0 0 traduzione di: BARBARA WIEL MARIN DICEMBRE 2009 1 GLOSSARIO DI ARCHITETTURA DELL INFORMAZIONE

Dettagli

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da

Dettagli

Il reference digitale: l intermediazione e le risorse multimediali

Il reference digitale: l intermediazione e le risorse multimediali Università di RomaTre Stato attuale delle metodologie di gestione e diffusione dell informazione multimediale Roma, venerdì 3 dicembre 2004 Il reference digitale: l intermediazione e le risorse multimediali

Dettagli

Data Base. Prof. Filippo TROTTA

Data Base. Prof. Filippo TROTTA Data Base Definizione di DataBase Un Database può essere definito come un insieme di informazioni strettamente correlate, memorizzate su un supporto di memoria di massa, costituenti un tutt uno, che possono

Dettagli

Sistemi Informativi Multimediali Indicizzazione multidimensionale

Sistemi Informativi Multimediali Indicizzazione multidimensionale Indicizzazione nei sistemi di IR (1) Sistemi Informativi Multimediali Indicizzazione multidimensionale ugusto elentano Università a Foscari Venezia La struttura fondamentale di un sistema di information

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

Tecniche di DM: Link analysis e Association discovery

Tecniche di DM: Link analysis e Association discovery Tecniche di DM: Link analysis e Association discovery Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Architettura di un generico algoritmo di DM. 2 2 Regole di associazione:

Dettagli

Organizzazione degli archivi

Organizzazione degli archivi COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i

Dettagli

Gestione Dati Multimediali: Modelli, Indici, Interfacce, Applicazioni

Gestione Dati Multimediali: Modelli, Indici, Interfacce, Applicazioni Introduzione Gestione Dati Multimediali: Modelli, Indici, Interfacce, Applicazioni Ilaria Bartolini e Marco Patella DEIS Università di Bologna La diffusione di nuovi strumenti tecnologici di acquisizione

Dettagli

Introduzione ad Access

Introduzione ad Access Introduzione ad Access Antonino Bella Centro Nazionale di Epidemiologia, Sorveglianza e Promozione della Salute Istituto Superiore di Sanità 1 Base di Dati 2 Database: Concetti (1) Database Collezione

Dettagli

Formazione sistema editoriale CMS

Formazione sistema editoriale CMS Ufficio Società dell'informazione Nome del Progetto Acronimo del Progetto Formazione sistema editoriale CMS Documento Data di stesura Maggio 2010 Versione 1.2 Sommario 1 Scopo... 3 2 Campo di applicazione...

Dettagli

Albano Squizzato ingsquizzato@libero.it. Moodle-manuale. manuale per il docente. Generazione Web 2013-14 - G9

Albano Squizzato ingsquizzato@libero.it. Moodle-manuale. manuale per il docente. Generazione Web 2013-14 - G9 Albano Squizzato ingsquizzato@libero.it Moodle-manuale manuale per il docente Generazione Web 2013-14 - G9 Come utilizzare Moodle La versatilità di Moodle consente la totale personalizzazione dell interfaccia,

Dettagli

1. Rappresentazione della conoscenza 2. Ontologie 3. Usi delle ontologie 4. Progettazione di un ontologia 5. Esempio di progettazione di una

1. Rappresentazione della conoscenza 2. Ontologie 3. Usi delle ontologie 4. Progettazione di un ontologia 5. Esempio di progettazione di una 1. Rappresentazione della conoscenza 2. Ontologie 3. Usi delle ontologie 4. Progettazione di un ontologia 5. Esempio di progettazione di una ontologia 1 Rappresentazione della conoscenza Il problema di

Dettagli

Alessandra Raffaetà. Basi di Dati

Alessandra Raffaetà. Basi di Dati Lezione 2 S.I.T. PER LA VALUTAZIONE E GESTIONE DEL TERRITORIO Corso di Laurea Magistrale in Scienze Ambientali Alessandra Raffaetà Dipartimento di Informatica Università Ca Foscari Venezia Basi di Dati

Dettagli

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE Il sistema di ricerca della biblioteca virtuale permette di accedere in maniera rapida ai materiali didattici di interesse degli studenti presenti all interno del

Dettagli

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Dettagli

A seguito della consultazione di questo sito possono essere trattati dati relativi a persone identificate o identificabili.

A seguito della consultazione di questo sito possono essere trattati dati relativi a persone identificate o identificabili. Privacy policy del sito web Bitmama S.r.l. In questa pagina si descrivono le modalità di gestione del sito Bitmama, in riferimento al trattamento dei dati personali degli utenti che lo consultano. Si tratta

Dettagli

PRIVACY POLICY. Tipi di dati trattati

PRIVACY POLICY. Tipi di dati trattati PRIVACY POLICY In questa pagina si descrivono le modalità di gestione del sito in riferimento al trattamento dei dati personali degli utenti che lo consultano. Si tratta di un informativa che è resa anche

Dettagli

Progettare Ipermedia. Presentazione

Progettare Ipermedia. Presentazione Progettare Ipermedia Presentazione L aspetto progettuale riveste notevole importanza in un percorso didattico impostato sulla produzione di ipermedia così come è importante pianificarne lo sviluppo su

Dettagli

Linguaggi e Paradigmi di Programmazione

Linguaggi e Paradigmi di Programmazione Linguaggi e Paradigmi di Programmazione Cos è un linguaggio Definizione 1 Un linguaggio è un insieme di parole e di metodi di combinazione delle parole usati e compresi da una comunità di persone. È una

Dettagli

Multimedia Recommender Systems

Multimedia Recommender Systems Elaborato finale in Sistemi Multimediali Multimedia Recommender Systems Anno Accademico 2011/2012 Candidato: JULIO CESAR PLASCENCIA BIERD matr. N46000685 Indice Introduzione 3...............................

Dettagli

Sorgenti autorevoli in ambienti hyperlinkati.

Sorgenti autorevoli in ambienti hyperlinkati. Sorgenti autorevoli in ambienti hyperlinkati. La qualità di un metodo di ricerca richiede la valutazione umana dovuta alla soggettività inerente alla nozione di rilevanza. I motori di ricerca correnti,

Dettagli

Introduzione. è uguale a 0, spostamento di dati da una parte della memoria del calcolatore ad un altra.

Introduzione. è uguale a 0, spostamento di dati da una parte della memoria del calcolatore ad un altra. Appunti di Calcolatori Elettronici Modello di macchina multilivello Introduzione... 1 Linguaggi, livelli e macchine virtuali... 3 La struttura a livelli delle macchine odierne... 4 Evoluzione delle macchine

Dettagli

HTML e Linguaggi. Politecnico di Milano Facoltà del Design Bovisa. Prof. Gianpaolo Cugola Dipartimento di Elettronica e Informazione

HTML e Linguaggi. Politecnico di Milano Facoltà del Design Bovisa. Prof. Gianpaolo Cugola Dipartimento di Elettronica e Informazione HTML e Linguaggi Politecnico di Facoltà del Design Bovisa Prof. Gianpaolo Cugola Dipartimento di Elettronica e Informazione cugola@elet.polimi.it http://home.dei.polimi.it/cugola Indice Il linguaggio del

Dettagli

Comprendere cosa è Internet e sapere quali sono i suoi principali impieghi. 25/09/2011 prof. Antonio Santoro

Comprendere cosa è Internet e sapere quali sono i suoi principali impieghi. 25/09/2011 prof. Antonio Santoro Comprendere cosa è Internet e sapere quali sono i suoi principali impieghi. 1 Internet è una rete che collega centinaia di milioni di computer in tutto il mondo 2 Le connessioni sono dei tipi più disparati;

Dettagli

31/05/2013. Sistemi Web Distribuiti (parte 2) - Indice dei Contenuti - Naming. Corso Sistemi Distribuiti 6 cfu Docente: Prof. Marcello Castellano

31/05/2013. Sistemi Web Distribuiti (parte 2) - Indice dei Contenuti - Naming. Corso Sistemi Distribuiti 6 cfu Docente: Prof. Marcello Castellano Corso Sistemi Distribuiti 6 cfu Docente: Prof. Marcello Castellano /28 Sistemi Web Distribuiti (parte 2) - Indice dei Contenuti - Naming 3 Sincronizzazione 4 Consistenza e Replica 5 Replica di sistemi

Dettagli

Ci becchiamo su Facebook: social network ed educazione, si può fare? Elena Pacetti Università di Bologna elena.pacetti@unibo.it

Ci becchiamo su Facebook: social network ed educazione, si può fare? Elena Pacetti Università di Bologna elena.pacetti@unibo.it Ci becchiamo su Facebook: social network ed educazione, si può fare? Elena Pacetti Università di Bologna elena.pacetti@unibo.it Ciascuno di noi ha oggi a disposizione uno spazio potenzialmente illimitato

Dettagli

Indicizzazione. Fasi del processo di IR. Indicizzazione: due aspetti. Corpus: Costruzione delle viste logiche dei documenti: Termine indice

Indicizzazione. Fasi del processo di IR. Indicizzazione: due aspetti. Corpus: Costruzione delle viste logiche dei documenti: Termine indice Fasi del processo di IR Indicizzazione Information need text input Pre-process documents Parse Query Index Rank Indicizzazione: due aspetti Costruzione delle viste logiche dei documenti: Per ogni documento

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

Spettabile. Termine attività PREMESSA

Spettabile. Termine attività PREMESSA Spettabile Ogetto: Regione Lazio - Bando per l educazione permanente degli adulti. Misura 1.a di Sistema. Delibera Giunta Regionale n. 30 dell 11/01/2001 - (Pubblicato nel BUR Lazio n.5 del 20 febbraio

Dettagli

PRIVACY POLICY DEL SITO: agrobio.biz

PRIVACY POLICY DEL SITO: agrobio.biz PRIVACY POLICY DEL SITO: agrobio.biz 1. INTRODUZIONE Poiché, anche a seguito della mera consultazione dei siti web, vi può essere la possibilità di raccogliere e trattare dati relativi a persone identificate

Dettagli

Sistemi Informativi e Basi di Dati

Sistemi Informativi e Basi di Dati Sistemi Informativi e Basi di Dati Laurea Specialistica in Tecnologie di Analisi degli Impatti Ecotossicologici Docente: Francesco Geri Dipartimento di Scienze Ambientali G. Sarfatti Via P.A. Mattioli

Dettagli

Breve descrizione del prodotto

Breve descrizione del prodotto Breve descrizione del prodotto 1. Il software AquaBrowser Library...2 1.1 Le funzioni di Search Discover Refine...3 1.2 Search: la funzione di ricerca e di presentazione dei risultati...3 1.2.1 La configurazione

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

Esplorazioni e visualizzazioni Rocco Tripodi rocco@unive.it

Esplorazioni e visualizzazioni Rocco Tripodi rocco@unive.it Università Ca Foscari di Venezia Linguistica Informatica Mod. 1 Anno Accademico 2010-2011 Esplorazioni e visualizzazioni Rocco Tripodi rocco@unive.it Schema Input Text Teoria informazione Espressioni Regolari

Dettagli

Archiviazione ed accesso all'informazione (I. Zangara)

Archiviazione ed accesso all'informazione (I. Zangara) Università degli studi di Catania Archiviazione ed accesso all informazione Archivio Insieme di documenti, dello stesso tipo o di tipi diversi, che per esigenze specifiche informative costituisce una raccolta

Dettagli

Automatic Ontology-Based Knowledge Extraction from Web Documents

Automatic Ontology-Based Knowledge Extraction from Web Documents Automatic Ontology-Based Knowledge Extraction from Web Documents 5 gennaio 2009 1 Introduzione Al ne di ottenere un eettivo WEB semantico bisogna essere in grado di costruire servizi che consentano l'estrazione

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testuali Il text mining: una definizione Data mining per dati destrutturati ovvero documenti codificati in linguaggio

Dettagli

Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane

Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane Vantaggi e limiti delle folksonomie (difficoltà: *) Nel paragrafo 7.4 è stato introdotto il concetto di social

Dettagli

Un metodo knowledge-based per la raccomandazione in e-learning

Un metodo knowledge-based per la raccomandazione in e-learning Un metodo knowledge-based per la raccomandazione in e-learning P. Di Bitonto, M. Laterza, T. Roselli, V. Rossano Dipartimento di Informatica Università degli Studi di Bari Aldo Moro Via Orabona,4 70126

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

BASI DI DATI. Queste slides sono un adattamento di quelle di Luca Anselma e Gian Luca Pozzato, cui va il mio ringraziamento

BASI DI DATI. Queste slides sono un adattamento di quelle di Luca Anselma e Gian Luca Pozzato, cui va il mio ringraziamento BASI DI DATI Queste slides sono un adattamento di quelle di Luca Anselma e Gian Luca Pozzato, cui va il mio ringraziamento BASI DI DATI (DATABASE, DB) Una delle applicazioni informatiche più utilizzate,

Dettagli

Mariella Proietta. Introduzione

Mariella Proietta. Introduzione Mariella Proietta maripro@yahoo.it Joomla per una scuola secondaria superiore: una piattaforma per integrare l insegnamento della lingua straniera e migliorare la professionalità docente Introduzione L

Dettagli

http://www.vicenzafiera.it e per tutti i Suoi siti che rimandano alle singole manifestazioni fieristiche e progetti speciali

http://www.vicenzafiera.it e per tutti i Suoi siti che rimandano alle singole manifestazioni fieristiche e progetti speciali LA GESTIONE DEI COOKIE DI QUESTO SITO In questa pagina si descrivono le modalità di gestione dei cookie di questo sito. Si tratta di un informativa che è resa anche ai sensi dell'art. 13 del d.lgs. n.

Dettagli

E-marketing Intelligence e personalizzazione

E-marketing Intelligence e personalizzazione E-marketing Intelligence e personalizzazione Nel mondo degli affari di oggi comprendere e sfruttare il potere delle 4 P del marketing (product, price, place e promotion) è diventato uno dei fattori più

Dettagli

http://mb.unisalento.it/index.htm

http://mb.unisalento.it/index.htm Appunti Fondamenti di Informatica 7/05/015 I motori di ricerca Algoritmi e strutture dati I motori di ricerca sono tra i servizi internet maggiormente utilizzati. Come in un libro sono generalmente presenti

Dettagli

Michele Nappi, Ph.D Dipartimento di Matematica e Informatica Università degli Studi di Salerno mnappi@unisa.it www.dmi.unisa.

Michele Nappi, Ph.D Dipartimento di Matematica e Informatica Università degli Studi di Salerno mnappi@unisa.it www.dmi.unisa. Indicizzazione di Immagini (1) Michele Nappi, Ph.D Dipartimento di Matematica e Informatica Università degli Studi di Salerno mnappi@unisa.it www.dmi.unisa.it/people/nappi Agenda Introduzione al Problema

Dettagli

INFORMATICA LE470. Ipertesto. Facoltà di Lettere e Filosofia anno accademico 2008/2009 secondo semestre

INFORMATICA LE470. Ipertesto. Facoltà di Lettere e Filosofia anno accademico 2008/2009 secondo semestre INFORMATICA LE470 Ipertesto Facoltà di Lettere e Filosofia anno accademico 2008/2009 secondo semestre Il World Wide Web un immenso ipertesto Le pagine Web non sono basate su una struttura lineare. E possibile

Dettagli

Sistemi Ipermediali I modelli dei sistemi ipermediali

Sistemi Ipermediali I modelli dei sistemi ipermediali Documenti e ipermedialità Sistemi Ipermediali I modelli dei sistemi ipermediali Augusto Celentano Università Ca Foscari Venezia Documento ipertestuale insieme di informazioni testuali e grafiche, esplorabili

Dettagli

Progettare una basi di dati vuole dire progettare la struttura dei dati e le applicazioni

Progettare una basi di dati vuole dire progettare la struttura dei dati e le applicazioni LA PROGETTAZIONE DI BASI DI DATI Progettare una basi di dati vuole dire progettare la struttura dei dati e le applicazioni La progettazione dei dati è l attività più importante Per progettare i dati al

Dettagli

Reti Informatiche: Internet e posta. elettronica. Tina Fasulo. Guida a Internet Explorer e alla posta elettronica Windows Live Mail

Reti Informatiche: Internet e posta. elettronica. Tina Fasulo. Guida a Internet Explorer e alla posta elettronica Windows Live Mail Reti Informatiche: Internet e posta elettronica Tina Fasulo 2012 Guida a Internet Explorer e alla posta elettronica Windows Live Mail 1 Parte prima: navigazione del Web Il browser è un programma che consente

Dettagli

MAPPE CONCETTUALI E SEMANTICHE PER ORIENTARE LA LETTURA DEI DOCUMENTI IPERTESTUALI E LORO APPLICAZIONE NELL INSEGNAMENTO DI UNA L2

MAPPE CONCETTUALI E SEMANTICHE PER ORIENTARE LA LETTURA DEI DOCUMENTI IPERTESTUALI E LORO APPLICAZIONE NELL INSEGNAMENTO DI UNA L2 MAPPE CONCETTUALI E SEMANTICHE PER ORIENTARE LA LETTURA DEI DOCUMENTI IPERTESTUALI E LORO APPLICAZIONE NELL INSEGNAMENTO DI UNA L2 Abstract Mappe concettuali, semantiche, mentali, lessicali. Comunque le

Dettagli

Creazione di un ipertesto con Word

Creazione di un ipertesto con Word Creazione di un ipertesto con Word Realizzare un ipertesto per illustrare la storia dell esplorazione dello spazio. Descriviamo le fasi principali per la creazione di un ipertesto: a. all inizio occorre

Dettagli

Materiale didattico. Laboratorio di Informatica a.a. 2007-08. I) Introduzione all Informatica. Definizione di Informatica. Definizione di Informatica

Materiale didattico. Laboratorio di Informatica a.a. 2007-08. I) Introduzione all Informatica. Definizione di Informatica. Definizione di Informatica Corso di Laurea Triennale in Storia, Scienze e Tecniche dell Industria Culturale sede di Brindisi Laboratorio di Informatica a.a. 2007-08 Materiale didattico Testo adottato D.P. Curtin, K. Foley, K. Suen,

Dettagli

Corso di Sistemi di Elaborazione delle informazioni

Corso di Sistemi di Elaborazione delle informazioni Corso di Sistemi di Elaborazione delle informazioni Reti di Calcolatori Francesco Fontanella Il DNS Gli indirizzi IP sono in formato numerico: sono difficili da ricordare; Ricordare delle stringhe di testo

Dettagli

Indice dei contenuti

Indice dei contenuti Gesttiione Knowlledge Base Serrviiziio dii Conttactt Centterr 055055 Manualle dii consullttaziione Indice dei contenuti 1. Introduzione... 4 2. Modalità di accesso alle informazioni... 5 2.1. Accesso diretto

Dettagli

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Roccatello Ing. Eduard L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Agenda Presentazione docente Definizione calendario Questionario pre corso

Dettagli

INFORMATICA COMPETENZE

INFORMATICA COMPETENZE INFORMATICA Docente: Sandra Frigiolini Finalità L insegnamento di INFORMATICA, nel secondo biennio, si propone di: potenziare l uso degli strumenti multimediali a supporto dello studio e della ricerca

Dettagli

PROGETTO - Ingegneria del Software. Università degli Studi di Milano Polo di Crema. Corso di laurea in Scienze Matematiche, Fisiche e Naturali

PROGETTO - Ingegneria del Software. Università degli Studi di Milano Polo di Crema. Corso di laurea in Scienze Matematiche, Fisiche e Naturali Università degli Studi di Milano Polo di Crema Corso di laurea in Scienze Matematiche, Fisiche e Naturali INFORMATICA Corso di Ingegneria del Software progetto IL SISTEMA CALENDAR Presentato al dott. Paolo

Dettagli

roberto.albiero@cnr.it

roberto.albiero@cnr.it 2.2 Gestione dei file 2.2.1 Concetti fondamentali Un file (termine inglese che significa archivio) è un insieme di informazioni codificate ed organizzate come una sequenza di byte; queste informazioni

Dettagli

Indicizzazione terza parte e modello booleano

Indicizzazione terza parte e modello booleano Reperimento dell informazione (IR) - aa 2014-2015 Indicizzazione terza parte e modello booleano Gruppo di ricerca su Sistemi di Gestione delle Informazioni (IMS) Dipartimento di Ingegneria dell Informazione

Dettagli

Fondamenti di Informatica

Fondamenti di Informatica Fondamenti di Informatica Il software Dipartimento di Ingegneria dell Informazione Universitàdegli Studi di Parma SOFTWARE I componenti fisici del calcolatore (unità centrale e periferiche) costituiscono

Dettagli

Architettura dell informazione. Sistemi di ricerca

Architettura dell informazione. Sistemi di ricerca Architettura dell informazione Sistemi di ricerca Sistemi di ricerca Il sistema di ricerca è un elemento centrale della navigazione supplementare. La ricerca è uno degli strumenti preferiti dagli utenti

Dettagli

Uso di un browser (con riferimento a Microsoft Internet Explorer 6.0)

Uso di un browser (con riferimento a Microsoft Internet Explorer 6.0) Uso di un browser (con riferimento a Microsoft Internet Explorer 6.0) Nota Bene: Si raccomanda di leggere queste dispense di fronte al computer, provando passo dopo passo le funzionalità descritte. Per

Dettagli

Informatica per la comunicazione" - lezione 10 -

Informatica per la comunicazione - lezione 10 - Informatica per la comunicazione" - lezione 10 - Pagine dinamiche L accesso a una pagina web può innescare l esecuzione di programmi, ad esempio per eseguire la prenotazione di un biglie8o aereo Ques:

Dettagli

Realizzazione del file system

Realizzazione del file system Realizzazione del file system Struttura del file system Metodi di allocazione: Contigua Concatenata Indicizzata Gestione dello spazio libero Realizzazione delle directory Efficienza e prestazioni Ripristino

Dettagli

Tesi disponibili nell ambito del progetto FP7 ARISTOTELE. Tesi disponibili nell ambito del progetto INDUSTRIA 2015 KITE.it

Tesi disponibili nell ambito del progetto FP7 ARISTOTELE. Tesi disponibili nell ambito del progetto INDUSTRIA 2015 KITE.it Tesi disponibili nell ambito del progetto FP7 ARISTOTELE Ambiente collaborativo per il design e l innovazione Il lavoro si concentrerà sullo sviluppo di specifici componenti di un ambiente collaborativo

Dettagli

Fondamenti di Informatica 7. Linguaggi di programmazione

Fondamenti di Informatica 7. Linguaggi di programmazione I linguaggi di alto livello Fondamenti di Informatica 7. Linguaggi di programmazione Introduzione alla programmazione Caratteristiche dei linguaggi di programmazione I linguaggi di programmazione di alto

Dettagli

Piattaforma ilearn di Hiteco. Presentazione Piattaforma ilearn

Piattaforma ilearn di Hiteco. Presentazione Piattaforma ilearn Presentazione Piattaforma ilearn 1 Sommario 1. Introduzione alla Piattaforma Hiteco ilearn...3 1.1. Che cos è...3 1.2. A chi è rivolta...4 1.3. Vantaggi nell utilizzo...4 2. Caratteristiche della Piattaforma

Dettagli

RILEVANZA = attinenza oggettiva/assoluta PERTINENZA = attinenza soggettiva/relativa (effettivo interesse personale) PUNTO DI FUTILITA ---> ranking

RILEVANZA = attinenza oggettiva/assoluta PERTINENZA = attinenza soggettiva/relativa (effettivo interesse personale) PUNTO DI FUTILITA ---> ranking NOZIONI DI INFORMATION RETRIEVAL a cura di Riccardo Ridi (Università Ca' Foscari di Venezia) aggiornate a Ottobre 2014 RILEVANZA = attinenza oggettiva/assoluta PERTINENZA = attinenza soggettiva/relativa

Dettagli

Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l ambiente e il territorio

Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l ambiente e il territorio Dipartimento di Ingegneria dell Informazione Università degli Studi di Parma Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l ambiente e il territorio Il software di base Software

Dettagli

Documentazione Demo online

Documentazione Demo online READ-IT Documentazione Demo online ILC-CNR ItaliaNLP Lab Sommario 1 MISURAZIONE DELLA LEGGIBILITÀ DI UN TESTO 2 1.1 Analisi globale della leggibilità 3 1.1.1 Valutazione globale della leggibilità del documento

Dettagli

cos è l architettura dell informazione?

cos è l architettura dell informazione? Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 3. Architettura dell informazione cos è l architettura dell informazione? E la progettazione di spazi informativi

Dettagli

Capitolo 6 ELABORAZIONE DI IMMAGINI A COLORI

Capitolo 6 ELABORAZIONE DI IMMAGINI A COLORI Capitolo 6 ELABORAZIONE DI IMMAGINI A COLORI Il colore viene utilizzato nelle immagini digitali per due motivi principali: è un descrittore che semplifica l identificazione di un oggetto e la sua estrazione

Dettagli

Reti di Calcolatori. Lezione 3

Reti di Calcolatori. Lezione 3 Reti di Calcolatori Lezione 3 I livelli di una rete Per ridurre la complessità di progetto, le reti sono in generale organizzate a livelli: Il Formato dei Pacchetti Tutti pacchetti sono fatti in questo

Dettagli

Come rappresentato nello schema precedente Onyx Systems Messaging Security Suite è una soluzione di spam e virus filtering sever side, quindi basata

Come rappresentato nello schema precedente Onyx Systems Messaging Security Suite è una soluzione di spam e virus filtering sever side, quindi basata COME FUNZIONA *Per attivare il servizio di spam e virus filtering è necessario modificare il record MX (mail exchange) del dominio del cliente in modo che tutti i messaggi indirizzati a casella@dominiocliente.it

Dettagli

Facoltà di Scienze e Tecnologie

Facoltà di Scienze e Tecnologie Corso di Laurea in Informatica Applicata Estratto da: Tesi di laurea di: Matteo Parlani Anno Accademico 2006-2007 Indice 1. Introduzione 2. Cepstrum Analysis 3. Caso di studio 4. Esperimenti 5. Risultati

Dettagli

Uso di un browser (con riferimento a Microsoft Internet Explorer 7.0)

Uso di un browser (con riferimento a Microsoft Internet Explorer 7.0) Uso di un browser (con riferimento a Microsoft Internet Explorer 7.0) Nota Bene: Si raccomanda di leggere queste dispense di fronte al computer, provando passo dopo passo le funzionalità descritte. Per

Dettagli

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Corso di Laurea Magistrale in Ingegneria per l Ambiente e il Territorio A.A. 2014-2015 Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Strutture di dati: DB e DBMS DATO E INFORMAZIONE Dato: insieme

Dettagli

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File system verso DBSM Vantaggi di un DBMS Modelli dei dati Utenti

Dettagli

BASI DI DATI INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO PER L ANNO ACCADEMICO 2013 2014 Prof. Gigliola Vaglini, Ing. Francesco Pistolesi

BASI DI DATI INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO PER L ANNO ACCADEMICO 2013 2014 Prof. Gigliola Vaglini, Ing. Francesco Pistolesi BASI DI DATI INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO PER L ANNO ACCADEMICO 2013 2014 Prof. Gigliola Vaglini, Ing. Francesco Pistolesi 1 Descrizione dei requisiti delle fasi di progettazione Si desidera

Dettagli

Le principali novità di Windows XP

Le principali novità di Windows XP Le principali novità di Windows XP di Gemma Francone supporto tecnico di Mario Rinina La nuova versione di Windows XP presenta diverse nuove funzioni, mentre altre costituiscono un evoluzione di quelle

Dettagli

Lo schema concettuale risultante dalla progettazione concettuale è l input alla fase di progettazione logica.

Lo schema concettuale risultante dalla progettazione concettuale è l input alla fase di progettazione logica. Progettazione logica Lo schema concettuale risultante dalla progettazione concettuale è l input alla fase di progettazione logica. La progettazione logica è basata su un particolare modello logico dei

Dettagli

Ing. Gianluca Murgia. murgia@unisi.it. Milano 29/04/2009

Ing. Gianluca Murgia. murgia@unisi.it. Milano 29/04/2009 Ing. Gianluca Murgia murgia@unisi.it Milano 29/04/2009 Sommario Definizione di Social Network Analysis Tipologie di social network Costruzione di una social network Principali indicatori SNA Perché applicarla

Dettagli

Il cervello è un computer?

Il cervello è un computer? Corso di Intelligenza Artificiale a.a. 2012/13 Viola Schiaffonati Il cervello è un computer? Definire l obiettivo L obiettivo di queste due lezioni è di analizzare la domanda, apparentemente semplice,

Dettagli

Lega Italiana per la Lotta contro i Tumori - Sezione Provinciale di Genova

Lega Italiana per la Lotta contro i Tumori - Sezione Provinciale di Genova Lega Italiana per la Lotta contro i Tumori - Sezione Provinciale di Genova Via Caffaro 4/1-16124 Genova Tel +39 010 253 01 60 Fax +39 010 25 30 176 info@legatumori.genova.it CF: 95041690108 Privacy In

Dettagli

CRAWLER. Il primo problema da affrontare per tracciare il Web è la costruzione di Crawler scalabili

CRAWLER. Il primo problema da affrontare per tracciare il Web è la costruzione di Crawler scalabili TRACCIARE IL WEB CRAWLER Il primo problema da affrontare per tracciare il Web è la costruzione di Crawler scalabili per scalabile si intende: quale è il numero P di pagine oltre il quale il Crawler si

Dettagli

Internet e il Direct Marketing

Internet e il Direct Marketing 1 Internet e il Direct Marketing Obiettivi...1 Introduzione...2 Interattività...2 Misurabilità...2 Multimedialità...3 Le opportunità che Internet offre al Direct marketing...3 Raccolta informazioni...3

Dettagli

PIANO DI LAVORO (a.s. 2014/2015) Prof.ssa Andrea Luppichini Prof. Marco Fiorentini DISCIPLINA Informatica

PIANO DI LAVORO (a.s. 2014/2015) Prof.ssa Andrea Luppichini Prof. Marco Fiorentini DISCIPLINA Informatica lllo Istituto Tecnico Commerciale Statale e per Geometri E. Fermi Pontedera (Pi) Via Firenze, 51 - Tel. 0587/213400 - Fax 0587/52742 http://www.itcgfermi.it E-mail: mail@itcgfermi.it PIANO DI LAVORO (a.s.

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: similarità Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Definizioni preliminari

Dettagli

LABORATORIO. 2 Lezioni su Basi di Dati Contatti:

LABORATORIO. 2 Lezioni su Basi di Dati Contatti: PRINCIPI DI INFORMATICA CORSO DI LAUREA IN SCIENZE BIOLOGICHE Gennaro Cordasco e Rosario De Chiara {cordasco,dechiara}@dia.unisa.it Dipartimento di Informatica ed Applicazioni R.M. Capocelli Laboratorio

Dettagli

PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO 147 6/001.0

PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO 147 6/001.0 PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO 147 6/001.0 PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO ELEMENTI FONDAMENTALI PER LO SVILUPPO DI SISTEMI INFORMATIVI ELABORAZIONE DI

Dettagli

Le tecnologie ed i componenti di Ethernet

Le tecnologie ed i componenti di Ethernet Le tecnologie ed i componenti di Ethernet Hub, Bridge, Switch Ethernet Tecnologia LAN dominante: Economica:

Dettagli