UNIVERSITÀ DEGLI STUDI DI SIENA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA INFORMATICA

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "UNIVERSITÀ DEGLI STUDI DI SIENA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA INFORMATICA"

Transcript

1 UNIVERSITÀ DEGLI STUDI DI SIENA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA INFORMATICA Analisi e Sviluppo di Algoritmi per il Suggerimento Automatico di Articoli Scientifici Relatore: Prof. MARCO MAGGINI Correlatore Ing. AUGUSTO PUCCI Tesi di laurea di FILIPPO MARTINELLI Anno Accademico 25/26

2 Indice Introduzione 1 Capitolo 1 Recommender System Introduzione ai Recommender System Esempi di Recommender System reali Paper Recommender System...9 Capitolo 2 Algoritmi di ranking Page Rank Trust Rank PaperRank Implementazione di PaperRank Modelli basati su catene di Markov Matrice Laplaciana di un grafo Pseudoinversa della matrice Laplaciana (L + ) Modello Catena di Markov Average Commute Time (CT) Utilizzo di L + come algoritmo di ranking Implementazione di CT e L Capitolo 3 Dataset Biblioteche digitali ACM Portal WebCraw Costruzione dei dataset Analisi dei dataset...33 Capitolo 4 Risultati sperimentali...41

3 Capitolo 5 Conclusione e sviluppi futuri...56 Bibliografia 58

4 Introduzione Ogni giorno molti ricercatori, alle prese con la scrittura di articoli, report tecnici o presentazioni, devono affrontare il problema del sovraccarico dell informazione ovvero devono filtrare l enorme massa di articoli scientifici esistenti con l obiettivo essenziale di scovare pubblicazioni utili riferite al loro lavoro corrente. Nell era del World Wide Web è diventato, infatti, sempre più facile ottenere documenti, ma una crescita così veloce della disponibilità di risorse potenzialmente utili non è accompagnata da un miglioramento sostanziale dei mezzi per estrarre le informazioni necessarie. Più le persone pubblicano informazione sul WWW e più aumenta la difficoltà di trovare velocemente qualcosa di utile. Nell età dell informazione, sono stati concentrati molti sforzi nello sviluppo di strumenti automatici adatti al filtraggio ed alla gestione del grande quantitativo di informazioni già disponibili. Un servizio molto utile è quello fornito dai sistemi di suggerimento automatico (recommender system), che generano suggerimenti personalizzati per un utente sulla base dell estrazione di conoscenza sulla base delle sue precedenti interazioni con il sistema. In pratica, un sistema di suggerimento costruisce un profilo dell utente basato sulle sue interazioni, implicite o esplicite, con il sistema. Tale profilo è, quindi, utilizzato per trovare prodotti da suggerirgli. L approccio più semplice è quello in cui il profilo è costruito usando solamente caratteristiche che sono relative all utente sotto osservazione ed ai prodotti che lui ha già considerato. Dall altro lato, l approccio più studiato e di maggiore successo al progetto di un sistema di suggerimento automatico è quello basato sul collaborative filtering. In questo caso, ciascun utente collabora con gli altri per stabilire la qualità dei prodotti, fornendo la sua opinione su un insieme di essi. Viene definita, anche, una misura di similarità tra utenti comparando i profili di utenti differenti. I sistemi di suggerimento, per consigliare un prodotto, selezionano gli articoli tra quelli classificati da utenti simili. Concentrando l attenzione sulla produzione di un articolo scientifico, si apre uno scenario applicativo molto interessante, in cui il processo di raffinamento dell informazione e la ricerca bibliografica sono parti chiave fondamentali dell intero lavoro. Un ricercatore ha la necessità di essere quotidianamente aggiornato sulle eventuali innovazioni nell ambito in cui sta studiando e scrivendo; in questo senso, i più moderni sistemi di Information Retrieval, combinati con le biblioteche digitali, costituiscono degli ottimi alleati. D altro canto, il numero degli articoli scientifici pubblicati e resi disponibili sul Web è cresciuto esponenzialmente ed è, tuttora, in espansione, quindi un qualsiasi ricercatore si trova di fronte al problema di scegliere e selezionare articoli dalla smisurata quantità di potenziali candidati. Questo processo di filtraggio è generalmente pesante e richiede molto tempo. Gli strumenti tipici adottati sono le ricerche basate sulle keywords 1

5 Introduzione o sulle citazioni degli articoli; sfortunatamente, entrambe queste tecniche non sono abbastanza accurate ed hanno un basso livello di copertura; infatti, anche gli studiosi più pazienti saranno in grado di esplorare solo i risultati della query basata sulla prima keyword e l analisi delle citazioni sarà molto superficiale. In letteratura sono stati proposti alcuni algoritmi che tentano di superare il problema della ricerca di articoli scientifici significativi. La classe di questi algoritmi viene generalmente definita come Paper Recommender System ed è, semplicemente, un caso speciale dell area di ricerca dei sistemi di suggerimento. Il lavoro ha riguardato l applicazione delle tecniche di suggerimento automatico basate su tre algoritmi: Paper Rank, CT (Commute Time) e L +. Il primo è una evoluzione del PageRank, utilizzato nel motore di ricerca Google per calcolare una misura di rilevanza dei documenti presenti sul Web, il secondo è una tecnica basata sulle catene di Markov, mentre l ultimo si basa su una misura di similarità data dalla pseudo-inversa della matrice Laplaciana del grafo associato alle citazioni fra gli articoli. Sfruttando questi algoritmi, accuratamente adattati al contesto in esame, sono stati compiuti vari esperimenti, collezionando i risultati in modo da poter trarre delle conclusioni sulla validità di queste tecniche nell ambito del suggerimento automatico di articoli scientifici. Il dataset è stato scelto ponendo l attenzione sul mondo delle biblioteche digitali di documenti scientifici, in particolar modo è stato preso in considerazione il portale ACM 1, che risulta uno dei più completi in materia di computer science. 1 2

6 Capitolo 1 Recommender System 1.1 Introduzione ai Recommender System Nell esperienza quotidiana può capitare, spesso, di trovarsi in situazioni in cui siamo costretti a prendere una decisione senza avere una sufficiente conoscenza delle alternative possibili o esperienza personale. Ciò che viene naturale fare in queste situazioni è basarsi sulle opinioni e sulle esperienze di altre persone, che riteniamo essere esperte nell ambito considerato o di cui, in ogni caso, ci fidiamo. In pratica, si va alla ricerca di suggerimenti (recommendation). Esempi banali sono la scelta di un film o di un libro. Chi, prima di andare al cinema, ad esempio, non legge le recensioni del film o chiede pareri a chi lo ha già visto? Riflettere su questi semplici esempi, aiuta a comprendere meglio il concetto di recommendation: può essere visto come un atto comunicativo [1] che si basa sulle preferenze di chi ce le fornisce (recommender) e può essere diretto ad individui specifici oppure in modo broadcast a chiunque ne sia interessato. In ogni caso, per chiunque riceva il suggerimento, costituisce una risorsa che aiuta a prendere delle decisioni da un universo di possibilità ed, in questo senso, può essere visto come un filtro su tale universo, spesso inaccessibile. Questi concetti sono riassunti in figura 1.1, nella quale sono inseriti in un modello generale. Figura 1.1: Modello di un processo di suggerimento 3

7 Capitolo Introduzione ai Recommender System Questo modello è costruito con l idea di essere il più generale possibile e coprire un ampia gamma di processi di suggerimento; quelli reali possono variare da tale modello non istanziando alcuni aspetti. Ad esempio, quotidianamente, i recensori dei film pubblicano le loro recensioni sulle riviste basandole sulle proprie preferenze, senza alcuna specifica conoscenza di ciò che piace al lettore o dei suoi specifici requisiti. Consideriamo, ora, nel dettaglio i cosiddetti sistemi di suggerimento automatico, automated recommender systems. Lo sviluppo del WWW e la sua crescita di utilizzo hanno portato ad un mondo di infinite possibilità: siti Web interattivi in cui è possibile ascoltare musica, partecipare a conversazioni, leggere esperienze di altre persone, ordinare e comprare qualsiasi articolo o prodotto esistente, ecc. I più grandi e popolari siti di e-commerce offrono, al giorno d oggi, migliaia di prodotti differenti in vendita; quindi, scegliere tra così tante possibilità è difficoltoso per i consumatori. I sistemi di suggerimento sono nati in risposta a questo problema. Un tale sistema in questo ambito suggerisce, o meglio propone, alcuni prodotti che sembrano soddisfare di più i bisogni di un determinato consumatore che vi accede. Più in generale, un tipico sistema di suggerimento genera ed offre proposte attraverso 3 passi [2]: 1. L utente fornisce una qualche forma di input al sistema. Tali input possono essere impliciti ed espliciti. Le quotazioni (ratings) sottoposte dagli utenti, ad esempio, sono degli input espliciti, mentre gli URL visitati o il tempo speso nel leggere un sito web fanno parte della categoria degli input impliciti. 2. Tali input sono uniti per formare una rappresentazione di ciò che piace all utente e di ciò che, invece, non piace; ovvero si provvede a costruire il cosiddetto profilo. Questa rappresentazione potrebbe essere semplice, come una matrice di rating di articoli o prodotti, oppure più complessa come una struttura dati che combina entrambe le informazioni di valutazione e di contenuto. 3. Il sistema calcola i suggerimenti utilizzando questi profili-utente. È possibile suddividere i sistemi di suggerimento in alcune classi sulla base delle politiche adottate per la definizione delle preferenze (come e da chi sono ottenute), dei ruoli e delle comunicazioni (decidere se affidare il ruolo del suggeritore direttamente ad un sistema di calcolo oppure ad una persona con il suo supporto), degli algoritmi (come calcolare i suggerimenti) ed infine dell interazione uomo-computer (come presentare i suggerimenti all utente che li attende). Le categorie che vengono fuori dal tipo di approccio che si sceglie per affrontare queste questioni sono le seguenti: 4

8 Capitolo Introduzione ai Recommender System - Collaborative Filtering Systems: richiedono agli utenti in cerca di un suggerimento, di esprimere delle preferenze attraverso la valutazione di alcuni articoli, fondendo di fatto quel ruolo con quello di fornitore delle preferenze. - Content-Based Systems: utilizzano solo le preferenze dell utente in attesa di suggerimenti, tentando di suggerire articoli o prodotti simili a quelli che piacevano all utente in passato. - Recommendation Support Systems: funzionano come strumenti per supportare le persone nella condivisione di documenti, aiutando sia chi produce il suggerimento, sia chi ne è in attesa. - Social Data Mining Systems: cercano di sfruttare le informazioni implicite delle preferenze degli utenti nei documenti o archivi delle attività già esistenti, estraendo le preferenze implicite dagli archivi elettronici relativi ad attività sociali, come ad esempio messaggi, citazioni o hyperlinks. Concentriamo l attenzione sulle prime due categorie, che negli ultimi tempi sono state oggetto di uno studio e sviluppo maggiore da parte dei ricercatori [2]. I Collaborative Filtering Systems sono un tentativo di simulare una collaborazione tra gli utenti per la condivisione di suggerimenti e recensioni. Essi si basano su tecniche che tentano di associare persone con interessi simili per poi generare suggerimenti su tali basi. Questo approccio si basa su tre principi fondamentali: 1. Devono partecipare molti individui per trovare più facilmente persone con interessi simili. 2. Deve esistere un modo molto semplice e facile per far rappresentare agli utenti le loro preferenze nel sistema. 3. Gli algoritmi utilizzati devono essere in grado di associare persone con gli stessi interessi. Questi sistemi hanno reso il compito dell utente abbastanza semplice; la maggior parte di loro si basa sul modello nearest neighbours: l utente esprime le sue preferenze valutando gli articoli o prodotti (ad esempio libri, CD, ) che gli sono presentati dal sistema. Queste quotazioni funzionano, poi, come una rappresentazione approssimata delle preferenze dell utente in quel particolare dominio. Il sistema, a questo punto, le confronta con quelle espresse dagli altri fruitori del sistema. Il risultato è l insieme dei nearest neighbours (i vicini più prossimi all utente in esame) che formalizza il concetto di persone con le stesse preferenze. Quindi, il sistema propone articoli o prodotti che i nearest neighbour hanno valutato nelle posizioni più alte e che non erano stati valutati in precedenza. E inoltre possibile, per l utente, quotare immediatamente gli articoli proposti dal sistema che non gli interessano; quindi, quotazione dopo quotazione, il sistema acquisisce una rappresentazione sempre più accurata delle preferenze ed, in questo senso, teoricamente, riesce sempre meglio a proporre articoli soddisfacenti. 5

9 Capitolo Introduzione ai Recommender System Un problema legato a questo tipo di approccio è il quello della partenza a freddo (cold start problem) [3], ovvero nel momento del primo utilizzo del sistema non ci sono abbastanza utenti con cui cercare delle similarità. Un'altra difficoltà è quella del primo valutatore (first rater problem) [3], relativa al fatto che quando viene aggiunto un nuovo articolo al sistema, poiché nessuno lo ha ancora valutato, non è possibile che esso possa essere proposto ad alcuno. Passiamo all analisi dei Content-based System. Tali sistemi suggeriscono prodotti basandosi sul contenuto degli stessi piuttosto che sulle valutazioni di altri. Questi sistemi si compongono di 4 passi essenziali: 1. Raccogliere i dati del contenuto dei vari articoli, ad esempio, nel caso dei libri: titolo, autori, descrizione, ecc. 2. Chiedere all utente di fornire alcune valutazioni su articoli o prodotti casuali. 3. Compilare un profilo dell utente utilizzando le informazioni sul contenuto estratte al primo passo e le informazioni di rating fornite dal secondo passo. 4. Confrontare il contenuto dei libri non valutati con i profili compilati nel terzo passo ed assegnare un punteggio agli articoli in base alla qualità del confronto. I prodotti sono ordinati in base al loro punteggio e presentati in ordine. Problemi legati a questo tipo di approccio possono essere che in alcuni ambiti di interesse non ci sono informazioni sul contenuto disponibili, oppure tale contenuto è difficile da analizzare, oppure che esprimere le preferenze e la qualità in forma numerica non è un compito banale. Questo tipo di sistema può suggerire solo articoli il cui contenuto è associabile al profilo dell utente. Se questi ha delle preferenze che non vengono rappresentate nel suo profilo, gli articoli che riguardano tali preferenze non gli saranno mai proposti. Studiando i problemi relativi ai due approcci e notando che uno svantaggio per uno non lo è necessariamente per l altro, molti ricercatori hanno provato a combinare questi due orientamenti, ottenendo una sorta di modello ibrido. Ad esempio in [4] è stata introdotta l idea dei Filterbots, in altre parole dei robots software che valutano automaticamente un nuovo articolo, usando l informazione del contenuto dello stesso, non appena il nuovo articolo è inserito nel database. I Filterbots agiscono nel sistema come gli altri utenti, ad eccezione del fatto che essi devono valutare un numero molto maggiore di articoli rispetto ad un utente tipico ed, ovviamente, non chiedono al sistema nessun suggerimento. I Filterbots, quindi, sono pensati per superare il problema del primo valutatore. In [3] è stato introdotto un sistema chiamato Fab, un sistema di suggerimento automatico per il Web. In questo sistema, i profili degli utenti vengono costruiti usando per prime le informazioni del contenuto; dopodichè, ogni utente viene correlato con tutti gli altri utilizzando questi profili anziché, semplicemente, le quotazioni. Una volta che si sono individuati i neighbours 6

10 Capitolo Introduzione ai Recommender System per l utente attivo, le predizioni vengono calcolate utilizzando i metodi collaborative filtering. Ad ogni modo, per ottenere un buon funzionamento, la costruzione di profili accurati è un passo cruciale. 1.2 Esempi di Recommender System reali In [5] sono descritti alcune compagnie di e-commerce che utilizzano una o più varianti della tecnologia dei sistemi di suggerimento nei loro siti web. Vediamone qualcuno. Il primo in esame è Amazon.com 2, in cui si concentra l attenzione nei sistemi di suggerimento della sezione book. Le caratteristiche principali sono le seguenti: - Customers Who Bought: come molti siti di e-commerce, anche Amazon.com è strutturato con una pagine informativa per ciascun libro, che fornisce dettagli sul testo ed informazioni sull acquisto. Il servizio Customers Who Bought si trova nella pagina informativa di ciascun libro nel catalogo. In realtà, esistono due liste di suggerimento separate. La prima propone i libri più frequentemente acquistati dai clienti che hanno comprato il libro selezionato; la seconda gli autori dei libri più frequentemente comprati dai clienti che hanno acquistato opere dell autore del libro selezionato. - Your Recommendations: Amazon.com incoraggia anche feedback diretti tra clienti che hanno già letto i libri. Essi assegnano un punteggio su una scala da 1 a 5, da hated it a loved it. Dopo aver votato un insieme di libri, un cliente potrebbe richiedere suggerimenti per quelli che potrebbero piacergli. A questo punto, gli viene presentata una mezza dozzina di testi non votati, che sono correlati con i gusti da lui indicati. - Eyes: questa caratteristica permette ai clienti di essere informati via riguardo all aggiunta di nuovi prodotti al catalogo di Amazon.com. È possibile, quindi, inserire richieste sulla base di informazioni sull autore, sul titolo, sul soggetto o sulla data di pubblicazione. Un cliente può usare interrogazioni booleane semplici o più complesse. - Amazon.com Delivers: è una variazione della caratteristica Eye. I clienti selezionano dei checkbox per scegliere da una lista di categorie o generi specifici (bibliografie, libri di cucina, ecc). Periodicamente gli editori presso Amazon.com inviano i loro ultimi suggerimenti per agli iscritti a ciascuna categoria. - Bookstore Gift Ideas: tale caratteristica permette di ricevere suggerimenti dagli editori. I clienti scelgono una categoria di libri per i quali desiderano ricevere qualche suggerimento. Navigando nella sezione Gift Department, possono vedere una lista generale di raccomandazioni create 2 7

11 Capitolo Esempi di Recommender System reali - dagli editori di Amazon.com. In qualche modo, funziona come una versione on-line della caratteristica Amazon.com Delivers. I clienti, inoltre, possono ottenere suggerimenti anonimamente, dal momento che non è necessaria la registrazione al sito come è per Delivers. - Customer Comments: permette ai clienti di ricevere suggerimenti testuali basati sulle opinioni di altri. Localizzata nella pagina informativa, per ciascun libro c è una lista di valutazione da 1 a 5 e commenti scritti dai clienti che hanno già letto il libro in esame; i clienti possono così inglobare questi suggerimenti nella loro decisione di acquisto. - Purchase Circles: permette ai clienti di vedere la lista dei top 1 per una data regione geografica, compagnia, istituto didattico, governativo o altro. Per esempio, un cliente potrebbe richiedere di vedere quali sono i best-seller per i clienti presso Oracle, MIT o residenti a New York City; è possibile vedere il Purchase Circle navigando nel Circle di loro interesse. Il secondo esempio è Drugstore.com 3, le cui caratteristiche sono: - Advisor: tale caratteristica permette ai clienti di indicare le loro preferenze acquistando un prodotto da una categoria tipo scottatura o rimedi per l influenza ; essi indicano i sintomi che desiderano alleviare (naso gocciolante e starnuti), la forma del medicinale (capsule) e l'età del paziente a cui vogliono somministrare il prodotto (adulto). Una volta fornito di queste informazioni, l advisor restituisce una lista di prodotti raccomandati alle condizioni indicate. - Test Driver: in tale caratteristica, ad un gruppo di volontari, composto di clienti del sito, è inviato un nuovo prodotto. Questi clienti tipo forniscono revisioni del prodotto, incluso una valutazione di punteggio e commenti scritti. Un altro esempio riportato in [5] è ebay 4, le cui caratteristiche principali sono: - Feedback Profile: permette che sia i compratori sia i venditori contribuiscano ai profili di altri clienti con i quali hanno effettuato la compravendita. I feedback consistono in una valutazione di soddisfazione (soddisfatto/neutro/insoddisfatto) ed in un commento specifico circa l'altro acquirente. I feedback sono usati per fornire un sistema di suggerimento per gli acquirenti, che possono osservare il profilo dei venditori. Questo profilo consiste in una tabella riferita ad ogni valutazione fatta nei 7 giorni precedenti, durante il mese, e nei 6 mesi trascorsi, così come un sommario generale (per esempio, 867 feedback positivi da 776 clienti unici). Su ulteriore richiesta, i clienti possono passare in rassegna le diverse valutazioni ed osservazioni per i venditori

12 Capitolo Esempi di Recommender System reali - Personal Shopper: permette ai clienti di indicare gli articoli a cui sono interessati per l'acquisto. I clienti immettono un breve termine (3/6/9 giorni) e cercano su un insieme di keyword la loro scelta, compreso il loro limite di prezzo. Su una base periodica (intervalli di uno o di tre giorni) il sito effettua la ricerca su tutte le aste nel sito e trasmette al cliente un con i risultati di questa ricerca. Molti altri sistemi di suggerimento sono stati sviluppati per lavorare con tipi differenti di articoli o prodotti, tipo MovieLens per i film [6], GroupLens per le usenet news [7], Ringo per la musica [8] o Jester per le barzellette [9]. 1.3 Paper Recommender Systems Come detto nell introduzione, lo studio di cui siamo interessati è l applicazione dei sistemi di suggerimento all ambito degli articoli scientifici. In letteratura sono stati proposti vari algoritmi per trattare questo tipo di problema. Questa classe di algoritmi è solitamente indicata come Sistemi di Suggerimento di Articoli (Paper Recommender System) ed è un caso speciale dell area di ricerca dei sistemi di suggerimento. Un semplice esempio basato sul testo e sulle citazioni è stato proposto in [1], ma questo sistema genera delle proposte solamente all interno di un singolo libro digitale. Uno più interessante è quello descritto in [11], dove gli autori propongono un approccio al suggerimento di articoli scientifici basato sui filtri collaborativi ed utilizzano il grafo delle citazioni tra gli articoli per creare le valutazioni. Gli autori testano, inoltre, 6 differenti approcci su un sottoinsieme di 186. articoli scientifici contenuti in Research Index 5. Un altro approccio interessante è stato proposto in [12], l idea è che i ricercatori, che operano nello stesso campo, tendono ad essere interessati agli stessi articoli, quindi è possibile migliorare i risultati della ricerca utilizzando dei suggerimenti basati sulle ricerche effettuate in precedenza da altre persone con interessi simili. Recentemente, in [13] è stato proposto un approccio basato sul grafo; gli autori confrontano differenti algoritmi di ranking per calcolare un ordinamento di preferenza dei prodotti, in questo caso film, da suggerire ad un gruppo di utenti. Prima di analizzare nel dettaglio gli algoritmi di ranking utilizzati in questo lavoro, presentiamo in modo più formale il problema in esame, ovvero quello del suggerimento di articoli scientifici. Si consideri un utente attivo u che stia scrivendo un articolo scientifico o, in generale, un qualsiasi documento che contenga riferimenti e citazioni. Tale documento è indicato con p. Si supponga, 5 9

13 Capitolo Paper Recommender Systems inoltre, che l utente u abbia accesso ad una biblioteca digitale, tipo ACM Portal, CiteSeer o IEEE Xplorer, per consultare libri, riviste, pubblicazioni e qualsiasi materiale riferito all argomento che sta trattando. L insieme di documenti nella biblioteca è indicato con D = { pi : i = 1, L, n}, inoltre, per ogni articolo p i si considera l insieme R = p : p è citato da p }, il quale contiene tutti gli pi { j j i articoli citati da p i, ovvero vale D R pi. Si fa l ipotesi che anche l utente u abbia già citato nella lista dei riferimenti qualche altro elemento appartenente a D, quindi R Ø. p Il compito di un sistema di suggerimento, in questo contesto, è quello di calcolare un punteggio (score) significativo s(p i ) per ogni p i D, tale che più alto è il punteggio di p i e più alta dovrebbe essere la sua rilevanza rispetto all argomento di p.in pratica, significa che, se un articolo p i ha un punteggio s(p i ) alto, esso dovrebbe essere un buon candidato ad essere incluso nella lista dei riferimenti R e dovrebbe essere suggerito dal sistema all utente u come sorgente di informazione p preziosa relativa al nuovo articolo che sta scrivendo. È, poi, possibile avere un interpretazione grafica della struttura delle citazioni di D, introducendo il Grafo delle Citazioni G~. Tale grafo è formato da n nodi, uno per ciascun articolo presente in D, c perciò con pi ci si riferisce indifferentemente sia ad un articolo in D sia ad un nodo in quanto riguarda gli archi, si considera il Grafo delle Citazioni non diretto ed, inoltre, la coppia di nodi (pi,p j ) e (p j,p i ) appartiene all insieme degli archi se e solo se l articolo p i cita p j o viceversa. In modo più formale: p, p ),( p, p ) Archi{ G }) ( p R p R ). (( i j j i ~ c i pj j pi L utilizzo di un grafo non diretto è dovuto al fatto che in questo ambito siamo interessati, solamente, a tenere conto delle relazioni cita / è citato tra due articoli, che implicano una correlazione a livello di argomento tra la particolare coppia di documenti, senza alcuna distinzione tra quello che cita e quello che è citato. Definito il Grafo delle Citazioni, è possibile definire la Matrice di Connettività C ~ corrispondente come: ~ 1 se ( pi, p j ) Archi{ G~ c } C i, j = altrimenti (2.1) ovviamente, per come è costruita, C ~ è una matrice simmetrica e i, ~, =. Tale matrice è, quindi, normalizzata in modo tale da ottenere una matrice stocastica C i j C i, j j G~ c. Per ~ Ci, j =, dove w j è la w somma degli elementi della j-esima colonna dic ~. C è la Matrice di Correlazione del grafo e può essere considerata come una matrice di connettività pesata per il Grafo di Correlazione G c. La matrice di Correlazione, al contrario di quella di Connettività, non è simmetrica. 1

14 Capitolo Paper Recommender Systems Il Grafo di Correlazione è un prezioso modello grafico utile per esplorare la correlazione tra articoli, i pesi associati agli archi forniscono una misura approssimativa della correlazione relativa articolo/articolo, in accordo all informazione estratta dalla struttura di co-citazione all interno della collezione di documenti D. 11

15 Capitolo 2 Algoritmi di Ranking La quantità di informazioni disponibili in formato elettronico negli ultimi anni è cresciuta in maniera esponenziale, basta pensare al World Wide Web, in cui i navigatori di Internet trovano centinaia di milioni di pagine, ma anche alle banche dati disponibili on-line che coprono i campi più disparati: dalla medicina alle leggi, agli articoli scientifici. L aumento della mole di dati consultabili ha, però, avuto come conseguenza da parte degli utenti l accresciuta difficoltà di ricercare le informazioni interessanti per i propri scopi (tale difficoltà viene sovente indicata come information overload: impossibilità di trovare le informazioni rilevanti a causa dell eccessiva quantità di informazioni da controllare) e, con essa, la necessità di avere a disposizione degli strumenti efficaci per il recupero dell informazione. E in questo scenario che si colloca quel settore dell informatica che va sotto il nome di Information Retrieval. Quindi, in breve, l Information Retrieval si occupa dei problemi relativi alla memorizzazione, rappresentazione e reperimento di documenti. In questo ambito diventano molto importanti gli algoritmi di ranking, perché permettono di determinare un ordinamento delle informazioni, ad esempio i risultati di una ricerca, assegnando loro un punteggio, rank. Gli algoritmi di ranking sono utilizzati nei motori di ricerca del web in cui assegnano un punteggio ad ogni pagina ed, in base a questo, ciascuna pagina ottiene una posizione differente nei risultati: più alto il punteggio migliore la posizione. 2.1 PageRank Il PageRank è un metodo per il calcolo di un ranking delle pagine web basato sul grafo del web, proposto in [19] da L.Page, S.Brin, R.Motwani e T.Winograd con l obiettivo di misurare la loro importanza relativa. Tale metodo può essere applicato nella ricerca, nella navigazione e nella stima del traffico. Il noto motore di ricerca Google 6, ad esempio, attraverso l utilizzo del PageRank riesce oggi a fornire risultati altamente pertinenti stabilendo in modo del tutto automatizzato una misurazione oggettiva dell'importanza di ogni singola pagina web presente nel suo database. Per utilizzare tale metodo, così come per quelli derivanti da esso, si deve modellare il web come un grafo G = (V, E), dove V è l insieme dei nodi, connessi tramite archi diretti appartenenti all insieme 6 12

16 Capitolo PageRank E. In generale, una pagina web p può avere hyperlinks HTML multipli verso qualche altra pagina q; in questo caso, essi sono collassati in un unico link (p, q), appartenente all insieme E. In figura 2.1 si riporta un esempio molto semplice di grafo web, composto di 4 pagine e 4 link. Figura 2.1: esempio di grafo web Ciascuna pagina è caratterizzata da archi entranti ed uscenti, detti, rispettivamente, inlinks ed outlinks. Il numero di inlinks di una pagina p è il suo in-degree l(p), mentre il numero di outlinks è il suo out-degree w(p). Ad esempio, l in-degree per la pagina 3 di figura 2.1 è pari a 1, mentre il suo out-degree è pari a 2. Le pagine, che non hanno in-links, sono dette unreferenced pages, mentre quelle senza out-links sono note come non-referencing pages. Inoltre, le pagine, che sono sia unreferenced che nonreferencing, sono dette isolated pages. Un siffatto grafo è rappresentato mediante una matrice di Connettività C ~, dove la generica posizione (i, j) è pari ad 1 se (p i, p j ) E, altrimenti. Tale matrice è normalizzata in modo tale da ~ Ci, j ottenere una matrice stocastica Ci, j =, dove w j è la somma degli elementi della j-esima colonna w j dic ~. Indichiamo, quindi, con C la matrice di Correlazione del grafo. L intuizione che sta alla base del PageRank è che una pagina web è di grande interesse se molte altre pagine web importanti puntano ad essa. Di conseguenza, il PageRank si basa sul rafforzamento reciproco: l importanza di certe pagine influenza ed è influenzata dall importanza di altre. L algoritmo di PageRank classico calcola lo score di importanza PR(p) per ciascuna pagina p V in accordo alla connettività del grafo. Lo score PageRank può essere definito come: PR( q) 1 PR( p) = α + (1 α) (2.1) w V q:( q, p) E dove w q è l out-degree della pagina q ed α 7 è un fattore di decadimento. Esistono ulteriori definizioni equivalenti di PageRank [19], che possono differire leggermente nella formulazione matematica e nelle proprietà numeriche, ma che producono lo stesso ordinamento tra due qualsiasi pagine web. L equazione 2.1 può essere scritta in una forma matriciale equivalente: q 7 Una scelta comune per α è.85 13

17 Capitolo PageRank PR C PR 1 = α + ( 1 α) V 1 V (2.2) dove C è la matrice di connettività normalizzata per il grafo G e 1 V è un vettore di 1 lungo V. Analizzando le equazioni 2.1 e 2.2 si evidenzia che lo score di una pagina p è la somma di due componenti: una parte deriva dalle pagine che puntano p, mentre l altra (statica) è uguale per tutte le pagine web. Il PageRank può essere calcolato iterativamente, ad esempio, applicando il metodo di Jacobi [2]; mentre in senso strettamente matematico, le iterazioni dovrebbero portare alla convergenza, nella pratica è più comune usare un numero fissato I di iterazioni. È importante notare che tale algoritmo assegna, nella sua versione classica, lo stesso score statico a ciascuna pagina; per non tener conto di questa regola è stata introdotta una versione pesata, biased PageRank, generalizzando l equazione 2.2: PR = α M PR + ( 1 α ) d (2.3) dove M è una matrice stocastica, i cui elementi sono non-negativi e sommano ad 1 per tutte le colonne, e d è un vettore di distribuzione dello score statico, formato da elementi arbitrari non negativi la cui somma è 1. Nel biased PageRank si sfrutta, dunque, il vettore di distribuzione dello score statico d per assegnare uno score statico diverso da solamente ad un insieme di pagine; tale score è poi diffuso durante le iterazioni alle pagine che essi puntano. In questo modo è possibile differenziare le pagine, dando maggiore o minore importanza ad alcune di esse durante l inizializzazione dell algoritmo, rendendo possibile sia lo sfruttamento di una qualche conoscenza a priori sulle pagine sia l adattamento del PageRank ad ambiti differenti. Ad esempio, versioni pesate dell algoritmo di PageRank sono state sviluppate in [21, 22] e sono stati applicati vettori d, ad esempio, per combattere il web spam [23] o per determinare la reputazione di un nodo una rete peer-to-peer [24]. 2.2 TrustRank Il TrustRank è una particolare versione del biased PageRank, introdotta in [23] da Z.Gyöngyi, H. Garcia-Molina, J. Pedersen, con l obiettivo di sviluppare una tecnica semiautomatica per combattere il web spam. Stabilire se una pagina sia effettivamente spam o meno è un compito soggettivo e richiede la valutazione umana, compito assai costoso visto la vastità di materiale da analizzare. 14

18 Capitolo TrustRank È possibile formalizzare la nozione del controllo umano su una pagina con una funzione oracolo O binaria, valutata su tutte le pagine appartenenti al grafo rappresentante il web, che assume 1 se la pagina è buona (non spam) e in caso contrario (spam). Le invocazioni dell oracolo sono costose e richiedono tempo, perciò per limitare questo problema si può stimare semplicemente la verosimiglianza che una pagina sia buona. Più formalmente, si definisce una trust function T, in modo tale da produrre un range di valori compresi tra (pagine non buone) ed 1 (pagine buone). Idealmente, per ogni pagina p, T(p) dovrebbe dare la probabilità che p sia buona: Ideal Trust Property: T ( p) = Pr[O( p) = 1]. Nella pratica trovare una funzione T con tale proprietà è molto arduo. In ogni caso, anche se T non misura accuratamente tale verosimiglianza, risulta, comunque un valido aiuto nell ordinare le pagine sulla base della loro verosimiglianza. Ovvero, data una coppia di pagine p e q con T(p) < T(q), essa dovrebbe indicare che q è più simile ad essere buona rispetto a p. Più formalmente, quindi, una proprietà desiderabile per la funzione di trust è la seguente: Ordered Trust Property: T ( p) < T ( q) Pr T ( p) = T ( q) Pr [ O( p) = 1] < Pr[ O( q) = 1] [ O( p) = 1] = Pr[ O( q) = 1] Vediamo in che modo è possibile effettuare il calcolo del trust. Data una quantità limitata L di invocazioni di O, è naturale scegliere un sottoinsieme random S di L pagine e invocare l oracolo sui suoi elementi; l insieme S è detto insieme seed. Poiché le pagine restanti non sono state controllate dagli esperti umani, si assegna loro un trust score di 1/2 per sottolineare la mancanza di informazione, quindi, è possibile chiamare questo schema ignorant trust function T, definita per ogni pagina. Definito T, si prosegue sfruttando due importanti proprietà di cui gode il TrustRank: - Trust Propagation: si cerca di trarre vantaggio dall isolamento approssimato delle pagine buone. Aspettandosi che esse puntino solamente altre pagine buone, si assegna uno score pari ad 1 a tutte le pagine buone che sono raggiungibili da un seed in M o meno passi. Tale schema è indicato con M-Step Trust Function T M. Tramite semplici esperimenti, si evidenzia che per M=1 e M=2 T M dà risultati migliori rispetto a T ; mentre all aumentare di M ciò non è più verificato. Il problema è che con M-Step Trust non c è assolutamente la certezza che pagine raggiungibili dai seed siano ancora buone, in aggiunta più ci si allontana da questi ultimi e minore è la certezza che una pagina sia buona. Trust Attenuation: tali osservazioni suggeriscono di ridurre il trust man mano che ci si allontana dai seed. 15

19 Capitolo TrustRank Esistono varie strategie per realizzare tale attenuazione. La figura 2.2(a) illustra la prima idea, detta trust dampening. Poiché la pagina 2 ha un link dal seed 1, si assegna ad esso un trust score dampened di β, dove β < 1. Poiché la pagina 3 è raggiungibile in uno step dalla 2 con score β, esso prende score dampened di β * β. La seconda tecnica, detta trust splitting, si basa sulla seguente osservazione: la cura con cui le persone aggiungono link alle proprie pagine è inversamente proporzionale al numero totale di link presenti. Ovvero, se una pagina buona ha pochi link uscenti allora è verosimile che quelle puntate da essi siano ancora buone. Tale osservazione porta a dividere il trust come esso si propaga: dato una pagina p con score T(p) e con w(p) link uscenti, ciascuno delle w(p) pagine puntate riceve una frazione dello score, T(p) / w(p), da p. In questo caso, lo score attuale di una pagina è la somma delle frazioni di score ricevute attraverso i suoi in-links. Intuitivamente, più credito una pagina accumula da qualche altra, più probabilmente essa è buona. Un esempio è riportato nella figura 2.2(b). Figura 2.2: (a) Trust dampening, (b) Trust splitting Esistono vari modi per implementare il trust dampening e/o splitting. Una possibile implementazione condivide la stessa formulazione matematica con il calcolo del biased PageRank in M step. Questa caratteristica significa che è possibile rifarsi al codice del PageRank, con pochi cambiamenti, per calcolare il trust score. Il vantaggio risultante è molto importante perché sono stati spesi molti sforzi nel rendere efficiente la computazione del PageRank con dataset molto grandi (vedi [25, 26]). L equazione del TrustRank può, quindi, essere facilmente derivabile dall equazione 2.3. Si utilizza il grafo G per calcolare il vettore di TustRank IR, dove l i-esima componente IR i corrisponde al valore di TrustRank della pagina p i ; ovviamente questi valori dipendono anche dall insieme di pagine scelto come seed. Per eseguire il calcolo di IR, si sostituisce la matrice stocastica M dell equazione 2.3 con la matrice di Correlazione C e si può essere modellare la dipendenza tra IR ed insieme seed costruendo semplicemente un vettore di distribuzione dello score statico d dipendente dai seed. L equazione risultante è: 16

20 Capitolo TrustRank IR = α C IR + ( 1 α ) d (2.4) dove d è stato costruito definendo il vettore non normalizzato d ~, rispetto alla i-esima componente, come: ~ 1 se pi seed di = altrimenti ~ d Quindi, il vettore normalizzato d è dato dalla semplice relazione d = ~. d Il TrustRank, come definito dall equazione 2.4, può essere calcolato anche iterativamente nel seguente modo: 1 IR() = 1 seed seed (2.5) IR( t + 1) = α C IR( t) + (1 α) d 2.3 PaperRank L algoritmo di TrustRank, descritto precedentemente, è applicato alle pagine web con l obiettivo di ottenere una loro classificazione sulla base della verosimiglianza ad essere pagine spam o meno. Ciò che si vuole fare è introdurre un nuovo algoritmo, PaperRank, definendolo come una variante del TrustRank applicabile agli articoli scientifici, nell ambito dei recommender system. L idea che sta alla base dell algoritmo di PaperRank è la possibilità di sfruttare il modello fornito dal Grafo di Correlazione G c per ricercare articoli scientifici da suggerire ad un utente, sulla base di quelli già scelti come parte della bibliografia corrente Considerando, infatti, l insieme degli articoli contenuti in R è possibile utilizzare l informazione presente nel grafo G c in modo tale da incrementare le preferenze dell utente attraverso il Grafo di Correlazione; ovviamente si deve controllare correttamente il flusso di preferenza in modo tale da assegnare valori di score alti a quei documenti che sono fortemente relazionati a quelli appartenenti a R e bassi agli altri. P La prima variazione evidente, che si deve introdurre per definire PaperRank è il dataset su cui si lavora. Mentre il TrustRank lavora su pagine web e, quindi, sul grafo G con cui è rappresentato il web, nel caso di PaperRank il dataset è costituito da un insieme di articoli scientifici. Tale dataset, come spiegato nel paragrafo 1.3, è rappresentabile mediante il grafo di Correlazione G c, non introducendo, quindi, nessuna variazione rispetto al caso del TrustRank. R. P P 17

Metodi basati sugli autovettori per il Web Information Retrieval

Metodi basati sugli autovettori per il Web Information Retrieval Metodi basati sugli autovettori per il Web Information Retrieval HITS, PageRank e il metodo delle potenze LSI e SVD LSI è diventato famoso per la sua abilità nel permettere di manipolare i termini (all

Dettagli

Metodi Computazionali

Metodi Computazionali Metodi Computazionali Elisabetta Fersini fersini@disco.unimib.it A.A. 2009/2010 Catene di Markov Applicazioni: Fisica dinamica dei sistemi Web simulazione del comportamento utente Biologia evoluzione delle

Dettagli

Il PageRank è obsoleto? Via libera al TrustRank

Il PageRank è obsoleto? Via libera al TrustRank Il PageRank è obsoleto? Via libera al TrustRank Prefazione: Questo documento si basa sull originale Combating web spam with TrustRank firmato da alcuni ricercatori del dipartimento di Computer Science

Dettagli

Sorgenti autorevoli in ambienti hyperlinkati.

Sorgenti autorevoli in ambienti hyperlinkati. Sorgenti autorevoli in ambienti hyperlinkati. La qualità di un metodo di ricerca richiede la valutazione umana dovuta alla soggettività inerente alla nozione di rilevanza. I motori di ricerca correnti,

Dettagli

Reti complesse Ranking

Reti complesse Ranking Reti complesse Ranking dellamico@disi.unige.it Applicazioni di rete 2 A.A. 2006-07 Outline 1 Ricerca sul web Ranking 2 L'ago nel pagliaio Ricerca sul web Ranking Immaginiamo di avere una biblioteca con

Dettagli

Metodi iterativi per sistemi lineari

Metodi iterativi per sistemi lineari Metodi iterativi per sistemi lineari Dario A. Bini, Università di Pisa 30 ottobre 2013 Sommario Questo modulo didattico contiene risultati relativi ai metodi iterativi per risolvere sistemi di equazioni

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

Capitolo 2. Un introduzione all analisi dinamica dei sistemi

Capitolo 2. Un introduzione all analisi dinamica dei sistemi Capitolo 2 Un introduzione all analisi dinamica dei sistemi Obiettivo: presentare una modellistica di applicazione generale per l analisi delle caratteristiche dinamiche di sistemi, nota come system dynamics,

Dettagli

Note del Corso di Modelli Biologici Discreti: Un paio di algoritmi DNA per risolvere SAT

Note del Corso di Modelli Biologici Discreti: Un paio di algoritmi DNA per risolvere SAT Note del Corso di Modelli Biologici Discreti: Un paio di algoritmi DNA per risolvere SAT Giuditta Franco Corso di Laurea in Bioinformatica - AA 2012/2013 Uno dei più grossi risultati nell informatica degli

Dettagli

Le catene di Markov come metodologia utilizzata dai motori di ricerca per classificare le pagine web su internet.

Le catene di Markov come metodologia utilizzata dai motori di ricerca per classificare le pagine web su internet. Università degli Studi di Palermo Facoltà di Economia Dipartimento di Scienze Statistiche e Matematiche S. Vianelli Dottorato di Ricerca in Statistica e Finanza Quantitativa - XXI Ciclo Sergio Salvino

Dettagli

Ricerca Operativa 2. Introduzione al metodo del Simplesso

Ricerca Operativa 2. Introduzione al metodo del Simplesso Ricerca Operativa 2. Introduzione al metodo del Simplesso Luigi De Giovanni Giacomo Zambelli 1 Problemi di programmazione lineare Un problema di ottimizzazione vincolata è definito dalla massimizzazione

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

Sommario della lezione

Sommario della lezione Sommario della lezione Ulteriori applicazioni del Massimo Flusso 1. Connettività di grafi. Selezione di progetti 3. Trasporto in reti 4. Eliminazione in tornei Università degli Studi di Salerno Corso di

Dettagli

Sistemi Informativi Multimediali 1 - Introduzione

Sistemi Informativi Multimediali 1 - Introduzione Che cos è un sistema informativo multimediale? Sistemi Informativi li 1 - Introduzione Augusto Celentano Università Ca Foscari di Venezia Un sistema informativo multimediale (MMDBMS) è un framework che

Dettagli

Network complessi e modelli. Rossano Gaeta Università degli Studi di Torino

Network complessi e modelli. Rossano Gaeta Università degli Studi di Torino Network complessi e modelli Rossano Gaeta Università degli Studi di Torino Sommario Introduzione Proprietà network complessi Modelli matematici per la rappresentazione Grafi regolari Grafi random Small

Dettagli

9 Metodi diretti per la risoluzione di sistemi lineari: fattorizzazione P A = LU

9 Metodi diretti per la risoluzione di sistemi lineari: fattorizzazione P A = LU 9 Metodi diretti per la risoluzione di sistemi lineari: fattorizzazione P A LU 9.1 Il metodo di Gauss Come si è visto nella sezione 3.3, per la risoluzione di un sistema lineare si può considerare al posto

Dettagli

LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE

LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE FLAVIO ANGELINI Sommario Queste note hanno lo scopo di indicare a studenti di Economia interessati alla finanza quantitativa i concetti essenziali

Dettagli

A.1 Rappresentazione geometrica dei segnali

A.1 Rappresentazione geometrica dei segnali Appendice A Rappresentazione dei segnali A.1 Rappresentazione geometrica dei segnali Scomporre una generica forma d onda s(t) in somma di opportune funzioni base è operazione assai comune, particolarmente

Dettagli

CAPITOLO 1 INTRODUZIONE ALLE RETI COMPLESSE

CAPITOLO 1 INTRODUZIONE ALLE RETI COMPLESSE CAPITOLO 1 INTRODUZIONE ALLE RETI COMPLESSE Negli ultimi anni si è compreso che sistemi anche molto diversi tra loro possono essere efficacemente descritti in termini di cosiddetti "networks" o reti complesse.

Dettagli

Corso di Informatica di Base. Laboratorio 2

Corso di Informatica di Base. Laboratorio 2 Corso di Informatica di Base Laboratorio 2 Motori di Ricerca Sara Casolari Cercare nel posto giusto Andare in posti noti Esempio: per reperire informazioni sui contributi pensionistici chiediamo all INPS

Dettagli

CRAWLER. Il primo problema da affrontare per tracciare il Web è la costruzione di Crawler scalabili

CRAWLER. Il primo problema da affrontare per tracciare il Web è la costruzione di Crawler scalabili TRACCIARE IL WEB CRAWLER Il primo problema da affrontare per tracciare il Web è la costruzione di Crawler scalabili per scalabile si intende: quale è il numero P di pagine oltre il quale il Crawler si

Dettagli

- Trovare soluzione ottima primale ( con il simplesso o algoritmo analogo)

- Trovare soluzione ottima primale ( con il simplesso o algoritmo analogo) Se si ha un problema lineare e' possibile risolverlo in piu' modi (equivalenti ) - Trovare soluzione ottima primale ( con il simplesso o algoritmo analogo) - Trovare soluzione ottima duale (con il simplesso

Dettagli

Analisi matriciale delle reti di Petri (P/T) - sifoni e trappole -

Analisi matriciale delle reti di Petri (P/T) - sifoni e trappole - Analisi matriciale delle reti di Petri (P/T) - sifoni e trappole - - richiami preliminari sulle proprietà strutturali - Abbiamo visto che alcune caratteristiche dei sistemi dinamici (DES compresi) non

Dettagli

Svantaggi della Commutazione di Circuito. Commutazione di Pacchetto. Struttura di un Pacchetto

Svantaggi della Commutazione di Circuito. Commutazione di Pacchetto. Struttura di un Pacchetto Università degli studi di Salerno Laurea in Informatica I semestre / Commutazione di Pacchetto Prof. Vincenzo Auletta auletta@dia.unisa.it http://www.dia.unisa.it/professori/auletta/ Svantaggi della Commutazione

Dettagli

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D) ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI () Calcolo delle corrispondenze Affrontiamo il problema centrale della visione stereo, cioè la ricerca automatica di punti corrispondenti tra immagini Chiamiamo

Dettagli

Introduzione. Il principio di localizzazione... 2 Organizzazioni delle memorie cache... 4 Gestione delle scritture in una cache...

Introduzione. Il principio di localizzazione... 2 Organizzazioni delle memorie cache... 4 Gestione delle scritture in una cache... Appunti di Calcolatori Elettronici Concetti generali sulla memoria cache Introduzione... 1 Il principio di localizzazione... 2 Organizzazioni delle memorie cache... 4 Gestione delle scritture in una cache...

Dettagli

Altri metodi di indicizzazione

Altri metodi di indicizzazione Organizzazione a indici su più livelli Altri metodi di indicizzazione Al crescere della dimensione del file l organizzazione sequenziale a indice diventa inefficiente: in lettura a causa del crescere del

Dettagli

SISTEMI DI REPUTAZIONE E RACCOMANDAZIONE INTELLIGENTI

SISTEMI DI REPUTAZIONE E RACCOMANDAZIONE INTELLIGENTI UNIVERSITÀ DEGLI STUDI DI PADOVA Facoltà di Ingegneria Corso di Laurea in Ingegneria dell Informazione SISTEMI DI REPUTAZIONE E RACCOMANDAZIONE INTELLIGENTI Laureando: Paolo Bonaventura Relatore: Dott.ssa

Dettagli

Corso di Geometria e Algebra Lineare - Sezione di Metodi Numerici

Corso di Geometria e Algebra Lineare - Sezione di Metodi Numerici Corso di Geometria e Algebra Lineare - Sezione di Metodi Numerici C. Vergara 3. Metodo della fattorizzazione LU per la risoluzione di un sistema lineare Errori di arrotondamento. Prima di affrontare la

Dettagli

Modellazione delle preferenze

Modellazione delle preferenze Modellazione delle preferenze Roberto Cordone 1 1 Sono debitore delle dispense di B. Simeone e F. Patrone Sistemazione assiomatica Dato un insieme non vuoto di impatti F, esprimere una preferenza fra due

Dettagli

Capitolo 5 RESTAURO E RICOSTRUZIONE DI IMMAGINI

Capitolo 5 RESTAURO E RICOSTRUZIONE DI IMMAGINI Capitolo 5 RESTAURO E RICOSTRUZIONE DI IMMAGINI La differenza tra il restauro e il miglioramento (enhancement) delle immagini è che il miglioramento è un processo soggettivo, mentre il restauro è un processo

Dettagli

Esercizi di Ricerca Operativa I

Esercizi di Ricerca Operativa I Esercizi di Ricerca Operativa I Dario Bauso, Raffaele Pesenti May 10, 2006 Domande Programmazione lineare intera 1. Gli algoritmi per la programmazione lineare continua possono essere usati per la soluzione

Dettagli

fonti di informazione, qui intese come l insieme dei soggetti (singoli individui, imprese, enti,

fonti di informazione, qui intese come l insieme dei soggetti (singoli individui, imprese, enti, INTERNET COME RISORSA INFORMATIVA APPUNTI Internet e il Web rappresentano una risorsa informativa immensa, una delle più ricche ed eterogenee che siano mai state rese disponibili a un pubblico così vasto,

Dettagli

GUIDA ALLA COMPILAZIONE DELLA SCHEDA

GUIDA ALLA COMPILAZIONE DELLA SCHEDA GUIDA ALLA COMPILAZIONE DELLA SCHEDA 1. L identificazione del sito: dati generali Per capire chi proponga i contenuti di un sito è bene, all inizio del lavoro di analisi, chiarire chi ha prodotto i materiali

Dettagli

Sommario [1/2] Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali

Sommario [1/2] Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali Introduzione alle Biblioteche Digitali Sommario [1/2] Cenni storici Vannevar Bush Dalle Biblioteche ai Cataloghi Automatizzati Gli OPAC accessibili via Web Le Biblioteche Digitali Cos è una Biblioteca

Dettagli

Il social network dei blog italiani La mappa dei blogosfera italiana Febbraio 2005

Il social network dei blog italiani La mappa dei blogosfera italiana Febbraio 2005 liani 2005 Il social network dei blog italiani La mappa dei blogosfera italiana Febbraio 2005 1 Il Social Network dei blog italiani Introduzione...4 La dimensione della blogosfera...5 Percorsi della blogosfera...7

Dettagli

Barriere assorbenti nelle catene di Markov e una loro applicazione al web

Barriere assorbenti nelle catene di Markov e una loro applicazione al web Università Roma Tre Facoltà di Scienze M.F.N Corso di Laurea in Matematica a.a. 2001/2002 Barriere assorbenti nelle catene di Markov e una loro applicazione al web Giulio Simeone 1 Sommario Descrizione

Dettagli

TEORIA sulle BASI DI DATI

TEORIA sulle BASI DI DATI TEORIA sulle BASI DI DATI A cura del Prof. Enea Ferri Cos è un DATA BASE E un insieme di archivi legati tra loro da relazioni. Vengono memorizzati su memorie di massa come un unico insieme, e possono essere

Dettagli

Ing. Gianluca Murgia. murgia@unisi.it. Milano 29/04/2009

Ing. Gianluca Murgia. murgia@unisi.it. Milano 29/04/2009 Ing. Gianluca Murgia murgia@unisi.it Milano 29/04/2009 Sommario Definizione di Social Network Analysis Tipologie di social network Costruzione di una social network Principali indicatori SNA Perché applicarla

Dettagli

Analisi 2. Argomenti. Raffaele D. Facendola

Analisi 2. Argomenti. Raffaele D. Facendola Analisi 2 Argomenti Successioni di funzioni Definizione Convergenza puntuale Proprietà della convergenza puntuale Convergenza uniforme Continuità e limitatezza Teorema della continuità del limite Teorema

Dettagli

Introduzione E. TINELLI LTW A. A. 2011-2012

Introduzione E. TINELLI LTW A. A. 2011-2012 Corso di Laurea Specialistica in Ingegneria Informatica Corso di Linguaggi e Tecnologie Web A. A. 2011-2012 Web Information Retrieval Eufemia TINELLI Introduzione Per Web information Retrieval si intende

Dettagli

Sistemi di raccomandazione per negozi on-line

Sistemi di raccomandazione per negozi on-line Sistemi di raccomandazione per negozi on-line I. Sanseverino Seminario di Elaborazione del Linguaggio Naturale, 2011 Overview Introduzione 1 Introduzione Dierenze tra shopping online e shopping tradizionale

Dettagli

Mining Positive and Negative Association Rules:

Mining Positive and Negative Association Rules: Mining Positive and Negative Association Rules: An Approach for Confined Rules Alessandro Boca Alessandro Cislaghi Premesse Le regole di associazione positive considerano solo gli item coinvolti in una

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

CIRCUITI INTELLIGENTI Parte 5: PCA e ICA

CIRCUITI INTELLIGENTI Parte 5: PCA e ICA Ing. Simone SCARDAPANE Circuiti e Algoritmi per l Elaborazione dei Segnali Anno Accademico 2012/2013 Indice della Lezione 1. Analisi delle Componenti Principali 2. Auto-Associatori 3. Analisi delle Componenti

Dettagli

Tecniche di DM: Link analysis e Association discovery

Tecniche di DM: Link analysis e Association discovery Tecniche di DM: Link analysis e Association discovery Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Architettura di un generico algoritmo di DM. 2 2 Regole di associazione:

Dettagli

SEMINARIO. Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista. Di Marco Alessia

SEMINARIO. Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista. Di Marco Alessia SEMINARIO Realizzazione Di Siti Web Di Successo: Il Ruolo Del Progettista Di Marco Alessia ARGOMENTI TRATTATI Saranno affrontati separatamente due diversi argomenti, fondamentali per la realizzazione di

Dettagli

METODI ITERATIVI PER SISTEMI LINEARI

METODI ITERATIVI PER SISTEMI LINEARI METODI ITERATIVI PER SISTEMI LINEARI LUCIA GASTALDI 1. Metodi iterativi classici Sia A R n n una matrice non singolare e sia b R n. Consideriamo il sistema (1) Ax = b. Un metodo iterativo per la soluzione

Dettagli

Valutare un test. Affidabilità e validità di un test. Sensibilità e specificità

Valutare un test. Affidabilità e validità di un test. Sensibilità e specificità Valutare un test 9 Quando si sottopone una popolazione ad una procedura diagnostica, non tutti i soggetti malati risulteranno positivi al test, così come non tutti i soggetti sani risulteranno negativi.

Dettagli

BASI DI DATI INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO PER L ANNO ACCADEMICO 2013 2014 Prof. Gigliola Vaglini, Ing. Francesco Pistolesi

BASI DI DATI INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO PER L ANNO ACCADEMICO 2013 2014 Prof. Gigliola Vaglini, Ing. Francesco Pistolesi BASI DI DATI INGEGNERIA INFORMATICA SPECIFICHE DI PROGETTO PER L ANNO ACCADEMICO 2013 2014 Prof. Gigliola Vaglini, Ing. Francesco Pistolesi 1 Descrizione dei requisiti delle fasi di progettazione Si desidera

Dettagli

Introduzione. è uguale a 0, spostamento di dati da una parte della memoria del calcolatore ad un altra.

Introduzione. è uguale a 0, spostamento di dati da una parte della memoria del calcolatore ad un altra. Appunti di Calcolatori Elettronici Modello di macchina multilivello Introduzione... 1 Linguaggi, livelli e macchine virtuali... 3 La struttura a livelli delle macchine odierne... 4 Evoluzione delle macchine

Dettagli

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Concetti preliminari: struttura del dataset negli

Dettagli

Corso di Matematica per la Chimica

Corso di Matematica per la Chimica Dott.ssa Maria Carmela De Bonis a.a. 203-4 I sistemi lineari Generalità sui sistemi lineari Molti problemi dell ingegneria, della fisica, della chimica, dell informatica e dell economia, si modellizzano

Dettagli

Introduzione al MATLAB c Parte 2

Introduzione al MATLAB c Parte 2 Introduzione al MATLAB c Parte 2 Lucia Gastaldi Dipartimento di Matematica, http://dm.ing.unibs.it/gastaldi/ 18 gennaio 2008 Outline 1 M-file di tipo Script e Function Script Function 2 Costrutti di programmazione

Dettagli

Uso del computer e gestione dei file. Elaborazione testi. Foglio elettronico. Strumenti di presentazione

Uso del computer e gestione dei file. Elaborazione testi. Foglio elettronico. Strumenti di presentazione Il è finalizzato a elevare il livello di competenza nell utilizzo del computer, del pacchetto Office e delle principali funzionalità di Internet. Il percorso formativo si struttura in 7 moduli Concetti

Dettagli

1. PRIME PROPRIETÀ 2

1. PRIME PROPRIETÀ 2 RELAZIONI 1. Prime proprietà Il significato comune del concetto di relazione è facilmente intuibile: due elementi sono in relazione se c è un legame tra loro descritto da una certa proprietà; ad esempio,

Dettagli

Sommario. 1 Realizzazione del STG. Introduzione. 1 traduzione delle specifiche informali in specifiche formali (STG o

Sommario. 1 Realizzazione del STG. Introduzione. 1 traduzione delle specifiche informali in specifiche formali (STG o Sommario Sintesi di macchine a stati finiti 1 Realizzazione del ST M. avalli 2 utoma minimo di SM completamente specificate 6th June 2007 3 Ottimizzazione di SM non completamente specificate Sommario ()

Dettagli

Database e Microsoft Access. Ing. Antonio Guadagno

Database e Microsoft Access. Ing. Antonio Guadagno Database e Microsoft Access Ing. Antonio Guadagno Database e Microsoft Access Un Database non è altro che un insieme di contenitori e di strumenti informatici che ci permette di gestire grossi quantitativi

Dettagli

Da una a più variabili: derivate

Da una a più variabili: derivate Da una a più variabili: derivate ( ) 5 gennaio 2011 Scopo di questo articolo è di evidenziare le analogie e le differenze, relativamente al calcolo differenziale, fra le funzioni di una variabile reale

Dettagli

Parte II: Reti di calcolatori Lezione 11

Parte II: Reti di calcolatori Lezione 11 Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A. 2014-15 Parte II: Reti di calcolatori Lezione 11 Martedì 14-04-2015 1 Esempio di uso di proxy Consideriamo

Dettagli

A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.

A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini. Algoritmi di routing dinamici (pag.89) UdA2_L5 Nelle moderne reti si usano algoritmi dinamici, che si adattano automaticamente ai cambiamenti della rete. Questi algoritmi non sono eseguiti solo all'avvio

Dettagli

Minimizzazione di Reti Logiche Combinatorie Multi-livello

Minimizzazione di Reti Logiche Combinatorie Multi-livello Minimizzazione di Reti Logiche Combinatorie Multi-livello Maurizio Palesi Maurizio Palesi 1 Introduzione Obiettivo della sintesi logica: ottimizzazione delle cifre di merito area e prestazioni Prestazioni:

Dettagli

ECDL Base. Moduli compresi: Descrizione.

ECDL Base. Moduli compresi: Descrizione. ECDL Base Com'è facilmente deducibile anche dal nome, la certificazione ECDL Base attesta il livello essenziale di competenze informatiche e web del suo titolare, aggiornate alle funzionalità introdotte

Dettagli

Sistemi Informativi e WWW

Sistemi Informativi e WWW Premesse Sistemi Informativi e WWW WWW: introduce un nuovo paradigma di diffusione (per i fornitori) e acquisizione (per gli utilizzatori) delle informazioni, con facilità d uso, flessibilità ed economicità

Dettagli

Corso di Calcolo Numerico

Corso di Calcolo Numerico Corso di Calcolo Numerico Dott.ssa M.C. De Bonis Università degli Studi della Basilicata, Potenza Facoltà di Ingegneria Corso di Laurea in Ingegneria Meccanica Sistemi di Numerazione Sistema decimale La

Dettagli

Metodi e Modelli per le Decisioni

Metodi e Modelli per le Decisioni Metodi e Modelli per le Decisioni Corso di Laurea in Informatica e Corso di Laurea in Matematica Roberto Cordone DI - Università degli Studi di Milano Lezioni: Giovedì 13.30-15.30 Venerdì 15.30-17.30 Ricevimento:

Dettagli

Università degli studi di Cagliari FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI

Università degli studi di Cagliari FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI Università degli studi di Cagliari FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI Corso di Laurea Magistrale in Matematica L ALGORITMO DI PAGERANK Relatore: Dott. Lucio Cadeddu Tesi di laurea di: Veronica

Dettagli

Sintesi di Reti Sequenziali Sincrone

Sintesi di Reti Sequenziali Sincrone LABORATORIO DI ARCHITETTURA DEI CALCOLATORI lezione n 9 Prof. Rosario Cerbone rosario.cerbone@uniparthenope.it a.a. 2007-2008 http://digilander.libero.it/rosario.cerbone Sintesi di Reti Sequenziali Sincrone

Dettagli

INTERNET. Un percorso per le classi prime Prof. Angela Morselli

INTERNET. Un percorso per le classi prime Prof. Angela Morselli INTERNET Un percorso per le classi prime Prof. Angela Morselli PARTE 1 INTERNET: LA RETE DELLE RETI 2 È ALQUANTO DIFFICILE RIUSCIRE A DARE UNA DEFINIZIONE ESAUSTIVA E CHIARA DI INTERNET IN POCHE PAROLE

Dettagli

5. Requisiti del Software II

5. Requisiti del Software II 5. Requisiti del Software II Come scoprire cosa? Andrea Polini Ingegneria del Software Corso di Laurea in Informatica (Ingegneria del Software) 5. Requisiti del Software II 1 / 42 Sommario 1 Generalità

Dettagli

SVILUPPO DI UN SISTEMA DI SORVEGLIANZA MEDIANTE ROBOT MOBILI.

SVILUPPO DI UN SISTEMA DI SORVEGLIANZA MEDIANTE ROBOT MOBILI. SVILUPPO DI UN SISTEMA DI SORVEGLIANZA MEDIANTE ROBOT MOBILI. 1. ABSTRACT In questo progetto si intende costruire un sistema di sorveglianza mediante l uso di robot mobili. L idea base è quella di usare

Dettagli

MATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010

MATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010 elementi di teoria dei grafi anno acc. 2009/2010 Grafi semplici Un grafo semplice G è una coppia ordinata (V(G), L(G)), ove V(G) è un insieme finito e non vuoto di elementi detti vertici o nodi di G, mentre

Dettagli

Tassonomia Web Spam GIUGNO 2005

Tassonomia Web Spam GIUGNO 2005 Prefazione: Questo documento si basa sull originale Web Spam Taxonomy firmato da alcuni ricercatori del dipartimento di Computer Science della Stanford University e pubblicato ad Aprile 2005. Tassonomia

Dettagli

Cercare documenti Web

Cercare documenti Web Pagine web (struttura html) Cercare documenti Web Motori di Ricerca I MOTORI DI RICERCA Sulla rete Web vi sono strumenti specifici chiamati motori di ricerca (research engines) per la ricerca di siti e

Dettagli

Informatica per la comunicazione" - lezione 10 -

Informatica per la comunicazione - lezione 10 - Informatica per la comunicazione" - lezione 10 - Pagine dinamiche L accesso a una pagina web può innescare l esecuzione di programmi, ad esempio per eseguire la prenotazione di un biglie8o aereo Ques:

Dettagli

Architettura dell informazione. Sistemi di ricerca

Architettura dell informazione. Sistemi di ricerca Architettura dell informazione Sistemi di ricerca Sistemi di ricerca Il sistema di ricerca è un elemento centrale della navigazione supplementare. La ricerca è uno degli strumenti preferiti dagli utenti

Dettagli

Cultura Tecnologica di Progetto

Cultura Tecnologica di Progetto Cultura Tecnologica di Progetto Politecnico di Milano Facoltà di Disegno Industriale - DATABASE - A.A. 2003-2004 2004 DataBase DB e DataBase Management System DBMS - I database sono archivi che costituiscono

Dettagli

ACRL Association of College and Research Libraries

ACRL Association of College and Research Libraries ACRL Association of College and Research Libraries Standard delle competenze per il possesso dell informazione (information literacy) nell educazione superiore Standard, indicatori di performance, obiettivi

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

Capitolo 3: Ottimizzazione Discreta. E. Amaldi DEIB, Politecnico di Milano

Capitolo 3: Ottimizzazione Discreta. E. Amaldi DEIB, Politecnico di Milano Capitolo 3: Ottimizzazione Discreta E. Amaldi DEIB, Politecnico di Milano 3.1 Modelli di PLI e PLMI Moltissimi problemi decisionali complessi possono essere formulati o approssimati come problemi di Programmazione

Dettagli

Internet e Storia. Internet. INTERNET, uno strumento per la didattica della storia

Internet e Storia. Internet. INTERNET, uno strumento per la didattica della storia INTERNET, uno strumento per la didattica della storia Internet e Storia Internet Internet è come la più grande rete mondiale ed anche detta rete delle reti che collega centinaia di milioni di computer.

Dettagli

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D) ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI () Una immagine (digitale) permette di percepire solo una rappresentazione 2D del mondo La visione 3D si pone lo scopo di percepire il mondo per come è in 3 dimensioni

Dettagli

PIÙ IN DETTAGLIO Come si crea una scuola virtuale? Come viene associato un insegnate alla scuola? Cos è il Codice scuola?

PIÙ IN DETTAGLIO Come si crea una scuola virtuale? Come viene associato un insegnate alla scuola? Cos è il Codice scuola? PIÙ IN DETTAGLIO Come si crea una scuola virtuale? Quando si compila il modulo di registrazione, selezionare l opzione scuola.una volta effettuata la registrazione, si può accedere a un ambiente molto

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

Dispersion centrality: applicazione della dispersione in casi di studio reali

Dispersion centrality: applicazione della dispersione in casi di studio reali Dispersion centrality: applicazione della dispersione in casi di studio reali Amedeo Leo Alessio Petrozziello Simone Romano amedeo.leo92@gmail.com alessio92p@gmail.com s.romano1992@gmail.com Università

Dettagli

Prova di Laboratorio di Programmazione

Prova di Laboratorio di Programmazione Prova di Laboratorio di Programmazione 6 febbraio 015 ATTENZIONE: Non è possibile usare le classi del package prog.io del libro di testo. Oltre ai metodi richiesti in ciascuna classe, è opportuno implementare

Dettagli

GUIDA PER LA VALUTAZIONE E LA ESPRESSIONE DELL INCERTEZZA NELLE MISURAZIONI

GUIDA PER LA VALUTAZIONE E LA ESPRESSIONE DELL INCERTEZZA NELLE MISURAZIONI SISTEMA NAZIONALE PER L'ACCREDITAMENTO DI LABORATORI DT-000 GUIDA PER LA VALUTAZIONE E LA ESPRESSIONE DELL INCERTEZZA NELLE MISURAZIONI INDICE parte sezione pagina 1. INTRODUZIONE. FONDAMENTI.1. Misurando,

Dettagli

Metodi e Modelli per l Ottimizzazione Combinatoria Il problema del flusso di costo minimo

Metodi e Modelli per l Ottimizzazione Combinatoria Il problema del flusso di costo minimo Metodi e Modelli per l Ottimizzazione Combinatoria Il problema del flusso di costo minimo L. De Giovanni G. Zambelli 1 Problema del flusso a costo minimo Il problema del flusso a costo minimo é definito

Dettagli

Sistemi Operativi mod. B. Sistemi Operativi mod. B A B C A B C P 1 2 0 0 P 1 1 2 2 3 3 2 P 2 3 0 2 P 2 6 0 0 P 3 2 1 1 P 3 0 1 1 < P 1, >

Sistemi Operativi mod. B. Sistemi Operativi mod. B A B C A B C P 1 2 0 0 P 1 1 2 2 3 3 2 P 2 3 0 2 P 2 6 0 0 P 3 2 1 1 P 3 0 1 1 < P 1, > Algoritmo del banchiere Permette di gestire istanze multiple di una risorsa (a differenza dell algoritmo con grafo di allocazione risorse). Ciascun processo deve dichiarare a priori il massimo impiego

Dettagli

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo Evoluzione In ogni popolazione si verificano delle mutazioni. Intelligenza Artificiale In un ambiente che varia, le mutazioni possono generare individui che meglio si adattano alle nuove condizioni. Questi

Dettagli

Dimensionamento dei lotti di produzione: il caso con variabilità nota

Dimensionamento dei lotti di produzione: il caso con variabilità nota Dimensionamento dei lotti di produzione: il caso con variabilità nota A. Agnetis In questi appunti studieremo alcuni modelli per il problema del lot sizing, vale a dire il problema di programmare la dimensione

Dettagli

4. Matrici e Minimi Quadrati

4. Matrici e Minimi Quadrati & C. Di Natale: Matrici e sistemi di equazioni di lineari Formulazione matriciale del metodo dei minimi quadrati Regressione polinomiale Regressione non lineare Cross-validazione e overfitting Regressione

Dettagli

POLITICHE DI SCHEDULING OTTIME PER SENSORI RADIO ALIMENTATI DA FONTI DI ENERGIA RINNOVABILI

POLITICHE DI SCHEDULING OTTIME PER SENSORI RADIO ALIMENTATI DA FONTI DI ENERGIA RINNOVABILI UNIVERSITÀ DI PADOVA FACOLTÀ DI INGEGNERIA DIPARTIMENTO DI INGEGNERIA DELL INFORMAZIONE Corso di Laurea Magistrale in Ingegneria delle Telecomunicazioni Tesi di Laurea POLITICHE DI SCHEDULING OTTIME PER

Dettagli

Processi di Business e Sistemi di Gestione di Workflow: concetti di base. Prof. Giancarlo Fortino g.fortino@unical.it

Processi di Business e Sistemi di Gestione di Workflow: concetti di base. Prof. Giancarlo Fortino g.fortino@unical.it Processi di Business e Sistemi di Gestione di Workflow: concetti di base Prof. Giancarlo Fortino g.fortino@unical.it Introduzione Le aziende devono modificare la loro organizzazione per cogliere le nuove

Dettagli

MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA

MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA L alunno si muove con sicurezza nel calcolo scritto e mentale con i numeri naturali e sa valutare l opportunità di

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

I MOTORI DI RICERCA (I Parte)

I MOTORI DI RICERCA (I Parte) Introduzione I MOTORI DI RICERCA (I Parte) Una delle cose più incredibili che possiamo affermare riguardo ad Internet è che possiamo trovarci veramente di tutto. Qualsiasi argomento che ci viene in mente

Dettagli

Elaborazione delle Immagini Digitali

Elaborazione delle Immagini Digitali Elaborazione delle Immagini Digitali Parte I Prof. Edoardo Ardizzone A.A. 2-22 La trasformata di Hotelling o di Karhunen-Loeve KLT discreta Questa trasformata detta anche analisi delle componenti principali

Dettagli

Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione

Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione Consideriamo il nostro dataset formato da 468 individui e 1 variabili nominali costituite dalle seguenti modalità : colonna D: Age of client

Dettagli