Valutazione dei Sistemi di Information Retrieval. Gabriella Pasi
|
|
- Marcello De Angelis
- 8 anni fa
- Visualizzazioni
Transcript
1 Valutazione dei Sistemi di Information Retrieval Gabriella Pasi
2 Valutazione di un Sistema di Information Retrieval Perchè si valuta un sistema di IR? I compiti di un IRS non sono ben definiti È difficile stabilire se il sistema ha fallito o meno Per questa ragione è stata sviluppata una metodologia di valutazione
3 Valutazione di un Sistema di Information Retrieval Componenti di un esperimento di valutazione di un sistema di IR Un sistema di IR (visto come una black box) Una collezione di documenti Una collezione di query Un insieme di utenti Un criteri di base di valutazione Misure di performance Il progetto dell esperimento
4 Criteridivalutazione Che cosa si valuta? Come si valuta? Funzionalità analisi funzionale Correttezza analisi degli errori performance tempo tempi di risposta spazio occupazione degli indici efficacia del retrieval precisione e completezza dei documenti reperiti
5 What to Criteridivalutazione Evaluate? Quanto i risultati soddisfano le necessità informative dell utente? Quanto si è imparato su un dato argomento ricercato? Apprendimento accidentale: Quanto si è compreso di cosa trattano i documenti della collezione? Quanto si è compreso degli argomenti trattati? Quanto si è compreso di altri argomenti trattati? Com è l interazione con il sistema?
6 Relevance Criteridivalutazione In che modo un documento può essere rilevante a una query? Risponde precisamente alle domande dell utente Risponde parzialmente alle domande dell utente Suggerisce una sorgente di informazioni Fornisce informazioni contestuali sull argomento di interesse Richiama alla memoria dell utente conoscenze dimenticate
7 Relevance Criteridivalutazione Quanto rilevante è il documento? Per un dato utente e per le sue necessità informative (Soggettivo ma misurabile) Quanto spesso gli utenti sono d accordo nel considerare un documento rilevante rispetto alla stessa query? Quanto bene risponde alla domanda? La risposta è completa? Parziale? C è informazione contestuale? Fornisce indizi per esplorazioni future?
8 What to Evaluate? Criteridivalutazione Stima dell abilità dell utente nell utilizzare il sistema: Quantità di Informazioni di base sul sistema Forma di presentazione Impegno necessario per l utilizzo Efficienza in termini di tempo e spazio Efficacia Richiamo Proporzione di materiale rilevante che viene reperito Precisione Proporzione di materiale reperito che è rilevante
9 What to Evaluate? Criteri di base di valutazione Assunzioni: dell efficacia La rilevanza di un documento per l utente viene considerata binaria (rilevante/non rilevante) La rilevanza di un documento è indipendente dagli altri documenti. L utente è messo nella condizione di scoprire documenti rilevanti nella collezione senza l ausilio del sistema
10 Relevant vs. Retrieved Tutti i documenti Reperiti Rilevanti
11 Definizioni Precision di vs. Precisione Recall e Richiamo Rilevanti e Reperiti Precisione = Reperiti Rilevanti e Reperiti Recall = Rilevanti nell'intera Collezione Tutti i doc. Reperiti Rilevanti
12 Why Precision and Recall? Obbiettivo per una buona efficacia: Reperire quanti più documenti rilevanti possibile, minimizzando il numero di documenti non rilevanti reperiti
13 Retrieved vs. Relevant Documents Precisione altissima (1), richiamo molto basso reperiti Rilevanti
14 Retrieved vs. Relevant Documents Precisione e Richiamo molto bassi (0) reperiti Rilevanti
15 Retrieved vs. Relevant Documents Richiamo alto, Precisione bassa Rilevanti Reperiti
16 Retrieved vs. Relevant Documents Precisone e Richiamo alti reperiti Rilevanti
17 Precision/Recall Curves Misura di Recall e Precisione Per ogni query si misurano R e P I sistemi producono generalmente un ordinamento dei documenti si effettuano misure di Precisione con diversi livelli di richiamo: si individuano nella lista ordinata punti (cut-off) in cui la recall è 10%, 20%, 100% e si valuta la precisione in tale punti Si effettua una media di R e P per l insieme di query Si effettua una media per l insieme di utenti
18 Precision/Recall Curves Misura di Recall e Precisione Si osserva un bilanciamento tra i valori di Precisione e di Richiamo precisione x x x recall x
19 Precision/Recall Curves PRECISIONE vs RECALL E difficile ipotizzare quale dei due comportamenti sia migliore: generalmente dipende dall utente precisione x x x x recall
20 Document Cutoff Levels Misure di Precisione per livelli di Recall Si considerana il numero di documenti RILEVANTI REPERITI a diversi livelli di rilevanza dal sistema: I PRIMI 5 NELLA LISTA ORDINATA DEI DOCUMENTI REPERITI I PRIMI 10 I PRIMI 20 I PRIMI 50 I PRIMI 100 I PRIMI 500 Si misura la precisione per ogni livello di richiamo Si prende la media (pesata) dei risultati E un metodo per stimare quanto è la bontà della stima della rilevanza da parte del sistema
21 Misure di Precisione per livelli di Richiamo Documenti rilevanti per l utente per una data query q Rq={d3, d5, d9, d25, d39, d44, d56, d71, d89, d123} Rq =10 Documenti reperiti dal sistema in ordine decrescente di rilevanza 1 d123 2 d84 3 d56 4 d6 5 d8 6 d9 7 d511 8 d129 9 d d25 11 d38 12 d48 13 d d d3 Calcolo della precisione per 11 livelli di richiamo fissati Primo 1: Recall = 1/10= 10% Precisione 1/1=100% primi 3: Recall = 2/10= 20% Precisione 2/3=66% primi 6: Recall = 3/10= 33% Precisione 3/6=50% primi 10: Recall = 4/10= 40% Precisione 4/10=40% primi 15: Recall = 5/10= 50% Precisione 5/15=33%
22 Misure di Precisione per livelli di Richiamo Interpolazione dei risultati ottenuti dalla valutazione di Recall e Precisione su molte query P(R)= i=1,,nq Pi(R)/Nq P(R) = valor medio di Precisione al livello R di richiamo date Nq query Pi(R) = Precisione al livello R di richiamo data la i-esima query. Spesso Pi(R) non è disponibile, perciò lo si interpola Pi(R k )= max R k<=r<=r k+1 Pi(r)
23 Misure di Precisione per livelli di Richiamo Documenti rilevanti per l utente per una data query q Rq={d3, d56, d129} Rq =3 Documenti reperiti dal sistema in ordine decrescente di rilevanza 1 d123 2 d84 Primi 3: Recall = 1/3= 33.3% Precisione 1/3=33.3% 3 d56 primi 8: Recall = 2/3= 66.6% Precisione 2/8=25% 4 d6 5 d8 primi 15: Recall = 3/3= 100% Precisione 3/15=20% 6 d9 NON si dispone dei valori di P per gli 11 livelli standard 7 d511 di recall (0% 10%, 20%, 30%, 100%) 8 d129 9 d187 Si interpolano 10 d25 P(R 0% )=> P(R 30% ) = 33.3% 11 d38 12 d48 P(R 40% )=>P(R 60% )=max 50% <=r<= 70% (P(66.6%))=25% 13 d250 P(R 70% )=>P(R 100% )=max 90% <=r<= 100% (P(100%))=20% 14 d d3
24 TREC (Manual Queries) Confronto di curve di R/P Permettono il confronto di algoritmi diversi per modellare attività specifiche dello stesso sistema (es tecniche di indicizzazione) Sistemi diversi Lo stesso sistema per utenti/query/collezioni diverse
25 Misure singole di efficacia del retrieval E utile produrre un valore singolo di precisione per valutare le prestazioni di un algoritmo in funzione di query particolari Calcolo della media della Precisione P corrispondente a un incremento unitario del numero di documenti rilevanti reperiti precisione 40,00% 30,00% 20,00% 10,00% curca R/P 33,30% 66,67% 100,00% 0,00% 0,00% 50,00% 100,00% 150,00% curca R/P recall all'incremento di 1 doc reperito rilevante P=(33, )/3=26,1% favorisce i sistemi che reperiscono i documenti rilevanti nelle prime posizioni
26 Misure singole di efficacia del retrieval R-P: Calcolo della Precisione corrispondente ai primi R documenti reperiti, ove R = numero totale di documenti rilevanti per l utente per la query R= Rq utile per stimare il comportamento di un algoritmo in funzione di un set di query diverse Si puo calcolare R-P per il set di query Tra i primi 10 documenti ce ne sono 4 rilevanti primi 10: Recall = 4/10= 40% Precisione 4/10=40% =>10-P=40% Tra i primi 3 documenti reperiti c è solo il primo rilevante: Primo 1: Recall = 1/3= 33.3% Precisione 1/3=33.3% =>3-P= 33,3%
27 Misure singole di efficacia del retrieval Istogramma di Precisione Utile per confrontare il retrieval di due algoritmi Siano R-P(A)(q i ) e R-P(B)(q i ) le misure di R- precisione per due algoritmi A e B per la query q i R-P(A/B)(q i ) = R-P(A)(q i ) - R-P(B)(q i ) R-P(A/B)(q i )=0 i due algoritmi hanno lo stessa precisione per la query q i R-P(A/B)(q i )>0 A è più preciso di B R-P(A/B)(q i )<0 A è meno preciso di B Si possono calcolare valori medi R-P(A/B)(q i ) su un set di query
28 Istogramma di Precisione
29 Tabelle riassuntive delle misure di Precisione e Recall Numero totale di query N totale di documenti reperiti da tutte le query N totale di documenti rilevanti reperiti da tutte le query N totale di documenti rilevanti nella collezione
30 Problemi inerenti il calcolo di Problems with Precision/Recall Precisione e Richiamo Non si conoscono i veri valori di richiamo eccetto nel caso di collezioni con pochi documenti Precisione/Recall sono tra loro in relazione misure combinate sono in alcuni casi più appropriate Si è assunta una modalità batch di retrieval, mentre l interazione con l utente può alterare l efficacia del retrieval. Quindi sarebbe necessario quantificare l informazione derivante dall interazione con l utente Si assume che l ordinamento stretto sia importante.
31 Matrice di Confronto Sistema Doc è reperito Utente -> Doc NON è reperito Totale Doc è rilevante a+c a c Doc NON è rilevante b+d Accuratezza: (a+d) / (a+b+c+d) Precisione: a/(a+b) Recall: a/(a+c)? (spesso c non è noto) Problemi nell interpretazione dell accuratezza: nelle collezioni grandi La maggior parte dei documenti non sono rilevanti La maggior parte dei documenti non sono reperiti si ha un amplificazione del valore di accuratezza a causa del valore d>>a b d totale documenti a+b c+d a+b+c+d
32 Matrice di Confronto dell ordinamento Utente -> Sistema Doc reperito e molto rilevante Doc. molto rilevanti a11 Doc. rilevanti a12 Doc. poco rilevanti a13 Doc. non rilevanti a14 Doc reperito e rilevante a21 a22 a23 a24 Doc reperito e poco rilevante a31 a32 a33 a34 Doc non reperito a41 a42 a43 a44 Si valuta la Recall, Precisione e Accuratezza dell ordinamento in classi di rilevanza R (Molto rilevanti)=a11/(a11+a21+a31+a41) P(Molto rilevanti)=a11/(a11+a12+a13+a14) A(Molto rilevanti)=a11/(totale nelle varie classi)
33 F(j) R(j) al j - reperiti Combinazione di Precisione e Recall in un singolo parametro = è il 1 R(j) dal 2 + sistema media armonica) 1 P(j) richiamo e P(j) è la esimo documento nella lista F(j) [0,1] precisione corrispondenti ordinata F(j)=0 nessun documento rilevante è reperito dei F(j)=1 tutti i documenti reperiti sono quelli rilevanti documenti
34 Combinazione The E-Measuredi Precisione e Recall in un singolo parametro: E_measure (K. van Rijsbergen, 79) E(j) = 1 α 1 P(j) 1 + (1 α) 1 R(j) α = 1/( β 2 + 1) Permette all utente di stabilire se intende valutare il sistema rispetto al richiamo o alla precisione P(j) = precisione R(j) = recall al jesimo documento nel ranking α = misura dell importanza relativa della precisione P rispetto al richiamo R α = 0.5 l utente accorda pari importanza a P ed R α = 1 E = 1-P α = 0 E = 1-R
35 Misure di efficacia dipendenti dall utente Problemi: Utenti diversi possono identificare documenti rilevanti differenti rispetto alla stessa query Rilevanza è soggettiva Dipende dalla storia, esperienza dell utente Dall ordine di analisi dei documenti Necessità di misure che tengano conto della dipendenza dall utente Copertura, Novità, Recall relativo, Sforzo di recall
36 Misure di efficacia dipendenti dall utente Siano: R = insieme di tutti i documenti rilevanti A= insieme reperito dal sistema U = insieme di documenti rilevanti per l utente U R Rk = A U documenti reperiti e rilevanti per l utente Ru documenti rilevanti reperiti e sconosciuti precedentemente al retrieval all utente Copertura = Rk / U È la frazione di documenti rilevanti noti all utente e reperiti Novità = Ru / ( Ru + Rk ) frazione di documenti rilevanti reperiti e non noti all utente
37 Misure di efficacia dipendenti dall utente Copertura = Rk / U Copertura alta indica che il sistema trova molti dei documenti noti come rilevanti all utente Novità = Ru / ( Ru + Rk ) Novità alta indica che il sistema rivela all utente molti documenti rilevanti R Ru A U Rk
38 Misure di efficacia dipendenti dall utente Recall relativo: rapporto tra # di documenti reperiti rilevanti e # totale di documenti rilevanti che l utente si aspetta in risposta a una query Sforzo di Recall : rapporto tra # di documenti rilevanti che l utente si aspetta in risposta a una query e il # di documenti esaminati tra quelli reperiti per trovare quelli rilevanti
39 TREC Collezioni di riferimento per le valutazioni Cranfield 2 > 1400 Documents, 221 Queries 200 Documents, 42 Queries INSPEC > 542 Documents, 97 Queries UKCIS -- > Documents, multiple sets, 193 Queries ADI > 82 Document, 35 Queries CACM > 3204 Documents, 50 Queries CISI > 1460 Documents, 35 Queries MEDLARS (Salton) ->273 Documents, 18 Queries CLEFF per valutazione di IR multilingua
40 TREC Collezioni di riferimento per le valutazioni Text REtrieval Conference/Competition prima conferenza TREC 1992 NIST (National Institute of Standards & Technology) Office of Defense Advanded Research Projects Agency (DARPA) Collezioni >6 Gigabytes (6 CRDOMs), >1.5 Milione Documenti Newswire & full text news (AP, WSJ, Ziff, FT) documenti governativi (federal register, Congressional Record) trascrizioni Radio (FBIS) sottoinsiemi Web ( Large Web separate with 18.5 Million pages of Web data 100 Gbytes) Brevetti/licenze
41 TREC Conferenze TREC Per ogni conferenza viene progettato un insieme di esperimenti I gruppi che partecipano utilizzano: gli stessi dati (collezioni di circa 2 Gb Stessi topics o necessità informative Stessi giudizi di rilevanza I risultati prodotti vengono inseriti in un software standard di valutazione che permette un confronto diretto tra I diversi sistemi
42 Test Conferenze CollectionsTREC: collezioni La collezione TREC è distribuita a pagamento su 6 CD-ROM WSJ Wall Street Journal - circa 100Mila docs - AP Associated Press circa docs ZIFF Computer articles docs FR Federal Register circa docs DOE Publications abstract docs PAT US Patents 6700 docs FT Financial Times docs FBIS Foreign Broadcast Inf. Serv docs I documenti di tutte le collezioni sono in SGML Tag: <DOCNO> # doc. <TEXT> testo
43 Sample TREC Query (Topic) Esempio di documento delle collezioni TREC <doc> Number: 168 <docno> WSJ </docno> <hl> AT&T Unveils Services to upgrade phone networks under global plan </hl> <authot> J. Guyon </author> <ateline> New York </dateline> <text> American telephone &telegraph Co. Introduced. </text> </doc>
44 TREC TREC: (cont.) topics e giudizi Query + Giudizi di Rilevanza Topics, vale a dire Query progettate da specialisti espresse in linguaggio naturale numero di topics: sono stati preparati gruppi di topics per ogni conferenza: con 3 campi: <title> <number> <descrip> <narrative> Giudizi di Rilevanza sono foniti per ogni topics (metodo di pooling) solo per I primi 100 documenti nelle liste reperite da tutti I sistemi di IR partecipanti alla conferenza, non per l intera collezione Competizione tra Vari gruppi di ricerca e produttori commerciali di sistemi di IR (TREC 6 -> 51 gruppi, TREC 7 -> 56, TREC -> 8 66) Risultati giudicati in base a precisione e recall, fino a un livello di recall di 1000 documenti
45 Sample TREC Query (Topic) Esempio di Topics TREC <num> Number: 168 <title> Topic: Financing AMTRAK <desc> Description: A document will address the role of the Federal Government in financing the operation of the National Railroad Transportation Corporation (AMTRAK) <narr> Narrative: A relevant document must provide information on the government s responsibility to make AMTRAK an economically viable entity. It could also discuss the privatization of AMTRAK as an alternative to continuing government subsidies. Documents comparing government subsidies given to air and bus transportation with those provided to AMTRAK would also be relevant.
46 slide di Ellen Voorhees del NIST
47 slide di Ellen Voorhees del NIST
48 slide di Ellen Voorhees del NIST
49 slide di Ellen Voorhees del NIST
50 slide di Ellen Voorhees del NIST
51 slide di Ellen Voorhees del NIST
52 slide di Ellen Voorhees del NIST
53 slide di Ellen Voorhees del NIST
54 slide di Ellen Voorhees del NIST
Introduzione all Information Retrieval
Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information
DettagliCalcolatori Elettronici A a.a. 2008/2009
Calcolatori Elettronici A a.a. 2008/2009 PRESTAZIONI DEL CALCOLATORE Massimiliano Giacomin Due dimensioni Tempo di risposta (o tempo di esecuzione): il tempo totale impiegato per eseguire un task (include
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliSPC e distribuzione normale con Access
SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,
DettagliCapitolo 13: L offerta dell impresa e il surplus del produttore
Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:
DettagliStrutturazione logica dei dati: i file
Strutturazione logica dei dati: i file Informazioni più complesse possono essere composte a partire da informazioni elementari Esempio di una banca: supponiamo di voler mantenere all'interno di un computer
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliChe cosa e come valutano le prove di matematica e con quali risultati. nell A.S. 2008 2009
Che cosa e come valutano le prove di matematica e con quali risultati nell A.S. 2008 2009 Presentazione a cura di Roberta Michelini Casalpusterlengo, 8 gennaio 2010 http://www.invalsi.it/esamidistato0809/
DettagliProgettaz. e sviluppo Data Base
Progettaz. e sviluppo Data Base! Progettazione Basi Dati: Metodologie e modelli!modello Entita -Relazione Progettazione Base Dati Introduzione alla Progettazione: Il ciclo di vita di un Sist. Informativo
DettagliAnalisi e diagramma di Pareto
Analisi e diagramma di Pareto L'analisi di Pareto è una metodologia statistica utilizzata per individuare i problemi più rilevanti nella situazione in esame e quindi le priorità di intervento. L'obiettivo
DettagliRicerca di outlier. Ricerca di Anomalie/Outlier
Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla
DettagliRapporto dal Questionari Insegnanti
Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la
DettagliI quattro ordini di scuola a confronto Elisabetta Malaguti
I quattro ordini di scuola a confronto Elisabetta Malaguti Esperienze censite, destinate ad uno o più ordini di scuola. Le esperienze censite nella regione sono 2246. Nella figura che segue è, però, riportato
DettagliAutomazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it
Automazione Industriale (scheduling+mms) scheduling+mms adacher@dia.uniroma3.it Introduzione Sistemi e Modelli Lo studio e l analisi di sistemi tramite una rappresentazione astratta o una sua formalizzazione
DettagliMatrice Excel Calcolo rata con DURATA DEL FINANZIAMENTO determinata dall'utente
Matrice Excel Calcolo rata con DURATA DEL FINANZIAMENTO determinata dall'utente L'acquisto di un immobile comporta un impegno finanziario notevole e non sempre è possibile disporre della somma di denaro
DettagliUniversità degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI
Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni
DettagliValutazione dei rischi
Valutazione dei rischi 5 Novembre 2008 Andrea Pellei Il processo di attuazione dell audit Obiettivi della valutazione del rischio L attività di audit effettuata sul Sistema di Gestione e Controllo di un
DettagliSettori di attività economica
ELABORAZIONE DEI DATI QUALITATIVI Chiara Lamuraglia 1. Premessa Al fine di ottenere informazioni di carattere qualitativo che consentissero di interpretare e leggere in modo più approfondito i dati statistici,
DettagliDIMENSIONI CRITERI INDICATORI
Allegato 4 - Manerbio META EDUCATIVA: autonomia in ambito scolastico (classe 4/5 scuola primaria) DIMENSIONI CRITERI INDICATORI GESTIONALE OPERATIVA Uso degli strumenti Conoscere gli strumenti necessari
DettagliInformatica. Rappresentazione binaria Per esempio +101010000 diventa +0.10101 10 18/10/2007. Introduzione ai sistemi informatici 1
Informatica Pietro Storniolo storniolo@csai.unipa.it http://www.pa.icar.cnr.it/storniolo/info200708 Numeri razionali Cifre più significative: : sono le cifre associate ai pesi maggiori per i numeri maggiori
DettagliUTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI
UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI Un utilizzatore a valle di sostanze chimiche dovrebbe informare i propri fornitori riguardo al suo utilizzo delle sostanze (come tali o all
DettagliRELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica
Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -
DettagliQuestion Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes
Question Answering e semantica Tecnologie emergenti per le imprese Cos è QuestIT? QuestIT nasce nell ambito di attività di ricerca in Intelligenza Artificiale presso il Dipartimento di Ingegneria dell
DettagliI motori di ricerca. Che cosa sono. Stefania Marrara Corso di Sistemi Informativi
I motori di ricerca Stefania Marrara Corso di Sistemi Informativi a.a 2002/2003 Che cosa sono Un motore di ricerca è uno strumento per mezzo del quale è possibile ricercare alcuni termini (parole) all
DettagliLa produzione del testo scritto: generare e pianificare le idee
Lab.D.A. Laboratorio sui Disturbi dell Apprendimento Galleria Berchet, 3 Padova Via Cavour, 24 Rovigo Direttore: Prof. Cesare Cornoldi La produzione del testo scritto: generare e pianificare le idee Come
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliAllegato A Tenuta e redazione delle carte di lavoro
Indice 1 Finalità del documento... 2 2 Definizione... 2 3 Obiettivi... 2 4 Requisiti delle carte di lavoro... 2 5 Forma, contenuto ed ampiezza delle carte di lavoro... 3 6 Modalità e principi di compilazione...
DettagliIncident Management. Obiettivi. Definizioni. Responsabilità. Attività. Input
Incident Management Obiettivi Obiettivo dell Incident Management e di ripristinare le normali operazioni di servizio nel piu breve tempo possibbile e con il minimo impatto sul business, garantendo il mantenimento
DettagliLA REVISIONE LEGALE DEI CONTI La comprensione
LA REVISIONE LEGALE DEI CONTI La comprensione dell impresa e del suo contesto e la valutazione dei rischi di errori significativi Ottobre 2013 Indice 1. La comprensione dell impresa e del suo contesto
DettagliMotori di ricerca. Andrea Marin
Andrea Marin Università Ca Foscari Venezia SVILUPPO INTERCULTURALE DEI SISTEMI TURISTICI SISTEMI INFORMATIVI E TECNOLOGIE WEB PER IL TURISMO - 1 a.a. 2012/2013 Section 1 Information Retrieval e Motori
DettagliAi fini economici i costi di un impresa sono distinti principalmente in due gruppi: costi fissi e costi variabili. Vale ovviamente la relazione:
1 Lastoriadiun impresa Il Signor Isacco, che ormai conosciamo per il suo consumo di caviale, decide di intraprendere l attività di produttore di caviale! (Vuole essere sicuro della qualità del caviale
DettagliIL TEST DI ACCESSO AI CORSI DI STUDIO TRIENNALI DI PSICOLOGIA
AI CORSI DI STUDIO TRIENNALI DI PSICOLOGIA Claudio Barbaranelli Sapienza Università di Roma, Dipartimento di Psicologia 1 OUTLINE - Le prove del test - Il bando: localizzazione e contenuti - La difficoltà
DettagliGli input sono detti anche fattori di produzione: terra, capitale, lavoro, materie prime.
LA TECNOLOGIA Studio del comportamento dell impresa, soggetto a vincoli quando si compiono scelte. La tecnologia rientra tra vincoli naturali e si traduce nel fatto che solo alcuni modi di trasformare
DettagliMatrice Excel Calcolo rata con IMPORTO DEL FINANZIAMENTO determinato dall'utente
Matrice Excel Calcolo rata con IMPORTO DEL FINANZIAMENTO determinato dall'utente L'acquisto di un immobile comporta un impegno finanziario notevole e non sempre è possibile disporre della somma di denaro
DettagliGESTIONE INDUSTRIALE DELLA QUALITÀ A
GESTIONE INDUSTRIALE DELLA QUALITÀ A Lezione 10 CAMPIONAMENTO (pag. 62-64) L indagine campionaria all interno di una popolazione consiste nell estrazione di un numero limitato e definito di elementi che
DettagliDeterminazione del pka per un acido moderatamente debole per via potenziometrica C.Tavagnacco - versione 02.02.05
Determinazione del pka per un acido moderatamente debole per via potenziometrica C.Tavagnacco - versione 02.02.05 Dall equazione di Henderson-Hasselbalch (H-H), ph = pka + log ([A - ]/[HA]) si ricava che
DettagliOrganizzazione degli archivi
COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i
DettagliPROTOCOLLO DI CATALOGAZIONE IN BIBLIOWIN PER NBM E ER
Protocollo catalogazione NMB e ER software BIBLIOWin 1 PROTOCOLLO DI CATALOGAZIONE IN BIBLIOWIN PER NBM E ER PREMESSA Questo protocollo ha lo scopo di fornire ai bibliotecari utenti del software Bibliowin
DettagliBasi di dati. Concetti introduttivi ESEMPIO. INSEGNAMENTI Fisica, Analisi, Aule. Docenti. Entità Relazioni Interrogazioni. Ultima modifica: 26/02/2007
Basi di dati Concetti introduttivi Ultima modifica: 26/02/2007 ESEMPIO INSEGNAMENTI Fisica, Analisi, Informatica Aule Docenti Entità Relazioni Interrogazioni St udent i Database 2 Tabella (I) STUDENTE
DettagliDisegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Indici di Affidabilità L Attendibilità È il livello in cui una misura è libera da errore di misura È la proporzione di variabilità della misurazione
DettagliELABORAZIONE QUESTIONARIO DI GRADIMENTO FORMAZIONE DIRIGENTI E DOCENTI
ELABORAZIONE QUESTIONARIO DI GRADIMENTO FORMAZIONE DIRIGENTI E DOCENTI Premessa La Campagna Straordinaria rivolta alle Scuole ha previsto anche la realizzazione di interventi formativi rivolti a docenti
Dettagli5. IL PC E INTERNET NELLE DIVERSE TIPOLOGIE FAMILIARI
5. IL PC E INTERNET NELLE DIVERSE TIPOLOGIE FAMILIARI 5.1 Considerazioni generali Il livello di informatizzazione delle famiglie toscane è stato esaminato, oltre che sulla base del territorio, anche tenendo
DettagliInformatica 3. Informatica 3. LEZIONE 10: Introduzione agli algoritmi e alle strutture dati. Lezione 10 - Modulo 1. Importanza delle strutture dati
Informatica 3 Informatica 3 LEZIONE 10: Introduzione agli algoritmi e alle strutture dati Modulo 1: Perchè studiare algoritmi e strutture dati Modulo 2: Definizioni di base Lezione 10 - Modulo 1 Perchè
DettagliTechnical Document Release Version 1.0. Product Sheet. MediaSpot. Creazione e gestione palinsesto pubblicitario
Technical Document Release Version 1.0 Product Sheet MediaSpot Creazione e gestione palinsesto pubblicitario MediaSpot MediaSpot è il software di SI Media sviluppato per la gestione completa dei contratti
DettagliMatrice Excel Calcolo rata con TASSO DI INTERESSE determinato dall'utente
Matrice Excel Calcolo rata con TASSO DI INTERESSE determinato dall'utente L'acquisto di un immobile comporta un impegno finanziario notevole e non sempre è possibile disporre della somma di denaro sufficiente
DettagliIndici di dispersione
Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo
DettagliVADEMECUM PER UNA STRATEGIA SEO VINCENTE
F a b r i z i o C a r u s o VADEMECUM PER UNA STRATEGIA SEO VINCENTE L esperienza maturata e i risultati raggiunti nel corso degli anni attraverso l insegnamento e la consulenza SEO mi hanno indotto a
DettagliIl Problem-Based Learning dalla pratica alla teoria
Il Problem-Based Learning dalla pratica alla teoria Il Problem-based learning (apprendimento basato su un problema) è un metodo di insegnamento in cui un problema costituisce il punto di inizio del processo
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliIn Italia e RSM l IBAN e il BBAN hanno la seguente struttura: IBAN
Estremi c/c, IBAN e bonifici (data aggiornamento: 31/10/2007) (versione di riferimento di Business: 11, 12 e 13) (versione di riferimento di Business NET: 2008) A partire dal Gennaio 2008 viene richiesto,
DettagliDomande a scelta multipla 1
Domande a scelta multipla Domande a scelta multipla 1 Rispondete alle domande seguenti, scegliendo tra le alternative proposte. Cercate di consultare i suggerimenti solo in caso di difficoltà. Dopo l elenco
DettagliPROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO
PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti
DettagliCapitolo II. La forma del valore. 7. La duplice forma in cui si presenta la merce: naturale e di valore.
Capitolo II La forma del valore 7. La duplice forma in cui si presenta la merce: naturale e di valore. I beni nascono come valori d uso: nel loro divenire merci acquisiscono anche un valore (di scambio).
DettagliANALISI DEI QUESTIONARI PER LA RILEVAZIONE DELLE OPINIONI DEGLI STUDENTI SUI SINGOLI INSEGNAMENTI
ANALISI DEI QUESTIONARI PER LA RILEVAZIONE DELLE OPINIONI DEGLI STUDENTI SUI SINGOLI INSEGNAMENTI Anno Accademico 008/009 Rapporto statistico riassuntivo Corso di Laurea in Scienze politiche e delle Relazioni
DettagliStefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse
Politecnico di Milano View integration 1 Integrazione di dati di sorgenti diverse Al giorno d oggi d la mole di informazioni che viene gestita in molti contesti applicativi è enorme. In alcuni casi le
DettagliANALISI DEI QUESTIONARI PER LA RILEVAZIONE DELLE OPINIONI DEGLI STUDENTI SUI SINGOLI INSEGNAMENTI
ANALISI DEI QUESTIONARI PER LA RILEVAZIONE DELLE OPINIONI DEGLI STUDENTI SUI SINGOLI INSEGNAMENTI Anno Accademico 008/009 Rapporto statistico riassuntivo Scuola di specializzazione per gli insegnanti della
DettagliAlternanza scuola lavoro: a che punto siamo?
Alternanza scuola lavoro: a che punto siamo? Esiti monitoraggio nazionale a.s. 2012/2013 1 Dati in sintesi e trend L alternanza scuola lavoro è una metodologia didattica innovativa del sistema dell istruzione
DettagliISA 610 e ISA 620 L'utilizzo durante la revisione dei revisori interni e degli esperti. Corso di revisione legale dei conti progredito
ISA 610 e ISA 620 L'utilizzo durante la revisione dei revisori interni e degli esperti. Corso di revisione legale dei conti progredito 1 ISA 610 USING THE WORK OF INTERNAL AUDITORS Questo principio tratta
Dettagli4. Operazioni elementari per righe e colonne
4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:
DettagliOCCUPATI SETTORE DI ATTIVITA' ECONOMICA
ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971
DettagliModulo: Scarsità e scelta
In queste pagine è presentato un primo modello di conversione di concetti, schemi e argomentazioni di natura teorica relativi all argomento le scelte di consumo (presentato preliminarmente in aula e inserito
DettagliDispensa di database Access
Dispensa di database Access Indice: Database come tabelle; fogli di lavoro e tabelle...2 Database con più tabelle; relazioni tra tabelle...2 Motore di database, complessità di un database; concetto di
DettagliPro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
DettagliSicurezza Aziendale: gestione del rischio IT (Penetration Test )
Sicurezza Aziendale: gestione del rischio IT (Penetration Test ) Uno dei maggiori rischi aziendali è oggi relativo a tutto ciò che concerne l Information Technology (IT). Solo negli ultimi anni si è iniziato
DettagliCapitolo 7. Efficienza e scambio. Principi di economia (seconda edizione) Robert H. Frank, Ben S. Bernanke
Capitolo 7 Efficienza e scambio Pareto-efficienza L efficienza in senso economico ha una definizione ristretta che prende il nome da un economista italiano (Vilfredo Pareto) una allocazione è efficiente
DettagliMetodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla
Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
DettagliVALORE DELLE MERCI SEQUESTRATE
La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune
DettagliEffetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria
Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Christopher N. Sciamanna, Scott P. Novak, Bess H. Marcus. International Journal of
DettagliIL RISCHIO D IMPRESA ED IL RISCHIO FINANZIARIO. LA RELAZIONE RISCHIO-RENDIMENTO ED IL COSTO DEL CAPITALE.
IL RISCHIO D IMPRESA ED IL RISCHIO FINANZIARIO. LA RELAZIONE RISCHIO-RENDIMENTO ED IL COSTO DEL CAPITALE. Lezione 5 Castellanza, 17 Ottobre 2007 2 Summary Il costo del capitale La relazione rischio/rendimento
DettagliPROFILO RIASSUNTIVO DELLE AREE
PROFILO RIASSUNTIVO DELLE AREE CATEGORIA AREE DEFINIZIONE IMPLICAZIONI CHIAVE Relazioni e Comunicazione Interpersonale A - B - C Sviluppo delle conoscenze e Abilità Qualità e Prestazioni Soddisfazione
DettagliFinanza Aziendale. Lezione 13. Introduzione al costo del capitale
Finanza Aziendale Lezione 13 Introduzione al costo del capitale Scopo della lezione Applicare la teoria del CAPM alle scelte di finanza d azienda 2 Il rischio sistematico E originato dalle variabili macroeconomiche
DettagliGRIGLIA DI PROGETTAZIONE
GRIGLIA DI PROGETTAZIONE Utenti destinatari Classi prime - Scuola Secondaria di 1 grado S. Pellico - Camerano Periodo di applicazione (ore totali 22) Aprile 2014 / Maggio 2014 Docenti coinvolti Compito/Prodotto
DettagliPiano di gestione della qualità
Piano di gestione della qualità Pianificazione della qualità Politica ed obiettivi della qualità Riferimento ad un eventuale modello di qualità adottato Controllo della qualità Procedure di controllo.
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
DettagliLa Metodologia adottata nel Corso
La Metodologia adottata nel Corso 1 Mission Statement + Glossario + Lista Funzionalià 3 Descrizione 6 Funzionalità 2 Schema 4 Schema 5 concettuale Logico EA Relazionale Codice Transazioni In PL/SQL Schema
DettagliMService La soluzione per ottimizzare le prestazioni dell impianto
MService La soluzione per ottimizzare le prestazioni dell impianto Il segreto del successo di un azienda sta nel tenere sotto controllo lo stato di salute delle apparecchiature degli impianti. Dati industriali
DettagliEsempi di algoritmi. Lezione III
Esempi di algoritmi Lezione III Scopo della lezione Implementare da zero algoritmi di media complessità. Verificare la correttezza di un algoritmo eseguendolo a mano. Imparare a valutare le prestazioni
DettagliQuali sono le ragioni per passare alle competenze? Stimoli esterni: Consiglio europeo di Lisbona (22-23/03/2000);
Stimoli esterni: Consiglio europeo di Lisbona (22-23/03/2000); Raccomandazioni Parlamento Europeo e del Consiglio dell'unione Europea (18/12/2006); DM 22 agosto 2007; I risultati nelle indagini internazionali
DettagliSCENARIO. Personas. 2010 ALICE Lucchin / BENITO Condemi de Felice. All rights reserved.
SCENARIO Personas SCENARIO È una delle tecniche che aiuta il designer a far emergere le esigente dell utente e il contesto d uso. Gli scenari hanno un ambientazione, attori (personas) con degli obiettivi,
DettagliProgetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario
Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,
DettagliPresupposti per la determinazione per l anno 2003 del prezzo all ingrosso dell energia elettrica destinata ai clienti del mercato vincolato
Relazione tecnica Presupposti per la determinazione per l anno 2003 del prezzo all ingrosso dell energia elettrica destinata ai clienti del mercato vincolato 1. Premessa e contesto normativo Il provvedimento
DettagliMODULO 5 Appunti ACCESS - Basi di dati
MODULO 5 Appunti ACCESS - Basi di dati Lezione 1 www.mondopcnet.com Modulo 5 basi di dati Richiede che il candidato dimostri di possedere la conoscenza relativa ad alcuni concetti fondamentali sui database.
DettagliGeneral Linear Model. Esercizio
Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue
DettagliCorso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
DettagliOpportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica. Francesco Maria Sanna Roma, 3 maggio 2012
Opportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica Francesco Maria Sanna Roma, 3 maggio 2012 Procedere alla misura, al rilevamento e al trattamento dei dati è sempre stato
DettagliStage 6. "Esplorare nuovi Spazi"
Stage 6. "Esplorare nuovi Spazi" Gli obiettivi Nella prima sezione del questionario si è chiesto ai partecipanti di esprimere un giudizio riguardo il raggiungimento degli obiettivi previsti dal progetto
DettagliL EFFICACIA DELLE MISURE DI POLITICA ATTIVA DEL LAVORO REALIZZATE IN PROVINCIA DI TORINO NEL 2007-08
1 La valutazione L EFFICACIA DELLE MISURE DI POLITICA ATTIVA DEL LAVORO REALIZZATE IN PROVINCIA DI TORINO NEL 2007-08 Esiti occupazionali a 24 dalla partecipazione Vengono qui riassunti i risultati della
DettagliGUIDA ALLA RILEVANZA
GUIDA ALLA RILEVANZA Posizionamento per Rilevanza Suggerimenti per una migliore visibilità su ebay www.egolden.it Vers. 1.1 Questa guida puo essere ridistribuita con l obbligo di non modificarne contenuto
DettagliNota interpretativa. La definizione delle imprese di dimensione minori ai fini dell applicazione dei principi di revisione internazionali
Nota interpretativa La definizione delle imprese di dimensione minori ai fini dell applicazione dei principi di revisione internazionali Febbraio 2012 1 Mandato 2008-2012 Area di delega Consigliere Delegato
DettagliComparazione dei Risultati dell Indagine
Comparazione dei Risultati dell Indagine DOCTAE (Agr. nr. 2007-1983 001/001) Questo progetto è stato finanziato con il supporto della Commissione Europea. Questo documento riflette unicamente il punto
DettagliStimare il WCET Metodo classico e applicazione di un algoritmo genetico
Stimare il WCET Metodo classico e applicazione di un algoritmo genetico Sommario Introduzione Definizione di WCET Importanza del WCET Panoramica dei classici metodi per calcolare il WCET [1] Utilizzo di
DettagliDocumento di accompagnamento: mediane dei settori bibliometrici
Documento di accompagnamento: mediane dei settori bibliometrici 1. Introduzione Vengono oggi pubblicate sul sito dell ANVUR e del MIUR 3 tabelle, deliberate nel CD dell ANVUR del 13 agosto 2012, relative
DettagliLibrerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video
Video Librerie digitali Gestione di video Ogni filmato è composto da più parti Video Audio Gestito come visto in precedenza Trascrizione del testo, identificazione di informazioni di interesse Testo Utile
DettagliPrestazioni CPU Corso di Calcolatori Elettronici A 2007/2008 Sito Web:http://prometeo.ing.unibs.it/quarella Prof. G. Quarella prof@quarella.
Prestazioni CPU Corso di Calcolatori Elettronici A 2007/2008 Sito Web:http://prometeo.ing.unibs.it/quarella Prof. G. Quarella prof@quarella.net Prestazioni Si valutano in maniera diversa a seconda dell
DettagliCaratteristiche del contesto. Rubrica valutativa della competenza
Caratteristiche del contesto Rubrica valutativa della competenza Traguardi di apprendimento (riferiti ai saperi disciplinari, in termini di conoscenza, abilità e atteggiamenti) Senso del percorso formativo
DettagliInformatica 3. LEZIONE 21: Ricerca su liste e tecniche di hashing. Modulo 1: Algoritmi sequenziali e basati su liste Modulo 2: Hashing
Informatica 3 LEZIONE 21: Ricerca su liste e tecniche di hashing Modulo 1: Algoritmi sequenziali e basati su liste Modulo 2: Hashing Informatica 3 Lezione 21 - Modulo 1 Algoritmi sequenziali e basati su
DettagliLE COMPETENZE CHE VALGONO UN LAVORO LE INDICAZIONI FORNITE DALLE IMPRESE ATTRAVERSO IL SISTEMA INFORMATIVO EXCELSIOR
Le sfide all'orizzonte 2020 e la domanda di competenze delle imprese LE COMPETENZE CHE VALGONO UN LAVORO LE INDICAZIONI FORNITE DALLE IMPRESE ATTRAVERSO IL SISTEMA INFORMATIVO EXCELSIOR Domenico Mauriello
Dettagli