Esercizio 1. (7 punti) Illustrare facendo uso di pseudocodice uno degli algoritmi per l estrazione di regole di decisione visti a lezione.



Documenti analoghi
(spazio per i docenti)

COGNOME E NOME (IN STAMPATELLO) MATRICOLA

RAPPRESENTAZIONE GRAFICA DEGLI ALGORITMI

Compito DA e BD. Tempo concesso: 90 minuti 12 giugno 03 Nome: Cognome: Matricola: Esercizio 1

Politecnico di Milano Facoltà di Ingegneria dell Informazione AGENTI AUTONOMI E SISTEMI MULTIAGENTE Appello COGNOME E NOME

SIMULAZIONE ESAME di OTTIMIZZAZIONE Corso di Laurea in Ingegneria Gestionale 2 o anno

MATEMATICA GENERALE - (A-D) Prova d esame del 1 giugno FILA A

Traccia di soluzione dell esercizio del 25/1/2005

COMPITO B - ANALISI DEI DATI PER IL MARKETING OTTOBRE 2009

MATEMATICA GENERALE - (A-D) Prova d esame del 7 febbraio FILA A

per le persone in formazione del ramo di formazione e d esame <inserire il ramo>

Esercitazioni di Calcolo Numerico 23-30/03/2009, Laboratorio 2

Metodi di calcolo dei costi di prodotto

Laboratorio di Alfabetizzazione Informatica - Esame 20 settembre 2013.

Progetto PI , passo A.1 versione del 14 febbraio 2007

Alternanza scuola lavoro: a che punto siamo?

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ

MATEMATICA GENERALE Prova d esame del 18 giugno FILA A

PROGRAMMA SVOLTO DI INFORMATICA ANNO SCOLASTICO 2013/2014. DOCENTE: Villani Chiara

Università di Roma La Sapienza, Facoltà di Ingegneria

Università degli Studi di Padova Dipartimento di Matematica. - Corso di Laurea in Informatica

Gli attributi di STUDENTE saranno: Matricola (chiave primaria), Cognome, Nome.

La seduta ha termine alle ore 13,30.

Il mercato assicurativo: selezione avversa, fallimenti del mercato, menù di contratti, assicurazione obbligatoria

Introduzione alla contabilità Appunti introduttivi / Quick guide. Luca Dossena - Docente

Tecnologie e servizi di rete 23 giugno Nome e Cognome... Matricola...

Percorso di formazione continua nell ambito del progetto La strada per domani 2 Modulo qualità e sviluppo

Informatica (Basi di Dati)

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE

Laboratorio di Algoritmi e Strutture Dati

Algoritmi e diagrammi di flusso

Consideriamo due polinomi

La valutazione dell opinione degli studenti sulla didattica

1. Che cos è la multiprogrammazione? Si può realizzare su un sistema monoprocessore? 2. Quali sono i servizi offerti dai sistemi operativi?

Università degli Studi di L Aquila. Facoltà di Ingegneria. Corso di Laurea in Ingegneria Elettronica Corso di Sistemi Informativi

Guida al colloquio d esame

Logica Numerica Approfondimento 1. Minimo Comune Multiplo e Massimo Comun Divisore. Il concetto di multiplo e di divisore. Il Minimo Comune Multiplo

1996: il prezzo salì a $5.00 per bushel con contestazioni sui vecchi contratti

TEMI D ESAME. Valore contabile Valore corrente Brevetti Magazzino

ALGORITMO DEL SIMPLESSO

Esercitazione di Basi di Dati

Periodo di riferimento Gennaio Giugno Osservatorio sui Servizi

PARTE A 1. Si valuti la convenienza della operazione di acquisto di una posizione di cambio a termine a tre mesi, in assenza di costi di negoziazione.

Strategia Laboratoriale

Collegio di Ingegneria Gestionale

BASE DI DATI: sicurezza. Informatica febbraio ASA

ALTAMURA. II Rassegna "Musicale per le Scuole" Premio Teatro Mercadante Anno scolastico PREMESSA

ESAMI DI QUALIFICA PROFESSIONALE

Strutturazione logica dei dati: i file

Innovazione e Design educativo per la buona scuola

(Preventivatore Veicoli a Motore) MANUALE D USO. Aggiornamento maggio 2007

Statistica Aziendale Avanzata

Il Piano di Marketing

Analisi Statistica per le Imprese (6 CFU) - a.a Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA

Bando Start-up 4 Alba Rivolto ad aspiranti imprenditori

ALLEGATO N. 1 AL DOCUMENTO 15 MAGGIO V D PROGRAMMATORI

Zurich Connect Compagnia diretta di assicurazione Proposta di collaborazione per i consorziati a Brokers Italiani

E ELLE - INDICATORI STATISTICI DELL'ECONOMIA e DEL LAVORO COMMERCIO E SERVIZI

Corso di. Analisi e contabilità dei costi

Università degli studi di Roma La Sapienza

Punto tesoreria: dati sull autofinanziamento al 13 febbraio 2009

ISTITUTO D ISTRUZIONE SUPERIORE MAJORANA Via Ada Negri, MONCALIERI (TO) Codice fiscale

MODELLO E/R. Modellazione dei dati

IL PREVENTIVATORE UNICO RC AUTO

Economia Politica. Indicate Nome e Cognome, Numero di matricola e Corso di Laurea su ogni foglio.

Prova di Esame - Rete Internet (ing. Giovanni Neglia) Prova completa Mercoledì 14 Settembre 2005, ore 9.00

Le votazioni. Consorzio Interuniversitario ALMALAUREA 123

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

ESAME DI STATO PER L ABILITAZIONE ALLA PROFESSIONE DI INGEGNERE II SESSIONE 2008 TRACCIA N. 1

4 Concorso di Musica Città di Gangi REGOLAMENTO

- OLIMPIADI DI PROBLEM SOLVING - Informatica e pensiero algoritmico nella scuola dell'obbligo

Politecnico di Milano I a Facoltà di Ingegneria C.S. in Ing. per l Ambiente e il Territorio

Servizi offerti ai clienti Intesa Sanpaolo Casa

Mappatura dei processi aziendali. Una metodologia per l analisi dei processi

(liberamente interpretato da SCHEDA ALUNNI. Descrizione dell attività:

da dove siamo venuti e dove vorremo andare

Sign. Mario Rossi Team Pianificazione Assicurativa

Analisi e diagramma di Pareto

Corso di Sistemi di Elaborazione delle Informazioni I Anno 2005/2006. Esercizi entità relazione risolti. a cura di Angela Campagnaro

MODULO INTRODUCTORY IN PROJECT MANAGEMENT POLITECNICO DI MILANO EDIZIONE

Il Test d ingresso per la Facoltà à di Scienze. PISA 3 dicembre 2008

Prova esperta asse matematico LAVORO INDIVIDUALE

Facoltà di Scienze Politiche Corso di Economia Politica. Esercitazione di Microeconomia sui capitoli 11, 12 e 13

IL RISPARMIO ENERGETICO E GLI AZIONAMENTI A VELOCITA VARIABILE L utilizzo dell inverter negli impianti frigoriferi.

CAUSA 6 - impresa in liquidazione coatta amministrativa o fallimento

IL RUOLO DEL DIRIGENTE SCOLASTICO NELLA PREDISPOSIZIONE DEL PROCESSO DI MIGLIORAMENTO. Vanna Monducci 6 settembre 2013

GRAFICO DI FUNZIONI GONIOMETRICHE

TEATRO MERCADANTE. Premio Teatro Mercadante

Il campionamento statistico

Progettazione del Software, Laurea in Ingegneria Gestionale Progettazione del Software Laurea in Ing. Gestionale

Fila A. Economia Aziendale Economia e Commercio Cognome... Nome... Matricola...

Basi di dati 9 febbraio 2010 Compito A

Esercizi di Macroeconomia per il corso di Economia Politica

Parimenti una gestione delle scorte in maniera non oculata può portare a serie ripercussioni sul rendimento sia dei mezzi propri che di terzi.

ESAME DI STATO PER LA PROFESSIONE DI ATTUARIO ANNO 2013 II SESSIONE PROVA PRATICA BUSTA N. 1

Compito di Informatica Grafica 5 appello 29/06/2006

25/04/2011. PROGRAMMAZIONE E CONTROLLO Prof. Luca Fornaciari

Il Sistema Nazionale di Autovalutazione

Tempi di realizzazione

Transcript:

Politecnico di Milano Facoltà di Ingegneria dell Informazione Metodologie per Sistemi Intelligenti Prof. Lanzi e Ing. Rossini 19 Luglio 2005 COGNOME E NOME (IN STAMPATELLO) MATRICOLA Risolvere i seguenti esercizi, scrivendo le risposte ed eventuali tracce di soluzione negli spazi disponibili. NON CONSEGNARE ALTRI FOGLI. (spazio per i docenti) Esercizio 1. (7 punti) Illustrare facendo uso di pseudocodice uno degli algoritmi per l estrazione di regole di decisione visti a lezione. Soluzione: Lezione su regole di classificazione

Esercizio 2. (5 punti) Solo per gli studenti che non hanno presentato l articolo in classe. Dato il seguente insieme di dati di train, in cui l attributo nazionalità rappresenta la classe, calcolare l information gain dei tre attributi rimanenti. Dire inoltre qual è l attributo migliore su cui effettuare lo split. Mangia Suona Baffi Nazionalità Spaghetti Mandolino No A Maccheroni Chitarra Si B Riso Chitarra No A Riso Chitarra Si A Spaghetti Pianoforte Si B Maccheroni Pianoforte Si B Maccheroni Pianoforte No A Riso Chitarra No B

Esercizio 3. (7 punti) Illustrare l algoritmo Agglomerative Nesting (AGNES). Si consideri poi la seguente matrice delle distanze relativa a 5 elementi. 2 7 7 9 4 8 5 3 1 0 A partire da questa si ricavi il dendrogramma utilizzando per il calcolo delle distanze il metodo del Complete Linkage o del Single Linkage (a scelta del candidato). Soluzione: calcolo delle distanze col metodo del Complete Linkage I passo: minima distanza d 45 =1, aggrego gli elementi 4 e 5 d (45)1 =max (d 41, d 51 )=max (7,8)=8 d (45)2 =max (d 42, d 52 )=max (9,5)=9 d (45)3 =max (d 43, d 53 )=max (4,3)=4 Matrice delle distanze D 1 2 7 8 9 4 0 II passo: minima distanza d 12 =2, aggrego gli elementi 1 e 2 d (12)3 =max (d 13, d 23 )=max (5,7)=7 d (12)(45) =max (d 1(45), d 2(45) )=max (8,9)=9 Matrice delle distanze D 2 7 9 4 0 III passo: minima distanza d 3(45) =4, aggrego l elemento 3 con il gruppo (45) d (3 (45))(12) =max (d 3(12), d (45)(12))=max (7,9)=9 Matrice delle distanze D 3 9 0 IV passo: minima distanza d (3 (45))(12)=9, aggrego i due gruppi (345) e (12) in un unico gruppo Dendrogramma 1 2 3 4 5 0 1 2 3 4 5 6 7 8 9

Soluzione: calcolo delle distanze col metodo del Single Linkage I passo: minima distanza d 45 =1, aggrego gli elementi 4 e 5 d (45)1 =min (d 41, d 51 )=min (7,8)=7 d (45)2 =min (d 42, d 52 )=min (9,5)=5 d (45)3 =min (d 43, d 53 )=min (4,3)=3 Matrice delle distanze D 1 2 7 7 5 3 0 II passo: minima distanza d 12 =2, aggrego gli elementi 1 e 2 d (12)3 =min (d 13, d 23 )=min (5,7)=7 d (12)(45) =min (d 1(45), d 2(45) )=min (7,5)=5 Matrice delle distanze D 2 5 3 0 III passo: minima distanza d 3(45) =3, aggrego l elemento 3 con il gruppo (45) d (3 (45))(12) =min (d 3(12), d (45)(12))=min (5,5)=5 Matrice delle distanze D 3 5 0 IV passo: minima distanza d (3 (45))(12)=5, aggrego i due gruppi (345) e (12) in un unico gruppo Dendrogramma 1 2 3 4 5 0 1 2 3 4 5

Esercizio 4. (7 punti) Descrivere il processo di costruzione di un modello previsionale specificando le caratteristiche e le finalità di ciascuno dei set di dati utilizzati. Rappresentare poi per ognuno dei set di dati utilizzati il tipico andamento della curva lift ottenuto nel caso di buoni modelli. Si consideri inoltre il seguente problema. La compagnia assicurativa L&R ha deciso di sviluppare, nell ambito delle campagne di vendita previste per le attività di cross selling (vendita di un prodotto/servizio aggiuntivo rispetto a quanto già posseduto dal cliente), un modello previsionale per la vendita della polizza Infortuni Guidatori ai clienti che hanno una già sottoscritto la polizza Auto R&P. Analizzando i risultati del modello ottenuti dal set di valutazione, si scopre che il primo 10% dei clienti corrisponde ad appena il 18% dei clienti che hanno oltre alla polizza Auto R&P la polizza Infortuni Guidatori. Supponendo che i clienti della polizza Infortuni Guidatori all interno del set di dati analizzato sono pari al 50%, qual è l incremento teorico massimo del modello? Quali le performance del modello? Soluzione Primo quesito: Esercitazione 01 Modelli previsionali, Costruzione di Modelli Previsionali Secondo quesito: se il 10% dei clienti con il miglior punteggio avessero la polizza Infortuni Guidatori, essi inciderebbero per il 20% (il 10% del 50%), che rappresenta l incremento teorico massimo. Il modello ottenuto mostra quindi un risultato soddisfacente.

Esercizio 5. (4 punti) Illustrare brevemente le fasi che compongono il tipico processo preparazione dei dati. Indicare poi le possibili cause che determinano i valori missing nei dati e le tecniche tipicamente utilizzate per la loro gestione. Soluzione Primo quesito: esercitazione 04 Data PreProcessing Secondo quesito: esercitazione 04 Data PreProcessing, Data Cleaning