Modelli matematici e Data Mining



Documenti analoghi
Data Science A.A. 2018/2019

I Componenti del processo decisionale 7

Data Science A.A. 2018/2019

Laboratorio di Sistemi Informativi Aziendali a.a

Sistemi e modelli. Sistemi

LA RICERCA OPERATIVA (R.O.)

Modelli e Metodi per la Simulazione (MMS)

Indice generale. Introduzione. Capitolo 1 Essere uno scienziato dei dati... 1

Sistemi informativi aziendali struttura e processi

Classificazione Mario Guarracino Data Mining a.a. 2010/2011

Istituto Universitario Architettura Venezia TR 285. Servizio Bibliografico Audiovisivo e di Documentazione

Indice Premessa Cenni storici delle misure

Statistica per l impresa

MASTER UNIVERSITARIO

MATEMATICA CLASSE PRIMA: NUMERI TRAGUARDI IN USCITA:

Politecnico di Milano Dipartimento di Elettronica e Informazione Introduzione. Laboratorio di Reti di Telecomunicazione

Programmazione e Controllo della Produzione. Introduzione

INTRODUZIONE PARTE I LA PREVENZIONE E LA DIAGNOSI

Statistica multivariata 27/09/2016. D.Rodi, 2016

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

CURRICOLO DI MATEMATICA

L INFORMATICA c1. Informatica è qualcosa che ha a che fare con l uso del computer

MATEMATICA e COMPLEMENTI di MATEMATICA

La Competitive Intelligence

Sommario Obiettivo della programmazione e ciclo di sviluppo di programmi. Programmi. Ciclo di sviluppo di programmi. Obiettivo

1. EVOLUZIONE DELLE TECNOLOGIE DI ANALISI DEI DATI

Modellazione di sistemi ingegneristici (parte 1 di 2)

L adozione di MATLAB e Simulink nei Corsi di Ingegneria al Politecnico di Milano. Maurizio Magarini MATLAB EXPO Milano, 4 novembre 2014

Numero OBIETTIVI DI APPRENDIMENTO ABILITÀ CONTENUTI Scoprire e costruire la successione numerica entro la classe delle unità semplici.

Lezione 1. 1 Probabilità e statistica. 2 Definizioni di probabilità. Statistica e analisi dei dati Data: 22 Febbraio 2016

Introduzione alla ricerca operativa Problemi e modelli

Serie storiche Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

NUMERI ED OPERAZIONI indicatori descrittori valutazione

Processi decisionali e modelli di simulazione

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Simulazione. D.E.I.S. Università di Bologna DEISNet

SISTEMI DI REFERENZIAZIONE. [ ] Responsabili di magazzino e della distribuzione interna

PROGRAMMAZIONE MATEMATICA classe seconda economico/turistico:

Classe quarta NUMERI. (Nucleo tematico) VALUTAZIONE DELLE COMPETENZE. ABILITÀ (Competenze specifiche) CONTENUTI (Conoscenze)

1 PROCESSI STOCASTICI... 11

Aspetti linguistici e di rappresentazione nell insegnamento della matematica Il caso dell aritmetica

Materia: Tecnologie e tecniche di rappresentazione grafica

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Introduzione alla simulazione

Classificazione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Note introduttive alla probabilitá e alla statistica

Lezioni di Ricerca Operativa

PROGRAMMAZIONE DIDATTICA DISCIPLINARE Liceo scientifico Anno scolastico Materia Classi Matematica Terze-Quarte

Sommario. Prefazione...xi. Capitolo 1 Introduzione...1. Capitolo 2 Basi concettuali... 19

CREARE UNA NUOVA IMPRESA

Liceo Scientifico " C. CATTANEO " PIANO DI LAVORO DI INFORMATICA. CLASSE 3 LSA SEZ. B e D

Reti Neurali in Generale

Fattori Critici di Successo

Università di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali

Dipartimento di INFORMATICA, TC, TTRG. Anno Scolastico Piano di Lavoro Disciplinare

Fondamenti di Ricerca Operativa LA. Corso di Laurea in Ingegneria Gestionale

Istituto Comprensivo di Pralboino Curricolo Verticale

Scuola Statale Italiana di Madrid Anno scolastico PROGRAMMAZIONE CURRICOLARE DI MATEMATICA Classe quarta B Insegnante: Adriano Adamo

CORSO DI LAUREA IN INGEGNERIA PER L AMBIENTE E IL TERRITORIO. Programma del corso di Tecnica ed Economia dei Trasporti. Prof.

I. Principî di marketing... 1

MATRICE TUNING competenze versus unità didattiche, Corso di Laurea in Informatica (classe L-31), Università degli Studi di Cagliari

Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

MATEMATICA - NUMERO Classe 1, 2, 3, 4, 5 ISTITUTO COMPRENSIVO DI CARIGNANO

Mathcad Prime 2.0 Guida al curriculum

PROGETTAZIONE ANNUALE PER COMPETENZE DISCIPLINARI MATEMATICA CLASSE II - OTTOBRE - NOVEMBRE Competenza chiave europea

Machine Learning: apprendimento, generalizzazione e stima dell errore di generalizzazione

Istituto Comprensivo

PROGRAMMAZIONE CLASSE QUINTA - MATEMATICA NUMERO

I SISTEMI. di entità che interagiscono tra loro in vista del conseguimento di un obiettivo (o scopo).

Università degli Studi di Perugia Corso di Laurea Magistrale in Finanza e Metodi Quantitativi per l Economia. Econometria. Introduzione al corso

Istituto Comprensivo Luigi Capuana Mineo Anno Scolastico

Indice generale. Prefazione

Laboratorio di matematica: processamento, interpretazione ed elaborazione dei dati

Matematica - Classe Prima

Istituto Comprensivo

Corso di Modelli e Algoritmi della Logistica

Introduzione alla probabilità

CURRICOLO VERTICALE MATEMATICA RELAZIONI/ DATI E PREVISIONI/ MISURA

relazioni classe 1 a 2 a 3 a

Statistica per l Impresa

MATERIALI PER LA DISCUSSIONE

SCHEDA DATI PER OFFERTA FORMATIVA PUBBLICA DI CUI AL PUNTO 1.2 DELLA CIRCOLARE MINISTERIALE N 187 DELL 11 GIUGNO

OTTIMIZZAZIONE in unione con COMPLEMENTI DI RICERCA OPERATIVA

PROGRAMMAZIONE DIDATTICA DI MATEMATICA

4. Matematica applicata all economia opzione

ISTITUTO COMPRENSIVO ALLENDE SCUOLA SECONDARIA DI PRIMO GRADO ALLENDE Paderno Dugnano

Area di Istruzione Generale Attività e Insegnamenti Generali. Disciplina: MATEMATICA

Dall intuizione alla conoscenza

Jerom Bruner - nasce a New York nel 1915 professore di psicologia alla Harvard University

Metodi & Modelli per le Scelte Economiche

Informazioni sul corso 1

Corso di Programmazione Dati e Istruzioni. Comunicazione dell algoritmo all elaboratore. Programmazione. Dott. Pasquale Lops

Lingue e culture per il turismo e il commercio internazionale MARKETING DEL TURISMO. Lezione aprile 2009

CLASSE: 3ELE MATERIA: SISTEMI AUTOMATICI DOCENTE: PELLEGRINI PROGRAMMAZIONE DIDATTICA. competenze chiave competenze base abilità conoscenze

CLASSE: 3ELE MATERIA: SISTEMI AUTOMATICI DOCENTE: PELLEGRINI PROGRAMMAZIONE DIDATTICA

Transcript:

Modelli matematici e Data Mining

Introduzione I modelli matematici giocano un ruolo critico negli ambienti di business intelligence e sistemi di supporto alle decisioni. Essi rappresentano un astrazione selettiva di un sistema reale e vengono utilizzati per capire in astratto come funziona un sistema reale. Nell elaborazione di un modello bisognerebbe rendere tutto il più semplice possibile, ma non troppo semplice.

Struttura dei modelli Iconici: modelli che costituiscono una rappresentazione fisica della realtà (es. un plastico) Analogici: rappresenta fisicamente la realtà (es. la galleria del vento) Simbolici: costituiscono una rappresentazione astratta di un sistema concreto (es. modello matematico).

Modelli stocastici e deterministici Nei modelli stocastici alcune informazioni fornite in ingresso rappresentano eventi aleatori e sono caratterizzate da una distribuzione di probabilità assegnata oppure ignota es. modelli della teoria delle code. Un modello si dice deterministico se tutti i dati in ingresso si suppongono noti a priori con certezza.

Modelli statici e dinamici I modelli statici considerano un sistema ed il relativo processo decisionale in un unica fase temporale. Es. alcuni modelli di ottimizzazione I modelli dinamici considerano un sistema attraverso varie fasi temporali, di solito di ampiezza predefinita. Es. serie temporali.

Fasi di sviluppo Identificazione del problema Formulazione del modello Sviluppo degli algoritmi Realizzazione e collaudo

Identificazione del problema La prima fase consiste nellàidentificare correttamente il problema da affrontare. E necessario analizzare i sintomi e formulare le prime ipotesi. Es. Il livello di giacenza a fronte di indici di rotazione elevati, è sintomo di un inefficace pianificazione?

Formulazione del modello Orizzonte temporale Es. qual è il periodo di tempo considerato? Valutazione delle decisioni Indicatori di prestazione: costi e ricavi, livello di efficacia, qualità dei prodotti, flessibilità, affidabilità, Variabili di decisione Es. In un piano di produzione vanno prese in considerazione i volumi produttivi dei prodotti/ processi/ periodi.

Formulazione del modello Parametri numerici Es. capacità produttiva, capacità di assorbimento, Relazioni matematiche Legami deterministici o probabilistici.

Sviluppo degli algoritmi La risoluzione di un modello richiede l identificazione l algoritmo risolutivo e degli strumenti software che lo incorporano. Non è possibile prescindere dalla conoscenza dei metodi risolutivi esistenti e delle loro caratteristiche.

Realizzazione e collaudo E necessario verificare: Plausibilità e verosimiglianza delle conclusioni raggiunte; Consistenza dei risultati per valori estremi; Stabilità dei risultati.

Classi di modelli Modelli predittivi Esplicativi: identificano la forma funzionale di una relazione. Es. Modelli di regressione, classificazione, Serie storiche: identificano eventuali regolarità. Modelli di apprendimento Modelli di interpretazione: identificano regolarità e le esprimono tramite regole criteri. Apprendimento supervisionato e non supervisionato Modelli di ottimizzazione Pianificazione logistica, produttiva, finanziaria

Classi di modelli Modelli per la gestione dei progetti PERT: project evaluation and review techniques. Modelli di analisi del rischio Teoria bayesiana delle decisioni. Modelli di teoria delle code

Data Mining Il complesso delle attività volte all analisi di basi di dati di grandi dimensioni per ricavarne conoscenze utilizzabili nel corso dei processi decisionali. Il data mining indica il processo di esplorazione ed analisi di un insieme di dati per individuarne regolarità, estrarne conoscenza e ricavare regole ricorrenti.

Interpretazione e predizione L interpretazione è volta ad identificare schemi di regolarità presenti nei dati e a esprimerli attraverso regole e criteri che risultino comprensibili agli esperti. La predizione è volta a prevedere il valore che una variabile casuale assumerà in futuro, oppure a stimare la probabilità di un certo evento. Le due attività non sono mutuamente esclusive: un modello sviluppato per la predizione può risultare efficace anche per l interpretazione.

Applicazioni di data mining Marketing relazionale Identificazione di segmenti di clienti, Stima del tasso di risposta, Comprensione dei comportamenti d acquisto, Identificazione delle combinazioni di acquisto. Identificazione di frodi Telefoniche assicurative, bancaria, Valutazione del rischio Prestiti, mutui,

Applicazioni di data mining Text mining Spam, classificazione di notizie d agenzia, Web mining Caching, personalizzazione, pagine dinamiche, Diagnostica medica Diagnosi e prognosi.

Rappresentazione dei dati di input Categorici Conteggi (associazione di una carta ad un conto) Nominali (città di residenza) Ordinali (livello di scolarità) Numerici Discreti Continui

Processo di data mining Analisi Analisi esplorativa Selezione degli degli attributi attributi Sviluppo modelli modelli Predizione Interpretazione Data Data mart mart Raccolta dati dati e integrazione Definizione

Metodologie di analisi Apprendimento supervisionato Caratterizzare e discriminare Classificare Stimare Serie storiche Apprendimento non supervisionato Regole associative Clustering Descrizione e visualizzazione

Sommario Abbiamo visto: Struttura dei modelli matematici Fasi di sviluppo dei modelli Classi principali di modelli Definizione, modelli, applicazioni di data mining Rappresentazione dei dati Metodologie di analisi

Nella prossima lezione Preparazione dei dati Validazione Trasformazione Riduzione