Knowledge Discovery e Data Mining
|
|
|
- Ida Pozzi
- 10 anni fa
- Visualizzazioni
Transcript
1 Sommario Knowledge Discovery e Mining Introduzione Motivazioni ed applicazioni ll processo di KDD Fasi e caratteristiche Le tecniche di DM Classificazione e regressione Scoperta di regole associative Clustering La classificazione Alberi di decisione Classificatori instance-based Motivazioni Problema della crescita dei dati : La disponibilità di tecnologie efficienti e poco costose per la raccolta e la gestione di dati porta ad accumulare un incredibile quantità di dati Opportunità di trarre vantaggio competitivo dai dati Inadeguatezza dei sistemi di analisi tradizionali We are drowning in data, but starving for knowledge! A cosa serve il Mining? Accrescere la conoscenza su cui basare le decisioni decision support system (DSS) Soluzioni: data warehousing e data mining: On-line analytical processing Estrazione di conoscenza interessante (regole, regolarità, patterns, vincoli) dai dati in grandi DB. data knowledge La catena del valore dell informazione Decisioni Promuovere il prodotto A nei negozi della regione Z Offrire dei servizi addizionali ai clienti di classe C Il prodotto P èusato per lo Progettare cataloghi di più da clienti giovani prodotti adatti ai vari profili di Chi acquista il prodotto P clienti tende ad acquistare Q I clienti possono essere suddivisi in classi omogenee (A,B,C, ) Informazioni La persona X vive nella città Z La persona S ha Y anni demografici: (Mario,Rossi,25/10/1960, ), (Luigi,Bianchi,, ) geografici: Rende, Cosenza, Lombardia, Punti di vendita Analisi dei dati ed estrazione di conoscenza KDD (Knowledge Discovery in bases) Processo di analisi dei dati finalizzato alla scoperta di nuova conoscenza, accurata e utile per comprendere/modellare i fenomeni del mondo reale corrispondenti ai dati supportare processi decisionali mining È la fase chiave del processo di KDD Scoperta automatica di pattern o di modelli a partire da un insieme di dati Pattern: descrive regolarità (proprietà frequenti) dei dati Modello: generalizza i dati e modella i fenomeni del mondo reale che li hanno generati
2 Mining riferito anche come: dredging, harvesting, archeology un settore interdisciplinare: base e data warehousing visualization Statistica e machine learning Sistemi esperti e knowledge acquisition Motivazioni: perché ORA Abbondanza di informazioni utili Focus competitivo - Knowledge Management Sistemi di calcolo economici e potenti Fondamenti teorici/matematici robusti machine learning & inferenza logica statistica database management systems Estrazione della conoscenza: il processo di KDD Knowledge Discovery in bases (KDD) Scoperta di conoscenza nelle basi di dati utile per comprendere/modellare i fenomeni del mondo reale corrispondenti ai dati Processo non banale (semi-automatico) di estrazione di pattern validi nuovi INTERESSANTI potenzialmente utili comprensibili Aree Applicative Analisi dei dati & supporto alle decisioni Market analysis & management Risk analysis & management Fraud detection & management Altre Text mining (news group, documents) e Web analysis Intelligent query answering Market Analysis & Management Quali sono le sorgenti di dati per l analisi? Transazioni di carte di credito, carte fedeltà, coupons di sconti, chiamate a clienti accondiscendenti, studi su stili di vita. Target marketing: trova raggruppamenti che modellino gli acquirenti con stesse caratteristiche: interessi, abitudini di spesa, etc. Determina i pattern degli acquirenti nel tempo: Conversione da un conto singolo a un conto congiunto: matrimonio, etc. Analisi incrociate Associazioni/Correlazioni tra vendite di prodotti Predizione basata sulle associazioni. Market Analysis & Management (2) Customer profiling quali acquirenti comprano cosa (clustering o classificazione) Identificazione delle richieste dei clienti identificare i migliori prodotti per acquirenti differenti usa la predizione per capire quali fattori attraggono nuovi clienti Informazioni generalizzate vari summary reports multidimensionali informazioni statistiche aggregate (tendenze e variazioni)
3 Sources Warehouse Consolidated Prepared Patterns & Models 9 Technologies Risk Management Pianificazione finanziaria: analisi e predizione dei flussi di cassa valutazione dei profitti e analisi delle richieste contingenti analisi di serie temporali (financial-ratio, trend analysis,...) Resource planning: riassumi a confronte le risorse e le spese Competition: monitora i vari competitori e le direzioni di mercato (CI: competitive intelligence). Segmenta i clienti per classi di prezzi Seleziona una strategia in un mercato altamente competitivo Fraud Detection & Management monitoraggio della salute, prestiti, servizi di carte di credito, telecomunicazioni (frodi su carte telefoniche), etc. Approccio: utilizza i dati storici per costruire un modello del comportamento fraudolento e utilizza il data mining per facilitare l identificazione di istanze simili Esempi: Assicurazioni auto: individua un gruppo di persone che creano (artificialmente) incidenti per guadagnare dalle assicurazioni Money Laundering: individua movimenti di denaro sospetti Assicurazioni mediche: individua i pazienti professionali dei medici individuazione di frodi telefoniche Altre Applicazioni Il Ciclo Virtuoso Sport IBM Advanced Scout hanno analizzato le statistiche della NBA Astronomia Cal Tech e il Palomar Observatory hanno scoperto 22 nuove quasar con l aiuto del data mining Internet Web Surf-Aid IBM Surf-Aid applica algoritmi di data mining ai log di accesso delle pagine correlate alle informazioni commerciali, per scoprire le preferenze del cliente e indirizzare opportunamente il web-marketing Problema Identifica problema/ opportunità Strategia The KDD Process Interpretation and Evaluation Mining Knowledge Selection and Preprocessing Consolidation Misura effetti delle azioni CogNova conoscenza Agisci sulla base della conoscenza risultati Mining & Business Intelligence Il processo di KDD Increasing potential to support business decisions Making Decisions Knowledge Presentation Visualization Techniques Mining Knowledge Discovery Exploration Statistical Analysis, Querying and Reporting Warehouses / Marts OLAP, MDA Sources Paper, Files, Information Providers, base Systems, OLTP Manager Business Analyst Analyst DBA Integrazione e Consolidamento Sorgenti Selezione e Pre-elaborazione Consolidati Mining trasformati Interpretazione e Pattern e/o Modelli
4 Architettura di un sistema KDD Consolidamento dei Garbage in Garbage out Consolidation Selection and Preprocessing Graphical User Interface Mining Interpretation and Evaluation La qualità dei risultati è in relazione diretta con la qualità dei dati Il 50%-70% degli sforzi sul processo di KDD viene speso nella preparazione e il consolidamento dei dati Sources Warehouse Knowledge Consolidamento dei Consolidamento dei Determinazione un insieme preliminare di attributi Consolidamento dei dati in un database sorgenti interne ed esterne Da sorgenti eterogenee a un data warehouse RDBMS Eliminazione e/o stima dei valori nulli Rimozione di outlier (eccezioni ovvie, picchi) Determinazione della probabilità delle categorie e trattamento dei volume bias Legacy DBMS Flat Files Consolidation and Cleaning Warehouse Object/Relation DBMS Multidimensional DBMS External Deductive base Flat files Il processo di KDD Selezione & Preprocessing Integrazione e Consolidamento Selezione e Pre-elaborazione Consolidati Mining trasformati Interpretazione e Pattern e/o Modelli Generazione di un insieme di esempi scelta del metodo di sampling analisi della complessità del campione tratta le problematiche collegate al volume bias Riduzione delle dimensioni degli attributi rimozione di attributi ridondanti e/o correlati combinazione di attributi (somma, prodotto, differenza) Riduzione dei range di valori di attributi raggruppamento di valori simbolici o discreti discretizzazione dei valori continui Sorgenti
5 Selezione & Preprocessing: tool OLAP Può essere utile nella fase di selezione e preparazione dei dati esplorazione dei dati, utile per individuare le caratteristiche rilevanti e suggerire i tipi di pattern/modelli che potrebbero essere scoperti Una visione multidimensionale dei dati Aggregazioni per ogni intersezione di ogni dimensione. Analisi interattiva dei dati Modellazione analitica: derivazione delle proporzioni, delle varianze, etc previsione, trend analysis, e statistical analysis. Calcola e visualizza i dati in 2D o 3D crosstabs, charts e grafi, con semplici operazioni di pivoting degli assi Il Processo di KDD Integrazione e Consolidamento Sorgenti Selezione e Pre-elaborazione Consolidati Mining trasformati Interpretazione e Pattern e/o Modelli Mining: un approccio di analisi induttiva Approccio deduttivo ( Verification-Driven ) Top-Down Down: analisi passiva, atta a verificare se un certo modello (ipotesi) è coerente con i dati a disposizione L ipotesi o il modello sono formulati dall utente sulla base della sua esperienza Approccio induttivo ( Discovery-Driven ) Bottom-Up Up: analisi attiva, in cui i dati stessi suggeriscono possibili ipotesi sul significato del loro contenuto Individuazione di fatti significativi, relazioni, tendenze, pattern, associazioni, eccezioni e anomalie, che sfuggono all analisi manuale per la loro complessità Approccio deduttivo Query & Reporting Foglio Elettronico Analisi multidimensionale Analisi statistica Raccolta dei dati Generazione di una ipotesi Formulazione di una domanda Interpretazione dei risultati e revisione dell ipotesi... finchè non emerge un pattern interessante Approccio induttivo ( Mining) mining: task e metodi Riconoscimento di Forme Intelligenza Artificiale Visualizzazione Esplorazione/Scoperta scoperta di associazioni/correlazioni clustering algoritmi matematici, statistici, reti neurali, es. scoperta segmenti di mercato x2 x1 Apprendimento automatico simbolico Reti neurali Algoritmi Genetici Reti Bayesiane del dominio Apprendimento Storici Modello Nuovi Predizione uso di modelli di classificazione e regressione matematici, statistici, reti neurali, algoritmi genetici, alberi e regole di decisione, es. prevedere volumi di vendita, o classe di cliente Descrizione Scoperta di pattern/modelli facilmente interpretabili regole/alberi di decisione, regole associative es. descrivere clienti in base a dati demografici e acquisti f(x) SE età > 35 E reddito < $35k ALLORA... x
6 Clustering Analysis Clustering: Partizionamento di un insieme di dati in un insieme di classi, chiamati cluster, tali che i membri di ogni classe condividano delle caratteristiche rilevanti Qualità dei cluster: la similarità intra-classe é alta la similarità inter-classe é bassa 3 categorie di Clustering Partizionali: si enumerano le varie partizioni e quindi si valuta il partizionamento in base a qualche criterio. K-means, K-medoids, etc. Agglomerativi-based: si crea un agglomerato di dati utilizzando qualche criterio Hierarchical Clustering Model-based: Un modello viene ipotizzato per ogni cluster a quel punto si trova qual é la migliore construzione che soddisfa il modello. E.g., classificazione Bayesiana (AutoClass), Cobweb. Clustering Scoperta di Associazioni Distanza Densità Forma ( Gestalt ) Scoperta di associazioni tra fatti, proprietà o valori di variabili ( Link analysis ) La scoperta di associazioni tra variabili è solo il primo passo di analisi: occorre cercare una spiegazione Esempio: Il 72% degli acquirenti di insalata verde, acquista anche qualche tipo di dressing Regole Associative : un database di transazioni Ogni transazione é un insieme di item Obiettivo: trovare tutte le regole che correlano la presenza di un insieme di item con un altro insieme di item Esempio: 98% delle persone che comprano pannolini e cibo per bambini comprano anche birra. Qualità di Regole Associative: supporto e confidenza Una regola deve avere una confidenza minimale, specificata dall utente 1 & 2 => 3 ha confidenza 90% se quando viene acquistato 1 e 2, nel 90% dei casi viene acquistato anche 3. Una regola deve avere un supporto minimale, specificato dall utente 1 & 2 => 3 dovrebbe valere in qualche percentuale minima delle transazioni per essere significativa
7 Regole Associative: Esempio Transaction ID Purchased Items 1 {1, 2, 3} 2{1, 4} 3{1, 3} 4 {2, 5, 6} Per un supporto minimo del 50%, e confidenza minima del 50%, troviamo le seguenti regole 1 => 3 con 50% supporto e 66% confidenza 3 => 1 con 50% supporto e 100% confidenza Modellazione Induttiva = apprendimento induttivo Obiettivo: Sviluppo un modello generale o un ipotesi da esempio specifici Approssimazione di funzione (curve fitting) f(x) Classificazione (concept learning, pattern recognition) x2 A B x1 x Classificazione e apprendimento induttivo Framework di base per l Apprendimento Induttivo: Training Examples (x, f(x)) Ambiente Sistema di Apprendimento h(x) = ~ f(x)? Un problema di rappresentazione e ricerca della migliore ipotesi, h(x). Testing Examples Modello Indotto Output Classification (x, h(x)) Tecniche di apprendimento automatico Tecniche simboliche ( logiche ) Alberi di Decisione Regole di Produzione Altri approcci tecniche matematiche tecniche statistiche Alberi di Decisione Un grafo diretto aciclico I nodi sono: D? Yes Foglie - indicano la classe foglia o distribuzione delle classi Nodi di decisione - un test su un singolo attributo un ramo ed un sottoalbero per ogni possibile risultato del test Classificazione: navigazione da radice a una foglia, in base ai test A? B? C? radice Alberi di Decisione : Esempio Problema: indurre un albero che separi le classi di forme (POS) e (NEG) : Attributi Color = {Red, Blue, Green, White} Shaded = {Yes, No} Shape = {Square, Triangle, Circle, Oval} Size = {Small, Large} Esempi (training set): (POS) a (NEG) m b n c d e f p q r g s h t i
8 Alberi di Decisione: Costruzione (apprendimento) { b,g} { m,t} {e} Triangle Blue { d,e,f,h} { n,q} Square Red Shape Oval {a-i} Color { m-t} Green { c } { p,r,s } Circle White + {f} Size {d,h} + - { n} { q} Small {f} { q} Shaded Yes {f} + No Large - { q} - + { a,i } Alberi di Decisione: Uso (classificazione/predizione) { b,g} { m,t} {e} Triangle Blue { d,e,f,h} { n,q} Square Red Shape Oval Color Green {a-i} { m-t} { c } { p,r,s } Circle White + {f} Size {d,h} + - { n} { q} Large Small {f} { q} Shaded Yes {f} + No - { q} { a,i } Nuovi Esempi e 1 : - e 2 :? Regole di decisione Il Processo di KDD Regole espresse in forma logica: (Calcolo Calcolo Proposizionale o Calcolo dei Predicati) Interpretazione e (forma = quadrato or triangolo) and (dimensione = piccolo) => POS (forma = triangolo) and (tratteggiato = SI) => NEG Classificazione NEG POS POS, NEG Integrazione e Consolidamento Selezione e Pre-elaborazione Mining trasformati Pattern e/o Modelli e 1 e 2 e 3 Sorgenti Consolidati Interpretazione e valutazione Interpretazione Alberi e regole logiche possono essere interpretati facilmente Risultati di clustering possono essere graficati/tabellati In generale, tool di visualizzazione possono essere molto utili per interpretare i risultati Validazione statistica e test di significanza Analisi qualitativa da parte di esperti del dominio Test del modello su casi di esempio per valutarne la bontà (es., accuratezza) Sono tutti interessanti i pattern scoperti? Un sistema di mining può generare migliaia di pattern Pattern interessanti: Facilmente comprensibili Validi su nuovi dati di test con un certo grado di certezza Potenzialmente utili per processi decisionali Nuovi o confermano ipotesi che si cercava di validare Misure Oggettive vs. Soggettive Oggettive: basate su statistiche e struttura dei pattern (e.g., supporto, confidenza, lunghezza della descrizione, etc.) Soggettive: basate su conoscenza pregressa e aspettative degli utenti (e.g., novità, etc.)
9 Completezza/Precisione di un processo di data mining Completezza: Trova tutti i pattern interessanti E possibile in un tempo ragionevole? Correttezza: Trova solo pattern interessanti E possibile non commettere errori e trovare solo pattern interessanti? Possibili approcci: Si generano tutti i pattern che potrebbero essere interessanti e poi si eliminano quelli che non lo sono Generare solo pattern interessanti (è possibile perdere in completezza)
Data Mining: Applicazioni
Sistemi Informativi Universitá degli Studi di Milano Facoltá di Scienze Matematiche, Fisiche e Naturali Dipartimento di Tecnologie dell Informazione 1 Giugno 2007 Data Mining Perché il Data Mining Il Data
Data mining e rischi aziendali
Data mining e rischi aziendali Antonella Ferrari La piramide delle componenti di un ambiente di Bi Decision maker La decisione migliore Decisioni Ottimizzazione Scelta tra alternative Modelli di apprendimento
Introduzione al Data Mining
Introduzione al Data Mining Sistemi informativi per le Decisioni Slide a cura di Prof. Claudio Sartori Evoluzione della tecnologia dell informazione (IT) (Han & Kamber, 2001) Percorso evolutivo iniziato
Sistemi Informativi Aziendali. Sistemi Informativi Aziendali
DIPARTIMENTO DI INGEGNERIA INFORMATICA AUTOMATICA E GESTIONALE ANTONIO RUBERTI Cenni al Data Mining 1 Data Mining nasce prima del Data Warehouse collezione di tecniche derivanti da Intelligenza Artificiale,
Introduzione alle tecniche di Data Mining. Prof. Giovanni Giuffrida
Introduzione alle tecniche di Data Mining Prof. Giovanni Giuffrida Programma Contenuti Introduzione al Data Mining Mining pattern frequenti, regole associative Alberi decisionali Clustering Esempio di
Analisi dei Dati. Lezione 10 Introduzione al Datwarehouse
Analisi dei Dati Lezione 10 Introduzione al Datwarehouse Il Datawarehouse Il Data Warehousing si può definire come il processo di integrazione di basi di dati indipendenti in un singolo repository (il
Data Warehousing (DW)
Data Warehousing (DW) Il Data Warehousing è un processo per estrarre e integrare dati storici da sistemi transazionali (OLTP) diversi e disomogenei, e da usare come supporto al sistema di decisione aziendale
Marketing relazionale
Marketing relazionale Introduzione Nel marketing intelligence assume particolare rilievo l applicazione di modelli predittivi rivolte a personalizzare e rafforzare il legame tra azienda e clienti. Un azienda
Data Mining e Analisi dei Dati
e Analisi dei Dati Rosaria Lombardo Dipartimento di Economia, Seconda Università di Napoli La scienza che estrae utili informazioni da grandi databases è conosciuta come E una disciplina nuova che interseca
Data mining. Data Mining. processo di Data Mining estrarre automaticamente informazioneda un insieme di dati
Data mining Il consente l informazione processo di Data Mining estrarre automaticamente informazioneda un insieme di dati telefoniche, ènascostaa a causa di fra quantitàdi loro, complessità: non... ci
SEGMENTAZIONE INNOVATIVA VS TRADIZIONALE
SEGMENTAZIONE INNOVATIVA VS TRADIZIONALE Arricchimento dei dati del sottoscrittore / user Approccio Tradizionale Raccolta dei dati personali tramite contratto (professione, dati sul nucleo familiare, livello
PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD
Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da
Data warehouse Introduzione
Database and data mining group, Data warehouse Introduzione INTRODUZIONE - 1 Pag. 1 Database and data mining group, Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi
La Progettazione Concettuale
La Progettazione Concettuale Università degli Studi del Sannio Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica CorsodiBasidiDati Anno Accademico 2006/2007 docente: ing. Corrado Aaron Visaggio
SISTEMI INFORMATIVI AZIENDALI
SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg [email protected] Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Sistemi informazionali La crescente diffusione dei
Rassegna sui principi e sui sistemi di Data Warehousing
Università degli studi di Bologna FACOLTA DI SCIENZE MATEMATICHE, FISICHE E NATURALI Rassegna sui principi e sui sistemi di Data Warehousing Tesi di laurea di: Emanuela Scionti Relatore: Chiar.mo Prof.Montesi
REALIZZARE UN MODELLO DI IMPRESA
REALIZZARE UN MODELLO DI IMPRESA - organizzare e gestire l insieme delle attività, utilizzando una piattaforma per la gestione aziendale: integrata, completa, flessibile, coerente e con un grado di complessità
B C I un altro punto di vista Introduzione
Bollicine Community B C Intelligence B C I un altro punto di vista Introduzione Graziano Guazzi General Manager Data Flow Settembre 2007 pag, 1 Cosa misurare La definizione di quale domanda di mercato
MASTER UNIVERSITARIO
MASTER UNIVERSITARIO Analisi Dati per la Business Intelligence In collaborazione con II edizione 2013/2014 Dipartimento di Culture, Politica e Società Dipartimento di Informatica gestito da aggiornato
Ciclo di vita dimensionale
aprile 2012 1 Il ciclo di vita dimensionale Business Dimensional Lifecycle, chiamato anche Kimball Lifecycle descrive il framework complessivo che lega le diverse attività dello sviluppo di un sistema
Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Data warehousing Introduzione A partire dalla metà degli anni novanta è risultato chiaro che i database per i DSS e le analisi di business intelligence vanno separati da quelli operazionali. In questa
Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo
Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Obiettivi. Presentare l evoluzione dei sistemi informativi: da supporto alla operatività a supporto al momento decisionale Definire
Uno standard per il processo KDD
Uno standard per il processo KDD Il modello CRISP-DM (Cross Industry Standard Process for Data Mining) è un prodotto neutrale definito da un consorzio di numerose società per la standardizzazione del processo
Business Intelligence & Data Mining. In ambiente Retail
Business Intelligence & Data Mining In ambiente Retail Business Intelligence Platform DATA SOURCES STAGING AREA DATA WAREHOUSE DECISION SUPPORT Application Databases Packaged application/erp Data DATA
MASTER UNIVERSITARIO. Analisi Dati per la Business Intelligence e Data Science. IV edizione 2015/2016
MASTER UNIVERSITARIO Analisi Dati per la Business Intelligence e Data Science In collaborazione con IV edizione 2015/2016 Dipartimento di Culture, Politica e Società Dipartimento di Informatica Dipartimento
Introduzione al Data Mining Parte 1
Introduzione al Data Mining Parte 1 Corso di Laurea Specialistica in Ingegneria Informatica II Facoltà di Ingegneria, sede di Cesena (a.a. 2009/2010) Prof. Gianluca Moro Dipartimento di Elettronica, Informatica
Business Intelligence CRM
Business Intelligence CRM CRM! Customer relationship management:! L acronimo CRM (customer relationship management) significa letteralmente gestione della relazione con il cliente ;! la strategia e il
Relazione sul data warehouse e sul data mining
Relazione sul data warehouse e sul data mining INTRODUZIONE Inquadrando il sistema informativo aziendale automatizzato come costituito dall insieme delle risorse messe a disposizione della tecnologia,
Data Mining. Gabriella Trucco [email protected]
Data Mining Gabriella Trucco [email protected] Perché fare data mining La quantità dei dati memorizzata su supporti informatici è in continuo aumento Pagine Web, sistemi di e-commerce Dati relativi
Data Mining a.a. 2010-2011
Data Mining a.a. 2010-2011 Docente: [email protected] tel. 081 6139519 http://www.na.icar.cnr.it/~mariog Informazioni logistiche Orario delle lezioni A partire dall 19.10.2010, Martedì h: 09.50 16.00
Analisi dei requisiti e casi d uso
Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................
IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE
IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE 51 Dichiarazione d intenti (mission statement) La dichiarazione d intenti ha il compito di stabilire degli obiettivi dal punto di vista del mercato, e in parte dal
Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.
DATA WAREHOUSE Un Dataware House può essere definito come una base di dati di database. In molte aziende ad esempio ci potrebbero essere molti DB, per effettuare ricerche di diverso tipo, in funzione del
Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse
Introduzione data warehose Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa Data Warehouse Che cosa e un data warehouse? Quali sono i modelli dei dati per data warehouse Come si progetta
Sistemi di supporto alle decisioni
Sistemi di supporto alle decisioni Introduzione I sistemi di supporto alle decisioni, DSS (decision support system), sono strumenti informatici che utilizzano dati e modelli matematici a supporto del decision
LA SEGMENTAZIONE DEL MERCATO
LA SEGMENTAZIONE DEL MERCATO Perché segmentare? I mercati sono numerosi, dispersi geograficamente ed eterogenei nelle loro esigenze d'acquisto. Un'impresa che decide di operare in un certo mercato non
Configuration Management
Configuration Management Obiettivi Obiettivo del Configuration Management è di fornire un modello logico dell infrastruttura informatica identificando, controllando, mantenendo e verificando le versioni
Segmentare ovvero capire il contesto di mercato di riferimento
Lezione n. 5 Segmentare ovvero capire il contesto di mercato di riferimento Prof.ssa Clara Bassano Corso di Principi di Marketing A.A. 2006-2007 Verso la strategia aziendale Mission + Vision = Orientamento
SISTEMI INFORMATIVI AZIENDALI
SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg [email protected] Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità
DATA MINING. Data mining. Obiettivo: estrarre informazione nascosta nei dati in modo da consentire decisioni strategiche
DATA MINING datamining Data mining Obiettivo: estrarre informazione nascosta nei dati in modo da consentire decisioni strategiche Una materia interdisciplinare: - statistica, algoritmica, reti neurali
Analisi di Mercato. Facoltà di Economia. Analisi sui consumi. Metodo delle inchieste familiari. Metodo delle disponibilità globali
Obiettivi delle aziende Analisi di Mercato Facoltà di Economia francesco mola Analisi sui consumi Conoscere i bisogni e i gusti dei consumatori Valutare la soddisfazione della clientela Lanciare nuovi
Università di Pisa A.A. 2004-2005
Università di Pisa A.A. 2004-2005 Analisi dei dati ed estrazione di conoscenza Corso di Laurea Specialistica in Informatica per l Economia e per l Azienda Tecniche di Data Mining Corsi di Laurea Specialistica
Database Commerciali/ Marketing. Indice: 1. Gli elementi chiave del db commerciale/ marketing 2. Come si costruisce un db commerciale/ marketing
Database Commerciali/ Marketing Indice: 1. Gli elementi chiave del db commerciale/ marketing 2. Come si costruisce un db commerciale/ marketing Database Commerciali/ Marketing Gli elementi chiave del db
Cosa è un data warehouse?
Argomenti della lezione Data Warehousing Parte I Introduzione al warehousing cosa è un data warehouse classificazione dei processi aziendali sistemi di supporto alle decisioni elaborazione OLTP e OLAP
Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario
Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,
Concetto e sistema di Marketing
Università degli Studi di Urbino Carlo Bo Facoltà di Economia Corso di Laurea in INTERNAZIONALIZZAZIONE DELLE IMPRESE ECONOMIA, GESTIONE E INTERNAZIONALIZZAZIONE DELLE IMPRESE Prof. Fabio Musso A.A. 2008-09
Ricerca di outlier. Ricerca di Anomalie/Outlier
Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla
Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita;
.netbin. è un potentissimo strumento SVILUPPATO DA GIEMME INFORMATICA di analisi dei dati con esposizione dei dati in forma numerica e grafica con un interfaccia visuale di facile utilizzo, organizzata
Elio Cutino. Business Analytics and Optimization Dai Dati alle Decisioni. Milano,13 ottobre 2010
Elio Cutino Business Analytics and Optimization Dai Dati alle Decisioni Milano,13 ottobre 2010 Immaginate di poter analizzare le relazioni e i contatti dei vostri clienti per prevenire defezioni e abbandoni
CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo
CAPITOLO 8 Tecnologie dell informazione e controllo Agenda Evoluzione dell IT IT, processo decisionale e controllo Sistemi di supporto al processo decisionale Sistemi di controllo a feedback IT e coordinamento
Introduzione al KDD e al DATA MINING
Introduzione al KDD e al DATA MINING Vincenzo Antonio Manganaro [email protected], www.statistica.too.it Indice 1 Verso il DM: una breve analisi delle fasi del processo KDD. 1 2 Il DM: Alcune definizioni.
I vantaggi ottenibili nei campi applicativi attraverso l uso di tecniche di data mining
Dipartimento di Informatica e Sistemistica I vantaggi ottenibili nei campi applicativi attraverso l uso di tecniche di data mining Renato Bruni [email protected] Antonio Sassano [email protected]
DATA MINING E DATA WAREHOUSE
Reti e sistemi informativi DATA MINING E DATA WAREHOUSE Marco Gottardo FONTI Wikipedia Cineca Università di Udine, Dipartimento di fisica, il data mining scientifico thepcweb.com DATA MINING 1/2 Il Data
MACHINE LEARNING e DATA MINING Introduzione. a.a.2015/16 Jessica Rosati [email protected]
MACHINE LEARNING e DATA MINING Introduzione a.a.2015/16 Jessica Rosati [email protected] Apprendimento Automatico(i) Branca dell AI che si occupa di realizzare dispositivi artificiali capaci di
La misurazione e la previsione della domanda
La misurazione e la previsione della domanda Le domande fondamentali Quali sono i principi che sottendono alla misurazione e alla previsione della domanda? Come si può stimare la domanda attuale? Come
Controllo di Gestione
Pianificazione e controllo del business aziendale Controllo di Gestione In un contesto altamente complesso e competitivo quale quello moderno, il controllo di gestione ricopre un ruolo quanto mai strategico:
25/11/14 ORGANIZZAZIONE AZIENDALE. Tecnologie dell informazione e controllo
ORGANIZZAZIONE AZIENDALE 1 Tecnologie dell informazione e controllo 2 Evoluzione dell IT IT, processo decisionale e controllo Sistemi di supporto al processo decisionale IT e coordinamento esterno IT e
Modelli matematici avanzati per l azienda a.a. 2010-2011
Modelli matematici avanzati per l azienda a.a. 2010-2011 Docente: Pasquale L. De Angelis [email protected] tel. 081 5474557 http://www.economia.uniparthenope.it/siti_docenti P.L.DeAngelis Modelli
Organizzazione e pianificazione delle attività di marketing
Organizzazione e pianificazione delle attività di marketing Il continuum delle strutture tra efficienza ed efficacia Struttura funzionale Struttura divisionale Struttura a matrice Struttura orizzontale
Business Intelligence Revorg. Roadmap. Revorg Business Intelligence. trasforma i dati operativi quotidiani in informazioni strategiche.
soluzioni di business intelligence Revorg Business Intelligence Utilizza al meglio i dati aziendali per le tue decisioni di business Business Intelligence Revorg Roadmap Definizione degli obiettivi di
Cercare informazioni sul Web
Fluency Cercare informazioni sul Web Capitolo 4 Guardare nel posto giusto cosa cerco mondo fisico Web per avere informazioni su contributi pensionistici INPS www.inps.it per trovare un percorso tra due
Piano di gestione della qualità
Piano di gestione della qualità Pianificazione della qualità Politica ed obiettivi della qualità Riferimento ad un eventuale modello di qualità adottato Controllo della qualità Procedure di controllo.
Sistemi Informativi Aziendali I
Modulo 6 Sistemi Informativi Aziendali I 1 Corso Sistemi Informativi Aziendali I - Modulo 6 Modulo 6 Integrare verso l alto e supportare Managers e Dirigenti nell Impresa: Decisioni più informate; Decisioni
SysAround S.r.l. L'efficacia delle vendite è l elemento centrale per favorire la crescita complessiva dell azienda.
Scheda Il CRM per la Gestione delle Vendite Le organizzazioni di vendita sono costantemente alla ricerca delle modalità migliori per aumentare i ricavi aziendali e ridurre i costi operativi. Oggi il personale
S upportare un T eam di successo. 2 Forum APB di aggiornam ento tecnico Sestri Levante il 19 e il 20 m aggio 2003.
S upportare un T eam di successo 2 Forum APB di aggiornam ento tecnico Sestri Levante il 19 e il 20 m aggio 2003. T ALENT Consulenti di Marketing. Sviluppatori di valore per il cliente. Ricercatori di
Data mining for e- commerce sites
Data mining for e- commerce sites Commercio elettronico Possibilità di svolgerele attività commerciali per via elettronica, in particolare tramite Internet. Un qualsiasi tipo di transazione tendente a
IL MARKETING E QUELLA FUNZIONE D IMPRESA CHE:
IL MARKETING E QUELLA FUNZIONE D IMPRESA CHE:! definisce i bisogni e i desideri insoddisfatti! ne definisce l ampiezza! determina quali mercati obiettivo l impresa può meglio servire! definisce i prodotti
Tecniche di Marketing. Parola chiave: Formula imprenditoriale. Formula imprenditoriale coerente
Tecniche di Marketing Progetto F.I.S.I.Agri 7 e 13 dicembre 2007 Luisa Baldeschi Parola chiave: Formula imprenditoriale La formula imprenditoriale è il cuore della pianificazione strategica La coerenza
Credex LA PIATTAFORMA PER LA GESTIONE DELLA CATENA ESTESA DEL VALORE DEL RECUPERO CREDITI. ABI Consumer Credit 2003. Roma, 27 marzo 2003
LA PIATTAFORMA PER LA GESTIONE DELLA CATENA ESTESA DEL VALORE DEL RECUPERO CREDITI ABI Consumer Credit 2003 Roma, 27 marzo 2003 Questo documento è servito da supporto ad una presentazione orale ed i relativi
Capitolo 1. Il marketing: costruire una relazione profittevole con il cliente. Capitolo 1- slide 1
Capitolo 1 Il marketing: costruire una relazione profittevole con il cliente Capitolo 1- slide 1 Obiettivi di apprendimento Che cos è il marketing? Comprendere il mercato e i bisogni del consumatore Obiettivi
Sistemi Informativi Direzionali
DIPARTIMENTO DI INGEGNERIA INFORMATICA AUTOMATICA E GESTIONALE ANTONIO RUBERTI Sistemi Informativi Direzionali 1 Architettura per la Business Intelligence KPI DSS MKT CRM HR Datamart-1 Datamart-2 Datamart-3
Mining Positive and Negative Association Rules:
Mining Positive and Negative Association Rules: An Approach for Confined Rules Alessandro Boca Alessandro Cislaghi Premesse Le regole di associazione positive considerano solo gli item coinvolti in una
Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni
Data warehouse Data warehouse La crescita dell importanza dell analisi dei dati ha portato ad una separazione architetturale dell ambiente transazionale (OLTP on-line transaction processing) da quello
Segmentazione del mercato e scelta del target
Segmentazione del mercato e scelta del target 1 DEFINIZIONE DEL MERCATO: PROCESSO A PIU STADI LIVELLI DI SEGMENTAZIONE (Lambin): 1. Segmentazione strategica: identifica grandi settori di attività CORPORATE
Pro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
Gli Elementi fondamentali della Gestione Aziendale
Gli Elementi fondamentali della Gestione Aziendale n La Pianificazione n L Organizzazione n Il Coinvolgimento del Personale n Il Controllo Componenti del Sistema di Pianificazione n Valutazioni interne
LA LOGISTICA INTEGRATA
dell Università degli Studi di Parma LA LOGISTICA INTEGRATA Obiettivo: rispondere ad alcuni interrogativi di fondo Come si è sviluppata la logistica in questi ultimi anni? Quali ulteriori sviluppi sono
Supply Intelligence. Informazioni rapide e approfondite sui fornitori potenziali
Supply Intelligence Informazioni rapide e approfondite sui fornitori potenziali Ancora in alto mare? Le forniture, specialmente se effettuate a livello globale, possono rivelarsi un vero e proprio viaggio
ISTITUTO TECNICO ECONOMICO MOSSOTTI
CLASSE III INDIRIZZO S.I.A. UdA n. 1 Titolo: conoscenze di base Conoscenza delle caratteristiche dell informatica e degli strumenti utilizzati Informatica e sistemi di elaborazione Conoscenza delle caratteristiche
CRM analitico: introduzione. Andrea Farinet
CRM analitico: introduzione Andrea Farinet 1 1. Agenda Definizione di Customer Relationship Management (CRM) Le caratteristiche strutturali di un progetto di Customer Relationship Management Il Customer
Customer Relationship Management. Eleonora Ploncher 3 aprile 2006
Customer Relationship Management Eleonora Ploncher 3 aprile 2006 1. Gli obiettivi Gli obiettivi della presentazione sono volti a definire: 1. gli elementi fondamentali e strutturali di una strategia di
TECNICHE DI SIMULAZIONE
TECNICHE DI SIMULAZIONE INTRODUZIONE Francesca Mazzia Dipartimento di Matematica Università di Bari a.a. 2004/2005 TECNICHE DI SIMULAZIONE p. 1 Introduzione alla simulazione Una simulazione è l imitazione
Università degli Studi di Parma Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica. Ingegneria del Software. La fase di Analisi
Università degli Studi di Parma Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica Ingegneria del Software La fase di Analisi Giulio Destri Ing. del software: Analisi - 1 Scopo del modulo Definire
Lezione 4. Controllo di gestione. Il controllo direzionale
Lezione 4 Il controllo direzionale Sistema di pianificazione e controllo PIANIFICAZIONE STRATEGICA PIANO 1 2 OBIETTIVI OBIETTIVI ATTIVITA 3 DI LUNGO PERIODO DI BREVE PERIODO OPERATIVA 5 BUDGET FEED-BACK
GUIDA - Business Plan Piano d impresa a 3/5 anni
GUIDA - Business Plan Piano d impresa a 3/5 anni 1 Executive summary...2 2 Business idea...2 3 Analisi di mercato...2 4 Analisi dell ambiente competitivo...2 5 Strategia di marketing...3 5.1 SWOT Analysis...3
Creazione di un modello di data mining di tipo OLAP con l'algoritmo Microsoft Clustering
Pagina 1 di 9 Menu principale Sezione precedente Sezione successiva Creazione di un modello di data mining di tipo OLAP con l'algoritmo Microsoft Clustering Un modello di data mining è un modello che include
MODELLO RELAZIONALE. Introduzione
MODELLO RELAZIONALE Introduzione E' stato proposto agli inizi degli anni 70 da Codd finalizzato alla realizzazione dell indipendenza dei dati, unisce concetti derivati dalla teoria degli insiemi (relazioni)
Programmazione e controllo
Programmazione e controllo Capitolo 1 L attività di direzione e il sistema di misurazione dei costi Un quadro di riferimento 1.a. I tratti caratteristici dell attività di direzione nelle imprese moderne
Un po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
Capitolo 7. Strategia di marketing orientata al cliente Creare valore per il cliente obiettivo. Capitolo 7- slide 1
Capitolo 7 Strategia di marketing orientata al cliente Creare valore per il cliente obiettivo Capitolo 7- slide 1 Strategia di marketing orientata al cliente Creare valore per il cliente obiettivo Obiettivi
Come sviluppare un marketing plan
Come sviluppare un marketing plan Fasi del marketing plan 1. analisi della situazione; 2. definizione degli obiettivi; 3. individuazione del target; 4. sviluppo strategia di posizionamento 5. definizione
Il catalogo MARKET. Mk6 Il sell out e il trade marketing: tecniche, logiche e strumenti
Si rivolge a: Forza vendita diretta Agenti Responsabili vendite Il catalogo MARKET Responsabili commerciali Imprenditori con responsabilità diretta sulle vendite 34 di imprese private e organizzazioni
I sistemi di reporting e i rapporti direzionali
I sistemi di reporting e i rapporti direzionali Reporting - Sintesi dei fenomeni aziendali secondo modelli preconfezionati e con frequenza e aggiornamento prestabiliti - contabile (dati economici) - extracontabile
TECNICO SUPERIORE DEI TRASPORTI E DELL INTERMODALITÀ
ISTRUZIONE E FORMAZIONE TECNICA SUPERIORE SETTORE TRASPORTI TECNICO SUPERIORE DEI TRASPORTI E DELL INTERMODALITÀ STANDARD MINIMI DELLE COMPETENZE TECNICO PROFESSIONALI TECNICO SUPERIORE DEI TRASPORTI E
