KNOWLEDGE DISCOVERY E DATA MINING
|
|
|
- Franco Durante
- 10 anni fa
- Просмотров:
Транскрипт
1 KNOWLEDGE DISCOVERY E DATA MINING Prof. Dipartimento di Elettronica e Informazione Politecnico di Milano LE TECNOLOGIE DI GESTIONE DELL INFORMAZIONE DATA WAREHOUSE SUPPORTO ALLE DECISIONI DATA MINING ANALISI DEI S.I. INTEGRAZIONE DEI DATI GESTIONE DI DATI DISTRIBUITI ED ETEROGENEI BASI DI DATI REAL-TIME MAIN MEMORY TEMPORALI INFORMAZIONE NON STRUTTURATA SEMISTRUTTURATA E MULTIMEDIALE SISTEMI INFORMATIVI SU WEB SISTEMI EMBEDDED COMPONENTI MOBILI E DIPENDENTI DAL CONTESTO SISTEMI DI INFORMATION RETRIEVAL data warehouse
2 LA SCOPERTA DI CONOSCENZA (KNOWLEDGE DISCOVERY) OGNI CONOSCENZA UMANA PARTE DA INTUIZIONI, PROCEDE ATTRAVERSO CONCETTI E CULMINA IN IDEE E. Kant data warehouse 2 LA GERARCHIA DELLA CONOSCENZA VARIABILI FATTURE ANDAMENTO VENDITE REGOLE DI MERCATO DECISIONI STRATEGICHE ELEMENTI (VOLUME) DATI INFORMAZIONI CONOSCENZA SAGGEZZA VALORE AGGIUNTO ELABORAZIONI STATISTICHE PROCEDURE DI SCOPERTA DI CONOSCENZA ESPERIENZA data warehouse 3
3 KNOWLEDGE DISCOVERY E DATA MINING SCOPERTA DI CONOSCENZA NELLE BASI DI DATI (KDD) IDENTIFICARE LE INFORMAZIONI PIU SIGNIFICATIVE PRESENTARLE IN MODO OPPORTUNO ALL UTENTE DATA MINING APPLICAZIONE DI ALGORITMI AI DATI GREZZI AL FINE DI ESTRARNE CONOSCENZA (RELAZIONI, PERCORSI, ) OBIETTIVO PREDITTIVO (ANALISI DEI SEGNALI, RICONOSCIMENTO DEL PARLATO, ECC.) OBIETTIVO DESCRITTIVO (SISTEMI DI SUPPORTO ALLE DECISIONI) data warehouse 4 IL PROCESSO DI SCOPERTA DI CONOSCENZA () ANCHE IN PRESENZA DI EFFICACI STRUMENTI RICHIEDE COMPETENZA DELLE TECNICHE UTILIZZATE OTTIMA CONOSCENZA DEL DOMINIO DI APPLICAZIONE PASSI SUCCESSIVI SELEZIONE SCELTA DEI DATI CAMPIONE SUI QUALI FOCALIZZARE L ANALISI PRE-ELABORAZIONE CAMPIONAMENTO DEI DATI PER RIDURNE IL VOLUME PULIZIA DI DATI ERRATI E/O MANCANTI data warehouse 5
4 IL PROCESSO DI SCOPERTA DI CONOSCENZA (2) TRASFORMAZIONE OMOGENEIZZAZIONE E/O CONVERSIONE DEI TIPI DI DATI DATA MINING SCELTA DEL TIPO DI METODO/ALGORITMO INTERPRETAZIONE E VALUTAZIONE FILTRAGGIO DELL INFORMAZIONE OTTENUTA EVENTUALE RAFFINAMENTO CON RIPETIZIONE DI PASSI PRECEDENTI PRESENTAZIONE VISUALE (GRAFICA O LOGICA) DEL RISULTATO DELLA RICERCA data warehouse 6 IL PROCESSO DI SCOPERTA DI CONOSCENZA (3) DATA MINING INTERPRETAZIONE CONOSCENZA TRASFORMAZIONE PRE-ELABORAZIONE DATI PRE- ELABORATI DATI TRASFORMATI CORRELAZIONI E PERCORSI SELEZIONE DATI TARGET DATI GREZZI da: G. Piatesky-Shapiro 996 data warehouse 7
5 APPLICAZIONI DEL DATA MINING VENDITA AL DETTAGLIO E PER CORRISPONDENZA QUALI OFFERTE SPECIALI FARE COME DISPORRE LE MERCI SUGLI SCAFFALI MARKETING PREVISIONI DI VENDITA PERCORSI DI ACQUISTO DEI PRODOTTI BANCHE CONTROLLO DEI PRESTITI USO (ED ABUSO) DELLE CARTE DI CREDITO TELECOMUNICAZIONI AGEVOLAZIONI TARIFFARIE data warehouse 8 APPLICAZIONI DEL DATA MINING ASTRONOMIA E ASTROFISICA CLASSIFICAZIONE DI STELLE E GALASSIE RICERCA CHIMICO FARMACEUTICA SCOPERTA DI NUOVI COMPOSTI RELAZIONI TRA COMPOSTI BIOLOGIA MOLECOLARE PATTERN NEI DATI GENETICI E NELLE STRUTTURE MOLECOLARI TELERILEVAMENTO E METEREOLOGIA ANALISI DEI DATI SATELLITARI STATISTICA ECONOMICA E DEMOGRAFICA ANALISI DEI CENSIMENTI data warehouse 9
6 STRUTTURA DEGLI ALGORITMI DI DATA MINING RAPPRESENTAZIONE DEL MODELLO FORMALISMI PER LA RAPPRESENTAZIONE E LA DESCRIZIONE DEI PERCORSI INDIVIDUABILI VALUTAZIONE DEL MODELLO STIMA STATISTICA O LOGICA DELLA RISPONDENZA DI UN PERCORSO AI CRITERI DI RICERCA METODO DI RICERCA DEI PARAMETRI RICERCA DEI PARAMETRI CHE OTTIMIZZANO I CRITERI DI VALUTAZIONE, FISSATI L INSIEME DELLE OSSERVAZIONI E LA RAPRESENTAZIONE DEL MODELLO DEL MODELLO I PARAMETRI VENGONO APPLICATI A MODELLI DI UNA STESSA FAMIGLIA, CHE SI DIVERSIFICANO PER IL TIPO DI RAPPRESENTAZIONE, PER VALUTARNE LA QUALITA data warehouse 0 TIPI DI INFORMAZIONI OTTENUTE ASSOCIAZIONI INSIEME DI REGOLE CHE SPECIFICA L OCCORRENZA CONGIUNTA DI DUE (O PIU ) ELEMENTI SEQUENZE POSSIBILITA DI STABILIRE CONCATENAZIONI TEMPORALI DI EVENTI CLASSIFICAZIONI RAGGRUPPAMENTI DI ELEMENTI IN CLASSI SECONDO UN MODELLO PREDEFINITO RAGGRUPPAMENTI (CLUSTER) RAGGRUPPAMENTI DI ELEMENTI IN CLASSI NON DEFINITE A PRIORI TENDENZE (TREND) SCOPERTA DI ANDAMENTI TEMPORALI CARATTERISTICI CON VALENZA PREVISIONALE data warehouse
7 TECNICHE (MODELLI) PER DATA MINING RETI NEURALI STRUMENTO MOLTO POTENTE CAPACITA DI APPRENDIMENTO LAVORANO IN MODO OPACO INDUZIONE ALBERI DI DECISIONE (GERARCHIA DI DECISIONI if - then) INDUZIONE DI REGOLE (INSIEMI NON GERARCHICI DERIVATI DAGLI ALBERI DI DECISIONE) SONO AUTOESPLICATIVE data warehouse 2 TECNICHE (MODELLI) PER DATA MINING SCOPERTA DI REGOLE REGOLE DI ASSOCIAZIONE (EVENTI SIMULTANEI X Y) ASSOCIAZIONI SEQUENZIALI VISUALIZZAZIONE DEI DATI I DATI VENGONO PREPARATI E PRESENTATI IN VESTE GRAFICA PER EVIDENZIARE EVENTUALI IRREGOLARITA O PATTERN STRANI data warehouse 3
8 TECNICHE PER DATA MINING TECNICHE INFORMAZIONI ASSOCIAZIONI SEQUENZE CLASSIFICAZIONI CLUSTER TENDENZE RETI NEURALI INDUZIONE SCOPERTA DI REGOLE VISUALIZZAZIONE DEI DATI data warehouse 4 IL CESTINO DELLA SPESA E IL MODELLO PIU NOTO SUL QUALE SI APPLICANO LE TECNICHE DI DATA MINING E USATO PRINCIPALMENTE, MA NON SOLO, PER I PROBLEMI DI VENDITA AL DETTAGLIO LO SCOPO E QUELLO DI SCOPRIRE PATTERN RICORRENTI NEI DATI (REGOLE DI ASSOCIAZIONE) data warehouse 5
9 IL CESTINO DELLA SPESA I = {i,..., i k } B = {b,..., b n } b i I INSIEME DI k ELEMENTI (ITEM) INSIEME DI n SOTTOINSIEMI (BASKET) DI I I PRODOTTI IN UN SUPERMERCATO PAROLE IN UN DIZIONARIO B ACQUISTI DI UN SINGOLO CLIENTE SINGOLO DOCUMENTO IN UN CORPUS REGOLA DI ASSOCIAZIONE i i 2 i E i 2 COMPAIONO ASSIEME IN ALMENO s% DEGLI n BASKET (SUPPORTO) DI TUTTI I BASKET CHE CONTENGONO i ALMENO c% CONTENGONO ANCHE i 2 (CONFIDENZA) data warehouse 6 ESEMPI DI REGOLE REGOLE CHE HANNO DIET COKE COME CONSEGUENTE AIUTANO A DEFINIRE LE STRATEGIE PER AUMENTARE LE VENDITE DI UN PRODOTTO REGOLE CHE HANNO GRISSINI TRA ANTECEDENTI AIUTANO A CAPIRE L IMPATTO DELLA CESSAZIONE DELLA VENDITA DI UN PRODOTTO REGOLE CHE HANNO WURSTEL TRA GLI ANTECEDENTI E SENAPE COME CONSEGUENTE EVIDENZIANO GLI ABBINAMENTI DI PRODOTTI PRESENTI NELL ANTECEDENTE CHE INDUCONO LA VENDITA DEL CONSEGUENTE data warehouse 7
10 ESEMPI DI REGOLE REGOLE CHE COLLEGANO ELEMENTI NELLO SCAFFALE A A ELEMENTI NELLO SCAFFALE B AIUTANO UNA PIU EFFICACE ALLOCAZIONE DEI PRODOTTI NEGLI SCAFFALI LE MIGLIORI k REGOLE CHE HANNO GRISSINI NEL CONSEGUENTE IN TERMINI DEL FATTORE DI CONFIDENZA INTERMINI DEL FATTORE DI SUPPORTO data warehouse 8 QUALCHE PROBLEMA c NEL CESTINO C E CAFFE c NEL CESTINO NON C E CAFFE t NEL CESTINO C E THE t NEL CESTINO NON C E THE t t Σcolonne c c Σ righe t c s = 20% E VERA??? c = P[t c] / P[t] =20/25= 80% FORSE SI, MA... COLORO CHE COMPRANO COMUNQUE IL CAFFE SONO PARI AL 90%!!! ATTENZIONE! ESISTE UNA CORRELAZIONE TRA THE E CAFFE r = P[t c] / (P[t] x P[c] ) = 0.89 data warehouse 9
11 DATA MINING IN AMBIENTE RELAZIONALE ESTENSIONE DI SQL CON OPERATORI DI DATA MINING INTEGRATI NEL LINGUAGGIO INTEGRARE UN SERVER SQL CON UN MOTORE DI DATA MINING MINE RULE PER LE REGOLE DI ASSOCIAZIONE MINE CLASSIFICATION PER I PROBLEMI DI CLASSIFICAZIONE MINE INTERVAL PER LA DISCRETIZZAZIONE DI ATTRIBUTI CONTINUI data warehouse 20 MINE RULE: ESEMPIO MINE RULE AssociazioneSemplice AS SELECT DISTINCT..n item AS BODY,.. item AS HEAD, SUPPORT, CONFIDENCE FROM Purchase GROUP BY transaction EXTRACTING RULES WITH SUPPORT: 0., CONFIDENCE: 0.2 TR CLIENTE OGGETTO DATA PREZZO QUANT. Rossi pantal. da ski 7/ Rossi scarponi mont. 7/ Bianchi camicia sport 8/ Bianchi scarpe marron 8/ Bianchi Rossi giacca giacca 8/2 8/ Bianchi camicia sport 9/ Bianchi giacca 9/ data warehouse 2
12 MINE RULE: ESEMPIO CORPO TESTA SUPPORTO CONFIDENZA pantaloni da ski scarponi montagna camicia sport camicia sport scarpe marron scarpe marron giacca giacca camicia sport, scarpe marron scarponi montagna pantaloni da ski scarpe marron giacca camicia sport giacca camicia sport scarpe marron giacca camicia sport, giacca scarpe marron scarpe marron, giacca camicia sport 0.25 data warehouse 22 PROBLEMA DI CLASSIFICAZIONE CIASCUN ELEMENTO (RECORD) DI UN INSIEME DI DATI E ASSOCIATO, IN BASE A ESPERIENZE O OSSERVAZIONI PREGRESSE, AD UNA CARATTERISTICA DISTINTIVA CHIAMATA CLASSE FASE : APPRENDIMENTO (TRAINING) COSTRUZIONE DI UN MODELLO SULL INSIEME NOTO (TRAINING SET) IN MODO CHE OGNI CLASSE SIA UNA PARTIZIONE DELL INSIEME FASE 2: APPLICAZIONE IL MODELLO INDIVIDUATO VIENE UTILIZZATO PER CLASSIFICARE NUOVI DATI data warehouse 23
13 PROBLEMA DI CLASSIFICAZIONE: ESEMPIO FASE : APPRENDIMENTO MINE CLASSIFICATION CarInsuranceRules AS SELECT DISTINCT RULES ID, *, CLASS FROM CarInsurance CLASSIFY BY Risk FASE 2: APPLICAZIONE MINE CLASSIFICATION TEST ClassifiedApplicants AS SELECT DISTINCT *, CLASS FROM Applicants USING CLASSIFICATION FROM CarInsuranceRules AS RULES data warehouse 24 PROBLEMA DI CLASSIFICAZIONE: ESEMPIO AGE CAR TYPE RISK 7 sports high 43 family low 68 family low 32 truck low 23 family high 8 family high 20 family high 45 sports high 50 truck low 64 truck high 46 family low 40 family low. IF Age 23 THEN Risk IS High; 2. IF CarType = sports THEN Risk IS High; 3. IF CarType IN {family, truck} AND Age > 23 THEN Risk IS Low; 4. DEFAULT Risk IS Low AGE CAR TYPE 22 family 60 family 35 sports AGE CAR TYPE 22 family 60 family 35 sports MINE CLASSIFICATION TEST CLASS data warehouse 25 high low high
14 PROBLEMA DI DISCRETIZZAZIONE SI TRATTA DI TRASFORMARE UN ATTRIBUTO NUMERICO IN UNO CATEGORIALE FRAZIONANDO IL DOMINIO NUMERICO IN INTERVALLI CHE, ASSOCIATI CIASCUNO AD UNA ETICHETTA DI CLASSE, COSTITUISCONO IL DOMINIO CATEGORIALE METODI DI DISCRETIZZAZIONE NON SUPERVISIONATI VIENE CONSIDERATA SOLAMENTE LA DISTRIBUZIONE DEI VALORI DELL ATTRIBUTO SUPERVISIONATI SI CERCA DI CONSERVARE QUANTA PIU INFORMAZIONE POSSIBILE RELATIVA ALLE CLASSI DI UN ATTRIBUTO ASSOCIATO ALLE TUPLE data warehouse 26 PROBLEMA DI DISCRETIZZAZIONE DISCRETIZZAZIONE SEMPLICE INTERVALLI DI UGUALE AMPIEZZA IL DOMINIO NUMERICO VIENE SUDDIVISO IN UN ASSEGNATO NUMERO DI INTERVALLI DI UGUALE AMPIEZZA INTERVALLI DI UGUALE FREQUENZA GLI INTERVALLI SONO PIU STRETTI DOVE I VALORI SONO DENSI E PIU AMPI DOVE I VALORI SONO SPARSI MINE INTERVAL IntervalliDiUgualeAmpiezza AS SELECT DISTINCT ID, LOWER, UPPER GENERATING AssicurazioneAutoDiscreta FROM AssicurazioneAuto DISCRETIZE Età BY WIDTH USING 3 INTERVALS data warehouse 27
15 PROBLEMA DI DISCRETIZZAZIONE: ESEMPIO AGE CAR TYPE RISK 7 sports high 43 family low 68 family low 32 truck low 23 family high 8 family high 20 family high 45 sports high 50 truck low 64 truck high 46 family low 40 family low ID LOWER UPPER AGE CAR TYPE RISK sports high truck low 2 family low truck low family low data warehouse 28
DATA MINING. Data mining. Obiettivo: estrarre informazione nascosta nei dati in modo da consentire decisioni strategiche
DATA MINING datamining Data mining Obiettivo: estrarre informazione nascosta nei dati in modo da consentire decisioni strategiche Una materia interdisciplinare: - statistica, algoritmica, reti neurali
Data Warehousing (DW)
Data Warehousing (DW) Il Data Warehousing è un processo per estrarre e integrare dati storici da sistemi transazionali (OLTP) diversi e disomogenei, e da usare come supporto al sistema di decisione aziendale
Sistemi Informativi Aziendali. Sistemi Informativi Aziendali
DIPARTIMENTO DI INGEGNERIA INFORMATICA AUTOMATICA E GESTIONALE ANTONIO RUBERTI Cenni al Data Mining 1 Data Mining nasce prima del Data Warehouse collezione di tecniche derivanti da Intelligenza Artificiale,
Uno standard per il processo KDD
Uno standard per il processo KDD Il modello CRISP-DM (Cross Industry Standard Process for Data Mining) è un prodotto neutrale definito da un consorzio di numerose società per la standardizzazione del processo
PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD
Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da
Data mining e rischi aziendali
Data mining e rischi aziendali Antonella Ferrari La piramide delle componenti di un ambiente di Bi Decision maker La decisione migliore Decisioni Ottimizzazione Scelta tra alternative Modelli di apprendimento
SISTEMI INFORMATIVI AZIENDALI
SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg [email protected] Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità
Analisi di Mercato. Facoltà di Economia. Analisi sui consumi. Metodo delle inchieste familiari. Metodo delle disponibilità globali
Obiettivi delle aziende Analisi di Mercato Facoltà di Economia francesco mola Analisi sui consumi Conoscere i bisogni e i gusti dei consumatori Valutare la soddisfazione della clientela Lanciare nuovi
SQL/OLAP. Estensioni OLAP in SQL
SQL/OLAP Estensioni OLAP in SQL 1 Definizione e calcolo delle misure Definire una misura significa specificare gli operatori di aggregazione rispetto a tutte le dimensioni del fatto Ipotesi: per ogni misura,
Corso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
Ricerca di outlier. Ricerca di Anomalie/Outlier
Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla
Introduzione alle tecniche di Data Mining. Prof. Giovanni Giuffrida
Introduzione alle tecniche di Data Mining Prof. Giovanni Giuffrida Programma Contenuti Introduzione al Data Mining Mining pattern frequenti, regole associative Alberi decisionali Clustering Esempio di
Organizzazione degli archivi
COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i
DBMS (Data Base Management System)
Cos'è un Database I database o banche dati o base dati sono collezioni di dati, tra loro correlati, utilizzati per rappresentare una porzione del mondo reale. Sono strutturati in modo tale da consentire
Dispensa di database Access
Dispensa di database Access Indice: Database come tabelle; fogli di lavoro e tabelle...2 Database con più tabelle; relazioni tra tabelle...2 Motore di database, complessità di un database; concetto di
LE CARTE DI CONTROLLO (4)
LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale
Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario
Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,
1 CARICAMENTO LOTTI ED ESISTENZE AD INIZIO ESERCIZIO
GESTIONE LOTTI La gestione dei lotti viene abilitata tramite un flag nei Progressivi Ditta (è presente anche un flag per Considerare i Lotti con Esistenza Nulla negli elenchi visualizzati/stampati nelle
Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni
Data warehouse Data warehouse La crescita dell importanza dell analisi dei dati ha portato ad una separazione architetturale dell ambiente transazionale (OLTP on-line transaction processing) da quello
SEGMENTAZIONE INNOVATIVA VS TRADIZIONALE
SEGMENTAZIONE INNOVATIVA VS TRADIZIONALE Arricchimento dei dati del sottoscrittore / user Approccio Tradizionale Raccolta dei dati personali tramite contratto (professione, dati sul nucleo familiare, livello
Operazioni sui database
Operazioni sui database Le operazioni nel modello relazionale sono essenzialmente di due tipi: Operazioni di modifica della base di dati (update) Interrogazioni della base di dati per il recupero delle
Lezione V. Aula Multimediale - sabato 29/03/2008
Lezione V Aula Multimediale - sabato 29/03/2008 LAB utilizzo di MS Access Definire gli archivi utilizzando le regole di derivazione e descrivere le caratteristiche di ciascun archivio ASSOCIAZIONE (1:1)
Automazione Industriale (scheduling+mms) scheduling+mms. [email protected]
Automazione Industriale (scheduling+mms) scheduling+mms [email protected] Introduzione Sistemi e Modelli Lo studio e l analisi di sistemi tramite una rappresentazione astratta o una sua formalizzazione
Regole di Associazione
Metodologie per Sistemi Intelligenti Regole di Associazione Prof. Pier Luca Lanzi Laurea in Ingegneria Informatica Politecnico di Milano Polo regionale di Como Esempio Esempio Regole di Associazione Scopo
La BDCR Assilea per la valutazione del profilo di rischio delle imprese
La BDCR Assilea per la valutazione del profilo di rischio delle imprese Luciano Bruccola, Assilea / Conectens RES, ConfiRes 2015 Firenze, 25 febbraio 2015 La Banca Dati Centrale Rischi Assilea BDCR Elementi
Gestione campagne di Marketing per il C.R.M.
Caratteristiche principali: Preselezione di nominativi basati scremandoli con opportuni filtri basati su informazioni di rischio provenienti da fonti esterne. Analisi grafica tramite sintetiche distribuzioni
SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione
SISTEMI INFORMATIVI AVANZATI -2010/2011 1 Introduzione In queste dispense, dopo aver riportato una sintesi del concetto di Dipendenza Funzionale e di Normalizzazione estratti dal libro Progetto di Basi
Università di Pisa A.A. 2004-2005
Università di Pisa A.A. 2004-2005 Analisi dei dati ed estrazione di conoscenza Corso di Laurea Specialistica in Informatica per l Economia e per l Azienda Tecniche di Data Mining Corsi di Laurea Specialistica
Data mining for e- commerce sites
Data mining for e- commerce sites Commercio elettronico Possibilità di svolgerele attività commerciali per via elettronica, in particolare tramite Internet. Un qualsiasi tipo di transazione tendente a
Basi di Dati Relazionali
Corso di Laurea in Informatica Basi di Dati Relazionali a.a. 2009-2010 PROGETTAZIONE DI UNA BASE DI DATI Raccolta e Analisi dei requisiti Progettazione concettuale Schema concettuale Progettazione logica
Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux
Scheduling della CPU Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux Sistemi multiprocessori Fin qui si sono trattati i problemi di scheduling su singola
Il DataMining. Susi Dulli [email protected]
Il DataMining Susi Dulli [email protected] Il Data Mining Il Data Mining è il processo di scoperta di relazioni, pattern, ed informazioni precedentemente sconosciute e potenzialmente utili, all interno
Elenchi Intrastat. Indice degli argomenti. Premessa. Operazioni preliminari. Inserimento manuale dei movimenti e presentazione
Elenchi Intrastat Indice degli argomenti Premessa Operazioni preliminari Inserimento manuale dei movimenti e presentazione Collegamento con la Contabilità Collegamento con il ciclo attivo e passivo Generazione
Mining Positive and Negative Association Rules:
Mining Positive and Negative Association Rules: An Approach for Confined Rules Alessandro Boca Alessandro Cislaghi Premesse Le regole di associazione positive considerano solo gli item coinvolti in una
FATTURATO E ORDINATIVI DELL INDUSTRIA
22 luglio 2015 Maggio 2015 FATTURATO E ORDINATIVI DELL INDUSTRIA Allo scopo di fornire informazioni statistiche integrate, a partire dalla diffusione odierna, il comunicato è arricchito di un paragrafo
Data warehouse Introduzione
Database and data mining group, Data warehouse Introduzione INTRODUZIONE - 1 Pag. 1 Database and data mining group, Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi
Data Mining. Gabriella Trucco [email protected]
Data Mining Gabriella Trucco [email protected] Perché fare data mining La quantità dei dati memorizzata su supporti informatici è in continuo aumento Pagine Web, sistemi di e-commerce Dati relativi
SQL prima parte D O C E N T E P R O F. A L B E R T O B E L U S S I. Anno accademico 2011/12
SQL prima parte D O C E N T E P R O F. A L B E R T O B E L U S S I Anno accademico 2011/12 DEFINIZIONE Il concetto di vista 2 È una relazione derivata. Si specifica l espressione che genera il suo contenuto.
Riccardo Dutto, Paolo Garza Politecnico di Torino. Riccardo Dutto, Paolo Garza Politecnico di Torino
Integration Services Project SQL Server 2005 Integration Services Permette di gestire tutti i processi di ETL Basato sui progetti di Business Intelligence di tipo Integration services Project SQL Server
Data mining. Data Mining. processo di Data Mining estrarre automaticamente informazioneda un insieme di dati
Data mining Il consente l informazione processo di Data Mining estrarre automaticamente informazioneda un insieme di dati telefoniche, ènascostaa a causa di fra quantitàdi loro, complessità: non... ci
IL SISTEMA INFORMATIVO
IL SISTEMA INFORMATIVO In un organizzazione l informazione è una risorsa importante al pari di altri tipi di risorse: umane, materiali, finanziarie, (con il termine organizzazione intendiamo un insieme
Dominio applicativo. Analisi e ricognizione delle fonti dati
Dominio applicativo La Società chiamata StraSport, si occupa di vendite all ingrosso di articoli sportivi. Ha agenzie distribuite sul territorio italiano che gestiscono le vendite, ognuna di esse gestisce
MODELLO RELAZIONALE. Introduzione
MODELLO RELAZIONALE Introduzione E' stato proposto agli inizi degli anni 70 da Codd finalizzato alla realizzazione dell indipendenza dei dati, unisce concetti derivati dalla teoria degli insiemi (relazioni)
Compito DA e BD. Tempo concesso: 90 minuti 12 giugno 03 Nome: Cognome: Matricola: Esercizio 1
Compito DA e BD. Tempo concesso: 90 minuti 12 giugno 03 Nome: Cognome: Matricola: Esercizio 1 Si considerino le seguenti specifiche relative alla realizzazione della base di dati di una facoltà e si definisca
Progettazione di Basi di Dati
Progettazione di Basi di Dati Prof. Nicoletta D Alpaos & Prof. Andrea Borghesan Entità-Relazione Progettazione Logica 2 E il modo attraverso il quale i dati sono rappresentati : fa riferimento al modello
Integrazione al Manuale Utente 1
RAEE Modulo per la gestione dei Rifiuti derivanti da Apparecchiature Elettriche ed Elettroniche Il Decreto Legislativo 25 luglio 2005 n. 151 prevede che i produttori di Apparecchiature Elettriche ed Elettroniche
Introduzione all Information Retrieval
Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information
Basi Di Dati, 09/12/2003
Basi Di Dati, 09/12/2003 Una concessionaria di auto nuove ed usate vuole automatizzare alcune delle sue attività. L attività che la concessionaria vuole automatizzare riguarda la gestione delle auto nuove,
PROGRAMMAZIONE MODULARE DI INFORMATICA CLASSE QUINTA - INDIRIZZO MERCURIO SEZIONE TECNICO
PROGRAMMAZIONE MODULARE DI INFORMATICA CLASSE QUINTA - INDIRIZZO MERCURIO SEZIONE TECNICO Modulo 1: IL LINGUAGGIO HTML Formato degli oggetti utilizzati nel Web Elementi del linguaggio HTML: tag, e attributi
Data mining. Vincenzo D Elia. [email protected]. DBDMG - Politecnico di Torino
Data mining Vincenzo D Elia [email protected] DBDMG - Politecnico di Torino [email protected] Archivi Multimediali e Data Mining - p. 1 Rapid Miner [email protected] Archivi Multimediali
Business Intelligence Revorg. Roadmap. Revorg Business Intelligence. trasforma i dati operativi quotidiani in informazioni strategiche.
soluzioni di business intelligence Revorg Business Intelligence Utilizza al meglio i dati aziendali per le tue decisioni di business Business Intelligence Revorg Roadmap Definizione degli obiettivi di
Progettaz. e sviluppo Data Base
Progettaz. e sviluppo Data Base! Progettazione Basi Dati: Metodologie e modelli!modello Entita -Relazione Progettazione Base Dati Introduzione alla Progettazione: Il ciclo di vita di un Sist. Informativo
Data Mining e Analisi dei Dati
e Analisi dei Dati Rosaria Lombardo Dipartimento di Economia, Seconda Università di Napoli La scienza che estrae utili informazioni da grandi databases è conosciuta come E una disciplina nuova che interseca
Basi di dati. Il Modello Relazionale dei Dati. K. Donno - Il Modello Relazionale dei Dati
Basi di dati Il Modello Relazionale dei Dati Proposto da E. Codd nel 1970 per favorire l indipendenza dei dati Disponibile come modello logico in DBMS reali nel 1981 (non è facile realizzare l indipendenza
I sistemi di reporting e i rapporti direzionali
I sistemi di reporting e i rapporti direzionali Reporting - Sintesi dei fenomeni aziendali secondo modelli preconfezionati e con frequenza e aggiornamento prestabiliti - contabile (dati economici) - extracontabile
Abilità Informatiche A.A. 2010/2011 Lezione 9: Query Maschere Report. Facoltà di Lingue e Letterature Straniere
Abilità Informatiche A.A. 2010/2011 Lezione 9: Query Maschere Report Facoltà di Lingue e Letterature Straniere Le QUERY 2 Che cos è una Query? Una Query rappresenta uno strumento per interrogare un database.
SQL - Funzioni di gruppo
una funzione di gruppo permette di estrarre informazioni da gruppi di tuple di una relazione le funzioni di gruppo si basano su due concetti: partizionamento delle tuple di una relazione in base al valore
Nuova funzione di ricerca del sito WIKA.
Nuova funzione di ricerca del sito WIKA. Il sito WIKA dispone ora di una funzione di ricerca completamente riprogettata. Essa è uno strumento particolarmente importante in quanto deve fornire al navigatore
Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto
Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto Il presente capitolo continua nell esposizione di alcune basi teoriche della manutenzione. In particolare si tratteranno
Data management a.a. 2009-2010. Il linguaggio SQL
Data management a.a. 2009-2010 Il linguaggio SQL 1 Modello di database E' un database generico con anagrafica e movimenti di uso molto frequente: per esempio, clienti e fatture, studenti ed esami sostenuti,
1. BASI DI DATI: GENERALITÀ
1. BASI DI DATI: GENERALITÀ BASE DI DATI (DATABASE, DB) Raccolta di informazioni o dati strutturati, correlati tra loro in modo da risultare fruibili in maniera ottimale. Una base di dati è usualmente
Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria
Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Christopher N. Sciamanna, Scott P. Novak, Bess H. Marcus. International Journal of
Analisi dei requisiti e casi d uso
Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................
25/11/14 ORGANIZZAZIONE AZIENDALE. Tecnologie dell informazione e controllo
ORGANIZZAZIONE AZIENDALE 1 Tecnologie dell informazione e controllo 2 Evoluzione dell IT IT, processo decisionale e controllo Sistemi di supporto al processo decisionale IT e coordinamento esterno IT e
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
Il linguaggio SQL. è di fatto lo standard tra i linguaggi per la gestione di data base relazionali.
(Structured Query Language) : Il linguaggio è di fatto lo standard tra i linguaggi per la gestione di data base relazionali. prima versione IBM alla fine degli anni '70 per un prototipo di ricerca (System
IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE
IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE 51 Dichiarazione d intenti (mission statement) La dichiarazione d intenti ha il compito di stabilire degli obiettivi dal punto di vista del mercato, e in parte dal
ISTITUTO TECNICO ECONOMICO MOSSOTTI
CLASSE III INDIRIZZO S.I.A. UdA n. 1 Titolo: conoscenze di base Conoscenza delle caratteristiche dell informatica e degli strumenti utilizzati Informatica e sistemi di elaborazione Conoscenza delle caratteristiche
Business Process Management
Business Process Management Comprendere, gestire, organizzare e migliorare i processi di business Caso di studio a cura della dott. Danzi Francesca e della prof. Cecilia Rossignoli 1 Business process Un
Introduzione ai database relazionali
Introduzione ai database relazionali Tabelle Un database (DB) è costituito da un insieme di file che memorizzano dati opportunamente organizzati Nei database relazionale tale organizzazione è costituita
Informatica 3. LEZIONE 21: Ricerca su liste e tecniche di hashing. Modulo 1: Algoritmi sequenziali e basati su liste Modulo 2: Hashing
Informatica 3 LEZIONE 21: Ricerca su liste e tecniche di hashing Modulo 1: Algoritmi sequenziali e basati su liste Modulo 2: Hashing Informatica 3 Lezione 21 - Modulo 1 Algoritmi sequenziali e basati su
Corso di. Analisi e contabilità dei costi
Corso di Analisi e Contabilità dei Costi Prof. 1_I costi e il sistema di controllo Perché analizzare i costi aziendali? La CONOSCENZA DEI COSTI (formazione, composizione, comportamento) utile EFFETTUARE
SQL Server 2005. Integration Services. SQL Server 2005: ETL - 1. Integration Services Project
atabase and ata Mi ni ng Group of P ol itecnico di Torino atabase and ata Mi ni ng Group of P ol itecnico di Torino atabase and data mining group, SQL Server 2005 Integration Services SQL Server 2005:
Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci
Corso di Laurea Magistrale in Ingegneria per l Ambiente e il Territorio A.A. 2014-2015 Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Strutture di dati: DB e DBMS DATO E INFORMAZIONE Dato: insieme
Utilizzando Microsoft Access. Si crea la tabella Anagrafica degli alunni,le Materie e i voti si mettono alcuni campi
Vogliamo creare una struttura per permettere di memorizzari i voti della classe in tutte le materie Per fare questo untilizziamo tre tabelle Alunni,materie,voti Alunni Materie Voti Creo un record per ogni
PROGRESS: UN CODICE PER IL CALCOLO DELLE EMISSIONI DA VEICOLI STRADALI IN AMBITO URBANO
VIII Incontro EXPERT PANEL EMISSIONI DA TRASPORTO STRADALE Roma, 5 novembre 2003 PROGRESS: UN CODICE PER IL CALCOLO DELLE EMISSIONI DA VEICOLI STRADALI IN AMBITO URBANO Massimo Capobianco, Giorgio Zamboni
Rassegna sui principi e sui sistemi di Data Warehousing
Università degli studi di Bologna FACOLTA DI SCIENZE MATEMATICHE, FISICHE E NATURALI Rassegna sui principi e sui sistemi di Data Warehousing Tesi di laurea di: Emanuela Scionti Relatore: Chiar.mo Prof.Montesi
CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo
CAPITOLO 8 Tecnologie dell informazione e controllo Agenda Evoluzione dell IT IT, processo decisionale e controllo Sistemi di supporto al processo decisionale Sistemi di controllo a feedback IT e coordinamento
La costruzione di strumenti per la verifica delle competenze. LA PROVA ESPERTA
La costruzione di strumenti per la verifica delle competenze. LA PROVA ESPERTA 1 CONCETTO DI PROVA ESPERTA Per prova esperta si intende una prova di verifica che non si limiti a misurare conoscenze e abilità,
Certificazione della consegna ed incentivazione della restituzione a punto vendita del volantino: il test Panorama
Certificazione della consegna ed incentivazione della restituzione a punto vendita del volantino: il test Panorama Parma 19 aprile 2013 Premessa L efficacia del volantino in termini di driver di spesa
Ciclo di vita dimensionale
aprile 2012 1 Il ciclo di vita dimensionale Business Dimensional Lifecycle, chiamato anche Kimball Lifecycle descrive il framework complessivo che lega le diverse attività dello sviluppo di un sistema
Il linguaggio SQL: trigger. Versione elettronica: 04.7.SQL.trigger.pdf
Il linguaggio SQL: trigger Sistemi Informativi T Versione elettronica: 04.7.SQL.trigger.pdf DBMS attivi Un DBMS si dice attivoquando dispone di un sottosistema integrato per definire e gestire regole I
Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse
Politecnico di Milano View integration 1 Integrazione di dati di sorgenti diverse Al giorno d oggi d la mole di informazioni che viene gestita in molti contesti applicativi è enorme. In alcuni casi le
Il progetto ECO LEARNING
APAT e ARPA Lazio Corso laboratorio di educazione ambientale STRATEGIE E INTERVENTI PER LA GOVERNANCE DELL AMBIENTE URBANO Roma 15 e 16 novembre La formazione come supporto alla governance urbana Il progetto
Basi di dati 9 febbraio 2010 Compito A
Basi di dati 9 febbraio 2010 Compito A Domanda 0 (5%) Leggere e rispettare le seguenti regole: Scrivere nome, cognome, matricola (se nota), corso di studio e lettera del compito (ad esempio, A) sui fogli
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
TECNICHE DI SIMULAZIONE
TECNICHE DI SIMULAZIONE INTRODUZIONE Francesca Mazzia Dipartimento di Matematica Università di Bari a.a. 2004/2005 TECNICHE DI SIMULAZIONE p. 1 Introduzione alla simulazione Una simulazione è l imitazione
jeenuin Jeenuin Uno strumentoinnovativoper l ascoltosemantico 17 Ottobre 2013 www.jeenuin.com
jeenuin www.jeenuin.com Jeenuin Uno strumentoinnovativoper l ascoltosemantico 17 Ottobre 2013 La missione di Jeenuin jeenuin www.jeenuin.com Fornire un servizio di Web intelligence di nuova generazione:
Tecniche di riconoscimento statistico
On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 4 Reti neurali per la classificazione Ennio Ottaviani On AIR srl [email protected]
Il mercato della Business Intelligence è attualmente in forte crescita. Il fenomeno si può spiegare in vari modi: la maturità raggiunta dai sistemi
Enterprise Dashboard Il mercato della Business Intelligence è attualmente in forte crescita. Il fenomeno si può spiegare in vari modi: la maturità raggiunta dai sistemi di Information e Communication Technology
Text Mining nella PA
Text Mining nella PA Elena Fabbris SAS / Data Mining & CRM Solutions (in collaborazione con Settore Dati in Rete CSI Piemonte) Data Mining & Text Mining Data Mining Text Mining Oggetto d analisi Struttura
