Knowledge Discovery e Data Mining

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Knowledge Discovery e Data Mining"

Transcript

1 Knowledge Discovery e Data Mining interessi di ricerca, risultati e progetti Salvatore Orlando Alessandra Raffaetà Data Mining Motivazioni: Evoluzione delle tecnologie per la raccolta e la memorizzazione dei dati Lettori di codici a barre, scanner, foto digitali, ecc. Database Relazioni, Data warehouses, altri repository Disponibilità di enormi sorgenti di dati: Terrorbytes! I dati contengono molte informazioni nascoste Pattern frequenti, regole ricorrenti, modelli di conoscenza, ecc. Nuove conoscenze valide, e potenzialmente utili Data Mining ovvero tecnologie e strumenti per l estrazione di conoscenza da grandi basi di dati in modo semi-automatico

2 KDD: Knowledge Discovery in Databases Data mining: il cuore del processo di KDD Pattern Evaluation Task-relevant Data Data Mining Data Warehouse Selection Data Cleaning Data Integration Databases KDD come confluenza di molte discipline

3 Il processo di analisi usando strumenti di Data Mining Discovery-driven Il computer setaccia milioni di ipotesi e presenta solo le più interessanti/valide all analista Differente dal tipico metodo statistico verification-driven, basato sul campionamento dei dati e sulla verifica di ipotesi fornite dall analista Esempio : A partire dai dati relativi ad un gran numero di clienti che hanno trasferito il proprio conto su una banca concorrente identifica le caratteristiche più importanti dei clienti che sono correlati strettamente (modello di conoscenza). Usando tali caratteristiche, classifica il resto dei clienti e valuta quanto fortemente sono correlati al gruppo campione. Market Basket Analysis Market-Basket Transactional database TID Items 1 Bread, Milk 2 Bread, Diaper, Beer, Eggs 3 Milk, Diaper, Beer, Coke 4 Bread, Milk, Diaper, Beer 5 Bread, Milk, Diaper, Coke Esempio di regola associativa: Supporto = 60% Confidenza = 75%

4 Pattern sequenziali 10/01/ /02/ /12/ /04/ /11/2002 Database delle sequenze 16/05/ /06/2002 Sequenza frequente estratta Classificazione age income student credit_rating buys_computer <=30 high no fair no <=30 high no excellent no high no fair yes >40 medium no fair yes >40 low yes fair yes >40 low yes excellent no low yes excellent yes <=30 medium no fair no <=30 low yes fair yes >40 medium yes fair yes <=30 medium yes excellent yes medium no excellent yes high yes fair yes >40 medium no excellent no Training data age? <=30 >40 student? YES credit rating? Modello = Albero di decisione no yes excellent fair NO YES NO YES

5 Clustering Scopo: raggruppare oggetti/dati in cluster in modo da Massimizzare la similarità intra-cluster Minimizzare la similarità inter-cluster rispetto ad una certa metrica di similarità Dati originali (bidimensionali) Clusters Interessi di ricerca Alte Prestazioni Database enormi Limitazioni di memoria su computer sequenziali out-of-core passi multipli (e potenzialmente costosi) di I/O sui dati Scalabilità possibilità di gestire dati più grandi per aumentare l accuratezza della conoscenza acquisita ottenere risultati in meno tempo vantaggi competitivi se la conoscenza è usata per migliorare marketing o processi di business

6 Interessi di ricerca Sorgenti di dati stream Misure monitoraggio di reti Dettagli chiamate telefoniche Transazioni di acquisto in catene di distribuzione, transazioni ATM Record di log generati da Web Servers e Search Engines Dati raccolti da reti di sensori Dati relativi a traiettorie di oggetti mobili Caratteristiche delle applicazioni Grandi volumi di dati (terabytes) Record che giungono rapidamente e in burst Goal: Estrarre patterns, processare query e calcolare statistiche su stream in real-time Interessi di ricerca Stream multipli e distribuiti Ambienti distribuiti Dati collezionati da entità diverse, spesso appartenenti a organizzazioni differenti Problemi di eterogeneità dei dati Centralizzazione non possibile Comunicazioni eterogenee tra i partner, con vincoli di banda es., reti wireless Dati privacy sensitive Necessità di algoritmi distribuiti, ad accoppiamento lasco

7 Persone e Collaborazioni Knowledge Discovery e Data Mining Salvatore Orlando Claudio Silvestri (Post-Doc) Claudio Lucchese (PhD Student) Fernando Bras (PhD Student) Modelli per data warehouse Spazio Temporale, ragionamento logico su conoscenza Spazio Temporale Renzo Orsini Alessandra Raffaetà Alessandro Roncato Salvatore Orlando Fernando Bras (PhD Student) Grid Computing Salvatore Orlando Matteo Mordacchini (PhD Student) Francesco Lelli (PhD Student) Collaborazioni ISTI C.N.R./ Università - Pisa HPC Lab KDD Lab Università di Milano Università della Calabria e ICAR/C.N.R. Alcuni risultati Algoritmi per l estrazione di pattern frequenti e chiusi DCI, kdci, ParDCI, CCSM DCI_Closed AP interp e AP stream Applicazioni Web Usage Mining Query logs of Web Search Engines Web Server logs

8 DCI_Closed Pattern Chiusi e Frequenti Se {birra,patatine} sono acquistati sempre assieme al {latte} analista interessato solo a pattern e regole che contengono {birra,patatine,latte} Lucchese, Orlando, Perego. "Fast and Memory Efficient Mining of Frequent Closed Itemsets", IEEE Transactions on Knowledge and Data Engineering, Jan 2006 (Vol. 18, No. 1), pp AP interp e AP stream Estrazione di pattern frequenti da stream multipli distribuiti Un framework che combina AP stream e AP interp AP stream C. Silvestri, S. Orlando. Approximate Mining of Frequent Patterns on Streams. Int. Journal of Intelligent Data Analisys, IOS Press.

9 Analisi di Log dei Web Search Engine Caching dei risultati delle query Analysi delle query più frequenti Molte delle query riappaiono ciclicamente a grande distanza metodi di cache replacement LRU, basati solo su quanto recentemente è stata riferita una query, possono fallire Static cache + Prefetching SDC (Static & Dynamic Cache) Strategia di caching che cerca di sfruttare la località temporale e spaziale Query più frequenti memorizzate in una porzione statica e read-only della cache. Uso e confronto di diverse politiche dinamiche nella porzione dinamica Adaptive prefetching per migliorare l hit-ratio (spatiale sull insieme dei risultati) Fagni, Silvestri, Orlando, Perego. Boosting the Performance of Web Search Engines: Caching and Prefetching Query Results by Exploiting Historical Usage Data. ACM Trans. on Inf. Sys., To apper, 2006.

10 Analisi di Log dei Web Search Engine Migliorare le prestazioni di un Parallel WSE Term-Partitioned Index Indici relativi ad ogni termine t i sono assegnati completamente ad uno degli IR Core Per risolvere una query, solo gli IR Core responsabili per i termini della query devono essere interrogati Problema dell assegnamento dei termini agli IR Core cercare l assegnamento che migliora il tempo di completamento compromesso tra bilanciamento del carico tra gli IR Core incremento del numero di query risolte completamente da un singolo (pochi) IR Core, senza (con poco) overhead di comunicazione Analisi di Log dei Web Search Engine Migliorare le prestazioni di un Parallel WSE Analisi dei log con strumenti di mining per determinare correlazioni frequenti tra termini all interno delle query del log per inferire il carico medio generato da un certo assegnamento parziale di termini Algoritmo di ottimizzazione modificato (Bin Packing) che assegna sfruttando le conoscenze acquisite dalle analisi dei log altri query log sono usati poi per il testing dell assegnamento Lucchese, Orlando, Perego, Silvestri. Statistically Driven Term Partitioning to Enhance Performance of Parallel IR Systems. Submitted to ACM SIGIR 06.

11 PRIN 04/EU GeoPKDD GeoPKDD - Geographic Privacy-aware Knowledge Discovery and Delivery Partecipanti: S. Orlando, R. Orsini, A. Raffaetà, A. Roncato, F. Bras (PhD Student), C. Silvestri (Assegnista), C. Lucchese (PhD Student). Motivazioni: Nuove tecnologie hanno permesso di raccogliere una grande collezione di dati referenziati sia nello spazio che nel tempo Cellulari, GPS, altri dispositivi location-aware. Obiettivo: Teorie, tecniche e sistemi per la scoperta e presentazione di conoscenza da grandi sorgenti distribuite e streaming di dati geografici, referenziati sia nello spazio che nel tempo; nuovi metodi che garantiscano automaticamente la privacy. Scenario Aggregative Location-based services Bandwidth/Power optimization Mobile cells planning Traffic Management Accessibility of services Mobility evolution Urban planning. Telecommunication company (WIND) Privacy-aware Data mining interpretation visualization Public administration or business companies GeoKnowledge trajectory reconstruction p(x)=0.02 ST patterns warehouse Trajectories warehouse Privacy enforcement

12 Tematiche di ricerca Nuovi modelli per oggetti mobili Data warehouse per memorizzare le traiettorie degli oggetti mobili e relativi aggregati Clustering Nuovi metodi di data mining che preservino la privacy Nuovi metodi di data mining per dati distribuiti e streaming Ragionamento spaziotemporale, anche sulla base di conoscenza di dominio 60% 7% 20%? Classification 5% 8% Frequent pattern Modelli per traiettorie t Real trajectory of moving object: Traj: T R 2 t Route and trajectory reconstruction X Y t Sampling Y X X Y t [t 1,t 2 ] (x-x 1 )(t 2 -t 1 )-(x 2 -x 1 )(t-t 1 ) = 0

13 Data warehouse di traiettorie Data warehouse: è una raccolta di dati integrata, orientata ai soggetti, storica, con dati tipicamente aggregati e non volatile di supporto ai processi decisionali. Modello dei dati multidimensionale: Data Cube. Fatti, misure e dimensioni. Traiettorie arrivano in stream come triple: (ID, SpatialPos, TemporalPos). Come memorizzare tali dati all interno di un data warehouse? Necessità di discretizzare la dimensione spaziale e temporale. Quali sono le misure e le relative operazioni di aggregazione? Numero di oggetti Velocità Distanza percorsa

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da

Dettagli

Introduzione al Data Mining

Introduzione al Data Mining Introduzione al Data Mining Sistemi informativi per le Decisioni Slide a cura di Prof. Claudio Sartori Evoluzione della tecnologia dell informazione (IT) (Han & Kamber, 2001) Percorso evolutivo iniziato

Dettagli

KNOWLEDGE DISCOVERY E DATA MINING

KNOWLEDGE DISCOVERY E DATA MINING KNOWLEDGE DISCOVERY E DATA MINING Prof. Dipartimento di Elettronica e Informazione Politecnico di Milano LE TECNOLOGIE DI GESTIONE DELL INFORMAZIONE DATA WAREHOUSE SUPPORTO ALLE DECISIONI DATA MINING ANALISI

Dettagli

DATA MINING. Data mining. Obiettivo: estrarre informazione nascosta nei dati in modo da consentire decisioni strategiche

DATA MINING. Data mining. Obiettivo: estrarre informazione nascosta nei dati in modo da consentire decisioni strategiche DATA MINING datamining Data mining Obiettivo: estrarre informazione nascosta nei dati in modo da consentire decisioni strategiche Una materia interdisciplinare: - statistica, algoritmica, reti neurali

Dettagli

Una miniera di dati sul comportamento degli utenti del Web

Una miniera di dati sul comportamento degli utenti del Web Una miniera di dati sul comportamento degli utenti del Web Organizzare le informazioni sull'utilizzo della rete in PostgreSQL utilizzando ht://miner, un sistema open-source di data mining e data warehousing

Dettagli

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni Data warehouse Data warehouse La crescita dell importanza dell analisi dei dati ha portato ad una separazione architetturale dell ambiente transazionale (OLTP on-line transaction processing) da quello

Dettagli

Data mining e rischi aziendali

Data mining e rischi aziendali Data mining e rischi aziendali Antonella Ferrari La piramide delle componenti di un ambiente di Bi Decision maker La decisione migliore Decisioni Ottimizzazione Scelta tra alternative Modelli di apprendimento

Dettagli

ht://miner Un sistema open-source di data mining e data warehousing per lo studio dei comportamenti degli utenti su Internet

ht://miner Un sistema open-source di data mining e data warehousing per lo studio dei comportamenti degli utenti su Internet ht://miner Un sistema open-source di data mining e data warehousing per lo studio dei comportamenti degli utenti su Internet Gabriele Bartolini Comune di Prato Sistema Informativo Servizi di E-government

Dettagli

I vantaggi ottenibili nei campi applicativi attraverso l uso di tecniche di data mining

I vantaggi ottenibili nei campi applicativi attraverso l uso di tecniche di data mining Dipartimento di Informatica e Sistemistica I vantaggi ottenibili nei campi applicativi attraverso l uso di tecniche di data mining Renato Bruni bruni@dis.uniroma1.it Antonio Sassano sassano@dis.uniroma1.it

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

Introduzione al Data Mining Parte 1

Introduzione al Data Mining Parte 1 Introduzione al Data Mining Parte 1 Corso di Laurea Specialistica in Ingegneria Informatica II Facoltà di Ingegneria, sede di Cesena (a.a. 2009/2010) Prof. Gianluca Moro Dipartimento di Elettronica, Informatica

Dettagli

Data Mining e Analisi dei Dati

Data Mining e Analisi dei Dati e Analisi dei Dati Rosaria Lombardo Dipartimento di Economia, Seconda Università di Napoli La scienza che estrae utili informazioni da grandi databases è conosciuta come E una disciplina nuova che interseca

Dettagli

Data Warehousing (DW)

Data Warehousing (DW) Data Warehousing (DW) Il Data Warehousing è un processo per estrarre e integrare dati storici da sistemi transazionali (OLTP) diversi e disomogenei, e da usare come supporto al sistema di decisione aziendale

Dettagli

Introduzione a data warehousing e OLAP

Introduzione a data warehousing e OLAP Corso di informatica Introduzione a data warehousing e OLAP La Value chain Information X vive in Z S ha Y anni X ed S hanno traslocato Data W ha del denaro in Z Stile di vita Punto di vendita Dati demografici

Dettagli

Data Mining. Gabriella Trucco gabriella.trucco@unimi.it

Data Mining. Gabriella Trucco gabriella.trucco@unimi.it Data Mining Gabriella Trucco gabriella.trucco@unimi.it Perché fare data mining La quantità dei dati memorizzata su supporti informatici è in continuo aumento Pagine Web, sistemi di e-commerce Dati relativi

Dettagli

Il DataMining. Susi Dulli dulli@math.unipd.it

Il DataMining. Susi Dulli dulli@math.unipd.it Il DataMining Susi Dulli dulli@math.unipd.it Il Data Mining Il Data Mining è il processo di scoperta di relazioni, pattern, ed informazioni precedentemente sconosciute e potenzialmente utili, all interno

Dettagli

S P A P Bus Bu in s e in s e s s s O n O e n 9 e.0 9 p.0 e p r e r S A S P A P HAN HA A Gennaio 2014

S P A P Bus Bu in s e in s e s s s O n O e n 9 e.0 9 p.0 e p r e r S A S P A P HAN HA A Gennaio 2014 SAP Business One 9.0 per SAP HANA High Performance Analytical Appliance I progressi nella tecnologia HW hanno permesso di ripensare radicalmente la progettazione dei data base per servire al meglio le

Dettagli

Knowledge Discovery e Data Mining

Knowledge Discovery e Data Mining Sommario Knowledge Discovery e Mining Introduzione Motivazioni ed applicazioni ll processo di KDD Fasi e caratteristiche Le tecniche di DM Classificazione e regressione Scoperta di regole associative Clustering

Dettagli

Sistemi informativi aziendali

Sistemi informativi aziendali Sistemi informativi aziendali Lezione 12 prof. Monica Palmirani Sistemi informativi e informatici Sistemi informativi = informazioni+processi+comunicazione+persone Sistemi informatici = informazioni+hardware+software

Dettagli

Business Intelligence: Data warehouse & Data mining

Business Intelligence: Data warehouse & Data mining Business Intelligence Business Intelligence: Data warehouse & Data mining Termine generico per indicare: un insieme di processi per raccogliere ed analizzare informazioni strategiche la tecnologia utilizzata

Dettagli

Il progetto di ricerca Ellade

Il progetto di ricerca Ellade Il progetto di ricerca Ellade Ellade ELectronic Live ADaptive Learning Gruppo di lavoro Università degli Studi della Calabria, Dipartimento di Matematica Università degli Studi Mediterranea di Reggio Calabria,

Dettagli

RELAZIONE ANNUALE CONSUNTIVA

RELAZIONE ANNUALE CONSUNTIVA RELAZIONE ANNUALE CONSUNTIVA PROGRAMMA DI RICERCA SETTORE Legge 449/97 SETTORE: Strumenti, Ambienti e Applicazioni per la Società dell Informazione PROGETTO: P1 Reti Internet: efficienza, integrazione

Dettagli

Reti sociali per trovare clienti e fornitori

Reti sociali per trovare clienti e fornitori Reti sociali per trovare clienti e fornitori Angelo Iacubino Dipartimento di Informatica - Università degli Studi dell'insubria sito web: www.disinformatica.com email: angelo.iacubino@uninsubria.it Roberto

Dettagli

Sistemi informativi aziendali

Sistemi informativi aziendali Sistemi informativi aziendali Lezione 12 prof. Monica Palmirani Sistemi informativi e informatici Sistemi informativi = informazioni+processi+comunicazione+persone Sistemi informatici = informazioni+hardware+software

Dettagli

Data Warehousing e Data Mining

Data Warehousing e Data Mining Università degli Studi di Firenze Dipartimento di Sistemi e Informatica A.A. 2011-2012 I primi passi Data Warehousing e Data Mining Parte 2 Docente: Alessandro Gori a.gori@unifi.it OLTP vs. OLAP OLTP vs.

Dettagli

Lezione 8. Data Mining

Lezione 8. Data Mining Lezione 8 Data Mining Che cos'è il data mining? Data mining (knowledge discovery from data) Estrazione di pattern interessanti (non banali, impliciti, prima sconosciuti e potenzialmente utili) da enormi

Dettagli

Data Mining: Applicazioni

Data Mining: Applicazioni Sistemi Informativi Universitá degli Studi di Milano Facoltá di Scienze Matematiche, Fisiche e Naturali Dipartimento di Tecnologie dell Informazione 1 Giugno 2007 Data Mining Perché il Data Mining Il Data

Dettagli

Sviluppo Applicazione di BI/DWH. con tecnologia Microsoft. per il supporto della catena logistica

Sviluppo Applicazione di BI/DWH. con tecnologia Microsoft. per il supporto della catena logistica UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Dipartimento di Ingegneria Enzo Ferrari di Modena Corso di Laurea Magistrale in Ingegneria Informatica (270/04) Sviluppo Applicazione di BI/DWH con tecnologia

Dettagli

Data Mining Algorithms

Data Mining Algorithms Proposte di Tesi Elena Baralis, Silvia Chiusano, Paolo Garza, Tania Cerquitelli, Giulia Bruno, Daniele Apiletti, Alessandro Fiori, Luca Cagliero, Alberto Grand, Luigi Grimaudo Torino, Giugno 2011 Data

Dettagli

Complex Data Mining & Workflow Mining

Complex Data Mining & Workflow Mining Complex Data Mining & Workflow Mining Obiettivi Processo di Knowledge Discovery Estremamente complesso, non automatizzabile Chesuccedenelcasodidaticomplessi? Uno sguardo all analisi di dati complessi (direzioni

Dettagli

Introduzione al Data Mining Parte 1

Introduzione al Data Mining Parte 1 Introduzione al Data Mining Parte 1 Corso di Laurea Specialistica in Ingegneria Informatica II Facoltà di Ingegneria, sede di Cesena (a.a. 2010/2011) Prof. Gianluca Moro Dipartimento di Elettronica, Informatica

Dettagli

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011 Data warehousing Introduzione A partire dagli anni novanta è risultato chiaro che i database per i DSS e le analisi di business intelligence vanno separati da quelli operazionali. In questa lezione vedremo

Dettagli

Data warehouse Introduzione

Data warehouse Introduzione Database and data mining group, Data warehouse Introduzione INTRODUZIONE - 1 Pag. 1 Database and data mining group, Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi

Dettagli

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Data warehousing Introduzione A partire dalla metà degli anni novanta è risultato chiaro che i database per i DSS e le analisi di business intelligence vanno separati da quelli operazionali. In questa

Dettagli

Sistemi informativi aziendali

Sistemi informativi aziendali Operatore giuridico d impresa Informatica Giuridica A.A 2002/2003 II Semestre Sistemi informativi aziendali prof. Monica Palmirani Sistemi informativi e informatici Sistemi informativi = informazioni+processi+comunicazione+persone

Dettagli

I METODI DI MONITORAGGIO. Indici e indicatori di di qualità del servizio

I METODI DI MONITORAGGIO. Indici e indicatori di di qualità del servizio I METODI DI MONITORAGGIO Indici e indicatori di di qualità del servizio Indici e indicatori di di qualità del servizio Indici e indicatori di di qualità del servizio Indici e indicatori di di qualità del

Dettagli

Question answering e generazione automatica di contenuti su piattaforme mobile per i Beni Culturali

Question answering e generazione automatica di contenuti su piattaforme mobile per i Beni Culturali Question answering e generazione automatica di contenuti su piattaforme mobile per i Beni Culturali Napoli, 13 Ottobre 2009 Alberto Raggioli M.E.T.A. srl Centro Direzionale isola F11. Via G. Porzio Insert

Dettagli

Data Warehouse Architettura e Progettazione

Data Warehouse Architettura e Progettazione Introduzione Data Warehouse Architettura! Nei seguenti lucidi verrà fornita una panoramica del mondo dei Data Warehouse.! Verranno riportate diverse definizioni per identificare i molteplici aspetti che

Dettagli

Indice Prefazione... 1 1 SQL Procedurale/SQL-PSM (Persistent Stored Modules)... 3 Vincoli e Trigger... 9

Indice Prefazione... 1 1 SQL Procedurale/SQL-PSM (Persistent Stored Modules)... 3 Vincoli e Trigger... 9 Prefazione... 1 Contenuti... 1 Ringraziamenti... 2 1 SQL Procedurale/SQL-PSM (Persistent Stored Modules)... 3 1.1 Dichiarazione di funzioni e procedure... 3 1.2 Istruzioni PSM... 4 2 Vincoli e Trigger...

Dettagli

Introduzione al Data Mining

Introduzione al Data Mining Introduzione al Data Mining Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Modalità didattiche e materiale Lezioni in aula e in laboratorio utilizzando il software open source Weka

Dettagli

Grid Data Management Services

Grid Data Management Services Grid Management Services D. Talia - UNICAL Griglie e Sistemi di Elaborazione Ubiqui Sommario Grid Management GridFTP RFT RLS OGSA-DAI 1 GT4 Services GridFTP High-performance transfer protocol The Reliable

Dettagli

Introduzione. File System Distribuiti. Nominazione e Trasparenza. Struttura dei DFS. Strutture di Nominazione

Introduzione. File System Distribuiti. Nominazione e Trasparenza. Struttura dei DFS. Strutture di Nominazione File System Distribuiti Introduzione Nominazione e Trasparenza Accesso ai File Remoti Servizio Con/Senza Informazione di Stato Replica dei File Un esempio di sistema Introduzione File System Distribuito

Dettagli

File System Distribuiti

File System Distribuiti File System Distribuiti Introduzione Nominazione e Trasparenza Accesso ai File Remoti Servizio Con/Senza Informazione di Stato Replica dei File Un esempio di sistema 20.1 Introduzione File System Distribuito

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Sistemi informazionali La crescente diffusione dei

Dettagli

Definizione e sintesi di modelli del traffico di rete per la rilevazione in tempo reale delle intrusioni in reti di calcolatori

Definizione e sintesi di modelli del traffico di rete per la rilevazione in tempo reale delle intrusioni in reti di calcolatori Definizione e sintesi di modelli del traffico di rete per la rilevazione in tempo reale delle intrusioni in reti di calcolatori Francesco Oliviero folivier@unina.it Napoli, 22 Febbraio 2005 ipartimento

Dettagli

INDICE INTRODUZIONE... 1. Capitolo 1: RETI WIRELESS... 5. 1.1 Reti Wireless... 5. 1.2 Lo standard IEEE 802.11... 10. 1.3 Le Vanet...

INDICE INTRODUZIONE... 1. Capitolo 1: RETI WIRELESS... 5. 1.1 Reti Wireless... 5. 1.2 Lo standard IEEE 802.11... 10. 1.3 Le Vanet... Indice INDICE INTRODUZIONE... 1 Capitolo 1: RETI WIRELESS... 5 1.1 Reti Wireless... 5 1.2 Lo standard IEEE 802.11... 10 1.3 Le Vanet... 14 1.4 LTE (Long Term Evolution)... 19 1.5 5G... 21 Capitolo 2: RETI

Dettagli

Microsoft SQL Server Integration Services

Microsoft SQL Server Integration Services Sistemi Informativi Dott.ssa Elisa Turricchia Alma Mater Studiorum - Università di Bologna elisa.turricchia2@unibo.it 1 Microsoft SQL Server Integration Services 1 SQL Server Integration Services SSIS

Dettagli

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Obiettivi. Presentare l evoluzione dei sistemi informativi: da supporto alla operatività a supporto al momento decisionale Definire

Dettagli

Scriviamo insieme il futuro

Scriviamo insieme il futuro Res User Meeting 2014 con la partecipazione di Scriviamo insieme il futuro Research for Enterprise Systems 1 Generale - 1 Obbiettivo Fornire al Cliente uno strumento a supporto della problematica Legata

Dettagli

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence Introduzione Definizione di Business Intelligence: insieme di processi per raccogliere

Dettagli

-Possibilità di svolgere le attività commerciali per via elettronica, in particolare tramite Internet.

-Possibilità di svolgere le attività commerciali per via elettronica, in particolare tramite Internet. COMMERCIO ELETTRONICO -Possibilità di svolgere le attività commerciali per via elettronica, in particolare tramite Internet. -Un qualsiasi tipo di transazione tendente a vendere o acquistare un prodotto

Dettagli

4 Introduzione al data warehousing

4 Introduzione al data warehousing Che cosa è un data warehouse? Introduzione al data warehousing 22 maggio 2001 Un data warehouse è una base di dati collezione di dati di grandi dimensioni, persistente e condivisa gestita in maniera efficace,

Dettagli

Grid Data Management Services

Grid Data Management Services Grid Management Services D. Talia - UNICAL Griglie e Sistemi di Elaborazione Ubiqui Sommario Grid Management in Globus Toolkit GridFTP (Trasferimento Dati) RFT (Trasferimento Dati Affidabile) RLS (Gestione

Dettagli

Modelli matematici avanzati per l azienda a.a. 2010-2011

Modelli matematici avanzati per l azienda a.a. 2010-2011 Modelli matematici avanzati per l azienda a.a. 2010-2011 Docente: Pasquale L. De Angelis deangelis@uniparthenope.it tel. 081 5474557 http://www.economia.uniparthenope.it/siti_docenti P.L.DeAngelis Modelli

Dettagli

Marketing nel commercio elettronico Parte 2

Marketing nel commercio elettronico Parte 2 Marketing nel commercio elettronico Parte 2 Dr. Stefano Burigat Dipartimento di Matematica e Informatica Università di Udine www.dimi.uniud.it/burigat stefano.burigat@uniud.it Obbiettivi della ricerca

Dettagli

Cosa è un data warehouse?

Cosa è un data warehouse? Argomenti della lezione Data Warehousing Parte I Introduzione al warehousing cosa è un data warehouse classificazione dei processi aziendali sistemi di supporto alle decisioni elaborazione OLTP e OLAP

Dettagli

Dynamic Warehousing: la tecnologia a supporto della Business Intelligence 2.0. Giulia Caliari Software IT Architect

Dynamic Warehousing: la tecnologia a supporto della Business Intelligence 2.0. Giulia Caliari Software IT Architect Dynamic Warehousing: la tecnologia a supporto della Business Intelligence 2.0 Giulia Caliari Software IT Architect Business Intelligence: la nuova generazione Infrastruttura Flessibilità e rapidità di

Dettagli

Company Profile. www.valuelab.it

Company Profile. www.valuelab.it Company Profile www.valuelab.it 1 Profilo VALUE LAB è una innovativa società di consulenza di management e IT solutions specializzata in Marketing, Vendite e Retail. Aiutiamo le Aziende di produzione,

Dettagli

Proposte ed esperienze di CartaSi

Proposte ed esperienze di CartaSi Carte di pagamento, un modello cooperativo per la prevenzione della frode. Proposte ed esperienze di CartaSi Andrea Giacomelli Convegno Carte 2006 Roma, 27 novembre 2006 Contenuti I fattori di rischio

Dettagli

Data mining. Data Mining. processo di Data Mining estrarre automaticamente informazioneda un insieme di dati

Data mining. Data Mining. processo di Data Mining estrarre automaticamente informazioneda un insieme di dati Data mining Il consente l informazione processo di Data Mining estrarre automaticamente informazioneda un insieme di dati telefoniche, ènascostaa a causa di fra quantitàdi loro, complessità: non... ci

Dettagli

Di seguito ci accingiamo ad analizzare le possibili configurazioni di architettura: Server singolo

Di seguito ci accingiamo ad analizzare le possibili configurazioni di architettura: Server singolo La progettazione dell architettura si concentra sulla scelta dell hardware, dell infrastruttura di rete, e dei componenti software che andranno a costituire il sistema. Gli obbiettivi tecnologici che il

Dettagli

Distributed P2P Data Mining. Autore: Elia Gaglio (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo

Distributed P2P Data Mining. Autore: Elia Gaglio (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo Distributed P2P Data Mining Autore: (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo A.A. 2005/2006 Il settore del Data Mining Distribuito (DDM): Data Mining: cuore del processo

Dettagli

RRF Reply Reporting Framework

RRF Reply Reporting Framework RRF Reply Reporting Framework Introduzione L incremento dei servizi erogati nel campo delle telecomunicazioni implica la necessità di effettuare analisi short-term e long-term finalizzate a tenere sotto

Dettagli

Cultura e Territorio

Cultura e Territorio Cultura e Territorio G.F. Mascari(*), M. Mautone(.), L. Moltedo(*), P. Salonia( ) (*)mascari@iac.rm.cnr.it moltedo@iac.rm.cnr.it (.)direttore.dpc@cnr.it ( )paolo.salonia@itabc.cnr.it Network Humanitatis

Dettagli

Piano di Formazione Interaziendale/Aziendale

Piano di Formazione Interaziendale/Aziendale Piano di Formazione Interaziendale/Aziendale Criticità emerse e obiettivi perseguiti Sulla base del ruolo strategico assunto dall impiego di tecnologie e strumenti propri di aree quali, ad esempio, Knowledge

Dettagli

La progettazione dell Urban Control Center di una Smart City per il monitoraggio e la gestione energetico-ambientale della città

La progettazione dell Urban Control Center di una Smart City per il monitoraggio e la gestione energetico-ambientale della città La progettazione dell Urban Control Center di una Smart City per il monitoraggio e la gestione energetico-ambientale della città Prof. Ing. Mariagrazia DOTOLI (email: mariagrazia.dotoli@poliba.it) Dipartimento

Dettagli

E-marketing Intelligence e personalizzazione

E-marketing Intelligence e personalizzazione E-marketing Intelligence e personalizzazione Nel mondo degli affari di oggi comprendere e sfruttare il potere delle 4 P del marketing (product, price, place e promotion) è diventato uno dei fattori più

Dettagli

Table of Contents. Insegnamento: Sistemi Distribuiti - 6 cfu LM Ing. Informatica Docente: Prof. Marcello Castellano

Table of Contents. Insegnamento: Sistemi Distribuiti - 6 cfu LM Ing. Informatica Docente: Prof. Marcello Castellano Insegnamento: Sistemi Distribuiti - 6 cfu LM Ing. Informatica Docente: Prof. Marcello Castellano Table of Contents Definizione di Sistema Distribuito - 4 Obiettivi Principali di un S.D. - 7 Tipi di Sistemi

Dettagli

Introduzione ad OLAP (On-Line Analytical Processing)

Introduzione ad OLAP (On-Line Analytical Processing) Introduzione ad OLAP (On-Line Analytical Processing) Metodi e Modelli per il Supporto alle Decisioni 2002 Dipartimento di Informatica Sistemistica e Telematica (Dist) Il termine OLAP e l acronimo di On-Line

Dettagli

Il data mining. di Alessandro Rezzani

Il data mining. di Alessandro Rezzani Il data mining di Alessandro Rezzani Cos è il data mining.... 2 Knowledge Discovery in Databases (KDD)... 3 Lo standard CRISP-DM... 4 La preparazione dei dati... 7 Costruzione del modello... 7 Attività

Dettagli

Table of Contents. Definizione di Sistema Distribuito 15/03/2013

Table of Contents. Definizione di Sistema Distribuito 15/03/2013 Insegnamento: Sistemi Distribuiti - 6 cfu LM Ing. Informatica Docente: Prof. Marcello Castellano Table of Contents Definizione di Sistema Distribuito - 4-7 - 13 Definizioni e Principali Caratteristiche

Dettagli

Descrizione dell Offerta Formativa

Descrizione dell Offerta Formativa Descrizione dell Offerta Formativa Titolo dell Offerta Formativa TECNICHE AVANZATE DI PROGRAMMAZIONE Articolazione e Contenuti dell Offerta Formativa Il percorso è articolato in due moduli didattici, della

Dettagli

On Line Analytical Processing

On Line Analytical Processing On Line Analytical Processing Data integra solitamente Warehouse(magazzino dati) èun sorgenti un unico schema globalel informazione estratta da piu puo replicazioneai puo essere èinterrogabile, non modificabile

Dettagli

OSSERVATORIO TURISMO PISA

OSSERVATORIO TURISMO PISA 1 OSSERVATORIO TURISMO PISA Osservatorio Turistico di Destinazione KDD Lab, ISTI CNR, Pisa Comune di Pisa Turismo nelle città d arte 2 I flussi in arrivo consumano le risorse della città: La mobilità:

Dettagli

La piattaforma Oracle10g per la Continuita Operativa

La piattaforma Oracle10g per la Continuita Operativa La piattaforma Oracle10g per la Continuita Operativa Roma, 10 maggio 2006 Alfredo Valenza Principal Sales Consultant - Oracle Italia alfredo.valenza@oracle.com Cause di un disastro 3% 18% 18% 4% 14% 4%

Dettagli

Relazione sul data warehouse e sul data mining

Relazione sul data warehouse e sul data mining Relazione sul data warehouse e sul data mining INTRODUZIONE Inquadrando il sistema informativo aziendale automatizzato come costituito dall insieme delle risorse messe a disposizione della tecnologia,

Dettagli

Wireless Grids e Pervasive Grids. Pervasive Grids

Wireless Grids e Pervasive Grids. Pervasive Grids Griglie e Sistemi di Elaborazione Ubiqui Wireless Grids e Pervasive Grids Griglie e Sistemi Ubiqui - D. Talia - UNICAL 1 Wireless Grids e Pervasive Grids Wireless Grids Caratteristiche Sistemi Applicazioni

Dettagli

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Dettagli

Overview. Le soluzioni Microsoft per la Business Intelligence

Overview. Le soluzioni Microsoft per la Business Intelligence Overview Le soluzioni Microsoft per la Business Intelligence La strategia Microsoft per la BI Improving organizations by providing business insights to all employees leading to better, faster, more relevant

Dettagli

SAP PLM - DMS. SAP Document Management System integrazione con Content Server

SAP PLM - DMS. SAP Document Management System integrazione con Content Server SAP PLM - DMS SAP Document Management System integrazione con Content Server Apex assists companies increase business value by leveraging existing investments in SAP solutions SAP DMS Agenda Overview soluzione

Dettagli

LA TECHNOLOGY TRANSFER PRESENTA MIKE ROMA 27-28 GIUGNO 2013 RESIDENZA DI RIPETTA - VIA DI RIPETTA, 231

LA TECHNOLOGY TRANSFER PRESENTA MIKE ROMA 27-28 GIUGNO 2013 RESIDENZA DI RIPETTA - VIA DI RIPETTA, 231 LA TECHNOLOGY TRANSFER PRESENTA MIKE FERGUSON BIG DATA ANALYTICS Costruire il Data Warehouse Logico ROMA 27-28 GIUGNO 2013 RESIDENZA DI RIPETTA - VIA DI RIPETTA, 231 info@technologytransfer.it www.technologytransfer.it

Dettagli

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse Introduzione data warehose Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa Data Warehouse Che cosa e un data warehouse? Quali sono i modelli dei dati per data warehouse Come si progetta

Dettagli

Previsione e monitoraggio del posizionamento competitivo sul sistema. Analisi comparata della propria rete di vendita e penetrazione sul territorio

Previsione e monitoraggio del posizionamento competitivo sul sistema. Analisi comparata della propria rete di vendita e penetrazione sul territorio Essbase XTD e Pk.ben Pagina 1 Una sinergia vincente Previsione e monitoraggio del posizionamento competitivo sul sistema. Analisi comparata della propria rete di vendita e penetrazione sul territorio Cesare

Dettagli

Basi di Dati Complementi Esercitazione su Data Warehouse

Basi di Dati Complementi Esercitazione su Data Warehouse Sommario Basi di Dati Complementi Esercitazione su Data Warehouse 1. Riassunto concetti principali dalle slide della lezione di teoria 2.Studio di caso : progettazione di un Data Warehouse di una catena

Dettagli

La Business Intelligence per competere e governare il cambiamento Vittorio Arighi Practice Leader Netconsulting

La Business Intelligence per competere e governare il cambiamento Vittorio Arighi Practice Leader Netconsulting La Business Intelligence per competere e governare il cambiamento Vittorio Arighi Practice Leader Netconsulting 9 ottobre 2014 L andamento del PIL a livello mondiale: l Italia continua ad arretrare Mondo

Dettagli

Sommario IX. Indice analitico 331

Sommario IX. Indice analitico 331 Sommario Prefazione X CAPITOLO 1 Introduzione ai sistemi informativi 1 1.1 Il prodotto del secolo 1 1.2 Prodotti e servizi divenuti indispensabili 2 1.3 Orientarsi nelle definizioni 4 1.4 Informatica e

Dettagli

Introduzione al data warehousing

Introduzione al data warehousing Introduzione al data warehousing, Riccardo Torlone aprile 2012 1 Motivazioni I sistemi informatici permettono di aumentare la produttività delle organizzazioni automatizzandone la gestione quotidiana dei

Dettagli

Tecniche di caching per migliorare l'ecienza dei sistemi P2P di Web Search. Laureando: Elia Gaglio (matricola n 809477)

Tecniche di caching per migliorare l'ecienza dei sistemi P2P di Web Search. Laureando: Elia Gaglio (matricola n 809477) Tecniche di caching per migliorare l'ecienza dei sistemi P2P di Web Search Laureando: Elia Gaglio (matricola n 809477) 19/10/2007 Indice 1 Introduzione 6 2 Tecniche di Web Searching 12 2.1 Lo scenario

Dettagli

L utilizzo dei Big Data in Istat: stato attuale e prospettive

L utilizzo dei Big Data in Istat: stato attuale e prospettive L utilizzo dei Big Data in Istat: stato attuale e prospettive Giulio Barcaroli FORUM PA 28 maggio 2015 Outline Illustrazione delle attività portate avanti dall Istat, riguardanti: la prosecuzione di sperimentazioni

Dettagli

AIR MILES un case study di customer segmentation

AIR MILES un case study di customer segmentation AIR MILES un case study di customer segmentation Da: G. Saarenvirta, Mining customer data, DB2 magazine on line, 1998 http://www.db2mag.com/db_area/archives/1998/q3/ 98fsaar.shtml Customer clustering &

Dettagli

Wireless Grids e Pervasive Grids

Wireless Grids e Pervasive Grids Griglie e Sistemi di Elaborazione Ubiqui e Pervasive Grids Griglie e Sistemi Ubiqui - D. Talia - UNICAL 1 e Pervasive Grids Caratteristiche Sistemi Applicazioni Pervasive Grids Caratteristiche Problemi

Dettagli

Gestire l informazione in un ottica innovativa. Enrico Durango Manager of Information Management Software Sales - IBM Italia

Gestire l informazione in un ottica innovativa. Enrico Durango Manager of Information Management Software Sales - IBM Italia Gestire l informazione in un ottica innovativa Enrico Durango Manager of Information Management Software Sales - IBM Italia INFORMAZIONE 2 La sfida dell informazione Business Globalizzazione Merger & Acquisition

Dettagli

Sistemi Informativi. Catena del valore di PORTER

Sistemi Informativi. Catena del valore di PORTER Sistemi Informativi Catena del valore di PORTER La catena del valore permette di considerare l'impresa come un sistema di attività generatrici del valore, inteso come il prezzo che il consumatore è disposto

Dettagli

Sistemi Distribuiti. Introduzione Definizione Vantaggi e svantaggi Architetture hardware e software Problemi di progetto. Sistemi Operativi mod.

Sistemi Distribuiti. Introduzione Definizione Vantaggi e svantaggi Architetture hardware e software Problemi di progetto. Sistemi Operativi mod. Sistemi Distribuiti Introduzione Definizione Vantaggi e svantaggi Architetture hardware e software Problemi di progetto 19.1 Introduzione A metà degli anni quaranta inizia l era dei calcolatori elettronici

Dettagli

Introduzione. Sistemi Distribuiti. Introduzione. Introduzione. Definizione di sistema distribuito. Introduzione

Introduzione. Sistemi Distribuiti. Introduzione. Introduzione. Definizione di sistema distribuito. Introduzione Sistemi Distribuiti Definizione Vantaggi e svantaggi Architetture hardware e software Problemi di progetto A metà degli anni quaranta inizia l era dei calcolatori elettronici moderni: grandi, costosi e

Dettagli

Data Mining a.a. 2010-2011

Data Mining a.a. 2010-2011 Data Mining a.a. 2010-2011 Docente: mario.guarracino@cnr.it tel. 081 6139519 http://www.na.icar.cnr.it/~mariog Informazioni logistiche Orario delle lezioni A partire dall 19.10.2010, Martedì h: 09.50 16.00

Dettagli

Che cosa è SADAS INFOMANAGER (1982) Gestione Archivi Storici (1992) SADAS (2005) Ambiente MVS OVERMILLION (1990) Client-Server e multipiattaforma

Che cosa è SADAS INFOMANAGER (1982) Gestione Archivi Storici (1992) SADAS (2005) Ambiente MVS OVERMILLION (1990) Client-Server e multipiattaforma 1 Che cosa è SADAS SADAS è un DBMS column-based progettato in modo specifico per ottenere grandi performance nell interrogazione di archivi statici di grandi dimensioni (analisi data warehouse, OLAP).

Dettagli

Introduzione al Datamining. Francesco Passantino francesco@iteam5.net www.iteam5.net/francesco

Introduzione al Datamining. Francesco Passantino francesco@iteam5.net www.iteam5.net/francesco Introduzione al Datamining Francesco Passantino francesco@iteam5net wwwiteam5net/francesco Cos è il datamining Processo di selezione, esplorazione e modellazione di grandi masse di dati, al fine di scoprire

Dettagli

Miriam Gotti m.gotti@cineca.it

Miriam Gotti m.gotti@cineca.it Cenni sul Dat a Warehouse Ravenna 5 Novembre 2007 Miriam Gotti m.gotti@cineca.it www. cineca.it Agenda Fondamenti di Data Warehouse Modello Multidimensionale Analisi OLAP Introduzione a Statportal www.cineca.it

Dettagli

SEGMENTAZIONE INNOVATIVA VS TRADIZIONALE

SEGMENTAZIONE INNOVATIVA VS TRADIZIONALE SEGMENTAZIONE INNOVATIVA VS TRADIZIONALE Arricchimento dei dati del sottoscrittore / user Approccio Tradizionale Raccolta dei dati personali tramite contratto (professione, dati sul nucleo familiare, livello

Dettagli