Il data mining. di Alessandro Rezzani

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Il data mining. di Alessandro Rezzani"

Transcript

1 Il data mining di Alessandro Rezzani Cos è il data mining Knowledge Discovery in Databases (KDD)... 3 Lo standard CRISP-DM... 4 La preparazione dei dati... 7 Costruzione del modello... 7 Attività tipiche... 8 Valutazione del modello... 9 La matrice di confusione... 9 La curva ROC (Receiver Operating Characteristic) Lift chart Bibliografia... 14

2 Cos è il data mining. Se esaminiamo come le modalità di analisi dei dati si sono evolute negli anni, notiamo come da indagini effettuate direttamente sulle fonti operazionali, si è passati, a partire dagli anni 90, all utilizzo di una base dati creata appositamente: il data warehouse. Con il data warehouse e i database multidimensionali è possibile analizzare i dati non solo al massino livello di dettaglio, ma anche a diversi livelli di aggregazione, e, inoltre, eseguendo operazione di drill-down o slicing e dicing si ottengono dinamicamente prospettive diverse del dato. Tuttavia si tratta sempre di una visione storica, che consente soltanto una valutazione a consuntivo di ciò che è accaduto nel passato, oppure di ciò che sta accadendo ora. Più di recente, a partire dai primi anni 2000, ha cominciato ad affermarsi la necessità di effettuare analisi previsionali, per anticipare gli eventi e ottenere un vantaggio di business. La grande quantità di dati disponibili ha reso inoltre necessaria l adozione di tecniche di analisi efficienti e in grado di lavorare su valori numerici, testuali o binari (per es. le immagini). Le tecniche di analisi, a cui ci riferiamo, prendono il nome di data mining, poiché consentono di scavare nei dati ed estrarre informazioni, pattern 1 e relazioni non immediatamente identificabili e non note a priori. Il data mining può essere utilizzato in qualsiasi settore economico, per risolvere molteplici problemi di business: - Ricerca di anomalie. Il data mining può essere impiegato per l identificazione di comportamenti fraudolenti nell utilizzo di carte di credito. - Churn Analysis. La churn analysis consiste nell analisi della clientela per determinare i clienti che presentano un alta probabilità di passare alla concorrenza, al fine di intervenire in anticipo ed evitarne la migrazione. - Segmentazione della clientela. Le tecniche di segmentazione possono essere utili, per esempio, a determinare il profilo comportamentale dei clienti. Una volta identificati i segmenti di clienti simili, è possibile studiare strategie di marketing differenziate per ciascun gruppo. - Previsioni. Le analisi predittive dell andamento delle vendite, o, genericamente dell andamento di serie temporali, sono un altro degli ambiti di impiego del data mining. - Campagne pubblicitarie mirate. L utilizzo del data mining nell ambito delle campagne di marketing mirate, consente di stabilire a priori quali siano, tra i prospect, quelli con maggior probabilità di acquistare i prodotti dell azienda, in modo da impiegare su di essi le risorse del marketing. - Market basket analysis. Le tecniche di market basket analysis sono utili a suggerire, a un certo cliente, ulteriori prodotti da acquistare in base ai suoi comportamenti d acquisto abituali, oppure a definire il layout dei prodotti sugli scaffali. Il data mining comporta l utilizzo integrato di diverse discipline, come il data warehousing, la statistica, l intelligenza artificiale, le tecniche di visualizzazione, l analisi delle serie temporali e l analisi di dati geospaziali. La componente tecnologica riveste una grande importanza, poiché gli algoritmi di data mining richiedono una certa potenza di calcolo e tecniche di ottimizzazione delle performance sono essenziali, soprattutto in presenza di una mole di dati elevata. Nel processo di data mining è però la figura dell utente ad assumere un ruolo centrale: si tratta, infatti, di un processo che richiede l interazione di un esperto del business, che deve sfruttare la propria conoscenza per la preparazione dei dati, per costruzione dei modelli e per la valutazione dei risultati. La tabella seguente contiene un sunto delle caratteristiche del data mining. 1 Per pattern intendiamo una struttura, un modello, o, più in generale una rappresentazione sintetica dei dati.

3 Tabella 1 Caratteristiche del data mining. Caratteristica Scopo Ambito dei dati Ipotesi di partenza Requisiti Interazione Capacità di elaborazione Interpretazione dei risultati Descrizione Il data mining utilizza tecniche analitiche per identificare pattern nascosti nei dati. Il data mining può trattare dati qualitativi, qualitativi, testuali, immagini e suoni. Non richiede ipotesi a priori da parte del ricercatore, nemmeno sulla forma distributiva 2 delle variabili. E necessaria una buona conoscenza de business nel cui ambito si vogliono applicare le tecniche di data mining. Ciò consente la corretta valutazione e selezione dei dati di partenza rilevanti. Inoltre occorre aver pienamente compreso i requisiti e gli obiettivi che si vogliono raggiungere, al fine di poter interpretare nel modo corretto i risultati dei modelli. L analista e il sistema di data mining devono interagire al fine di produrre un modello valido. L analista sceglie i dati da analizzare, configura il sistema di data mining e valuta i risultati. Il processo può essere ripetuto per affinare il modello. Gli algoritmi sono ottimizzati per minimizzare i tempi di elaborazione anche in presenza di un numero elevato di osservazione e un numero elevato di variabili. I software i data mining offrono propongono i risultati in forma semplice, anche attraverso l uso di strumenti visuali che ne facilitano l interpretazione. Knowledge Discovery in Databases (KDD) Il data mining fa parte di un più ampio processo chiamato Knowledge Discovery in Databases (KDD) e ne rappresenta la fase più importante. Il KDD, come si evince dal nome, ha lo scopo di estrarre la conoscenza dai dati. Sappiamo che il dato è il risultato di una misurazione di un certo evento e di per sé non ha grande utilità. Tuttavia valutando i dati in un preciso contesto e applicandovi opportune elaborazioni è possibile ricavare informazioni: in questo modo il dato diventa utile e in grado di rispondere a una richiesta specifica. Tuttavia l informazione va utilizzata in modo produttivo al fine di ottenere conoscenza. La conoscenza è dunque il risultato di un percorso che parte dai dati grezzi e termina con l interpretazione e lo sfruttamento produttivo dei risultati. Il processo di KDD contiene diversi passi: 1) Selezione dei dati. E evidente come un database possa contenere nati di varia natura, che per il problema in esame possono risultare inutili. E dunque importante comprendere il dominio applicativo determinato dagli obiettivi dell utente finale. 2) Preelaborazione. Dopo aver ridotto l ambito dei dati da considerare, è comunque poco opportuno analizzarli per intero, poiché la quantità di dati potrebbe essere ancora molto elevata. Può essere conveniente estrarre un campione e analizzare soltanto quello. Inoltre nella fase di preelaborazione rientrano le attività di pulizia dei dati e di definizione del trattamento dei dati mancanti. Teniamo in 2 Le tecniche statistiche richiedono quasi sempre di formulare ipotesi sulla distribuzione delle variabili esaminate.

4 considerazione, però, che, se i dati provengono dal data warehouse, molte le operazioni di pulizia dovrebbero essere già state messe in opera nella fase di ETL. 3) Trasformazione. Le trasformazioni possono riguardare cambiamenti nei tipi di dato (da numero a stringa, per esempio), la discretizzazione di valori continui, oppure la normalizzazione dei valori. 4) Data Mining. La fase di data mining vede la determinazione dell algoritmo da utilizzare, la costruzione e il testing di un modello. 5) Interpretazione dei risultati.i risultati del modello di data mining evidenzia dei pattern nascosti nei dati: occorre però valutare se essi sono utili e possono apportare un beneficio per il business. Figura 1 Il processo di KDD. Lo standard CRISP-DM CRISP-DM, che sta per Cross Industry Standard Process for Data Mining è un metodo di comprovata efficacia per l implementazione di un processo di data mining. I lavori di definizione dello standard prendono avvio nel 1996 come iniziativa finanziata dall Unione Europea e portata avanti da un consorzio di quattro società: SPSS, NCR Corporation, Daimler-Benz e OHRA. La prima versione della metodologia vede la luce nel 1999, mentre nel 2006 iniziano i lavori per definire lo standard CRISP-DM 2.0. Tuttavia, la seconda versione non ha mai visto la luce e nessun tipo di attività o comunicazione è più pervenuta dal gruppo di lavoro dal 2007, tant è che anche il sito web non è più attivo da parecchio tempo. Nonostante questo la metodologia CRISP-DM è valida ed è stata largamente adottata dalle aziende che hanno affrontato progetti di data mining.

5 Il presupposto della metodologia risiede nella volontà di rendere il processo di data mining affidabile e utilizzabile da persone con pochi skill in materia, ma con elevata conoscenza del business. La metodologia fornisce un framework che prevede sei fasi, che possono essere ripetute ciclicamente con l obiettivo di revisionare e rifinire il modello previsionale: - Business Understanding - Data Understanding - Data Preparation - Modeling - Evaluation - Deployment La figura che segue mostra l intero processo. Figura 2 Metodologia CRISP-DM. Ciascuna delle fasi si articola in più punti, illustrati nella tabella seguente. Tabella 2 Punti della metodologia CRISP-DM Determinazione degli obiettivi di business Assessment della situazione attuale Business Understanding La comprensione delle problematiche del business e degli obiettivi aziendali è necessaria al fine di poter creare un modello di data mining adeguato. Le attività di assessment riguardano tipicamente: Inventario delle risorse Requisiti, presupposti e vincoli Rischi e imprevisti

6 Determinazione degli obiettivi del processo di data mining Creazione del piano di progetto Identificazione e recupero dei dati Esplorazione e descrizione dei dati Verifica della qualità Selezione dei dati Pulizia dei dati, integrazione e formattazione Costruzione dei dati Selezione dell algoritmo Creazione del modello Valutazione dei risultati Analisi dei costi/benefici La costruzione del modello e la scelta degli algoritmi di calcolo dipendono anche dagli obiettivi che il sistema dovrebbe raggiungere; in altre parole è necessario interpretare in maniera corretta i requisiti dell utente. Già nella prima fase, una volta capiti gli obiettivi, è possibile predisporre il piano di sviluppo del progetto di data mining. Data understanding 3 In base a quanto determinato con la fase precedente, occorre identificare quali sono i dati rilevanti per la creazione del modello. La metodologia prevede per questa fase la creazione di un report che evidenzi le caratteristiche delle fonti dati e i criteri di scelta. I dati devono essere analizzati e descritti attraverso un report L attività di esplorazione e descrizione dei dati deve essere completata con la verifica della qualità. Devono essere indentificati i dati mancanti, le situazioni anomale (i cosiddetti outliers, ecc.) Data Preparation I dati identificati come pertinenti nel punto precedente, sono ulteriormente soggetti a selezione, poiché occorre individuare le singole tabelle e i singoli campi da utilizzare nel modello di data mining La preparazione del data set da utilizzare per la costruzione del modello di data mining prevede un attività di pulizia dei dati, qualora la verifica della qualità avesse evidenziato problemi. Oltre a questo, potrebbe essere utile integrare il data set con dati provenienti da fonti esterne. La costruzione dei dati consiste nella creazione di campi calcolati che saranno utilizzati come attributi d analisi nei modelli di data mining. Modeling Come vedremo esistono spesso più algoritmi che si adattano ad un determinato problema di data mining. In questa fase occorre identificare quali sono gli algoritmi corretti, e decidere se costruire un modello per ciascuno di essi. Occorre tener presente che alcuni algoritmi richiedono i dati in specifici formati, perciò è spesso necessario ritornare alla fase di preparazione dei dati, prima di proseguire con la creazione del modello. La creazione del modello consiste nell impostazione dei parametri dell algoritmo e nella loro calibrazione sulla base dei dati. Evaluation Il modello deve valutato attraverso un insieme di dati di test. Se i risultati non sono soddisfacenti occorrerà riconsiderare l attività di modellazione oppure l attività di preparazione dei dati. 3 Notiamo che, a parte la scelta dei dati rilevanti, il resto delle operazioni dovrebbe già essere parte del sistema di Business Intelligence.

7 Revisione del processo Decisione sull utilizzo del modello Pianificazione del deployment Manutenzione e verifiche Revisione finale Una volta eseguita la valutazione del modello, è bene, anche in caso di risultati positivi, ricontrollare tutte le fasi del processo, soprattutto per indentificare eventuali omissioni di regole di business e per verificare la congruità dei risultati con gli obiettivi stabiliti. A questo punto è possibile decidere se utilizzare i risultati del modello nel processo di KDD, procedendo quindi con il deployment agli utenti. Deployment La fase di deployment include anche l integrazione del modello con i sistemi esistenti. Inoltre la raccolta dati, la loro preparazione e l elaborazione attraverso il modello devono essere automatizzati. Nel definire le attività di deployment occorre programmare anche l attività di manutenzione. La fase di deployment si conclude con la documentazione dell intero processo e con una revisione finale con il coinvolgimento degli utenti. La metodologia CRISP-DM ha il vantaggio di essere applicabile a qualsiasi ramo di attività e di essere indipendente dallo strumento software utilizzato. Inoltre è strettamente collegata al modello d azione della KDD. Nei paragrafi che seguono approfondiremo i punti principali relativi alla costruzione e alla valutazione di un modello di data mining. In particolare vedremo gli aspetti di preparazione dei dati, di scelta dell algoritmo e di valutazione dei risultati. La preparazione dei dati La preparazione dei dati assume un ruolo cruciale nel processo di data mining, poiché essa può influenzare in maniera sostanziale la bontà dei modelli. Il primo aspetto da considerare riguarda la qualità dei dati. Se supponiamo che i dati da utilizzare per il data mining arrivino dal data warehouse, allora possiamo dare per scontato che il processo di pulizia, integrazione e uniformazione dei dati sia già stato compiuto. Se così non fosse, occorre valutare il grado di affidabilità e completezza dei dati e porre rimedio ai problemi di qualità, pena la costruzione di modelli destinati ad essere completamente inefficaci. Esiste poi un problema legato ai valori mancanti degli attributi, che, in parte può essere sanato nel data warehouse attraverso l integrazione diverse fonti, anche esterne all azienda (si pensi all acquisto di dati demografici o relativi al territorio da banche dati specializzate). Accade però che per alcuni attributi non sia sempre possibile ottenere un valore. In questo caso, nel data warehouse, invece di presentare un valore NULL, si utilizzerà un valore di default che indica la mancanza del dato, ma questa soluzione non è ottimale per il data mining ed è da gestire al momento della preparazione dei dati. Alcuni algoritmi richiedono che i dati siano trasformati, di solito attraverso operazioni di vario genere: normalizzazioni, riduzione del numero di attributi, riclassificazione dei valori di un attributo. Costruzione del modello La costruzione del modello di data mining si articola su più fasi:

8 - La scelta dell algoritmo di calcolo. Essa è basata sull analisi del problema di data mining da risolvere. Il paragrafo che segue fornisce una descrizione dei più comuni algoritmi e delle situazioni alle quali essi si adattano. - Il completamento della fase di preparazione dei dati. Qualora l algoritmo richieda elaborazioni particolari, è necessario ultimare la fase di preparazione dei dati, con le tecniche che abbiamo trattato nel paragrafo precedente. - La scelta dei parametri base di configurazione dell algoritmo. - La suddivisione dei dati disponibili in training set e test set. Nel costruire un modello di data mining occorre operare una suddivisione dei dati disponibili in due insiemi: uno, contenente un ampia percentuale dei dati, costituisce il training set, cioè l insieme dei dati su cui l algoritmo scelto è calibrato. L altro rappresenta il test set, cioè l insieme di dati su cui si eseguirà il test del modello per verificarne la bontà. Il test set ovviamente contiene anche l attributo o gli attributi che sono il risultato dell attività predittiva del modello. In questo modo sarà possibile confrontare i dati reali con quelli previsti ed eseguire così una valutazione. La suddivisione in training set e test set dovrebbe avvenire mantenendo la stessa distribuzione degli attributi in entrambi gli insiemi di elementi, in modo che essi siano ugualmente rappresentativi. - L avvio della fase di training dell algoritmo. Nella fase di training l algoritmo analizza le relazioni nascoste nei dati e imposta il modello di data mining. Molto spesso è necessario ripetere più volte il processo di costruzione del modello al fine di provare algoritmi alternativi oppure di operare aggiustamenti sui parametri, o sulle trasformazioni del data set. Attività tipiche Le attività che tipicamente sono oggetto di un processo di data mining sono raggruppabili in categorie. Per ciascuna categoria è possibile individuare uno o più algoritmi di data mining che meglio si prestano a risolvere il problema. La tabella presenta una categorizzazione dei problemi di data mining, una breve descrizione e gli algoritmi più adatti a ciascuna categoria. Tabella 3 Problemi e algoritmi. Problema Esempio Algoritmo Stima di un attributo discreto: in questo caso si tratta di predire il valore di un particolare attributo sulla base dei valori degli altri attributi. Stimare se il destinatario di una campagna di mailing diretto acquisterà un prodotto, sulla base di dati anagrafici e comportamentali di vario genere. Decision Trees Bayesian classifier Clustering Neural Network Stima di un attributo continuo. Stimare le vendite dell'anno successivo Time Series Neural Network Ricerca di gruppi di elementi comuni nelle transazioni. Utilizzare analisi di mercato sugli acquisti per suggerire a un cliente ulteriori prodotti da acquistare. Association Rules Decision Trees

9 Ricerca di gruppi di elementi simili. Segmentare i dati demografici in gruppi, con comportamenti d acquisto simili Clustering Ricerca di anomalie nei dati Per esempio la ricerca di utilizzi fraudolenti di strumenti di pagamento, come le carte di credito. Clustering Valutazione del modello Con qualsiasi algoritmo la si realizzi, una delle operazioni più frequenti nel data mining è la classificazione: dato un certo numero di elementi che appartengono a classi diverse, ciò che vogliamo ottenere è un modello che assegni ciascun elemento alla classe corretta. Per esempio, può essere utile, prima di iniziare una campagna di vendita, classificare i prospect in due classi: quella dei probabili acquirenti e quella dei non acquirenti, in modo da concentrare gli sforzi soltanto sulla prima classe. Nell implementare un qualsiasi modello, abbiamo visto come sia necessario suddividere i dati in due insiemi: il training set e il test set. Entrambi gli insiemi devono contenere gli elementi con la corretta classificazione; il training set sarà utilizzato per la calibrazione dei parametri del modello, mentre il test set per valutare i risultati del classificatore. Teniamo sempre presente che è praticamente impossibile costruire un modello di classificazione perfetto, e che dovremo accontentarci di un modello sub ottimale. La scelta del modello da utilizzare avviene selezionando il migliore da un insieme di modelli calibrati e testati, costruiti con algoritmi e con parametri differenti. E chiara dunque la necessità di uno strumento che ci permetta di valutare la bontà di un modello e che ci permetta di confrontarlo con altri, al fine di poter scegliere tra essi il più efficace. Molti problemi di classificazione possono essere ricondotti a una classificazione binaria, cioè con sole due opzioni, dove una classe è detta classe positiva e l altra è chiamata classe negativa. Nel nostro esempio della campagna di marketing, la classe positiva è quella dei possibili acquirenti, mentre la classe negativa è rappresentata dai non acquirenti. Descriviamo i metodi per la valutazione dei modelli. La matrice di confusione La performance di un modello è determinata dal numero di predizioni corrette o, per contro, dal numero di errori di predizione. Una prima metrica per la valutazione del modello è rappresentata dalla cosiddetta matrice di confusione il cui generico elemento E ij rappresenta il numero di elementi della classe i-esima che il modello assegna, erroneamente, alla classe j-esima. Come esempio, poniamo di dover rappresentare attraverso la matrice di confusione le previsioni di un modello di classificazione dei possibili acquirenti. I dati del modello, eseguito sul test set sono inclusi nella tabella che segue. Tabella 4 Esempio di risultati di un test. Codice cliente Dato reale Previsione

10 1 Acquirente_SI Acquirente_SI 2 Acquirente_NO Acquirente_NO 3 Acquirente_NO Acquirente_NO 4 Acquirente_SI Acquirente_SI 5 Acquirente_SI Acquirente_SI 6 Acquirente_NO Acquirente_SI 7 Acquirente_NO Acquirente_NO 8 Acquirente_SI Acquirente_SI 9 Acquirente_NO Acquirente_SI 10 Acquirente_SI Acquirente_NO In questo caso la matrice di confusione è data da: Dati Reali Acquirente_SI Acquirente_SI 4 (VERI POSITIVI) Acquirente_NO 2 (FALSI POSITIVI) Predizione Acquirente_NO 1 (FALSI NEGATIVI) 3 (VERI NEGATIVI) Nella matrice di confusione abbiamo quattro quadranti che esprimono: - I veri positivi (VP), cioè i veri acquirenti, classificati come tali. - I falsi positivi (FP), cioè i non acquirenti, classificati come acquirenti dal modello. - I veri negativi (VN), cioè i non acquirenti correttamente classificati. - I falsi negativi (FN), cioè gli acquirenti, classificati come non acquirenti dal modello. Inoltre abbiamo che il numero totale di positivi è dato da P=VP+FN e che il numero totale di negativi è dato da N=FP+VN Dalla matrice possiamo ricavare alcune misure di performance: % falsi positivi = FP/N % veri positivi = VP/P Accuratezza = (VP+VN)/(P+N) Precisione = VP/(VP+FP) Bisogna fare attenzione in particolare all interpretazione della misura di accuratezza, soprattutto nel caso di classi molto sbilanciate (solitamente questi casi sono quelli più interessanti!). Se avessimo nella realtà 999 non acquirenti reali e 1 solo acquirente reale e il modello classificasse tutti come non acquirenti, avremmo l accuratezza pari a (999+0)/(999+1) = 99.9%. In realtà a noi interesserebbe soltanto la previsione dei veri acquirenti, che non si realizzerebbe mai (almeno secondo il nostro modello). Se associamo ai quadranti della matrice di confusione un ricavo derivante dalla corretta previsione o un costo che si origina dalla mancata previsione, otteniamo una matrice di costo per ciascuno dei modelli che sviluppiamo. I modelli possono così essere confrontati non solo in base alle misure proposte poco sopra, ma anche attraverso il risultato economico derivante dalla previsione. Come esempio, associamo i seguenti

11 costi e ricavi ai quadranti della matrice, ipotizzando che, in base alle previsioni, contatteremo soltanto i potenziali clienti: - Al quadrante VP associamo un margine netto di 50 per cliente - Al quadrante FP associamo un costo di 10 per ciascun cliente contattato che non si rivela essere acquirente. - Ai quadranti FN e VN associamo un risultato economico pari a 0. Il risultato dell operazione sarebbe 4*50-2*10 = 180, mostrando quindi un risultato economico positivo a fronte dell applicazione del modello. Tuttavia il risultato è molto più significativo se utilizzato per paragonare vari modelli oppure parametrizzazioni diverse dello stesso modello, al fine di determinare quello più performante. La curva ROC (Receiver Operating Characteristic) La curva ROC è uno strumento messo a punto durante la seconda guerra mondiale dagli ingegneri che si occupavano dei radar per cercare di distinguere i segnali relativi a oggetti nemici dai segnali causati da stormi di uccelli. La curva è stata impiegata in diversi campi, tra cui vi è anche il data mining. La curva ROC è ampiamente utilizzata per valutare i risultati di un modello previsionali. Per il calcolo delle curve ROC occorre che il modello produca come output oltre alla previsione anche la probabilità di realizzazione. Ciò accade in modo nativo per modelli che utilizzano algoritmi come Naïve Bayes o reti neurali, mentre per altri algoritmi è comunque possibile calcolare la probabilità con tecniche specifiche. Solitamente se la probabilità è superiore a 0.5 allora l appartenenza ad una certa classe è vera, altrimenti è falsa. La curva, mostrata in Figura 3, è disegnata ricalcolando la percentuale di falsi positivi e la percentuale di falsi negativi spostando via via la soglia di probabilità di appartenenza da 0 a 1 a piccoli intervalli. Figura 3 Esempi di tre curve ROC che descrivono modelli con performance differenti. Nel grafico ROC, il punto (0,0) rappresenta una classificazione in cui non vi sono falsi positivi, ma nemmeno veri positivi. Il punto (0,100) indica una classificazione perfetta: 0 falsi positivi e 100% veri positivi. Il punto

12 (100,100) è il risultato di una strategia in cui tutti gli elementi sono classificati come veri positivi: così facendo il tasso di falsi positivi è massimo. Come di nota dalla figura nei grafici ROC compare una retta diagonale che unisce i punti (0,0) e (100,100). Essa rappresenta un classificatore completamente casuale: i mostri modelli dovranno per lo meno presentare una curva che stia sopra a quella del classificatore casuale. Ora, utilizziamo la formula dell accuratezza e trasformiamola attraverso semplici passaggi algebrici: Accuratezza = VP+VN P+N VP = P P+(1 FP N ) %Veri Positivi P+(1 % falsi positivi) N = P+N P+N Da questa formula si ricava che: %Veri Positivi = Accuratezza (P + N) (1 %falsi positivi) N P = N P %falsi positivi + Accuratezza (P+N) N P Se visualizziamo graficamente l equazione appena determinata otteniamo un fascio di rette parallele che rappresentano diversi livelli di accuratezza. Possiamo utilizzare la retta per determinare il punto di miglior accuratezza nel modello: esso sarà quello in cui la retta è tangente alla curva ROC, come mostrato nella figura seguente. Figura4 ROC con curva di livello dell'accuratezza. Il punto di miglior accuratezza ci dice qual è la soglia di probabilità ottimale al di sopra della quale un elemento è classificato come appartenente alla classe positiva. Dunque, se ritorniamo all esempio della campagna di marketing, dovremo utilizzare il modello in questo modo:

13 - Come prima azione, eseguiamo la classificazione dei prospect in modo da determinare gli appartenenti alla classe dei probabili acquirenti (classe positiva) - Come output del modello otteniamo anche la probabilità di assegnazione alla classe. - Determiniamo il livello della soglia di probabilità ottimale attraverso la curva ROC e l equazione delle rette di accuratezza. - Selezioniamo gli elementi che appartengono alla classe dei probabili acquirenti e la cui probabilità di appartenenza è maggiore della soglia di probabilità ottimane Lift chart Il lift chart risponde, per mezzo una rappresentazione grafica, alla domanda: selezionando, secondo un certo criterio, l x% di casi nel test set, quale percentuale dei casi di veri positivi (VP) è raggiunta? In questo tipo di grafico sull asse delle ascisse poniamo le percentuali, da 0 a 100% di elementi selezionati dal test set, scelti secondo un certo ordine (tipicamente la probabilità di appartenenza alla classe positiva). Sull asse delle ordinate compare la percentuale dei veri positivi ottenuti attraverso la selezione, sul totale dei veri positivi del test set. Figura 5 Lift chart Anche nel caso del lift chart, così come abbiamo fatto per matrice di confusione, possiamo ragionare in termini di costi e ricavi. I costi possono essere suddivisi in costi fissi e costi cariabili. I costi fissi non dipendono dal numero di elementi estratti dal campione, mentre i costi variabili sono determinati da un costo unitario da moltiplicare al numero di elementi estratti dal test set. Il ricavo è dato da un valore unitario moltiplicato per il numero di veri positivi ottenuti attraverso la selezione. Sempre considerando l esempio della campagna di marketing, potremmo avere costi fissi per la campagna, indipendenti dal numero di clienti contattati; inoltre avremo un costo per ciascun contatto effettuato e un ricavo in caso di acquisizione del cliente. Contattando prima i clienti con maggior probabilità di essere veri positivi, avremo un alta percentuale di successo, che via via diminuisce, al diminuire della probabilità. Ciò significa che il guadagno ( = ricavi - costo fisso costi variabili) tenderà ad aumentare velocemente per poi assestarsi e addirittura diminuire, poiché, con una bassa probabilità di avere un falso positivo dovremo spendere molto nei contatti, prima di ottenere un ricavo. La figura seguente mostra un Profit chart ottenuto con il Data Mining add-in per Excel di Microsoft SQL Server 2008.

14 Figura 6 Profit Chart ricavato con il Data Mining add-in per Excel di Microsoft SQL Server Il profit chart proposto nell add-in di Microsoft, offre la possibilità di specificare un costo fisso, il numero di elementi della popolazione, il costo variabile, per ciascun elemento e il ricavo unitario. In output lo strumento presenta, oltre al grafico anche una tabella con i parametri impostati, il valore del profitto massimo e la soglia di probabilità. La probabilità della classificazione, come abbiamo già detto, è utilizzata per ordinare in modo decrescente gli elementi della popolazione. Il numero proposto dall add-in di Microsoft rappresenta la soglia sotto la quale non bisogna prendere più in considerazione gli elementi. Detto in altri termini, seguendo sempre il nostro esempio di classificazione dei prospect in acquirenti e non acquirenti, se la probabilità di essere acquirente è maggiore o uguale alla Probability threshold, allora possiamo contattare il prospect, altrimenti non ne vale la pena. Bibliografia A. Rezzani, Business Intelligence. Processi, metodi, utilizzo in azienda, APOGEO, 2012 Jack E. Olsen, Data Quality: The Accuracy Dimension, Morgan Kaufmann Publishers, 2003 Tamraparni Dasu, Theodore Johnson: Exploratory Data Mining and Data Cleaning, John Wiley & Sons, 2003

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Alessandro Rezzani Abstract L articolo descrive una delle tecniche di riduzione della dimensionalità del data set: il metodo dell analisi delle componenti principali (Principal

Dettagli

Business Intelligence. Il data mining in

Business Intelligence. Il data mining in Business Intelligence Il data mining in L'analisi matematica per dedurre schemi e tendenze dai dati storici esistenti. Revenue Management. Previsioni di occupazione. Marketing. Mail diretto a clienti specifici.

Dettagli

Relazione sul data warehouse e sul data mining

Relazione sul data warehouse e sul data mining Relazione sul data warehouse e sul data mining INTRODUZIONE Inquadrando il sistema informativo aziendale automatizzato come costituito dall insieme delle risorse messe a disposizione della tecnologia,

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testualilezione 2 Le principali tecniche di analisi testuale Facendo riferimento alle tecniche di data mining,

Dettagli

Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita;

Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita; .netbin. è un potentissimo strumento SVILUPPATO DA GIEMME INFORMATICA di analisi dei dati con esposizione dei dati in forma numerica e grafica con un interfaccia visuale di facile utilizzo, organizzata

Dettagli

ORACLE BUSINESS INTELLIGENCE STANDARD EDITION ONE A WORLD CLASS PERFORMANCE

ORACLE BUSINESS INTELLIGENCE STANDARD EDITION ONE A WORLD CLASS PERFORMANCE ORACLE BUSINESS INTELLIGENCE STANDARD EDITION ONE A WORLD CLASS PERFORMANCE Oracle Business Intelligence Standard Edition One è una soluzione BI completa, integrata destinata alle piccole e medie imprese.oracle

Dettagli

BRM. Tutte le soluzioni. per la gestione delle informazioni aziendali. BusinessRelationshipManagement

BRM. Tutte le soluzioni. per la gestione delle informazioni aziendali. BusinessRelationshipManagement BRM BusinessRelationshipManagement Tutte le soluzioni per la gestione delle informazioni aziendali - Business Intelligence - Office Automation - Sistemi C.R.M. I benefici di BRM Garantisce la sicurezza

Dettagli

Convegno 6 giugno 2013 Federlazio Frosinone

Convegno 6 giugno 2013 Federlazio Frosinone Convegno 6 giugno 2013 Federlazio Frosinone pag. 1 6 giugno 2013 Federlazio Frosinone Introduzione alla Business Intelligence Un fattore critico per la competitività è trasformare la massa di dati prodotti

Dettagli

LA TECHNOLOGY TRANSFER PRESENTA JEN UNDERWOOD ADVANCED WORKSHOP ROMA 6 MAGGIO 2015 RESIDENZA DI RIPETTA - VIA DI RIPETTA, 231

LA TECHNOLOGY TRANSFER PRESENTA JEN UNDERWOOD ADVANCED WORKSHOP ROMA 6 MAGGIO 2015 RESIDENZA DI RIPETTA - VIA DI RIPETTA, 231 LA TECHNOLOGY TRANSFER PRESENTA JEN UNDERWOOD ADVANCED ANALYTICS WORKSHOP ROMA 6 MAGGIO 2015 RESIDENZA DI RIPETTA - VIA DI RIPETTA, 231 info@technologytransfer.it www.technologytransfer.it ADVANCED ANALYTICS

Dettagli

VC-dimension: Esempio

VC-dimension: Esempio VC-dimension: Esempio Quale è la VC-dimension di. y b = 0 f() = 1 f() = 1 iperpiano 20? VC-dimension: Esempio Quale è la VC-dimension di? banale. Vediamo cosa succede con 2 punti: 21 VC-dimension: Esempio

Dettagli

Analisi per tutti. Panoramica. Considerazioni principali. Business Analytics Scheda tecnica. Software per analisi

Analisi per tutti. Panoramica. Considerazioni principali. Business Analytics Scheda tecnica. Software per analisi Analisi per tutti Considerazioni principali Soddisfare le esigenze di una vasta gamma di utenti con analisi semplici e avanzate Coinvolgere le persone giuste nei processi decisionali Consentire l'analisi

Dettagli

(accuratezza) ovvero (esattezza)

(accuratezza) ovvero (esattezza) Capitolo n 2 2.1 - Misure ed errori In un analisi chimica si misurano dei valori chimico-fisici di svariate grandezze; tuttavia ogni misura comporta sempre una incertezza, dovuta alla presenza non eliminabile

Dettagli

t.fabrica wanna be smarter? smart, simple, cost effectiveness solutions for manufactoring operational excellence.

t.fabrica wanna be smarter? smart, simple, cost effectiveness solutions for manufactoring operational excellence. t.fabrica wanna be smarter? smart, simple, cost effectiveness solutions for manufactoring operational excellence. Per le aziende manifatturiere, oggi e sempre più nel futuro individuare ed eliminare gli

Dettagli

un occhio al passato per il tuo business futuro

un occhio al passato per il tuo business futuro 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 un occhio al passato per il tuo business futuro BUSINESS DISCOVERY Processi ed analisi per aziende virtuose Che cos è La Business Discovery è un insieme

Dettagli

Business Intelligence

Business Intelligence aggregazione dati Business Intelligence analytic applications query d a t a w a r e h o u s e aggregazione budget sales inquiry data mining Decision Support Systems MIS ERP data management Data Modeling

Dettagli

EQUAZIONI non LINEARI

EQUAZIONI non LINEARI EQUAZIONI non LINEARI Francesca Pelosi Dipartimento di Matematica, Università di Roma Tor Vergata CALCOLO NUMERICO e PROGRAMMAZIONE http://www.mat.uniroma2.it/ pelosi/ EQUAZIONI non LINEARI p.1/44 EQUAZIONI

Dettagli

Sistemi di supporto alle decisioni

Sistemi di supporto alle decisioni Sistemi di supporto alle decisioni Introduzione I sistemi di supporto alle decisioni, DSS (decision support system), sono strumenti informatici che utilizzano dati e modelli matematici a supporto del decision

Dettagli

Cos è la Businèss Intèlligèncè

Cos è la Businèss Intèlligèncè Cos è la Businèss Intèlligèncè di Alessandro Rezzani Il sistema informativo aziendale... 2 Definizione di Business Intelligence... 6 Il valore della Business Intelligence... 7 La percezione della Business

Dettagli

SCHEDA DI PROGRAMMAZIONE DELLE ATTIVITA EDUCATIVE DIDATTICHE. Disciplina: Matematica Classe: 5A sia A.S. 2014/15 Docente: Rosito Franco

SCHEDA DI PROGRAMMAZIONE DELLE ATTIVITA EDUCATIVE DIDATTICHE. Disciplina: Matematica Classe: 5A sia A.S. 2014/15 Docente: Rosito Franco Disciplina: Matematica Classe: 5A sia A.S. 2014/15 Docente: Rosito Franco ANALISI DI SITUAZIONE - LIVELLO COGNITIVO La classe ha dimostrato fin dal primo momento grande attenzione e interesse verso gli

Dettagli

ALGEBRA: LEZIONI DAL 13 OTTOBRE AL 3 NOVEMBRE

ALGEBRA: LEZIONI DAL 13 OTTOBRE AL 3 NOVEMBRE ALGEBRA: LEZIONI DAL 13 OTTOBRE AL 3 NOVEMBRE 1 DIPENDENZA E INDIPENDENZA LINEARE Se ho alcuni vettori v 1, v 2,, v n in uno spazio vettoriale V, il sottospazio 1 W = v 1,, v n di V da loro generato è

Dettagli

Accuratezza di uno strumento

Accuratezza di uno strumento Accuratezza di uno strumento Come abbiamo già accennato la volta scora, il risultato della misurazione di una grandezza fisica, qualsiasi sia lo strumento utilizzato, non è mai un valore numerico X univocamente

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo

CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo CAPITOLO 8 Tecnologie dell informazione e controllo Agenda Evoluzione dell IT IT, processo decisionale e controllo Sistemi di supporto al processo decisionale Sistemi di controllo a feedback IT e coordinamento

Dettagli

www.bistrategy.it In un momento di crisi perché scegliere di investire sulla Business Intelligence?

www.bistrategy.it In un momento di crisi perché scegliere di investire sulla Business Intelligence? In un momento di crisi perché scegliere di investire sulla Business Intelligence? Cos è? Per definizione, la Business Intelligence è: la trasformazione dei dati in INFORMAZIONI messe a supporto delle decisioni

Dettagli

BUSINESS INTELLIGENCE & PERFORMANCE MANAGEMENT

BUSINESS INTELLIGENCE & PERFORMANCE MANAGEMENT BUSINESS INTELLIGENCE & PERFORMANCE MANAGEMENT BOLOGNA BUSINESS school Dal 1088, studenti da tutto il mondo vengono a studiare a Bologna dove scienza, cultura e tecnologia si uniscono a valori, stile di

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

COME FRODE. la possibilità propri dati. brevissimo. Reply www.reply.eu

COME FRODE. la possibilità propri dati. brevissimo. Reply www.reply.eu FRAUD MANAGEMENT. COME IDENTIFICARE E COMB BATTERE FRODI PRIMA CHE ACCADANO LE Con una visione sia sui processi di business, sia sui sistemi, Reply è pronta ad offrire soluzioni innovative di Fraud Management,

Dettagli

IBM Cognos 8 BI Midmarket Reporting Packages Per soddisfare tutte le vostre esigenze di reporting restando nel budget

IBM Cognos 8 BI Midmarket Reporting Packages Per soddisfare tutte le vostre esigenze di reporting restando nel budget Data Sheet IBM Cognos 8 BI Midmarket Reporting Packages Per soddisfare tutte le vostre esigenze di reporting restando nel budget Panoramica Le medie aziende devono migliorare nettamente le loro capacità

Dettagli

IT FOR BUSINESS AND FINANCE

IT FOR BUSINESS AND FINANCE IT FOR BUSINESS AND FINANCE Business Intelligence Siena 14 aprile 2011 AGENDA Cos è la Business Intelligence Terminologia Perché la Business Intelligence La Piramide Informativa Macro Architettura Obiettivi

Dettagli

Applicazioni dell'analisi in più variabili a problemi di economia

Applicazioni dell'analisi in più variabili a problemi di economia Applicazioni dell'analisi in più variabili a problemi di economia La diversità tra gli agenti economici è alla base della nascita dell attività economica e, in generale, lo scambio di beni e servizi ha

Dettagli

Stefano Bonetti Framework per la valutazione progressiva di interrogazioni di localizzazione

Stefano Bonetti Framework per la valutazione progressiva di interrogazioni di localizzazione Analisi del dominio: i sistemi per la localizzazione Definizione e implementazione del framework e risultati sperimentali e sviluppi futuri Tecniche di localizzazione Triangolazione Analisi della scena

Dettagli

Da una a più variabili: derivate

Da una a più variabili: derivate Da una a più variabili: derivate ( ) 5 gennaio 2011 Scopo di questo articolo è di evidenziare le analogie e le differenze, relativamente al calcolo differenziale, fra le funzioni di una variabile reale

Dettagli

Capitolo 9: PROPAGAZIONE DEGLI ERRORI

Capitolo 9: PROPAGAZIONE DEGLI ERRORI Capitolo 9: PROPAGAZIOE DEGLI ERRORI 9.1 Propagazione degli errori massimi ella maggior parte dei casi le grandezze fisiche vengono misurate per via indiretta. Il valore della grandezza viene cioè dedotto

Dettagli

Principal Component Analysis (PCA)

Principal Component Analysis (PCA) Principal Component Analysis (PCA) Come evidenziare l informazione contenuta nei dati S. Marsili-Libelli: Calibrazione di Modelli Dinamici pag. Perche PCA? E un semplice metodo non-parametrico per estrarre

Dettagli

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys.

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys. METODO DEI MINIMI QUADRATI GIUSEPPE GIUDICE Sommario Il metodo dei minimi quadrati è trattato in tutti i testi di statistica e di elaborazione dei dati sperimentali, ma non sempre col rigore necessario

Dettagli

Energy Data Management System (EDMS): la soluzione software per una gestione efficiente dell energia secondo lo standard ISO 50001

Energy Data Management System (EDMS): la soluzione software per una gestione efficiente dell energia secondo lo standard ISO 50001 Energy Data Management System (EDMS): la soluzione software per una gestione efficiente dell energia secondo lo standard ISO 50001 Oggi più che mai, le aziende italiane sentono la necessità di raccogliere,

Dettagli

white paper La Process Intelligence migliora le prestazioni operative del settore assicurativo

white paper La Process Intelligence migliora le prestazioni operative del settore assicurativo white paper La Process Intelligence migliora le prestazioni operative del settore assicurativo White paper La Process Intelligence migliora le prestazioni operative del settore assicurativo Pagina 2 Sintesi

Dettagli

di4g: Uno strumento di clustering per l analisi integrata di dati geologici

di4g: Uno strumento di clustering per l analisi integrata di dati geologici di4g: Uno strumento di clustering per l analisi integrata di dati geologici Alice Piva 1, Giacomo Gamberoni 1, Denis Ferraretti 1, Evelina Lamma 2 1 intelliware snc, via J.F.Kennedy 15, 44122 Ferrara,

Dettagli

White Paper. Operational DashBoard. per una Business Intelligence. in real-time

White Paper. Operational DashBoard. per una Business Intelligence. in real-time White Paper Operational DashBoard per una Business Intelligence in real-time Settembre 2011 www.axiante.com A Paper Published by Axiante CAMBIARE LE TRADIZIONI C'è stato un tempo in cui la Business Intelligence

Dettagli

su web che riportano documentazione e software dedicati agli argomenti trattati nel libro, riportandone, alla fine dei rispettivi capitoli, gli

su web che riportano documentazione e software dedicati agli argomenti trattati nel libro, riportandone, alla fine dei rispettivi capitoli, gli Prefazione Non è facile definire che cosa è un problema inverso anche se, ogni giorno, facciamo delle operazioni mentali che sono dei metodi inversi: riconoscere i luoghi che attraversiamo quando andiamo

Dettagli

REALIZZARE UN MODELLO DI IMPRESA

REALIZZARE UN MODELLO DI IMPRESA REALIZZARE UN MODELLO DI IMPRESA - organizzare e gestire l insieme delle attività, utilizzando una piattaforma per la gestione aziendale: integrata, completa, flessibile, coerente e con un grado di complessità

Dettagli

Business Intelligence: dell impresa

Business Intelligence: dell impresa Architetture Business Intelligence: dell impresa Silvana Bortolin Come organizzare la complessità e porla al servizio dell impresa attraverso i sistemi di Business Intelligence, per creare processi organizzativi

Dettagli

1 Definizione: lunghezza di una curva.

1 Definizione: lunghezza di una curva. Abstract Qui viene affrontato lo studio delle curve nel piano e nello spazio, con particolare interesse verso due invarianti: la curvatura e la torsione Il primo ci dice quanto la curva si allontana dall

Dettagli

Prof. Like you. Prof. Like you. Tel. +39 075 801 23 18 / Fax +39 075 801 29 01. Email info@zerounoinformatica.it / Web www.hottimo.

Prof. Like you. Prof. Like you. Tel. +39 075 801 23 18 / Fax +39 075 801 29 01. Email info@zerounoinformatica.it / Web www.hottimo. Pag. 1/7 Prof. Like you Tel. +39 075 801 23 18 / Fax +39 075 801 29 01 Email / Web / Social Pag. 2/7 hottimo.crm Con CRM (Customer Relationship Management) si indicano tutti gli aspetti di interazione

Dettagli

Grandi dimensioni e dimensioni variabili

Grandi dimensioni e dimensioni variabili Grandi dimensioni e dimensioni variabili aprile 2012 1 Questo capitolo studia alcuni ulteriori aspetti importanti e caratteristici della gestione delle dimensioni in particolare, delle grandi dimensioni

Dettagli

STUDIO DI SETTORE SM43U

STUDIO DI SETTORE SM43U ALLEGATO 3 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SM43U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

Utilizzato con successo nei più svariati settori aziendali, con Passepartout Mexal BP ogni utente può disporre di funzionalità

Utilizzato con successo nei più svariati settori aziendali, con Passepartout Mexal BP ogni utente può disporre di funzionalità PASSEPARTOUT MEXAL BP è una soluzione gestionale potente e completa per le imprese che necessitano di un prodotto estremamente flessibile, sia dal punto di vista tecnologico sia funzionale. Con più di

Dettagli

La Business Intelligence

La Business Intelligence Parte 1 La Business Intelligence Capitolo 1 Cos è la Business Intelligence 1.1 Il sistema informativo aziendale Sempre la pratica dev essere edificata sopra la buona teorica. Leonardo da Vinci Le attività,

Dettagli

Pagine romane (I-XVIII) OK.qxd:romane.qxd 7-09-2009 16:23 Pagina VI. Indice

Pagine romane (I-XVIII) OK.qxd:romane.qxd 7-09-2009 16:23 Pagina VI. Indice Pagine romane (I-XVIII) OK.qxd:romane.qxd 7-09-2009 16:23 Pagina VI Prefazione Autori XIII XVII Capitolo 1 Sistemi informativi aziendali 1 1.1 Introduzione 1 1.2 Modello organizzativo 3 1.2.1 Sistemi informativi

Dettagli

Il modello metodologico del Sistema di Misurazione e Valutazione della sicurezza aziendale (MVS)

Il modello metodologico del Sistema di Misurazione e Valutazione della sicurezza aziendale (MVS) Il modello metodologico del Sistema di Misurazione e Valutazione della sicurezza aziendale (MVS) >> Il Sistema MVS permette di misurare e valutare la sicurezza aziendale (nell accezione di Security) nei

Dettagli

Le Dashboard di cui non si può fare a meno

Le Dashboard di cui non si può fare a meno Le Dashboard di cui non si può fare a meno Le aziende più sensibili ai cambiamenti stanno facendo di tutto per cogliere qualsiasi opportunità che consenta loro di incrementare il business e di battere

Dettagli

Project Management Office per centrare tempi e costi

Project Management Office per centrare tempi e costi Project Management Office per centrare tempi e costi Il Project Management Office (PMO) rappresenta l insieme di attività e strumenti per mantenere efficacemente gli obiettivi di tempi, costi e qualità

Dettagli

IV-1 Funzioni reali di più variabili

IV-1 Funzioni reali di più variabili IV- FUNZIONI REALI DI PIÙ VARIABILI INSIEMI IN R N IV- Funzioni reali di più variabili Indice Insiemi in R n. Simmetrie degli insiemi............................................ 4 2 Funzioni da R n a R

Dettagli

STUDIO DI UNA FUNZIONE

STUDIO DI UNA FUNZIONE STUDIO DI UNA FUNZIONE OBIETTIVO: Data l equazione Y = f(x) di una funzione a variabili reali (X R e Y R), studiare l andamento del suo grafico. PROCEDIMENTO 1. STUDIO DEL DOMINIO (CAMPO DI ESISTENZA)

Dettagli

Business Process Management

Business Process Management Business Process Management Comprendere, gestire, organizzare e migliorare i processi di business Caso di studio a cura della dott. Danzi Francesca e della prof. Cecilia Rossignoli 1 Business process Un

Dettagli

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile Problemi connessi all utilizzo di un numero di bit limitato Abbiamo visto quali sono i vantaggi dell utilizzo della rappresentazione in complemento alla base: corrispondenza biunivoca fra rappresentazione

Dettagli

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina Cosa è il DSS L elevato sviluppo dei personal computer, delle reti di calcolatori, dei sistemi database di grandi dimensioni, e la forte espansione di modelli basati sui calcolatori rappresentano gli sviluppi

Dettagli

dal Controllo di Gestione alla Business Intelligence

dal Controllo di Gestione alla Business Intelligence dal Controllo di Gestione alla strumenti strategici per la gestione delle imprese Giovanni Esposito Bergamo, 29 Ottobre 2012 dal Controllo di Gestione alla 25/10/2012 1 Agenda 14:00 Benvenuto Il Sistema

Dettagli

I.Stat Guida utente Versione 1.7 Dicembre 2010

I.Stat Guida utente Versione 1.7 Dicembre 2010 I.Stat Guida utente Versione 1.7 Dicembre 2010 1 Sommario INTRODUZIONE 3 I concetti principali di I.Stat 4 Organizzazione dei dati 4 Ricerca 5 GUIDA UTENTE 6 Per iniziare 6 Selezione della lingua 7 Individuazione

Dettagli

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera L. De Giovanni AVVERTENZA: le note presentate di seguito non hanno alcuna pretesa di completezza, né hanno lo scopo di sostituirsi

Dettagli

Consideriamo due polinomi

Consideriamo due polinomi Capitolo 3 Il luogo delle radici Consideriamo due polinomi N(z) = (z z 1 )(z z 2 )... (z z m ) D(z) = (z p 1 )(z p 2 )... (z p n ) della variabile complessa z con m < n. Nelle problematiche connesse al

Dettagli

Data warehouse.stat Guida utente

Data warehouse.stat Guida utente Data warehouse.stat Guida utente Versione 3.0 Giugno 2013 1 Sommario INTRODUZIONE 3 I concetti principali 4 Organizzazione dei dati 4 Ricerca 5 Il browser 5 GUIDA UTENTE 6 Per iniziare 6 Selezione della

Dettagli

Analisi termografica su celle litio-ione sottoposte ad esperienze di "second life" Francesco D'Annibale, Francesco Vellucci. Report RdS/PAR2013/191

Analisi termografica su celle litio-ione sottoposte ad esperienze di second life Francesco D'Annibale, Francesco Vellucci. Report RdS/PAR2013/191 Agenzia nazionale per le nuove tecnologie, l energia e lo sviluppo economico sostenibile MINISTERO DELLO SVILUPPO ECONOMICO Analisi termografica su celle litio-ione sottoposte ad esperienze di "second

Dettagli

Evoluzione competitiva dei controlli in produzione nelle filiere dei mezzi di trasporto. Torino, Centro Congressi Lingotto 14 15 aprile 2010

Evoluzione competitiva dei controlli in produzione nelle filiere dei mezzi di trasporto. Torino, Centro Congressi Lingotto 14 15 aprile 2010 Evoluzione competitiva dei controlli in produzione nelle filiere dei mezzi di trasporto INDICI E PIANI DI PROCESS CAPABILITY Prof. Biagio Palumbo (Università di Napoli Federico II - Dipartimento Ingegneria

Dettagli

LE FUNZIONI MATEMATICHE

LE FUNZIONI MATEMATICHE ALGEBRA LE FUNZIONI MATEMATICHE E IL PIANO CARTESIANO PREREQUISITI l l l l l conoscere il concetto di insieme conoscere il concetto di relazione disporre i dati in una tabella rappresentare i dati mediante

Dettagli

STATISTICHE DOCUMENTI PMV IN SOL

STATISTICHE DOCUMENTI PMV IN SOL STATISTICHE DOCUMENTI PMV IN SOL INTRODUZIONE A cura del Coordinamento del Polo regionale del Veneto Vicenza, 12 ottobre 2011 PREMESSA Le istruzioni fornite nel 2010 per la compilazione del PMV riferito

Dettagli

Piazza delle Imprese alimentari. Viale delle Manifatture. Via della Produzione

Piazza delle Imprese alimentari. Viale delle Manifatture. Via della Produzione Piazza delle Imprese alimentari Viale delle Manifatture Via della Produzione PASSEPARTOUT MEXAL è una soluzione gestionale potente e completa per le imprese che necessitano di un prodotto estremamente

Dettagli

QUADERNI DI DIDATTICA

QUADERNI DI DIDATTICA Department of Applied Mathematics, University of Venice QUADERNI DI DIDATTICA Tatiana Bassetto, Marco Corazza, Riccardo Gusso, Martina Nardon Esercizi sulle funzioni di più variabili reali con applicazioni

Dettagli

Quando troncare uno sviluppo in serie di Taylor

Quando troncare uno sviluppo in serie di Taylor Quando troncare uno sviluppo in serie di Taylor Marco Robutti October 13, 2014 Lo sviluppo in serie di Taylor di una funzione è uno strumento matematico davvero molto utile, e viene spesso utilizzato in

Dettagli

IT FINANCIAL MANAGEMENT

IT FINANCIAL MANAGEMENT IT FINANCIAL MANAGEMENT L IT Financial Management è una disciplina per la pianificazione e il controllo economico-finanziario, di carattere sia strategico sia operativo, basata su un ampio insieme di metodologie

Dettagli

Esercizi svolti sui numeri complessi

Esercizi svolti sui numeri complessi Francesco Daddi - ottobre 009 Esercizio 1 Risolvere l equazione z 1 + i = 1. Soluzione. Moltiplichiamo entrambi i membri per 1 + i in definitiva la soluzione è z 1 + i 1 + i = 1 1 + i z = 1 1 i. : z =

Dettagli

L evoluzione del software per l azienda moderna. Gestirsi / Capirsi / Migliorarsi

L evoluzione del software per l azienda moderna. Gestirsi / Capirsi / Migliorarsi IL GESTIONALE DEL FUTURO L evoluzione del software per l azienda moderna Gestirsi / Capirsi / Migliorarsi IL MERCATO ITALIANO L Italia è rappresentata da un numero elevato di piccole e medie aziende che

Dettagli

SYSKOPLAN REPLY IMPLEMENTA PER IL GRUPPO INDUSTRIALE SCHOTT UNA SOLUZIONE SAP CRM SU BASE SAP HANA E OPERATIVA IN 35 PAESI.

SYSKOPLAN REPLY IMPLEMENTA PER IL GRUPPO INDUSTRIALE SCHOTT UNA SOLUZIONE SAP CRM SU BASE SAP HANA E OPERATIVA IN 35 PAESI. SYSKOPLAN REPLY IMPLEMENTA PER IL GRUPPO INDUSTRIALE SCHOTT UNA SOLUZIONE SAP CRM SU BASE SAP HANA E OPERATIVA IN 35 PAESI. Come gruppo industriale tecnologico leader nel settore del vetro e dei materiali

Dettagli

Presentazione di alcuni casi di successo. Paolo Piffer 28 Maggio 2007

Presentazione di alcuni casi di successo. Paolo Piffer 28 Maggio 2007 Presentazione di alcuni casi di successo Paolo Piffer 28 Maggio 2007 AZIENDA 1 DEL SETTORE CERAMICO Il problema presentato L azienda voleva monitorare il fatturato in raffronto ai 2 anni precedenti tenendo

Dettagli

CONSIGLIO NAZIONALE DEI DOTTORI COMMERCIALISTI E CONSIGLIO NAZIONALE DEI RAGIONIERI

CONSIGLIO NAZIONALE DEI DOTTORI COMMERCIALISTI E CONSIGLIO NAZIONALE DEI RAGIONIERI CONSIGLIO NAZIONALE DEI DOTTORI COMMERCIALISTI E CONSIGLIO NAZIONALE DEI RAGIONIERI COMMISSIONE PARITETICA PER I PRINCIPI DI REVISIONE LA COMPRENSIONE DELL IMPRESA E DEL SUO CONTESTO E LA VALUTAZIONE DEI

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

Laboratorio di Progettazione Esecutiva dell Architettura 2 Corso di Estimo a.a. 2007-08 Docente Renato Da Re Collaboratore: Barbara Bolognesi

Laboratorio di Progettazione Esecutiva dell Architettura 2 Corso di Estimo a.a. 2007-08 Docente Renato Da Re Collaboratore: Barbara Bolognesi Laboratorio di Progettazione Esecutiva dell Architettura 2 Corso di Estimo a.a. 2007-08 Docente Renato Da Re Collaboratore: Barbara Bolognesi Microeconomia venerdì 29 febbraio 2008 La struttura della lezione

Dettagli

Business Process Modeling Caso di Studio

Business Process Modeling Caso di Studio Caso di Studio Stefano Angrisano, Consulting IT Specialist December 2007 2007 IBM Corporation Sommario Perché l architettura SOA? Le aspettative del Cliente. Ambito applicativo oggetto dell introduzione

Dettagli

Strategie competitive ed assetti organizzativi nell asset management

Strategie competitive ed assetti organizzativi nell asset management Lezione di Corporate e Investment Banking Università degli Studi di Roma Tre Strategie competitive ed assetti organizzativi nell asset management Massimo Caratelli, febbraio 2006 ma.caratelli@uniroma3.it

Dettagli

Il software per la gestione smart del Call Center

Il software per la gestione smart del Call Center Connecting Business with Technology Solutions. Il software per la gestione smart del Call Center Center Group srl 1 Comunica : per la gestione intelligente del tuo call center Comunica è una web application

Dettagli

Panoramica su ITIL V3 ed esempio di implementazione del Service Design

Panoramica su ITIL V3 ed esempio di implementazione del Service Design Master Universitario di II livello in Interoperabilità Per la Pubblica Amministrazione e Le Imprese Panoramica su ITIL V3 ed esempio di implementazione del Service Design Lavoro pratico II Periodo didattico

Dettagli

2013 Skebby. Tutti i diritti riservati.

2013 Skebby. Tutti i diritti riservati. Disclaimer: "# $%&'(&)'%# *("# +,(-(&'(# *%$).(&'%#,/++,(-(&'/# 0"#.(1"0%# *(""20&3%,./40%&(# /# &%-',/# disposizione. Abbiamo fatto del nostro meglio per assicurare accuratezza e correttezza delle informazioni

Dettagli

Quali dati potremmo modificare? Impostazioni sul campionato, risultati, designazioni, provvedimenti disciplinari, statistiche e tanto ancora.

Quali dati potremmo modificare? Impostazioni sul campionato, risultati, designazioni, provvedimenti disciplinari, statistiche e tanto ancora. WCM Sport è un software che tramite un sito web ha l'obbiettivo di aiutare l'organizzazione e la gestione di un campionato sportivo supportando sia i responsabili del campionato sia gli utilizzatori/iscritti

Dettagli

Indice generale. Modulo 1 Algebra 2

Indice generale. Modulo 1 Algebra 2 Indice generale Modulo 1 Algebra 2 Capitolo 1 Scomposizione in fattori. Equazioni di grado superiore al primo 1.1 La scomposizione in fattori 2 1.2 Raccoglimento a fattor comune 3 1.3 Raccoglimenti successivi

Dettagli

Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 2014

Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 2014 Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 14 Problema 1 Punto a) Osserviamo che g (x) = f(x) e pertanto g () = f() = in quanto Γ è tangente all asse delle ascisse,

Dettagli

La piattaforma IBM Cognos

La piattaforma IBM Cognos La piattaforma IBM Cognos Fornire informazioni complete, coerenti e puntuali a tutti gli utenti, con una soluzione economicamente scalabile Caratteristiche principali Accedere a tutte le informazioni in

Dettagli

Rischio impresa. Rischio di revisione

Rischio impresa. Rischio di revisione Guida alla revisione legale PIANIFICAZIONE del LAVORO di REVISIONE LEGALE dei CONTI Formalizzazione delle attività da svolgere nelle carte di lavoro: determinazione del rischio di revisione, calcolo della

Dettagli

PLM Software. Answers for industry. Siemens PLM Software

PLM Software. Answers for industry. Siemens PLM Software Siemens PLM Software Monitoraggio e reporting delle prestazioni di prodotti e programmi Sfruttare le funzionalità di reporting e analisi delle soluzioni PLM per gestire in modo più efficace i complessi

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

I costi nel breve periodo

I costi nel breve periodo I costi di produzione e la funzione di offerta Breve e lungo periodo Il breve periodo è quell orizzonte temporale nel quale l impresa può variare solo parzialmente l impiego degli input esempio: l impresa

Dettagli

Risk management come opportunità per un nuovo welfare

Risk management come opportunità per un nuovo welfare Risk management come opportunità per un nuovo welfare Il contesto economico e sociale in cui operano i comitati Uisp condiziona la loro attività mettendoli di fronte a criticità di natura organizzativa,

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Realizzare un architettura integrata di Business Intelligence

Realizzare un architettura integrata di Business Intelligence Realizzare un architettura integrata di Business Intelligence Un sistema integrato di Business Intelligence consente all azienda customer oriented una gestione efficace ed efficiente della conoscenza del

Dettagli

Utilizzato con successo nei più svariati settori aziendali, Passepartout Mexal BP è disponibile in diverse versioni e configurazioni:

Utilizzato con successo nei più svariati settori aziendali, Passepartout Mexal BP è disponibile in diverse versioni e configurazioni: Passepartout Mexal BP è una soluzione gestionale potente e completa per le imprese che necessitano di un prodotto estremamente flessibile, sia dal punto di vista tecnologico sia funzionale. Con più di

Dettagli

CS. Cinematica dei sistemi

CS. Cinematica dei sistemi CS. Cinematica dei sistemi Dopo aver esaminato la cinematica del punto e del corpo rigido, che sono gli schemi più semplificati con cui si possa rappresentare un corpo, ci occupiamo ora dei sistemi vincolati.

Dettagli

Business Intelligence RENDE STRATEGICHE LE INFORMAZIONI

Business Intelligence RENDE STRATEGICHE LE INFORMAZIONI Business Intelligence RENDE STRATEGICHE LE INFORMAZIONI Business Intelligence RENDE STRATEGICHE LE INFORMAZIONI CSC ritiene che la Business Intelligence sia un elemento strategico e fondamentale che, seguendo

Dettagli

Affrontare il Mercato Elettronico della Pubblica Amministrazione (MePA), obbligatorio per gli acquisti pubblici con la Spending Review

Affrontare il Mercato Elettronico della Pubblica Amministrazione (MePA), obbligatorio per gli acquisti pubblici con la Spending Review Affrontare il Mercato Elettronico della Pubblica Amministrazione (MePA), obbligatorio per gli acquisti pubblici con la Spending Review Ing. Francesco Porzio Padova, 5 Giugno 2013 f.porzio@porzioepartners.it

Dettagli

Neomobile incentra l infrastruttura IT su Microsoft ALM, arrivando a 40 nuovi rilasci a settimana

Neomobile incentra l infrastruttura IT su Microsoft ALM, arrivando a 40 nuovi rilasci a settimana Storie di successo Microsoft per le Imprese Scenario: Software e Development Settore: Servizi In collaborazione con Neomobile incentra l infrastruttura IT su Microsoft ALM, arrivando a 40 nuovi rilasci

Dettagli

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE 1. EQUAZIONI Definizione: un equazione è un uguaglianza tra due espressioni letterali (cioè in cui compaiono numeri, lettere

Dettagli