Il data mining. di Alessandro Rezzani

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Il data mining. di Alessandro Rezzani"

Transcript

1 Il data mining di Alessandro Rezzani Cos è il data mining Knowledge Discovery in Databases (KDD)... 3 Lo standard CRISP-DM... 4 La preparazione dei dati... 7 Costruzione del modello... 7 Attività tipiche... 8 Valutazione del modello... 9 La matrice di confusione... 9 La curva ROC (Receiver Operating Characteristic) Lift chart Bibliografia... 14

2 Cos è il data mining. Se esaminiamo come le modalità di analisi dei dati si sono evolute negli anni, notiamo come da indagini effettuate direttamente sulle fonti operazionali, si è passati, a partire dagli anni 90, all utilizzo di una base dati creata appositamente: il data warehouse. Con il data warehouse e i database multidimensionali è possibile analizzare i dati non solo al massino livello di dettaglio, ma anche a diversi livelli di aggregazione, e, inoltre, eseguendo operazione di drill-down o slicing e dicing si ottengono dinamicamente prospettive diverse del dato. Tuttavia si tratta sempre di una visione storica, che consente soltanto una valutazione a consuntivo di ciò che è accaduto nel passato, oppure di ciò che sta accadendo ora. Più di recente, a partire dai primi anni 2000, ha cominciato ad affermarsi la necessità di effettuare analisi previsionali, per anticipare gli eventi e ottenere un vantaggio di business. La grande quantità di dati disponibili ha reso inoltre necessaria l adozione di tecniche di analisi efficienti e in grado di lavorare su valori numerici, testuali o binari (per es. le immagini). Le tecniche di analisi, a cui ci riferiamo, prendono il nome di data mining, poiché consentono di scavare nei dati ed estrarre informazioni, pattern 1 e relazioni non immediatamente identificabili e non note a priori. Il data mining può essere utilizzato in qualsiasi settore economico, per risolvere molteplici problemi di business: - Ricerca di anomalie. Il data mining può essere impiegato per l identificazione di comportamenti fraudolenti nell utilizzo di carte di credito. - Churn Analysis. La churn analysis consiste nell analisi della clientela per determinare i clienti che presentano un alta probabilità di passare alla concorrenza, al fine di intervenire in anticipo ed evitarne la migrazione. - Segmentazione della clientela. Le tecniche di segmentazione possono essere utili, per esempio, a determinare il profilo comportamentale dei clienti. Una volta identificati i segmenti di clienti simili, è possibile studiare strategie di marketing differenziate per ciascun gruppo. - Previsioni. Le analisi predittive dell andamento delle vendite, o, genericamente dell andamento di serie temporali, sono un altro degli ambiti di impiego del data mining. - Campagne pubblicitarie mirate. L utilizzo del data mining nell ambito delle campagne di marketing mirate, consente di stabilire a priori quali siano, tra i prospect, quelli con maggior probabilità di acquistare i prodotti dell azienda, in modo da impiegare su di essi le risorse del marketing. - Market basket analysis. Le tecniche di market basket analysis sono utili a suggerire, a un certo cliente, ulteriori prodotti da acquistare in base ai suoi comportamenti d acquisto abituali, oppure a definire il layout dei prodotti sugli scaffali. Il data mining comporta l utilizzo integrato di diverse discipline, come il data warehousing, la statistica, l intelligenza artificiale, le tecniche di visualizzazione, l analisi delle serie temporali e l analisi di dati geospaziali. La componente tecnologica riveste una grande importanza, poiché gli algoritmi di data mining richiedono una certa potenza di calcolo e tecniche di ottimizzazione delle performance sono essenziali, soprattutto in presenza di una mole di dati elevata. Nel processo di data mining è però la figura dell utente ad assumere un ruolo centrale: si tratta, infatti, di un processo che richiede l interazione di un esperto del business, che deve sfruttare la propria conoscenza per la preparazione dei dati, per costruzione dei modelli e per la valutazione dei risultati. La tabella seguente contiene un sunto delle caratteristiche del data mining. 1 Per pattern intendiamo una struttura, un modello, o, più in generale una rappresentazione sintetica dei dati.

3 Tabella 1 Caratteristiche del data mining. Caratteristica Scopo Ambito dei dati Ipotesi di partenza Requisiti Interazione Capacità di elaborazione Interpretazione dei risultati Descrizione Il data mining utilizza tecniche analitiche per identificare pattern nascosti nei dati. Il data mining può trattare dati qualitativi, qualitativi, testuali, immagini e suoni. Non richiede ipotesi a priori da parte del ricercatore, nemmeno sulla forma distributiva 2 delle variabili. E necessaria una buona conoscenza de business nel cui ambito si vogliono applicare le tecniche di data mining. Ciò consente la corretta valutazione e selezione dei dati di partenza rilevanti. Inoltre occorre aver pienamente compreso i requisiti e gli obiettivi che si vogliono raggiungere, al fine di poter interpretare nel modo corretto i risultati dei modelli. L analista e il sistema di data mining devono interagire al fine di produrre un modello valido. L analista sceglie i dati da analizzare, configura il sistema di data mining e valuta i risultati. Il processo può essere ripetuto per affinare il modello. Gli algoritmi sono ottimizzati per minimizzare i tempi di elaborazione anche in presenza di un numero elevato di osservazione e un numero elevato di variabili. I software i data mining offrono propongono i risultati in forma semplice, anche attraverso l uso di strumenti visuali che ne facilitano l interpretazione. Knowledge Discovery in Databases (KDD) Il data mining fa parte di un più ampio processo chiamato Knowledge Discovery in Databases (KDD) e ne rappresenta la fase più importante. Il KDD, come si evince dal nome, ha lo scopo di estrarre la conoscenza dai dati. Sappiamo che il dato è il risultato di una misurazione di un certo evento e di per sé non ha grande utilità. Tuttavia valutando i dati in un preciso contesto e applicandovi opportune elaborazioni è possibile ricavare informazioni: in questo modo il dato diventa utile e in grado di rispondere a una richiesta specifica. Tuttavia l informazione va utilizzata in modo produttivo al fine di ottenere conoscenza. La conoscenza è dunque il risultato di un percorso che parte dai dati grezzi e termina con l interpretazione e lo sfruttamento produttivo dei risultati. Il processo di KDD contiene diversi passi: 1) Selezione dei dati. E evidente come un database possa contenere nati di varia natura, che per il problema in esame possono risultare inutili. E dunque importante comprendere il dominio applicativo determinato dagli obiettivi dell utente finale. 2) Preelaborazione. Dopo aver ridotto l ambito dei dati da considerare, è comunque poco opportuno analizzarli per intero, poiché la quantità di dati potrebbe essere ancora molto elevata. Può essere conveniente estrarre un campione e analizzare soltanto quello. Inoltre nella fase di preelaborazione rientrano le attività di pulizia dei dati e di definizione del trattamento dei dati mancanti. Teniamo in 2 Le tecniche statistiche richiedono quasi sempre di formulare ipotesi sulla distribuzione delle variabili esaminate.

4 considerazione, però, che, se i dati provengono dal data warehouse, molte le operazioni di pulizia dovrebbero essere già state messe in opera nella fase di ETL. 3) Trasformazione. Le trasformazioni possono riguardare cambiamenti nei tipi di dato (da numero a stringa, per esempio), la discretizzazione di valori continui, oppure la normalizzazione dei valori. 4) Data Mining. La fase di data mining vede la determinazione dell algoritmo da utilizzare, la costruzione e il testing di un modello. 5) Interpretazione dei risultati.i risultati del modello di data mining evidenzia dei pattern nascosti nei dati: occorre però valutare se essi sono utili e possono apportare un beneficio per il business. Figura 1 Il processo di KDD. Lo standard CRISP-DM CRISP-DM, che sta per Cross Industry Standard Process for Data Mining è un metodo di comprovata efficacia per l implementazione di un processo di data mining. I lavori di definizione dello standard prendono avvio nel 1996 come iniziativa finanziata dall Unione Europea e portata avanti da un consorzio di quattro società: SPSS, NCR Corporation, Daimler-Benz e OHRA. La prima versione della metodologia vede la luce nel 1999, mentre nel 2006 iniziano i lavori per definire lo standard CRISP-DM 2.0. Tuttavia, la seconda versione non ha mai visto la luce e nessun tipo di attività o comunicazione è più pervenuta dal gruppo di lavoro dal 2007, tant è che anche il sito web non è più attivo da parecchio tempo. Nonostante questo la metodologia CRISP-DM è valida ed è stata largamente adottata dalle aziende che hanno affrontato progetti di data mining.

5 Il presupposto della metodologia risiede nella volontà di rendere il processo di data mining affidabile e utilizzabile da persone con pochi skill in materia, ma con elevata conoscenza del business. La metodologia fornisce un framework che prevede sei fasi, che possono essere ripetute ciclicamente con l obiettivo di revisionare e rifinire il modello previsionale: - Business Understanding - Data Understanding - Data Preparation - Modeling - Evaluation - Deployment La figura che segue mostra l intero processo. Figura 2 Metodologia CRISP-DM. Ciascuna delle fasi si articola in più punti, illustrati nella tabella seguente. Tabella 2 Punti della metodologia CRISP-DM Determinazione degli obiettivi di business Assessment della situazione attuale Business Understanding La comprensione delle problematiche del business e degli obiettivi aziendali è necessaria al fine di poter creare un modello di data mining adeguato. Le attività di assessment riguardano tipicamente: Inventario delle risorse Requisiti, presupposti e vincoli Rischi e imprevisti

6 Determinazione degli obiettivi del processo di data mining Creazione del piano di progetto Identificazione e recupero dei dati Esplorazione e descrizione dei dati Verifica della qualità Selezione dei dati Pulizia dei dati, integrazione e formattazione Costruzione dei dati Selezione dell algoritmo Creazione del modello Valutazione dei risultati Analisi dei costi/benefici La costruzione del modello e la scelta degli algoritmi di calcolo dipendono anche dagli obiettivi che il sistema dovrebbe raggiungere; in altre parole è necessario interpretare in maniera corretta i requisiti dell utente. Già nella prima fase, una volta capiti gli obiettivi, è possibile predisporre il piano di sviluppo del progetto di data mining. Data understanding 3 In base a quanto determinato con la fase precedente, occorre identificare quali sono i dati rilevanti per la creazione del modello. La metodologia prevede per questa fase la creazione di un report che evidenzi le caratteristiche delle fonti dati e i criteri di scelta. I dati devono essere analizzati e descritti attraverso un report L attività di esplorazione e descrizione dei dati deve essere completata con la verifica della qualità. Devono essere indentificati i dati mancanti, le situazioni anomale (i cosiddetti outliers, ecc.) Data Preparation I dati identificati come pertinenti nel punto precedente, sono ulteriormente soggetti a selezione, poiché occorre individuare le singole tabelle e i singoli campi da utilizzare nel modello di data mining La preparazione del data set da utilizzare per la costruzione del modello di data mining prevede un attività di pulizia dei dati, qualora la verifica della qualità avesse evidenziato problemi. Oltre a questo, potrebbe essere utile integrare il data set con dati provenienti da fonti esterne. La costruzione dei dati consiste nella creazione di campi calcolati che saranno utilizzati come attributi d analisi nei modelli di data mining. Modeling Come vedremo esistono spesso più algoritmi che si adattano ad un determinato problema di data mining. In questa fase occorre identificare quali sono gli algoritmi corretti, e decidere se costruire un modello per ciascuno di essi. Occorre tener presente che alcuni algoritmi richiedono i dati in specifici formati, perciò è spesso necessario ritornare alla fase di preparazione dei dati, prima di proseguire con la creazione del modello. La creazione del modello consiste nell impostazione dei parametri dell algoritmo e nella loro calibrazione sulla base dei dati. Evaluation Il modello deve valutato attraverso un insieme di dati di test. Se i risultati non sono soddisfacenti occorrerà riconsiderare l attività di modellazione oppure l attività di preparazione dei dati. 3 Notiamo che, a parte la scelta dei dati rilevanti, il resto delle operazioni dovrebbe già essere parte del sistema di Business Intelligence.

7 Revisione del processo Decisione sull utilizzo del modello Pianificazione del deployment Manutenzione e verifiche Revisione finale Una volta eseguita la valutazione del modello, è bene, anche in caso di risultati positivi, ricontrollare tutte le fasi del processo, soprattutto per indentificare eventuali omissioni di regole di business e per verificare la congruità dei risultati con gli obiettivi stabiliti. A questo punto è possibile decidere se utilizzare i risultati del modello nel processo di KDD, procedendo quindi con il deployment agli utenti. Deployment La fase di deployment include anche l integrazione del modello con i sistemi esistenti. Inoltre la raccolta dati, la loro preparazione e l elaborazione attraverso il modello devono essere automatizzati. Nel definire le attività di deployment occorre programmare anche l attività di manutenzione. La fase di deployment si conclude con la documentazione dell intero processo e con una revisione finale con il coinvolgimento degli utenti. La metodologia CRISP-DM ha il vantaggio di essere applicabile a qualsiasi ramo di attività e di essere indipendente dallo strumento software utilizzato. Inoltre è strettamente collegata al modello d azione della KDD. Nei paragrafi che seguono approfondiremo i punti principali relativi alla costruzione e alla valutazione di un modello di data mining. In particolare vedremo gli aspetti di preparazione dei dati, di scelta dell algoritmo e di valutazione dei risultati. La preparazione dei dati La preparazione dei dati assume un ruolo cruciale nel processo di data mining, poiché essa può influenzare in maniera sostanziale la bontà dei modelli. Il primo aspetto da considerare riguarda la qualità dei dati. Se supponiamo che i dati da utilizzare per il data mining arrivino dal data warehouse, allora possiamo dare per scontato che il processo di pulizia, integrazione e uniformazione dei dati sia già stato compiuto. Se così non fosse, occorre valutare il grado di affidabilità e completezza dei dati e porre rimedio ai problemi di qualità, pena la costruzione di modelli destinati ad essere completamente inefficaci. Esiste poi un problema legato ai valori mancanti degli attributi, che, in parte può essere sanato nel data warehouse attraverso l integrazione diverse fonti, anche esterne all azienda (si pensi all acquisto di dati demografici o relativi al territorio da banche dati specializzate). Accade però che per alcuni attributi non sia sempre possibile ottenere un valore. In questo caso, nel data warehouse, invece di presentare un valore NULL, si utilizzerà un valore di default che indica la mancanza del dato, ma questa soluzione non è ottimale per il data mining ed è da gestire al momento della preparazione dei dati. Alcuni algoritmi richiedono che i dati siano trasformati, di solito attraverso operazioni di vario genere: normalizzazioni, riduzione del numero di attributi, riclassificazione dei valori di un attributo. Costruzione del modello La costruzione del modello di data mining si articola su più fasi:

8 - La scelta dell algoritmo di calcolo. Essa è basata sull analisi del problema di data mining da risolvere. Il paragrafo che segue fornisce una descrizione dei più comuni algoritmi e delle situazioni alle quali essi si adattano. - Il completamento della fase di preparazione dei dati. Qualora l algoritmo richieda elaborazioni particolari, è necessario ultimare la fase di preparazione dei dati, con le tecniche che abbiamo trattato nel paragrafo precedente. - La scelta dei parametri base di configurazione dell algoritmo. - La suddivisione dei dati disponibili in training set e test set. Nel costruire un modello di data mining occorre operare una suddivisione dei dati disponibili in due insiemi: uno, contenente un ampia percentuale dei dati, costituisce il training set, cioè l insieme dei dati su cui l algoritmo scelto è calibrato. L altro rappresenta il test set, cioè l insieme di dati su cui si eseguirà il test del modello per verificarne la bontà. Il test set ovviamente contiene anche l attributo o gli attributi che sono il risultato dell attività predittiva del modello. In questo modo sarà possibile confrontare i dati reali con quelli previsti ed eseguire così una valutazione. La suddivisione in training set e test set dovrebbe avvenire mantenendo la stessa distribuzione degli attributi in entrambi gli insiemi di elementi, in modo che essi siano ugualmente rappresentativi. - L avvio della fase di training dell algoritmo. Nella fase di training l algoritmo analizza le relazioni nascoste nei dati e imposta il modello di data mining. Molto spesso è necessario ripetere più volte il processo di costruzione del modello al fine di provare algoritmi alternativi oppure di operare aggiustamenti sui parametri, o sulle trasformazioni del data set. Attività tipiche Le attività che tipicamente sono oggetto di un processo di data mining sono raggruppabili in categorie. Per ciascuna categoria è possibile individuare uno o più algoritmi di data mining che meglio si prestano a risolvere il problema. La tabella presenta una categorizzazione dei problemi di data mining, una breve descrizione e gli algoritmi più adatti a ciascuna categoria. Tabella 3 Problemi e algoritmi. Problema Esempio Algoritmo Stima di un attributo discreto: in questo caso si tratta di predire il valore di un particolare attributo sulla base dei valori degli altri attributi. Stimare se il destinatario di una campagna di mailing diretto acquisterà un prodotto, sulla base di dati anagrafici e comportamentali di vario genere. Decision Trees Bayesian classifier Clustering Neural Network Stima di un attributo continuo. Stimare le vendite dell'anno successivo Time Series Neural Network Ricerca di gruppi di elementi comuni nelle transazioni. Utilizzare analisi di mercato sugli acquisti per suggerire a un cliente ulteriori prodotti da acquistare. Association Rules Decision Trees

9 Ricerca di gruppi di elementi simili. Segmentare i dati demografici in gruppi, con comportamenti d acquisto simili Clustering Ricerca di anomalie nei dati Per esempio la ricerca di utilizzi fraudolenti di strumenti di pagamento, come le carte di credito. Clustering Valutazione del modello Con qualsiasi algoritmo la si realizzi, una delle operazioni più frequenti nel data mining è la classificazione: dato un certo numero di elementi che appartengono a classi diverse, ciò che vogliamo ottenere è un modello che assegni ciascun elemento alla classe corretta. Per esempio, può essere utile, prima di iniziare una campagna di vendita, classificare i prospect in due classi: quella dei probabili acquirenti e quella dei non acquirenti, in modo da concentrare gli sforzi soltanto sulla prima classe. Nell implementare un qualsiasi modello, abbiamo visto come sia necessario suddividere i dati in due insiemi: il training set e il test set. Entrambi gli insiemi devono contenere gli elementi con la corretta classificazione; il training set sarà utilizzato per la calibrazione dei parametri del modello, mentre il test set per valutare i risultati del classificatore. Teniamo sempre presente che è praticamente impossibile costruire un modello di classificazione perfetto, e che dovremo accontentarci di un modello sub ottimale. La scelta del modello da utilizzare avviene selezionando il migliore da un insieme di modelli calibrati e testati, costruiti con algoritmi e con parametri differenti. E chiara dunque la necessità di uno strumento che ci permetta di valutare la bontà di un modello e che ci permetta di confrontarlo con altri, al fine di poter scegliere tra essi il più efficace. Molti problemi di classificazione possono essere ricondotti a una classificazione binaria, cioè con sole due opzioni, dove una classe è detta classe positiva e l altra è chiamata classe negativa. Nel nostro esempio della campagna di marketing, la classe positiva è quella dei possibili acquirenti, mentre la classe negativa è rappresentata dai non acquirenti. Descriviamo i metodi per la valutazione dei modelli. La matrice di confusione La performance di un modello è determinata dal numero di predizioni corrette o, per contro, dal numero di errori di predizione. Una prima metrica per la valutazione del modello è rappresentata dalla cosiddetta matrice di confusione il cui generico elemento E ij rappresenta il numero di elementi della classe i-esima che il modello assegna, erroneamente, alla classe j-esima. Come esempio, poniamo di dover rappresentare attraverso la matrice di confusione le previsioni di un modello di classificazione dei possibili acquirenti. I dati del modello, eseguito sul test set sono inclusi nella tabella che segue. Tabella 4 Esempio di risultati di un test. Codice cliente Dato reale Previsione

10 1 Acquirente_SI Acquirente_SI 2 Acquirente_NO Acquirente_NO 3 Acquirente_NO Acquirente_NO 4 Acquirente_SI Acquirente_SI 5 Acquirente_SI Acquirente_SI 6 Acquirente_NO Acquirente_SI 7 Acquirente_NO Acquirente_NO 8 Acquirente_SI Acquirente_SI 9 Acquirente_NO Acquirente_SI 10 Acquirente_SI Acquirente_NO In questo caso la matrice di confusione è data da: Dati Reali Acquirente_SI Acquirente_SI 4 (VERI POSITIVI) Acquirente_NO 2 (FALSI POSITIVI) Predizione Acquirente_NO 1 (FALSI NEGATIVI) 3 (VERI NEGATIVI) Nella matrice di confusione abbiamo quattro quadranti che esprimono: - I veri positivi (VP), cioè i veri acquirenti, classificati come tali. - I falsi positivi (FP), cioè i non acquirenti, classificati come acquirenti dal modello. - I veri negativi (VN), cioè i non acquirenti correttamente classificati. - I falsi negativi (FN), cioè gli acquirenti, classificati come non acquirenti dal modello. Inoltre abbiamo che il numero totale di positivi è dato da P=VP+FN e che il numero totale di negativi è dato da N=FP+VN Dalla matrice possiamo ricavare alcune misure di performance: % falsi positivi = FP/N % veri positivi = VP/P Accuratezza = (VP+VN)/(P+N) Precisione = VP/(VP+FP) Bisogna fare attenzione in particolare all interpretazione della misura di accuratezza, soprattutto nel caso di classi molto sbilanciate (solitamente questi casi sono quelli più interessanti!). Se avessimo nella realtà 999 non acquirenti reali e 1 solo acquirente reale e il modello classificasse tutti come non acquirenti, avremmo l accuratezza pari a (999+0)/(999+1) = 99.9%. In realtà a noi interesserebbe soltanto la previsione dei veri acquirenti, che non si realizzerebbe mai (almeno secondo il nostro modello). Se associamo ai quadranti della matrice di confusione un ricavo derivante dalla corretta previsione o un costo che si origina dalla mancata previsione, otteniamo una matrice di costo per ciascuno dei modelli che sviluppiamo. I modelli possono così essere confrontati non solo in base alle misure proposte poco sopra, ma anche attraverso il risultato economico derivante dalla previsione. Come esempio, associamo i seguenti

11 costi e ricavi ai quadranti della matrice, ipotizzando che, in base alle previsioni, contatteremo soltanto i potenziali clienti: - Al quadrante VP associamo un margine netto di 50 per cliente - Al quadrante FP associamo un costo di 10 per ciascun cliente contattato che non si rivela essere acquirente. - Ai quadranti FN e VN associamo un risultato economico pari a 0. Il risultato dell operazione sarebbe 4*50-2*10 = 180, mostrando quindi un risultato economico positivo a fronte dell applicazione del modello. Tuttavia il risultato è molto più significativo se utilizzato per paragonare vari modelli oppure parametrizzazioni diverse dello stesso modello, al fine di determinare quello più performante. La curva ROC (Receiver Operating Characteristic) La curva ROC è uno strumento messo a punto durante la seconda guerra mondiale dagli ingegneri che si occupavano dei radar per cercare di distinguere i segnali relativi a oggetti nemici dai segnali causati da stormi di uccelli. La curva è stata impiegata in diversi campi, tra cui vi è anche il data mining. La curva ROC è ampiamente utilizzata per valutare i risultati di un modello previsionali. Per il calcolo delle curve ROC occorre che il modello produca come output oltre alla previsione anche la probabilità di realizzazione. Ciò accade in modo nativo per modelli che utilizzano algoritmi come Naïve Bayes o reti neurali, mentre per altri algoritmi è comunque possibile calcolare la probabilità con tecniche specifiche. Solitamente se la probabilità è superiore a 0.5 allora l appartenenza ad una certa classe è vera, altrimenti è falsa. La curva, mostrata in Figura 3, è disegnata ricalcolando la percentuale di falsi positivi e la percentuale di falsi negativi spostando via via la soglia di probabilità di appartenenza da 0 a 1 a piccoli intervalli. Figura 3 Esempi di tre curve ROC che descrivono modelli con performance differenti. Nel grafico ROC, il punto (0,0) rappresenta una classificazione in cui non vi sono falsi positivi, ma nemmeno veri positivi. Il punto (0,100) indica una classificazione perfetta: 0 falsi positivi e 100% veri positivi. Il punto

12 (100,100) è il risultato di una strategia in cui tutti gli elementi sono classificati come veri positivi: così facendo il tasso di falsi positivi è massimo. Come di nota dalla figura nei grafici ROC compare una retta diagonale che unisce i punti (0,0) e (100,100). Essa rappresenta un classificatore completamente casuale: i mostri modelli dovranno per lo meno presentare una curva che stia sopra a quella del classificatore casuale. Ora, utilizziamo la formula dell accuratezza e trasformiamola attraverso semplici passaggi algebrici: Accuratezza = VP+VN P+N VP = P P+(1 FP N ) %Veri Positivi P+(1 % falsi positivi) N = P+N P+N Da questa formula si ricava che: %Veri Positivi = Accuratezza (P + N) (1 %falsi positivi) N P = N P %falsi positivi + Accuratezza (P+N) N P Se visualizziamo graficamente l equazione appena determinata otteniamo un fascio di rette parallele che rappresentano diversi livelli di accuratezza. Possiamo utilizzare la retta per determinare il punto di miglior accuratezza nel modello: esso sarà quello in cui la retta è tangente alla curva ROC, come mostrato nella figura seguente. Figura4 ROC con curva di livello dell'accuratezza. Il punto di miglior accuratezza ci dice qual è la soglia di probabilità ottimale al di sopra della quale un elemento è classificato come appartenente alla classe positiva. Dunque, se ritorniamo all esempio della campagna di marketing, dovremo utilizzare il modello in questo modo:

13 - Come prima azione, eseguiamo la classificazione dei prospect in modo da determinare gli appartenenti alla classe dei probabili acquirenti (classe positiva) - Come output del modello otteniamo anche la probabilità di assegnazione alla classe. - Determiniamo il livello della soglia di probabilità ottimale attraverso la curva ROC e l equazione delle rette di accuratezza. - Selezioniamo gli elementi che appartengono alla classe dei probabili acquirenti e la cui probabilità di appartenenza è maggiore della soglia di probabilità ottimane Lift chart Il lift chart risponde, per mezzo una rappresentazione grafica, alla domanda: selezionando, secondo un certo criterio, l x% di casi nel test set, quale percentuale dei casi di veri positivi (VP) è raggiunta? In questo tipo di grafico sull asse delle ascisse poniamo le percentuali, da 0 a 100% di elementi selezionati dal test set, scelti secondo un certo ordine (tipicamente la probabilità di appartenenza alla classe positiva). Sull asse delle ordinate compare la percentuale dei veri positivi ottenuti attraverso la selezione, sul totale dei veri positivi del test set. Figura 5 Lift chart Anche nel caso del lift chart, così come abbiamo fatto per matrice di confusione, possiamo ragionare in termini di costi e ricavi. I costi possono essere suddivisi in costi fissi e costi cariabili. I costi fissi non dipendono dal numero di elementi estratti dal campione, mentre i costi variabili sono determinati da un costo unitario da moltiplicare al numero di elementi estratti dal test set. Il ricavo è dato da un valore unitario moltiplicato per il numero di veri positivi ottenuti attraverso la selezione. Sempre considerando l esempio della campagna di marketing, potremmo avere costi fissi per la campagna, indipendenti dal numero di clienti contattati; inoltre avremo un costo per ciascun contatto effettuato e un ricavo in caso di acquisizione del cliente. Contattando prima i clienti con maggior probabilità di essere veri positivi, avremo un alta percentuale di successo, che via via diminuisce, al diminuire della probabilità. Ciò significa che il guadagno ( = ricavi - costo fisso costi variabili) tenderà ad aumentare velocemente per poi assestarsi e addirittura diminuire, poiché, con una bassa probabilità di avere un falso positivo dovremo spendere molto nei contatti, prima di ottenere un ricavo. La figura seguente mostra un Profit chart ottenuto con il Data Mining add-in per Excel di Microsoft SQL Server 2008.

14 Figura 6 Profit Chart ricavato con il Data Mining add-in per Excel di Microsoft SQL Server Il profit chart proposto nell add-in di Microsoft, offre la possibilità di specificare un costo fisso, il numero di elementi della popolazione, il costo variabile, per ciascun elemento e il ricavo unitario. In output lo strumento presenta, oltre al grafico anche una tabella con i parametri impostati, il valore del profitto massimo e la soglia di probabilità. La probabilità della classificazione, come abbiamo già detto, è utilizzata per ordinare in modo decrescente gli elementi della popolazione. Il numero proposto dall add-in di Microsoft rappresenta la soglia sotto la quale non bisogna prendere più in considerazione gli elementi. Detto in altri termini, seguendo sempre il nostro esempio di classificazione dei prospect in acquirenti e non acquirenti, se la probabilità di essere acquirente è maggiore o uguale alla Probability threshold, allora possiamo contattare il prospect, altrimenti non ne vale la pena. Bibliografia A. Rezzani, Business Intelligence. Processi, metodi, utilizzo in azienda, APOGEO, 2012 Jack E. Olsen, Data Quality: The Accuracy Dimension, Morgan Kaufmann Publishers, 2003 Tamraparni Dasu, Theodore Johnson: Exploratory Data Mining and Data Cleaning, John Wiley & Sons, 2003

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Analisi e diagramma di Pareto

Analisi e diagramma di Pareto Analisi e diagramma di Pareto L'analisi di Pareto è una metodologia statistica utilizzata per individuare i problemi più rilevanti nella situazione in esame e quindi le priorità di intervento. L'obiettivo

Dettagli

Contabilità generale e contabilità analitica

Contabilità generale e contabilità analitica 1/5 Contabilità generale e contabilità analitica La sfida della contabilità analitica è di produrre informazioni sia preventive che consuntive. Inoltre questi dati devono riferirsi a vari oggetti (prodotti,

Dettagli

STRATEGIA DI TRADING. Turning Points

STRATEGIA DI TRADING. Turning Points STRATEGIA DI TRADING Turning Points ANALISI E OBIETTIVI DA RAGGIUNGERE Studiare l andamento dei prezzi dei mercati finanziari con una certa previsione su tendenze future Analisi Tecnica: studio dell andamento

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

Uno standard per il processo KDD

Uno standard per il processo KDD Uno standard per il processo KDD Il modello CRISP-DM (Cross Industry Standard Process for Data Mining) è un prodotto neutrale definito da un consorzio di numerose società per la standardizzazione del processo

Dettagli

Domande a scelta multipla 1

Domande a scelta multipla 1 Domande a scelta multipla Domande a scelta multipla 1 Rispondete alle domande seguenti, scegliendo tra le alternative proposte. Cercate di consultare i suggerimenti solo in caso di difficoltà. Dopo l elenco

Dettagli

Automazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it

Automazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it Automazione Industriale (scheduling+mms) scheduling+mms adacher@dia.uniroma3.it Introduzione Sistemi e Modelli Lo studio e l analisi di sistemi tramite una rappresentazione astratta o una sua formalizzazione

Dettagli

Calcolo del Valore Attuale Netto (VAN)

Calcolo del Valore Attuale Netto (VAN) Calcolo del Valore Attuale Netto (VAN) Il calcolo del valore attuale netto (VAN) serve per determinare la redditività di un investimento. Si tratta di utilizzare un procedimento che può consentirci di

Dettagli

Capitolo 2. Operazione di limite

Capitolo 2. Operazione di limite Capitolo 2 Operazione di ite In questo capitolo vogliamo occuparci dell operazione di ite, strumento indispensabile per scoprire molte proprietà delle funzioni. D ora in avanti riguarderemo i domini A

Dettagli

Lezione 3: Introduzione all analisi e valutazione delle azioni. Analisi degli Investimenti 2014/15 Lorenzo Salieri

Lezione 3: Introduzione all analisi e valutazione delle azioni. Analisi degli Investimenti 2014/15 Lorenzo Salieri Lezione 3: Introduzione all analisi e valutazione delle azioni Analisi degli Investimenti 2014/15 Lorenzo Salieri Valutazione degli investimenti in azioni Intuitivamente si crea valore quando un azienda

Dettagli

LA REVISIONE LEGALE DEI CONTI La comprensione

LA REVISIONE LEGALE DEI CONTI La comprensione LA REVISIONE LEGALE DEI CONTI La comprensione dell impresa e del suo contesto e la valutazione dei rischi di errori significativi Ottobre 2013 Indice 1. La comprensione dell impresa e del suo contesto

Dettagli

SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO

SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO Descrizione Nell ambito della rilevazione dei costi, Solari con l ambiente Start propone Time&Cost, una applicazione che contribuisce a fornire

Dettagli

Ciclo di vita dimensionale

Ciclo di vita dimensionale aprile 2012 1 Il ciclo di vita dimensionale Business Dimensional Lifecycle, chiamato anche Kimball Lifecycle descrive il framework complessivo che lega le diverse attività dello sviluppo di un sistema

Dettagli

Data Mining a.a. 2010-2011

Data Mining a.a. 2010-2011 Data Mining a.a. 2010-2011 Docente: mario.guarracino@cnr.it tel. 081 6139519 http://www.na.icar.cnr.it/~mariog Informazioni logistiche Orario delle lezioni A partire dall 19.10.2010, Martedì h: 09.50 16.00

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

COME SVILUPPARE UN EFFICACE PIANO DI INTERNET MARKETING

COME SVILUPPARE UN EFFICACE PIANO DI INTERNET MARKETING Febbraio Inserto di Missione Impresa dedicato allo sviluppo pratico di progetti finalizzati ad aumentare la competitività delle imprese. COME SVILUPPARE UN EFFICACE PIANO DI INTERNET MARKETING COS E UN

Dettagli

Appendice III. Competenza e definizione della competenza

Appendice III. Competenza e definizione della competenza Appendice III. Competenza e definizione della competenza Competenze degli psicologi Lo scopo complessivo dell esercizio della professione di psicologo è di sviluppare e applicare i principi, le conoscenze,

Dettagli

IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE

IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE 51 Dichiarazione d intenti (mission statement) La dichiarazione d intenti ha il compito di stabilire degli obiettivi dal punto di vista del mercato, e in parte dal

Dettagli

UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI

UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI Un utilizzatore a valle di sostanze chimiche dovrebbe informare i propri fornitori riguardo al suo utilizzo delle sostanze (come tali o all

Dettagli

ROI, WACC e EVA: strumenti di pianificazione economico finanziaria Di : Pietro Bottani Dottore Commercialista in Prato

ROI, WACC e EVA: strumenti di pianificazione economico finanziaria Di : Pietro Bottani Dottore Commercialista in Prato Articolo pubblicato sul n 22 / 2004 di Amministrazione e Finanza edito da Ipsoa. ROI, WACC e EVA: strumenti di pianificazione economico finanziaria Di : Pietro Bottani Dottore Commercialista in Prato Premessa

Dettagli

La riforma del servizio di distribuzione del

La riforma del servizio di distribuzione del CReSV Via Röntgen, 1 Centro Ricerche su Sostenibilità e Valore 20136 Milano tel +39 025836.3626 La riforma del servizio di distribuzione del 2013 gas naturale In collaborazione con ASSOGAS Gli ambiti territoriali

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Marketing relazionale

Marketing relazionale Marketing relazionale Introduzione Nel marketing intelligence assume particolare rilievo l applicazione di modelli predittivi rivolte a personalizzare e rafforzare il legame tra azienda e clienti. Un azienda

Dettagli

REGOLAZIONE (E TASSAZIONE OTTIMALE) DI UN MONOPOLIO CON PIÙ LINEE DI PRODUZIONE

REGOLAZIONE (E TASSAZIONE OTTIMALE) DI UN MONOPOLIO CON PIÙ LINEE DI PRODUZIONE REGOLAZIONE (E TASSAZIONE OTTIMALE) DI UN MONOPOLIO CON PIÙ LINEE DI PRODUZIONE Nella Sezione 16.5 abbiamo visto come un regolatore che voglia fissare il prezzo del monopolista in modo da minimizzare la

Dettagli

Analisi della performance temporale della rete

Analisi della performance temporale della rete Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:

Dettagli

I ricavi ed i costi di produzione

I ricavi ed i costi di produzione I ricavi ed i costi di produzione Supponiamo che le imprese cerchino di operare secondo comportamenti efficienti, cioè comportamenti che raggiungono i fini desiderati con mezzi minimi (o, che è la stessa

Dettagli

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede

Dettagli

Data mining e rischi aziendali

Data mining e rischi aziendali Data mining e rischi aziendali Antonella Ferrari La piramide delle componenti di un ambiente di Bi Decision maker La decisione migliore Decisioni Ottimizzazione Scelta tra alternative Modelli di apprendimento

Dettagli

Scheda. Il CRM per la Gestione del Marketing. Accesso in tempo reale alle Informazioni di rilievo

Scheda. Il CRM per la Gestione del Marketing. Accesso in tempo reale alle Informazioni di rilievo Scheda Il CRM per la Gestione del Marketing Nelle aziende l attività di Marketing è considerata sempre più importante poiché il mercato diventa sempre più competitivo e le aziende necessitano di ottimizzare

Dettagli

L ergonomia dei sistemi informativi

L ergonomia dei sistemi informativi Strumenti non convenzionali per l evoluzione d Impresa: L ergonomia dei sistemi informativi di Pier Alberto Guidotti 1 L ergonomia dei sistemi informativi CHI SONO Pier Alberto Guidotti Fondatore e direttore

Dettagli

IL MARKETING E QUELLA FUNZIONE D IMPRESA CHE:

IL MARKETING E QUELLA FUNZIONE D IMPRESA CHE: IL MARKETING E QUELLA FUNZIONE D IMPRESA CHE:! definisce i bisogni e i desideri insoddisfatti! ne definisce l ampiezza! determina quali mercati obiettivo l impresa può meglio servire! definisce i prodotti

Dettagli

MODELLO PER LO SVILUPPO DEL PRODOTTO

MODELLO PER LO SVILUPPO DEL PRODOTTO MODELLO PER LO SVILUPPO DEL PRODOTTO 34 Funzioni aziendali coinvolte nello sviluppo prodotto LE PRINCIPALI FUNZIONI AZIENDALI PROTAGONISTE NELLO SVIPUPPO PRODOTTI SONO: Progettazione e sviluppo prodotto

Dettagli

Settori di attività economica

Settori di attività economica ELABORAZIONE DEI DATI QUALITATIVI Chiara Lamuraglia 1. Premessa Al fine di ottenere informazioni di carattere qualitativo che consentissero di interpretare e leggere in modo più approfondito i dati statistici,

Dettagli

GUIDA DI APPROFONDIMENTO IL CONTROLLO DI GESTIONE: IL SISTEMA DI REPORTING

GUIDA DI APPROFONDIMENTO IL CONTROLLO DI GESTIONE: IL SISTEMA DI REPORTING WWW.SARDEGNAIMPRESA.EU GUIDA DI APPROFONDIMENTO IL CONTROLLO DI GESTIONE: IL SISTEMA DI REPORTING A CURA DEL BIC SARDEGNA SPA 1 S OMMAR IO LA FUNZIONE DEI REPORT... 3 TIPOLOGIA DEI REPORT... 3 CRITERI

Dettagli

SysAround S.r.l. L'efficacia delle vendite è l elemento centrale per favorire la crescita complessiva dell azienda.

SysAround S.r.l. L'efficacia delle vendite è l elemento centrale per favorire la crescita complessiva dell azienda. Scheda Il CRM per la Gestione delle Vendite Le organizzazioni di vendita sono costantemente alla ricerca delle modalità migliori per aumentare i ricavi aziendali e ridurre i costi operativi. Oggi il personale

Dettagli

Corrispondenze e funzioni

Corrispondenze e funzioni Corrispondenze e funzioni L attività fondamentale della mente umana consiste nello stabilire corrispondenze e relazioni tra oggetti; è anche per questo motivo che il concetto di corrispondenza è uno dei

Dettagli

Controllo di Gestione

Controllo di Gestione Pianificazione e controllo del business aziendale Controllo di Gestione In un contesto altamente complesso e competitivo quale quello moderno, il controllo di gestione ricopre un ruolo quanto mai strategico:

Dettagli

IL SISTEMA INFORMATIVO

IL SISTEMA INFORMATIVO LEZIONE 15 DAL MODELLO DELLE CONDIZIONI DI EQUILIBRIO AL MODELLO CONTABILE RIPRESA DEL CONCETTO DI SISTEMA AZIENDALE = COMPLESSO DI ELEMENTI MATERIALI E NO CHE DIPENDONO RECIPROCAMENTE GLI UNI DAGLI ALTRI

Dettagli

Capitolo 26: Il mercato del lavoro

Capitolo 26: Il mercato del lavoro Capitolo 26: Il mercato del lavoro 26.1: Introduzione In questo capitolo applichiamo l analisi della domanda e dell offerta ad un mercato che riveste particolare importanza: il mercato del lavoro. Utilizziamo

Dettagli

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile Problemi connessi all utilizzo di un numero di bit limitato Abbiamo visto quali sono i vantaggi dell utilizzo della rappresentazione in complemento alla base: corrispondenza biunivoca fra rappresentazione

Dettagli

Costi unitari materie dirette 30 40 Costi unitari manodopera diretta. Energia 10 20 Quantità prodotte 600 400 Prezzo unitario di vendita 120 180

Costi unitari materie dirette 30 40 Costi unitari manodopera diretta. Energia 10 20 Quantità prodotte 600 400 Prezzo unitario di vendita 120 180 SVOLGIMENTO Per ogni attività di programmazione e pianificazione strategica risulta di fondamentale importanza per l impresa il calcolo dei costi e il loro controllo, con l attivazione di un efficace sistema

Dettagli

Corso di. Analisi e contabilità dei costi

Corso di. Analisi e contabilità dei costi Corso di Analisi e Contabilità dei Costi Prof. 1_I costi e il sistema di controllo Perché analizzare i costi aziendali? La CONOSCENZA DEI COSTI (formazione, composizione, comportamento) utile EFFETTUARE

Dettagli

Sistemi di Gestione dei Dati e dei Processi Aziendali. Computer-Assisted Audit Technique (CAAT)

Sistemi di Gestione dei Dati e dei Processi Aziendali. Computer-Assisted Audit Technique (CAAT) Sistemi di Gestione dei Dati e dei Processi Aziendali Computer-Assisted Audit Technique (CAAT) Indice degli argomenti Introduzione Metodologia Esempi Conclusioni Slide 2 Introduzione Metodologia Esempi

Dettagli

Parimenti una gestione delle scorte in maniera non oculata può portare a serie ripercussioni sul rendimento sia dei mezzi propri che di terzi.

Parimenti una gestione delle scorte in maniera non oculata può portare a serie ripercussioni sul rendimento sia dei mezzi propri che di terzi. Metodo per la stima del ROE e del ROI in un azienda operante nel settore tessile abbigliamento in funzione delle propria struttura di incasso e pagamento e della gestione delle rimanenze di magazzino.

Dettagli

Indice di rischio globale

Indice di rischio globale Indice di rischio globale Di Pietro Bottani Dottore Commercialista in Prato Introduzione Con tale studio abbiamo cercato di creare un indice generale capace di valutare il rischio economico-finanziario

Dettagli

Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda

Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Premessa Con l analisi di sensitività il perito valutatore elabora un range di valori invece di un dato

Dettagli

Come visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1)

Come visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1) Transitori Analisi nel dominio del tempo Ricordiamo che si definisce transitorio il periodo di tempo che intercorre nel passaggio, di un sistema, da uno stato energetico ad un altro, non è comunque sempre

Dettagli

Il modello di ottimizzazione SAM

Il modello di ottimizzazione SAM Il modello di ottimizzazione control, optimize, grow Il modello di ottimizzazione Il modello di ottimizzazione è allineato con il modello di ottimizzazione dell infrastruttura e fornisce un framework per

Dettagli

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI Indice 1 Le frazioni algebriche 1.1 Il minimo comune multiplo e il Massimo Comun Divisore fra polinomi........ 1. Le frazioni algebriche....................................

Dettagli

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE 1. Proporzionalità diretta e proporzionalità inversa Analizziamo le seguenti formule Peso Lordo = Peso Netto + Tara Ricavo = Utile + Costo Rata = Importo + Interesse

Dettagli

Gli Elementi fondamentali della Gestione Aziendale

Gli Elementi fondamentali della Gestione Aziendale Gli Elementi fondamentali della Gestione Aziendale n La Pianificazione n L Organizzazione n Il Coinvolgimento del Personale n Il Controllo Componenti del Sistema di Pianificazione n Valutazioni interne

Dettagli

Capitolo Terzo Valore attuale e costo opportunità del capitale

Capitolo Terzo Valore attuale e costo opportunità del capitale Capitolo Terzo Valore attuale e costo opportunità del capitale 1. IL VALORE ATTUALE La logica di investimento aziendale è assolutamente identica a quella adottata per gli strumenti finanziari. Per poter

Dettagli

Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale.

Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale. Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale. Il presente materiale didattico costituisce parte integrante del percorso formativo

Dettagli

La Minimizzazione dei costi

La Minimizzazione dei costi La Minimizzazione dei costi Il nostro obiettivo è lo studio del comportamento di un impresa che massimizza il profitto sia in mercati concorrenziali che non concorrenziali. Ora vedremo la fase della minimizzazione

Dettagli

IL PROCESSO DI BUDGETING. Dott. Claudio Orsini Studio Cauli, Marmocchi, Orsini & Associati Bologna

IL PROCESSO DI BUDGETING. Dott. Claudio Orsini Studio Cauli, Marmocchi, Orsini & Associati Bologna IL PROCESSO DI BUDGETING Dott. Claudio Orsini Studio Cauli, Marmocchi, Orsini & Associati Bologna Il processo di budgeting Il sistema di budget rappresenta l espressione formalizzata di un complesso processo

Dettagli

IN COLLABORAZIONE CON OPTA SRL

IN COLLABORAZIONE CON OPTA SRL PROGRAMMARE LA PRODUZIONE IN MODO SEMPLICE ED EFFICACE IN COLLABORAZIONE CON OPTA SRL SOMMARIO 1. L AZIENDA E IL PRODOTTO 2. IL PROBLEMA 3. DATI DI INPUT 4. VERIFICA CARICO DI LAVORO SETTIMANALE 5. VERIFICA

Dettagli

INCREMENTARE LE QUOTE DI MERCATO E LA REDDITIVITÀ

INCREMENTARE LE QUOTE DI MERCATO E LA REDDITIVITÀ INCREMENTARE LE QUOTE DI MERCATO E LA REDDITIVITÀ L ANALISI DELLA CONCORRENZA E IL CUSTOMER VALUE MANAGEMENT 1. [ GLI OBIETTIVI ] PERCHÉ ADOTTARE UN PROCESSO DI CUSTOMER VALUE MANAGEMENT? La prestazione

Dettagli

11. Evoluzione del Software

11. Evoluzione del Software 11. Evoluzione del Software Andrea Polini Ingegneria del Software Corso di Laurea in Informatica (Ingegneria del Software) 11. Evoluzione del Software 1 / 21 Evoluzione del Software - generalità Cosa,

Dettagli

È evidente dunque l'abbattimento dei costi che le soluzioni ASP permettono in quanto:

È evidente dunque l'abbattimento dei costi che le soluzioni ASP permettono in quanto: Sitea Easy Events Il software gestionale per organizzare eventi fieristici Sitea Information Technology presenta Sitea Easy Events, il software gestionale studiato per ottimizzare il processo di organizzazione

Dettagli

Più processori uguale più velocità?

Più processori uguale più velocità? Più processori uguale più velocità? e un processore impiega per eseguire un programma un tempo T, un sistema formato da P processori dello stesso tipo esegue lo stesso programma in un tempo TP T / P? In

Dettagli

Introduzione alla teoria dei database relazionali. Come progettare un database

Introduzione alla teoria dei database relazionali. Come progettare un database Introduzione alla teoria dei database relazionali Come progettare un database La struttura delle relazioni Dopo la prima fase di individuazione concettuale delle entità e degli attributi è necessario passare

Dettagli

L uso della Balanced Scorecard nel processo di Business Planning

L uso della Balanced Scorecard nel processo di Business Planning L uso della Balanced Scorecard nel processo di Business Planning di Marcello Sabatini www.msconsulting.it Introduzione Il business plan è uno strumento che permette ad un imprenditore di descrivere la

Dettagli

Project Cycle Management

Project Cycle Management Project Cycle Management Tre momenti centrali della fase di analisi: analisi dei problemi, analisi degli obiettivi e identificazione degli ambiti di intervento Il presente materiale didattico costituisce

Dettagli

Rapporto dal Questionari Insegnanti

Rapporto dal Questionari Insegnanti Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

IL SISTEMA DI CONTROLLO INTERNO

IL SISTEMA DI CONTROLLO INTERNO http://www.sinedi.com ARTICOLO 27 OTTOBRE 2008 IL SISTEMA DI CONTROLLO INTERNO PRODUZIONE DI VALORE E RISCHIO D IMPRESA Nel corso del tempo, ogni azienda deve gestire un adeguato portafoglio di strumenti

Dettagli

REALIZZARE UN BUSINESS PLAN CON MICROSOFT EXCEL 2007

REALIZZARE UN BUSINESS PLAN CON MICROSOFT EXCEL 2007 REALIZZARE UN BUSINESS PLAN CON MICROSOFT EXCEL 2007 INTRODUZIONE Uno degli elementi più importanti che compongono un Business Plan è sicuramente la previsione dei risultati economico-finanziari. Tale

Dettagli

ECONOMIA CLASSE IV prof.ssa Midolo L ASPETTO ECONOMICO DELLA GESTIONE. (lezione della prof.ssa Edi Dal Farra)

ECONOMIA CLASSE IV prof.ssa Midolo L ASPETTO ECONOMICO DELLA GESTIONE. (lezione della prof.ssa Edi Dal Farra) ECONOMIA CLASSE IV prof.ssa Midolo L ASPETTO ECONOMICO DELLA GESTIONE (lezione della prof.ssa Edi Dal Farra) La GESTIONE (operazioni che l azienda compie per raggiungere i suoi fini) può essere: ORDINARIA

Dettagli

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ In questa Appendice mostreremo come trovare la tariffa in due parti che massimizza i profitti di Clearvoice,

Dettagli

RECUPERO DATI LIFO DA ARCHIVI ESTERNI

RECUPERO DATI LIFO DA ARCHIVI ESTERNI RECUPERO DATI LIFO DA ARCHIVI ESTERNI È possibile importare i dati relativi ai LIFO di esercizi non gestiti con Arca2000? La risposta è Sì. Esistono tre strade per recuperare i dati LIFO per gli articoli

Dettagli

Introduzione all economia

Introduzione all economia Introduzione all economia 4.X.2005 Macro e microeconomia La teoria economica è divisa in due sezioni principali: la microeconomia e la macroeconomia La microeconomia studia il comportamento dei singoli

Dettagli

Cosa è un foglio elettronico

Cosa è un foglio elettronico Cosa è un foglio elettronico Versione informatica del foglio contabile Strumento per l elaborazione di numeri (ma non solo...) I valori inseriti possono essere modificati, analizzati, elaborati, ripetuti

Dettagli

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L. DATA WAREHOUSE Un Dataware House può essere definito come una base di dati di database. In molte aziende ad esempio ci potrebbero essere molti DB, per effettuare ricerche di diverso tipo, in funzione del

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?) Ambiente Access La Guida di Access Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?) Guida in linea Guida rapida Assistente di Office indicazioni

Dettagli

LA RICLASSIFICAZIONE DEI SALDI CONTABILI CON MICROSOFT ACCESS 2007

LA RICLASSIFICAZIONE DEI SALDI CONTABILI CON MICROSOFT ACCESS 2007 LA RICLASSIFICAZIONE DEI SALDI CONTABILI CON MICROSOFT ACCESS 2007 La fase di riclassificazione del bilancio riveste un ruolo molto importante al fine di comprendere l andamento aziendale; essa consiste,

Dettagli

Lezione 4. Controllo di gestione. Il controllo direzionale

Lezione 4. Controllo di gestione. Il controllo direzionale Lezione 4 Il controllo direzionale Sistema di pianificazione e controllo PIANIFICAZIONE STRATEGICA PIANO 1 2 OBIETTIVI OBIETTIVI ATTIVITA 3 DI LUNGO PERIODO DI BREVE PERIODO OPERATIVA 5 BUDGET FEED-BACK

Dettagli

CAPITOLO 10 I SINDACATI

CAPITOLO 10 I SINDACATI CAPITOLO 10 I SINDACATI 10-1. Fate l ipotesi che la curva di domanda di lavoro di una impresa sia data da: 20 0,01 E, dove è il salario orario e E il livello di occupazione. Ipotizzate inoltre che la funzione

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Raggruppamenti Conti Movimenti

Raggruppamenti Conti Movimenti ESERCITAZIONE PIANO DEI CONTI Vogliamo creare un programma che ci permetta di gestire, in un DB, il Piano dei conti di un azienda. Nel corso della gestione d esercizio, si potranno registrare gli articoli

Dettagli

Pro e contro delle RNA

Pro e contro delle RNA Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;

Dettagli

Monitoraggio sulla conversione dei prezzi al consumo dalla Lira all Euro

Monitoraggio sulla conversione dei prezzi al consumo dalla Lira all Euro ISTAT 17 gennaio 2002 Monitoraggio sulla conversione dei prezzi al consumo dalla Lira all Euro Nell ambito dell iniziativa di monitoraggio, avviata dall Istat per analizzare le modalità di conversione

Dettagli

GESTIONE CONTRATTI. Contratti clienti e contratti fornitori

GESTIONE CONTRATTI. Contratti clienti e contratti fornitori SPRING - CONTRATTI La Gestione Contratti di SPRING, in un'azienda, risolve le esigenze relative alla rilevazione dei contratti e delle relative condizioni. In particolare è possibile definire i servizi

Dettagli

ascoltare ispirare e motivare miglioramento problem solving Flex360 pianificare comunicare la vision organizzare

ascoltare ispirare e motivare miglioramento problem solving Flex360 pianificare comunicare la vision organizzare Flex360 La valutazione delle competenze online comunicare la vision ascoltare problem solving favorire il cambiamento proattività pianificare miglioramento organizzare ispirare e motivare Cos è Flex360

Dettagli

LE CARTE DI CONTROLLO (4)

LE CARTE DI CONTROLLO (4) LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale

Dettagli

Master della filiera cereagricola. Impresa e mercati. Facoltà di Agraria Università di Teramo. Giovanni Di Bartolomeo Stefano Papa

Master della filiera cereagricola. Impresa e mercati. Facoltà di Agraria Università di Teramo. Giovanni Di Bartolomeo Stefano Papa Master della filiera cereagricola Giovanni Di Bartolomeo Stefano Papa Facoltà di Agraria Università di Teramo Impresa e mercati Parte prima L impresa L impresa e il suo problema economico L economia studia

Dettagli

ANALISI DELLA STRUTTURA FINANZIARIA a cura Giuseppe Polli SECONDA PARTE clicca QUI per accedere direttamente alla prima parte dell'intervento...

ANALISI DELLA STRUTTURA FINANZIARIA a cura Giuseppe Polli SECONDA PARTE clicca QUI per accedere direttamente alla prima parte dell'intervento... ANALISI DELLA STRUTTURA FINANZIARIA a cura Giuseppe Polli SECONDA PARTE clicca QUI per accedere direttamente alla prima parte dell'intervento... 4 GLI INDICI DI LIQUIDITA L analisi procede con la costruzione

Dettagli

4.1 Che cos è l ideazione

4.1 Che cos è l ideazione Luca Cabibbo Analisi e Progettazione del Software Ideazione (non è la fase dei requisiti) Capitolo 4 marzo 2013 Il meglio è nemico del bene. Voltaire 1 *** AVVERTENZA *** I lucidi messi a disposizione

Dettagli

CRM: IL FUTURO DEL MARKETING ATTRAVERSO LA CONOSCENZA DEL CLIENTE

CRM: IL FUTURO DEL MARKETING ATTRAVERSO LA CONOSCENZA DEL CLIENTE UNIVERSITÁ DEGLI STUDI DI UDINE FACOLTÁ DI ECONOMIA Corso di Laurea in Economia Aziendale Esame di Laurea CRM: IL FUTURO DEL MARKETING ATTRAVERSO LA CONOSCENZA DEL CLIENTE Tutore: Prof. Maria Chiarvesio

Dettagli

Sistemi di supporto alle decisioni

Sistemi di supporto alle decisioni Sistemi di supporto alle decisioni Introduzione I sistemi di supporto alle decisioni, DSS (decision support system), sono strumenti informatici che utilizzano dati e modelli matematici a supporto del decision

Dettagli

CHIUSURE di MAGAZZINO di FINE ANNO

CHIUSURE di MAGAZZINO di FINE ANNO CHIUSURE di MAGAZZINO di FINE ANNO Operazioni da svolgere per il riporto delle giacenze di fine esercizio Il documento che segue ha lo scopo di illustrare le operazioni che devono essere eseguite per:

Dettagli

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video Video Librerie digitali Gestione di video Ogni filmato è composto da più parti Video Audio Gestito come visto in precedenza Trascrizione del testo, identificazione di informazioni di interesse Testo Utile

Dettagli

Progetto NoiPA per la gestione giuridicoeconomica del personale delle Aziende e degli Enti del Servizio Sanitario della Regione Lazio

Progetto NoiPA per la gestione giuridicoeconomica del personale delle Aziende e degli Enti del Servizio Sanitario della Regione Lazio Progetto NoiPA per la gestione giuridicoeconomica del personale delle Aziende e degli Enti del Servizio Sanitario della Regione Lazio Pillola operativa Integrazione Generazione Dettagli Contabili INFORMAZIONI

Dettagli

Capitolo 3. L applicazione Java Diagrammi ER. 3.1 La finestra iniziale, il menu e la barra pulsanti

Capitolo 3. L applicazione Java Diagrammi ER. 3.1 La finestra iniziale, il menu e la barra pulsanti Capitolo 3 L applicazione Java Diagrammi ER Dopo le fasi di analisi, progettazione ed implementazione il software è stato compilato ed ora è pronto all uso; in questo capitolo mostreremo passo passo tutta

Dettagli

Project Management. Modulo: Introduzione. prof. ing. Guido Guizzi

Project Management. Modulo: Introduzione. prof. ing. Guido Guizzi Project Management Modulo: Introduzione prof. ing. Guido Guizzi Definizione di Project Management Processo unico consistente in un insieme di attività coordinate con scadenze iniziali e finali, intraprese

Dettagli

Guida all uso di Java Diagrammi ER

Guida all uso di Java Diagrammi ER Guida all uso di Java Diagrammi ER Ver. 1.1 Alessandro Ballini 16/5/2004 Questa guida ha lo scopo di mostrare gli aspetti fondamentali dell utilizzo dell applicazione Java Diagrammi ER. Inizieremo con

Dettagli

Finanza Aziendale. Lezione 13. Introduzione al costo del capitale

Finanza Aziendale. Lezione 13. Introduzione al costo del capitale Finanza Aziendale Lezione 13 Introduzione al costo del capitale Scopo della lezione Applicare la teoria del CAPM alle scelte di finanza d azienda 2 Il rischio sistematico E originato dalle variabili macroeconomiche

Dettagli

1. Scopo dell esperienza.

1. Scopo dell esperienza. 1. Scopo dell esperienza. Lo scopo di questa esperienza è ricavare la misura di tre resistenze il 4 cui ordine di grandezza varia tra i 10 e 10 Ohm utilizzando il metodo olt- Amperometrico. Tale misura

Dettagli