Data Mining in SAP. Alessandro Ciaramella
|
|
- Alfonsina Sorrentino
- 8 anni fa
- Visualizzazioni
Transcript
1 UNIVERSITÀ DI PISA Corsi di Laurea Specialistica in Ingegneria Informatica per la Gestione d Azienda e Ingegneria Informatica Data Mining in SAP A cura di: Alessandro Ciaramella
2 La Business Intelligence Profitto Conoscenza Informazione Dati 2 Processi Tecnologie Strumenti
3 I Passi della Business Intelligence 3 Fonte: Norbert Egger & al., Business Intelligence, SAP PRESS (2007)
4 Il Data Mining 4 Un processo iterativo Per scoprire regolarità e relazioni In grandi quantità di dati Per un risultato chiaro, utile e riusabile
5 Un processo iterativo Processo Standardizzato dal CRISP-DM 5
6 Il Modulo SAP APD Permette di sviluppare processi di analisi di Data Mining Fonte: sap.com 6
7 Il Processo di Data Mining in SAP 7
8 1st Step: Selection of Data 8 I dati possono essere prelevati da una grande quantità di sorgenti:
9 2nd step: Preparation 9 Permette di manipolare i dati per renderli adatti alle analisi dei metodi di data mining
10 3td Step: Transformation 10 Rappresentano metodi potenti di analisi dei dati:
11 4th Step: Saving / Trasferring 11 I dati possono essere salvati in diverse strutture: Oppure possono essere utilizzati per addestrare i modelli di data mining o generare le Regole di Associazione
12 I Metodi di Data Mining 12 Decision Tree Cluster Analysis Regression Analysis Association Rules
13 Decision Tree A A=w A=x B 13 B B B<θ Class 1 A=z A=y B θ Class 2 Class 3
14 Generare un Albero di Decisione test test test......
15 Algoritmo CLS Proposto da Hunt (1966) Base della maggior parte degli algoritmi Sia T il training set non vuoto e {C, C,, C } le classi a cui appartengono le unità Tutte le unità appartengono alla stessa classe 2.L'insieme T è vuoto 3.L'insieme T contiene unità di classi diverse Selezione della variabile per test Partizione di T in sottoinsiemi T e ricorsione i 15 k
16 Il Problema dell Overfitting 16 L obiettivo è riuscire a classificare in modo corretto anche dati non appartenenti al training set. In modo intuitivo è facile capire che alberi più semplici riescono a generalizzare meglio di alberi complessi, con tanti test sulle variabili di ingresso.
17 Algoritmi ID3 e C Proposti da Quinlan (1986 e 1993) Il C4.5 estende gli alberi ai domini quantitativi Basati sull algoritmo CLS Tecnica di sampling del training set Selezione della variabile guidata dall'information Gain
18 L'Information Gain L'information Gain di una variabile A rispetto a una variabile X è un indicatore di quanto la conoscenza di A può influire sulla conoscenza di X: IG(X,A) = H(X) H(X A) Dove H() rappresenta l'entropia informatica, una misura dell'incertezza legata a una variabile statistica (Shannon, 1948) 18
19 Pruning La potatura è guidata da una misura del tasso di errore dell albero nel classificare campioni non precedentemente visti. 19 prepruning: si decide di fermarsi a un certo nodo, anche se l insieme dei campioni non appartiene tutto a un unica classe postpruning: la potatura è effettuata sull albero completamente generato, agendo retrospettivamente sulla sua struttura
20 Decision Tree in SAP 20
21 L'Algoritmo in SAP 21 Utilizza una variante dell algoritmo C4.5
22 I Risultati della Classificazione 22
23 Applicazione 23 Problema: Predire quando l income di una persona supera una certa soglia in base ai dati relativi al censo. Decision Tree: 86,17% successo in test set
24 Cluster Analysis 24 Segmenta un insieme di oggetti in gruppi tali che: Oggetti molto simili tra loro appartengano allo stesso gruppo Oggetti di gruppi diversi siano molto diversi tra loro
25 Il Processo di Clustering Fonte: Halkidi (2001) 25
26 Cluster Analysis in SAP 26 Utilizza una variante del k-means Estende il dominio alle variabili qualitative
27 Le Dimensioni dello Spazio 27 Ciascun attributo rappresenta una o più dimensioni nello spazio di ricerca Alle variabili quantitative e qualitative ordinate viene assegnata una dimensione Alle variabili qualitative non ordinate viene assegnata una dimensione per ogni modalità che possono assumere (binarizzazione)
28 Algoritmo di Clustering: passo 1 Calcolo dei Centroidi Iniziali 28 Attraverso un campionamento casuale, l insieme dei dati iniziali viene diviso in k parti; Per ciascuna parte, su alcuni dei campioni rappresentati come vettori viene calcolata la media aritmetica che rappresenterà le coordinate del punto centroide.
29 Algoritmo di Clustering: passo 2 Attribuzione degli Oggetti ai Cluster 29 Ogni campione viene assegnato al cluster il cui centroide ha la distanza euclidea minima dal campione stesso.
30 Algoritmo di Clustering: passo 3 Nuovo Calcolo dei Centroidi 30 I centroidi vengono calcolati in base alle appartenenze stabilite nel passo precedente. In particolare, alcuni campioni vengono selezionati a caso e la loro media rappresenterà le coordinate del nuovo punto centroide.
31 Algoritmo di Clustering: passo 4 Condizioni di Stop 31 L algoritmo torna al passo due (attribuzione degli oggetti ai cluster) finchè le condizioni di stop non vengono soddisfatte.
32 Configurazione dei Parametri 32
33 La Validazione dei Risultati 33 Ottenuta una partizione dei dati, è importante controllare che questa non sia stata prodotta artificialmente dall algoritmo ma corrisponda alla struttura effettiva dei dati. Una buona partizione ha cluster ben separati tra loro e compatti al loro interno.
34 L'Indice Xie-Beni Al numeratore: compattezza Al denominatore: separazione Piccoli valori di Xie-Beni buone partizioni 34
35 La Validazione in SAP 35 Non è presente alcun indicatore sintetico della bontà dei risultati ottenuti Possiamo utilizzare alcune informazioni di riepilogo fornite dal sistema per ottenere un approssimazione dell indice di Xie-Beni
36 La Compattezza 36 Attraverso l Intra Cluster Distance Graph si può risalire alla distanza media tra gli elementi appartenenti a un cluster e il suo centroide.
37 La Separazione 37 Visualizzando il modello secondo la sintassi PMML è possibile accedere alle coordinate di ogni cluster
38 Applicazione 1/2 Problema: classificare un insieme di individui in gruppi omogenei, attraverso l analisi delle caratteristiche del loro censo Guidati dall indice Xie-Beni, abbiamo trovato la migliore partizione in tre gruppi 38 Variabili utilizzate: sex, income, relationship, education, age
39 Applicazione 2/2 39 Problema: predire la classe di appartenenza di una pianta di iris, raggruppando i campioni in base ai loro dati biologici Cluster Analysis: si ottiene una corretta classificazione nel 96% dei casi
40 Regression Analysis y = f(x, θ) + ε 40 Stima i parametri dell equazione che lega le variabili predittrici con la variabile risposta La variabile da predire è di tipo continuo e non un identificatore di classe
41 La Regressione Lineare y=α+β x+ε La risposta è funzione lineare dei parametri Errore: Metodo dei minimi quadrati 41
42 Regressione Non Lineare Equazione della regressione non lineare: y = f(x, θ) + ε 42 Per stimare i parametri non c è un metodo generale, ma sono necessari algoritmi specifici di ricerca operativa
43 Alcune Definizioni 43 Da cui SST = SSR + SSE Coefficiente di Determinazione:
44 Regression Analysis in SAP 44 Effettua regressioni sia di tipo lineare sia di tipo non lineare Accetta predittori qualitativi, generando un equazione per ogni combinazione dei loro valori
45 Regressione Lineare in SAP 45 Per stimare i parametri dell equazione di regressione utilizza il metodo dei minimi quadrati
46 Regressione non Lineare in SAP Attraverso spline di ordine uno y x 46
47 Linearizzazione Locale 47 Per ogni variabile predittrice quantitativa è necessario stabilire un intervallo di linearizzazione in modo automatico o manuale (specificando le soglie):
48 I Risultati del Modello 48 Il sistema fornisce come indicatore di bontà la radice quadrata del coefficiente di determinazione: Pericolo di sovrastimare la capacità di analisi raggiunta
49 Applicazione 49 Problema: predire il numero di anelli della conchiglia di un mollusco note alcune sue misure fisiche Regression Analysis: 45,40% di successo con margine di errore ± 1 unità.
50 Association Rules Scoprono relazioni nascoste tra gli attributi (local pattern) La conoscenza indotta è mantenuta sotto forma di regole del tipo: Se {Antecedente} allora {Conseguente} 50
51 Market Basket Analysis Rappresenta l applicazione più nota delle Regole di Associazione Ogni acquisto rappresenta una transazione e coinvolge un certo insieme di articoli Se A e B sono due insiemi di articoli disgiunti, una regola di associazione prende la forma: A B 51
52 Il Supporto Il Supporto di una regola di associazione A B è la proporzione di transazioni che contengono sia A e B: (numero delle transazioni contenenti sia A e B) (numero totale delle transazioni) 52
53 La Confidenza La Confidenza di una regola di associazione A B è una misura della sua accuratezza ed è determinata dalla percentuale di transazioni che contengono A e che inoltre contengono B: (num. delle trans. contenenti sia A e B) (num. delle trans. contenenti A) 53
54 Altre Definizioni 54 Regole forti: regole che hanno supporto e confidenza maggiori di soglie prestabilite Itemset: un insieme di articoli K-itemset: un itemset contenente k articoli Large Itemset: un itemset che si presenta almeno un certo numero di volte
55 Algoritmo Apriori Proposto da Agrawal (1993) 1. Trova i large itemset 2. Per ciascun large itemset, genera tutte le regole ottenute dalla combinazione dei suoi articoli 3. Seleziona le regole che superano una certa soglia di confidenza prestabilita 55
56 I Large Itemset Trovare i large itemset in modo diretto non è computazionalmente possibile Si usa la downward closure property: 56 Se un itemset X non è un large itemset, aggiungere un ulteriore articolo A a tale itemset non renderà X U A un large itemset Per ottenere i large itemset, è sufficiente cercare soltanto tra le combinazioni di large itemset di ordine inferiore, partendo dagli 1-itemset più frequenti.
57 L incremento (Lift) 1/2 Se un articolo è presente nel database con una frequenza alta, la confidenza delle regole in cui appare come conseguente risulta distorta. Per valutare la bontà di una regola si introduce l incremento: (confidenza della regola) (probabilità del conseguente) 57
58 L incremento (Lift) 2/2 Confronta la confidenza della regola con la probabilità del conseguente 58 Lift >> 1: effettiva correlazione Lift 1: la presenza del conseguente non è associabile alla presenza dell antecedente
59 Association Rules in SAP 59 Utilizza una variante dell'algoritmo Apriori
60 Il Transaction Weight È possibile specificare il peso assunto da ciascun articolo all interno della transazione In questo caso il supporto di un itemset è calcolato come: (peso totale delle transazioni contenenti l itemset) (peso totale delle transazioni) 60
61 Le Regole Generate 61
62 Applicazione Problema: predire la pagina web che sarà visitata durante l accesso a un sito, nota la pagina già visitata. Association Rules: Si ottengono regole con confidenza anche maggiore del 90% 62 Esempio: /WINDOWS95 /WINDOWS
63 Grazie. 63
Università di Pisa A.A. 2004-2005
Università di Pisa A.A. 2004-2005 Analisi dei dati ed estrazione di conoscenza Corso di Laurea Specialistica in Informatica per l Economia e per l Azienda Tecniche di Data Mining Corsi di Laurea Specialistica
DettagliPro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
DettagliAlgoritmi di clustering
Algoritmi di clustering Dato un insieme di dati sperimentali, vogliamo dividerli in clusters in modo che: I dati all interno di ciascun cluster siano simili tra loro Ciascun dato appartenga a uno e un
DettagliMining Positive and Negative Association Rules:
Mining Positive and Negative Association Rules: An Approach for Confined Rules Alessandro Boca Alessandro Cislaghi Premesse Le regole di associazione positive considerano solo gli item coinvolti in una
DettagliCorso di Amministrazione di Reti A.A. 2002/2003
Struttura di Active Directory Corso di Amministrazione di Reti A.A. 2002/2003 Materiale preparato utilizzando dove possibile materiale AIPA http://www.aipa.it/attivita[2/formazione[6/corsi[2/materiali/reti%20di%20calcolatori/welcome.htm
DettagliRicerca di outlier. Ricerca di Anomalie/Outlier
Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla
DettagliBasi di Dati Relazionali
Corso di Laurea in Informatica Basi di Dati Relazionali a.a. 2009-2010 PROGETTAZIONE DI UNA BASE DI DATI Raccolta e Analisi dei requisiti Progettazione concettuale Schema concettuale Progettazione logica
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
DettagliGestione Turni. Introduzione
Gestione Turni Introduzione La gestione dei turni di lavoro si rende necessaria quando, per garantire la continuità del servizio di una determinata struttura, è necessario che tutto il personale afferente
DettagliProcedura tecnico-statistica per il calcolo dell Indice di Disagio Socioeconomico (IDS)
Procedura tecnico-statistica per il calcolo dell Indice di Disagio Socioeconomico (IDS) Unità di Valutazione-DPS Ministero dello Sviluppo Economico Luglio 2008 Per garantire uniformità e completezza dei
DettagliProgetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario
Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,
Dettagli1. PRIME PROPRIETÀ 2
RELAZIONI 1. Prime proprietà Il significato comune del concetto di relazione è facilmente intuibile: due elementi sono in relazione se c è un legame tra loro descritto da una certa proprietà; ad esempio,
DettagliMANUALE ESSE3 Gestione Registro delle lezioni
MANUALE ESSE3 Gestione Registro delle lezioni DOCENTI 1 INDICE 1. INTRODUZIONE E ACCESSO... 3 2. GESTIONE DEL REGISTRO... 4 2.1. Informazioni generali... 6 2.2. Stato del Registro... 7 2.2.1. Transizioni
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliROCK. A Robust Clustering Algorithm for Categorical Attributes. Sudipto Guha, Rajeev Rastogi, Kyuseok Shim
ROCK A Robust Clustering Algorithm for Categorical Attributes Sudipto Guha, Rajeev Rastogi, Kyuseok Shim Presentazione di Sara Liparesi e Francesco Nonni Sistemi Informativi per le Decisioni a.a. 2005/2006
DettagliIl Metodo Branch and Bound
Il Laura Galli Dipartimento di Informatica Largo B. Pontecorvo 3, 56127 Pisa laura.galli@unipi.it http://www.di.unipi.it/~galli 4 Novembre 2014 Ricerca Operativa 2 Laurea Magistrale in Ingegneria Gestionale
DettagliCorso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
DettagliRegole di Associazione
Metodologie per Sistemi Intelligenti Regole di Associazione Prof. Pier Luca Lanzi Laurea in Ingegneria Informatica Politecnico di Milano Polo regionale di Como Esempio Esempio Regole di Associazione Scopo
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliCapitolo 3. L applicazione Java Diagrammi ER. 3.1 La finestra iniziale, il menu e la barra pulsanti
Capitolo 3 L applicazione Java Diagrammi ER Dopo le fasi di analisi, progettazione ed implementazione il software è stato compilato ed ora è pronto all uso; in questo capitolo mostreremo passo passo tutta
DettagliRegressione non lineare con un modello neurale feedforward
Reti Neurali Artificiali per lo studio del mercato Università degli studi di Brescia - Dipartimento di metodi quantitativi Marco Sandri (sandri.marco@gmail.com) Regressione non lineare con un modello neurale
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliCreazione di un modello di data mining di tipo OLAP con l'algoritmo Microsoft Clustering
Pagina 1 di 9 Menu principale Sezione precedente Sezione successiva Creazione di un modello di data mining di tipo OLAP con l'algoritmo Microsoft Clustering Un modello di data mining è un modello che include
DettagliE-LEARNING ACADEMY GUIDA OPERATIVA
E-LEARNING ACADEMY INDICE PREMESSA 3 1. FUNZIONALITÀ DELLA PIATTAFORMA E-LEARNING ACADEMY 4 2. REGISTRATI 5 2.1 COME EFFETTUARE LA REGISTRAZIONE 5 3. PERCORSI 8 3.1 COME FRUIRE DEI CONTENUTI FORMATIVI
DettagliGUIDA AL SOCIAL CARE
1 REGISTRAZIONE pag. 2 GESTIONE PROFILO pag. 3 GESTIONE APPUNTAMENTI pag. 4 GESTIONE PIANI DI CURA (RICHIESTA AUTORIZZAZIONE) pag. 5 INVIO DOCUMENTI A PRONTO CARE (es. FATTURE) pag. 6 LIQUIDAZIONI pag.
DettagliESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114
DettagliAnalisi dei requisiti e casi d uso
Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................
DettagliGUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL
GUIDA RAPIDA BOZZA 23/07/2008 INDICE 1. PERCHÉ UNA NUOVA VERSIONE DEI MODULI DI RACCOLTA DATI... 3 2. INDICAZIONI GENERALI... 4 2.1. Non modificare la struttura dei fogli di lavoro... 4 2.2. Cosa significano
DettagliLa statistica multivariata
Cenni di Statistica Multivariata Dr Corrado Costa La statistica multivariata La statistica multivariata è quella parte della statistica in cui l'oggetto dell'analisi è per sua natura formato da almeno
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliMarketing relazionale
Marketing relazionale Introduzione Nel marketing intelligence assume particolare rilievo l applicazione di modelli predittivi rivolte a personalizzare e rafforzare il legame tra azienda e clienti. Un azienda
DettagliUso delle tabelle e dei grafici Pivot
Uso delle tabelle e dei grafici Pivot 1 Una tabella Pivot usa dati a due dimensioni per creare una tabella a tre dimensioni, cioè una tabella riassuntiva basata su condizioni multiple che hanno punti di
DettagliPer studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R
Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.
DettagliIL CAMPIONAMENTO NELLA REVISIONE CONTABILE
Università RomaTre. Facoltà di Economia Federico Caffè Prof. Ugo Marinelli Anno Accademico 07-08 1 PREMESSA RACCOLTA SUFFICIENTI ED APPROPRIATI ELEMENTI PROBATIVI LA È SVOLTA IN BASE A VERIFICHE DI CAMPIONI
DettagliDistributed P2P Data Mining. Autore: Elia Gaglio (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo
Distributed P2P Data Mining Autore: (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo A.A. 2005/2006 Il settore del Data Mining Distribuito (DDM): Data Mining: cuore del processo
DettagliLE CARTE DI CONTROLLO (4)
LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale
DettagliRegione Toscana. ARPA Fonte Dati. Manuale Amministratore. L. Folchi (TAI) Redatto da
ARPA Fonte Dati Regione Toscana Redatto da L. Folchi (TAI) Rivisto da Approvato da Versione 1.0 Data emissione 06/08/13 Stato DRAFT 1 Versione Data Descrizione 1,0 06/08/13 Versione Iniziale 2 Sommario
DettagliA intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.
Algoritmi di routing dinamici (pag.89) UdA2_L5 Nelle moderne reti si usano algoritmi dinamici, che si adattano automaticamente ai cambiamenti della rete. Questi algoritmi non sono eseguiti solo all'avvio
DettagliOttimizzazione Multi Obiettivo
Ottimizzazione Multi Obiettivo 1 Ottimizzazione Multi Obiettivo I problemi affrontati fino ad ora erano caratterizzati da una unica (e ben definita) funzione obiettivo. I problemi di ottimizzazione reali
DettagliSistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate
MODULO BASE Quanto segue deve essere rispettato se si vuole che le immagini presentate nei vari moduli corrispondano, con buona probabilità, a quanto apparirà nello schermo del proprio computer nel momento
DettagliTecniche di riconoscimento statistico
On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 4 Reti neurali per la classificazione Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com
DettagliAnalisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda
Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Premessa Con l analisi di sensitività il perito valutatore elabora un range di valori invece di un dato
DettagliInteresse, sconto, ratei e risconti
TXT HTM PDF pdf P1 P2 P3 P4 293 Interesse, sconto, ratei e risconti Capitolo 129 129.1 Interesse semplice....................................................... 293 129.1.1 Esercizio per il calcolo dell
DettagliNuova funzione di ricerca del sito WIKA.
Nuova funzione di ricerca del sito WIKA. Il sito WIKA dispone ora di una funzione di ricerca completamente riprogettata. Essa è uno strumento particolarmente importante in quanto deve fornire al navigatore
DettagliVerifica di ipotesi e intervalli di confidenza nella regressione multipla
Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo
DettagliAnalisi di scenario File Nr. 10
1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica giorgio.calcagnini@uniurb.it http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html
DettagliAutomazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it
Automazione Industriale (scheduling+mms) scheduling+mms adacher@dia.uniroma3.it Introduzione Sistemi e Modelli Lo studio e l analisi di sistemi tramite una rappresentazione astratta o una sua formalizzazione
DettagliDatabase 1 biblioteca universitaria. Testo del quesito
Database 1 biblioteca universitaria Testo del quesito Una biblioteca universitaria acquista testi didattici su indicazione dei professori e cura il prestito dei testi agli studenti. La biblioteca vuole
DettagliProgetto: ARPA Fonte Dati. ARPA Fonte Dati. Regione Toscana. Manuale Amministratore
ARPA Fonte Dati Regione Toscana 1 Redatto da L. Folchi (TAI) Rivisto da Approvato da Versione 1.1 Data emissione 09/10/13 Stato FINAL 2 Versione Data Descrizione 1,0 06/08/13 Versione Iniziale 1.1 09/10/2013
DettagliMon Ami 3000 Varianti articolo Gestione di varianti articoli
Prerequisiti Mon Ami 3000 Varianti articolo Gestione di varianti articoli L opzione Varianti articolo è disponibile per le versioni Azienda Light e Azienda Pro e include tre funzionalità distinte: 1. Gestione
DettagliGuida Utente. La seguente guida indirizza il fruitore del programma PatternDiscoverer a un corretto utilizzo.
Guida Utente La seguente guida indirizza il fruitore del programma PatternDiscoverer a un corretto utilizzo. INDICE Pag Introduzione al programma... 1 Client.. 2 Server...... 3 Test 4 Introduzione al programma
DettagliIngegneria del Software T
Home Finance 1 Requisiti del cliente 1 Si richiede di realizzare un sistema per la gestione della contabilità familiare. Il sistema consente la classificazione dei movimenti di denaro e la loro memorizzazione.
Dettaglie-dva - eni-depth Velocity Analysis
Lo scopo dell Analisi di Velocità di Migrazione (MVA) è quello di ottenere un modello della velocità nel sottosuolo che abbia dei tempi di riflessione compatibili con quelli osservati nei dati. Ciò significa
DettagliScheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux
Scheduling della CPU Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux Sistemi multiprocessori Fin qui si sono trattati i problemi di scheduling su singola
DettagliPDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD
Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da
DettagliGUIDA ALLA COMPILAZIONE DEL PIANO DI STUDI ON LINE
Università degli Studi G. d Annunzio CHIETI - PESCARA GUIDA ALLA COMPILAZIONE DEL PIANO DI STUDI ON LINE A cura del Settore Statistica e Applicativi Didattica e Ricerca Guida all utilizzo Compilazione
DettagliGuida all uso di Java Diagrammi ER
Guida all uso di Java Diagrammi ER Ver. 1.1 Alessandro Ballini 16/5/2004 Questa guida ha lo scopo di mostrare gli aspetti fondamentali dell utilizzo dell applicazione Java Diagrammi ER. Inizieremo con
Dettagli3 GRAFICI DI FUNZIONI
3 GRAFICI DI FUNZIONI Particolari sottoinsiemi di R che noi studieremo sono i grafici di funzioni. Il grafico di una funzione f (se non è specificato il dominio di definizione) è dato da {(x, y) : x dom
DettagliEsercizio data base "Biblioteca"
Rocco Sergi Esercizio data base "Biblioteca" Database 2: Biblioteca Testo dell esercizio Si vuole realizzare una base dati per la gestione di una biblioteca. La base dati conterrà tutte le informazioni
DettagliAprire WEKA Explorer Caricare il file circletrain.arff Selezionare random split al 66% come modalità di test Selezionare J48 come classificatore e
Alberi di decisione Aprire WEKA Explorer Caricare il file circletrain.arff Selezionare random split al 66% come modalità di test Selezionare J48 come classificatore e lanciarlo con i parametri di default.
DettagliIntroduzione agli Algoritmi Genetici Prof. Beatrice Lazzerini
Introduzione agli Algoritmi Genetici Prof. Beatrice Lazzerini Dipartimento di Ingegneria della Informazione Via Diotisalvi, 2 56122 PISA ALGORITMI GENETICI (GA) Sono usati per risolvere problemi di ricerca
DettagliOBIETTIVI DEL DOCUMENTO INTRODUZIONE
OBIETTIVI DEL DOCUMENTO... 1 INTRODUZIONE... 1 ACCESSO ALLA PROCEDURA... 2 COMPILAZIONE ON-LINE... 3 SCELTA DELLA REGIONE O PROVINCIA AUTONOMA... 4 DATI ANAGRAFICI... 5 SCELTA DEL PROGETTO... 9 DATI RELATIVI
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliRAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
Dettagliper immagini guida avanzata Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1
Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1 Una tabella Pivot usa dati a due dimensioni per creare una tabella a tre dimensioni, cioè una tabella
DettagliData mining. Vincenzo D Elia. vincenzo.delia@polito.it. DBDMG - Politecnico di Torino
Data mining Vincenzo D Elia vincenzo.delia@polito.it DBDMG - Politecnico di Torino vincenzo.delia@polito.it Archivi Multimediali e Data Mining - p. 1 Rapid Miner vincenzo.delia@polito.it Archivi Multimediali
DettagliSistema Informativo Gestione Fidelizzazione Clienti MANUALE D USO
Sistema Informativo Gestione Fidelizzazione Clienti MANUALE D USO Login All apertura il programma controlla che sia stata effettuata la registrazione e in caso negativo viene visualizzato un messaggio.
Dettagli1- OBIETTIVI DEL DOCUMENTO 2- INTRODUZIONE
1- OBIETTIVI DEL DOCUMENTO... 1 2- INTRODUZIONE... 1 3- ACCESSO ALLA PROCEDURA... 2 4- COMPILAZIONE ON-LINE... 4 5- SCELTA DELLA REGIONE O PROVINCIA AUTONOMA... 5 6- DATI ANAGRAFICI... 6 7- DATI ANAGRAFICI
DettagliEsercizi sull Association Analysis
Data Mining: Esercizi sull Association Analysis 1 Esercizi sull Association Analysis 1. Si consideri il mining di association rule da un dataset T di transazioni, rispetto a delle soglie minsup e minconf.
Dettagli(a cura di Francesca Godioli)
lezione n. 12 (a cura di Francesca Godioli) Ad ogni categoria della variabile qualitativa si può assegnare un valore numerico che viene chiamato SCORE. Passare dalla variabile qualitativa X2 a dei valori
DettagliAnalisi di Mercato. Facoltà di Economia. Analisi sui consumi. Metodo delle inchieste familiari. Metodo delle disponibilità globali
Obiettivi delle aziende Analisi di Mercato Facoltà di Economia francesco mola Analisi sui consumi Conoscere i bisogni e i gusti dei consumatori Valutare la soddisfazione della clientela Lanciare nuovi
DettagliInformatica (Basi di Dati)
Corso di Laurea in Biotecnologie Informatica (Basi di Dati) Modello Entità-Relazione Anno Accademico 2009/2010 Da: Atzeni, Ceri, Paraboschi, Torlone - Basi di Dati Lucidi del Corso di Basi di Dati 1, Prof.
DettagliPiattaforma software mfp
Piattaforma software mfp MANUALE UTENTE DELL APPLICATIVO LABORATORY Introduzione Il presente manuale ha l obiettivo di presentare le funzionalità dell applicativo AGENDA inserito nella piattaforma informatica
DettagliSVM. Veronica Piccialli. Roma 11 gennaio 2010. Università degli Studi di Roma Tor Vergata 1 / 14
SVM Veronica Piccialli Roma 11 gennaio 2010 Università degli Studi di Roma Tor Vergata 1 / 14 SVM Le Support Vector Machines (SVM) sono una classe di macchine di che derivano da concetti riguardanti la
DettagliFunzioni in C. Violetta Lonati
Università degli studi di Milano Dipartimento di Scienze dell Informazione Laboratorio di algoritmi e strutture dati Corso di laurea in Informatica Funzioni - in breve: Funzioni Definizione di funzioni
DettagliCodifiche a lunghezza variabile
Sistemi Multimediali Codifiche a lunghezza variabile Marco Gribaudo marcog@di.unito.it, gribaudo@elet.polimi.it Assegnazione del codice Come visto in precedenza, per poter memorizzare o trasmettere un
DettagliManPro.Net: Principali caratteristiche del prodotto.
ManPro.Net: Principali caratteristiche del prodotto. Accesso alle comesse Gestione Multicomessa Articolazione delle attività e delle responsabilità di intervento divise per Settori o per Componenti di
Dettagli7.2 Indagine di Customer Satisfaction
7.2 Indagine di Customer Satisfaction Il campione L indagine è stata condotta su un campione a più stadi di 795 clienti TIEMME SpA (errore di campionamento +/ 2%) rappresentativo della popolazione obiettivo,
DettagliEsame di Informatica CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO. Facoltà di Scienze Motorie
Facoltà di Scienze Motorie CHE COS È UN FOGLIO ELETTRONICO Una tabella che contiene parole e numeri che possono essere elaborati applicando formule matematiche e funzioni statistiche. Esame di Informatica
DettagliIl calendario di Windows Vista
Il calendario di Windows Vista Una delle novità introdotte in Windows Vista è il Calendario di Windows, un programma utilissimo per la gestione degli appuntamenti, delle ricorrenze e delle attività lavorative
DettagliUniversità di L Aquila Facoltà di Biotecnologie Agro-alimentari
RIFERIMENTI Università di L Aquila Facoltà di Biotecnologie Agro-alimentari Esame di Laboratorio di informatica e statistica Parte 3 (versione 1.0) Il riferimento permette di identificare univocamente
DettagliFLASHINVESTOR Manuale dell Utente
FLASHINVESTOR Manuale dell Utente Questa breve guida ha lo scopo di aiutare l utente a prendere confidenza con il prodotto in modo da sfruttarne appieno tutte le potenzialità. Abbiamo cercato di realizzare
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliClustering. Utilizziamo per la realizzazione dell'esempio due tipologie di software:
Esercizio Clustering Utilizziamo per la realizzazione dell'esempio due tipologie di software: - XLSTAT.xls - Cluster.exe XLSTAT.xls XLSTAT.xls è una macro di Excel che offre la possibilità di effettuare
DettagliStatistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
DettagliSi aprirà una schermata dove verranno proposte le gare assegnate
Come compilare la scheda on line dei programmi di gara. Vediamo nel dettaglio quali sono le cose da fare per compilare correttamente un programma di gara on line. Ogni società può accedere alle schede
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliIndice di rischio globale
Indice di rischio globale Di Pietro Bottani Dottore Commercialista in Prato Introduzione Con tale studio abbiamo cercato di creare un indice generale capace di valutare il rischio economico-finanziario
DettagliManuale operatore per l utilizzo dell utente di dominio
Manuale operatore per l utilizzo dell utente di dominio Sommario Manuale operatore per l utilizzo dell utente di dominio... 1 1. Account personale di dominio... 2 2. Account generico di dominio... 2 3.
DettagliRapporto ambientale Anno 2012
Rapporto ambientale Anno 2012 Pagina 1 di 11 1 ANNO 2012 Nell anno 2005 la SITI TARGHE srl ha ottenuto la certificazione ambientale secondo la norma internazionale ISO 14001:2004, rinnovata nel 2008 e
DettagliSuggerimenti per l approccio all analisi dei dati multivariati
Suggerimenti per l approccio all analisi dei dati multivariati Definizione degli obbiettivi Il primo passo è la definizione degli obbiettivi. Qual è l obbiettivo della sperimentazione i cui dati dovete
DettagliLa categoria «ES» presenta (di solito) gli stessi comandi
Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:
DettagliCorso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione : Misurazione, tabelle 1 Misurazione Definizione: La misura è l attribuzione di un valore numerico
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) La Regressione Multipla La Regressione Multipla La regressione multipla
DettagliExcel avanzato. I nomi. Gli indirizzi e le formule possono essere sostituiti da nomi. Si creano tramite Inserisci Nome Definisci
Excel avanzato I nomi marco.falda@unipd.it Gli indirizzi e le formule possono essere sostituiti da nomi documentazione astrazione Si creano tramite Inserisci Nome Definisci Vengono raccolti nell area riferimento
DettagliDESIGN PATTERN ESERCITAZIONE UML E DP INGEGNERIA DEL SOFTWARE. A quali pattern si riferiscono i tre schemi?
ESERCITAZIONE UML E DP INGEGNERIA DEL SOFTWARE Università degli Studi di Padova Dipartimento di Matematica Corso di Laurea in Informatica, A.A. 2014 2015 rcardin@math.unipd.it DESIGN PATTERN A quali pattern
Dettagli3 - Variabili. Programmazione e analisi di dati Modulo A: Programmazione in Java. Paolo Milazzo
3 - Variabili Programmazione e analisi di dati Modulo A: Programmazione in Java Paolo Milazzo Dipartimento di Informatica, Università di Pisa http://www.di.unipi.it/ milazzo milazzo di.unipi.it Corso di
DettagliLA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di
STATISTICA LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di oggetti; cerca, attraverso l uso della matematica
Dettagli