Weka: Weikato university Environment for Knowledge Analysis
|
|
- Geraldina Greco
- 8 anni fa
- Visualizzazioni
Transcript
1 : Weikato university Environment for Knowledge Analysis Corso di Data e Text Mining Ing. Andrea Tagarelli Università della Calabria Acknowledgements: Salvatore Ruggieri, Dip. di Informatica, Univ. di Pisa
2 Corso di Data e Text Mining
3 ! Software per machine learning / data mining! Scritto in Java distribuito con licenza GNU GPL! Funzionalità / Limiti: Insieme completo di algoritmi di preprocessing, learning e tecniche di valutazione Estendibile Non efficiente / scalabile: mantiene i dati in memoria
4 Versioni! Download: Aprile 2006, 3.4.7! Riferimento Data Mining by Witten & Frank, 2005
5 : interfacce 1/4! Explorer GUI a scomparti per operazioni di preprocessing, classificazione, clustering, regole associative
6 : interfacce 2/4! KnowledgeFlow GUI a flussi per operazioni di preprocessing e classificazione.
7 : interfacce 3/4! Simple CLI (Call Level Interface) accesso a oggetti e metodi del sistema mediante linea di comando
8 : interfacce 4/4! Experimenter Automazione serie di esperimenti di learning variando datasets, algoritmi e parametri
9 : messaggi ed errori
10 Formati di input/output! ARFF! JDBC! Binari (classi Java serializzate)! CSV! C4.5
11 Attribute-Relation File Format tabella % nome cognome eta professione string % Mario,Bianchi,23,Studente Luigi,Rossi,?,Operaio Anna,Verdi,50, Dottorando di ricerca Rosa,Neri,20,Studente Nome della tabella Linea di commento Nome e tipo colonna Inizio dati Missing value Quoting
12 Tipi ARFF! Enumerati o CdL {informatica,tecnologie,infeconomia} Nominali à identificatori univoci (Cod. Fiscale) Categoriche à etichette ripetibili (Città) Ordinali à è definito un ordine (low < high) Binarie à due soli valori (T/F, 1/0,...)! Continui (int, real, eta numeric! Stringhe! indirizzo datanascita date "yyyy-mm-dd HH:mm:ss"
13 Data Preprocessing e Visualization in Explorer
14 Explorer! Metafora: a task, un pannello per tipologia di analisi Pre-processing Visualizzazione Selezione degli attributi Classificazione Clustering Regole associative
15 Preprocessing: accesso ai dati File Url JDBC
16 Preprocessing: accesso ai dati
17 Edit e Salva Relazione Attributo classe Statistiche Attributi Distribuzione
18 Rimozione di un attributo Attributo selezionato Rimuovi
19 Edit della relazione
20 Filtri: selezione
21 Filtri: selezione
22 Filtri: opzioni
23 Filtri: applicazione
24 Filtri: applicazione Relazione Statistiche Distribuzione
25 Il Data Preprocessing è un processo! Accesso ai Dati! Esplorazione dei Dati Sorgenti Quantità Qualità! Ampliamento e arricchimento dei dati! Applicazione di tecniche specifiche
26 Il Data Preprocessing è un processo! Obiettivo: analisi preventiva per la riduzione dei dati ad un data set di minore dimensione! I dati devono essere significativi e non ridondanti! L analisi viene fatta sugli attributi e sulle istanze
27 Data Preprocessing: operazioni! Alcune operazioni sono necessarie Studio dei dati Pulizia dei dati Campionamento! Altre possono essere guidate dagli obiettivi Trasformazioni Selezioni
28 Data Preprocessing: problemi! Troppi dati dati sbagliati, rumorosi dati non rilevanti dimensionalità intrattabile mix di dati numerici/simbolici! Pochi dati attributi mancanti valori mancanti dimensionalità insufficiente
29 Data Preprocessing: problemi! Sparsità Mancanza di valore associato ad una variabile w Un attributo è sparso se contiene molti valori nulli! Monotonicità Crescita continua dei valori di una variabile w w Intervallo [-, ] (o simili) Non ha senso considerare l intero intervallo! Outliers Valori singoli o con frequenza estremamente bassa Possono distorcere le informazioni sui dati! Dimensionalità Il numero di valori che una variabile può assumere può essere estremamente alto Tipicamente riguarda valori categorici! Anacronismo Una variabile può essere contingente: abbiamo i valori in una sola porzione dei dati
30 Data Preprocessing: esplorazione dei dati Corso di Data e Text Mining! Uso di misure di statistica descrittiva Indici di valore centrale w Media, mediana, moda Indici di dispersione o variabilità w Varianza, deviazione standard, etc.! Visualizzazione dei dati Diagrammi a barre, etc.
31 Data Preprocessing in! Sostituzione dei valori NULL: Utilizzando media/mediana/moda Predicendo i valori mancanti utilizzando la distribuzione dei valori non nulli Segmentando i dati (tramite le distribuzioni di altre variabili) e utilizzando misure statistiche (media/ moda/mediana) di ogni segmento Costruendo un modello di regressione! In i valori nulli vengono sostituiti con le medie e le mode calcolate sui dati di training (ReplaceMissingValues filter)
32 Data Preprocessing in! Eliminazione degli attributi necessaria se: esistono moltissimi valori NULL esistono pochissimi valori distinti esiste una correlazione con altri attributi! In tale funzione è svolta dal filtro Remove cancella uno specificato set di attributi dal dataset di partenza
33 Data Preprocessing in! La Normalizzazione è utile in presenza di: Errori nei dati Dati incompleti Forte asimmetria nei dati w diversi raggruppamenti esprimono comportamenti differenti w Molti picchi residui larghi e sistematici nella definizione di un modello! La modifica della forma dei dati può alleviare questi problemi! In tale funzione èsvolta dal filtro Normalize I valori risultanti sono compresi tra [0,1]
34 Data Preprocessing in! Discretizzare: perché? I dati originali possono avere valori continui estremamente sparsi I dati discretizzati possono essere più semplici da interpretare Le distribuzioni dei dati discretizzate possono avere una forma normale! Esistono due modalità di discretizzazione: Supervisionata Non supervisionata
35 Data Preprocessing in! Discretizzazione non supervisionata: Discretizza senza un preciso criterio (GAIN, ENTROPIA ) Il numero di classi è noto a priori Natural binning w intervalli di identica ampiezza Equal Frequency binning w intervalli di identica frequenza Statistical binning w utilizza misure statistiche: media e varianza, quartili
36 Data Preprocessing in! Discretizzazione supervisionata la discretizzazione ha un obiettivo quantificabile (entropia, guadagno) Il numero di classi non è noto a priori I dati discretizzati possono essere ancora estremamente sparsi w eliminazione della variabile in oggetto
37 Data Preprocessing in! Riduzione del dataset In è possibile ottenere un sottoinsieme del dataset originale utilizzando il filtro Resample Il dataset ridotto è ottenuto attraverso una scelta random sulle sue istanze w Verifica della forma delle distribuzioni degli attributi del sottoinsieme rispetto a quelle del dataset originale
38 Explorer: filtri di preprocessing! Supervisionati Su attributi Su istanze (righe)! Non supervisionati Su attributi Su istanze (righe)! Aggiunti Classi Java
39 Filtri non supervisionati: Aggiunta e rimozione attributi! Add / AddExpression / Copy Aggiunta nuovo attributo con tutti i valori? / con valori calcolati mediante espressione / con valori copiati da un altro attributo! Remove / RemoveType / RemoveUseless Rimuove un attributo / di un certo tipo / con valori sempre costanti o troppo variabili (valori distinti / totale valori * 100) > 80 Rimuove gli attributi con variabilità superiore all 80%
40 Filtri non supervisionati: Trasformazioni attributi! NumericTransformation Calcola una funzione matematica sui valori! ReplaceMissingValues Rimpiazza? con moda (attributi discreti) e media (attributi continui)! Add noise Perturba una percentuale di valori di un attributo! MergeTwoValues Fonde due valori di un attributo in uno solo
41 Filtri non supervisionati: Trasformazioni attributi! ChangeDateFormat Cambia il formato di rappresentazione di un attributo data! Obfuscate Rinomina tutte le stringhe della relazione (per motivi di privacy)
42 Filtri non supervisionati: Normalizzazione attributi! Normalize Normalizzazione di tutti gli attributi numerici nell intervallo [0,1] (x Min) / (Max-Min)! Standardize Z-score normalizzazione (media = 0 e varianza = 1) (x media) / varianza
43 Filtri non supervisionati: Discretizzazione attributi! Discretize Discretizzazione dei valori Equal width N intervalli aventi la stessa ampiezza Equal frequency N intervalli aventi (approx) la stessa frequenza! PKDiscretize Equal frequency con N = SQRT( #valori non nulli )
44 Corso di Data e Text Mining
45 Filtri non supervisionati: Tipologia attributi:! Make indicator Trasforma un attributo discreto in binario secondo il test: valore in {v1,, vk}! NumericToBinary Trasforma gli attributi continui in binari secondo il test: valore == 0! NominalToBinary Trasforma attributi discreti con K valori in K attributi binari
46 Filtri non supervisionati: Tipologia attributi:! StringToNominal Trasforma un attributo stringa in uno enumerato! NumericToBinary Trasforma gli attributi continui in binari secondo il test: valore == 0! NominalToBinary Trasforma attributi discreti con K valori in K attributi binari
47 Filtri non supervisionati: Selezione e sampling di istanze:! RemoveFolds Seleziona 1 su record! RemovePercentage Seleziona una percentuale dei record in modo casuale! Randomize Mescola record in modo casuale! Resample Seleziona una percentuale dei record in modo casuale con rimpiazzamento
48 Filtri non supervisionati: Selezione e sampling di istanze:! RemoveWithValue Rimuove record con un determinato valore di un attributo! RemoveRange Seleziona un intervallo di record
49 Filtri supervisionati:! Attributo speciale Detto classe cui il filtro fa riferimento Per default è l ultimo attributo Seleziona classe
50 Filtri supervisionati: Su attributi:! Discretize Discretizzazione supervisionata Su istanze:! StratifiedRemoveFolds Seleziona 1 su record mantenendo la proporzione originaria delle classi! Resample / SpreadSample Seleziona campione casuale con controllo della distribuzione dei valori della classe Es., campione del 30% dei clienti in cui la percentuale di uomini sia uguale / il doppio a quella di donne
51 Explorer! Metafora: a task, un pannello per tipologia di analisi Pre-processing Visualizzazione Selezione degli attributi Classificazione Clustering Regole associative
52 Visualizzazione: preprocess Attributo classe Distribuzione
53 Visualizzazione: visualize Aggiorna Seleziona attributi Campione Attributo classe
54 Visualizzazione: visualize
55 Explorer! Metafora: a task, un pannello per tipologia di analisi Pre-processing Visualizzazione Selezione degli attributi Classificazione Clustering Regole associative
56 Selezione attributi Metodo di valutazione Metodo di ricerca Attributo classe
57 Selezione attributi Pannello delle selezioni
58 Selezione attributi! Valutazione (singolo) attributo Information Gain Chi-Square Gain-Ratio Principal Component Analysis Basato su classificatori
59 Selezione attributi! Valutazione gruppi di attributi Valuta ciascun singolo e combina le valutazioni con strategie di ricerca: w Ranker w Ricerca esaustiva w BestFirst (con backtracking) w Ricerca casuale
60 Selezione attributi! Filtro (preprocessing) supervised AttributeSelection Utile per automatizzare la selezione di attributi rilevanti
61 : KnowledgeFlow
62 KnowledgeFlow! KnowledgeFlow GUI a flussi per operazioni di preprocessing e classificazione.
63 Knowledge Flow: layouts Task List Help Load/save layouts Knowledge Flow Layout Status Log
64 Sorgenti/Destinazioni di dati
65 Configurare sorgente
66 Visualizzatori! DataVisualizers / ScatterPlotMatrix 2D scatterplot / matrice di 2D scatterplot! AttributeSummarizer Distribuzione dei valori negli attributi! TextViewer / GraphViewer Visualizza dati/modelli in formato testuale / grafico
67 Connessione sorgente->task
68 Avvio elaborazione flusso
69 Visualizzazione risultati
70 Filtri (di preprocessing):
Data mining. Vincenzo D Elia. vincenzo.delia@polito.it. DBDMG - Politecnico di Torino
Data mining Vincenzo D Elia vincenzo.delia@polito.it DBDMG - Politecnico di Torino vincenzo.delia@polito.it Archivi Multimediali e Data Mining - p. 1 Rapid Miner vincenzo.delia@polito.it Archivi Multimediali
DettagliUno standard per il processo KDD
Uno standard per il processo KDD Il modello CRISP-DM (Cross Industry Standard Process for Data Mining) è un prodotto neutrale definito da un consorzio di numerose società per la standardizzazione del processo
DettagliAccess. P a r t e p r i m a
Access P a r t e p r i m a 1 Esempio di gestione di database con MS Access 2 Cosa è Access? Access e un DBMS che permette di progettare e utilizzare DB relazionali Un DB Access e basato sui concetti di
DettagliLABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL
DettagliPreprocessamento dei Dati
Preprocessamento dei Dati Raramente i dati sperimentali sono pronti per essere utilizzati immediatamente per le fasi successive del processo di identificazione, a causa di: Offset e disturbi a bassa frequenza
DettagliLABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE
LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile
DettagliCOLLI. Gestione dei Colli di Spedizione. Release 5.20 Manuale Operativo
Release 5.20 Manuale Operativo COLLI Gestione dei Colli di Spedizione La funzione Gestione Colli consente di generare i colli di spedizione in cui imballare gli articoli presenti negli Ordini Clienti;
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V
Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.
DettagliProgettazione di Basi di Dati
Progettazione di Basi di Dati Prof. Nicoletta D Alpaos & Prof. Andrea Borghesan Entità-Relazione Progettazione Logica 2 E il modo attraverso il quale i dati sono rappresentati : fa riferimento al modello
DettagliAutomazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it
Automazione Industriale (scheduling+mms) scheduling+mms adacher@dia.uniroma3.it Introduzione Sistemi e Modelli Lo studio e l analisi di sistemi tramite una rappresentazione astratta o una sua formalizzazione
DettagliCosa è un foglio elettronico
Cosa è un foglio elettronico Versione informatica del foglio contabile Strumento per l elaborazione di numeri (ma non solo...) I valori inseriti possono essere modificati, analizzati, elaborati, ripetuti
DettagliIndici (Statistiche) che esprimono le caratteristiche di simmetria e
Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica
DettagliCorso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
DettagliDatabase. Si ringrazia Marco Bertini per le slides
Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida
DettagliStrumenti per l Analisi l. ed il Preprocessing dei dati. Francesco Folino. Introduzione
Strumenti per l Analisi l ed il Preprocessing dei dati Francesco Folino Obiettivo Introdurre gli aspetti essenziali della fase di preparazione dei dati Acquisire padronanza di un processo tipicamente artigianale
DettagliLA GESTIONE DELLE VISITE CLIENTI VIA WEB
LA GESTIONE DELLE VISITE CLIENTI VIA WEB L applicazione realizzata ha lo scopo di consentire agli agenti l inserimento via web dei dati relativi alle visite effettuate alla clientela. I requisiti informatici
DettagliEsperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale
Esperienze di Apprendimento Automatico per il corso di lippi@dsi.unifi.it Dipartimento Sistemi e Informatica Università di Firenze Dipartimento Ingegneria dell Informazione Università di Siena Introduzione
DettagliStatistica inferenziale
Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo
DettagliAutomatizzare i compiti ripetitivi. I file batch. File batch (1) File batch (2) Visualizzazione (2) Visualizzazione
Automatizzare i compiti ripetitivi I file batch Anno accademico 2000-01 1 Spesso capita di dover eseguire ripetutatmente una data sequenza di comandi Introdurli uno a uno da tastiera è un processo lento
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva
Università del Piemonte Orientale Corsi di Laurea Triennale di Area Tecnica Corso di Statistica e Biometria Statistica descrittiva 1 Statistica Funzioni Descrittiva Induttiva (inferenziale) Statistica
DettagliEPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it. www.psicometria.unich.
EPG Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it www.psicometria.unich.it GIORNI E ORARI LEZIONI Sabato 01-03-2014 h 08:00-12:00 Sabato
DettagliDispensa di database Access
Dispensa di database Access Indice: Database come tabelle; fogli di lavoro e tabelle...2 Database con più tabelle; relazioni tra tabelle...2 Motore di database, complessità di un database; concetto di
DettagliDisegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Rcmdr
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Rcmdr http://www.r-project.org http://qplab.psy.unipd.it Che cos è Rcmdr? Rcmdr è un pacchetto che possiamo scaricare dal CRAN e installare su
DettagliVALORE DELLE MERCI SEQUESTRATE
La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune
Dettagli3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS
Per utilizzare SPSS sui PC dell aula informatica occorre accedere come: ID: SPSS Password: winidams Testo rapido di consultazione: Fideli R. Come analizzare i dati al computer. ed. Carocci, Urbino, 2002.
DettagliRegione Toscana. ARPA Fonte Dati. Manuale Amministratore. L. Folchi (TAI) Redatto da
ARPA Fonte Dati Regione Toscana Redatto da L. Folchi (TAI) Rivisto da Approvato da Versione 1.0 Data emissione 06/08/13 Stato DRAFT 1 Versione Data Descrizione 1,0 06/08/13 Versione Iniziale 2 Sommario
DettagliCORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)
Ambiente Access La Guida di Access Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?) Guida in linea Guida rapida Assistente di Office indicazioni
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliModulo 3 - Elaborazione Testi 3.5 Stampa unione
Università degli Studi dell Aquila Corso ECDL programma START Modulo 3 - Elaborazione Testi 3.5 Stampa unione Maria Maddalena Fornari Stampa Unione Processo che permette di unire dati provenienti da tipi
DettagliIntroduzione all analisi dei segnali digitali.
Introduzione all analisi dei segnali digitali. Lezioni per il corso di Laboratorio di Fisica IV Isidoro Ferrante A.A. 2001/2002 1 Segnali analogici Si dice segnale la variazione di una qualsiasi grandezza
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliOrganizzazione delle informazioni: Database
Organizzazione delle informazioni: Database Laboratorio Informatico di base A.A. 2013/2014 Dipartimento di Scienze Aziendali e Giuridiche Università della Calabria Dott. Pierluigi Muoio (pierluigi.muoio@unical.it)
DettagliExcel avanzato. I nomi. Gli indirizzi e le formule possono essere sostituiti da nomi. Si creano tramite Inserisci Nome Definisci
Excel avanzato I nomi marco.falda@unipd.it Gli indirizzi e le formule possono essere sostituiti da nomi documentazione astrazione Si creano tramite Inserisci Nome Definisci Vengono raccolti nell area riferimento
DettagliNOTE OPERATIVE. Prodotto Inaz Download Manager. Release 1.3.0
Prodotto Inaz Download Manager Release 1.3.0 Tipo release COMPLETA RIEPILOGO ARGOMENTI 1. Introduzione... 2 2. Architettura... 3 3. Configurazione... 4 3.1 Parametri di connessione a Internet... 4 3.2
DettagliMETODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI
METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI 1.1 La Statistica La Statistica è la scienza che raccoglie, elabora ed interpreta i dati (informazioni) relativi ad un dato fenomeno oggetto di osservazione.
DettagliManuale Terminal Manager 2.0
Manuale Terminal Manager 2.0 CREAZIONE / MODIFICA / CANCELLAZIONE TERMINALI Tramite il pulsante NUOVO possiamo aggiungere un terminale alla lista del nostro impianto. Comparirà una finestra che permette
DettagliElena Baralis 2013 Politecnico di Torino 1
Modello relazionale Docente M2170 Fondamenti di informatica Verdi M4880 Sistemi di elaborazione Bianchi F0410 Basi di dati Neri Docenti Nome Dipartimento Telefono Verdi Informatica 123456 Bianchi Elettronica
DettagliVersione 2015I PROTOCOLLO: CRS/SG-PAC/151021
MyDB - Anagrafiche estensioni dei Documenti di Magazzino e delle Parcelle Nella definizione delle anagrafiche MyDB è ora possibile estendere direttamente anche le TESTATE e le RIGHE delle varie tipologie
DettagliCorso di Archivistica
Corso di Archivistica e gestione documentale Prima Parte - Area Informatica Le tabelle Lezione 6 Creare un data base Introduzione La presente è la prima di una serie di lezioni finalizzate alla creazione
DettagliModelli descrittivi, statistica e simulazione
Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica descrittiva Cernusco S.N., giovedì 21 gennaio 2016 (9.00/13.00)
DettagliRicerca di outlier. Ricerca di Anomalie/Outlier
Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla
DettagliIndice Statistiche Univariate Statistiche Bivariate
Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................
DettagliProgramma del Corso per Segretaria d Azienda:
Programma del Corso per Segretaria d Azienda: Modulo 1. Uso del computer e gestione file Utilizzare le funzioni principali del sistema operativo, incluse la modifica delle impostazioni principali e l utilizzo
DettagliRiccardo Dutto, Paolo Garza Politecnico di Torino. Riccardo Dutto, Paolo Garza Politecnico di Torino
Integration Services Project SQL Server 2005 Integration Services Permette di gestire tutti i processi di ETL Basato sui progetti di Business Intelligence di tipo Integration services Project SQL Server
DettagliAprire WEKA Explorer Caricare il file circletrain.arff Selezionare random split al 66% come modalità di test Selezionare J48 come classificatore e
Alberi di decisione Aprire WEKA Explorer Caricare il file circletrain.arff Selezionare random split al 66% come modalità di test Selezionare J48 come classificatore e lanciarlo con i parametri di default.
DettagliIL SISTEMA INFORMATIVO
IL SISTEMA INFORMATIVO In un organizzazione l informazione è una risorsa importante al pari di altri tipi di risorse: umane, materiali, finanziarie, (con il termine organizzazione intendiamo un insieme
DettagliUtilizzare Event Viewer
Utilizzare Event Viewer Visualizzare lo storico di tutti gli eventi della macchina 1s 2s 1. Cenni Generali 1.1. Cos è Event Viewer Event Viewer (Visualizzatore di eventi) è un tool molto utile di amministrazione
DettagliHBase Data Model. in più : le colonne sono raccolte in gruppi di colonne detti Column Family; Cosa cambia dunque?
NOSQL Data Model HBase si ispira a BigTable di Google e perciò rientra nella categoria dei column store; tuttavia da un punto di vista logico i dati sono ancora organizzati in forma di tabelle, in cui
DettagliDatabase Manager Guida utente DMAN-IT-01/09/10
Database Manager Guida utente DMAN-IT-01/09/10 Le informazioni contenute in questo manuale di documentazione non sono contrattuali e possono essere modificate senza preavviso. La fornitura del software
DettagliOCCUPATI SETTORE DI ATTIVITA' ECONOMICA
ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971
DettagliOperazioni sui database
Operazioni sui database Le operazioni nel modello relazionale sono essenzialmente di due tipi: Operazioni di modifica della base di dati (update) Interrogazioni della base di dati per il recupero delle
DettagliValutazione profili di competenza. Manuale operativo
Valutazione profili di competenza Manuale operativo Indice 1. Introduzione... 3 2. Accesso all applicativo... 3 3. Valutazione profilo di competenza... 4 3.1 Premessa...4 3.2 Fase di valutazione...5 3.3
DettagliProgetto: ARPA Fonte Dati. ARPA Fonte Dati. Regione Toscana. Manuale Amministratore
ARPA Fonte Dati Regione Toscana 1 Redatto da L. Folchi (TAI) Rivisto da Approvato da Versione 1.1 Data emissione 09/10/13 Stato FINAL 2 Versione Data Descrizione 1,0 06/08/13 Versione Iniziale 1.1 09/10/2013
Dettagli(A) CONOSCENZA TERMINOLOGICA (B) CONOSCENZA E COMPETENZA (C) ESERCIZI DI COMPRENSIONE
(A) CONOSCENZA TERMINOLOGICA Dare una breve descrizione dei termini introdotti: Caselle di testo Caselle di riepilogo Caselle combinate Gruppo di opzioni Pulsanti di comando (B) CONOSCENZA E COMPETENZA
DettagliGestione delle informazioni necessarie all attività di validazione degli studi di settore. Trasmissione degli esempi da valutare.
Gestione delle informazioni necessarie all attività di validazione degli studi di settore. Trasmissione degli esempi da valutare. E stato previsto l utilizzo di uno specifico prodotto informatico (denominato
DettagliTecniche di personalizzazione di interfacce Web
Tecniche di personalizzazione di interfacce Web Parte dei contenuti delle seguenti slides sono stati estratti da Tasso C., Omero P, La personalizzazione dei contenuti WEB, Franco Angeli, 2002 ed arricchite
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliSistemi Operativi MECCANISMI E POLITICHE DI PROTEZIONE. D. Talia - UNICAL. Sistemi Operativi 13.1
MECCANISMI E POLITICHE DI PROTEZIONE 13.1 Protezione Obiettivi della Protezione Dominio di Protezione Matrice di Accesso Implementazione della Matrice di Accesso Revoca dei Diritti di Accesso Sistemi basati
DettagliMECCANISMI E POLITICHE DI PROTEZIONE 13.1
MECCANISMI E POLITICHE DI PROTEZIONE 13.1 Protezione Obiettivi della Protezione Dominio di Protezione Matrice di Accesso Implementazione della Matrice di Accesso Revoca dei Diritti di Accesso Sistemi basati
DettagliEUROPEAN COMPUTER DRIVING LICENCE. Use of the GIS Software. Syllabus
EUROPEAN COMPUTER DRIVING LICENCE Use of the GIS Software Syllabus Scopo Questo documento presenta il syllabus di ECDL GIS Modulo 3 Uso di un software GIS. Il syllabus descrive, attraverso i risultati
DettagliCapitolo 3. L applicazione Java Diagrammi ER. 3.1 La finestra iniziale, il menu e la barra pulsanti
Capitolo 3 L applicazione Java Diagrammi ER Dopo le fasi di analisi, progettazione ed implementazione il software è stato compilato ed ora è pronto all uso; in questo capitolo mostreremo passo passo tutta
DettagliPunto Print Il programma per stampare. Documentazione Tecnica
Punto Print Il programma per stampare Documentazione Tecnica 1 Punto Software di Iselle Mirko Documentazione tecnica PuntoPrint 1. Installazione Per effettuare l installazione del programma, decomprimere
DettagliSQL Server 2005. Integration Services. SQL Server 2005: ETL - 1. Integration Services Project
atabase and ata Mi ni ng Group of P ol itecnico di Torino atabase and ata Mi ni ng Group of P ol itecnico di Torino atabase and data mining group, SQL Server 2005 Integration Services SQL Server 2005:
DettagliWG-TRANSLATE Manuale Utente WG TRANSLATE. Pagina 1 di 15
WG TRANSLATE Pagina 1 di 15 Sommario WG TRANSLATE... 1 1.1 INTRODUZIONE... 3 1 TRADUZIONE DISPLAY FILE... 3 1.1 Traduzione singolo display file... 4 1.2 Traduzione stringhe da display file... 5 1.3 Traduzione
DettagliI Sistemi Informativi
I Sistemi Informativi Definizione Un Sistema Informativo è un mezzo per acquisire, organizzare, correlare, elaborare e distribuire le informazioni che riguardano una realtà che si desidera descrivere e
DettagliITER Imprese & Territorio
ITER Imprese & Territorio Generalità...2 La Scheda Impresa...4 Il sistema di Rating...6 Bilanci...7 Analisi di composizione...8 Elenchi imprese...9 Milano, novembre 2009 1 GENERALITÀ ITER è una applicazione,
DettagliRepairsLab Manuale Utente. RepairsLab. Manuale Utente
Pag 1 di 14 RepairsLab Manuale Utente Per RepairsLab 1.0 Autore: Fabrizio Ferraiuolo Indice generale Introduzione...2 Installazione...2 Schermata principale...3 Configurazione...4 Configurazioni Base Dati...5
DettagliWeb Intelligence. Argomenti 10/5/2010. abaroni@yahoo.com
Web Intelligence Argomenti Cap.7 le Tabelle e le Cross Table Cap.8 Modalità di Visualizzazione (Html,Pdf,altro) Cap.9 Creare Formule e utilizzare le Variabili Slide 2 - Copyright 2007 Business Objects
DettagliOrganizzazione degli archivi
COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i
DettagliAVCP Generatore di XML
AVCP Generatore di XML Perché è necessario... 2 Come Funziona... 3 Appalto... 3 Indice... 5 Anagrafiche... 6 Lotto... 7 Partecipanti... 9 Partecipante in Solitario (Partecipante)... 9 Partecipante in Raggruppamento...
DettagliUTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI
UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI Un utilizzatore a valle di sostanze chimiche dovrebbe informare i propri fornitori riguardo al suo utilizzo delle sostanze (come tali o all
DettagliAnalisi dei dati MLPA con il nuovo Coffalyser.NET. MRC-Holland
Analisi dei dati MLPA con il nuovo Coffalyser.NET MRC-Holland Contenuti Che cos è il Coffalyser.NET Analisi dei frammenti e del Copy number Interpretazione dei dati Che cos è il Cofffalyser.NET Software
DettagliECDL AM5 Access Advanced
SANDRO GALLEA ECDL AM5 Access Advanced Guida alla prova d esame per la patente europea di informatica Indice Premessa...pag. 9 AM5.1 Progettazione delle tabelle AM5.1.1 Campi, colonne...» 11 AM5.1.1.1
Dettagliper immagini guida avanzata Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1
Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1 Una tabella Pivot usa dati a due dimensioni per creare una tabella a tre dimensioni, cioè una tabella
DettagliGuida Rapida di Syncronize Backup
Guida Rapida di Syncronize Backup 1) SOMMARIO 2) OPZIONI GENERALI 3) SINCRONIZZAZIONE 4) BACKUP 1) - SOMMARIO Syncronize Backup è un software progettato per la tutela dei dati, ed integra due soluzioni
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliAlgebra Booleana 1 ALGEBRA BOOLEANA: VARIABILI E FUNZIONI LOGICHE
Algebra Booleana 1 ALGEBRA BOOLEANA: VARIABILI E FUNZIONI LOGICHE Andrea Bobbio Anno Accademico 2000-2001 Algebra Booleana 2 Calcolatore come rete logica Il calcolatore può essere visto come una rete logica
Dettagliper immagini guida avanzata Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1
Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1 Il raggruppamento e la struttura dei dati sono due funzioni di gestione dati di Excel, molto simili tra
DettagliRelazioni tra variabili
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina
DettagliManuale Utente CONSERVAZIONE A NORMA Caricamento Singolo & Massivo electronic Document Keeper
Manuale Utente CONSERVAZIONE A NORMA Caricamento Singolo & Massivo electronic Document Keeper Versione 1.1 Agosto 2015 1 Sommario 1 Premessa... 3 1.1 Conservazione delle Fatture per la Pubblica Amministrazione...
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliEsame di Informatica CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO. Facoltà di Scienze Motorie
Facoltà di Scienze Motorie CHE COS È UN FOGLIO ELETTRONICO Una tabella che contiene parole e numeri che possono essere elaborati applicando formule matematiche e funzioni statistiche. Esame di Informatica
Dettagli2003.06.16 Il sistema C.R.M. / E.R.M.
2003.06.16 Il sistema C.R.M. / E.R.M. Customer / Enterprise : Resource Management of Informations I-SKIPPER è un sistema di CONOSCENZE che raccoglie ed integra INFORMAZIONI COMMERCIALI, dati su Clienti,
DettagliI database relazionali (Access)
I database relazionali (Access) Filippo TROTTA 04/02/2013 1 Prof.Filippo TROTTA Definizioni Database Sistema di gestione di database (DBMS, Database Management System) Sistema di gestione di database relazionale
DettagliMonitor Orientamento. Manuale Utente
Monitor Orientamento Manuale Utente 1 Indice 1 Accesso al portale... 3 2 Trattamento dei dati personali... 4 3 Home Page... 5 4 Monitor... 5 4.1 Raggruppamento e ordinamento dati... 6 4.2 Esportazione...
DettagliSEGMENTAZIONE INNOVATIVA VS TRADIZIONALE
SEGMENTAZIONE INNOVATIVA VS TRADIZIONALE Arricchimento dei dati del sottoscrittore / user Approccio Tradizionale Raccolta dei dati personali tramite contratto (professione, dati sul nucleo familiare, livello
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliSistema di Monitoraggio e Controllo della Produzione di Materie Plastiche
Sistema di Monitoraggio e Controllo della Produzione di Materie Plastiche Windows NT Pagina di Impostazione Pressa Per ognuna delle presse è possibile dichiarare la sequenza di cambi stampo che deve essere
DettagliPostV Pos e tv n e d n i d ta t : : altre altr e funzi funz on o i n www.sellrapido.com
altre PostVendita: funzioni www.sellrapido.com Stampa scheda inserzioni Stampare una scheda che riporta tutti i dati dell'ordine Per visualizzare una scheda dettagliata sull'ordine, selezionarlo nella
DettagliCorso di Informatica. Immissione di dati. Visualizzazione come foglio dati 1. Visualizzazione come foglio dati 2 11/01/2008
Corso di Informatica Immissione di dati La modalità di inserimento che ricorda più Excel è la visualizzazione come foglio dati Ing. Dario Sguassero Microsoft Access 2/3 11/01/2008 0.35 2 Visualizzazione
DettagliNuovo Order Manager per il software NobelProcera
Nuovo Order Manager per il software NobelProcera Guida rapida versione 1 Il nuovo Order Manager facilita i processi e le procedure di invio degli ordini mediante il sistema NobelProcera, che comprendono
DettagliData mining e rischi aziendali
Data mining e rischi aziendali Antonella Ferrari La piramide delle componenti di un ambiente di Bi Decision maker La decisione migliore Decisioni Ottimizzazione Scelta tra alternative Modelli di apprendimento
DettagliTelerilevamento e GIS Prof. Ing. Giuseppe Mussumeci
Corso di Laurea Magistrale in Ingegneria per l Ambiente e il Territorio A.A. 2014-2015 Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Strutture di dati: DB e DBMS DATO E INFORMAZIONE Dato: insieme
DettagliSuggerimenti per l approccio all analisi dei dati multivariati
Suggerimenti per l approccio all analisi dei dati multivariati Definizione degli obbiettivi Il primo passo è la definizione degli obbiettivi. Qual è l obbiettivo della sperimentazione i cui dati dovete
DettagliBasi di Dati Relazionali
Corso di Laurea in Informatica Basi di Dati Relazionali a.a. 2009-2010 PROGETTAZIONE DI UNA BASE DI DATI Raccolta e Analisi dei requisiti Progettazione concettuale Schema concettuale Progettazione logica
DettagliPostV Pos e tv n e d n i d ta t : : altre altr e funzi funz on o i n www.sellrapido.com
altre PostVendita: funzioni www.sellrapido.com Stampa scheda inserzioni Stampare una scheda che riporta tutti i dati dell'ordine Per visualizzare una scheda dettagliata sull'ordine, selezionarlo nella
DettagliCompilatore risorse display grafico LCD serie IEC-line
Compilatore risorse display grafico LCD serie IEC-line aggiornamento: 22-11-2012 IEC-line by OVERDIGIT overdigit.com 1. Il display grafico LCD I PLC della serie IPC-line possono disporre opzionalmente
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva
Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione
DettagliPremesse alla statistica
Premesse alla statistica Versione 22.10.08 Premesse alla statistica 1 Insiemi e successioni I dati di origine sperimentale si presentano spesso non come singoli valori, ma come insiemi di valori. Richiamiamo
Dettagli