Modelli probabilistici

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Modelli probabilistici"

Transcript

1 Modelli probabilistici Davide Cittaro e Marco Stefani Master bioinformatica 2003 Introduzione L obiettivo di presente lavoro è la classificazione di un insieme di proteine, definite da 27 valori numerici, detti attributi. Il significato degli attributi è sconosciuto, quindi nessuna analisi preventiva è stata possibile, come risulta impossibile verificare la qualità dei dati stessi. Un meta-attributo specifica a quale classe appartiene la proteina; ciò permette una classificazione di tipo supervisionato, che offre il vantaggio di poter misurare l errore commesso dal modello durante la fase di verifica. Gli strumenti software La nostra ricerca cerca di individuare il miglior classificatore per questo specifico insieme di dati, utilizzando due applicazioni, Weka e BN PowerSoft, che permettono di costruire dei classificatori di vario tipo. Weka offre un ampia collezione di classificatori sia supervisionati che non supervisionati. Il comportamento di ogni classificatore può essere modificato e controllato da un insieme specifico di parametri. Individuati i modelli più interessanti, Weka dà la possibilità di definire un ciclo di esperimenti in cui un numero arbitrario di classificatori può essere provato su un insieme di dati; anche il numero di esperimenti è definito dall utente. Diventa facile così confrontare i risultati dei vari classificatori sugli stessi dati, e verificare la stabilità del modello durante le reiterazioni. BN PowerSoft utilizza solo dei modelli bayesiani. In questo caso, la scelta obbligata del classificatore è compensata dal miglior controllo sulla creazione e l addestramento della rete. Gli esperimenti Di seguito riportiamo una breve descrizione del lavoro svolto con i due programmi descritti e i risultati dei relativi esperimenti. Le descrizioni dettagliate dei risultati sono memorizzate in file esterni, i cui riferimenti sono riportati di fianco ai risultati sintetici. WEKA Per trovare i migliori classificatori abbiamo usato Weka Explorer. Abbiamo condotto una serie di test con classificatori che usano metodi di analisi diversi. In tutti i casi, il primo esperimento si è sempre svolto con i parametri di default. Abbiamo verificato le differenze date da un insieme discretizzato rispetto ai dati non modificati. In qualche circostanza abbiamo provato variazioni diverse, come la normalizzazione o la standardizzazione dei dati. La mancanza di miglioramenti ci ha però fatto desistere

2 dall utilizzarli con maggior frequenza. Anche la discretizzazione, quando non peggiora i risultati, non influisce significativamente sulla capacità di classificazione. Nella fase di validazione abbiamo privilegiato la cross-validation rispetto all hold out perché la consideriamo più affidabile nella verifica del modello: ogni istanza viene usata, in momenti diversi, sia nell addestramento che nel test, riducendo la possibilità di classificare male eventuali casi anomali. La valutazione complessiva del classificatore si basa sulla percentuale dei risultati corretti; come risulta dalla Tabella 1, i risultati ottenuti variano sensibilmente, dal 74,59% di ZeroR all 87,48% di IBk. Per semplificare la lettura dei risultati degli esperimenti, mostriamo una tabella riassuntiva con i parametri più significativi. Cliccando sul nome del classificatore, si può accedere alla sezione corrispondente nell Appendice A, che mostra i dati più significativi. I nomi dei file che contengono tutti i dettagli dell esperimento sono elencati nella colonna File. Nome Validazione Opzioni % Corretti File ZeroR XV 10 fold D 74,59 R001/M001 NaiveBayes XV 10 fold D 80,83 R002/M002 NaiveBayes XV 10 fold 80,01 R003/M003 J48 XV 10 fold 82,95 R004/M004 J48 XV 10 fold D 83,09 R005/M005 JRip XV 10 fold 84,15 R006/M006 JRip XV 10 fold D 82,49 R007/M007 JRip HO 66% 84,91 R008/M008 JRip HO 75% 84,95 R009/M009 K* Xv 10 fold 87,43 R010/M010 K* XV 10 fold D 84,57 R011/M011 SMO XV 10 fold D 83,40 R012/M012 Neural Networks HO 75% 84,83 R013/M013 NaiveBayesSimple XV 10 fold 79,81 R014/M014 NaiveBayesUpdateable XV 10 fold 80,01 R015/M015 IB1 XV 10 fold 87,31 R016/M016 IBk XV 10 fold 87,48 R017/M017 IB1 XV 10 fold Ds 82,52 R018/M018 IB1 XV 10 fold D 83,83 R019/M019 IB1 XV 10 fold N 87,31 R020/M020 IB1 XV 10 fold S R021/M021 K* XV 10 fold D 84,43 R022/M022 K* HO 66% D 84,82 R023/M023 K* XV 10 fold A 87,43 R024/M024 IBk HO 66% 86,67 R025/M025 Tabella 1 Classificatori analizzati con Weka Legenda Validazione: XV: Cross validation HO: Hold out Opzioni: D: discretizzazione Ds: discretizzazione supervisionata N: normalizzazione S: standardizzazione A: autoblend (un opzione specifica di K*)

3 Dalla tabella risulta immediatamente che, globalmente, il miglior classificatore è IBk, e che in generale tutti i classificatori basati sulla distanza (IB1, IBk, K*), hanno una buona prestazione. Per i migliori classificatori riportiamo anche i risultati ripartiti per le singole classi. JRip IBk J P P P P P P2 La capacità di classificare correttamente la classe P1 in generale è più elevata rispetto a P2. IBk è il più bilanciato sulle due classi, ottenendo una buona classificazione per entrambe. Nel caso degli altri due, la capacità di discriminare la classe P2 è scarsa: con una percentuale prossima al 50% di veri positivi, essi hanno una capacità di riconoscere P2 paragonabile al lancio di una moneta. Con i migliori classificatori trovati delle categorie lazy, rules e tree, abbiamo svolto con Weka Experimenter dei cicli di test che confrontano direttamente i risultati tra loro e permettono di valutare la stabilità del modello. Non abbiamo preso in considerazione i classificatori bayesiani, perché hanno risultati inferiori rispetto a quelli usati. I classificatori usati sono IBk, JRip e J48. Abbiamo eseguito tre cicli di esperimenti in cui è stato cambiato il metodo di validazione: Ciclo 1: cross-validation con 10 fold o File: expris001/expdef001 Ciclo 2: hold-out al 66% con selezione casuale ad ogni iterazione o File: expris002/expdef002 Ciclo 3: hold-out al 66% conservando la divisione dei due sottoinsiemi o File: expris003/expdef003 Per ogni ciclo abbiamo eseguito 10 ripetizioni. Sotto sono riportati i risultati espressi come percentuale di classificati correttamente. Ciclo 1 Dataset (1) rules.jrip '-F (2) trees.j48.j4 (3) lazy.ibk '-K protein (100) 83.86( 1.64) 82.46( 1.9 ) 87.49( 1.62) v (v/ /*) (0/1/0) (1/0/0) Ciclo 2 Dataset (1) rules.jrip '-F (2) trees.j48.j4 (3) lazy.ibk '-K protein (10) 82.71( 1.29) 81.45( 0.67) 86.94( 0.63) v

4 Ciclo 3 Dataset (v/ /*) (0/1/0) (1/0/0) (1) rules.jrip '-F (2) trees.j48.j4 (3) lazy.ibk '-K protein (1) 81.46(Inf ) 81.29(Inf ) 87 (Inf ) (v/ /*) (0/1/0) (0/1/0) Tra parentesi viene riportata la deviazione standard. I metodi di validazione non influiscono significativamente sulla capacità di classificazione, e IBk si conferma globalmente come il migliore classificatore e il più stabile: sia in termini assoluti che relativi la sua deviazione standard è minore rispetto agli altri. In Tabella 2 riportiamo la sensitività e la specificità per i classificatori usati durante i cicli di esperimenti: essi sono due indicatori importanti per valutare l effettiva capacità del modello di discriminare le proteine. Le formule usate per calcolare i due parametri sono Sensitività: TP / (TP + FN) Specificità: TP / (TP + FP) Esperimento JRip J48 IBk Ciclo 1 Specificità 0,94 0,90 0,92 Sensibilità 0,86 0,87 0,92 Ciclo 2 Specificità 0,94 0,89 0,91 Sensibilità 0,85 0,86 0,91 Ciclo 3 Specificità 0,93 0,87 0,92 Sensibilità 0,84 0,88 0,91 Tabella 2 Specificità e sensibilità JRip mostra contemporaneamente la migliore sensitività e la peggiore specificità, cioè tende a generare un numero di falsi positivi superiore agli altri due modelli. IBk è il più equilibrato, e complessivamente il suo è il comportamento migliore, perché riesce a filtrare meglio i falsi positivi e bilanciare così la minor capacità di classificazione corretta. J48 è il classificatore che si comporta complessivamente peggio. Occorre comunque tenere presente che le differenze sono dell ordine dei centesimi di punto, rendendo le differenze minime. CHENG I dati sono stati subito divisi in due sottoinsiemi per i dati di training e quelli di test, con percentuale di hold-out del 33%. I dati di training sono stati discretizzati con il modulo di pre-processing secondo il metodo supervisionato in base all entropia della classe, che da test preliminari è risultato il più efficiente. Con il modulo Constructor abbiamo poi costruito la rete delle relazioni causa-effetto tra gli attributi dell intero insieme di dati, sperimentando i due valori di soglia 1,0 e 5,0. La soglia influisce direttamente sulla quantità di relazioni trovate: una soglia bassa permette di identificare le relazioni più deboli, e viceversa. In Figura 1 e Figura 2 vengono mostrate le reti prodotte.

5 Figura 1 Relazioni causa-effetto con soglia 1,0 Figura 2 - Relazioni causa-effetto con soglia 5,0 Con il modulo Predictor abbiamo infine costruito una serie di reti bayesiane che variano per alcuni parametri fondamentali dell architettura. Nella costruzione delle reti abbiamo ridefinito le relazioni causa-effetto utilizzando i risultati del Constructor, ma non avendo notato alcuna variazione, anche dal punto di vista numerico, abbiamo deciso di ignorare questi risultati, e di proseguire gli esperimenti utilizzando solo le relazioni causa-effetto di default. Non abbiamo cambiato gli altri parametri, come l ordinamento totale o parziale, perché non abbiamo informazioni sufficienti sul significato degli attributi.

6 Per ogni configurazione abbiamo generato una rete singola e una multipla. I risultati sono riassunti in Tabella 3. Anche in questo caso, è possibile cliccare sul nome dell esperimento per andare alla relativa sezione dell Appendice B che riporta i risultati riassuntivi del classificatore; agli esperimenti abbiamo anche affiancato il riferimento al file che definisce la rete prodotta. Gli altri file prodotti hanno lo stesso nome e una diversa estensione che li identifica: jpg per le immagini delle reti costruite da Predictor o nel caso delle multinet, al nome viene aggiunto p1 o p2 per identificare le due classi bnc per i classificatori log per i file di log txt per i file analitici dei risultati dne per le relazioni causa-effetto in forma analitica, mostrate in Figura 1 e Figura 2. In questo caso i file si chiamano ce1.dne e ce5.dne rispettivamente Esperimento Archittettura Soglia Risultato File 001 S Automatica 81,70±2,29% bn001.bnc 002 M Automatica 82,62±2,25% bn002.bnc 003 S 1,0 81,52±2,30% bn003.bnc 004 M 1,0 81,43±2,31% bn004.bnc 005 S 0,5 82,34±2,26% bn005.bnc 006 M 0,5 83,07±2,22% bn006.bnc 007 S 0,3 81,70±2,29% bn007.bnc 008 M 0,3 82,98±2,23% bn008.bnc 009 S 2,0 80,60±2,34% bn009.bnc 010 M 2,0 80,42±2,35% bn010.bnc 011 S 5,0 79,96±2,37% bn011.bnc 012 M 5,0 75,02±2,57% bn012.bnc Legenda Architettura: S: Rete singola M: rete multipla Tabella 3 Parametri degli esperimenti e risultati In Figura 3 vengono mostrate le percentuali di classificazioni corrette rispetto alla soglia usata, per le due tipologie di reti: per entrambe, il comportamento con soglia bassa è migliore, con il massimo intorno a 0,5. Allontanandosi da questo intorno, i risultati degradano vistosamente, e continuando a sinistra si incorre nell over-fitting, dovuto ad un eccessivo numero di relazioni rispetto al numero di istanze. Aumentando la soglia, il peggioramento è per tutte e due monotono decrescente. Nell intervallo [1, 2] il comportamento delle reti è sostanzialmente identico, ma oltre quest intervallo la rete semplice offre la prestazione migliore senza degradare tanto quanto la multi-net. La single-net mostra complessivamente una stabilità superiore.

7 % classificati corretti Single net Multi net soglia Figura 3 Capacità di classificazione al variare della soglia CONCLUSIONI La migliore delle reti semplici costruite da Cheng, con una percentuale di classificazioni corrette dell 82,34%, ha prestazioni leggermente superiori rispetto alle reti bayesiane di Weka, che raggiungono al massimo una percentuale dell 80,82%. Rispetto alle altre tipologie di classificatori, però, si può notare come in nessun caso le reti bayesiane ottengano risultati superiori; a maggior ragione, esse non sono in grado di ottenere percentuali di classificazione paragonabili al migliore classificatore generato da Weka, IBk, che classifica correttamente l 87,48% delle proteine.

8 Appendice A: Risultati Weka ZeroR discretizzato Definisce l estremo inferiore del risultato della classificazione: classificando gli elementi nella classe più numerosa, predice la media per le classi numeriche o la moda per le classi nominali Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic 0 Mean absolute error Root mean squared error Relative absolute error % Root relative squared error 100 % P P a = P b = P2 NaiveBayes discretizzato Classificatore probabilistico che si basa sugli stimatori di classe. Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P2

9 a = P b = P2 NaiveBayes Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 J48 Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 J48 discretizzato Correctly Classified Instances %

10 Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 JRip Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 JRip discretizzato Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error %

11 P P a = P b = P2 JRip 66% === Evaluation on test split === Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % Total Number of Instances P P a = P b = P2 JRip 75% === Evaluation on test split === Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % Total Number of Instances P P a = P1

12 b = P2 K* Classificatore basato sulle istanze: istanze simili appartengono a classi simili Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 K* discretizzato Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 SMO discretizzato

13 Un algoritmo per l addestramento dei SVM: trasforma il loro risultato in probabilità applicando una funzione sigmoide normale che non si adatta ai dati. Questa implementazione sostituisce globalmente tutti i valori mancanti e trasforma gli attributi nominali in attributi binari Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic 0.47 Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 Neural Networks 75% === Evaluation on test split === Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % Total Number of Instances P P a = P b = P2 Naive Bayes Simple Un classificatore bayesiano semplice in cui gli attributi numerici sono modellati con una distribuzione normale

14 Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 NaiveBayes Updateable Variante del precedente. Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 IB1 Usa una semplice misura della distanza: per ogni istanza dell insieme di test, cerca la minore distanza tra le istanze del training set, e la assegna a quella classe.

15 Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 IBk Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 IB1 discretizzato Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error %

16 P P a = P b = P2 IB1 discretizzato Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 IB1 normalizzato Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P2

17 a = P b = P2 IB1 standardizzato Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 K* discretizzato Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 K* discretizzato 66% === Evaluation on test split ===

18 Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % Total Number of Instances P P a = P b = P2 K* autoblend Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % P P a = P b = P2 IBk 66% === Evaluation on test split === Correctly Classified Instances % Incorrectly Classified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % Total Number of Instances 1193

19 P P a = P b = P2 Appendice B: Risultati Cheng Esperimento 001 Esperimento 002

20 Esperimento 003 Esperimento 004 Esperimento 005

21 Esperimento 006 Esperimento 007 Esperimento 008

22 Esperimento 009 Esperimento 010 Esperimento 011

23 Esperimento 012

Classificazione di un data set di proteine con Weka

Classificazione di un data set di proteine con Weka MODELLI PROBABILISTICI Classificazione di un data set di proteine con Weka SOFIA CIVIDINI 2 INTRODUZIONE Negli ultimi due decenni si è assistito ad un aumento esponenziale nella quantità dell informazione

Dettagli

C4.5 Algorithms for Machine Learning

C4.5 Algorithms for Machine Learning C4.5 Algorithms for Machine Learning C4.5 Algorithms for Machine Learning Apprendimento di alberi decisionali c4.5 [Qui93b,Qui96] Evoluzione di ID3, altro sistema del medesimo autore, J.R. Quinlan Ispirato

Dettagli

Aprire WEKA Explorer Caricare il file circletrain.arff Selezionare random split al 66% come modalità di test Selezionare J48 come classificatore e

Aprire WEKA Explorer Caricare il file circletrain.arff Selezionare random split al 66% come modalità di test Selezionare J48 come classificatore e Alberi di decisione Aprire WEKA Explorer Caricare il file circletrain.arff Selezionare random split al 66% come modalità di test Selezionare J48 come classificatore e lanciarlo con i parametri di default.

Dettagli

Data mining: classificazione DataBase and Data Mining Group of Politecnico di Torino

Data mining: classificazione DataBase and Data Mining Group of Politecnico di Torino DataBase and Data Mining Group of Database and data mining group, Database and data mining group, DataBase and Data Mining Group of DataBase and Data Mining Group of So dati insieme di classi oggetti etichettati

Dettagli

Realizzazione di un sistema predittivo dei risultati del campionato di calcio italiano di serie A 2006/2007

Realizzazione di un sistema predittivo dei risultati del campionato di calcio italiano di serie A 2006/2007 Realizzazione di un sistema predittivo dei risultati del campionato di calcio italiano di serie A 2006/2007 Docente Prof. Giuseppe Manco Studenti Matr.. 96803 Francesco Aiello Matr.. 94881 Vittorio Leo

Dettagli

Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale

Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale Esperienze di Apprendimento Automatico per il corso di lippi@dsi.unifi.it Dipartimento Sistemi e Informatica Università di Firenze Dipartimento Ingegneria dell Informazione Università di Siena Introduzione

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

Altri metodi di indicizzazione

Altri metodi di indicizzazione Organizzazione a indici su più livelli Altri metodi di indicizzazione Al crescere della dimensione del file l organizzazione sequenziale a indice diventa inefficiente: in lettura a causa del crescere del

Dettagli

Riconoscimento e Recupero dell'informazione per Bioinformatica

Riconoscimento e Recupero dell'informazione per Bioinformatica Riconoscimento e Recupero dell'informazione per Bioinformatica LAB. 8 PRTools (2) Pietro Lovato Corso di Laurea in Bioinformatica Dip. di Informatica Università di Verona A.A. 2015/2016 Ripasso: validazione

Dettagli

Mining Positive and Negative Association Rules:

Mining Positive and Negative Association Rules: Mining Positive and Negative Association Rules: An Approach for Confined Rules Alessandro Boca Alessandro Cislaghi Premesse Le regole di associazione positive considerano solo gli item coinvolti in una

Dettagli

Regressione non lineare con un modello neurale feedforward

Regressione non lineare con un modello neurale feedforward Reti Neurali Artificiali per lo studio del mercato Università degli studi di Brescia - Dipartimento di metodi quantitativi Marco Sandri (sandri.marco@gmail.com) Regressione non lineare con un modello neurale

Dettagli

ATTIVAZIONE SCHEDE ETHERNET PER STAMPANTI SATO SERIE ENHANCED

ATTIVAZIONE SCHEDE ETHERNET PER STAMPANTI SATO SERIE ENHANCED ATTIVAZIONE SCHEDE ETHERNET PER STAMPANTI SATO SERIE ENHANCED Il collegamento normale delle schede Ethernet è eseguito installando la scheda e collegando la macchina al sistema. Di norma una rete Ethernet

Dettagli

PTDR Disaster Recovery for oracle database

PTDR Disaster Recovery for oracle database PTDR Disaster Recovery for oracle database INTRODUZIONE... 3 INTRODUZIONE... 3 I MECCANISMI BASE DI ORACLE DATA GUARD... 3 COSA SONO I REDO LOG?... 4 IMPATTO SULL'ARCHITETTURA COMPLESSIVA... 4 CONCLUSIONI...

Dettagli

Intelligenza Artificiale

Intelligenza Artificiale Intelligenza Artificiale Anno accademico 2008-2009 Information Retrieval: Text Categorization Una definizione formale Sia D il dominio dei documenti Sia C = {c 1,,c C } un insieme di categorie predefinite

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Mon Ami 3000 Provvigioni agenti Calcolo delle provvigioni per agente / sub-agente

Mon Ami 3000 Provvigioni agenti Calcolo delle provvigioni per agente / sub-agente Prerequisiti Mon Ami 3000 Provvigioni agenti Calcolo delle provvigioni per agente / sub-agente L opzione Provvigioni agenti è disponibile per le versioni Vendite, Azienda Light e Azienda Pro. Introduzione

Dettagli

Sistemi di Numerazione

Sistemi di Numerazione Fondamenti di Informatica per Meccanici Energetici - Biomedici 1 Sistemi di Numerazione Sistemi di Numerazione I sistemi di numerazione sono abitualmente posizionali. Gli elementi costitutivi di un sistema

Dettagli

Uno standard per il processo KDD

Uno standard per il processo KDD Uno standard per il processo KDD Il modello CRISP-DM (Cross Industry Standard Process for Data Mining) è un prodotto neutrale definito da un consorzio di numerose società per la standardizzazione del processo

Dettagli

Database. Si ringrazia Marco Bertini per le slides

Database. Si ringrazia Marco Bertini per le slides Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida

Dettagli

Manuale d uso Albo Online per le Scuole

Manuale d uso Albo Online per le Scuole Manuale d uso Albo Online per le Scuole Accedere come utente al sito Joomla della scuola. Accedere all Albo Online per le Scuole dai link presenti sul sito web scolastico. Cliccare su Modifica la configurazione.

Dettagli

TEORIA sulle BASI DI DATI

TEORIA sulle BASI DI DATI TEORIA sulle BASI DI DATI A cura del Prof. Enea Ferri Cos è un DATA BASE E un insieme di archivi legati tra loro da relazioni. Vengono memorizzati su memorie di massa come un unico insieme, e possono essere

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

Sintesi di Reti Sequenziali Sincrone

Sintesi di Reti Sequenziali Sincrone LABORATORIO DI ARCHITETTURA DEI CALCOLATORI lezione n 9 Prof. Rosario Cerbone rosario.cerbone@uniparthenope.it a.a. 2007-2008 http://digilander.libero.it/rosario.cerbone Sintesi di Reti Sequenziali Sincrone

Dettagli

Elaborazione dei dati su PC Regressione Multipla

Elaborazione dei dati su PC Regressione Multipla 21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione

Dettagli

PIATTAFORMA DOCUMENTALE CRG

PIATTAFORMA DOCUMENTALE CRG SISTEMA DI GESTIONE DOCUMENTALE DMS24 PIATTAFORMA DOCUMENTALE CRG APPLICAZIONE PER LE PROCEDURE DI GARE D AMBITO 1 AGENDA 1. Introduzione 2. I Livelli di accesso 3. Architettura di configurazione 4. Accesso

Dettagli

Corso di Tecniche di Programmazione

Corso di Tecniche di Programmazione Corso di Tecniche di Programmazione Corsi di Laurea in Ingegneria Informatica ed Automatica Anno Accedemico 003/004 Proff. Giuseppe De Giacomo, Luca Iocchi, Domenico Lembo Dispensa : Algoritmi di Ordinamento

Dettagli

Miglioramento dell analisi di immagine in GRASS tramite segmentazione

Miglioramento dell analisi di immagine in GRASS tramite segmentazione Segmentazione in GRASS Miglioramento dell analisi di immagine in GRASS tramite segmentazione Alfonso Vitti e Paolo Zatelli Dipartimento di Ingegneria Civile ed Ambientale Università di Trento Italy FOSS4G-it

Dettagli

Classificazione e Predizione

Classificazione e Predizione Lezione di TDM DM del 16 Aprile 2007 Francesco Bonchi, KDD Lab Pisa, ISTI-C.N.R. 1 Lezione odierna Intuizioni sul concetto di classificazione Alberi di decisione Alberi di decisione con Weka Classificazione:

Dettagli

Algoritmi di Ricerca. Esempi di programmi Java

Algoritmi di Ricerca. Esempi di programmi Java Fondamenti di Informatica Algoritmi di Ricerca Esempi di programmi Java Fondamenti di Informatica - D. Talia - UNICAL 1 Ricerca in una sequenza di elementi Data una sequenza di elementi, occorre verificare

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

Cosa dobbiamo già conoscere?

Cosa dobbiamo già conoscere? Cosa dobbiamo già conoscere? Insiemistica (operazioni, diagrammi...). Insiemi finiti/numerabili/non numerabili. Perché la probabilità? In molti esperimenti l esito non è noto a priori tuttavia si sa dire

Dettagli

41126 Cognento (MODENA) Italy Via Bottego 33/A Tel: +39-(0)59 346441 Internet: http://www.aep.it E-mail: aep@aep.it Fax: +39-(0)59-346437

41126 Cognento (MODENA) Italy Via Bottego 33/A Tel: +39-(0)59 346441 Internet: http://www.aep.it E-mail: aep@aep.it Fax: +39-(0)59-346437 QUICK ANALYZER Manuale Operativo Versione 5.3 Sommario 1.0 Generalità... 2 CONTRATTO DI LICENZA... 3 2.0 Configurazione dei Canali... 4 2.1 Gestione DataLogger IdroScan... 7 3.0 Risultati di Prova... 9

Dettagli

online La situazione operativa. In ambito aziendale i processi decisionali richiedono assunzioni di responsabilità a vari LABORATORIO 1

online La situazione operativa. In ambito aziendale i processi decisionali richiedono assunzioni di responsabilità a vari LABORATORIO 1 LABORATORIO 1 Scelta tra preventivi per l acquisto di un impianto di Luca CAGLIERO Materie: Informatica, Matematica, Economia aziendale (Triennio IT) L attività da svolgere in laboratorio, di carattere

Dettagli

Backpropagation in MATLAB

Backpropagation in MATLAB Modello di neurone BACKPROPAGATION Backpropagation in MATLAB Prof. Beatrice Lazzerini Dipartimento di Ingegneria dell Informazione Via Diotisalvi 2, 56122 Pisa La funzione di trasferimento, che deve essere

Dettagli

Elementi di Statistica descrittiva Parte I

Elementi di Statistica descrittiva Parte I Elementi di Statistica descrittiva Parte I Che cos è la statistica Metodo di studio di caratteri variabili, rilevabili su collettività. La statistica si occupa di caratteri (ossia aspetti osservabili)

Dettagli

Tutorial di FPM c. Poderico Luigi

Tutorial di FPM c. Poderico Luigi Poderico Luigi Introduzione Per rendere più agevole l utilizzo di FPM c, specialmente per chi lo usa per la prima volta, proponiamo di seguito un esempio d utilizzo del programma. Partendo dalla formulazione

Dettagli

PROCEDURA PER GESTIONE DATI E CREAZIONE FILE TELEMATICO Revisione 1.0 Sommario: - Gestione Spesometro - Appendice Gestione Modello Black List 2015

PROCEDURA PER GESTIONE DATI E CREAZIONE FILE TELEMATICO Revisione 1.0 Sommario: - Gestione Spesometro - Appendice Gestione Modello Black List 2015 SPESOMETRO ANNO 2015 COMUNICAZIONE POLIVALENTE Procedura Gestionale: SPRING SQ PROCEDURA PER GESTIONE DATI E CREAZIONE FILE TELEMATICO Revisione 1.0 Sommario: - Gestione Spesometro - Appendice Gestione

Dettagli

Indice Statistiche Univariate Statistiche Bivariate

Indice Statistiche Univariate Statistiche Bivariate Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................

Dettagli

Modellazione dei dati in UML

Modellazione dei dati in UML Corso di Basi di Dati e Sistemi Informativi Modellazione dei dati in UML Angelo Montanari Dipartimento di Matematica e Informatica Università degli Studi di Udine Introduzione UML (Unified Modeling Language):

Dettagli

Introduzione. Il principio di localizzazione... 2 Organizzazioni delle memorie cache... 4 Gestione delle scritture in una cache...

Introduzione. Il principio di localizzazione... 2 Organizzazioni delle memorie cache... 4 Gestione delle scritture in una cache... Appunti di Calcolatori Elettronici Concetti generali sulla memoria cache Introduzione... 1 Il principio di localizzazione... 2 Organizzazioni delle memorie cache... 4 Gestione delle scritture in una cache...

Dettagli

Mon Ami 3000 Varianti articolo Gestione di varianti articoli

Mon Ami 3000 Varianti articolo Gestione di varianti articoli Prerequisiti Mon Ami 3000 Varianti articolo Gestione di varianti articoli L opzione Varianti articolo è disponibile per le versioni Azienda Light e Azienda Pro e include tre funzionalità distinte: 1. Gestione

Dettagli

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni Introduzione Ai Data Bases Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni I Limiti Degli Archivi E Il Loro Superamento Le tecniche di gestione delle basi di dati nascono

Dettagli

Normalizzazione. Relazionali

Normalizzazione. Relazionali Normalizzazione di Schemi Relazionali Normalizzazione Forme Normali Una forma normale è una proprietà di uno schema relazionale che ne garantisce la qualità, cioè l assenza di determinati difetti Una relazione

Dettagli

Documenti Tecnici Informatica e Farmacia Vega S.p.A.

Documenti Tecnici Informatica e Farmacia Vega S.p.A. Nuova gestione Offerte al pubblico Wingesfar: istruzioni per le farmacie Novembre 2009 Documenti Tecnici Informatica e Farmacia Vega S.p.A. Premessa La gestione delle Offerte al pubblico è stata oggetto

Dettagli

E-Shop/X4Shop : interfaccia IceCat the opencatalog

E-Shop/X4Shop : interfaccia IceCat the opencatalog E-Shop/X4Shop : interfaccia IceCat the opencatalog La presente guida illustra le corrette modalità di utilizzo delle procedure incluse nel Programma E-Shop/X4- Shop per accedere alle funzioni offerte dal

Dettagli

Iniziativa Comunitaria Equal II Fase IT G2 CAM - 017 Futuro Remoto. Approfondimento SOFTWARE PER L ARCHIVIAZIONE

Iniziativa Comunitaria Equal II Fase IT G2 CAM - 017 Futuro Remoto. Approfondimento SOFTWARE PER L ARCHIVIAZIONE APPROFONDIMENTO ICT Iniziativa Comunitaria Equal II Fase IT G2 CAM - 017 Futuro Remoto Approfondimento SOFTWARE PER L ARCHIVIAZIONE ORGANISMO BILATERALE PER LA FORMAZIONE IN CAMPANIA INDICE SOFTWARE PER

Dettagli

Statistica descrittiva univariata

Statistica descrittiva univariata Statistica descrittiva univariata Elementi di statistica 2 1 Tavola di dati Una tavola (o tabella) di dati è l insieme dei caratteri osservati nel corso di un esperimento o di un rilievo. Solitamente si

Dettagli

VALIDAZIONE METODI DI PROVA PROVE MICROBIOLOGICHE

VALIDAZIONE METODI DI PROVA PROVE MICROBIOLOGICHE VALIDAZIONE METODI DI PROVA PROVE MICROBIOLOGICHE 1 Il processo di validazione/qualificazione di un metodo microbiologico presuppone che i fattori critici siano adeguatamente disciplinati da indicazioni

Dettagli

Modello relazionale. ing. Alfredo Cozzi 1

Modello relazionale. ing. Alfredo Cozzi 1 Modello relazionale E fondato sul concetto matematico di relazione tra insiemi di oggetti Una relazione su n insiemi A1, A2,..,An è un sottoinsieme di tutte le n-uple a1,a2,,an che si possono costruire

Dettagli

Tabella iniziale con i dati. Malattia Malati Non malati Totale Test Positivo 183 Negativo 280 Totale 199 512. Calcolo i valori mancanti per differenza

Tabella iniziale con i dati. Malattia Malati Non malati Totale Test Positivo 183 Negativo 280 Totale 199 512. Calcolo i valori mancanti per differenza ESERCIZIO DI STATISTICA D.U. / simulazione di esame Esercizio 1: Per una malattia particolarmente grave viene sperimentato l utilizzo di una nuova tecnica radiologica allo scopo di identificare correttamente

Dettagli

SISTEMI OPERATIVI. Deadlock (blocco critico) Domande di verifica. Luca Orrù Centro Multimediale Montiferru 04/06/2007

SISTEMI OPERATIVI. Deadlock (blocco critico) Domande di verifica. Luca Orrù Centro Multimediale Montiferru 04/06/2007 2007 SISTEMI OPERATIVI Deadlock (blocco critico) Domande di verifica Luca Orrù Centro Multimediale Montiferru 04/06/2007 Deadlock (blocco critico) 1. Si descriva il deadlock e le condizioni sotto cui si

Dettagli

SETTE DOMANDE SU «Protocollo 2»

SETTE DOMANDE SU «Protocollo 2» SETTE DOMANDE SU «Protocollo 2» 1. Che cosa è «Protocollo 2»? 2. A chi serve «Protocollo 2»? 3. Quali sono le principali funzionalità di «Protocollo 2»? 4. Quanto può essere adattato «Protocollo 2» alle

Dettagli

Controllo di qualità dei dati giornalieri di temperatura minima e massima e di precipitazione

Controllo di qualità dei dati giornalieri di temperatura minima e massima e di precipitazione Quaderno Tecnico ARPA-SIM n 15/2003 Controllo di qualità dei dati giornalieri di temperatura minima e massima e di precipitazione Valentina Pavan Rodica Tomozeiu Andrea Selvini Stefano Marchesi Chiara

Dettagli

Sistemi Informativi Territoriali. Map Algebra

Sistemi Informativi Territoriali. Map Algebra Paolo Mogorovich Sistemi Informativi Territoriali Appunti dalle lezioni Map Algebra Cod.735 - Vers.E57 1 Definizione di Map Algebra 2 Operatori locali 3 Operatori zonali 4 Operatori focali 5 Operatori

Dettagli

I pilastri della TPM

I pilastri della TPM I pilastri della TPM Miglioramento specifico Manutenzione preventiva Set-up impianti Manutenzione autonoma Formazione Sicurezza e ambiente LE POLITICHE DI MANUTENZIONE - Norma UNI 9910 E 10147 - MANUTENZIONE

Dettagli

Progetto di simulazione molecolare per il corso di Complementi di algoritmi A.A. 2005-06

Progetto di simulazione molecolare per il corso di Complementi di algoritmi A.A. 2005-06 Progetto di simulazione molecolare per il corso di Complementi di algoritmi A.A. 2005-06 13 febbraio 2006 1 Descrizione Il progetto si compone delle seguenti fasi: 1. caricamento di soluzioni in formato

Dettagli

1) Dati in ingresso 2 numeri, l algoritmo calcola e stampa a video la loro somma

1) Dati in ingresso 2 numeri, l algoritmo calcola e stampa a video la loro somma Algoritmo: E un insieme finito di azioni che risolvono un determinato problema, trasformando i dati di input in di dati di output (o risultati) attraverso relazioni o formule che legano i dati in ingresso

Dettagli

INTRODUZIONE. Articolo qe001: versione 4

INTRODUZIONE. Articolo qe001: versione 4 INTRODUZIONE L obiettivo principale del progetto è dimostrare come ridefinire le strategie di gestione dei quadri elettrici disponendo di un network telematico in grado di monitorare e storicizzare tutti

Dettagli

Informazioni sulla verifica di codici a barre 1D e 2D mediante l'elaborazione elettronica delle immagini

Informazioni sulla verifica di codici a barre 1D e 2D mediante l'elaborazione elettronica delle immagini Informazioni sulla verifica di codici a barre 1D e 2D mediante l'elaborazione elettronica delle immagini Nozioni fondamentali sulla verifica della leggibilità dei codici a barre per una maggiore affidabilità

Dettagli

Introduzione. Pagina: 1 di 8. Data creazione 10/06/2011 10.59.00

Introduzione. Pagina: 1 di 8. Data creazione 10/06/2011 10.59.00 Introduzione Il nuovo Codice del Processo Amministrativo prevede che i difensori costituiti forniscano copia in via informatica di tutti gli atti di parte depositati e, ove possibile, dei documenti prodotti

Dettagli

Raffinamento dello schema e forme normali. T. Catarci, M. Scannapieco, Corso di Basi di Dati, A.A. 2008/2009, Sapienza Università di Roma

Raffinamento dello schema e forme normali. T. Catarci, M. Scannapieco, Corso di Basi di Dati, A.A. 2008/2009, Sapienza Università di Roma Raffinamento dello schema e forme normali 1 Forme Normali Le forme normali consentono di valutare la qualità delle relazione Sono state proposte diverse forme normali che includono, in ordine di generalità:

Dettagli

Dott.ssa Michela Nelli. Dott.ssa Ilaria Giannelli. Dott. Francesco Pennasilico. Aggiornato al 03/06/2013

Dott.ssa Michela Nelli. Dott.ssa Ilaria Giannelli. Dott. Francesco Pennasilico. Aggiornato al 03/06/2013 MANUALE SIDIP - Versione per Cancelleria- Dott.ssa Michela Nelli Dott.ssa Ilaria Giannelli Dott. Francesco Pennasilico Aggiornato al 03/06/2013 1 INDICE CAPITOLO 1: Consultazione e stampa dei documenti

Dettagli

Il File System. È la componente del S.O. che si occupa della gestione della memoria di massa e dell organizzazione logica dei dati

Il File System. È la componente del S.O. che si occupa della gestione della memoria di massa e dell organizzazione logica dei dati Il File System È la componente del S.O. che si occupa della gestione della memoria di massa e dell organizzazione logica dei dati Le operazioni supportate da un file system sono: eliminazione di dati modifica

Dettagli

Per il suo compleanno, il goloso Re di un lontano regno riceve in regalo da un altro sovrano un grande canestro contenente 4367 caramelle di tanti

Per il suo compleanno, il goloso Re di un lontano regno riceve in regalo da un altro sovrano un grande canestro contenente 4367 caramelle di tanti Per il suo compleanno, il goloso Re di un lontano regno riceve in regalo da un altro sovrano un grande canestro contenente 4367 caramelle di tanti colori, tra cui 382 rosse. Qualche tempo dopo il donatore

Dettagli

AmIS - Comunità di Pratica. Guida Utente

AmIS - Comunità di Pratica. Guida Utente AmIS - Comunità di Pratica Guida Utente 1 Indice 1. Scopo del documento... 3 2. Caratteristiche generali... 4 3. Navigazione utente ospite... 5 3.1 Attività recenti... 6 3.2 Documenti... 9 3.3 Iscritti...

Dettagli

L espressione torna invece sempre vera (quindi la soluzione originale) se cambiamo contemporaneamente il verso: 1 < 0.

L espressione torna invece sempre vera (quindi la soluzione originale) se cambiamo contemporaneamente il verso: 1 < 0. EQUAZIONI E DISEQUAZIONI Le uguaglianze fra espressioni numeriche si chiamano equazioni. Cercare le soluzioni dell equazione vuol dire cercare quelle combinazioni delle lettere che vi compaiono che la

Dettagli

Preprocessing di un immagine in scala di grigi parte 2/2

Preprocessing di un immagine in scala di grigi parte 2/2 Preprocessing di un immagine in scala di grigi parte 2/2 Preview Il comando Automatic preprocessing (2) del menu Preprocessing effettua un preprocessing totale. Il risultato è una sequenza di immagini

Dettagli

Sistema Informativo Agricoltura

Sistema Informativo Agricoltura Sistema Informativo Agricoltura Manuale Utente CONAGRI - Controlli in Agricoltura Indice 1 Introduzione al servizio... 3 2 Tipologie di Utenza... 3 2.1 Accreditamento utenti... 3 3 Caratteristiche generali

Dettagli

Ricerca di outlier. Ricerca di Anomalie/Outlier

Ricerca di outlier. Ricerca di Anomalie/Outlier Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla

Dettagli

HBase Data Model. in più : le colonne sono raccolte in gruppi di colonne detti Column Family; Cosa cambia dunque?

HBase Data Model. in più : le colonne sono raccolte in gruppi di colonne detti Column Family; Cosa cambia dunque? NOSQL Data Model HBase si ispira a BigTable di Google e perciò rientra nella categoria dei column store; tuttavia da un punto di vista logico i dati sono ancora organizzati in forma di tabelle, in cui

Dettagli

ANALISI DEI DATI BIOLOGICI

ANALISI DEI DATI BIOLOGICI ANALISI DI DATI BIOLOGICI RAPPRSNTAR L COMUNITA tramite descrizioni grafiche e relazioni tra gli organismi presenti nei vari campioni. DISCRIMINAR dei siti sulla base della loro composizione biologica.

Dettagli

Il documento rappresenta una guida sintetica al processo di affido pratiche agli operatori in recuper@2.0

Il documento rappresenta una guida sintetica al processo di affido pratiche agli operatori in recuper@2.0 Il documento rappresenta una guida sintetica al processo di affido pratiche agli operatori in recuper@2.0 ver 1.0 del 19/03/2013 Saranno trattati le varie modalità di affido, in particolare l affido diretto,

Dettagli

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse Introduzione data warehose Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa Data Warehouse Che cosa e un data warehouse? Quali sono i modelli dei dati per data warehouse Come si progetta

Dettagli

MACHINE LEARNING e DATA MINING Introduzione. a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it

MACHINE LEARNING e DATA MINING Introduzione. a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it MACHINE LEARNING e DATA MINING Introduzione a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it Apprendimento Automatico(i) Branca dell AI che si occupa di realizzare dispositivi artificiali capaci di

Dettagli

WG-TRANSLATE Manuale Utente WG TRANSLATE. Pagina 1 di 15

WG-TRANSLATE Manuale Utente WG TRANSLATE. Pagina 1 di 15 WG TRANSLATE Pagina 1 di 15 Sommario WG TRANSLATE... 1 1.1 INTRODUZIONE... 3 1 TRADUZIONE DISPLAY FILE... 3 1.1 Traduzione singolo display file... 4 1.2 Traduzione stringhe da display file... 5 1.3 Traduzione

Dettagli

SPORTLANDIA TRADATE Cookie Policy

SPORTLANDIA TRADATE Cookie Policy SPORTLANDIA TRADATE Cookie Policy Informativa Privacy (art.13 D.Lgs. 196/2003): i dati che i partecipanti al Blog conferiscono all atto della loro iscrizione sono limitati all indirizzo e-mail e sono obbligatori

Dettagli

Aritmetica dei Calcolatori 2

Aritmetica dei Calcolatori 2 Laboratorio di Architettura 13 aprile 2012 1 Operazioni bit a bit 2 Rappresentazione binaria con segno 3 Esercitazione Operazioni logiche bit a bit AND OR XOR NOT IN OUT A B A AND B 0 0 0 0 1 0 1 0 0 1

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

Il guadagno informativo negli alberi decisionali: un nuovo approccio

Il guadagno informativo negli alberi decisionali: un nuovo approccio Il guadagno informativo negli alberi decisionali: un nuovo approccio Sommario Descrizione del problema... 2 Il guadagno informativo di Nanni... 3 Il software Weka... 3 Cos è Weka... 3 Il guadagno Informativo

Dettagli

Corso di Programmazione I dati nei linguaggi di programmazione Tipi Semplici. I dati nei linguaggi di programmazione. Dati. Dott.

Corso di Programmazione I dati nei linguaggi di programmazione Tipi Semplici. I dati nei linguaggi di programmazione. Dati. Dott. Materiale didattico preparato dal dott. Stefano Ferilli Corso di Programmazione I dati nei linguaggi di programmazione Tipi Semplici Dott. Pasquale Lops lops@di.uniba.it Corso di Programmazione - DIB 1/49

Dettagli

Strutture di Memoria 1

Strutture di Memoria 1 Architettura degli Elaboratori e Laboratorio 17 Maggio 2013 Classificazione delle memorie Funzionalitá: Sola lettura ROM, Read Only Memory, generalmente usata per contenere le routine di configurazione

Dettagli

LA NORMALIZZAZIONE. Introduzione

LA NORMALIZZAZIONE. Introduzione LA NORMALIZZAZIONE Introduzione La normalizzazione e' una tecnica di progettazione dei database, mediante la quale si elimina la rindondanza dei dati al fine di evitare anomalie nella loro consistenza

Dettagli

Analisi video intelligente

Analisi video intelligente Analisi video intelligente (versione 1.4) pag. 1 di 17 INDICE 1. PRESENTAZIONE ANALISI VIDEO... 3 2. PROSPETTIVA... 4 3. AREE DI INTERESSE... 6 4. PARAMETRI BASE... 7 5. PEOPLE DETECTOR... 10 6. PERCORSI...

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

Automatizzare i compiti ripetitivi. I file batch. File batch (1) File batch (2) Visualizzazione (2) Visualizzazione

Automatizzare i compiti ripetitivi. I file batch. File batch (1) File batch (2) Visualizzazione (2) Visualizzazione Automatizzare i compiti ripetitivi I file batch Anno accademico 2000-01 1 Spesso capita di dover eseguire ripetutatmente una data sequenza di comandi Introdurli uno a uno da tastiera è un processo lento

Dettagli

La versione standard di Shop_Net contempla due diversi metodi di stampa dei Cartellini:

La versione standard di Shop_Net contempla due diversi metodi di stampa dei Cartellini: Tabelle di Servizio In alcune circostanze Shop_Net ha la necessità di avere informazioni aggiuntive non strettamente legate ai dati contenuti negli Archivi principali del Data Base. Queste informazioni

Dettagli

Logica e geometria con il linguaggio Logo

Logica e geometria con il linguaggio Logo Logica e geometria con il linguaggio Logo Classe: III, IV e V primaria Argomento: geometria e logica Autori: Guido Gottardi e Alberto Battaini Introduzione: senza la pretesa di redigere un trattato sul

Dettagli

Fondamenti di Elaborazione di Immagini Estrazione dei Bordi e Segmentazione. Raffaele Cappelli raffaele.cappelli@unibo.it

Fondamenti di Elaborazione di Immagini Estrazione dei Bordi e Segmentazione. Raffaele Cappelli raffaele.cappelli@unibo.it Fondamenti di Elaborazione di Immagini Estrazione dei Bordi e Segmentazione Raffaele Cappelli raffaele.cappelli@unibo.it Contenuti Estrazione dei bordi Calcolo del gradiente Operatori di Roberts Operatori

Dettagli

Azienda Sanitaria ULSS 3 Risultati dell indagine 2014 sul benessere del personale dipendente

Azienda Sanitaria ULSS 3 Risultati dell indagine 2014 sul benessere del personale dipendente Risultati dell indagine 2014 sul benessere del personale dipendente Sommario Premessa 1 L indagine e il questionario di rilevazione 1 La partecipazione e le caratteristiche dei rispondenti 2 I risultati

Dettagli

1 SEGNALAZIONE EFFICIENZA (SOGLIA DI EFFICIENZA PERSONALIZZATA)

1 SEGNALAZIONE EFFICIENZA (SOGLIA DI EFFICIENZA PERSONALIZZATA) GBox: Personalizzazione Tempi di Fermo e Soglia di Efficienza SW0003704 Creazione 09/01/2014 Revisione del 07/07/2014 Numero 1 Le implementazioni di seguito documentate riguardano, nell ambito GSMA GBox

Dettagli

Sistemi Informativi Territoriali. Il caso del rischio di incendio

Sistemi Informativi Territoriali. Il caso del rischio di incendio Paolo Mogorovich Sistemi Informativi Territoriali Appunti dalle lezioni Il caso del rischio di incendio Cod.731 - Vers.CC9 1 Introduzione 2 Definizione del problema 3 Omogeneizzazione dei dati 4 Calcolo

Dettagli

Identificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete Neuronale

Identificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete Neuronale Identificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete euronale Descrizione Il presente lavoro, facente segiuto a quanto descritto precedentemente, ha il fine di: 1) introdurre

Dettagli

70555 Informatica 3 70777 Sicurezza 2. 70555 Mario Rossi 70777 Anna Bianchi. Esempio istanza:

70555 Informatica 3 70777 Sicurezza 2. 70555 Mario Rossi 70777 Anna Bianchi. Esempio istanza: DOMANDE 1) Definire i concetti di schema e istanza di una base di dati, fornendo anche un esempio. Si definisce schema di una base di dati, quella parte della base di dati stessa che resta sostanzialmente

Dettagli

per immagini guida avanzata Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1

per immagini guida avanzata Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1 Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1 Il raggruppamento e la struttura dei dati sono due funzioni di gestione dati di Excel, molto simili tra

Dettagli

Novità: Riscaldamento Standard RISCALDAMENTO / TUBAZIONI. Novità in SymCAD

Novità: Riscaldamento Standard RISCALDAMENTO / TUBAZIONI. Novità in SymCAD RISCALDAMENTO / TUBAZIONI Novità: Riscaldamento Standard Il modulo Riscaldamento Standard permette di effettuare la progettazione integrata (disegno e calcoli) in AutoCAD degli impianti di riscaldamento

Dettagli

Feature Selection per la Classificazione

Feature Selection per la Classificazione 1 1 Dipartimento di Informatica e Sistemistica Sapienza Università di Roma Corso di Algoritmi di Classificazione e Reti Neurali 20/11/2009, Roma Outline Feature Selection per problemi di Classificazione

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli