Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale"

Transcript

1 Esperienze di Apprendimento Automatico per il corso di Dipartimento Sistemi e Informatica Università di Firenze Dipartimento Ingegneria dell Informazione Università di Siena

2 Introduzione Esempi di problemi di apprendimento automatico Filtro SPAM per OCR (Optical Character Recognition) Diagnosticare la patologia di un paziente Predire l esito di una partita di scacchi Interpretazione di segmenti audio (Speech Recognition) Classificazione di documenti testuali Predire la struttura 3D di una proteina...

3 Introduzione Analisi di un problema di apprendimento automatico Inquadramento del problema: definizione degli obiettivi Scelta di un algoritmo di apprendimento Preparazione dei dati Addestramento del modello Test del modello addestrato Interpretazione dei risultati

4 I dataset UCI UCI Machine Learning Repository : collezione di dataset utilizzati dai ricercatori per testare gli algoritmi sviluppati Per ogni dataset sono riportate le performance di alcuni algoritmi di apprendimento automatico da usare come confronto (benchmark) Dataset tipicamente composti da uno o più dei seguenti file: NOME.names: descrive la sorgente dei dati e gli attributi NOME.data: contiene esempi e target (se esiste il file NOME.test, spesso NOME.data rappresenta il training set) NOME.test: contiene i dati da usare per il test NOME.all: data + test Dati spesso forniti nel formato compatibile con C4.5 (software per alberi di decisione che vedremo nelle prossime lezioni).

5 Descrizione dei dati Nel caso dei dataset UCI, la descrizione del dataset si trova nel file.names, che contiene: una serie di righe di intestazione, iniziate dal carattere, dove vengono descritti in maniera generale i dati e gli algoritmi che sono stati applicati al dataset una lista separata da, e terminata da. contenente i nomi delle classi una sequenza di coppie <nome>: <valore>. che descrive gli attributi dei vettori di ingresso, dove valore può essere: continuous: per gli attributi continui valore 1,valore 2... valore n : per gli attributi discreti

6 Preparazione dei dati Il formato dei file utilizzato nell archivio di UCI è compatibile con il formato di ingresso utilizzato dal tool C4.5 ma non con quello del simulatore di reti neurali JNNS Le reti neurali possono gestire solamente attributi numerici quindi gli attributi discreti devono essere opportunamente codificati Gli attributi continui devono essere normalizzati per facilitare l addestramento della rete

7 Preparazione dei dati: attributi continui Si distinguono due tecniche per la normalizzazione di un attributo continuo a seconda di come si distribuiscono i valori: distribuzione uniforme: i dati vengono normalizzati nell intervallo [0,1] v = v v min v max v min (1) distribuzione gaussiana: la nuova distribuzione ha media nulla e varianza unitaria v = v v (2) σ dove v è la media e σ è la deviazione standard

8 Preparazione dei dati: attributi discreti Per rappresentare in modo efficace gli n valori di un attributo discreto si utilizza la codifica one-hot: Ad ogni valore dell attributo discreto corrisponde un vettore di n attributi binari Se l attributo discreto assume il valore k-esimo, allora il corrispondente attributo binario vale 1 e tutti gli altri 0 {A,B,C,D}: A C B D

9 Preparazione dei dati: valore della classe La classe di appartenenza di un esempio, ovvero il target dell addestramento, deve essere trattata come un attributo discreto Il vettore di attributi così ottenuto costituisce l output della rete neurale Per un problema con due sole classi è preferibile utilizzare un singolo output, in questo caso il valore 0 rappresenta una classe ed il valore 1 l altra

10 Preparazione dei dati: dati mancanti All interno dei file di dati si possono trovare dei valori mancanti (missing) contraddistinti dal carattere?. Si distinguono i seguenti casi: La maggior parte dei dati ha valori mancanti per un certo attributo: si elimina l attributo in tutto il dataset La maggior parte degli attributi di un esempio hanno valori mancanti: si elimina l esempio dal dataset Solo in alcuni esempi l attributo è mancante, e l attributo è a valori discreti: si prevede un valore aggiuntivo per identificare i valori mancanti (oppure si sostituisce con la moda) Solo in alcuni esempi l attributo è mancante, e l attributo è a valori continui: si sostituisce il valore mancante con il valore più comune (media o mediana)

11 Creazione dei Dataset Per addestrare, validare e testare una rete neurale sono solitamente impiegati tre file di dati: train: serve per calcolare il gradiente della funzione di errore che viene minimizzata durante l addestramento validation: serve per scegliere i parametri ottimali e per fermare l addestramento in modo da prevenire l over-fitting test: serve per calcolare l accuratezza della rete neurale addestrata, non deve essere mai usato per scegliere i parametri e per addestrare la rete I tre file devono essere ricavati suddividendo l intero dataset in tre parti che devono avere la stessa frazione di esempi per ogni classe. La suddivisione in tre parti può essere fatta seguendo varie tecniche (es. K-fold-cross-validation); per i primi esperimenti si può usare una suddivisione 50%-25%-25%.

12 Creazione dei Dataset: i file dei Pattern Dopo aver preparato opportunamente i dati, questi devono essere scritti nel formato utilizzato da JNNS, e devono avere l estensione.pat : SNNS pattern definition file V1.4 generated at Sun Jan 1 00:00: Header No. of patterns : 1000 No. of input units : 2 No. of output units : Numero di esempi Numero di attributi Numero di classi Vettore degli inputs Vettore degli outputs

13 JNNS: Avvio e Caricamento Dati Il tool JavaNNS è un applicativo scritto in Java e memorizzato sotto forma di archivio Jar Per lanciare JNNS da terminale: java -jar <path>/javanns.jar Ogni file di dati che verrà utilizzato durante l addestramento della rete neurale deve essere caricato con il comando File open Allo stesso modo si possono caricare delle reti neurali precedentemente addestrate

14 JNNS: Creazione della Rete 1/3 Il primo passo è la creazione della rete neurale utilizzando il comando tools create layers Dimensione layer Tipo layer Funzione attivazione neuroni

15 JNNS: Creazione della Rete 2/3 Il layer di ingresso dovrà contenere un numero di neuroni pari al numero di attributi nel dataset Il layer di uscita dovrà contenere un numero di neuroni pari al numero di classi Un numero opzionale di layer nascosti potrà essere creato (prima del layer di uscita) per aumentare il potere discriminativo della rete neurale

16 JNNS: Creazione della Rete 3/3 Dopo aver creato i layers dovranno essere sistemate le connessioni fra i neuroni in modo feed-forward usando tools create connections

17 JNNS: il Pannello di Controllo L addestramento della rete viene controllato usando il pannello tools control panel. Per prima cosa i pesi della rete devono essere inizializzati con un valore molto basso.

18 JNNS: il Pannello di Controllo Fra tutti i dataset caricati si deve scegliere quale usare per l addestramento e quale per la scelta dei parametri.

19 JNNS: il Pannello di Controllo I vari parametri dell addestramento devono essere scelti in modo da massimizzare l accuratezza finale sul validation e dipendono fortemente dal dataset Learning rate Algoritmo di addestramento Numero di epoche Momento Presentazione casuale degli esempi

20 JNNS: il Grafico dell Errore L andamento dell addestramento può essere seguito tramite il panello view error graph Fattore di scala verticale Errore sul train Errore sul validation Cancella tutto Fattore di scala orizzontale

21 Selezione dei Parametri Un errata selezione dei parametri può portare ad una rete che non ha appreso niente dai dati Il learning-rate ed il momento controllano la velocità di apprendimento Un apprendimento troppo lento potrebbe portare a pensare che la rete sia già arrivata al suo ottimo, oppure può finire in un minimo locale Un apprendimento troppo veloce potrebbe far mancare alla rete il minimo della funzione d errore, oppure potrebbe portare ad un comportamento non convergente (oscillante)

22 JNNS: Selezione dell Architettura Un altro fattore critico per la qualità dell apprendimento è la dimensione della rete (numero di neuroni, numero di connessioni) Una rete troppo piccola non ha la capacità di apprendere la funzione di discriminazione che separa gli esempi nelle varie classi (under-fitting) Una rete troppo grande potrebbe apprendere anche il rumore (errori sulle classi degli esempi di training), ovvero dei fatti che sicuramente non si verificano sui dati di test (over-fitting) Il fenomeno dell over-fitting può essere limitato usando la tecnica dell early-stopping

23 Calcolo dell Accuratezza Per confrontare due reti addestrate è necessario calcolare la loro accuratezza sui dati di validazione L accuratezza si calcola come: Q k = N esempi corretti N esempi (3) Un esempio è predetto correttamente se la classe predetta dalla rete è la stessa presente nei dati Per una rete con più uscite la classe predetta è quella corrispondente all uscita più elevata Per una rete con una sola uscita (due classi) una classe è associata ad un valore di uscita maggiore di 0.5, e viceversa

24 JNNS: Salvataggio delle Predizioni Per verificare le predizioni della rete è necessario salvare su file l output calcolato sugli esempi di validation usando il comando: file save data

25 JNNS: ATTENZIONE Per salvare gli output della rete su un certo insieme di dati, è necessario selezionare prima il file corrispondente come training set nella sezione patterns del pannello di controllo. La figura mostra la selezione necessaria per salvare i dati del validation set.

Backpropagation in MATLAB

Backpropagation in MATLAB Modello di neurone BACKPROPAGATION Backpropagation in MATLAB Prof. Beatrice Lazzerini Dipartimento di Ingegneria dell Informazione Via Diotisalvi 2, 56122 Pisa La funzione di trasferimento, che deve essere

Dettagli

Regressione non lineare con un modello neurale feedforward

Regressione non lineare con un modello neurale feedforward Reti Neurali Artificiali per lo studio del mercato Università degli studi di Brescia - Dipartimento di metodi quantitativi Marco Sandri (sandri.marco@gmail.com) Regressione non lineare con un modello neurale

Dettagli

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali DIPARTIMENTO DI INGEGNERIA INFORMATICA AUTOMATICA E GESTIONALE ANTONIO RUBERTI Cenni al Data Mining 1 Data Mining nasce prima del Data Warehouse collezione di tecniche derivanti da Intelligenza Artificiale,

Dettagli

Feature Selection per la Classificazione

Feature Selection per la Classificazione 1 1 Dipartimento di Informatica e Sistemistica Sapienza Università di Roma Corso di Algoritmi di Classificazione e Reti Neurali 20/11/2009, Roma Outline Feature Selection per problemi di Classificazione

Dettagli

Introduzione al Pattern Recognition Statistico

Introduzione al Pattern Recognition Statistico Introduzione al Pattern Recognition Statistico Roberto Tagliaferri Dipartimento di Informatica Università di Salerno ( Sa ) 84084 Fisciano e-mail robtag@unisa.it Statistical Pattern Recognition Introduzione

Dettagli

Sommario. 1 Specifiche della soluzione. Davide Anastasia, Nicola Cogotti. 27 dicembre 2005

Sommario. 1 Specifiche della soluzione. Davide Anastasia, Nicola Cogotti. 27 dicembre 2005 Utilizzo delle reti neurali di tipo MLP e RBF per l approssimazione di funzioni reali di variabile reale note mediante coppie di punti (x,y) in presenza di rumore Davide Anastasia, Nicola Cogotti 27 dicembre

Dettagli

NUOVA PROCEDURA COPIA ED INCOLLA PER L INSERIMENTO DELLE CLASSIFICHE NEL SISTEMA INFORMATICO KSPORT.

NUOVA PROCEDURA COPIA ED INCOLLA PER L INSERIMENTO DELLE CLASSIFICHE NEL SISTEMA INFORMATICO KSPORT. NUOVA PROCEDURA COPIA ED INCOLLA PER L INSERIMENTO DELLE CLASSIFICHE NEL SISTEMA INFORMATICO KSPORT. Con l utilizzo delle procedure di iscrizione on line la società organizzatrice ha a disposizione tutti

Dettagli

CIRCUITI INTELLIGENTI Parte 5: PCA e ICA

CIRCUITI INTELLIGENTI Parte 5: PCA e ICA Ing. Simone SCARDAPANE Circuiti e Algoritmi per l Elaborazione dei Segnali Anno Accademico 2012/2013 Indice della Lezione 1. Analisi delle Componenti Principali 2. Auto-Associatori 3. Analisi delle Componenti

Dettagli

6.2 Modelli per il monossido di carbonio

6.2 Modelli per il monossido di carbonio 6.2 Modelli per il monossido di carbonio La serie temporale scelta per l addestramento è quella rilevata in via Piave poiché tra le stazioni idonee, per legge, al controllo di questo inquinante essa presenta

Dettagli

Data mining: classificazione DataBase and Data Mining Group of Politecnico di Torino

Data mining: classificazione DataBase and Data Mining Group of Politecnico di Torino DataBase and Data Mining Group of Database and data mining group, Database and data mining group, DataBase and Data Mining Group of DataBase and Data Mining Group of So dati insieme di classi oggetti etichettati

Dettagli

Identificazione del dispositivo sorgente

Identificazione del dispositivo sorgente UNIVERSITÀ DEGLI STUDI DI FIRENZE Facoltà di Ingegneria Corso di Laurea in INGEGNERIA INFORMATICA Identificazione del dispositivo sorgente mediante tecniche di Image Forensics Tesi di Laurea di ANDREA

Dettagli

SVM. Veronica Piccialli. Roma 11 gennaio 2010. Università degli Studi di Roma Tor Vergata 1 / 14

SVM. Veronica Piccialli. Roma 11 gennaio 2010. Università degli Studi di Roma Tor Vergata 1 / 14 SVM Veronica Piccialli Roma 11 gennaio 2010 Università degli Studi di Roma Tor Vergata 1 / 14 SVM Le Support Vector Machines (SVM) sono una classe di macchine di che derivano da concetti riguardanti la

Dettagli

MACHINE LEARNING e DATA MINING Introduzione. a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it

MACHINE LEARNING e DATA MINING Introduzione. a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it MACHINE LEARNING e DATA MINING Introduzione a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it Apprendimento Automatico(i) Branca dell AI che si occupa di realizzare dispositivi artificiali capaci di

Dettagli

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 8 Support Vector Machines Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com http://www.onairweb.com/corsopr

Dettagli

Realizzazione di un sistema predittivo dei risultati del campionato di calcio italiano di serie A 2006/2007

Realizzazione di un sistema predittivo dei risultati del campionato di calcio italiano di serie A 2006/2007 Realizzazione di un sistema predittivo dei risultati del campionato di calcio italiano di serie A 2006/2007 Docente Prof. Giuseppe Manco Studenti Matr.. 96803 Francesco Aiello Matr.. 94881 Vittorio Leo

Dettagli

Sintesi di Reti Sequenziali Sincrone

Sintesi di Reti Sequenziali Sincrone LABORATORIO DI ARCHITETTURA DEI CALCOLATORI lezione n 9 Prof. Rosario Cerbone rosario.cerbone@uniparthenope.it a.a. 2007-2008 http://digilander.libero.it/rosario.cerbone Sintesi di Reti Sequenziali Sincrone

Dettagli

Per chi ha la Virtual Machine: avviare Grass da terminale, andando su Applicazioni Accessori Terminale e scrivere grass

Per chi ha la Virtual Machine: avviare Grass da terminale, andando su Applicazioni Accessori Terminale e scrivere grass 0_Iniziare con GRASS Avvio di Grass e creazione della cartella del Database di GRASS Per chi ha la Virtual Machine: avviare Grass da terminale, andando su Applicazioni Accessori Terminale e scrivere grass

Dettagli

Unione Europea Repubblica Italiana Regione Calabria Cooperativa sociale

Unione Europea Repubblica Italiana Regione Calabria Cooperativa sociale INFORMATICA Lezione 1 Docente Ferrante Francesco fracco2004@alice.it Sito web: http://luis7.altervista.org Obiettivi del corso Una parte generale sull'introduzione dei concetti di base dell'informatica

Dettagli

Data mining e rischi aziendali

Data mining e rischi aziendali Data mining e rischi aziendali Antonella Ferrari La piramide delle componenti di un ambiente di Bi Decision maker La decisione migliore Decisioni Ottimizzazione Scelta tra alternative Modelli di apprendimento

Dettagli

Introduzione al Linguaggio C

Introduzione al Linguaggio C Introduzione al Linguaggio C File I/O Daniele Pighin April 2009 Daniele Pighin Introduzione al Linguaggio C 1/15 Outline File e dati Accesso ai file File I/O Daniele Pighin Introduzione al Linguaggio C

Dettagli

Modelli probabilistici

Modelli probabilistici Modelli probabilistici Davide Cittaro e Marco Stefani Master bioinformatica 2003 Introduzione L obiettivo di presente lavoro è la classificazione di un insieme di proteine, definite da 27 valori numerici,

Dettagli

Riconoscimento di cifre manoscritte tramite una rete neurale

Riconoscimento di cifre manoscritte tramite una rete neurale Riconoscimento di cifre manoscritte tramite una rete neurale 3 luglio 2008 Argomenti discussi 1 Il problema 2 Il training set Codifica dei file 3 Soluzione implementata Soluzione ideale Soluzione implementata

Dettagli

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 5 Tecniche OCR Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com http://www.onairweb.com/corsopr

Dettagli

CLASSE PRIMA Istruzione Professionale Servizi Commerciali a.s. 2013/14

CLASSE PRIMA Istruzione Professionale Servizi Commerciali a.s. 2013/14 IIS Almerico Da Schio - DISCIPLINA: Informatica e Laboratorio CLASSE PRIMA Istruzione Professionale Servizi Commerciali a.s. 2013/14 COMPETENZE ABILITÀ/ CAPACITÀ CONOSCENZE dei linguaggi L1 Utilizzare

Dettagli

Uno standard per il processo KDD

Uno standard per il processo KDD Uno standard per il processo KDD Il modello CRISP-DM (Cross Industry Standard Process for Data Mining) è un prodotto neutrale definito da un consorzio di numerose società per la standardizzazione del processo

Dettagli

Computazione per l interazione naturale: Modelli dinamici

Computazione per l interazione naturale: Modelli dinamici Computazione per l interazione naturale: Modelli dinamici Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2015.html

Dettagli

Liberare la memoria allocata dinamicamente.

Liberare la memoria allocata dinamicamente. Scrivere un programma per la gestione dei libri e dei prestiti di una biblioteca universitaria. I libri sono caratterizzati dalle seguenti informazioni: titolo, autore, collocazione del libro, numero di

Dettagli

TypeEdit LaserType. TypeEdit e LaserType: i software artistici CAD/CAM, leader nel mercato, Vi offrono nuove e potenti funzionalità.

TypeEdit LaserType. TypeEdit e LaserType: i software artistici CAD/CAM, leader nel mercato, Vi offrono nuove e potenti funzionalità. TypeEdit LaserType V11 Innovativo Produttivo Ottimizzato TypeEdit e LaserType: i software artistici CAD/CAM, leader nel mercato, Vi offrono nuove e potenti funzionalità. Con la nuova versione V11, ottimizzano,

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

LABORATORIO. 2 Lezioni su Basi di Dati Contatti:

LABORATORIO. 2 Lezioni su Basi di Dati Contatti: PRINCIPI DI INFORMATICA CORSO DI LAUREA IN SCIENZE BIOLOGICHE Gennaro Cordasco e Rosario De Chiara {cordasco,dechiara}@dia.unisa.it Dipartimento di Informatica ed Applicazioni R.M. Capocelli Laboratorio

Dettagli

Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010

Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010 Traccia delle lezioni svolte in laboratorio Excel 2003 Excel 2003 Excel 2010 INTRODUZIONE A EXCEL EXCEL è un programma di Microsoft Office che permette di analizzare grandi quantità di dati (database)

Dettagli

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo Evoluzione In ogni popolazione si verificano delle mutazioni. Intelligenza Artificiale In un ambiente che varia, le mutazioni possono generare individui che meglio si adattano alle nuove condizioni. Questi

Dettagli

Sistemi di Elaborazione delle Informazioni (C.I. 15) Access

Sistemi di Elaborazione delle Informazioni (C.I. 15) Access Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Sistemi di Elaborazione delle Informazioni (C.I. 15) Anno Accademico 2009/2010 Docente: ing. Salvatore Sorce Access C.d.L. in Igiene

Dettagli

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 4 Reti neurali per la classificazione Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com

Dettagli

PHOTO FILTRE. I programmi

PHOTO FILTRE. I programmi PHOTO FILTRE Iniziamo un percorso addestrativo che intende aiutare tutti i cacciatori ed i tiratori a mettersi nelle condizioni di predisporre con correttezza le immagini per la rete internet. Questo addestramento

Dettagli

1 Breve introduzione ad AMPL

1 Breve introduzione ad AMPL 1 Breve introduzione ad AMPL Il primo passo per risolvere un problema reale attraverso strumenti matematici consiste nel passare dalla descrizione a parole del problema al modello matematico dello stesso.

Dettagli

LE CARTE DI CONTROLLO (4)

LE CARTE DI CONTROLLO (4) LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale

Dettagli

VC-dimension: Esempio

VC-dimension: Esempio VC-dimension: Esempio Quale è la VC-dimension di. y b = 0 f() = 1 f() = 1 iperpiano 20? VC-dimension: Esempio Quale è la VC-dimension di? banale. Vediamo cosa succede con 2 punti: 21 VC-dimension: Esempio

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Corso di Laurea Magistrale in Ingegneria per l Ambiente e il Territorio A.A. 2014-2015 Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Strutture di dati: DB e DBMS DATO E INFORMAZIONE Dato: insieme

Dettagli

Data Mining. Gabriella Trucco gabriella.trucco@unimi.it

Data Mining. Gabriella Trucco gabriella.trucco@unimi.it Data Mining Gabriella Trucco gabriella.trucco@unimi.it Perché fare data mining La quantità dei dati memorizzata su supporti informatici è in continuo aumento Pagine Web, sistemi di e-commerce Dati relativi

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

MANUALE UTENTE. Versione 1.2 novembre 2011 2011 MAILDEM Tutti i diritti sono riservati

MANUALE UTENTE. Versione 1.2 novembre 2011 2011 MAILDEM Tutti i diritti sono riservati MANUALE UTENTE Versione 1.2 novembre 2011 2011 MAILDEM Tutti i diritti sono riservati INDICE ACCESSO AL SERVIZIO... 3 GESTIONE DESTINATARI... 4 Aggiungere destinatari singoli... 5 Importazione utenti...

Dettagli

Computazione per l interazione naturale: macchine che apprendono

Computazione per l interazione naturale: macchine che apprendono Computazione per l interazione naturale: macchine che apprendono Corso di Interazione Naturale! Prof. Giuseppe Boccignone! Dipartimento di Informatica Università di Milano! boccignone@di.unimi.it boccignone.di.unimi.it/in_2015.html

Dettagli

TUTOREDATTILO 7.144 MINI GUIDA PER L INSEGNANTE

TUTOREDATTILO 7.144 MINI GUIDA PER L INSEGNANTE TUTOREDATTILO 7.144 MINI GUIDA PER L INSEGNANTE PER SFRUTTARE AL MEGLIO TUTTE LE POTENZIALITÀ DI TUTOREDATTILO, SI CONSIGLIA VIVAMENTE DI LEGGERE LA GUIDA FORNITA CON IL PROGRAMMA. Scaricare la versione

Dettagli

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL

Dettagli

Università degli Studi di Salerno Ingegneria del Software: Tecniche Avanzate

Università degli Studi di Salerno Ingegneria del Software: Tecniche Avanzate Università degli Studi di Salerno Ingegneria del Software: Tecniche Avanzate Mystic Pizza Gestione Pizzeria Scheda di Progetto Version 1.0 Data 19/03/2007 Indice degli argomenti 1. Introduzione 3 a. Scenario

Dettagli

Laboratorio di Apprendimento Automatico. Fabio Aiolli aiolli@math.unipd.it Università di Padova

Laboratorio di Apprendimento Automatico. Fabio Aiolli aiolli@math.unipd.it Università di Padova Laboratorio di Apprendimento Automatico Fabio Aiolli aiolli@math.unipd.it Università di Padova Informazioni Aula (16 ore) e Laboratorio (16 ore) Sempre il giovedi dalle 15:30 alle 17:00, cercheremo di

Dettagli

PROGRAMMA DEL CORSO. Teoria

PROGRAMMA DEL CORSO. Teoria CORSO DI LAUREA in BIOLOGIA PROGRAMMA DEL CORSO INTRODUZONE ALL INFORMATICA A.A. 2014-15 Docente: Annamaria Bria Esercitatori: Salvatore Ielpa Barbara Nardi PROGRAMMA DEL CORSO Teoria 1. Cosa si intende

Dettagli

Il guadagno informativo negli alberi decisionali: un nuovo approccio

Il guadagno informativo negli alberi decisionali: un nuovo approccio Il guadagno informativo negli alberi decisionali: un nuovo approccio Sommario Descrizione del problema... 2 Il guadagno informativo di Nanni... 3 Il software Weka... 3 Cos è Weka... 3 Il guadagno Informativo

Dettagli

Sommario. Prefazione... 11. Introduzione... 13

Sommario. Prefazione... 11. Introduzione... 13 Prefazione... 11 Introduzione... 13 1. L interfaccia utente e le operazioni più comuni... 15 La scheda File...20 Ridurre la barra multifunzione...24 Personalizzare la barra multifunzione...25 La barra

Dettagli

Sicurezza dei sistemi e delle reti Introduzione

Sicurezza dei sistemi e delle reti Introduzione Sicurezza dei sistemi e delle reti Introduzione Damiano Carra Università degli Studi di Verona Dipartimento di Informatica Riferimenti! Cap. 8 di Reti di calcolatori e Internet. Un approccio topdown, J.

Dettagli

Dr. A. Appice. Alberi di Decisione. Caso di studio di Metodi Avanzati di Programmazione AA 2012-2013

Dr. A. Appice. Alberi di Decisione. Caso di studio di Metodi Avanzati di Programmazione AA 2012-2013 Alberi di Decisione Caso di studio di Metodi Avanzati di Programmazione AA 2012-2013 Data Mining Lo scopo del data mining è l estrazione (semi) automatica di conoscenza nascosta in voluminose basi di dati

Dettagli

Esempio di prova di laboratorio

Esempio di prova di laboratorio Esempio di prova di laboratorio Messa a punto di un modello mediante: Utilizzo dell interprete Matlab Utilizzo del toolbox Fuzzy Logic Utilizzo del toolbox Neuro Network Creazione di funzioni Analisi critica

Dettagli

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video Video Librerie digitali Gestione di video Ogni filmato è composto da più parti Video Audio Gestito come visto in precedenza Trascrizione del testo, identificazione di informazioni di interesse Testo Utile

Dettagli

DATA MINING PER IL MARKETING

DATA MINING PER IL MARKETING DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Algoritmi di classificazione Zani-Cerioli, Cap. XI CHAID: Chi-square Automatic Interaction

Dettagli

Statistica descrittiva univariata

Statistica descrittiva univariata Statistica descrittiva univariata Elementi di statistica 2 1 Tavola di dati Una tavola (o tabella) di dati è l insieme dei caratteri osservati nel corso di un esperimento o di un rilievo. Solitamente si

Dettagli

Annotazione automatica di immagini con sistemi desktop grid

Annotazione automatica di immagini con sistemi desktop grid Annotazione automatica di immagini con sistemi desktop grid Marco Ferrante (ferrante@csita.unige.it) Laura Lo Gerfo (logerfo@disi.unige.it) DISI - Università di Genova Tagging e retrieval di immagini Nell'annotazione

Dettagli

Hardware, software e periferiche. Facoltà di Lettere e Filosofia anno accademico 2008/2009 secondo semestre

Hardware, software e periferiche. Facoltà di Lettere e Filosofia anno accademico 2008/2009 secondo semestre Hardware, software e periferiche Facoltà di Lettere e Filosofia anno accademico 2008/2009 secondo semestre Riepilogo - Concetti di base dell informatica L'informatica è quel settore scientifico disciplinare

Dettagli

Pro e contro delle RNA

Pro e contro delle RNA Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;

Dettagli

Introduzione ad OLAP (On-Line Analytical Processing)

Introduzione ad OLAP (On-Line Analytical Processing) Introduzione ad OLAP (On-Line Analytical Processing) Metodi e Modelli per il Supporto alle Decisioni 2002 Dipartimento di Informatica Sistemistica e Telematica (Dist) Il termine OLAP e l acronimo di On-Line

Dettagli

DNA sequence alignment

DNA sequence alignment DNA sequence alignment - Introduzione: un possibile modello per rappresentare il DNA. Il DNA (Acido desossiribonucleico) è una sostanza presente nei nuclei cellulari, sia vegetali che animali; a questo

Dettagli

Dai dati al modello teorico

Dai dati al modello teorico Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere

Dettagli

Registro unico Antiriciclaggio

Registro unico Antiriciclaggio Registro unico Antiriciclaggio VERSIONE PROFESSIONISTI E CED VERSIONE 4.0.0 Sommario Introduzione... 4 Requisiti di sistema... 5 Installazione del software... 6 Verifica automatica dei requisiti di installazione...

Dettagli

Organizzano CORSO D INFORMATICA LIVELLO BASE

Organizzano CORSO D INFORMATICA LIVELLO BASE Comune di Stienta Organizzano CORSO D INFORMATICA LIVELLO BASE PRESSO AULA MULTIMEDIALE SCUOLA MEDIA COMUNE DI STIENTA IL MOTORE DI RICERCA CHE TI CERCA VISITA IL SITO HTTP://cerca.gruppo-si.it Premessa:

Dettagli

Linea guida di inserimento dati Antiriciclaggio-XP DM-141

Linea guida di inserimento dati Antiriciclaggio-XP DM-141 La linea guida consente tramite la procedura operativa per il primo inserimento dei dati di raggiungere una corretta creazione dei registri soggetti e prestazioni ai fini DM-141. Procedura operativa al

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

TEORIA sulle BASI DI DATI

TEORIA sulle BASI DI DATI TEORIA sulle BASI DI DATI A cura del Prof. Enea Ferri Cos è un DATA BASE E un insieme di archivi legati tra loro da relazioni. Vengono memorizzati su memorie di massa come un unico insieme, e possono essere

Dettagli

Algoritmi Genetici. e programmazione genetica

Algoritmi Genetici. e programmazione genetica Algoritmi Genetici e programmazione genetica Algoritmi Genetici Algoritmi motivati dall analogia con l evoluzione biologica Lamarck: le specie trasmutano nel tempo Darwin e Wallace: variazioni consistenti

Dettagli

Airone Gestione Rifiuti Funzioni di Esportazione e Importazione

Airone Gestione Rifiuti Funzioni di Esportazione e Importazione Airone Gestione Rifiuti Funzioni di Esportazione e Importazione Airone Funzioni di Esportazione Importazione 1 Indice AIRONE GESTIONE RIFIUTI... 1 FUNZIONI DI ESPORTAZIONE E IMPORTAZIONE... 1 INDICE...

Dettagli

LINEE GUIDA PER IL DISASTER RECOVERY DELLE PUBBLICHE AMMINISTRAZIONI. Note di accompagnamento allo strumento di autovalutazione

LINEE GUIDA PER IL DISASTER RECOVERY DELLE PUBBLICHE AMMINISTRAZIONI. Note di accompagnamento allo strumento di autovalutazione LINEE GUIDA PER IL DISASTER RECOVERY DELLE PUBBLICHE AMMINISTRAZIONI Note di accompagnamento allo strumento di autovalutazione 1 1. INTRODUZIONE ALLO STRUMENTO DI SUPPORTO ALL AUTOVALUTAZIONE Lo strumento

Dettagli

Le Basi di dati: generalità. Unità di Apprendimento A1 1

Le Basi di dati: generalità. Unità di Apprendimento A1 1 Le Basi di dati: generalità Unità di Apprendimento A1 1 1 Cosa è una base di dati In ogni modello di organizzazione della vita dell uomo vengono trattate informazioni Una volta individuate e raccolte devono

Dettagli

Data mining. Vincenzo D Elia. vincenzo.delia@polito.it. DBDMG - Politecnico di Torino

Data mining. Vincenzo D Elia. vincenzo.delia@polito.it. DBDMG - Politecnico di Torino Data mining Vincenzo D Elia vincenzo.delia@polito.it DBDMG - Politecnico di Torino vincenzo.delia@polito.it Archivi Multimediali e Data Mining - p. 1 Rapid Miner vincenzo.delia@polito.it Archivi Multimediali

Dettagli

Finalmente a disposizione un software unico per tutte le LIM della scuola 2.0

Finalmente a disposizione un software unico per tutte le LIM della scuola 2.0 Finalmente a disposizione un software unico per tutte le LIM della scuola 2.0 Uno strumento unico per risolvere i problemi di compatibilità tra le diverse lavagne interattive Non fermarti alla LIM, con

Dettagli

Tracciare percorsi con OCAD8 Checo 11.1.03

Tracciare percorsi con OCAD8 Checo 11.1.03 Tracciare percorsi con OCAD8 Checo 11.1.03 Panoramica generale Avvìo di un progetto di tracciamento percorsi Per avviare un progetto di tracciamento occorre creare un file progetto. Quindi vi si carica

Dettagli

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI Documenti su Internet LINGUAGGI DI MARKUP Internet permette (tra l altro) di accedere a documenti remoti In generale, i documenti acceduti via Internet sono multimediali, cioè che possono essere riprodotti

Dettagli

Scaricare la versione 7.1 di TutoreDattilo per tastiera italiana dal sito. http://www.maurorossi.net/pagine/programmi/tutoredattilo.

Scaricare la versione 7.1 di TutoreDattilo per tastiera italiana dal sito. http://www.maurorossi.net/pagine/programmi/tutoredattilo. TUTOREDATTILO 7.1 GUIDA PER L INSEGNANTE Scaricare la versione 7.1 di TutoreDattilo per tastiera italiana dal sito http://www.maurorossi.net/pagine/programmi/tutoredattilo.htm e installarla sui PC utilizzati

Dettagli

Logistica Magazzino: Distinta base

Logistica Magazzino: Distinta base Logistica Magazzino: Distinta base Premessa 2 Centri di lavoro 2 Cicli di lavorazione 3 Fasi cicli di lavorazione 4 Dettaglio costi 4 Distinta base 5 Archivio distinta base 5 Dettaglio distinta 5 Duplicazione

Dettagli

Laboratorio di Apprendimento Automatico. Fabio Aiolli Università di Padova

Laboratorio di Apprendimento Automatico. Fabio Aiolli Università di Padova Laboratorio di Apprendimento Automatico Fabio Aiolli Università di Padova Esempi di Applicazioni Web page Ranking Quali documenti sono rilevanti per una determinata query? Quali sorgenti di informazione

Dettagli

Ref. Prof.ri TIC e Informatica e Laboratorio A PRESENTAZIONE

Ref. Prof.ri TIC e Informatica e Laboratorio A PRESENTAZIONE UNITÀ DI APPRENDIMENTO TECNOLOGIE DELL INFORMAZIONE E DELLA COMUNICAZIONE Ref. Prof.ri TIC e Informatica e Laboratorio A.S. 2015-2016 TITOLO : Il PC: un amico utile COD. U.d.A N 1/4 A PRESENTAZIONE Destinatari

Dettagli

SDD System design document

SDD System design document UNIVERSITA DEGLI STUDI DI PALERMO FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA INFORMATICA TESINA DI INGEGNERIA DEL SOFTWARE Progetto DocS (Documents Sharing) http://www.magsoft.it/progettodocs

Dettagli

ISTITUTO d IstruzIone Superiore A. righi

ISTITUTO d IstruzIone Superiore A. righi I.T.S. A. Righi M. I. U. R. Unione Europea ISTITUTO d IstruzIone Superiore A. righi Istituto Tecnico Statale Attività Sociali M.Guerrisi PROGRAMMA SVOLTO TECNOLOGIE INFORMATICHE CLASSI: PRIMA SEZ: B PROF:

Dettagli

Indicatori di occorrenza Indica la presenza facoltativa (0-1) dell'elemento

Indicatori di occorrenza Indica la presenza facoltativa (0-1) dell'elemento Nelle righe che seguono si cercherà di dar conto delle scelte operate nella definizione del modello attraverso una descrizione puntuale delle unità informative (elementi della DTD) in cui è stata segmentata

Dettagli

16.3.1 Alberi binari di ricerca

16.3.1 Alberi binari di ricerca 442 CAPITOLO 16. STRUTTURE DI DATI DINAMICHE root 7 5 11 2 8 13 10 Figura 16.11 Esempio di albero binario: ogni nodo contiene il dato da immagazzinare e tre puntatori che definiscono le sue relazioni di

Dettagli

Progettazione di basi di dati. Progettazione di basi di dati. Ciclo di vita dei sistemi informativi. Fasi del ciclo di vita [1]

Progettazione di basi di dati. Progettazione di basi di dati. Ciclo di vita dei sistemi informativi. Fasi del ciclo di vita [1] Progettazione di basi di dati Progettazione di basi di dati Requisiti progetto Base di dati Struttura Caratteristiche Contenuto Metodologia in 3 fasi Progettazione concettuale Progettazione logica Progettazione

Dettagli

Ricerca di outlier. Ricerca di Anomalie/Outlier

Ricerca di outlier. Ricerca di Anomalie/Outlier Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla

Dettagli

Dispensa 3. 1.1 YACC: generalità

Dispensa 3. 1.1 YACC: generalità Dispensa 3 1.1 YACC: generalità Il tool Yacc (acronimo per Yet Another Compiler Compiler) è uno strumento software che a partire da una specifica grammaticale context free di un linguaggio scritta in un

Dettagli

- Guida Utente IMPRESA- GEMA. Codice Documento: LI-MU-A366-GEMA-IMPRESA Revisione del Documento: 05 Data revisione: 14-01-2015. Struttura Redatto da:

- Guida Utente IMPRESA- GEMA. Codice Documento: LI-MU-A366-GEMA-IMPRESA Revisione del Documento: 05 Data revisione: 14-01-2015. Struttura Redatto da: - Guida Utente IMPRESA- GEMA Codice Documento: LI-MU-A366-GEMA-IMPRESA Revisione del Documento: 05 Data revisione: 14-01-2015 Struttura Redatto da: A366 Area Sistemi di Settore Approvato da: A525 Area

Dettagli

Tecniche di Clustering basate sul Machine Learning

Tecniche di Clustering basate sul Machine Learning UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II Scuola Politecnica e delle Scienze di base Area didattica Scienze Matematiche Fisiche e Naturali Corso di Laurea in Informatica Tecniche di Clustering basate

Dettagli

Tutorial gvsig. Versione 1.1

Tutorial gvsig. Versione 1.1 Tutorial gvsig Versione 1.1 24/10/2007 Tutorial gvsig - Versione 1.1 www.gvsig.org Testo e screenshot a cura di R3 GIS Srl Via Johann Kravogl 2 39012 Merano (BZ) Italia Tel. +39 0473 494949 Fax +39 0473

Dettagli

2 - Introduzione al linguaggio Java

2 - Introduzione al linguaggio Java 2 - Introduzione al linguaggio Java Programmazione e analisi di dati Modulo A: Programmazione in Java Paolo Milazzo Dipartimento di Informatica, Università di Pisa http://www.di.unipi.it/ milazzo milazzo

Dettagli

R - Esercitazione 1. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. 30 Settembre 2013. Università Roma Tre

R - Esercitazione 1. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. 30 Settembre 2013. Università Roma Tre R - Esercitazione 1 Lorenzo Di Biagio dibiagio@mat.uniroma3.it Università Roma Tre 30 Settembre 2013 Introduzione a R R è un software open-source, per Linux, Mac OS X, Windows, distribuito secondo la licenza

Dettagli

INTRODUZIONE A EXCEL ESERCITAZIONE I

INTRODUZIONE A EXCEL ESERCITAZIONE I 1 INTRODUZIONE A EXCEL ESERCITAZIONE I Corso di Idrologia e Infrastrutture Idrauliche Prof. Roberto Guercio Cos è Excel 2 Foglio di calcolo o foglio elettronico è formato da: righe e colonne visualizzate

Dettagli

Informatica (Basi di Dati)

Informatica (Basi di Dati) Corso di Laurea in Biotecnologie Informatica (Basi di Dati) Introduzione alle Basi di Dati Anno Accademico 2009/2010 Da: Atzeni, Ceri, Paraboschi, Torlone - Basi di Dati Lucidi del Corso di Basi di Dati

Dettagli

INFORMATICA CORSI DELL'INDIRIZZO TECNICO CLASSI PRIME AMMINISTRAZIONE - FINANZA E MARKETING

INFORMATICA CORSI DELL'INDIRIZZO TECNICO CLASSI PRIME AMMINISTRAZIONE - FINANZA E MARKETING INFORMATICA CORSI DELL'INDIRIZZO TECNICO CLASSI PRIME AMMINISTRAZIONE - FINANZA E MARKETING Modulo propedeutico Le lezioni teoriche sono sviluppate sui seguenti argomenti: Struttura dell elaboratore: CPU,

Dettagli

A destra è delimitata dalla barra di scorrimento verticale, mentre in basso troviamo una riga complessa.

A destra è delimitata dalla barra di scorrimento verticale, mentre in basso troviamo una riga complessa. La finestra di Excel è molto complessa e al primo posto avvio potrebbe disorientare l utente. Analizziamone i componenti dall alto verso il basso. La prima barra è la barra del titolo, dove troviamo indicato

Dettagli

Model Driven Software Development con Eclipse, StatechartUMC

Model Driven Software Development con Eclipse, StatechartUMC Model Driven Software Development con Eclipse, StatechartUMC Aldi Sulova Istituto di Scienza e Tecnologie dell Informazione A. Faedo - CNR Via G. Moruzzi 1, 56124 Pisa, Italy aldi.sulova@isti.cnr.it Abstract.

Dettagli

Università degli Studi di Perugia A.A. 2014/2015 Dipartimento di Economia. ECONOMIA INDUSTRIALE Prof. Davide Castellani (davide.castellani@unipg.

Università degli Studi di Perugia A.A. 2014/2015 Dipartimento di Economia. ECONOMIA INDUSTRIALE Prof. Davide Castellani (davide.castellani@unipg. Università degli Studi di Perugia A.A. 2014/2015 Dipartimento di Economia ECONOMIA INDUSTRIALE Prof. Davide Castellani (davide.castellani@unipg.it) Introduzione Differenziazione del prodotto Differenziazione

Dettagli

DENUNCE EDILCONNECT GUIDA COMPILAZIONE

DENUNCE EDILCONNECT GUIDA COMPILAZIONE Cassa Edile Como e Lecco DENUNCE EDILCONNECT GUIDA COMPILAZIONE COMPILAZIONE MANUALE DENUNCIA Guida per i consulenti e le imprese che compilano la denuncia senza utilizzare il file di esportazione dei

Dettagli