Tesina Intelligenza Artificiale Maria Serena Ciaburri s A.A

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Tesina Intelligenza Artificiale Maria Serena Ciaburri s A.A"

Transcript

1 Tesina Intelligenza Artificiale Maria Serena Ciaburri s A.A Lo scopo di questa tesina è quello di clusterizzare con l algoritmo K-Means i dati presenti nel dataset MNIST e di calcolare per ogni cluster formato l indice di eterogeneità di Gini. Per raggiungere questo obiettivo è stato realizzato uno script in Python. I dati utilizzati sono contenuti nel dataset MNIST, una raccolta di cifre numeriche scritte a mano e salvate come immagini in bianco e nero di 28x28 pixels. Nel nostro caso è stato utilizzato il training set (disponibile al link: contente 60,000 immagini. L algoritmo K-Means è un algoritmo di clusterizzazione in cui il numero (k) di centroidi viene scelto all inizio e in cui i centroidi di ogni cluster vengono calcolati come media (means) di tutti i dati presenti in un cluster. Inizialmente, quindi, si scelgono in modo casuale k centroidi. Successivamente, si assegna ogni dato disponibile a uno di questi cluster e si ricalcolano i centri di cluster come media di tutti i punti presenti in quel cluster. Questo processo viene ripetuto fino a quando non si ha convergenza (cioè fino a quando i centroidi non cambiano). L indice di eterogeneità Gini è una misura dell eterogeneità di un campione {a!, a!,, a! } in cui ogni elemento può assumere s valori distiniti {v!, v!,, v! }. Il calcolo dell eterogeneità è basato sul valore f! della frequenza relativa dell elemento v! per i = 1, 2, s secondo la formula:! I = 1 f!! L indice può assumere valori compresi tra 0 e 1. In caso di eterogeneità minima (quando si ha quindi omogeneità massima), tutti gli elementi del campione assumono lo stesso valore, quindi I = 0. In caso di eterogeneità massima (quindi omogeneità minima) tutte le osservazioni hanno la stessa frequenza (f! =!!!! ) quindi I =.!! L indice di eterogeneità di Gini normalizzato si ottiene dividendo la quantità trovata per l indice massimo: I!"#$%&'((%)" =!!! I s 1 s = s I s 1 Lo script Lo script Python realizzato per svolgere la tesina è diviso in due moduli: gini. py (il modulo principale) e functions. py (quello che contiene le definizioni delle funzioni chiamate). Per eseguire lo script, bisogna semplicemente digitare nella finestra del terminale il seguente comando: python gini. py < k > < flag > dove < k > è il numero di cluster che vogliamo formare con K-Means e < flag > è un flag che viene settato per avere una visualizzazione grafica dei centroidi finali e del contenuto dei cluster ottenuti.

2 Le librerie principali utilizzate da questo script sono: -matplotlib, necessaria per la visualizzazione grafica dei dati ottenuti -numphy, una libreria di supporto per vettori e matrici multidimensionali -scikit.learn, una libreria open source contenente algoritmi per data mining e data analysis. In particolare, è stato utilizzato il modulo sklearn. cluster (link: La prima operazione che viene effettuata è l acquisizione dei dati, grazie alla funzione load_mnist() contenuta nel modulo functions. py. Il formato dei dati MNIST è chiamato IDX ed è un formato per vettori e matrici multidimensionali di numeri. La funzione load_mnist() interpreta il formato dei file e ritorna due insiemi di dati: le immagini (un vettore 3D in cui ogni elemento è un vettore 28x28) e le labels corrispondenti alle immagini. Le immagini vengono poi trasformate in vettori di 784 elementi, grazie alla funzione reshape della libreria numphy, in modo da poter essere elaborate dall algorimto K-Means. A questo punto, viene creato un oggetto della classe sklearn. cluster. KMeans: KMeans(n_clusers=8, init= k-means++, n_init=10, max_iter=300, tol=0.0001,precompute_ distance= auto, verbose=0, random_state=none, copy_x=true, n_jobs=1, algorithm= auto ) e viene successivamente chiamato il metodo fit() per effettuare il clustering dei dati. Una volta formati tutti i cluster, da ognuno di questi vengono estratti i dati contenuti e vengono calcolate le frequenze relative di ogni label. Vengono poi calcolati, sempre per ogni cluster, l indice di eterogeneità di Gini e la sua normalizzazione secondo la formula mostrata in precedenza. Una volta calcolati tutti gli indici del cluster, viene presentato a video un grafico a barre che mostra per ogni cluster il valore dell indice di Gini e della sua normalizzazione. Se il flag per la visualizzazione dei centroidi e dei cluster finali è stato settato ad 1, a questo punto vengono mostrate a video anche le immagini (28x28 pixels) degli ultimi centroidi ottenuti e le immagini dei dati contenuti in ogni cluster. Un esempio di visualizzazione dei centroidi finali è il seguente:

3 Qui, invece, abbiamo un esempio della visualizzazione di alcuni cluster ottenuti:

4 Risultati Di seguito abbiamo i risultati ottenuti dallo script con diversi valori di k: k=10

5 k=15 k =20

6 k =25 k=30

Uso dell algoritmo di Quantizzazione Vettoriale per la determinazione del numero di nodi dello strato hidden in una rete neurale multilivello

Uso dell algoritmo di Quantizzazione Vettoriale per la determinazione del numero di nodi dello strato hidden in una rete neurale multilivello Tesina di Intelligenza Artificiale Uso dell algoritmo di Quantizzazione Vettoriale per la determinazione del numero di nodi dello strato hidden in una rete neurale multilivello Roberto Fortino S228682

Dettagli

QUANTIZZATORE VETTORIALE

QUANTIZZATORE VETTORIALE QUANTIZZATORE VETTORIALE Introduzione Nel campo delle reti neurali, la scelta del numero di nodi nascosti da usare per un determinato compito non è sempre semplice. Per tale scelta potrebbe venirci in

Dettagli

Clustering con Weka. L interfaccia. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna. Algoritmo utilizzato per il clustering

Clustering con Weka. L interfaccia. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna. Algoritmo utilizzato per il clustering Clustering con Weka Testo degli esercizi Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna L interfaccia Algoritmo utilizzato per il clustering E possibile escludere un sottoinsieme

Dettagli

Clustering con Weka Testo degli esercizi. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna

Clustering con Weka Testo degli esercizi. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Clustering con Weka Testo degli esercizi Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna L interfaccia Algoritmo utilizzato per il clustering E possibile escludere un sottoinsieme

Dettagli

Introduzione all analisi di arrays: clustering.

Introduzione all analisi di arrays: clustering. Statistica per la Ricerca Sperimentale Introduzione all analisi di arrays: clustering. Lezione 2-14 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia

Dettagli

POLITECNICO DI TORINO

POLITECNICO DI TORINO POLITECNICO DI TORINO III Facoltà di Ingegneria dell Informazione Corso di Laurea Magistrale in Ingegneria Informatica Tesina di Intelligenza Artificiale Clustering su dati climatici usando Kohonen map

Dettagli

K-means clustering con R

K-means clustering con R K-means clustering con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l-10_cluster_k-means.html#(1) 1/10 Introduzione K-means è un approccio semplice ed elegante

Dettagli

ICA per analisi di gruppo

ICA per analisi di gruppo ICA per analisi di gruppo Simone Romano 1 1 Università degli Studi di Salerno Elaborazione di segnali ed immagini biomediche Prof. Fabrizio Esposito. Romano (Università degli Studi di Salerno) ICA per

Dettagli

Segmentazione di immagini in scala di grigio basata su clustering

Segmentazione di immagini in scala di grigio basata su clustering Segmentazione di immagini in scala di grigio basata su clustering Davide Anastasia, Nicola Cogotti 24 gennaio 06 1 Analisi del problema La segmentazione di immagini consiste nella suddivisione in un certo

Dettagli

Laboratorio di Bioimmagini A.A

Laboratorio di Bioimmagini A.A Laboratorio di Bioimmagini A.A. 2008-2009 Le immagini da utilizzare nei seguenti esercizi ed il codice Matlab delle soluzioni sono scaricabili da: http://www.dei.unipd.it/~enrigri/public/lab Esercizio

Dettagli

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011 Intelligenza Artificiale Clustering Francesco Uliana 14 gennaio 2011 Definizione Il Clustering o analisi dei cluster (dal termine inglese cluster analysis) è un insieme di tecniche di analisi multivariata

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione

Dettagli

Prova scritta di ASM - Modulo Analisi Esplorativa del

Prova scritta di ASM - Modulo Analisi Esplorativa del Cognome:... Nome:... Matricola:......... Prova scritta di ASM - Modulo Analisi Esplorativa del 14.02.2017 La durata della prova è di 90 minuti. Si svolgano gli esercizi A e B riportando il risultato dove

Dettagli

Processamento delle immagini

Processamento delle immagini Processamento delle immagini Docente: Domenico Daniele Bloisi Novembre 2017 Esercizio 1 Utilizzare il linguaggio di programmazione Python e la libreria OpenCV per visualizzare sullo schermo il logo ASL

Dettagli

Misura della performance di ciascun modello: tasso di errore sul test set

Misura della performance di ciascun modello: tasso di errore sul test set Confronto fra modelli di apprendimento supervisionato Dati due modelli supervisionati M 1 e M costruiti con lo stesso training set Misura della performance di ciascun modello: tasso di errore sul test

Dettagli

Istruzioni per l analisi in componenti principali con R

Istruzioni per l analisi in componenti principali con R Istruzioni per l analisi in componenti principali con R Vi ricordo che in nero sono state inserite le note e in rosso le istruzioni da digitare sulla console di R Importare il dataset gelati

Dettagli

Le Tecniche di Data Mining

Le Tecniche di Data Mining Cluster Analysis Le Tecniche di Data Mining Le rinciali tecniche di data mining che vedremo sono: Ø Ø Cluster Analysis Alberi Decisionali Cluster Analysis La Cluster Analysis è una tecnica di data mining

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: introduzione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Una definizione

Dettagli

Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60 minuti

Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60 minuti 3 Luglio 2018 - Analisi Esplorativa Cognome:... Nome: Matricola:... Tipologia d esame: 12 CFU 15 CFU Prova scritta - versione B Si svolgano gli esercizi riportando il risultato dove indicato. Durata: 60

Dettagli

Clustering con Weka. L interfaccia. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna. Algoritmo utilizzato per il clustering

Clustering con Weka. L interfaccia. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna. Algoritmo utilizzato per il clustering Clustering con Weka Soluzioni degli esercizi Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna L interfaccia Algoritmo utilizzato per il clustering E possibile escludere un sottoinsieme

Dettagli

Weka Project. Weka. Weka Project. Formato.arff. Modalità di utilizzo di Weka. Formato.arff

Weka Project. Weka. Weka Project. Formato.arff. Modalità di utilizzo di Weka. Formato.arff Weka Project Weka Machine Learning Algorithms in Java Waikato Environment for Knowledge Analysis Algoritmi di Data Mining e Machine Learning realizzati in Java Preprocessing Classificazione Clustering

Dettagli

13 Esercizi di Riepilogo

13 Esercizi di Riepilogo 13.1 Esercizi Esercizio 13.1 Si consideri una versione semplificata della battaglia navale in cui le navi possono essere posizionate solo in orizzontale e ogni riga può contenere al massimo una nave. Il

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: metodologie Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Tassonomia

Dettagli

FONDAMENTI DI INFORMATICA

FONDAMENTI DI INFORMATICA FONDAMENTI DI INFORMATICA Prof. Alfredo Accattatis Slide (rielaborate) del prof. Emiliano Casalicchio accattatis@ing.uniroma2.it Esercizio (1) Dati due vettori V1 e V2 scrivere un algoritmo che permetta

Dettagli

Fondamenti di Informatica

Fondamenti di Informatica Fondamenti di Informatica rogrammazione in MATLAB Gestione File Grafici E s e rc i t a z i o n e e r C a s a 2 r o f. R a f f a e l e i z zo l a n t e A. A. 2 0 1 6 / 1 7 M unteggio 5 3 2 4 7 3 3 2 1 9

Dettagli

Matlab: Script e Funzioni

Matlab: Script e Funzioni Matlab: Script e Funzioni Informatica B Script Cos è uno script (m-file) q Uno script è un file di testo contenente una sequenza di comandi MATLAB non deve contenere caratteri di formattazione (solo testo

Dettagli

Statistica per l Impresa

Statistica per l Impresa Statistica per l Impresa a.a. 207/208 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 2 maggio 208 Indice Analisi dei Gruppi: Introduzione Misure di distanza e indici di similarità 3. Metodi gerarchici

Dettagli

Slides estratte dalla tesi: EMT: UNA LIBRERIA MATLAB PER METODI DI ESTRAPOLAZIONE ED APPLICAZIONI

Slides estratte dalla tesi: EMT: UNA LIBRERIA MATLAB PER METODI DI ESTRAPOLAZIONE ED APPLICAZIONI Slides estratte dalla tesi: EMT: UNA LIBRERIA MATLAB PER METODI DI ESTRAPOLAZIONE ED APPLICAZIONI Corso di Laurea in Matematica Laureanda: Elena De Cia Relatore: Prof. Michela Redivo Zaglia Università

Dettagli

Metodi di Analisi dei Dati Sperimentali. AA 2009/2010 Pier Luca Maffettone. Elementi di Matlab

Metodi di Analisi dei Dati Sperimentali. AA 2009/2010 Pier Luca Maffettone. Elementi di Matlab Metodi di Analisi dei Dati Sperimentali AA /2010 Pier Luca Maffettone Elementi di Matlab Sommario Introduzione Variabili Manipolazione di elementi Creazione di vettori/matrici Operazioni elementari Funzioni

Dettagli

WEKA Data Mining System

WEKA Data Mining System Alma Mater Studiorum Università di Bologna WEKA Data Mining System Sistemi Informativi a supporto delle Decisioni LS - Prof. Marco Patella Presentazione di: Fabio Bertozzi, Giacomo Carli 1 WEKA: the bird

Dettagli

Data Journalism. Analisi dei dati. Angelica Lo Duca

Data Journalism. Analisi dei dati. Angelica Lo Duca Data Journalism Analisi dei dati Angelica Lo Duca angelica.loduca@iit.cnr.it Obiettivo L obiettivo dell analisi dei dati consiste nello scoprire trend, pattern e relazioni nascosti nei dati. di analisi

Dettagli

Python. Loriano Storchi.

Python. Loriano Storchi. Python Loriano Storchi loriano@storchi.org http:://www.storchi.org/ I linguaggi di programmazione Abbiamo visto che i linguaggi di programmaione sono: Dichiarativi Logici Funzionali Imperativi Procedurali

Dettagli

Introduzione al data mining. Sistemi di elaborazione delle informazioni 2 Anno Accademico Prof. Mauro Giacomini

Introduzione al data mining. Sistemi di elaborazione delle informazioni 2 Anno Accademico Prof. Mauro Giacomini Introduzione al data mining Sistemi di elaborazione delle informazioni 2 Anno Accademico 2007-2008 Prof. Mauro Giacomini Definizione Processo che impiega una o più tecniche di apprendimento computerizzate

Dettagli

Laboratorio di Calcolo Numerico Laboratorio 4: Grafici di convergenza e functions

Laboratorio di Calcolo Numerico Laboratorio 4: Grafici di convergenza e functions Dipartimento di Matematica Laboratorio di Calcolo Numerico Laboratorio 4: Grafici di convergenza e functions Damiano Pasetto E-mail: pasetto@math.unipd.it Dispense: http://dispense.dmsa.unipd.it/putti/calcolo

Dettagli

Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare!

Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare! La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. Le tecniche di cluster analysis vengono usate per esplorare i dati e non per modellare! La cluster analysis

Dettagli

Esercitazione gennaio 2015

Esercitazione gennaio 2015 Esercitazione 10 19 gennaio 2015 Termine per la consegna dei lavori: martedì 26 gennaio ore 23.59. Istruzioni I lavori dovranno essere salvati in una cartella che deve contenere tutto e solo ciò che volete

Dettagli

Preprocessing. Corso di AA, anno 2017/18, Padova. Fabio Aiolli. 27 Novembre Fabio Aiolli Preprocessing 27 Novembre / 14

Preprocessing. Corso di AA, anno 2017/18, Padova. Fabio Aiolli. 27 Novembre Fabio Aiolli Preprocessing 27 Novembre / 14 Preprocessing Corso di AA, anno 2017/18, Padova Fabio Aiolli 27 Novembre 2017 Fabio Aiolli Preprocessing 27 Novembre 2017 1 / 14 Pipeline di Apprendimento Supervisionato Analisi del problema Raccolta,

Dettagli

Matematica e Consulenza: un connubio perfetto. Mirco Patriarca Università di Pavia, Marzo 2018

Matematica e Consulenza: un connubio perfetto. Mirco Patriarca Università di Pavia, Marzo 2018 Matematica e Consulenza: un connubio perfetto Mirco Patriarca Università di Pavia, Marzo 2018 AGENDA La mia storia Cosa vuol dire essere un consulente «Data is the new Oil» Esempi di progetto Geo-localization

Dettagli

Lo scopo. Il primo esperimento. Soluzione informale. Le variabili

Lo scopo. Il primo esperimento. Soluzione informale. Le variabili Lo scopo 2 Il primo esperimento Si vuole scrivere un programma in linguaggio C che chieda all utente di introdurre da tastiera due numeri interi e visualizzi il valore della loro somma sul video Ver. 2.4

Dettagli

Introduzione ai Laboratori di Fondamenti di Analisi dei Dati. Antonino Furnari

Introduzione ai Laboratori di Fondamenti di Analisi dei Dati. Antonino Furnari Introduzione ai Laboratori di Fondamenti di Analisi dei Dati Antonino Furnari furnari@dmi.unict.it www.dmi.unict.it/~furnari/ Laboratori di FAD Docente: Antonino Furnari (www.dmi.unict.it/~furnari/); Ricevimento:

Dettagli

Ricerca di outlier. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna

Ricerca di outlier. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla

Dettagli

DIFFUSIONE SU GRAFO (rete) E RIPOSIZIONAMENTO DI FARMACI SULLA BASE DELLA SIMILARITA DI STRUTTURA MOLECOLARE

DIFFUSIONE SU GRAFO (rete) E RIPOSIZIONAMENTO DI FARMACI SULLA BASE DELLA SIMILARITA DI STRUTTURA MOLECOLARE 0 DIFFUSIONE SU GRAFO (rete) E RIPOSIZIONAMENTO DI FARMACI SULLA BASE DELLA SIMILARITA DI STRUTTURA MOLECOLARE Cammini aleatori su grafo (Random walk) 0 «processo di esplorazione casuale di un grafo mediante

Dettagli

Esercitazioni di MatLab

Esercitazioni di MatLab 1 / 33 Esercitazioni di MatLab Supporto alla didattica - Lezione 1 Serena Crisci Università di Ferrara - Dip. di Matematica e Informatica e-mail: serena.crisci@unife.it A.A. 2017/18 2 / 33 Sommario 1 Introduzione

Dettagli

A = Quindi > b=a(:) b =

A = Quindi > b=a(:) b = Una breve digressione. Se si vuole uscire da Matlab, occorre digitare ( come già riferito)il comando >> quit Se si vogliono utilizzare le variabili create per una successiva sessione di lavoro, prima di

Dettagli

Fondamenti di Informatica

Fondamenti di Informatica Fondamenti di Informatica Programmazione in MATLAB Gestione File Grafici E s e rc i t a z i o n e 4 P r o f. R a f f a e l e P i z zo l a n t e A. A. 2 0 1 6 / 1 7 carburante La matrice rappresenta

Dettagli

(a) Si proponga una formulazione di programmazione nonlineare a variabili misto-intere per problema.

(a) Si proponga una formulazione di programmazione nonlineare a variabili misto-intere per problema. 6. Clustering In molti campi applicativi si presenta il problema del data mining, che consiste nel suddividere un insieme di dati in gruppi e di assegnare un centro a ciascun gruppo. Ad esempio, in ambito

Dettagli

Classificazione di immagini aeree. Annalisa Franco

Classificazione di immagini aeree. Annalisa Franco Classificazione di immagini aeree Annalisa Franco annalisa.franco@unibo.it http://bias.csr.unibo.it/vr/ 2 Classificazione di immagini aeree Scopo di questa esercitazione è l implementazione di una tecnica

Dettagli

Università di Pisa A.A. 2004-2005

Università di Pisa A.A. 2004-2005 Università di Pisa A.A. 2004-2005 Analisi dei dati ed estrazione di conoscenza Corso di Laurea Specialistica in Informatica per l Economia e per l Azienda Tecniche di Data Mining Corsi di Laurea Specialistica

Dettagli

Indice generale. Introduzione. Ringraziamenti dell autore...xxi. Capitolo 1 Dare ai computer la capacità di apprendere dai dati...

Indice generale. Introduzione. Ringraziamenti dell autore...xxi. Capitolo 1 Dare ai computer la capacità di apprendere dai dati... Premessa Introduzione...xiii...xv Struttura del libro...xvi Dotazione software necessaria...xvii A chi è rivolto questo libro...xviii Convenzioni...xviii Scarica i file degli esempi...xix L autore...xix

Dettagli

STATISTICA 1 ESERCITAZIONE 2

STATISTICA 1 ESERCITAZIONE 2 Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti

Dettagli

Tecniche di Clustering basate sul Machine Learning

Tecniche di Clustering basate sul Machine Learning UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II Scuola Politecnica e delle Scienze di base Area didattica Scienze Matematiche Fisiche e Naturali Corso di Laurea in Informatica Tecniche di Clustering basate

Dettagli

Cenni sulla cluster analysis

Cenni sulla cluster analysis Cenni sulla cluster analysis Distanze Dato un insieme E, una funzione d: E X E -> R + che ha le seguenti tre proprietà: d(x i, x j ) = 0 x i = x j d(x i, x j ) = d(x j, x i ) d(x i, x j ) d(x j, x h )

Dettagli

Vivisezione di un algoritmo di machine learning. Francesco ESPOSITO Youbiquitous

Vivisezione di un algoritmo di machine learning. Francesco ESPOSITO Youbiquitous Vivisezione di un algoritmo di machine learning Francesco ESPOSITO Youbiquitous Argomenti Panoramica di algoritmi e problemi Dentro un algoritmo Definire un approssimazione Definire un errore Minimizzare

Dettagli

Slide Set 2 Distribuzioni Univariate. Analisi e Visualizzazione dei Dati (Parte I) a.a. 2018/2019. Pietro Coretto

Slide Set 2 Distribuzioni Univariate. Analisi e Visualizzazione dei Dati (Parte I) a.a. 2018/2019. Pietro Coretto Slide Set 2 Distribuzioni Univariate Pietro Coretto pcoretto@unisa.it Corso di Analisi e Visualizzazione dei Dati (Parte I) a.a. 2018/2019 Corso di Laurea in Statistica per i Big Data (L-41) Università

Dettagli

Università degli Studi di Napoli Federico II

Università degli Studi di Napoli Federico II Open Search Description nella ricerca Google di Unina Open Search Description 1 è un formato che consente di descrivere un motore di ricerca in modo che il motore possa essere utilizzato direttamente da

Dettagli

SAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing

SAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing SAGA: sequence alignment by genetic algorithm ALESSANDRO PIETRELLI Soft Computing Bologna, 25 Maggio 2007 Multi Allineamento di Sequenze (MSAs) Cosa sono? A cosa servono? Come vengono calcolati Multi Allineamento

Dettagli

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata STATISTICA PSICOMETRICA a.a. 004/005 Corsi di laurea Scienze e tecniche neuropsicologiche Modulo Modulo Distribuzioni semplici di frequenza e loro rappresentazioni Operatori di tendenza centrale Operatori

Dettagli

Sistemi Informativi per le decisioni

Sistemi Informativi per le decisioni Sistemi Informativi per le decisioni Professore Ing. Marco Patella Anno accademico 2006-2007 Presentazione a cura di Di Leo Valentina - Palmieri Francesco Knowledge Discovery La maggior parte delle aziende

Dettagli

Stima dei Redshift Fotometrici tramite il network SOM + K-NN

Stima dei Redshift Fotometrici tramite il network SOM + K-NN Stima dei Redshift Fotometrici tramite il network + K-NN Università di Napoli Federico II December 21, 2016 Corso Astroinformatica Federico II Napoli Overview 1 Introduzione Obiettivo Scientifico PhotoZ

Dettagli

Relazione progetto Fondamenti di Analisi dati e Laboratorio

Relazione progetto Fondamenti di Analisi dati e Laboratorio Università degli Studi di Catania Dipartimento di Matematica e Informatica Corso di Laurea in Informatica magistrale Relazione progetto Fondamenti di Analisi dati e Laboratorio Cancemi Damiano - W82000075

Dettagli

Laboratorio di INFORMATICA. 15 ottobre 2009

Laboratorio di INFORMATICA. 15 ottobre 2009 Laboratorio di INFORMATICA 15 ottobre 2009 GRAFICI Per ottenere il grafico di una funzione, devo: Preparare un vettore di ascisse Preparare un vettore di ordinate Scegliere la figura (opzionale)(istruzione

Dettagli

Dinamica e Controllo dei Processi Energetici. AA 2009/2010 Pier Luca Maffettone. Elementi di Matlab

Dinamica e Controllo dei Processi Energetici. AA 2009/2010 Pier Luca Maffettone. Elementi di Matlab Dinamica e Controllo dei Processi Energetici AA 2009/ Pier Luca Maffettone Elementi di Sommario Introduzione Variabili Manipolazione di elementi Creazione di vettori/matrici Operazioni elementari Funzioni

Dettagli

ISTRUZIONI PER LA CONSEGNA DEI FILE MATLAB

ISTRUZIONI PER LA CONSEGNA DEI FILE MATLAB Calcolo Numerico ed Elementi di Analisi - Allievi AEROSPAZIALI Proff. S. Micheletti, S. Perotto A.A. 20/202, Appello 28 Gennaio 203 NOME... COGNOME... MATRICOLA... DOCENTE... AULA... PC... Ver.A I seguenti

Dettagli

Disegnare nell intervallo [0, 1] con precisione 0.01 il grafico delle seguenti quattro funzioni

Disegnare nell intervallo [0, 1] con precisione 0.01 il grafico delle seguenti quattro funzioni 28 gennaio 2008 Nota: Creare all interno della cartella C:\\ Users una cartella in cui mettere tutti i file. Come nome della cartella usate il vostro cognome Trascinare l icona della cartella col vostro

Dettagli

Fondamenti di Informatica T-1

Fondamenti di Informatica T-1 Fondamenti di Informatica T-1 Iterazione Tutor: Angelo Feraudo angelo.feraudo2@unibo.it a.a. 2018/2019 Fondamenti di Informatica T-1 Angelo Feraudo 1 / 22 ITERAZIONE Iterazione: Strumento che consente

Dettagli

C.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018.

C.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018. AMBIENTE STATISTICO SOFTWARE PER L ANALISI STATISTICA DI DATI PROVENIENTI DAL MONITORAGGIO AMBIENTALE Release 4.0 20/03/2018 Manuale d uso Ambiente Statistico è un software sviluppato nell ambito del Progetto

Dettagli

Università degli Studi di Ferrara Corso di Laurea in Chimica - A.A

Università degli Studi di Ferrara Corso di Laurea in Chimica - A.A Università degli Studi di Ferrara Corso di Laurea in Chimica - A.A. 2018-2019 Programmazione Lezione 12A Esercizi in MATLAB Docente: Lorenzo Caruso lorenzo.caruso@unife.it Nelle lezioni precedenti Matlab:

Dettagli

Fondamenti di Informatica A.A. 2016/17

Fondamenti di Informatica A.A. 2016/17 Fondamenti di Informatica S i m u l a z i o n e S e co n d a P rova Inte rco rs o P ro f. C h r i st i a n E s p o s i to C o rs o d i L a u re a i n I n g e g n e r i a M e c ca n i ca e G e st i o n

Dettagli

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008.

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. ESERCIZIO I Si è applicata l analisi delle componenti principali a 97 modelli di fotocamere digitali, considerando 7 variabili ed ottenendo

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego

Riconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione

Dettagli

RELAZIONE SULL ATTIVITA DI LABORATORIO. Corso di Metodi Numerici per il Controllo (Prof.ssa A. M. Perdon) a.a. 2007/2008

RELAZIONE SULL ATTIVITA DI LABORATORIO. Corso di Metodi Numerici per il Controllo (Prof.ssa A. M. Perdon) a.a. 2007/2008 RELAZIONE SULL ATTIVITA DI LABORATORIO Corso di Metodi Numerici per il Controllo (Prof.ssa A. M. Perdon) a.a. 2007/2008 Relazione n 2 Radici di polinomi e Sistemi lineari Esercizio 1 di pag. 28 Per risolvere

Dettagli

Lezione 3. Ing. Giuseppe Chiapparo - Università di Roma Tor Vergata Corso di ingegneria degli algoritmi (parte pratica) A.A.

Lezione 3. Ing. Giuseppe Chiapparo - Università di Roma Tor Vergata Corso di ingegneria degli algoritmi (parte pratica) A.A. Lezione 3 Ing. Giuseppe Chiapparo - Università di Roma Tor Vergata Corso di ingegneria degli algoritmi (parte pratica) A.A. 2016/2017 19/10/2016 1 La funzione main In Python main() non è una funzione speciale

Dettagli

Il numero di righe e colonne effettive, rispettivamente num_righe e num_colonne, verrà individuato dalla funzione di lettura del file.

Il numero di righe e colonne effettive, rispettivamente num_righe e num_colonne, verrà individuato dalla funzione di lettura del file. PALUDE In un file di tipo testo è stata rappresentata una palude in forma schematizzata, utilizzando una matrice di caratteri di dimensioni non note a priori, comunque non superiori a 25 righe e 80 colonne.

Dettagli

Appello di Fondamenti di Informatica 12/09/2017

Appello di Fondamenti di Informatica 12/09/2017 Nome ognome Matricola Firma Traccia 1 Spazio Riservato alla ommissione Esercizio 1 Esercizio 2 Esercizio 3 Esercizio 4 Esercizio 5 Totale Appello di Fondamenti di Informatica 12/09/2017 Ingegneria Meccanica

Dettagli

GLRT SIMPLE DETECTOR Manuale per un utilizzo immediato

GLRT SIMPLE DETECTOR Manuale per un utilizzo immediato ARCADIA PROJECT -PRIN 2007 - MIUR Unità di ricerca: Università di Perugia GLRT SIMPLE DETECTOR Manuale per un utilizzo immediato A cura di: Ing. Emilia Nunzi emilia.nunzi@diei.unipg.it Ing. Giorgio Saltanocchi

Dettagli

Esercizi di introduzione alla programmazione

Esercizi di introduzione alla programmazione Esercizi di introduzione alla programmazione Federico Reghenzani Informatica ed Elementi di Informatica Medica 2017-18 1 Esercizi di codifica 1.1 Conversione da base 10 a un altra base Trovare x: 203 10

Dettagli

dt t z 1 exp( t). = π, Γ

dt t z 1 exp( t). = π, Γ Prova d esame di Laboratorio di Calcolo I per il corso di laurea in Matematica 16 Settembre 2009 Tema d esame: studio di alcune proprietà della funzione Γ di Eulero. Descrizione del metodo di calcolo La

Dettagli

Breve introduzione al linguaggio R

Breve introduzione al linguaggio R L'ambiente R Studio Breve introduzione al linguaggio R Davide Massidda www.insular.it Università di Cagliari, a.a. 2013/2014 R è una calcolatrice! Inserire commenti L'utente invia un comando in input;

Dettagli

1 (7) 2 (6) 3 (6) 4 (7) 5 (6)

1 (7) 2 (6) 3 (6) 4 (7) 5 (6) CORSO DI LAUREA IN INGEGNERIA ELETTRICA, CHIMICA e MATERIALI Informatica B, C Anno Accademico 2014-2015 Proff. Danilo ARDAGNA, Antonio MIELE Seconda Prova in Itinere 29.6.2015 Cognome Nome Matricola Firma

Dettagli

1. Calcolo dell indice di condizionamento di una matrice

1. Calcolo dell indice di condizionamento di una matrice 1 Esercizi sul condizionamento con matlab laboratorio di Calcolo Scientifico per Geofisici Prof. A. Murli a.a. 2006/07 1. Calcolo dell indice di condizionamento di una matrice Determinare una function

Dettagli

Calcolare il massimo di una lista

Calcolare il massimo di una lista Calcolare il massimo di una lista Lunedì abbiamo definito un algoritmo per calcolare il valore massimo fra gli elementi di una lista predefinita di interi. In particolare, abbiamo: deciso di rappresentare

Dettagli

Statistica descrittiva I. La frequenza

Statistica descrittiva I. La frequenza Statistica descrittiva I. La frequenza Supponiamo di ripetere n volte un esperimento che può dare esito 0 o 1, il numero di uni su n ripetizioni è detto frequenza di 1: f 1,n = #{esperimenti con esito

Dettagli

Fondamenti di Informatica

Fondamenti di Informatica Fondamenti di Informatica Programmazione in MATLAB Gestione File Grafici E s e rc i t a z i o n i Pe r C a s a P r o f. R a f f a e l e P i z zo l a n t e A. A. 2 0 1 6 / 1 7 Esercitazioni per Casa Indice

Dettagli

TESINA INTELLIGENZA ARTIFICIALE

TESINA INTELLIGENZA ARTIFICIALE Student Alessio Gallucci Professor Elio Piccolo TESINA INTELLIGENZA ARTIFICIALE 2015 2016 Benchmark Classification Model On Kaggle Santander Challange vers.1.0 AGENDA Background SLIDE 3 Database SLIDE

Dettagli

1) Matlab e simulazione. 2) Esempi di utilizzo. Mauro De Sanctis corso di Informazione e Codifica Università di Roma Tor Vergata

1) Matlab e simulazione. 2) Esempi di utilizzo. Mauro De Sanctis corso di Informazione e Codifica Università di Roma Tor Vergata Argomenti della Lezione 1) Matlab e simulazione 2) Esempi di utilizzo 1 Mauro De Sanctis corso di Informazione e Codifica Università di Roma Tor Vergata Matlab è un sistema di programmazione ad alto livello

Dettagli

LEZIONE 11 IMPARIAMO A PROGRAMMARE: I DATI E LE VARIABILI Laboratorio di Informatica per l Educazione A. A. 2014/2015

LEZIONE 11 IMPARIAMO A PROGRAMMARE: I DATI E LE VARIABILI Laboratorio di Informatica per l Educazione A. A. 2014/2015 1 LEZIONE 11 IMPARIAMO A PROGRAMMARE: I DATI E LE VARIABILI A. A. 2014/2015 PRIMI PASSI La più semplice sequenza di istruzioni che possiamo scrivere è quella costituita da un solo comando. come si fa a

Dettagli

Matematica Esempio esame Unità 7

Matematica Esempio esame Unità 7 Matematica Esempio esame Unità 7 Giuseppe Vittucci Marzetti Dipartimento di Sociologia e Ricerca Sociale Università degli Studi di Milano-Bicocca Corso di Laurea in Scienze dell Organizzazione Novembre

Dettagli

Calcolo Numerico - Prova Matlab 19 luglio 2013

Calcolo Numerico - Prova Matlab 19 luglio 2013 9 luglio 0 () tempo a disposizione per completare la prova: ora; () lo svolgimento della prova deve essere salvato in file denominati cognomenome#m; () è fatto assoluto divieto di aprire applicazioni diverse

Dettagli

1 Esercizi di Matlab. L operatore : permette di estrarre sottomatrici da una matrice assegnata. Vediamo alcuni esempi.

1 Esercizi di Matlab. L operatore : permette di estrarre sottomatrici da una matrice assegnata. Vediamo alcuni esempi. Esercizi di Matlab L operatore : permette di estrarre sottomatrici da una matrice assegnata. Vediamo alcuni esempi. Esempio Consideriamo la matrice A formata da n = righe e m = colonne M = 5 6 7 8. 9 0

Dettagli

Indici di eterogeneità e di concentrazione

Indici di eterogeneità e di concentrazione Indici di eterogeneità e di concentrazione Dario Malchiodi e Anna Maria Zanaboni 31 ottobre 2017 1 Indici di eterogeneità Nel caso di variabili qualitative nominali la varianza e gli altri indici da essa

Dettagli

PROVA SCRITTA DEL MODULO DI NOME: COGNOME: MATRICOLA:

PROVA SCRITTA DEL MODULO DI NOME: COGNOME: MATRICOLA: PROVA SCRITTA DEL MODULO DI CORSO DI LAUREA IN INGEGNERIA ELETTRICA ED ELETTRONICA, INGEGNERIA BIOMEDICA - 6 CFU Settembre 204 NOME: COGNOME: MATRICOLA: ESERCIZIO RETI LOGICHE (0 punti) Si vuole implementare

Dettagli

Laboratorio 1. 15/16 marzo 2018

Laboratorio 1. 15/16 marzo 2018 Laboratorio 1. 15/16 marzo 2018 Attivitá Professionalizzante A.A. 2017/18 Premessa Quando avete finito gli esercizi, inviatemeli in un unico file compresso chiamato lab1 CognomeNome (zip, rar,...), all

Dettagli

RANKER: strumento software per il calcolo e la valutazione comparata di indici sintetici

RANKER: strumento software per il calcolo e la valutazione comparata di indici sintetici La misurazione di fenomeni multidimensionali: indici sintetici ed esperienze a confronto RANKER: strumento software per il calcolo e la valutazione comparata di indici sintetici Giulio Barcaroli, Marco

Dettagli

Laboratorio 1 Strumenti quantitativi per la gestione

Laboratorio 1 Strumenti quantitativi per la gestione Laboratorio 1 Strumenti quantitativi per la gestione Emanuele taufer Lab: Introduzione a R Comandi di base Lab: Introduzione a R Comandi di base R utilizza funzioni per eseguire le operazioni. Per eseguire

Dettagli

Clustering. Clustering

Clustering. Clustering 1/40 Clustering Iuri Frosio frosio@dsi.unimi.it Approfondimenti in A.K. Jan, M. N. Murty, P. J. Flynn, Data clustering: a review, ACM Computing Surveys, Vol. 31, No. 3, September 1999, ref. pp. 265-290,

Dettagli

LABORATORIO DI FISICA I

LABORATORIO DI FISICA I UNIVERSITA DEGLI STUDI DI PALERMO CORSO DI LAUREA IN SCIENZE FISICHE A.A. 2018/2019 13 Dicembre 2018 LABORATORIO DI FISICA I RELAZIONE TERZA ESPERIENZA DI LABORATORIO GRUPPO 1 Nigrelli Giulia Valenti Giuseppe

Dettagli

Lab. di Sistemi Operativi - Lezione in aula - a.a. 2012/2013

Lab. di Sistemi Operativi - Lezione in aula - a.a. 2012/2013 Lab. di Sistemi Operativi - Lezione in aula - a.a. 2012/2013 Processi bash 1 Sommario I processi Comando ps (process status) Terminazione di un processo CTRL-C Kill Controllo dei processi Processi in background

Dettagli

Linguistica Computazionale: esercitazioni

Linguistica Computazionale: esercitazioni Esercitazione 1 Felice Dell'Orletta ItaliaNLP Lab (www.italianlp.it) presso Istituto di Linguistica Computazionale A. Zampolli CNR felice.dellorletta@ilc.cnr.it 24 settembre 2014 Linguistica Computazionale:

Dettagli