Introduzione all analisi di arrays: clustering.

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Introduzione all analisi di arrays: clustering."

Transcript

1 Statistica per la Ricerca Sperimentale Introduzione all analisi di arrays: clustering. Lezione 2-14 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia Molecolare, Istituto Nazionale per la Ricerca sul Cancro di Genova moretti@dima.unige.it Microarrays e loro funzione diagnostica Patologie diverse o sottoclassi della stessa patologia hanno dimostrato essere caratterizzate da diversi profili di espressione. un-supervised Identificazione di sottoclassi non note della patologia. supervised Identificazione di gruppi di geni predittori della patologia stessa. 1

2 Algoritmi di clustering Le relazioni di somiglianza tra i campioni (o geni) possono essere determinate attraverso le tecniche di clustering. Esempi: Clustering gerarchico agglomerativo K-means clustering Concetto basilare: Metriche o funzioni distanza Def.: Sia X un insieme non vuoto. Una funzione a valori reali d definita su X X è detta una metrica o una funzione distanza su X sse, presi comunque a,b,c X, soddisfa i seguenti assiomi: d(a,b) 0 e d(a,a)=0. (Simmetria) d(a,b)=d(b,a). (Disuguaglianza triangolare) d(a,b)+d(b,c) d(a,c). Se a b, allora d(a,b)>0. Dove sta scritto che devo per forza usare una metrica nel clustering gerarchico? (vedi funzione di dissimilarità basato sul coefficiente di correlazione di Pearson) 2

3 Clustering gerarchico Crea la filogenesi o gerarchia dell espressione dei geni o dei profili genici dei campioni. Simili agli algoritmi filogenetici. ATTENZIONE: Distanze diverse danno risultati diversi Metodi agglomerativi diversi forniscono risultati diversi Esempio: distanza euclidea sample a b c d e gene gene Sample d dist dist 2 = Gene sample c Gene 1 3

4 a b c d e a 0 b c d e d b a db c e a 0 db c e e a ae db c ae 0 db c c aec db aec 0 db Algoritmo per il clustering gerarchico Calcolare la distanza fra tutte le coppie di campioni Mettere i valori in una matrice Unire i campioni con punteggio inferiore Continuare a unire i successivi campioni con altri campioni o gruppi di campioni a minima distanza. 4

5 Metodi gerarchici agglomerativi nearest neighbour furthest neighbour average linkage centroid Clustering gerarchico Vantaggi Buona visualizzazione in due dimensioni Non necessità la conoscenza del numero di raggruppamenti che ci si aspetta Svantaggi Si puo avere piu di un albero per lo stesso set di dati in funzione sia della misura di dissimilarità utilizzata che del metodo di agglomerazione. Non è sempre chiaro dove è opportuno tagliare l albero per ottenere una partizione significativa 5

6 K-means clustering Si ricava una partizione dei campioni in gruppi con profili di espressione simile. k e il numero di clusters che l utente ritiene opportuno per un certo set di dati. Idea di fondo assegna casualmente ciascun punto ad uno dei k cluster calcola la media all interno di ciascuna classe cosi ottenuta e la media tra le medie minimizza la media all interno della classe e massimizza la distanza tra le classi attraverso un metodo iterattivo. 6

7 espressione Espressione in Gene condizione Esempio: Step 1 Algoritmo: k-means, Distanza Euclidea k 1 k 2 k espressione Espressione in condizione Gene 1 1 espressione Espressione in Gene condizione Esempio: Step 2 Algoritmo: k-means, Distanza Euclidea k 1 k 2 k espressione Espressione in condizione Gene 1 1 7

8 espressione Espressione in Gene condizione Esempio: Step 3 Algoritmo: k-means, Distanza Euclidea k 1 k 2 k 3 espressione Espressione in condizione Gene 1 1 espressione Espressione in Gene condizione Esempio: Step 4 Algoritmo: k-means, Distanza Euclidea k 1 k 2 k 3 espressione Espressione in condizione Gene 1 1 8

9 espressione Espressione in Gene condizione Esempio: Step 5 Algoritmo: k-means, Distanza Euclidea k 2 k k 1 espressione Espressione in condizione Gene 1 1 Algoritmo K-means 1) Si prenda un numero k di centroidi 2) Si assegna ogni gene al centroide piu vicino 3) Si muove ogni centroide nel punto che indica la media dei suoi geni 4) Si ripetono i passi 2-3 fino a che l algoritmo converge. 9

10 K-means clustering summary Vantaggi I campioni sono automaticamente assegnati alle classi E possibile variare la posizione iniziale dei centroidi per cercare di ridurre la dipendenza dalle condizioni iniziali Svantaggi Arbitrarieta di k Tutti i campioni sono forzati a stare in un unico cluster Quale metodo di clustering devo usare? Qual è la domanda biologica? Ho un idea preconcetta di quanti cluster debba ritrovare? A che tipo di somiglianza intendo riferirmi e come intendo misurarla? Può un gene essere presente in più di un cluster? 10

11 R R è un sistema open-source per l analisi statistica e la descrizione dei dati. Consiste di Un linguaggio Un ambiente run-time con Finestra grafici, debugger, ecc Accesso ad alcuni sistemi di funcioni, Può essere usato come Interattivo, attraverso un linguaggio di comando O esecuzione di programmi immagazzinati in file script 11

12 pro e contro Powerful, Molto utilizzato in statistica Facile da estendere Creare librerie Molte già disponibili Utilizzabile gratuitamente Unix, windows & Mac Molta documentazione Non è facile da imparare Basato sui comandi La documentazione a volte è un pò criptica Uso pesante della memoria Il peggio in windows A volte lento If you intend to do microarray data analysis Probably one of best options R e Microarray R è uno strumento popolare tra gli statistsici che analizzano I microarray Questo ha dato origine a varie applicaziioni sviluppate in R disponibili gratuitamente Il progetto Bioconductor raggruppa gran parte di questi sforzi 12

13 Il progetto Bioconductor Progetto Open source e open development software per l analisi e la comprensione di dati genomici. La maggior parte dei programmi è stata pensata come librerie di R. Documentazione esaustiva e materiale didattico al sito Ha raggiunto una certa stabilità ma si sta ancora evolvendo. quello che ora sembra uno standard potrebbe non esserlo più nel prossimo futuro. Ha raggiunto la versione

Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare!

Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare! La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. Le tecniche di cluster analysis vengono usate per esplorare i dati e non per modellare! La cluster analysis

Dettagli

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011 Intelligenza Artificiale Clustering Francesco Uliana 14 gennaio 2011 Definizione Il Clustering o analisi dei cluster (dal termine inglese cluster analysis) è un insieme di tecniche di analisi multivariata

Dettagli

Misure di diversità tra unità statistiche. Loredana Cerbara

Misure di diversità tra unità statistiche. Loredana Cerbara Misure di diversità tra unità statistiche Loredana Cerbara LA DISTANZA IN STATISTICA In statistica la distanza ha un significato diverso da quello che si può intuire in altre discipline, dove, peraltro,

Dettagli

Praticamente Statistica Laboratorio di software open source

Praticamente Statistica Laboratorio di software open source Praticamente Statistica Laboratorio di software open source ORIENTAMENTO CONSAPEVOLE Imparare dai dati: la Statistica come strumento della conoscenza Alessio Pollice Dipartimento di Scienze Economiche

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: metodologie Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Tassonomia

Dettagli

Analisi dei Gruppi con R

Analisi dei Gruppi con R Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi dei Gruppi

Dettagli

Cluster Analysis (2 parte)

Cluster Analysis (2 parte) Cluster Analysis (2 parte) Esempio 2 Data set: Nel data set Dieta (Dieta.txt, Dieta.sav) sono contenute informazioni sul consumo medio dei principali alimenti in 16 paesi Europei. Paese Cereali (Ce) Riso

Dettagli

Algoritmi di clustering

Algoritmi di clustering Algoritmi di clustering Dato un insieme di dati sperimentali, vogliamo dividerli in clusters in modo che: I dati all interno di ciascun cluster siano simili tra loro Ciascun dato appartenga a uno e un

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Filogenesi Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Introduzione alla

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego

Riconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione

Dettagli

I metodi di Classificazione automatica

I metodi di Classificazione automatica L Analisi Multidimensionale dei Dati Una Statistica da vedere I metodi di Classificazione automatica Matrici e metodi Strategia di AMD Anal Discrimin Segmentazione SI Per riga SI Matrice strutturata NO

Dettagli

ROCK. A Robust Clustering Algorithm for Categorical Attributes. Sudipto Guha, Rajeev Rastogi, Kyuseok Shim

ROCK. A Robust Clustering Algorithm for Categorical Attributes. Sudipto Guha, Rajeev Rastogi, Kyuseok Shim ROCK A Robust Clustering Algorithm for Categorical Attributes Sudipto Guha, Rajeev Rastogi, Kyuseok Shim Presentazione di Sara Liparesi e Francesco Nonni Sistemi Informativi per le Decisioni a.a. 2005/2006

Dettagli

Il problema del clustering

Il problema del clustering Il problema del clustering Stefano Rovetta 1 aprile 2003 Sommario Concetto di clustering Definizioni di distanze Modalità di raggruppamento Clustering con la tecnica k-means Clustering gerarchico Cautele

Dettagli

viii Indice generale

viii Indice generale Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi

Dettagli

Esercizio 1: archivio CD e DVD

Esercizio 1: archivio CD e DVD Esercizio 1: archivio CD e DVD Realizzare un applicazione Java per la creazione e la consultazione di un archivio di dischi ottici (CD e DVD). L applicazione riceve da standard input in maniera interattiva

Dettagli

Analisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008

Analisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008 Analisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008 Dott. Chiara Cornalba COMUNICAZIONI La lezione del 30 ottobre è sospesa per missione all estero del Prof. Giudici. Dal 6 Novembre

Dettagli

Cluster Analysis. Paese Cereali (Ce) Riso (R) Patate (P) Zucchero (Z) Verdure (Ver) Vino (Vi) Carne (Ca) Latte (L) Burro (B) Uova (U)

Cluster Analysis. Paese Cereali (Ce) Riso (R) Patate (P) Zucchero (Z) Verdure (Ver) Vino (Vi) Carne (Ca) Latte (L) Burro (B) Uova (U) Analysis Esempio Stiamo studiando le abitudini alimentari nei Paesi europei. Sulla base dei dati a disposizione, ci chiediamo se si possano individuare sotto-aree con abitudini alimentari simili. Dati:

Dettagli

Teoria e tecniche dei test

Teoria e tecniche dei test Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario

Dettagli

Data Mining in SAP. Alessandro Ciaramella

Data Mining in SAP. Alessandro Ciaramella UNIVERSITÀ DI PISA Corsi di Laurea Specialistica in Ingegneria Informatica per la Gestione d Azienda e Ingegneria Informatica Data Mining in SAP A cura di: Alessandro Ciaramella La Business Intelligence

Dettagli

Introduzione al Calcolo Scientifico

Introduzione al Calcolo Scientifico Introduzione al Calcolo Scientifico Francesca Mazzia Dipartimento di Matematica Università di Bari Francesca Mazzia (Univ. Bari) Introduzione al Calcolo Scientifico 1 / 14 Calcolo Scientifico Insieme degli

Dettagli

Il punto di vista del mercato: una app con i dati sugli incidenti stradali

Il punto di vista del mercato: una app con i dati sugli incidenti stradali Il punto di vista del mercato: una app con i dati sugli incidenti stradali Come usare i dati dell ISTAT per creare applicazioni di mercato Il punto di vista di Evodevo, azienda specializzata in Open Data

Dettagli

Clustering. Utilizziamo per la realizzazione dell'esempio due tipologie di software:

Clustering. Utilizziamo per la realizzazione dell'esempio due tipologie di software: Esercizio Clustering Utilizziamo per la realizzazione dell'esempio due tipologie di software: - XLSTAT.xls - Cluster.exe XLSTAT.xls XLSTAT.xls è una macro di Excel che offre la possibilità di effettuare

Dettagli

Principi di Progettazione del Software a.a Introduzione al corso Prof. Luca Mainetti Università del Salento

Principi di Progettazione del Software a.a Introduzione al corso Prof. Luca Mainetti Università del Salento Principi di Progettazione del Software a.a. 2016-2017 Prof. Università del Salento Il GSA Lab (www.gsalab.unisalento.it) Laboratorio di ricerca in ingegneria del software e sistemi interattivi La mission

Dettagli

Principi di Progettazione del Software a.a " Introduzione al corso! Prof. Luca Mainetti! Università del Salento!

Principi di Progettazione del Software a.a  Introduzione al corso! Prof. Luca Mainetti! Università del Salento! Principi di Progettazione del Software a.a. 2015-2016" Introduzione al corso! Prof. Luca Mainetti! Università del Salento! Il GSA Lab (www.gsalab.unisalento.it)" Laboratorio di ricerca in ingegneria del

Dettagli

Modulo III - Creazione di documenti, presentazioni e report

Modulo III - Creazione di documenti, presentazioni e report Modulo III - Creazione di documenti, presentazioni e report Elisabetta Ronchieri Università di Ferrara Dipartimento di Economia e Management e-mail: elisabetta.ronchieri@unife.it 1 Dicembre 2016 Elisabetta

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

Teoria dell informazione

Teoria dell informazione Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2008-09 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di

Dettagli

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica Corso di Calcolo delle Probabilità e Statistica II Parte - STATISTICA X Lezione Analisi della varianza Esempi e esercizi 1 Argomenti della X Lezione Tests per il confronto di più medie: ANOVA Utilità e

Dettagli

Clustering con Weka. L interfaccia. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna. Algoritmo utilizzato per il clustering

Clustering con Weka. L interfaccia. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna. Algoritmo utilizzato per il clustering Clustering con Weka Soluzioni degli esercizi Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna L interfaccia Algoritmo utilizzato per il clustering E possibile escludere un sottoinsieme

Dettagli

Linguistica Computazionale: esercitazioni

Linguistica Computazionale: esercitazioni Esercitazione 1 Felice Dell'Orletta ItaliaNLP Lab (www.italianlp.it) presso Istituto di Linguistica Computazionale A. Zampolli CNR felice.dellorletta@ilc.cnr.it 24 settembre 2014 Linguistica Computazionale:

Dettagli

Cartografie tematiche: principi e modalità di realizzazione. Mauro Giovanni Univ. di Trieste

Cartografie tematiche: principi e modalità di realizzazione. Mauro Giovanni Univ. di Trieste Cartografie tematiche: principi e modalità di realizzazione Mauro Giovanni Univ. di Trieste Analisi GIS Mappare dove sono le cose Mappare cosa c è dentro Mappare il minimo e il massimo GIS Mappare le cose

Dettagli

Corso di Matematica per la Chimica

Corso di Matematica per la Chimica Dott.ssa Maria Carmela De Bonis a.a. 2013-14 Il best fitting In molte applicazioni accade di avere una certa quantità di dati (solitamente elevata) e di voler descrivere l andamento del fenomeno che ha

Dettagli

Problemi, istanze, soluzioni

Problemi, istanze, soluzioni lgoritmi e Strutture di Dati II 2 Problemi, istanze, soluzioni Un problema specifica una relazione matematica tra dati di ingresso e dati di uscita. Una istanza di un problema è formata dai dati di un

Dettagli

Analisi dei dati di traffico esistenti per la definizione dei profili temporali: metodologia ed esempio di applicazione.

Analisi dei dati di traffico esistenti per la definizione dei profili temporali: metodologia ed esempio di applicazione. XIII Expert panel emissioni da trasporto su strada Roma, 4 ottobre 27 Analisi dei dati di traffico esistenti per la definizione dei profili temporali: metodologia ed esempio di applicazione. C. Lavecchia*;

Dettagli

UNIVERSITA' DEGLI STUDI DI CATANIA FACOLTA' DI SCIENZE MATEMATICHE, FISICHE E NATURALI MANIFESTO DEGLI STUDI

UNIVERSITA' DEGLI STUDI DI CATANIA FACOLTA' DI SCIENZE MATEMATICHE, FISICHE E NATURALI MANIFESTO DEGLI STUDI MANIFESTO DEGLI STUDI CORSO DI LAUREA Scienze Biologiche Triennale Classe 12 Anno Accademico 2006/2007 Nell A.A. 2006-2007 saranno attivati il 1, il 2 ed il 3 anno della Laurea in Scienze Biologiche. L

Dettagli

Università di Pisa A.A. 2004-2005

Università di Pisa A.A. 2004-2005 Università di Pisa A.A. 2004-2005 Analisi dei dati ed estrazione di conoscenza Corso di Laurea Specialistica in Informatica per l Economia e per l Azienda Tecniche di Data Mining Corsi di Laurea Specialistica

Dettagli

Introduzione all analisi di Affymetrix GeneChip array.

Introduzione all analisi di Affymetrix GeneChip array. Statistica per la Ricerca Sperimentale Introduzione all analisi di Affymetrix GeneChip array. Lezione 1-13 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia

Dettagli

SummeR School-DATA Mining and Data Analysis with R

SummeR School-DATA Mining and Data Analysis with R SummeR School-DATA Mining and Data Analysis with R PROPONENTE Prof.ssa Luisa Bernardinelli, Prof. Mario Grassi e Dott. Davide Gentilini OBIETTIVI FORMATIVI La gestione e l analisi dei dati rappresenta

Dettagli

yem Nuovo software per l analisi dell impatto elettromagnetico prodotto dalle stazioni radiobase in Friuli Venezia Giulia

yem Nuovo software per l analisi dell impatto elettromagnetico prodotto dalle stazioni radiobase in Friuli Venezia Giulia yem Nuovo software per l analisi dell impatto elettromagnetico prodotto dalle stazioni radiobase in Friuli Venezia Giulia Salvagni M., Poles N., Moretuzzo M., Bampo A. miro.salvagni@arpa.fvg.it yem yem

Dettagli

L Automatic Control Telelab

L Automatic Control Telelab Università di Siena L Marco Casini Dipartimento di Ingegneria dell Informazione Università di Siena, Italy Email: casini@ing.unisi.it UNIVERSITA DI SIENA 1 Sommario Introduzione all (ACT) Descrizione di

Dettagli

Clustering Mario Guarracino Data Mining a.a. 2010/2011

Clustering Mario Guarracino Data Mining a.a. 2010/2011 Clustering Introduzione Il raggruppamento di popolazioni di oggetti (unità statistiche) in base alle loro caratteristiche (variabili) è da sempre oggetto di studio: classificazione delle specie animali,

Dettagli

Introduzione al Linguaggio C ed all IDE DEV-C++

Introduzione al Linguaggio C ed all IDE DEV-C++ Microsoft Windows e Dev-C++ Introduzione al Linguaggio C ed all IDE DEV-C++ 1 Le Esercitazioni in Laboratorio! MTA + MLAB1/2: Edificio Via Valotti, primo piano e piano interrato! Orario: Giovedì 14:30-17:30!

Dettagli

Analisi di dati Microarray: Esercitazione Matlab

Analisi di dati Microarray: Esercitazione Matlab Analisi di dati Microarray: Esercitazione Matlab Laboratorio di Bioinformatica II Pietro Lovato Anno Accademico 2010/2011 Contenuti 1 Introduzione DNA Microarray 2 Lavorare con una singola ibridazione

Dettagli

Weka Project. Weka. Weka Project. Formato.arff. Modalità di utilizzo di Weka. Formato.arff

Weka Project. Weka. Weka Project. Formato.arff. Modalità di utilizzo di Weka. Formato.arff Weka Project Weka Machine Learning Algorithms in Java Waikato Environment for Knowledge Analysis Algoritmi di Data Mining e Machine Learning realizzati in Java Preprocessing Classificazione Clustering

Dettagli

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI. Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi

Dettagli

Sistema Operativo (Software di base)

Sistema Operativo (Software di base) Il Software Il software del PC Il computer ha grandi potenzialità ma non può funzionare senza il software. Il software essenziale per fare funzionare il PC può essere diviso nelle seguenti componenti:

Dettagli

SCUOLA PRIMARIA - MORI

SCUOLA PRIMARIA - MORI ISTITUTO COMPRENSIVO DI MORI Via Giovanni XXIII, n. 64-38065 MORI Cod. Fisc. 94024510227 - Tel. 0464-918669 Fax 0464-911029 www.icmori.it e-mail: segr.ic.mori@scuole.provincia.tn.it REPUBBLICA ITALIANA

Dettagli

24 - Possibili approfondimenti

24 - Possibili approfondimenti 24 - Possibili approfondimenti Programmazione e analisi di dati Modulo A: Programmazione in Java Paolo Milazzo Dipartimento di Informatica, Università di Pisa http://www.di.unipi.it/ milazzo milazzo di.unipi.it

Dettagli

Il modello lineare misto

Il modello lineare misto Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 15 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica

Dettagli

I TEST STATISTICI. dott.ssa Gabriella Agrusti

I TEST STATISTICI. dott.ssa Gabriella Agrusti I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

SOFTWARE PER DATA LOGGER VACQ

SOFTWARE PER DATA LOGGER VACQ SOFTWARE PER DATA LOGGER VACQ I software a disposizione sono stati sviluppati appositamente per ogni prodotto, esaltandone le specifiche tecniche senza tuttavia risultare incomprensibili all utente. Non

Dettagli

SCUOLA PRIMARIA - MORI

SCUOLA PRIMARIA - MORI REPUBBLICA ITALIANA ISTITUTO COMPRENSIVO DI MORI Via Giovanni XXIII, n. 64-38065 MORI Cod. Fisc. 94024510227 - Tel. 0464-918669 Fax 0464-911029 www.icmori.it e-mail: segr.ic.mori@scuole.provincia.tn.it

Dettagli

Distributed P2P Data Mining. Autore: Elia Gaglio (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo

Distributed P2P Data Mining. Autore: Elia Gaglio (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo Distributed P2P Data Mining Autore: (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo A.A. 2005/2006 Il settore del Data Mining Distribuito (DDM): Data Mining: cuore del processo

Dettagli

SCUOLA PRIMARIA - MORI

SCUOLA PRIMARIA - MORI REPUBBLICA ITALIANA ISTITUTO COMPRENSIVO DI MORI Via Giovanni XXIII, n. 64-38065 MORI Cod. Fisc. 94024510227 - Tel. 0464-918669 Fax 0464-911029 www.icmori.it e-mail: segr.ic.mori@scuole.provincia.tn.it

Dettagli

Java il Corso Fondamentale

Java il Corso Fondamentale Java il Corso Fondamentale Imparare a Programmare APP per Android, applicativi per Server e Desktop, applet e molto altro. IlTuoCorso - Ermes srl Via E.De Amicis 57 20123 Milano Il corso Ciao! Se desideri

Dettagli

Lezione n. 1 _Complementi di matematica

Lezione n. 1 _Complementi di matematica Lezione n. 1 _Complementi di matematica INTRODUZIONE ALLA STATISTICA La statistica è una disciplina che si occupa di fenomeni collettivi ( cioè fenomeni in cui sono coinvolti più individui o elementi )

Dettagli

Analisi dei gruppi (Cluster analysis)

Analisi dei gruppi (Cluster analysis) Capitolo 10 Analisi dei gruppi (Cluster analysis) Partendo da un collettivo multidimensionale, l analisi dei gruppi mira ad assegnarne le unità a categorie non definite a priori, formando dei gruppi di

Dettagli

La tecnologia dei microarray

La tecnologia dei microarray La tecnologia dei microarray I microarray I progetti di sequenziamento (progetti permesso di identificare migliaia di geni genoma) ) hanno Migliaia di geni (ed i loro prodotti, le proteine) operano in

Dettagli

Algoritmi e Strutture Dati

Algoritmi e Strutture Dati Algoritmi e Strutture Dati Capitolo 1 Un introduzione informale agli algoritmi Camil Demetrescu, Irene Finocchi, Giuseppe F. Italiano Definizione informale di algoritmo Insieme di istruzioni, definite

Dettagli

INTELLIGENZA ARTIFICIALE (elementi) 6 cfu

INTELLIGENZA ARTIFICIALE (elementi) 6 cfu INTELLIGENZA ARTIFICIALE (elementi) 6 cfu Prof.ssa Stefania Bandini Dott. Alessandro Mosca Dipartimento di Informatica, Sistemistica e Comunicazione Università di Milano-Bicocca www.lintar.disco.unimib.it

Dettagli

Statistica Aziendale Avanzata

Statistica Aziendale Avanzata PROGRAMMA del corso, informazioni e fonti bibliografiche Statistica Aziendale Avanzata Modulo A / Modulo B Organizzazione del corso Anno Accademico 2015/16 Codice 91019 Docente responsabile prof.ssa Silvia

Dettagli

Strategie di annotazione di geni e genomi

Strategie di annotazione di geni e genomi Strategie di annotazione di geni e genomi Dr. Giovanni Emiliani giovanni.emiliani@unifi.it Bioinformatica A.A. 2011-1012 Concetti generali Le nuove tecnologie consentono l ottenimento di una grande mole

Dettagli

Campusboard LIM 78" Multi-Touch (10 tocchi) con LCD ottica corta

Campusboard LIM 78 Multi-Touch (10 tocchi) con LCD ottica corta Codice: 297998 Prezzo: 1.200,00 Descrizione Questo kit è composto da una lavagna Interattiva multimediale 78" multitouch, videoproiettore ottica corta con staffa, software Easiteach, Campus DVD e Impara

Dettagli

Sistema operativo (SO)

Sistema operativo (SO) Diagramma a cipolla Sistema operativo (SO) Il calcolatore elabora informazioni codificate in sequenza di bit I dispositivi si interfacciano con il calcolatore tramite complessi protocolli di comunicazione

Dettagli

Corso Programmazione

Corso Programmazione Corso Programmazione 2008-2009 (docente) Fabio Aiolli E-mail: aiolli@math.unipd.it Web: www.math.unipd.it/~aiolli (docenti laboratorio) A. Ceccato, F. Di Palma, M. Gelain Dipartimento di Matematica Pura

Dettagli

Informatica ALGORITMI E LINGUAGGI DI PROGRAMMAZIONE. Francesco Tura. F. Tura

Informatica ALGORITMI E LINGUAGGI DI PROGRAMMAZIONE. Francesco Tura. F. Tura Informatica ALGORITMI E LINGUAGGI DI PROGRAMMAZIONE Francesco Tura francesco.tura@unibo.it 1 Lo strumento dell informatico: ELABORATORE ELETTRONICO [= calcolatore = computer] Macchina multifunzionale Macchina

Dettagli

Modelli matematici e Data Mining

Modelli matematici e Data Mining Modelli matematici e Data Mining Introduzione I modelli matematici giocano un ruolo critico negli ambienti di business intelligence e sistemi di supporto alle decisioni. Essi rappresentano un astrazione

Dettagli

INFORMATICA SANITARIA Domande ed Esercizi di Preparazione all Esame (Parti 8-17)

INFORMATICA SANITARIA Domande ed Esercizi di Preparazione all Esame (Parti 8-17) Università degli Studi di Padova Corso di Laurea Specialistica in Bioingegneria A.A. 2006-2007 2007 INFORMATICA SANITARIA Domande ed Esercizi di Preparazione all Esame (Parti 8-17) Giovanni Sparacino Dipartimento

Dettagli

Lezione 4. Problemi trattabili e soluzioni sempre più efficienti. Gianluca Rossi

Lezione 4. Problemi trattabili e soluzioni sempre più efficienti. Gianluca Rossi Lezione 4 Problemi trattabili e soluzioni sempre più efficienti Gianluca Rossi Trattabile o intrattabile? Consideriamo ora il problema, ben noto a tutti gli studenti a partire dalla scuola media, di calcolare

Dettagli

DBMS. Alice Pavarani

DBMS. Alice Pavarani DBMS Alice Pavarani DBMS Insieme di programmi che offrono gli strumenti per gestire una base di dati Permette di: definire la struttura delle tabelle recuperare le informazioni manipolare i dati memorizzati

Dettagli

Corso di Access. Modulo L2 A (Access) 1.4 Le maschere

Corso di Access. Modulo L2 A (Access) 1.4 Le maschere Corso di Access Modulo L2 A (Access) 1.4 Le maschere 1 Prerequisiti Concetto di database Interfaccia utente Elementi grafici (etichette, caselle di testo, pulsanti) 2 1 Introduzione Ora che sappiamo usare

Dettagli

Radar e Sistema di Puntamento con Arduino e Processing

Radar e Sistema di Puntamento con Arduino e Processing Radar e Sistema di Puntamento con Arduino e Processing ISTITUTO INTERNAZIONALE EDOARDO AGNELLI Istituto Tecnico Industriale - Liceo Scientifico Classe IV Eln. Premessa L uso della scheda Arduino è oramai

Dettagli

SISTEMI OPERATIVI, RETI, INTERNET

SISTEMI OPERATIVI, RETI, INTERNET Competenze e Unità didattica formativa capitalizzabile 4.1 SISTEMI OPERATIVI, RETI, INTERNET Comprendere il significato dell'evoluzione dei sistemi operativi. Comprendere che cosa fa un sistema operativo

Dettagli

Seconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016

Seconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016 Domande relative alla specializzazione in: Statistica sanitaria e Biometria Scenario 1: In uno studio prospettivo condotto per valutare la relazione tra l'uso di estrogeni e rischio di cancro alla mammella,

Dettagli

Fractals. Anna Carbone Politecnico di Torino November 2, 2016

Fractals. Anna Carbone Politecnico di Torino  November 2, 2016 Fractals Anna Carbone Politecnico di Torino www.polito.it/noiselab Caffé November 2, 2016 Fractals: Everywhere ever and ever (sempre e dovunque) Fractals: Everywhere ever and ever (sempre e dovunque) Middle

Dettagli

Introduzione alla Statistica con R Lezione 1

Introduzione alla Statistica con R Lezione 1 Introduzione alla Statistica con R Lezione 1 Sergio Camiz Chi sono? Laureato in Matematica 1969 (Università di Roma) Professore dal 1975 Dottore di ricerca in Analisi dei Dati dal 2002 (Université Paris

Dettagli

MATEMATICA CLASSE QUINTA

MATEMATICA CLASSE QUINTA MATEMATICA CLASSE QUINTA UNITÀ DIDATTICA N. 1 IL NUMERO 1. Rappresentare, leggere, scrivere e operare con i numeri naturali e decimali avendo la consapevolezza del valore posizionale delle cifre. 2. Operare

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Sistema operativo & file system 1

Sistema operativo & file system 1 Il software (sw) Software di sistema e file system Lezione 1b L esecuzione di programmi è lo scopo di un elaboratore I programmi sono algoritmi codificati in un particolare linguaggio di programmazione

Dettagli

LETTI PER VOI: L uso delle tecniche di matching nella valutazione di efficacia di un farmaco. Cinzia Di Novi. Università Ca Foscari di Venezia,

LETTI PER VOI: L uso delle tecniche di matching nella valutazione di efficacia di un farmaco. Cinzia Di Novi. Università Ca Foscari di Venezia, LETTI PER VOI: L uso delle tecniche di matching nella valutazione di efficacia di un farmaco Cinzia Di Novi Università Ca Foscari di Venezia, Dipartimento di Economia Il matching statistico è sempre più

Dettagli

Laboratorio di Python (con Linux)

Laboratorio di Python (con Linux) 8 a lezione Università di Bologna 2, 4 maggio 2012 Sommario 1 2 3 Diversi Python 2.6 vs 2.7 v.s 3.x La versione di Python installata sulle macchine del laboratorio è la 2.6 (per l esattezza 2.6.6 ). Versioni

Dettagli

Filomena Maggino, L analisi dei dati nell indagine statistica. Volume 2: l esplorazione dei dati e la validazione dei risultati, ISBN: 88-8453-351-1

Filomena Maggino, L analisi dei dati nell indagine statistica. Volume 2: l esplorazione dei dati e la validazione dei risultati, ISBN: 88-8453-351-1 Filomena Maggino, L analisi dei dati nell indagine statistica. Volume 2: l esplorazione dei dati e la validazione dei risultati, ISBN: 88-8453-351-1 (print) ISBN: 88-8453-350-3 (online), Firenze University

Dettagli

Linux e i software liberi. di Nardean Lorenzo e Redigolo Marco

Linux e i software liberi. di Nardean Lorenzo e Redigolo Marco Linux e i software liberi di Nardean Lorenzo e Redigolo Marco Indice INTRODUZIONE - Cos'è Linux - Software libero - Software libero proprietario - Versioni Linux - Distribuzioni STORIA - L idea - Prima

Dettagli

Introduzione a Matlab (e al Calcolo Numerico)

Introduzione a Matlab (e al Calcolo Numerico) Introduzione a Matlab (e al Calcolo Numerico) Giuseppe Rodriguez Università di Roma Tor Vergata Seminario nell ambito del corso di Fondamenti di Informatica per gli studenti di Ingegneria Meccanica e Ingegneria

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione

Dettagli

Linguaggio C: introduzione

Linguaggio C: introduzione Dipartimento di Elettronica ed Informazione Politecnico di Milano Informatica e CAD (c.i.) - ICA Prof. Pierluigi Plebani A.A. 2008/2009 Linguaggio C: introduzione La presente dispensa e da utilizzarsi

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

Università di Bergamo Facoltà di Ingegneria INGEGNERIA DEL SOFTWARE. Paolo Salvaneschi A4_3 V2.1. Progettazione. Metodi e Linguaggi

Università di Bergamo Facoltà di Ingegneria INGEGNERIA DEL SOFTWARE. Paolo Salvaneschi A4_3 V2.1. Progettazione. Metodi e Linguaggi Università di Bergamo Facoltà di Ingegneria INGEGNERIA DEL SOFTWARE Paolo Salvaneschi A4_3 V2.1 Progettazione Metodi e Linguaggi Il contenuto del documento è liberamente utilizzabile dagli studenti, per

Dettagli

Architettura. Nome Modulo Tipologia lezioni Ore Docente SSD Ruolo Interno Affidamento. Vincenzo Conti

Architettura. Nome Modulo Tipologia lezioni Ore Docente SSD Ruolo Interno Affidamento. Vincenzo Conti Anno Accademico 2015 2016 A.A. Settore Scientifico Disciplinare CFU Insegnamento Ore di aula Mutuazione 2015/16 ING-INF/05 6 Algoritmi e Strutture Dati (a scelta) 48 No Classe Corso di studi Tipologia

Dettagli

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA STATISTICA DESCRITTIVA Elementi di statistica medica STATISTICA DESCRITTIVA È quella branca della statistica che ha il fine di descrivere un fenomeno. Deve quindi sintetizzare tramite pochi valori(indici

Dettagli

Analisi ABC incrociata

Analisi ABC incrociata 1 Analisi ABC L analisi ABC incrociata è un metodo che permette di suddividere in classi una serie di oggetti. Permette perciò di raggruppare per classi secondo i valori di una variabile. Ad esempio classificazione

Dettagli

Apprendimento Automatico (Feature Selection e Kernel Learning)

Apprendimento Automatico (Feature Selection e Kernel Learning) Apprendimento Automatico (Feature Selection e Kernel Learning) Fabio Aiolli www.math.unipd.it/~aiolli Sito web del corso www.math.unipd.it/~aiolli/corsi/1516/aa/aa.html Servono tutti gli attributi? Gli

Dettagli

Fondamenti di Informatica 9. Esercitazione in linguaggio C

Fondamenti di Informatica 9. Esercitazione in linguaggio C Esercitazione in linguaggio C Fondamenti di Informatica 9. Esercitazione in linguaggio C Lo sviluppo dei programmi Compilazione dei file sorgente, link e caricamento La libreria di run time L ambiente

Dettagli

Dalla prima lezione. LABORATORIO DI PROGRAMMAZIONE Corso di laurea in matematica 7 VARIABILI E COSTANTI 28/02/2016. Concetto di algoritmo

Dalla prima lezione. LABORATORIO DI PROGRAMMAZIONE Corso di laurea in matematica 7 VARIABILI E COSTANTI 28/02/2016. Concetto di algoritmo LABORATORIO DI PROGRAMMAZIONE Corso di laurea in matematica 7 VARIABILI E COSTANTI Marco Lapegna Dipartimento di Matematica e Applicazioni Universita degli Studi di Napoli Federico II wpage.unina.it/lapegna

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Tabella 1 Parametri del generatore di traffico

Tabella 1 Parametri del generatore di traffico Tabella 1 Parametri del generatore di traffico 3.5 Bit error rate tests BER tests sono usati per determinare il tasso di errori in una trasmissione o in una rete punto-punto. Questi test sono effettuati

Dettagli

Sistema DANTE. Scheda prodotto SISTEMA DANTE

Sistema DANTE. Scheda prodotto SISTEMA DANTE PAG. 1 DI 11 SISTEMA DANTE Sistema professionale per l annotazione di eventi che consente raccolta, analisi, presentazione e gestione di dati osservati in tempo reale o su registrazione video. PAG. 2 DI

Dettagli

Istruzioni per l analisi in componenti principali con R

Istruzioni per l analisi in componenti principali con R Istruzioni per l analisi in componenti principali con R Vi ricordo che in nero sono state inserite le note e in rosso le istruzioni da digitare sulla console di R Importare il dataset gelati

Dettagli

Docente: Prof. Marco Patella Tutor: Vincenzo Lomonaco

Docente: Prof. Marco Patella Tutor: Vincenzo Lomonaco Università di Bologna Facoltà di Ingegneria C.d.L. in Ing. Gestionale Fondamenti di Informatica T-1 (A-K) A.A. 2015/16 Docente: Prof. Marco Patella Tutor: Vincenzo Lomonaco 1 Obiettivi del corso Il corso

Dettagli