Analisi di dati Microarray: Esercitazione Matlab
|
|
- Albino Belloni
- 5 anni fa
- Visualizzazioni
Transcript
1 Analisi di dati Microarray: Esercitazione Matlab Laboratorio di Bioinformatica II Pietro Lovato Anno Accademico 2011/2012
2 Contenuti 1 Introduzione Introduzione a Matlab Bioinformatics Toolbox DNA Microarray 2 Analisi di una singola ibridazione Ambiente Matlab Sottrazione del background Scatter plot 3 Analisi di più ibridazioni Esempio: Serie temporali di lievito Gene Selection Cluster analysis Validare i risultati 4 PCA e Visualizzazione scientifica Principal Component Analysis
3 Introduzione a Matlab Che cos è MATrix LABoratory Sistema interattivo per il calcolo tecnico e scientifico Linguaggio di programmazione Internamente: librerie numeriche altamente ottimizzate Una caratteristica di Matlab è l espansibilità delle sue funzioni, attraverso delle soluzioni denominate toolbox. Tali toolbox sono collezioni complete di funzioni Matlab per risolvere particolari categorie di problemi.
4 I toolbox Statistica Elaborazione di immagini Elaborazione di segnali Pattern recognition Bioinformatica Sistemi di comunicazione Sistemi di controllo Economia & Finanza Calcolo parallelo...
5 Applicazioni per la bioinformatica 1 Analisi di sequenze Allineamento, primer design, identificazione di motivi 2 Analisi di dati microarray Analisi di immagini Normalizzazione dei dati Clustering & data mining 3 Proteomica Analisi di dati da spettrometria di massa 4 Systems Biology Simulazione di pathway metabolici 5 Filogenesi
6 DNA Microarray Che cos è Tecnologia capace di misurare simultaneamente l espressione di migliaia di geni. Sono analizzate differenti condizioni sperimentali: Diversi tessuti (es. da individui sani/malati) Diverse condizioni di crescita Diversi istanti di tempo Enorme quantità di dati, da analizzare con strumenti informatici.
7 DNA Microarray (2)
8 DNA Microarray (3) Problematiche Design delle sonde Problematiche di Image Processing: Segmentazione spot Rimozione rumore Rilevamento della qualità degli spot Quantificazione del segnale Analisi dei dati: Riduzione della dimensionalità Cluster analysis Visualizzazione scientifica Interscambio di formati
9 DNA Microarray (4) Problema A seconda del tipo di esperimento e della piattaforma utilizzata, i dati che ci vengono forniti possono avere diversi formati. Qualche esempio.cel (Affymetrix).chp (Affymetrix).gpr (GenePix).soft (Dataset GEO).txt...
10 L interfaccia grafica Sotto Applicazioni Programmazione
11 Un tipico comando Matlab data_mouse = gprread ( mouse_a1pd.gpr ) ;
12 Un tipico comando Matlab Risultato data_mouse = gprread ( mouse_a1pd.gpr ) ;
13 Un tipico comando Matlab Risultato data_mouse = gprread ( mouse_a1pd.gpr ) ; Nome del comando
14 Un tipico comando Matlab Risultato data_mouse = gprread ( mouse_a1pd.gpr ) ; Nome del comando Argomenti in input
15 Un tipico comando Matlab Risultato data_mouse = gprread ( mouse_a1pd.gpr ) ; Nome del comando Argomenti in input Nota Per i comandi di visualizzazione non è necessario specificare un risultato.
16 Lavorare con una singola ibridazione Esempio Dati di espressione di topo in cui è stato indotto farmacologicamente il morbo di Parkinson. Ogni chip contiene l espressione in una regione (voxel) del cervello. Dati grezzi: file in formato.gpr oppure soft (GEO accession GSE30). File.gpr già presente come demo Matlab. Caricare i dati pd = gprread( mouse_a1pd.gpr );
17 Strutture in Matlab struct() Tipo di dato che raggruppa più campi in un unico oggetto. Un campo può memorizzare informazioni di vario tipo. Accesso ai campi con variabile.nomecampo. Nota Formati di file microarray diversi avranno campi con nomi diversi (ma l informazione contenuta è sostanzialmente la stessa). Header: [1x1 struct] Data: [9504x38 double] Blocks: [9504x1 double] Columns: [9504x1 double] Rows: [9504x1 double] Names: {9504x1 cell}...
18 Cosa ci interessa Campi Il campo Data è una matrice che contiene i dati. Il campo Names contiene i nomi dei geni (le righe). Il campo ColumnNames contiene i nomi delle colonne. All interno del campo ColumnNames: F635 Median intensità del canale rosso (cy5, λ = 635nm). F635 Median - B635, come sopra ma con sottrazione del background. F532 Median - B532 intensità del canale verde (cy3, λ = 532nm). La mediana è uno stimatore robusto dell intensità dei pixel.
19 Sottrazione del background Background: fluorescenza che può contribuire all intensità misurata ma non è dovuta all ibridazione del target. Può dipendere da polvere, molecole isolate, imperfezioni nel sistema di acquisizione, rumore,... Il background varia lungo il supporto e va stimato localmente. B532 Median Provare a visualizzare il bg del canale verde con il comando maimage(pd, B532 Median );
20 Salvare in variabili separate i campi di interesse Sintassi cy5data = magetfield(pd, F635 Median - B635 ); cy3data = magetfield(pd, F532 Median - B532 ); genes = pd.names;
21 Scatter plot: R vs G Dati osservati : {(R, G) i }
22 Scatter plot: log 2 R vs log 2 G Dati osservati : {(log 2 R, log 2 G) i }
23 Scatter plot: I vs R Dati osservati : {( ( R )) } log 10 (R G), log 2 G i
24 In Matlab Per creare uno scatter plot del tipo log R vs log G: maloglog(cy5data,cy3data, labels,genes); Per creare uno scatter plot del tipo I vs R: mairplot(cy5data,cy3data, labels,genes);
25 In Matlab Per creare uno scatter plot del tipo log R vs log G: maloglog(cy5data,cy3data, labels,genes); Per creare uno scatter plot del tipo I vs R: mairplot(cy5data,cy3data, labels,genes); Esercizio Provare a disegnare uno scatter plot a mano : Dato un vettore x, il logaritmo delle sue componenti si calcola con il comando: variabile = log10(x); Un qualsiasi scatter plot (non microarray-specifico) si disegna con il comando: scatter(x,y);
26 Ricapitolando...» pd = gprread( mouse_a1pd.gpr );» maimage(pd, B532 Median );» cy5data = magetfield(pd, F635 Median - B635 );» cy3data = magetfield(pd, F532 Median - B532 );» genes = pd.names;» maloglog(cy5data,cy3data, labels,genes)» mairplot(cy5data,cy3data, labels,genes)
27 Idea: combinare dati provenienti da diverse ibridazioni
28 Cluster analysis Passi (a grandi linee) Identificare geni differenzialmente espressi: t-test se il problema è a due classi. Altri indici per selezionare geni rilevanti (varianza, entropia,...). Definire una distanza tra profili di espressione. Scegliere un algoritmo di clustering. Validare il risultato.
29 Esempio: Serie temporali di lievito Problema Investigare come variano nel tempo i livelli di espressione del lievito (Saccharomyces cerevisiae). Si è interessati alla riprogrammazione metabolica nel passaggio dalla fermentazione alla respirazione. Idea Cercare di raggruppare geni con profili di espressione simili. Cercare di caratterizzare ciascun gruppo attraverso il processo biologico cui i geni prendono parte. Caricare i dati load yeastdata;
30 Plottare un profilo di espressione ( plot times, yeastvalues ( 15, : )) ;
31 Plottare un profilo di espressione Matrice dei dati ( plot times, yeastvalues ( 15, : )) ;
32 Plottare un profilo di espressione Matrice dei dati ( plot times, yeastvalues ( 15, : )) ; Seleziono la quindicesima riga=gene
33 Plottare un profilo di espressione Matrice dei dati ( plot times, yeastvalues ( 15, : )) ; Seleziono la quindicesima riga=gene Seleziono tutte le colonne=tempi
34 Gene Selection Scartare i geni non informativi Geni a bassa varianza. Geni con basso valore assoluto in ogni istante temporale. Geni a bassa entropia informativa. Sintassi» [mask, yeastvalues, genes] = genevarfilter(yeastvalues, genes);» [mask, yeastvalues, genes] = genelowvalfilter(yeastvalues, genes, absval, log2(3)); Quanti geni rimangono dopo la selezione?
35 Introduzione: Cluster Analysis Una possibile definizione Il clustering rappresenta l organizzazione di un insieme di entità in gruppi (clusters) sulla base della similarità. Il concetto di cluster è vago: Dipendentemente dalle misure di similarità utilizzate cambia il risultato. La scelta della misura di similarità è cruciale Dovrebbe essere fatta in modo da inglobare la maggior quantità possibile di informazione a priori. Il risultato può cambiare anche a seconda della metodologia utilizzata per fare clustering.
36 Clustering partizionale vs gerarchico Clustering partizionale Il risultato è una singola partizione dei dati. Tipicamente il numero di cluster deve essere dato a priori. Esempio: K-means. Clustering gerarchico Il risultato è una serie di partizioni innestate (un dendrogramma). Non è necessario settare a priori il numero di cluster. Più informativo del clustering partizionale ma improponibile per dataset molto grandi. Esempi: Complete link, single link,...
37 Clustering gerarchico Funzione clustergram clustergram(data, Linkage, tipo, rowlabels, genes); Dove: data: matrice di espressione. tipo : Algoritmo di clustering gerarchico. single : Algoritmo Single Link complete : Algoritmo Complete Link average : UPGMA... genes: identificativi dei geni.
38 Clustering partizionale K-means Algoritmo più famoso di clustering partizionale. Ogni gene è un punto in uno spazio n-dimensionale (n numero di esperimenti). Ogni cluster è rappresentato dalla sua media. Idea: L algoritmo è iterativo: si assesta in più passi. Si parte da una clusterizzazione iniziale, e ad ogni iterazione si assegna ogni gene alla media più vicina. Si riaggiornano le medie. Si ripete fino a convergenza.
39 K-means clustering
40 K-means clustering (2) Funzione kmeans [cidx, ctrs] = kmeans(data, K, dist, tipo ); Input: Output: data: matrice di espressione. K : numero di cluster. Per questo esempio K=16. tipo : Distanza da utilizzare. sqeucl : Distanza euclidea corr : Distanza di correlazione statistica... cidx: indica, per ogni gene, il cluster a cui appartiene. ctrs: centri dei cluster profilo medio di espressione.
41 Visualizzare i risultati Funzione maplot Per visualizzare i profili appartenenti ad ogni cluster: maplot(times, yeastvalues, cidx) Per visualizzare il profilo medio di espressione in ogni cluster: maplot(times, yeastvalues, ctrs) Quale/i cluster rappresenta geni che si esprimono solo durante la respirazione cellulare?
42 Validare i risultati: GOstat Una volta individuato un cluster di interesse x, esportare in un file di testo i geni che lo compongono: cluster = genes(cidx==x); dlmwrite( cluster.txt, char(cluster), ); Carico il file su GOstat: Nel campo Gene-association database mettere sgd (lievito) (Opzionale) Nel campo Subset of GO hierarchy mettere biological_process (siamo interessati al pathway cui i geni nel cluster prendono parte) In output ho i termini GO che meglio descrivono i geni all interno del mio cluster. Che informazioni riesco a dedurre?
43 Ricapitolando...» load yeastdata» plot(times, yeastvalues(15,:))» [mask, yeastvalues, genes] = genevarfilter(yeastvalues, genes);» [mask, yeastvalues, genes] = genelowvalfilter(yeastvalues,genes, absval,log2(3));» clustergram(yeastvalues, Linkage, complete,... rowlabels,genes)» [cidx, ctrs] = kmeans(yeastvalues, 16, dist, corr );» maplot(times, yeastvalues, cidx)» maplot(times, yeastvalues, ctrs)» cluster = genes(cidx==1);» dlmwrite( cluster.txt, char(cluster), );
44 Principal Component Analysis (PCA) Motivazioni Ridurre la dimensione dei dati (qui ogni dato è un gene caratterizzato da 7 numeri)... per visualizzare il dataset; per ridurre il carico computazionale delle tecniche applicate; per eliminare possibile ridondanza; Mettere in evidenza particolari strutture presenti nei dati.
45 PCA (2) Idea Presentare i dati nel riferimento che evidenzia maggiormente la loro struttura. Estrarre le direzioni di massima varianza dei dati.
46 PCA (3) Idea: eliminare le direzioni a bassa varianza In questo modo si comprimono i dati minimizzando la perdita di informazione. Per trasformare ogni punto: formule e nozioni derivanti dall algebra lineare (autovalori e autovettori della matrice di covarianza...).
47 PCA (4) Vantaggi Migliore tecnica di compressione dei dati Migliore in senso di errore quadratico medio Svantaggi Non è detto in tutti i casi che le direzioni a varianza maggiore siano le direzioni ottimali; Si perde l interpretabilità delle grandezze rappresentate.
48 PCA in Matlab Funzione princomp [pc, comp] = princomp(data); Input: Output: data: matrice di espressione. pc: coefficienti della trasformazione. comp: coordinate dei punti nello spazio trasformato, ordinate per importanza decrescente.
49 PCA in Matlab (2) Plottare le prime due o tre componenti per visualizzare i dati trasformati. Il comando è sempre scatter: scatter(comp(:,1),comp(:,2)); o, in alternativa: scatter3(comp(:,1),comp(:,2),comp(:,3));
50 Esercizio Effettuare un clustering k-means sui dati trasformati, prendendo solo le prime due o tre componenti principali; Ad es, per prendere solo le prime due componenti data_pca = comp(1:2,:); K = 2; Vengono separati i due cluster?
51 Ricapitolando...» [pc, comp] = princomp(yeastvalues);» scatter(comp(:,1),comp(:,2));» scatter3(comp(:,1),comp(:,2),comp(:,3));» pca_data = comp(:,1:2);» [pca_idx, pca_ctrs] = kmeans(pca_data, 2, dist, sqeucl );» scatter(pca_data(:,1), pca_data(:,2), 4, pca_idx); Nota Matlab offre un help molto semplice e dettagliato!
Analisi di dati Microarray: Esercitazione Matlab
Analisi di dati Microarray: Esercitazione Matlab Laboratorio di Bioinformatica II Pietro Lovato Anno Accademico 2010/2011 Contenuti 1 Introduzione DNA Microarray 2 Lavorare con una singola ibridazione
DettagliCluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare!
La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. Le tecniche di cluster analysis vengono usate per esplorare i dati e non per modellare! La cluster analysis
DettagliAnalisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008
Analisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008 Dott. Chiara Cornalba COMUNICAZIONI La lezione del 30 ottobre è sospesa per missione all estero del Prof. Giudici. Dal 6 Novembre
DettagliStrategie di annotazione di geni e genomi
Strategie di annotazione di geni e genomi Dr. Giovanni Emiliani giovanni.emiliani@unifi.it Bioinformatica A.A. 2011-1012 Concetti generali Le nuove tecnologie consentono l ottenimento di una grande mole
DettagliAlgoritmi di clustering
Algoritmi di clustering Dato un insieme di dati sperimentali, vogliamo dividerli in clusters in modo che: I dati all interno di ciascun cluster siano simili tra loro Ciascun dato appartenga a uno e un
DettagliGenerazione di Numeri Casuali- Parte 2
Esercitazione con generatori di numeri casuali Seconda parte Sommario Trasformazioni di Variabili Aleatorie Trasformazione non lineare: numeri casuali di tipo Lognormale Trasformazioni affini Numeri casuali
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliModulo 1 Information Communication Technology. ICT e computer... Pag. 6 Classificazione dei computer...» 8
I Indice generale 1 Introduzione all ICT Modulo 1 Information Communication Technology ICT e computer... Pag. 6 Classificazione dei computer...» 8 2 Come è fatto un computer I componenti di un personal
DettagliSistemi Web per il turismo - lezione 3 -
Sistemi Web per il turismo - lezione 3 - Software Si definisce software il complesso di comandi che fanno eseguire al computer delle operazioni. Il termine si contrappone ad hardware, che invece designa
DettagliPROGRAMMAZIONE DIDATTICA INDIVIDUALE (Parte 2 a )
Istituto di Istruzione Secondaria Superiore PEANO Via Andrea del Sarto, 6/A 50135 FIRENZE 055/66.16.28 055/67.80.41 www.peano.gov.it FITD06000T@PEC.ISTRUZIONE.IT posta@peano.gov.it Codice fiscale: 80032310486
Dettagli1 INTRODUZIONE ALL INTERFACCIA
SOMMARIO INIZIARE 1 Informazioni su questo libro................................ 1 Prerequisiti................................................. 1 Installare il programma.....................................
DettagliCorso di Laurea in Ingegneria Informatica Analisi Numerica
Corso di Laurea in Ingegneria Informatica Lucio Demeio Dipartimento di Scienze Matematiche 1 2 Analisi degli errori Informazioni generali Libro di testo: J. D. Faires, R. Burden, Numerical Analysis, Brooks/Cole,
DettagliINFORMATICA E PROGRAMMAZIONE PROF. M. GIACOMIN ESPERIENZA IN AULA: ELABORAZIONE DI IMMAGINI A COLORI IN LINGUAGGIO C
INFORMATICA E PROGRAMMAZIONE PROF. M. GIACOMIN ESPERIENZA IN AULA: ELABORAZIONE DI IMMAGINI A COLORI IN LINGUAGGIO C DESCRIZIONE GENERALE In questa esperienza il C verrà utilizzato per elaborare immagini
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis
DettagliTecniche di Clustering basate sul Machine Learning
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II Scuola Politecnica e delle Scienze di base Area didattica Scienze Matematiche Fisiche e Naturali Corso di Laurea in Informatica Tecniche di Clustering basate
DettagliINTRODUZIONE A MATLAB Matrix Laboratory
INTRODUZIONE A MATLAB Matrix Laboratory Introduzione Linguaggio di programmazione per applicazioni scientifiche e numeriche Vasto set di funzioni predefininte Interprete di comandi Possibilità di scrivere
DettagliPrincipal. component analysis. Dai volti agli spettri di galassie
Principal component analysis Dai volti agli spettri di galassie SCOPO: PCA for beginners Ridurre il numero di variabili all interno di una collezione di oggetti per descriverli piu facilmente, sulla base
DettagliIM-6145. Un sistema di misurazione completamente nuovo. p osi z iona re e. Sistema di misurazione dimensionale tramite immagini. Esempi di misurazione
IM-6145 Un sistema di completamente nuovo È su ffi c iente p osi z iona re e preme re Sistema di dimensionale tramite immagini Esempi di Panoramica del sistema di dimensionale tramite immagini Obiettivo
DettagliSuggerimenti per l approccio all analisi dei dati multivariati
Suggerimenti per l approccio all analisi dei dati multivariati Definizione degli obbiettivi Il primo passo è la definizione degli obbiettivi. Qual è l obbiettivo della sperimentazione i cui dati dovete
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Rappresentazione dati e visualizzazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona
DettagliRenderCAD S.r.l. Formazione
Descrizione AutoCAD rappresenta sempre più, oltre che un software di disegno assistito, una piattaforma ed uno standard di lavoro dal quale non si può più prescindere per tutti coloro che operano in ambito
DettagliSQL Server 2008. Architettura Client-Server. SQL Server 2008. Introduzione all uso di SQL Server 2008. Dutto Riccardo. http://dbdmg.polito.
SQL Server 2008 Introduzione all uso di SQL Server 2008 Dutto Riccardo http://dbdmg.polito.it SQL Server 2008 Gestione dei server OLAP e OLTP Gestione Utenti Creazione e gestione DB SQL Server Business
DettagliEsercizi su Autovalori e Autovettori
Esercizi su Autovalori e Autovettori Esercizio n.1 5 A = 5, 5 5 5 Esercizio n.6 A =, Esercizio n.2 4 2 9 A = 2 1 8, 4 2 9 Esercizio n.7 6 3 3 A = 6 3 6, 3 3 6 Esercizio n.3 A = 4 6 6 2 2, 6 6 2 Esercizio
DettagliDi testi ed immagini
Università Cattolica del Sacro Cuore - Brescia 23/5/2005 Parte I: Richiami di algebra lineare Parte II: Applicazioni Sommario della Parte I 1 Diagonalizzabilità di una matrice Autovalori ed autovettori
DettagliManuale Utente per la Gestione dei Revisori degli Enti Locali
Manuale Utente per la Gestione dei Revisori degli Enti Locali INDICE DEI CONTENUTI 1 PRESENTAZIONE DEL DOCUMENTO 3 1.1 INTRODUZIONE NORMATIVA 3 1.2 DEFINIZIONE DEI TERMINI/GLOSSARIO 4 2 MODALITÀ DI ACCESSO
DettagliLa mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione
La mappatura dei geni umani SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione Un grande impulso alla costruzione di mappe genetiche è stato dato da le tecniche della
DettagliDati importati/esportati
Dati importati/esportati Dati importati Al workspace MATLAB script Dati esportati file 1 File di testo (.txt) Spreadsheet Database Altro Elaborazione dati Grafici File di testo Relazioni Codice Database
DettagliComputazione per l interazione naturale: macchine che apprendono
Computazione per l interazione naturale: macchine che apprendono Corso di Interazione Naturale! Prof. Giuseppe Boccignone! Dipartimento di Informatica Università di Milano! boccignone@di.unimi.it boccignone.di.unimi.it/in_2015.html
DettagliPSICOMETRIA. Esercitazione n.1. C.d.L. Comunicazione e Psicologia a.a. 2012/13
PSICOMETRIA Esercitazione n.1 C.d.L. Comunicazione e Psicologia a.a. 2012/13 ESERCITAZIONE 1: INDICE 1. Informazioni di carattere generale sulle esercitazioni 2. Il foglio di calcolo (Excel) 3. Avviare
DettagliLa tecnologia dei microarray
La tecnologia dei microarray I microarray I progetti di sequenziamento (progetti permesso di identificare migliaia di geni genoma) ) hanno Migliaia di geni (ed i loro prodotti, le proteine) operano in
DettagliPrincipal Component Analysis
Principal Component Analysis Alessandro Rezzani Abstract L articolo descrive una delle tecniche di riduzione della dimensionalità del data set: il metodo dell analisi delle componenti principali (Principal
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra
DettagliIl comando provoca il salvataggio dello stato e la terminazione dell esecuzione.
Scrivere un programma per la gestione di una videoteca. Il programma deve essere in grado di tenere traccia dello stato corrente (presente/in prestito a x/smarrito da x/danneggiato da x a livello nn) e
DettagliSistemi Intelligenti. Riassunto
Sistemi Intelligenti Learning and Clustering Alberto Borghese and Iuri Frosio Università degli Studi di Milano Laboratorio di Sistemi Intelligenti Applicati (AIS-Lab) Dipartimento t di Scienze dell Informazione
DettagliIntroduzione al Pattern Recognition Statistico
Introduzione al Pattern Recognition Statistico Roberto Tagliaferri Dipartimento di Informatica Università di Salerno ( Sa ) 84084 Fisciano e-mail robtag@unisa.it Statistical Pattern Recognition Introduzione
DettagliSistemi Informativi Aziendali. Sistemi Informativi Aziendali
DIPARTIMENTO DI INGEGNERIA INFORMATICA AUTOMATICA E GESTIONALE ANTONIO RUBERTI Cenni al Data Mining 1 Data Mining nasce prima del Data Warehouse collezione di tecniche derivanti da Intelligenza Artificiale,
DettagliGUIDA RAPIDA. Versione 2.0; 26.01.2012. Indice
Indice GUIDA Versione 2.0; 26.01.2012 RAPIDA CD LAB AG, Irisweg 12, CH-3280 Murten, Tel. +41 (0)26 672 37 37, Fax +41 (0)26 672 37 38, www.wincan.com Indice 1 Introduzione 3 2 Avviare WinCan8 4 3 Creare
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: similarità Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Definizioni preliminari
DettagliClustering. Cos è un analisi di clustering
Clustering Salvatore Orlando Data Mining. - S. Orlando Cos è un analisi di clustering Cluster: collezione di oggetti/dati Simili rispetto a ciascun oggetto nello stesso cluster Dissimili rispetto agli
DettagliEvents: Track your favorite artists
Events: Track your favorite artists Universitá degli Studi di Salerno Progetto February 8, 2015 1 2 Overview 3 Concerts é un web site che permette di accedere a molte informazioni in rete, relative a cantanti
DettagliEsercitazione Strumentazione virtuale
Esercitazione Strumentazione virtuale - 1 Esercitazione Strumentazione virtuale 1 - Oggetto Introduzione alla strumentazione virtuale. LabView: il pannello frontale e il diagramma a blocchi. Esempi: generatore
DettagliROCK. A Robust Clustering Algorithm for Categorical Attributes. Sudipto Guha, Rajeev Rastogi, Kyuseok Shim
ROCK A Robust Clustering Algorithm for Categorical Attributes Sudipto Guha, Rajeev Rastogi, Kyuseok Shim Presentazione di Sara Liparesi e Francesco Nonni Sistemi Informativi per le Decisioni a.a. 2005/2006
DettagliI servizi del SITR-IDT
I servizi del SITR-IDT Sistema Informativo Territoriale Regionale (SITR-IDT) Titolo Creatore I servizi del SITR-IDT SITR Data 05/02/10 Soggetto Tipo Editore Descrizione Autori Formato Riferimento Diritti
Dettagli3.5.1 PREPARAZ1ONE I documenti che si possono creare con la stampa unione sono: lettere, messaggi di posta elettronica, o etichette.
3.5 STAMPA UNIONE Le funzioni della stampa unione (o stampa in serie) permettono di collegare un documento principale con un elenco di nominativi e indirizzi, creando così tanti esemplari uguali nel contenuto,
DettagliElementi di Informatica e Programmazione
Elementi di Informatica e Programmazione Introduzione Corsi di Laurea in: Ingegneria Civile Ingegneria per l Ambiente e il Territorio Università degli Studi di Brescia Docente: Daniela Fogli Informazioni
DettagliMATLAB (1) Introduzione e Operazioni con array
Laboratorio di Informatica per Ingegneria elettrica A.A. 2010/2011 Prof. Sergio Scippacercola MATLAB (1) Introduzione e Operazioni con array N.B. le slide devono essere utilizzate solo come riferimento
DettagliDOLFINI DILETTA MATRICOLA 686017
DOLFINI DILETTA MATRICOLA 686017 CELLULA GENES EXPRESSION PROGRAM TRASCRIPTION PROGRAM CHROMATIN-MODIFYING COMPLEX TF ON PROMOTERS TRASCRIPTION COMPLEX 141 TF DAL YEAST PROTEOME DATABASE MYC EPITOPE TAG
DettagliQuantificare la variabilità dei processi ecologici
Scopo ecologia Quantificare la variabilità dei processi ecologici Comprensione dei meccanismi fondamentale per identificare gli effetti del disturbo antropico e per prevenire alterazioni su scala globale
DettagliCarta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016
Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano
DettagliLiceo Marie Curie (Meda) Scientifico Classico Linguistico PROGRAMMAZIONE DISCIPLINARE PER COMPETENZE
Liceo Marie Curie (Meda) Scientifico Classico Linguistico PROGRAMMAZIONE DISCIPLINARE PER COMPETENZE a.s. 2015/16 CLASSE 2^ ASA Indirizzo di studio Liceo scientifico Scienze Applicate Docente Disciplina
DettagliCorso Matlab : Terza lezione (Esercitazione, 04/10/13) Samuela Persia, Ing. PhD.
Advanced level Corso Matlab : Terza lezione (Esercitazione, 04/10/13) Samuela Persia, Ing. PhD. Sommario Richiami Teoria Cenni Files Matlab File.m Script file File.mat Grafici Acquisizione dati esterni
DettagliANALISI E GESTIONE DEI COSTI
ANALISI E GESTIONE DEI COSTI Dott.ssa Francesca Mandanici Le valutazioni di convenienza economica di breve periodo: l'analisi differenziale 18 NOVEMBRE 2010 Le applicazioni dell analisi della variabilità
DettagliUD4 - MATLAB. M-file. Efficienza degli algoritmi. Formati d uscita
UD4 - MATLAB M-file. Efficienza degli algoritmi. Formati d uscita M-files In MatLab è possibile eseguire istruzioni contenute in file esterni; Tali file sono chiamati M-file perché devono avere estensione.m
DettagliBioinformatica Analisi del trascrittoma. Dott. Alessandro Laganà
Bioinformatica Analisi del trascrittoma Dott. Alessandro Laganà Analisi del trascrittoma Regolazione dell espressione genica I microarray cdna microarray Oligo microarray Affymetrix Chip Analisi dei dati
DettagliMetodi Stocastici per la Finanza
Metodi Stocastici per la Finanza Tiziano Vargiolu vargiolu@math.unipd.it 1 1 Università degli Studi di Padova Anno Accademico 2011-2012 Lezione 6 Indice 1 Il metodo bootstrap 2 Esercitazione 3 Interpolazione
DettagliPIANO DI LAVORO (a.s.2011/2012) Prof.essa Antonella Cerrai Prof. Roberto Casati DISCIPLINA Tecnologie Informatiche)
Istituto Tecnico Commerciale Statale e per Geometri E. Fermi Pontedera (Pi) Via Firenze, 51 - Tel. 0587/213400 - Fax 0587/52742 http://www.itcgfermi.it E-mail: mail@itcgfermi.it PIANO DI LAVORO (a.s.2011/2012)
DettagliPreprocessamento dei Dati
Preprocessamento dei Dati Raramente i dati sperimentali sono pronti per essere utilizzati immediatamente per le fasi successive del processo di identificazione, a causa di: Offset e disturbi a bassa frequenza
DettagliPrincipi di Usabilità
Corso di Laurea Magistrale in Scienze dell Informazione Editoriale, Pubblica e Sociale Principi di Usabilità a.a. 2011-2012 Principi di usabilità 2 L apprendibilità è la capacità di un sistema interattivo
DettagliPROGRAMMA DI SCIENZE E TECNOLOGIE APPLICATE 2015/2016 Classe 2ª Sez. C Tecnologico
ISTITUTO TECNICO STATALE MARCHI FORTI Viale Guglielmo Marconi n 16-51017 PESCIA (PT) - ITALIA PROGRAMMA DI SCIENZE E TECNOLOGIE APPLICATE 2015/2016 Classe 2ª Sez. C Tecnologico Docente PARROTTA GIOVANNI
DettagliData mining e rischi aziendali
Data mining e rischi aziendali Antonella Ferrari La piramide delle componenti di un ambiente di Bi Decision maker La decisione migliore Decisioni Ottimizzazione Scelta tra alternative Modelli di apprendimento
DettagliControl System Toolbox
Control System Toolbox E` un insieme di funzioni per l analisi di sistemi dinamici (tipicamente lineari tempo invarianti o LTI) e per la sintesi di controllori (in particolare a retroazione). All'interno
DettagliLa tecnologia Seegene per la diagnosi delle Malattie Sessualmente Trasmesse in Real Time PCR
La diagnostica molecolare delle malattie sessualmente trasmesse (non HIV): nuovi percorsi di appropriatezza analitica e clinica. La tecnologia Seegene per la diagnosi delle Malattie Sessualmente Trasmesse
DettagliDATABASE PER IL WEB. Programmazione Web 1
DATABASE PER IL WEB Programmazione Web 1 Archite3ura web con database Client Tier Web/App Tier DB Tier Client Web / App Server Database Il server web comunica con un altro server che con8ene il la banca
DettagliDATA MINING IN TIME SERIES
Modellistica e controllo dei sistemi ambientali DATA MINING IN TIME SERIES 01 Dicembre 2009 Dott. Ing.. Roberto Di Salvo Dipartimento di Ingegneria Elettrica Elettronica e dei Sistemi Anno Accademico 2009-2010
DettagliProgetto Cost reduction
Progetto Cost reduction Riflessioni frutto di esperienze concrete PER LA CORRETTA INTERPRETAZIONE DELLE PAGINE SEGUENTI SI DEVE TENERE CONTO DI QUANTO ILLUSTRATO ORALMENTE Dream Migliorare la bottom line
Dettagli(1) (2) (3) (4) 11 nessuno/a 9 10. (1) (2) (3) (4) X è il minore tra A e B nessuno/a X è sempre uguale ad A X è il maggiore tra A e B
Compito: Domanda 1 Per l'algoritmo fornito di seguito, qual è il valore assunto dalla variabile contatore quando l'algoritmo termina: Passo 1 Poni il valore di contatore a 1 Passo 2 Ripeti i passi da 3
DettagliMarziana Monfardini 2004-2005 lezioni di word
1 2 3 4 5 TABUlAZIONI, RIENTRI, ELENCHI...IN BREVE PER IMPOSTARE UNA TABULAZIONE... Posizionarsi nella riga in cui si vuole inserire una tabulazione. Selezionare il tipo di tabulazione desiderato sul pulsante
DettagliCIRCUITI INTELLIGENTI Parte 5: PCA e ICA
Ing. Simone SCARDAPANE Circuiti e Algoritmi per l Elaborazione dei Segnali Anno Accademico 2012/2013 Indice della Lezione 1. Analisi delle Componenti Principali 2. Auto-Associatori 3. Analisi delle Componenti
DettagliI-XIII_romane_sawyer 14-02-2006 10:50 Pagina V. Indice. Prefazione
I-XIII_romane_sawyer 14-02-2006 10:50 Pagina V Prefazione XI Capitolo 1 Tecnologie dell informazione e della comunicazione e Sistemi Informativi 1 1.1 Informatica e ICT 1 1.2 Il funzionamento dei computer:
DettagliNUCLEI FONDANTI COMPETENZE CONTENUTI ABILITA METODOLOGIE E STRUMENTI METODO SCIENTIFICO VEDERE
NUCLEI FONDANTI COMPETENZE CONTENUTI ABILITA METODOLOGIE E STRUMENTI METODO SCIENTIFICO VEDERE OSSERVARE COMPARARE CLASSIFICARE FORMULARE E VERIFICARE IPOTESI UTILIZZANDO SEMPLICI SCHEMATIZZAZIONI Relazione
DettagliIl file system. Le caratteristiche di file, direttorio e partizione sono del tutto indipendenti dalla natura e dal tipo di dispositivo utilizzato.
Il File System Il file system È quella parte del Sistema Operativo che fornisce i meccanismi di accesso e memorizzazione delle informazioni (programmi e dati) allocate in memoria di massa. Realizza i concetti
DettagliIl Manuale di KXSLDbg. Keith Isdale Traduzione del documento: Samuele Kaplun Traduzione del documento: Simone Solinas
Keith Isdale Traduzione del documento: Samuele Kaplun Traduzione del documento: Simone Solinas 2 Indice 1 Introduzione 5 1.1 Funzionalità......................................... 5 2 Usare KXSLDbg 6 2.1
DettagliCPU Performance: Regressione multipla e Analisi Cluster in Matlab
CPU Performance: Regressione multipla e Analisi Cluster in Matlab Alberto Lusoli Abstract Il seguente documento, illustra le tecniche utilizzate nell analisi del dataset CPU Performance. Gli scopi dello
DettagliAnalisi dei dati di traffico esistenti per la definizione dei profili temporali: metodologia ed esempio di applicazione.
XIII Expert panel emissioni da trasporto su strada Roma, 4 ottobre 27 Analisi dei dati di traffico esistenti per la definizione dei profili temporali: metodologia ed esempio di applicazione. C. Lavecchia*;
DettagliPIANO DI LAVORO. a.s. 2015 / 2016
PIANO DI LAVORO a.s. 2015 / 2016 Materia: INFORMATICA Classe: terza informatica- sez. A Data di presentazione: 15/10/2015 DOCENTI FIRMA Cerri Marta Bergamasco Alessandra Posta elettronica: itisleon@tin.it
DettagliProtocollo dei saperi imprescindibili Ordine di scuola: professionale
Protocollo dei saperi imprescindibili Ordine di scuola: professionale DISCIPLINA: MATEMATICA RESPONSABILE: CAGNESCHI F. IMPERATORE D. CLASSE: prima servizi commerciali Utilizzare le tecniche e le procedure
DettagliL equilibrio dei gas. Lo stato di equilibrio di una data massa di gas è caratterizzato da un volume, una pressione e una temperatura
Termodinamica 1. L equilibrio dei gas 2. L effetto della temperatura sui gas 3. La teoria cinetica dei gas 4. Lavoro e calore 5. Il rendimento delle macchine termiche 6. Il secondo principio della termodinamica
DettagliEsercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni
DettagliLICEO SCIENTIFICO "LEONARDO DA VINCI" - RC PROGRAMMA DI INFORMATICA A.S. 2014/15 - CLASSE: I Q - Indirizzo Scienze applicate Prof Miritello Rita
LICEO SCIENTIFICO "LEONARDO DA VINCI" - RC PROGRAMMA DI INFORMATICA A.S. 2014/15 - CLASSE: I Q - Indirizzo Scienze applicate Modulo 1: Introduzione all informatica Fondamenti di teoria della elaborazione
Dettagli32 Laurea magistrale in Informatica Scienze
32 Laurea magistrale in Informatica Scienze Il corso prepara alle professioni di (codifiche ISTAT): Analisti e progettisti di software Analisti di sistema Analisti e progettisti di applicazioni web P I
DettagliPIANO DI LAVORO ANNUALE DELLA DISCIPLINA. Classe 3 ATI A.S. 2015/2016
Istituto di Istruzione Secondaria Superiore Ettore Majorana 24068 SERIATE (BG) Via Partigiani 1 Tel 035 297612 Fax 035301672 Cod. Mecc. BGISO1700A Cod.Fisc. 95028420164 Md CDC 49_1 - Piano di Lavoro Annuale
DettagliAnalisi dei gruppi (Cluster analysis)
Capitolo 10 Analisi dei gruppi (Cluster analysis) Partendo da un collettivo multidimensionale, l analisi dei gruppi mira ad assegnarne le unità a categorie non definite a priori, formando dei gruppi di
DettagliUniversità degli studi di Milano Bicocca Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea Magistrale in INFORMATICA
Università degli studi di Milano Bicocca Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea Magistrale in INFORMATICA Offerta formativa Il (classe LM-18) ha, di norma, durata di due anni.
DettagliLEZIONE DI MATLAB 2.0. Ing.Irene Tagliente E-mail: irene.tagliente@opbg.net
LEZIONE DI MATLAB 2.0 Ing.Irene Tagliente E-mail: irene.tagliente@opbg.net Cos è Matlab Il programma MATLAB si è imposto in ambiente ingegneristico come strumento per la simulazione e l'analisi dei sistemi
DettagliData mining: classificazione DataBase and Data Mining Group of Politecnico di Torino
DataBase and Data Mining Group of Database and data mining group, Database and data mining group, DataBase and Data Mining Group of DataBase and Data Mining Group of So dati insieme di classi oggetti etichettati
DettagliMATEMATICA GENERALE Prova d esame del 4 giugno 2013 - FILA A
MATEMATICA GENERALE Prova d esame del 4 giugno 2013 - FILA A Nome e cognome Matricola I Parte OBBLIGATORIA (quesiti preliminari: 1 punto ciascuno). Riportare le soluzioni su questo foglio, mostrando i
DettagliOpzione manutentore impianti elettrici e automazione
PROGRAMMAZIONE DI T.T.I.M. (TECNOLOGIE E TECNICHE DELL'INSTALLAZIONE E DELLA MANUTENZIONE) CLASSE III Opzione manutentore impianti elettrici e automazione 1 UNITA' DI MISURA E CONVERSIONI (modulo propedeutico)
DettagliINTRODUZIONE A EXCEL ESERCITAZIONE I
1 INTRODUZIONE A EXCEL ESERCITAZIONE I Corso di Idrologia e Infrastrutture Idrauliche Prof. Roberto Guercio Cos è Excel 2 Foglio di calcolo o foglio elettronico è formato da: righe e colonne visualizzate
DettagliIntroduzione a Matlab
Introduzione a Matlab 1 Introduzione Matlab (MATrix LABoratory) è un software per il calcolo scientifico, particolarmente sviluppato per quanto riguarda la gestione ed elaborazione di vettori e matrici.
DettagliRichiami di informatica e programmazione
Richiami di informatica e programmazione Il calcolatore E una macchina usata per Analizzare Elaborare Collezionare precisamente e velocemente una grande quantità di informazioni. Non è creativo Occorre
DettagliINTRODUZIONE ALLE BASI DATI RELAZIONALI
INTRODUZIONE ALLE BASI DATI RELAZIONALI RELAZIONI E TABELLE Nelle BASI DI DATI RELAZIONALI le informazioni sono organizzate in TABELLE; Le tabelle sono rappresentate mediante griglie suddivise in RIGHE
DettagliDESCRIZIONE CREAZIONE APP Si suddivide in 4 fasi di lavoro: 1. PIANIFICAZIONE; 2. PROGETTAZIONE; 3. SVILUPPO; 4. DISTRIBUZIONE.
DESCRIZIONE CREAZIONE APP Si suddivide in 4 fasi di lavoro: 1. PIANIFICAZIONE; 2. PROGETTAZIONE; 3. SVILUPPO; 4. DISTRIBUZIONE. PIANIFICAZIONE La pianificazione è la prima fase. Questa è la più delicata
DettagliAnalisi del ciclo di vita per processi industriali
Analisi del ciclo di vita per processi industriali Laurea Magistrale in Scienze e Tecnologie per l Ambiente e il Territorio Corso a scelta 6 CFU Seconda Università di Napoli Dipartimento di Scienze e Tecnologie
DettagliLAB LEZ. 1 STATISTICA DESCRITTIVA CON R
LAB LEZ. 1 STATISTICA DESCRITTIVA CON R 1 2 L AMBIENTE DI SVILUPPO DI RStudio 1 3 4 2 1 FINESTRA PER GLI SCRIPT E PER VISUALIZZARE I DATI 2 CONSOLE DEI COMANDI 3 VARIABILI PRESENTI NELLA MEMORIA DEL PROGRAMMA
DettagliCOMPILAZIONE. Tarsformazione di linguaggi
COMPILAZIONE Tarsformazione di linguaggi Le fasi della compilazione File sorgente Compilazione File sorgente File sorgente File sorgente Compilazione Compilazione Compilazione Libreria di run-time File
DettagliCOMPITO B - ANALISI DEI DATI PER IL MARKETING OTTOBRE 2009
COGNOME E NOME COMPITO B - ANALISI DEI DATI PER IL MARKETING OTTOBRE 2009 Esercizio I MATR. Si è effettuata un indagine di customer satisfaction su un campione di 100 acquirenti d un modello di auto, chiedendo
DettagliApplicazioni biotecnologiche in systems biology
Applicazioni biotecnologiche in systems biology Lezione #6 Dr. Marco Galardini AA 2012/2013 Gene regulation analysis Lezione #6 Dr. Marco Galardini AA 2012/2013 Regolazione genica Elementi molecolari e
DettagliData mining. Vincenzo D Elia. vincenzo.delia@polito.it. DBDMG - Politecnico di Torino
Data mining Vincenzo D Elia vincenzo.delia@polito.it DBDMG - Politecnico di Torino vincenzo.delia@polito.it Archivi Multimediali e Data Mining - p. 1 Rapid Miner vincenzo.delia@polito.it Archivi Multimediali
DettagliIL COMPONENTE DATA MINING MODEL DEL PROGETTO
IL COMPONENTE DATA MINING MODEL DEL PROGETTO Relatore: prof. Anna Corazza Tutor Aziendale: dr. Massimo Brescia 1 PROGETTO DAME (DAta Mining& Exploration) Progettazione di web application per effettuare
Dettagli