Riconoscimento e recupero dell informazione per bioinformatica
|
|
|
- Dante Barone
- 8 anni fa
- Просмотров:
Транскрипт
1 Riconoscimento e recupero dell informazione per bioinformatica Clustering: similarità Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona
2 Sommario Definizioni preliminari Similarità tra punti Similarità tra sequenze dynamic time warping Similarità tra insiemi Un esempio biologico: il BLAST 2
3 Definizioni Coefficiente di similarità: indica la forza della relazione tra due oggetti maggiore è la somiglianza tra questi oggetti, più alto è il coefficiente di similarità Dissimilarità (distanza): concetto simile ma che misura le differenze tra due oggetti In generale si può parlare di misure di prossimità 3
4 Definizioni Concetto di metrica (già vista nella lezione sulla rappresentazione): misura di prossimità con particolari caratteristiche Definizione: (dissimilarità/distanza metrica): misura di dissimilarità che soddisfa alle seguenti proprietà: 4
5 Altra rappresentazione Matrice di prossimità: matrice che descrive i valori della funzione per tutte le possibili coppie simmetrica / asimmetrica, dissimilarità / similarità,... 5
6 Una distanza asimmetrica Esempio: distanza tra sequenze di DNA Distanza= inverso dell'alignment score basato sulla matrice di sostituzione Distanza simmetrica se la matrice di sostituzione è simmetrica ( A T è uguale a T A ) Jukes-Cantor 6
7 Una distanza asimmetrica Se la matrice di sostituzione non è simmetrica, allora non è la stessa cosa allineare la sequenza 1 su 2 o allineare la sequenza 2 su 1 Esempio: Distanza Tajima-Nei per sequenze di DNA Pesa in modo diverso le sostituzioni tenendo conto della frequenza che i nucleotidi hanno all interno delle sequenze α ga α gc 7
8 Commenti La scelta della misura di similarità/distanza è cruciale e influenza enormemente l uscita del clustering Informazione a priori: contesto applicativo tipo di pattern (vettore, sequenza, dati mancanti) dimensionalità del pattern scala cardinalità dell insieme requisiti (velocità vs precisione): e.g. retrieval by content (esperienza del ricercatore) 8
9 Trasformazione Similarità e dissimilarità misurano la stessa quantità da due punti di vista differenti Trasformazione: 9
10 Misure per pattern vettoriali Campo molto investigato: esistono molte misure diverse! vettori numerici vettori categorici vettori binari Distanze tra vettori numerici distanza euclidea distanza di Manhattan distanza Maximum distanza di Mahalanobis distanza di Minkowski misura coseno (similarità) 10
11 Vettori numerici Nozioni preliminari: vettori x = [x 1 x d ], y = [y 1 y d ] distanza euclidea Molto utilizzata distanza di Manhattan (city block distance) Tutti i percorsi più brevi hanno la stessa lunghezza Utilizzata nei circuiti dove i fili possono andare solo orizzontalmente o verticalmente 11
12 Vettori numerici Maximum distance (distanza sup ) Distanza di Mahalanobis Scalamento degli assi Pro: invariante alle rotazioni/traslazioni/trasformazioni affini Contro: calcolo della matrice di covarianza 12
13 Vettori numerici Distanza di Minkowsky Generalizzazione della distanza euclidea (p=2) e di quella di manhattan (p=1) Similarità coseno Similarità (non distanza) Tiene conto della lunghezza dei vettori 13
14 Misure per dati categorici Dati discreti (exe DNA) simple matching dissimilarity measure 14
15 Misure per dati binari Dati binari: 0 o 1 Distanza di Hamming: numero di posizioni dove i due vettori differiscono Esempio: la distanza di Hamming tra e è 2 15
16 Misure per dati binari Similarità di Jaccard: misura del grado di overlap fra 2 insiemi A e B L intersezione di A e B divisa per l unione di A e B La distanza di Jaccard si ottiene facilmente facendo JD(A,B) = 1 J(A,B) 16
17 Misure per dati binari Da questa misura si puà ricavare la versione per dati binari: Date 2 stringhe binarie A e B: JD (A, B) bin =1 M 11+ M 00 M 11 +M 01 + M 00 = M 10+M 10 M 11 +M 01 +M 00 M 11 n. di simboli dove sia A che B valgono 1. M 00 n. di simboli dove sia A che B valgono 0. M 01 n. di simboli dove A vale 0 e B vale 1. M 10 n. di simboli dove A vale 1 e B vale 0. Molto utilizzata in bioinformatica 17
18 Distanza geodesica Tiene conto del supporto : il percorso che effettivamente occorre fare per raggiungere B partendo da A - Misura più realistica, quindi più accurata - Molto più difficile da misurare, occorre conoscere il supporto 18
19 Misure per pattern sequenziali Devono gestire: l ordinalità dei dati il fatto che ci possono essere sequenze di lunghezza diversa Classi di misure misure per dati vettoriali (se le sequenze sono della stessa lunghezza) misure basate sul concetto di MSC (Massima sottosequenza comune) misure basate su modelli probabilistici misure basate su il concetto di editing (Edit Distance) 19
20 Misure per pattern sequenziali misure per dati vettoriali (se le sequenze sono della stessa lunghezza) Esempio: distanza euclidea Problemi: non tengono conto della sequenzialità dei dati non possono gestire sequenze a lunghezza diversa 20
21 Misure per pattern sequenziali Una misura più adatta a pattern sequenziali: Dynamic Time Warping Dynamic time warping: metodo per gestire accelerazioni e decelerazioni della sequenza usato in speech processing GOAL: allineare due sequenze deformando (warping) l asse temporale fino a quando non si trova un match ottimale. IDEE: estendere le sequenze ripetendo i simboli calcolare la distanza tra le sequenze estese 21
22 Misure per pattern sequenziali IDEA: warping path: come allineare diversi punti delle due sequenze ogni punto rappresenta un matching tra due punti delle due sequenze ci possono essere più match per lo stesso punto 22
23 Dynamic time warping (dettagli) Date due sequenze X = x1, x2,, xr Y = y1, y2,, ys (in generale r diverso da s ) Si costruisce una matrice M di dimensione (r x s) Mij = distanza tra i punti xi e yj (tipicamente la distanza euclidea Mij rappresenta l' allineamento tra i punti xi e yj 23
24 Dynamic time warping (dettagli) L'idea è di costruire un allineamento tra le due sequenze utilizzando la matrice M un possibile allineamento tra le due sequenze è rappresentato da un percorso nella matrice (warping path) Warping path 24
25 Dynamic time warping (dettagli) k è la lunghezza del warping path max {r, s} k r+ s 1 Situazione migliore Situazione peggiore 25
26 Dynamic time warping (dettagli) Proprietà di un warping path Monotonicità w h =(i, j),w h 1 =(i ', j ' ) i i ', j j ' ci si muove sempre in alto o verso destra Continuità w h =(i, j), w h 1 =(i ', j ' ) i i ' + 1, j j' + 1 si viaggia sempre su celle adiacenti, non ci sono salti Condizioni al contorno w 1 =(1,1), w k =(r, w) si parte in basso a sx e si finisce in alto a dx 26
27 Dynamic time warping (dettagli) Nota: ci sono molti percorsi che soddisfano le proprietà del warping path Il percorso ottimale è quello che minimizza il costo di warping DTW(X,Y) DTW ( X, Y )= h=1 k k k = h =1 M wh d ( x ih, y jh ) k w h =(i h, j h ) M wh =M i h, j h 27
28 Misure per pattern sequenziali Misure basate sul concetto di MSC (Massima sottosequenza comune) MSC without scaling: IDEA: due sequenze sono simili se hanno una sottosequenza in comune molto grande Approcci: caso discreto: classico problema della massima sottosequenza comune (vedi corso di algoritmi) caso continuo: occorre definire quando due valori corrispondono (match) ESEMPIO: Tipica soluzione con Programmazione Dinamica 28
29 Misure per pattern sequenziali MCS con Local Scaling IDEA: due sequenze sono simili se hanno un numero sufficientemente elevato di coppie di sottosequenze simili due sottosequenze sono simili se la prima può essere scalata e traslata appropriatamente in modo da assomigliare all altra SOLUZIONI: R-tree, percorso più lungo in un grafo aciclico 29
30 Misure per pattern sequenziali misure basate su modelli probabilistici: modellare la sequenza con modelli probabilistici estrarre la similarità sfruttando i modelli ESEMPIO: similarità tra sequenze con Hidden Markov Models Costruisco un modello per la sequenza 1 La similarità tra la sequenza 2 e la sequenza 1 si misura vedendo quando bene la sequenza 2 è spiegata dal modello della sequenza 1 (si misura la likelihood) 30
31 Misure per pattern sequenziali Edit distance: misura quante modifiche occorre effettuare su una sequenza per ottenerne un'altra Sostituzioni, inserzioni, cancellazioni In altre parole, il costo che si deve pagare per convertire un pattern nell altro ESEMPIO: i simboli sono lettere, i pattern sono parole di un testo scritto. Possibili editing : sostituzioni: pattern pastern inserzioni: pattern patterns cancellazioni: pattern pttern 31
32 Misure per pattern sequenziali Edit distance j varia tra tutte le possibili variazioni necessarie per ottenere B da A Soluzione algoritmica: programmazione dinamica (dettagli nel cap del Theodoridis) Molto utilizzato per automatic editing e text retrieval (trovare il best match tra un pattern e un database di patterns) Utilizzabile per trovare la distanza tra due sequenze di geni 32
33 Misure per insiemi Obiettivo: trovare una misura di prossimità per insiemi. Dati non ordinati cardinalità diversa Altro punto di vista: misure di similarità tra clusters (i clusters sono insiemi) utilizzabile negli algoritmi gerarchici (si vedrà meglio in seguito) ESEMPI nearest neighbor distance: distanza tra i punti più vicini farthest neighbor distance: distanza tra i punti più lontani average neighbor distance: distanza media tra tutti i punti mean based distance: distanza tra i rappresentanti dei cluster Media Medoide Vettore più centrale 33
34 Un esempio biologico: BLAST Basic Local Alignment Search Tool algoritmo per confrontare sequenze biologiche (nucleotidiche o aminoacidiche) confronta una sequenza di test con un database di sequenze, ritornando le più simili uno degli algoritmi più famosi di bioinformatica affronta un problema molto importante è computazionalmente efficiente -- la ricerca effettuata con algoritmi di programmazione dinamica è assolutamente inefficiente, vista la mole di dati presente oggigiorno BLAST è 50 volte più veloce 34
35 Un esempio biologico: BLAST IDEA: cerca di allineare due sequenze, lo score di allineamento rappresenta la misura della bontà del match Assunzioni / Idee per velocizzare l approccio non cercare l allineamento ottimale non effettuare la ricerca in tutto lo spazio delle sequenze utilizzare una serie di euristiche per velocizzare l approccio Input dell algoritmo: sequenza query (sequenza sconosciuta) sequenza target (o database) 35
36 Un esempio biologico: BLAST PASSI dell ALGORITMO 1. Rimuovere le regioni di bassa complessità della sequenza query regioni della sequenza con ripetizioni di pochi tipi di simbolo possono confondere il programma nello trovare regioni significative 2. Creare una lista delle word di K lettere della sequenza query 36
37 Un esempio biologico: BLAST 3. cercare, in tutte le sequenze del database, tutte le word di lunghezza K che hanno un buon match con le word della sequenza query buon match = score di allineamento sopra una certa soglia utilizzo della substitution matrix per calcolare lo score lo score considera l allineamento senza gap ogni word trovata si chiama hit (o hotspot ) allineamento senza gap è molto veloce: possibilità di memorizzare una volta per tutte le posizioni delle word in tutto il database 4. utilizzare ogni hit come seme per allargare la regione di similarità cercare di estendere la coppia di similarità a dx e a sx fino a quando lo score di similarità non diminuisce il risultato si chiama HSP (High Scoring segment pair) 37
38 Un esempio biologico: BLAST 5. visualizzare tutti gli HSP con uno score sufficientemente alto vengono listati in ordine di score 6. fornire un analisi statistica degli score risultanti: l Evalue misura il numero di hit che si potrebbero vedere per caso, in un database di sequenze casuali dipende dalla dimensionalità del database e dalla lunghezza della sequenza di query la significatività statistica è proporzionale al valore di tale indice (valori attorno allo zero supportano fortemente i risultati) 38
39 Un esempio biologico: BLAST Note: Eventualmente si può gestire anche la presenza di più HSP in una stessa sequenza del database si può utilizzare on line: utilizzatissimo per il buon compromesso tra accuratezza e velocità (negli anni sono state presentate molte varianti) l articolo dove viene presentato è il più citato degli anni 90 Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990). "Basic local alignment search tool". J Mol Biol 215 (3):
Riconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: similarità Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Definizioni preliminari
BLAST. W = word size T = threshold X = elongation S = HSP threshold
BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query
Riconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego
Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione
Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST
Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni
Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random
Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.
Riconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Filogenesi Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Introduzione alla
Riconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: metodologie Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Tassonomia
Introduzione all analisi di arrays: clustering.
Statistica per la Ricerca Sperimentale Introduzione all analisi di arrays: clustering. Lezione 2-14 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia
Ricerca di omologia di sequenza
Ricerca di omologia di sequenza RICERCA DI OMOLOGIA DI SEQUENZA := Data una sequenza (query), una banca dati, un sistema per il confronto e una soglia statistica trovare le sequenze della banca più somiglianti
Algoritmi di Allineamento
Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento
FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento
Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente
Cluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca
Cluster Analysis Distanze ed estrazioni M Q Marco Perugini Milano-Bicocca 1 Scopi Lo scopo dell analisi dei Clusters è di raggruppare casi od oggetti sulla base delle loro similarità in una serie di caratteristiche
Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare!
La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. Le tecniche di cluster analysis vengono usate per esplorare i dati e non per modellare! La cluster analysis
Le sequenze consenso
Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica
L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
Bioinformatica. Analisi del genoma
Bioinformatica Analisi del genoma GABRIELLA TRUCCO CREMA, 5 APRILE 2017 Cosa è il genoma? Insieme delle informazioni biologiche, depositate nella sequenza di DNA, necessarie alla costruzione e mantenimento
Programmazione dinamica
Programmazione dinamica Violetta Lonati Università degli studi di Milano Dipartimento di Informatica Laboratorio di algoritmi e strutture dati Corso di laurea in Informatica Violetta Lonati Programmazione
Reti Neurali in Generale
istemi di Elaborazione dell Informazione 76 Reti Neurali in Generale Le Reti Neurali Artificiali sono studiate sotto molti punti di vista. In particolare, contributi alla ricerca in questo campo provengono
Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)
Derivazione numerica Introduzione al calcolo numerico Il calcolo della derivata di una funzione in un punto implica un processo al limite che può solo essere approssimato da un calcolatore. Supponiamo
ALLINEAMENTO DI SEQUENZE
ALLINEAMENTO DI SEQUENZE Procedura per comparare due o piu sequenze, volta a stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che massimizzino la similarita
1) Codici convoluzionali. 2) Circuito codificatore. 3) Diagramma a stati e a traliccio. 4) Distanza libera. 5) Algoritmo di Viterbi
Argomenti della Lezione 1) Codici convoluzionali 2) Circuito codificatore 3) Diagramma a stati e a traliccio 4) Distanza libera 5) Algoritmo di Viterbi 1 Codici convoluzionali I codici convoluzionali sono
Array e Oggetti. Corso di Laurea Ingegneria Informatica Fondamenti di Informatica 1. Dispensa 12. A. Miola Dicembre 2006
Corso di Laurea Ingegneria Informatica Fondamenti di Informatica 1 Dispensa 12 Array e Oggetti A. Miola Dicembre 2006 http://www.dia.uniroma3.it/~java/fondinf1/ Array e Oggetti 1 Contenuti Array paralleli
Riconoscimento automatico di oggetti (Pattern Recognition)
Riconoscimento automatico di oggetti (Pattern Recognition) Scopo: definire un sistema per riconoscere automaticamente un oggetto data la descrizione di un oggetto che può appartenere ad una tra N classi
Corso di Visione Artificiale. Texture. Samuel Rota Bulò
Corso di Visione Artificiale Texture Samuel Rota Bulò Texture Le texture sono facili da riconoscere ma difficili da definire. Texture Il fatto di essere una texture dipende dal livello di scala a cui si
la edit distance tra X e Y è la distanza relativa all allineamento (o agli allineamenti) che minimizza tale distanza.
Algoritmica 14/15 EDIT DISTANCE Il problema della edit distance (distanza di edizione, in una versione in italiano scarsamente usata) è alla base dei problemi di confronto fra sequenze perché il meccanismo
Sintesi Sequenziale Sincrona Sintesi Comportamentale di reti Sequenziali Sincrone
Sintesi Sequenziale Sincrona Sintesi Comportamentale di reti Sequenziali Sincrone Il problema dell assegnamento degli stati versione del 9/1/03 Sintesi: Assegnamento degli stati La riduzione del numero
10 STRUTTURE DI CONTROLLO REPEAT E WHILE. Strutture di controllo e variabili strutturate
LABORATORIO DI PROGRAMMAZIONE Corso di laurea in matematica 10 STRUTTURE DI CONTROLLO REPEAT E WHILE Marco Lapegna Dipartimento di Matematica e Applicazioni Universita degli Studi di Napoli Federico II
Problemi algoritmici e Complessità degli algoritmi
Problemi algoritmici e Complessità degli algoritmi Università degli Studi di Salerno Corso di Laurea in Scienze della comunicazione Informatica generale Docente: Angela Peduto A.A. 2005/2006 Problemi algoritmici!
Esercizi vari. Alberto Montresor. 19 Agosto, 2014
Esercizi vari Alberto Montresor 19 Agosto, 2014 Alcuni degli esercizi che seguono sono associati alle rispettive soluzioni. Se il vostro lettore PDF lo consente, è possibile saltare alle rispettive soluzioni
Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.
Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato
Fondamenti di Informatica - 1. Prof. B.Buttarazzi A.A. 2011/2012
Fondamenti di Informatica - 1 Prof. B.Buttarazzi A.A. 2011/2012 Sommario I sistemi di numerazione Il sistema binario Altri sistemi di numerazione Algoritmi di conversione Esercizi 07/03/2012 2 Sistemi
Allineamenti a coppie
Laboratorio di Bioinformatica I Allineamenti a coppie Dott. Sergio Marin Vargas (2014 / 2015) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Il sito http://myhits.isb-sib.ch/cgi-bin/dotlet
1) Hamming bound, coset, codici equivalenti
Argomenti della Lezione ) Hamming bound, coset, codici equivalenti 2) Esercizi sui codici lineari a blocchi Osservazione () Per effettuare la decodifica a rivelazione di errore si può seguire una delle
Bioinformatica ed applicazioni di bioinformatica strutturale!
Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica! Le banche dati! Programmi per estrarre ed analizzare i dati! I numeri! Cellule nell uomo! Geni nell uomo! Genoma umano Il dogma
Scale di Misurazione Lezione 2
Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile
Fondamenti di Informatica. Algoritmi di Ricerca e di Ordinamento
Fondamenti di Informatica Algoritmi di Ricerca e di Ordinamento 1 Ricerca in una sequenza di elementi Data una sequenza di elementi, occorre verificare se un elemento fa parte della sequenza oppure l elemento
Organizzazione Fisica dei Dati (Parte II)
Modello Fisico dei Dati Basi di Dati / Complementi di Basi di Dati 1 Organizzazione Fisica dei Dati (Parte II) Angelo Montanari Dipartimento di Matematica e Informatica Università di Udine Modello Fisico
Pattern Sequenziali e Serie Temporali
Pattern Sequenziali e Serie Temporali Francesco Folino 9 Dicembre 2004 Pattern Sequenziali:intuizione Obiettivo: personalizzare ed ottimizzare le offerte di vendita ai clienti in base agli acquisti fatti
Algoritmi Greedy. Tecniche Algoritmiche: tecnica greedy (o golosa) Un esempio
Algoritmi Greedy Tecniche Algoritmiche: tecnica greedy (o golosa) Idea: per trovare una soluzione globalmente ottima, scegli ripetutamente soluzioni ottime localmente Un esempio Input: lista di interi
InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche
InfoBioLab I ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche Esercizio 1 - obiettivi: Ricerca di 2 proteine in ENTREZ Salva i flat file che descrivono le 2 proteine in formato testo Importa
Dynamic Time Warping
Dynamic Time Warping Introduzione DTW Classico DTW normalizzato Calcolo del DTW mediante Programmazione Dinamica Derivative Dynamic Time Warping (DDTW) Fast DTW Descrizione algoritmica del DTW Introduzione:
Lezione 3 Cinematica Velocità Moto uniforme Accelerazione Moto uniformemente accelerato Concetto di Forza Leggi di Newton
Corsi di Laurea in Scienze motorie - Classe L-22 (D.M. 270/04) Dr. Andrea Malizia 1 Cinematica Velocità Moto uniforme Accelerazione Moto uniformemente accelerato Concetto di Forza Leggi di Newton Sistemi
ANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani [email protected] http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra
Allineamento e similarità di sequenze
Allineamento e similarità di sequenze Allineamento di Sequenze L allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; La similarità
SISTEMI DI CONTROLLO CINEMATICA E DINAMICA DEI ROBOT
SISTEMI DI CONTROLLO Laurea Specialistica in Ingegneria Meccanica e del Veicolo SISTEMI DI CONTROLLO CINEMATICA E DINAMICA DEI ROBOT Ing. Cristian Secchi Tel. 0522 522235 e-mail: [email protected]
Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara
Sistemi lineari Lorenzo Pareschi Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara http://utenti.unife.it/lorenzo.pareschi/ [email protected] Lorenzo Pareschi (Univ. Ferrara)
RETI DI CALCOLATORI II
RETI DI CALCOLATORI II Facoltà di Ingegneria Università degli Studi di Udine Ing. DANIELE DE CANEVA a.a. 2009/2010 ARGOMENTI DELLA LEZIONE TEORIA DEL ROUTING ROUTING STATICO ROUTING DINAMICO o PROTOCOLLI
L errore percentuale di una misura è l errore relativo moltiplicato per 100 ed espresso in percentuale. Si indica con e p e risulta: e ( e 100)%
UNITÀ L ELBORZIONE DEI DTI IN FISIC 1. Gli errori di misura.. Errori di sensibilità, errori casuali, errori sistematici. 3. La stima dell errore. 4. La media, la semidispersione e lo scarto quadratico
Massimo Benerecetti Tabelle Hash
Massimo Benerecetti Tabelle Hash # Lezione n. Parole chiave: Corso di Laurea: Informatica Insegnamento: Algoritmi e Strutture Dati I Email Docente: [email protected] A.A. 2009-2010 Rappresentazione di insiemi
Calcolo numerico e programmazione Rappresentazione dei numeri
Calcolo numerico e programmazione Rappresentazione dei numeri Tullio Facchinetti 16 marzo 2012 10:54 http://robot.unipv.it/toolleeo Rappresentazione dei numeri nei calcolatori
Sommario. Tabelle ad indirizzamento diretto e hash Funzioni Hash
Funzioni Hash Sommario Tabelle ad indirizzamento diretto e hash Funzioni Hash Requisiti Metodo della divisione Metodo della moltiplicazione Funzione Hash Universale La ricerca Talvolta si richiede che
Corso di laurea in Informatica Calcolo Numerico Prof.ssa L. D Amore 12 Dicembre 2008 Esercizi di riepilogo tipo prova d esame
1 Cognome: Nome: Matricola: Corso di laurea in Informatica Calcolo Numerico Prof.ssa L. D Amore 12 Dicembre 2008 Esercizi di riepilogo tipo prova d esame 1. Si consideri il sistema aritmetico f. p. a precisione
Alberi binari e alberi binari di ricerca
Alberi binari e alberi binari di ricerca Violetta Lonati Università degli studi di Milano Dipartimento di Scienze dell Informazione Laboratorio di algoritmi e strutture dati Corso di laurea in Informatica
0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
Teoria dei Segnali Richiami di analisi matematica; alcune funzioni notevoli
Teoria dei Segnali Richiami di analisi matematica; alcune funzioni notevoli Valentino Liberali Dipartimento di Fisica Università degli Studi di Milano [email protected] Teoria dei Segnali Richiami
05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
Alberi filogenetici. File: alberi_filogenetici.odp. Riccardo Percudani 02/03/04
Alberi filogenetici The tree of life Albero filogenetico costruito con le sequenze della subunità piccola dell RNA ribosomale. Tutte le forme viventi condividono un comune ancestore (LCA, last common ancestor
PIXEL. Il valore quantizzato misurato da ciascun sensore diventa un. PICTURE ELEMENT = PIXEL dell immagine. Interazione & Multimedia
La risoluzione PIXEL Il valore quantizzato misurato da ciascun sensore diventa un PICTURE ELEMENT = PIXEL dell immagine La risoluzione Definizione: si dice risoluzione il numero di pixel per unità di misura.
Apprendimento Automatico (Lezione 1)
Apprendimento Automatico (Lezione 1) Fabio Aiolli www.math.unipd.it/~aiolli Sito web del corso www.math.unipd.it/~aiolli/corsi/1516/aa/aa.html Orario 40 ore di lezione in aula (5cfu) 8 ore di laboratorio
Alberi binari di ricerca
Alberi binari di ricerca Ilaria Castelli [email protected] Università degli Studi di Siena Dipartimento di Ingegneria dell Informazione A.A. 2009/20010 I. Castelli Alberi binari di ricerca, A.A. 2009/20010
Errori di misura Teoria
Errori di misura Teoria a misura operazione di misura di una grandezza fisica, anche se eseguita con uno strumento precisissimo e con tecniche e procedimenti accurati, è sempre affetta da errori. Gli errori
Algoritmo di Branch & Bound
Sapienza Università di Roma - Dipartimento di Ingegneria Informatica, Automatica e Gestionale Algoritmo di Branch & Bound Docente: Renato Bruni [email protected] Corso di: Ottimizzazione Combinatoria
Riconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Hidden Markov Models Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Processi
Algoritmo: procedimento non ambiguo che in un numero finito di passi risolve un problema (o una classe di problemi)
LABORATORIO DI PROGRAMMAZIONE Corso di laurea in matematica 2 LA MACCHINA DI VON NEUMANN Marco Lapegna Dipartimento di Matematica e Applicazioni Universita degli Studi di Napoli Federico II wpage.unina.it/lapegna
GRAFI. Cosa sono Grafi non orientati Grafi orientati Grafi pesati Alberi Automi!
G R A F I 1 GRAFI Cosa sono Grafi non orientati Grafi orientati Grafi pesati Alberi Automi! 2 cip: cip: Pallogrammi Pallogrammi GRAFI: cosa sono I grafi sono una struttura matematica fondamentale: servono
Minimizzazione a più livelli di reti combinatorie Cristina Silvano
Minimizzazione a più livelli di reti combinatorie Cristina Silvano Università degli Studi di Milano Dipartimento di Scienze dell Informazione Milano (Italy) Sommario Modello booleano e modello algebrico
Ricerche con BLAST (Laboratorio)
Laboratorio di Bioinformatica I Ricerche con BLAST (Laboratorio) Dott. Sergio Marin Vargas (2014 / 2015) NCBI BLAST BLAST: Basic Local Alignment Search Tool http://blast.ncbi.nlm.nih.gov/blast.cgi NCBI
Minimizzazione di Reti Logiche Combinatorie Multi-livello. livello
Minimizzazione di Reti Logiche Combinatorie Multi-livello livello Maurizio Palesi Maurizio Palesi 1 Introduzione I circuiti logici combinatori sono molto spesso realizzati come reti multi-livello di porte
