Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni:
|
|
- Giuseppa Bondi
- 6 anni fa
- Visualizzazioni
Transcript
1 Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni: antonella.meloni@ifc.cnr.it
2
3 Sequenza A= stringa formata da N simboli, dove i simboli apparterranno ad un certo alfabeto. A = (a 1, a 2, a 3,..a N ) Con a i ε (A,T,C,G) nel caso di sequenze di acidi nucleici e a i ε (A,R,N,D,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V) nel caso di sequenze proteiche.
4 La più semplice analisi di sequenze consiste nel chiedersi se c è una qualche relazione di similarità (somiglianza di tipo algoritmico indipendente dalle cause che la generano) significativa tra due o più sequenze (di DNA o proteine). E utile per scoprire informazioni funzionali, strutturali ed evolutive delle sequenze in esame: un applicazione tipica è quella di scoprire geni simili ad un gene di cui si conosce la funzione, ad esempio in questo modo è stata verificata la somiglianza tra geni oncogeni e geni deputati alla crescita cellulare. La similarità di due o più sequenze si verifica effettuando prima un allineamento tra le sequenze in esame (o parte di esse) e poi decidendo se le eventuali parti comuni sono più facilmente dovute al caso o ad una effettiva relazione tra loro.
5 Date due sequenze A e B descritte da due stringhe formate da N ed M simboli rispettivamente, allineare le due sequenze vuol dire trovare la funzione f(b) tale che la distanza tra A e C=f(B) sia la minima possibile (oppure che la similarità sia massima). f() è una qualche trasformazione che può essere applicata alla sequenza, ad esempio un semplice shift di n caratteri. Formalizzando, l operazione di allineamento consiste in tre passi fondamentali: 1. Scelta di una metrica di allineamento (distance). 2. Definizione delle possibili trasformazioni f() che s possono applicare (search space). 3. Definizione di un algoritmo che trovi il minimo (o il massimo) della metrica nel search space (algoritmo di ottimizzazione).
6 Allineamento globale: si tenta di allineare il massimo numero di caratteri delle due sequenze, incluse le parti finali. Candidate ideali sono le sequenze di lunghezza simile e quasi simili. Allineamento locale: si tenta di allineare solo pezzi di sequenze molto simili. L allineamento termina quando termina l isola di forte match. Candidate ideali sono sequenze con lunghezze diverse, con regioni fortemente conservate. Si distingue inoltre tra: - pairwise allignment - multiple allignment Metodi principali di allineamento a coppie: Algoritmi di Programmazione Dinamica - Needleman & Wunsh (1970) per l allineamento globale - Smith & Watermann (1981) per l allineamento locale Tecniche euristiche (algoritmi FASTA e BLAST)
7 Buona distanza: sempre non negativa e simmetrica (cioè d(a,b)=d(b,a)). La distanza è uguale a zero se le sequenze sono perfettamente allineate. Il modello più semplice di distanza definito in bioinformatica è la distanza di Hamming: numero di posizioni in cui due stringhe differiscono tra loro. La distanza di Hamming si calcola confrontando le coppie (ai,bi) e contando le coppie differenti. Analogamente, la similarità di Hamming si computa contando le coppie uguali. Le metriche di Hamming dipendono dalla lunghezza delle sequenze, quindi può essere opportuno usare delle versioni normalizzate alla lunghezza delle sequenze stesse.
8 Supponiamo di utilizzare la distanza di Hamming e che f() sia un operazione di shift delle due sequenze. A = A A K K Q W B = A A K Q W Per ognuna delle possibili posizioni dobbiamo valutare il numero di simboli che si appaiano esattamente, ovvero la similarità di Hamming. In questo caso l allineamento ottimo risulta quello della quinta casella con punteggio 4 (shift = +1).
9 DOT MATRIX: Alternativa grafica alla ricerca esaustiva. Viene costruita una matrice NxM, e gli elementi della matrice vengono posti ad uno in caso di corrispondenza tra i simboli delle due sequenze. Nel caso di due sequenze identiche, la dot-matrix è formata da una diagonale continua con del rumore, costituito dagli allineamenti casuali. In generale, un indice di similarità alto tra due sequenze corrisponderà ad una diagonale marcata. Il rumore casuale può essere ridotto con opportuni algoritmi di filtraggio.
10 L approccio brute force è applicabile solo per problemi semplici. Supponiamo ad esempio di volere allineare tre sequenze di lunghezza N, definendo la similarità come il numero di coincidenze nelle tre sequenze (quindi S=0,1,2 per ogni locazione). Il numero di casi da computare è (2N-1)K-1. Il numero di casi diventi estremamente grande. La complessità computazionale dell algoritmo brute force è troppo grande. In generale per risolvere problemi di allineamento di interesse pratico è quindi necessario utilizzare algoritmi di ottimizzazione più efficienti (cioè con complessità computazionale minore) della semplice ricerca esaustiva.
11 La edit distance tra due stringhe è il numero minimo di operazioni di editing necessarie per trasformare una stringa nell altra. Le possibili operazioni di editing sono: inserzione di un simbolo, cancellazione di un simbolo, sostituzione di un simbolo con un altro. L edit distance è equivalente alla distanza di Hamming se non si considerano le operazioni di inserzione e cancellazione. Tenendo conto delle operazioni di inserzione e cancellazione si ottiene un modello di distanza più adeguato alla realtà biologica. Esistono infinite combinazioni di operazioni di inserzione, cancellazione e sostituzione che trasformano una stringa in un altra.
12 Ad esempio, consideriamo le stringhe: S1: TGCATAT S2: ATCCGAT E possibile trasformare S1 in S2 con 5 operazioni: TGCATAT Cancellare l ultima T TGCATA Cancellare l ultima A TGCAT Aggiungere A all inizio ATGCAT sostituzione di G con C ATCCAT Inserire una G ATCCAT Sembrerebbe quindi che la edit distance sia 5. In realtà è possibile trasformare S1 in S2 con sole 4 operazioni: TGCATAT Inserimento di A all inizio ATGCATAT cancellazione di T alla posizione 6 ATGCAAT sostituzione di A con G ATGCGAT sostituzione di G con C ATCCGAT
13 Il problema del calcolo della edit distance tra due sequenze è quindi quello di trovare tra tutte le possibili trasformazioni quella che richiede il numero minimo di operazioni. E facile verificare che la possibilità di inserire spazi (gap) nelle due sequenze aumenta in modo esponenziale la complessità degli algoritmi brute-force di allineamento. Limitandoci ad un solo gap, l inserzione dello stesso in una sequenza di N simboli crea N nuove sequenze, ognuna delle quali andrebbe allineata con la seconda sequenza ottenendo una complessità O(n 3 ). Aumentando il numero di gap, la complessità diviene O(n n ). Diviene quindi impossibile utilizzare algoritmi esaustivi (o bruteforce) ma bisogna passare ad algoritmi più efficienti, quali quelli di programmazione dinamica.
14 Il calcolo della edit distance è equivalente al calcolo della matrice di allineamento ottima. Ogni percorso diagonale nella matrice corrisponde ad un possibile allineamento. Ogni segmento che congiunge due nodi di un percorso è equivalente ad una colonna dell allineamento. Segmenti verticali ed orizzontali corrispondono all inserimento di uno spazio.
15 Le colonne con lo stesso simbolo si dicono matches, quelle con uno spazio si dicono indels, divise in insertions (spazio nella colonna superiore) e deletions (spazio nella colonna inferiore). Numero di indels in un allineamento senza mismatch = numero di trasformazioni del calcolo della edit distance Corrispondenza tra il problema dell allineamento di due sequenze ed il problema di trovare un percorso ottimo in una matrice formata dalle due sequenze in esame. Tutti i problemi di allineamento di sequenze possono essere ricondotti quindi ad un problema di tipo matriciale, risolvibile con algoritmi di tipo dynamic programming. In generale per risolvere il problema del percorso ottimo, dobbiamo in qualche modo pesare i vari nodi della matrice introducendo una qualche metrica.
16 Nel caso della edit distance, mismatch, inserzioni e delezioni vengono pesate tutte con valore -1. In generale, una misura di similarità che tenga conto dell inserimento di gap dovrà tener conto del numero di gap inseriti e della loro lunghezza. Formalizzando avremo l espressione: score = L i= 1 s( a, b ) δ i [ γ + ( len( j) 1) ] - L = lunghezza dell allineamento che stiamo considerando, cioè della parte in cui le due sequenze si sovrappongono. - s(a,b)= score dell appaiamento di due residui: s(a,b)=1 se a=b, 0 altrimenti. - G= numero di gap inseriti. - γ= penalità per l inserzione di un gap, - δ = penalità per l allungamento di un gap esistente. - len = lunghezza del gap. i G j= 1
17
18 Calcolo della similarità di Hamming. Scrivere un programma MATLAB che accetti in input un numero N di sequenze in formato FASTA e fornisca la matrice della massima similarità di Hamming tra le sequenze. Per matrice di similarità si intende l insieme delle similarità tra tutte le possibili coppie di sequenze. La massima similarità di Hamming va valutata come massimo delle similarità per tutti i possibili valori di shift tra le due sequenze). Applicare il programma alle sequenze di DNA mitocondriale in allegato (Uomo, Scimpanzé, Neanderthal, Gorilla, Polytomella). Per la lettura del formato fasta si usi la funzione fastaread1.m.
19 Significatività della similarità di Hamming Dato un certo valore della massima similarità di Hamming tra due sequenze, esisterà una certa probabilità che tale valore sia dato da un appaiamento casuale di nucleotidi e non abbia un significato biologico (ipotesi nulla). Se la probabilità dell ipotesi nulla è abbastanza bassa (ad esempio minore del 5%), respingeremo l ipotesi nulla e considereremo le sequenze effettivamente simili secondo la metrica considerata. La probabilità dell ipotesi nulla può essere calcolata con gli strumenti del calcolo delle probabilità. Una possibilità alternativa è quella di creare dei dati casuali partendo dai dati sotto analisi (dati surrogati) e calcolare il parametro che ci interessa sui dati surrogati. Reiterando più volte il procedimento, si ottiene una distribuzione casuale del parametro di interesse (tipicamente gaussiana) dalla quale si possono ricavare le statistiche del primo ordine (media e SD). La soglia del parametro per respingere l ipotesi nulla sarà poi media ± 1.96SD.
20 Nel nostro caso, date le due sequenze S1 e S2, possiamo creare i dati surrogati mescolando in modo random le basi di una delle due sequenze. Otterremo quindi la massima similarità di Hamming SH per i dati surrogati come visto nell esercitazione 1.1. Ripetendo il procedimento un numero elevato di volte, avremo una distribuzione gaussiana di SH. Da tale distribuzione otteniamo l intervallo di valori di SH compatibile con l ipotesi nulla. A questo punto possiamo verificare se il valore di SH ottenuto tra le due sequenze originali è all interno dell intervallo definito dai dati surrogati.
21 Dot-matrix I bioinformatics toolbox di matlab forniscono la funzione seqdotplot che calcola la dot matrix tra due sequenze. Attraverso i parametri della funzione è possibile realizzare il filtraggio della matrice per migliorare la visualizzazione. In particolare è possibile scegliere una finestra (Window) e visualizzare solo le finestre con un certo numero di match (Number). Notiamo che la matrice è restituita in formato sparse che è un formato matlab utile ad ottimizzare l occupazione di memoria. Si calcolino e visualizzino le dot matrix delle coppie di sequenze homosapiens-scimpanze e homosapiens-polytomella (usare le sequenze in allegato dove sono stati eliminati i gap).
22 Un alternativa per ottimizzare la visualizzazione è operare un filtraggio della matrice come avviene per le immagini. Ad esempio possiamo operare un filtraggio con un kernel diagonale e binarizzare la matrice risultante secondo una soglia. Effettuare il filtraggio della dot matrix non filtrata homosapiensscimpanze con un kernel diagonale di dimensioni 11x11 (usare la funzione conv2, per trasformare la matrice sparse usare full() ). Binarizzare la matrice con soglia 7. Confrontare i risultati ottenuti con quelli dati dalla funzione seqdotplot con window=11, Number=7.
ALLINEAMENTO DI SEQUENZE
ALLINEAMENTO DI SEQUENZE Gli obiettivi degli algoritmi di allineamento di sequenze di acidi nucleici o proteine sono molteplici. Possiamo ricordare la ricerca di similarità nelle banche dati, la costruzione
DettagliAlgoritmi di Allineamento
Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento
DettagliQuarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST
Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni
DettagliBLAST. W = word size T = threshold X = elongation S = HSP threshold
BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query
DettagliALLINEAMENTO DI SEQUENZE
ALLINEAMENTO DI SEQUENZE Procedura per comparare due o piu sequenze, volta a stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che massimizzino la similarita
DettagliLe sequenze consenso
Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica
DettagliZ-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random
Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.
Dettaglila edit distance tra X e Y è la distanza relativa all allineamento (o agli allineamenti) che minimizza tale distanza.
Algoritmica 14/15 EDIT DISTANCE Il problema della edit distance (distanza di edizione, in una versione in italiano scarsamente usata) è alla base dei problemi di confronto fra sequenze perché il meccanismo
DettagliDistanza di Edit. Speaker: Antinisca Di Marco Data:
Distanza di Edit Speaker: Antinisca Di Marco Data: 14-04-2016 Confronto di sequenze Il confronto tra sequenze in biologia computazionale è la base per: misurare la similarità tra le sequenze allineamento
DettagliSISTEMI LINEARI. x y + 2t = 0 2x + y + z t = 0 x z t = 0 ; S 3 : ; S 5x 2y z = 1 4x 7y = 3
SISTEMI LINEARI. Esercizi Esercizio. Verificare se (,, ) è soluzione del sistema x y + z = x + y z = 3. Trovare poi tutte le soluzioni del sistema. Esercizio. Scrivere un sistema lineare di 3 equazioni
DettagliFASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento
Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente
DettagliLa ricerca di similarità in banche dati
La ricerca di similarità in banche dati Uno dei problemi più comunemente affrontati con metodi bioinformatici è quello di trovare omologie di sequenza interrogando una banca dati. L idea di base è che
DettagliAllineamenti a coppie
Laboratorio di Bioinformatica I Allineamenti a coppie Dott. Sergio Marin Vargas (2014 / 2015) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Il sito http://myhits.isb-sib.ch/cgi-bin/dotlet
DettagliFASTA. Lezione del
FASTA Lezione del 10.03.2016 Omologia vs Similarità Quando si confrontano due sequenze o strutture si usano spesso indifferentemente i termini somiglianza o omologia per indicare che esiste un rapporto
DettagliLEZIONE 3. a + b + 2c + e = 1 b + d + g = 0 3b + f + 3g = 2. a b c d e f g
LEZIONE 3 3.. Matrici fortemente ridotte per righe. Nella precedente lezione abbiamo introdotto la nozione di soluzione di un sistema di equazioni lineari. In questa lezione ci poniamo il problema di descrivere
DettagliSistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara
Sistemi lineari Lorenzo Pareschi Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara http://utenti.unife.it/lorenzo.pareschi/ lorenzo.pareschi@unife.it Lorenzo Pareschi (Univ. Ferrara)
Dettagli1) Hamming bound, coset, codici equivalenti
Argomenti della Lezione ) Hamming bound, coset, codici equivalenti 2) Esercizi sui codici lineari a blocchi Osservazione () Per effettuare la decodifica a rivelazione di errore si può seguire una delle
DettagliBLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
DettagliMetodo di Quine- McCluskey
Metodo di Quine- McCluskey Maurizio Palesi Maurizio Palesi Definizioni Date due funzioni f(x,x 2,,x n ) e g(x,x 2,,x n ) si dice che f copre g (oppure g implica f) e si scrive f g se f(x,x 2,,x n )= quando
DettagliEsercizi svolti. delle matrici
Esercizi svolti. astratti. Si dica se l insieme delle coppie reali (x, y) soddisfacenti alla relazione x + y è un sottospazio vettoriale di R La risposta è sì, perchè l unica coppia reale che soddisfa
DettagliApplicazioni eliminazione di Gauss
Applicazioni eliminazione di Gauss. Premessa Nel seguito supporremo sempre di applicare il metodo di eliminazione di Gauss allo scopo di trasformare la matrice del sistema Ax = b in una matrice triangolare
DettagliCapitolo 6. La distribuzione normale
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliCapitolo 6 La distribuzione normale
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliAllineamento e similarità di sequenze
Allineamento e similarità di sequenze Allineamento di Sequenze L allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; La similarità
DettagliLa ricerca di similarità: i metodi
La ricerca di similarità: i metodi Pairwise alignment allineamenti a coppie 1. Analisi della matrice a punti (dot matrix) 2. Programmazione dinamica (dynamic programming) allineamenti locale e globale.
Dettagli2.6 Calcolo degli equilibri di Nash
92 2 Giochi non Cooperativi Per queste estensioni di giochi non finiti si possono provare risultati analoghi a quelli visti per i giochi finiti. Rimandiamo alla bibliografia per uno studio più approfondito
Dettagliq xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0;
Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p1 p6 p i >0; 6! i=1 p i =1 Sequenza di dna/proteine x con probabilita q x Probabilita dell intera sequenza n " i!1 q xi Massima verosimiglianza
Dettaglistandardizzazione dei punteggi di un test
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la
DettagliBioinformatics more basic notions
Bioinformatics more basic notions Alcune slides provengono dal materiale rilasciato da: Dr Sergio Marin Vargas - Verona Prof. Riccardo Percudari - Parma Bioinformatics Bio-inspired Computer science Gli
DettagliLEZIONE 2. ( ) a 1 x 1 + a 2 x a n x n = b, ove a j, b R sono fissati.
LEZIONE 2 2 Sistemi di equazioni lineari Definizione 2 Un equazione lineare nelle n incognite x, x 2,, x n a coefficienti reali, è un equazione della forma (2 a x + a 2 x 2 + + a n x n = b, ove a j, b
DettagliI. Foglio di esercizi su vettori linearmente dipendenti e linearmente indipendenti. , v 2 = α v 1 + β v 2 + γ v 3. α v 1 + β v 2 + γ v 3 = 0. + γ.
ESERCIZI SVOLTI DI ALGEBRA LINEARE (Sono svolti alcune degli esercizi proposti nei fogli di esercizi su vettori linearmente dipendenti e vettori linearmente indipendenti e su sistemi lineari ) I. Foglio
DettagliAppunti su Indipendenza Lineare di Vettori
Appunti su Indipendenza Lineare di Vettori Claudia Fassino a.a. Queste dispense, relative a una parte del corso di Matematica Computazionale (Laurea in Informatica), rappresentano solo un aiuto per lo
DettagliSISTEMI LINEARI MATRICI E SISTEMI 1
MATRICI E SISTEMI SISTEMI LINEARI Sistemi lineari e forma matriciale (definizioni e risoluzione). Teorema di Rouché-Capelli. Sistemi lineari parametrici. Esercizio Risolvere il sistema omogeneo la cui
DettagliProblemi, istanze, soluzioni
lgoritmi e Strutture di Dati II 2 Problemi, istanze, soluzioni Un problema specifica una relazione matematica tra dati di ingresso e dati di uscita. Una istanza di un problema è formata dai dati di un
DettagliRETI LINEARI R 3 I 3 R 2 I 4
RETI LINERI 1 Leggi di Kirchoff. Metodo delle correnti di maglia R 1 R 3 I 1 I 3 E 1 J 1 J 2 J 3 I 2 I 4 R 4 I 5 R 5 I 6 R 6 J 4 R 7 Il calcolo delle correnti e delle differenze di potenziale in un circuito
DettagliAlgoritmi e Strutture Dati (Mod. B) Algoritmi Greedy (parte I)
Algoritmi e Strutture Dati (Mod. B) Algoritmi Greedy (parte I) Algoritmi greedy Gli algoritmi per problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione
DettagliUNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche)
Docente: Matteo Re UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2013-2014 semestre I 3 Allineamento veloce (euristiche) Banche dati primarie e secondarie Esistono due categorie
Dettaglix 1 x 2 x 3 x 5 La base iniziale è B 0 = I e risulta x B 0 = , x N 0 = Iterazione 0. Calcolo dei costi ridotti. γ 0 = c N 0 (N 0 ) T c B 0 =
56 IL METODO DEL SIMPLESSO 7.4 IL METODO DEL SIMPLESSO In questo paragrafo sono riportati alcuni esercizi risolti sul metodo del simplesso. Alcuni sono risolti utilizzando la procedura di pivot per determinare,
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliProgetto Matlab N 2. Calcolo Numerico 6 CFU. Corso di Laurea in Ingegneria delle Comunicazioni 31/05/2014
Progetto Matlab N 2 Calcolo Numerico 6 CFU Corso di Laurea in Ingegneria delle Comunicazioni 31/05/2014 Procedimento 1. Scrivere una function che implementi il prodotto matrice-vettore AX con A matrice
DettagliESPONENZIALI E LOGARITMI. chiameremo logaritmica (e si legge il logaritmo in base a di c è uguale a b ).
ESPONENZIALI E LOGARITMI Data una espressione del tipo a b = c, che chiameremo notazione esponenziale (e dove a>0), stabiliamo di scriverla anche in un modo diverso: log a c = b che chiameremo logaritmica
DettagliAlgoritmi greedy. Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione
Algoritmi greedy Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione Gli algoritmi greedy sono algoritmi basati sull idea
DettagliBioinformatica. Analisi del genoma
Bioinformatica Analisi del genoma GABRIELLA TRUCCO CREMA, 5 APRILE 2017 Cosa è il genoma? Insieme delle informazioni biologiche, depositate nella sequenza di DNA, necessarie alla costruzione e mantenimento
DettagliLa codifica digitale
La codifica digitale Codifica digitale Il computer e il sistema binario Il computer elabora esclusivamente numeri. Ogni immagine, ogni suono, ogni informazione per essere compresa e rielaborata dal calcolatore
DettagliAllineamenti di sequenze: concetti e algoritmi
Allineamenti di sequenze: concetti e algoritmi 1 globine: a- b- mioglobina Precoce esempio di allineamento di sequenza: globine (1961) H.C. Watson and J.C. Kendrew, Comparison Between the Amino-Acid Sequences
DettagliFACOLTA DI INGEGNERIA INGEGNERIA INFORMATICA A.A. 2008/2009. Corso VISIONE E PERCEZIONE. Docente. Prof. FIORA PIRRI. Tutor MATIA PIZZOLI
FACOLTA DI INGEGNERIA INGEGNERIA INFORMATICA A.A. 2008/2009 Corso VISIONE E PERCEZIONE Docente Prof. FIORA PIRRI Tutor MATIA PIZZOLI MAPPA DI DISPARITA Studente Redjan Shabani (1013173) 0 Definizione di
DettagliTEORIA DEI SISTEMI SISTEMI LINEARI
TEORIA DEI SISTEMI Laurea Specialistica in Ingegneria Meccatronica Laurea Specialistica in Ingegneria Gestionale Indirizzo Gestione Industriale TEORIA DEI SISTEMI SISTEMI LINEARI Ing. Cristian Secchi Tel.
DettagliLinguaggi Regolari e Linguaggi Liberi
Linguaggi Regolari e Linguaggi Liberi Linguaggi regolari Potere espressivo degli automi Costruzione di una grammatica equivalente a un automa Grammatiche regolari Potere espressivo delle grammatiche 1
DettagliRette e piani in R 3
Rette e piani in R 3 In questa dispensa vogliamo introdurre in modo elementare rette e piani nello spazio R 3 (si faccia riferimento anche al testo Algebra Lineare di S. Lang). 1 Rette in R 3 Vogliamo
DettagliInfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche
InfoBioLab I ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche Esercizio 1 - obiettivi: Ricerca di 2 proteine in ENTREZ Salva i flat file che descrivono le 2 proteine in formato testo Importa
Dettaglia + 2b + c 3d = 0, a + c d = 0 c d
SPAZI VETTORIALI 1. Esercizi Esercizio 1. Stabilire quali dei seguenti sottoinsiemi sono sottospazi: V 1 = {(x, y, z) R 3 /x = y = z} V = {(x, y, z) R 3 /x = 4} V 3 = {(x, y, z) R 3 /z = x } V 4 = {(x,
DettagliEdit distance. v intner RIMDMDMMI wri t ers
L'allineamento Edit distance Le operazioni permesse sono: I: insert (inserimento, inserzione) D: delete (cancellazione, delezione, rimozione) R: replacement (substition, sostituzione) M: match (corrispondenza,
DettagliSintesi Sequenziale Sincrona Sintesi Comportamentale di reti Sequenziali Sincrone
Sintesi Sequenziale Sincrona Sintesi Comportamentale di reti Sequenziali Sincrone Il problema dell assegnamento degli stati versione del 9/1/03 Sintesi: Assegnamento degli stati La riduzione del numero
DettagliRicerca di omologia di sequenza
Ricerca di omologia di sequenza RICERCA DI OMOLOGIA DI SEQUENZA := Data una sequenza (query), una banca dati, un sistema per il confronto e una soglia statistica trovare le sequenze della banca più somiglianti
DettagliUn ripasso di aritmetica: Conversione dalla base 10 alla base 2
Un ripasso di aritmetica: Conversione dalla base 10 alla base 2 Dato un numero N rappresentato in base dieci, la sua rappresentazione in base due sarà del tipo: c m c m-1... c 1 c 0 (le c i sono cifre
DettagliRaccolta di esercizi di Calcolo Numerico Prof. Michela Redivo Zaglia
Raccolta di esercizi di Calcolo Numerico Prof. Michela Redivo Zaglia Nota Bene: Gli esercizi di questa raccolta sono solo degli esempi. Non sono stati svolti né verificati e servono unicamente da spunto
DettagliAppunti di matematica per le Scienze Sociali Parte 1
Appunti di matematica per le Scienze Sociali Parte 1 1 Equazioni 1.1 Definizioni preliminari 1.1.1 Monomi Si definisce monomio ogni prodotto indicato di fattori qualsiasi, cioè uguali o diseguali, numerici
DettagliUNIVERSITÀ DEGLI STUDI ROMA TRE Collegio Didattico in Ingegneria Informatica corso di Ricerca operativa 2. Esercizi sul problema dell assegnamento
UNIVERSITÀ DEGLI STUDI ROMA TRE Collegio Didattico in Ingegneria Informatica corso di Ricerca operativa Esercizi sul problema dell assegnamento Richiami di Teoria Ricordiamo che, dato un grafo G=(N,A),
DettagliMetodi iterativi per sistemi lineari
Generare una successione di vettori Metodi iterativi per sistemi lineari convergente alla soluzione del sistema Convergenza in norma Costruzione di un metodo iterativo Per una qualche norma vettoriale
DettagliApplicazioni lineari tra spazi euclidei. Cambi di base.
pplicazioni lineari tra spazi euclidei. Cambi di base. Esercizio. Data la seguente applicazione lineare f : R R : f(x, y, z) = (x z, x + y, y + z), scrivere la matrice B, rappresentativa di f rispetto
DettagliTeoria dell informazione
Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2008-09 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di
DettagliFondamenti di Informatica T-1 Modulo 2
Fondamenti di Informatica T-1 Modulo 2 1 Obiettivi di questa esercitazione 1. Passaggio dei parametri per valore/riferimento 2. Trattamento degli errori: funzioni che restituiscono anche codici di errore
DettagliIL METODO DEL SIMPLESSO
IL METODO DEL SIMPLESSO Il metodo del Simplesso 1 si applica nella risoluzione di un problema di Programmazione Lineare 2 (funzione e vincoli lineari) quando le variabili di azione o iniziali sono almeno
DettagliDerivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)
Derivazione numerica Introduzione al calcolo numerico Il calcolo della derivata di una funzione in un punto implica un processo al limite che può solo essere approssimato da un calcolatore. Supponiamo
DettagliESERCITAZIONE SUI PUNTI STAZIONARI DI FUNZIONI LIBERE E SULLE FUNZIONI OMOGENEE
ESERCITAZIONE SUI PUNTI STAZIONARI DI FUNZIONI LIBERE E SULLE FUNZIONI OMOGENEE 1 Funzioni libere I punti stazionari di una funzione libera di più variabili si ottengono risolvendo il sistema di equazioni
DettagliEsercizi di Calcolo e Biostatistica con soluzioni
1 Esercizi di Calcolo e Biostatistica con soluzioni 1. Date le funzioni f 1 (x) = x/4 1, f 2 (x) = 3 x, f 3 (x) = x 4 2x, scrivere a parole le operazioni che, dato x in modo opportuno, permettono di calcolare
DettagliPROGRAMMAZIONE DINAMICA. Prof. Reho Gabriella Olimpiadi di Informatica
PROGRAMMAZIONE DINAMICA Quando si usa P.D.? La programmazione dinamica si usa nei casi in cui esista una definizione ricorsiva del problema, ma la trasformazione diretta di tale definizione in un algoritmo
DettagliEsercitazione: 16 novembre 2009 SOLUZIONI
Esercitazione: 16 novembre 009 SOLUZIONI Esercizio 1 Scrivere [ ] equazione vettoriale, parametrica [ ] e cartesiana della retta passante 1 per il punto P = e avente direzione d =. 1 x 1 Soluzione: Equazione
DettagliAnnamaria Mazzia. Corso di Metodi Numerici per l Ingegneria dispense e altro materiale su
Soluzione di un sistema non lineare con la Regula Falsi generalizzata per la determinazione degli angoli conico di taglio ed elicoidale di taglio di una cremagliera Annamaria Mazzia Dipartimento di Metodi
DettagliMotivazione: Come si fa? Matrici simmetriche. Fattorizzazioni di matrici speciali
Motivazione: Fattorizzazioni di matrici speciali Diminuire la complessità computazionale = evitare operazioni inutili = risparmiare tempo di calcolo Diminuire l occupazione di memoria Come si fa? Si tiene
DettagliLaboratorio di Algoritmi e Strutture Dati
Laboratorio di Algoritmi e Strutture Dati Docente: Camillo Fiorentini 8 gennaio 8 Il problema è simile all esercizio 5.6 del libro di testo di algoritmi (Introduzione agli algoritmi e strutture dati, T.
DettagliConcetti fondamentali
Concetti fondamentali elemento insieme sequenza tutto si riconduce a questi insieme: esempi {,3,5,7,9} insieme dei numeri dispari positivi minori di dieci {Antonio, Beatrice, Carlo, Daria} insieme dei
Dettagli1 se k = r i. 0 altrimenti. = E ij (c)
Facoltà di Scienze Statistiche, Algebra Lineare A, G.Parmeggiani LEZIONE 5 Matrici elementari e loro inverse Si fissi m un numero naturale. Per ogni i, j m con i j siano E ij (c) (ove c è uno scalare )
DettagliLezione 15 Equilibrio economico generale
Corso di Economia Politica prof. S. Papa Lezione 15 Equilibrio economico generale e pareto ottimalità Facoltà di Economia Università di Roma La Sapienza (valutare le allocazioni) Economia del benessere
DettagliRiassumiamo le proprietà dei numeri reali da noi utilizzate nel corso di Geometria.
Capitolo 2 Campi 2.1 Introduzione Studiamo ora i campi. Essi sono una generalizzazione dell insieme R dei numeri reali con le operazioni di addizione e di moltiplicazione. Nel secondo paragrafo ricordiamo
Dettagli1 L analisi delle corrispondenze
L analisi delle corrispondenze L analisi delle corrispondenze si effettua su un campione di osservazioni su due variabili qualitative V e V 2 I dati quindi sono il numero di osservazioni tali che V = i
DettagliComunicazioni Elettriche Esercizi
Comunicazioni Elettriche Esercizi Alberto Perotti 9 giugno 008 Esercizio 1 Un processo casuale Gaussiano caratterizzato dai parametri (µ = 0, σ = 0.5) ha spettro nullo al di fuori dellintervallo f [1.5kHz,
DettagliCosa è l Informatica?
Cosa è l Informatica? Scienza degli elaboratori elettronici (Computer Science) Scienza dell informazione Scienza della rappresentazione, memorizzazione, elaborazione e trasmissione dell informazione Elaboratore
DettagliSCHEDA DIDATTICA N 7
FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA CIVILE CORSO DI IDROLOGIA PROF. PASQUALE VERSACE SCHEDA DIDATTICA N 7 LA DISTRIBUZIONE NORMALE A.A. 01-13 La distribuzione NORMALE Uno dei più importanti
DettagliElementi di Algebra e di Matematica Discreta Numeri interi, divisibilità, numerazione in base n
Elementi di Algebra e di Matematica Discreta Numeri interi, divisibilità, numerazione in base n Cristina Turrini UNIMI - 2016/2017 Cristina Turrini (UNIMI - 2016/2017) Elementi di Algebra e di Matematica
DettagliMetodi per la risoluzione di sistemi lineari
Metodi per la risoluzione di sistemi lineari 1 Sistemi di equazioni lineari 1.1 Determinante di matrici quadrate Ad ogni matrice quadrata A è associato un numero reale det(a) detto determinante della matrice
DettagliUnità aritmetica e logica
Aritmetica del calcolatore Capitolo 9 Unità aritmetica e logica n Esegue le operazioni aritmetiche e logiche n Ogni altra componente nel calcolatore serve questa unità n Gestisce gli interi n Può gestire
DettagliCOME CALCOLARE LA COMBINAZIONE DI MINIMO COSTO DEI FATTORI
COME CALCOLARE LA COMBINAZIONE DI MINIMO COSTO DEI FATTORI In questa Appendice, mostreremo come un impresa possa individuare la sua combinazione di minimo costo dei fattori produttivi attraverso il calcolo
DettagliKangourou della Matematica 2010 Coppa a squadre Kangourou Semifinale turno A Mirabilandia, 8 maggio Quesiti
Kangourou della Matematica 2010 Coppa a squadre Kangourou Semifinale turno A Mirabilandia, 8 maggio 2010 Quesiti 1. Sei cifre per due numeri Avete a disposizione le cifre 1, 3, 4, 7, 8, 9 per formare due
Dettaglipercorso 4 Estensione on line lezione 2 I fattori della produzione e le forme di mercato La produttività La produzione
Estensione on line percorso 4 I fattori della produzione e le forme di mercato lezione 2 a produzione a produttività Una volta reperiti i fattori produttivi necessari l imprenditore dovrà decidere come
DettagliAlgoritmi in C++ (seconda parte)
Algoritmi in C++ (seconda parte) Introduzione Obiettivo: imparare a risolvere problemi analitici con semplici programmi in C++. Nella prima parte abbiamo imparato: generazione di sequenze di numeri casuali
Dettagli2.2 Alberi di supporto di costo ottimo
. Alberi di supporto di costo ottimo Problemi relativi ad alberi hanno numerose applicazioni: progettazione di reti (comunicazione, teleriscaldamento,...) protocolli reti IP memorizzazione compatta di
Dettagli11. Misure con segno.
11. Misure con segno. 11.1. Misure con segno. Sia Ω un insieme non vuoto e sia A una σ-algebra in Ω. Definizione 11.1.1. (Misura con segno). Si chiama misura con segno su A ogni funzione ϕ : A R verificante
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: similarità Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizioni
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliSi consideri il sistema a coefficienti reali di m equazioni lineari in n incognite
3 Sistemi lineari 3 Generalità Si consideri il sistema a coefficienti reali di m equazioni lineari in n incognite ovvero, in forma matriciale, a x + a 2 x 2 + + a n x n = b a 2 x + a 22 x 2 + + a 2n x
DettagliMODELLI QUANTITATIVI. f x r = c
MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico
Dettagli1 Il metodo dei tagli di Gomory
Il metodo dei tagli di Gomory Esercizio Sia dato il problema min(x x ) x + x (P 0 ) x + x x, x 0, interi. Calcolare la soluzione ottima applicando il metodo dei tagli di Gomory. Risoluzione Per applicare
DettagliL errore percentuale di una misura è l errore relativo moltiplicato per 100 ed espresso in percentuale. Si indica con e p e risulta: e ( e 100)%
UNITÀ L ELBORZIONE DEI DTI IN FISIC 1. Gli errori di misura.. Errori di sensibilità, errori casuali, errori sistematici. 3. La stima dell errore. 4. La media, la semidispersione e lo scarto quadratico
DettagliCorso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione dei numeri relativi
Codice BCD Prima di passare alla rappresentazione dei numeri relativi in binario vediamo un tipo di codifica che ha una certa rilevanza in alcune applicazioni: il codice BCD (Binary Coded Decimal). È un
DettagliMetodo di Quine- McCluskey
Metodo di Quine- McCluskey Maurizio Palesi Maurizio Palesi 1 Definizioni Date due funzioni f(x 1,x 2,,x n ) e g(x 1,x 2,,x n ) si dice che f copre g (oppure g implica f) e si scrive f g se f(x 1,x 2,,x
Dettaglimatematica è il numero che indica in quante parti è stato diviso l intero è il numero che indica quante sono le parti da considerare
LE FRAZIONI Segna con X la defnizione giusta di frazione. X una frazione indica che ci sono diversi interi da dividere una frazione indica che un intero è stato diviso in parti uguali una frazione indica
DettagliCODICI CORRETTORI E RIVELATORI DI ERRORE
CODICI CORRETTORI E RIVELATORI DI ERRORE Una problematica che va affrontata quando si tratta di codificare informazioni è la gestione degli errori. Infatti, per quanto la tecnologia sia avanzata, può sempre
DettagliAlgoritmi e Strutture Dati
Algoritmi Golosi (Greedy) Maria Rita Di Berardini, Emanuela Merelli 1 1 Dipartimento di Matematica e Informatica Università di Camerino un algoritmo goloso correttezza Problema della selezione di attività
DettagliUNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI INGEGNERIA. Matlab: esempi ed esercizi
UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI INGEGNERIA Matlab: esempi ed esercizi Sommario e obiettivi Sommario Esempi di implementazioni Matlab di semplici algoritmi Analisi di codici Matlab Obiettivi
Dettagli