BLAST: Basic Local Alignment Search Tool

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "BLAST: Basic Local Alignment Search Tool"

Transcript

1 BLAST: Basic Local Alignment Search Tool 1

2 Outline della lezione di oggi BLAST Uso pratico Algoritmo Strategie Trovare proteine lontanamente legate: PSI-BLAST 2

3 Problema con gli algoritmi dinamici Gli algoritmi visti (WS, NW) sono precisi ma lenti. Servono metodi euristici: trovano soluzioni approssimate ma vicine a quella ottimale in tempi brevi. Spesso la domanda è: data una sequenza query, quali sequenze simili sono note e già presenti nei database? Tra i metodi euristici più usati per la ricerca di singole sequenze in banche dati troviamo FASTA e BLAST 3

4 BLAST BLAST (Basic Local Alignment Search Tool) permette un confronto rapido tra una sequenza query e il contenuto di un database. L'algoritmo di BLAST è: veloce, accurato, web-accessibile. 4

5 Perché usare BLAST? BLAST è fondamentale per capire la relazione di una sequenza query con altre proteine o sequenze di DNA note. I suoi utilizzi comprendono: individuare ortologhi e paraloghi scoperta di nuovi geni o proteine scoperta di varianti di geni o proteine noti lo studio delle expressed sequence tags (EST) lo studio di struttura e funzione delle proteine 5

6 Le quattro fasi di una ricerca BLAST 1. Scegli la sequenza (query) 2. Selezionare il tipo di programma BLAST 3. Selezionare il database per la ricerca 4. Scegliere i parametri opzionali Quindi fare clic su "BLAST" 6

7 7

8 Passo 1: Scelta della sequenza La sequenza può essere inserita in formato FASTA o come accession number (RefSeq) 8

9 Esempio di formato FASTA per una query BLAST 9

10 Passo 2: Scegli il programma BLAST 10

11 Passo 2: Scegli il programma BLAST blastn (nucleotide BLAST) blastp (protein BLAST) blastx (BLAST tradotto n P) tblastn (BLAST tradotto p N ) tblastx (BLAST tradotto n P P N) 11

12 Passo 3: scegliere il database nr = non ridondante (database più generale, ritorna una sequenza e diversi riferimenti in database in cui la stessa è presente) refseq = solo sequenze con codice refseq dbest = database di EST database nucleotidici dbsts = database di sequenze localizzate gss = genome sequence surveys (BAC, Yac, ecc) Altri pdb, genomi completi, solo sequenze oggetto di brevetti (pat) ecc. ecc. database di proteine 12

13 Fase 4: parametri opzionali Si può... scegliere l'organismo di ricerca attivare filtri modificare la matrice di punteggio cambiare il valore minimo di affidabilità dei risultati modificare la dimensione della parola W 13

14 Fase 4a: Selezionare i parametri di ricerca opzionali organismo Entrez! algoritmo E possibile limitare la ricerca con sintassi Entrez, come per esempio Smith[auth] 14

15 Fase 4a: parametri opzionali di blastp Soglia attesa Valore massimo di incertezza richiesto ai risultati W Dimensione della parola usata dall algoritmo di BLAST Matrice di punteggio Filtri & Maschere Esclude parti della query perché non informative (i.e. ripetute) o non 15 significative

16 Fase 4a: parametri opzionali di blastn Soglia attesa Valore massimo di incertezza richiesto ai risultati W Dimensione della parola usata dall algoritmo di BLAST Punteggio Determina il punteggio per match o mismatch Filtri & Maschere Esclude parti della query perché non informative (i.e. ripetute) o non 16 significative

17 BLAST output: parte superiore query database tassonomia programma 17 pagina 112

18 BLAST output: output grafico 18

19 BLAST output: valori in dettaglio Punteggi più alti E-value più bassi 19

20 BLAST output: confrontiamo gli allineamenti: seconda hit 20

21 BLAST output: confrontiamo gli allineamenti: ultima hit (su 100) 21

22 Outline della lezione di oggi BLAST Uso pratico Algoritmo Strategie Trovare proteine lontanamente legate: PSI-BLAST 22

23 BLAST: le basi dell allineamento di sequenze L allineamento può essere: 1) Globale (Needleman & Wunsch). Usa la programmazione dinamica per trovare i migliori allineamenti tra due sequenze. (Anche se gli allineamenti sono ottimali, la ricerca non è esaustiva). I gap sono ammessi e l intera lunghezza delle sequenze è allineata (da cui "globale"). 2) Locale (Smith & Waterman, 1980). L allineamento può riguardare solo una parte di una delle sequenze, ed è adatto alla ricerca di caratteristiche locali comuni alle sequenze (domini, siti attivi, ecc). BLAST è una approssimazione euristica per l'allineamento locale. Esamina solo una parte dello spazio di ricerca. 23

24 Come funziona una ricerca BLAST "L'idea centrale dell algoritmo di BLAST è di limitare l'attenzione a coppie di segmenti in cui si allineano parole di lunghezza w con un punteggio di almeno T. " Altschul et al. (1990) 24

25 Come funziona l algoritmo originale di BLAST: tre fasi Fase 1 Fase 1: compilare una lista di coppie di parole (di lunghezza w = 3) con un punteggio oltre la soglia T Esempio: per una query di RBP umana... FSGTWYA... Un elenco di parole (w = 3) è il seguente: FSG SGT GTW TWY WYA Cui possono corrispondere: YSG TGT ATW SWY WFA FTG SVT GSW TWF WYS Consideriamo come esempio la parola GTW 25

26 Come funziona l algoritmo originale di BLAST: tre fasi GTW > 22 allineamenti GSW > 18 con punteggio ATW > 16 > della soglia NTW > 16 (T = 11) Fase 1 GTY > 13 GNW -> 10 allineamenti GAW -> 9 con punteggio < della soglia Dunque saranno esclusi dai passi successivi 26

27 Come funziona l algoritmo originale di BLAST: tre fasi Fase 2 Fase 2: Scansione del database per le voci che corrispondono alla lista compilata (con punteggio maggiore della soglia T). E un passo veloce e relativamente semplice: i database sono indicizzati per la ricerca di parole di lunghezza W 27

28 Algoritmi basati su tabelle di hash Sequenza da indicizzare: ATGCGTAATGCGATATGTA Con una parola di lunghezza 2: AA AC 0001 AG 0010 AT ,8,13,15 CA 0100 CC 0101 CG ,11 CT 0111 GA GC ,10 GG 1010 GT ,17 TA ,14,18 TC 1101 TG ,9,16 TT 1111 L approccio basato su tabelle di hash memorizza la posizione di tutte le parole (kmer) di una data lunghezza (2 nel nostro esempio) nella sequenza da indicizzare (reference o read). La tabella di hash consente di tenere traccia della posizione di ciascuna parola nella sequenza La tabella di hash viene poi utilizzare per eseguire la scansione delle sequenza da cercare per trovare le corrispondenze (i seed) tra le 2 sequenze.

29 Come funziona l algoritmo originale di BLAST: tre fasi Fase 3 Fase 3: quando si riesce a trovare una corrispondenza (abbinamento tra una parola con punteggio > T al database), estendere l allineamento in entrambe le direzioni. Tenere traccia del punteggio (utilizzando la matrice di punteggio) Stop quando il punteggio è inferiore a una certa soglia. KENFDKARFSGTWYAMAKKDPEG 50 RBP (query) MKGLDIQKVAGTWYSLAMAASD. 44 lattoglobulina (HIT) estendere Hit! estendere 29

30 Seed-and-Extend ATGCGTAATGCGATATGTA Seed ATGCGTAATGCGATATGTA Extend Dopo aver identificato la corrispondenza con il seed l allineamento viene esteso e raffinato al resto della sequenza. Anche l algoritmo BLAST utilizza questo approccio: dopo aver identificato una corrispondenza del seed con la sequenza subject l allineamento viene raffinato utilizzando l algoritmo Smith-Waterman

31 Come funziona l algoritmo originale di BLAST: tre fasi Fase 3 Fase 3: nella versione originale di BLAST (1990) ciascun hit è esteso in entrambe le direzioni. Nella versione migliorata, dal 1997, sono necessari due hit vicini (entro una distanza A). In questo modo le estensioni avvengono meno frequentemente ma si ottiene un notevole risparmio di tempo 31

32 Come funziona l algoritmo originale di BLAST: tre fasi I parametri È possibile personalizzare i parametri di BLAST, sia per le soglie menzionate che per le dimensioni delle parole w (default 3 per le proteine e 11 per le sequenze nucleotidiche). Ecco che effetto ha la scelta di diversi valori della soglia T Parole più grandi producono meno hits, velocizzando la ricerca, a scapito della sensibilità 32

33 Come interpretare una ricerca BLAST: il valore atteso E 'importante valutare la significatività statistica dei risultati della ricerca. I punteggi seguono una distribuzione del valore estremo (EVD), piuttosto che un distribuzione normale. 33

34 probabilità Distribuzione normale x 34

35 probabilità La densità di probabilità del valore estremo (u valore caratteristico = 0 e costante di decadimento l= 1) E spostata a destra rispetto alla distribuzione normale Distribuzione normale Distribuzione del valore Estremo o di Gumbel x 35

36 Come interpretare una ricerca BLAST: il valore atteso Il valore atteso E: è il numero di allineamenti (high scoring segment pairs o HSP) con punteggio maggiore o uguale a un punteggio S che dovrebbero verificarsi per caso in quella ricerca sul database. Si può pensarlo come un indice di incertezza. Un valore E è correlato a un valore di probabilità p. L'equazione fondamentale che descrive un valore E è: Con: M N S l,k E = KMN e -ls lunghezza della query lunghezza della sequenza nel database score parametri che dipendono dallo scoring system (l) dal database usato (K) 36

37 Alcune proprietà delle equazioni E = KMN e -ls Il valore di E decresce esponenzialmente con l'aumentare S. Valori più elevati di S corrispondono a migliori allineamenti e infatti hanno E values più bassi. Ottenere un allineamento con E = 1 significa che esiste un altro allineamento con lo stesso score S che è risultato per caso. La stessa ricerca, su un database più piccolo o più grande, anche se restituisce lo stesso allineamento deve avere un valore di E diverso (ciò dipende da K) 37

38 Punteggio, dallo score grezzo (S) in bit Ci sono due tipi di punteggi: punteggi grezzi (calcolato da una particolare matrice di sostituzione) punteggi bit (punteggio normalizzato) I punteggi in bit sono paragonabili tra diverse ricerche (es. diverse matrici di sostituzione o diverse banche dati) perché sono normalizzati, adatti quindi al paragone anche se originati tramite diverse matrici di punteggio e database di dimensione diversa S = bit score = (ls - lnk) / ln2 38

39 Come interpretare BLAST: E-value e p-value Il valore atteso E è il numero di allineamenti con punteggio maggiore o uguale a un punteggio S che dovrebbero verificarsi per caso in un database di ricerca. Il p-value è un modo diverso (ma equivalente) di rappresentare la significatività di un risultato p = 1 - e -E Per valori molto piccoli E e p sono molto simili. Tuttavia tra 1 e 10 il valore di E è più chiaro (poichè riflette un numero di hits) E p E p (circa 0.1) (circa 0.05) (circa 0.001)

40 Come interpretare BLAST: panoramica 40

41 Dimensione del database Soglia T di punteggio W Dimensione della parola usata dall algoritmo di BLAST Soglia attesa Valore massimo di incertezza richiesto ai risultati Costo gap apertura ed estensione Matrice di punteggio 41

42 Parametri per il calcolo di E Query (147 AA) 42

43 In quali casi ha senso una soglia E elevata? Si supponga di eseguire una ricerca con una query corta (ad esempio 9 aminoacidi). Non ci sono residui sufficienti per accumulare un punteggio elevato (o un valore di E piccolo). Infatti, una corrispondenza di tutti e 9 i residui potrebbe produrre un punteggio di piccole dimensioni con un valore di E =100 o 200. E tuttavia, questo risultato potrebbe essere "reale" e di vostro interesse. In casi particolari, impostando il valore di cut-off per E a non si cambia il modo in cui è stata fatta la ricerca, ma si cambiano i risultati che vengono riportati 43

44 Outline della lezione di oggi BLAST Uso pratico Algoritmo Strategie Trovare proteine lontanamente legate: PSI-BLAST Hidden Markov Models 44

45 Strategie per la ricerca con BLAST Concetti generali Come valutare la significatività dei risultati Come gestire troppi risultati Come gestire troppo pochi risultati Blast e la valutazione dell omologia 45

46 A volte un vero match ha un valore di E> 1 reale match?... Provare un BLAST reciproco per confermare 46

47 A volte un valore E simile si verifica sia per un match esatto corto che per uno lungo corto, quasi identico lungo, ma solo 31% identità, valore di E simile 47 I risultati delle ricerche, ordinati per E, si valutano poi nel dettaglio!

48 Valutare se le proteine sono omologhe: Es. lipocaline: hanno bassa s.i. ma struttura 3D simile RBP4 (query) e Salivary Lipocalin from boar: Basso punteggio bit, valore E 0,40, il 21% di identità ( twilight zone"). Ma sono davvero omologhe. Prova un altra ricerca BLAST con la seconda come query, per trovare molte altre lipocaline. 48

49 Link diretto per la visualizzazione della struttura 3D 49

50 L'universo di lipocaline (proteine che trasportano piccoli ligandi idrofobici) ogni punto è una proteina retinol-binding protein apolipoprotein D odorant-binding protein 50

51 la ricerca con BLAST con salivary lipocalin [Sus scrofa] come query trova molte altre lipocaline (continua ) 51

52 la ricerca con BLAST con salivary lipocalin [Sus scrofa] come query trova molte altri lipocaline 52

53 Utilizzando la beta globina umana come una query, ecco i risultati blastp contro le proteine umane RefSeq (PAM30). Dove si trova mioglobina? E 'assente! Abbiamo bisogno di usare PSI-BLAST 53

54 Outline della lezione di oggi BLAST Uso pratico Algoritmo Strategie Trovare proteine lontanamente legate: PSI-BLAST 54

55 Due esempi di problemi che BLAST standard non può risolvere 1) Usando la beta globina umana come query contro proteine umane con RefSeq, blastp non trova la mioglobina umana. Questo perché le due proteine sono troppo distanti. PSI-BLAST presso NCBI così come i modelli nascosti di Markov possono facilmente risolvere questo problema. 2) Come possiamo cercare con paia o addirittura milioni di paia di basi come query? Molti Strumenti tipo-blast per il DNA genomico sono disponibili come PatternHunter, Megablast, Blat, e BLASTZ. 55

56 BLAST reiterato per posizione specifica: PSI-BLAST (position specific iterated) Lo scopo di PSI-BLAST è quello di cercare più in profondità nel database match alla sequenza della proteina query, utilizzando una matrice di punteggio che è adattata dinamicamente (in modo iterativo) per la ricerca in corso. 56

57 PSI-BLAST viene eseguito in cinque fasi 1) Selezionare una query di ricerca (diverse sequenze) contro un database proteico 57

58 PSI-BLAST viene eseguito in cinque fasi 1) Selezionare una query di ricerca (diverse sequenze) contro un database proteico e lanciare BLASTP 2) PSI-BLAST costruisce un allineamento di sequenze multiple a partire dagli hit migliori e crea quindi un "profilo" detto anche Matrice di calcolo posizione-specifica (PSSM, position-specific scoring matrix) Un PROFILO di lunghezza L è una matrice L X 20 (per proteine, o L X 4 per DNA) di elementi s i,j rappresentanti lo score per allineare la la lettera j alla posizione i. Un profilo può essere allineato ad una sequenza individuale esattamente allo stesso modo di una normale sequenza 58

59 Come costruire in pratica il profilo: esaminare l'output di blastp per identificare "regole empiriche di punteggio per gli aminoacidi tollerati in ogni posizione: non tutte le posizioni ammettono la stessa variabilità. Il punteggio ne terra conto R,I,K C D,E,T K,R,T N,L,Y,G 59

60 A R N D C Q E G H I L K M F P S T W Y V 1 M K In -2 riga: W V aminoacidi W A L L L L In -2 colonna: A tutti 5-2 gli -2 aa -2 dalla A W posizione alla -2 fine A (L) 3-2 della -1-2 proteina A A query per -2 PSI-BLAST S G T W Y A

61 A R N D C Q E G H I L K M F P S T W Y V 1 M K W V W A L L L L A A W A A A S G T W Y A

62 A R N D C Q E G H I L K M F P S T W Y V 1 M K W V W A L nota -2-3 che -4 dato -3 2 un L L aminoacido (come L l alanina) nella A A sequenza query, -2-2 si W possono ottenere A A diversi 2 0 punteggi per 0 il A match, -1-1 in 3 relazione S alla 0 posizione nella G sequenza query -4-4 e -2 alla T W frequenza in cui -3-2 la Y ritrovo -2-2 nell allineam A multiplo 62

63 A R N D C Q E G H I L K M F P S T W Y V 1 M K W V W A L L L Lo -2 stesso vale 2 4 anche L A per -1-1 il triptofano: A posizioni diverse W A hanno, per -2-2 lo stesso A match, punteggi A diversi 37 S G T W Y A

64 In pratica: il profilo posizione-specifico (PSSM) cattura il pattern di conservazione nell allineamento multiplo ottenuto dai migliori hits di BLASTP e lo immagazzina sottoforma di matrice di punteggi Posizioni altamente conservate ottengono punteggi alti; posizioni poco conservate ottengono punteggi bassi. Il profilo e quindi una specie di nuova query in cui ogni posizione ha un peso differenziato: questa informazione puo essere utilizzata per estendere la ricerca 64

65 PSI-BLAST viene eseguito in cinque fasi 1) Selezionare una query di ricerca (diverse sequenze) contro un database proteico e lanciare BLASTP 2) PSI-BLAST costruisce un allineamento di sequenze multiple a partire dagli hit migliori e crea quindi un "profilo" detto anche Matrice di calcolo posizione-specifica (PSSM) 3) Il PSSM (e non più la sequenza iniziale) è usato come query sul database: mi aspetto ora di trovare più sequenze sui cui ricalcolare l allineamento multiplo 4) PSI-BLAST stima la significatività statistica (valori di E) 65

66 Esempio: 2 iterazioni di PSI-BLAST (come prima, globina beta, PAM30, RefSeq): la mioglobina compare già alla seconda iterazione! Possiamo continuare con le iterazioni 66

67 PSI-BLAST viene eseguito in cinque fasi 1) Selezionare una query di ricerca (diverse sequenze) contro un database proteico 2) PSI-BLAST costruisce un allineamento di sequenze multiple e crea quindi un "profilo" detto anche Matrice di calcolo (PSSM) posizione-specifica 3) Il PSSM è usato come query sul database 4) PSI-BLAST stima la significatività statistica (valori di E) 5) Ripetere i passaggi 3 e 4 in modo iterativo, tipicamente 5 volte. Ad ogni nuova ricerca, un nuovo profilo viene utilizzato nella query. 67

68 Esempio: dopo 4 iterazioni non vengono più aggiunte sequenze per i nuovi profili 68

69 Schematicamente, questi gli step per i primi due cicli: CICLO 1 : singola query, 1 run di BLAST 69

70 CICLO 1 : singola query, 1 run di BLAST CICLO 2 : PSSM come query, più sequenze trovate 70

71 Risultati di una ricerca PSI-BLAST Iterazioni # hits # hits > soglia

72 NOTA: (come prima, globina beta, PAM30, RefSeq, Homo sapiens). Gli E-values cambiano a seconda delle interazioni, e possono migliorare drasticamente Seguiamo iterativamente l allineamento con la subunità mu 72

73 Iterazione # 1: allineamento con la subunità mu 73

74 Iterazione # 2: allineamento con la subunità mu 74

75 Iterazione # 3: allineamento con la subunità mu E non migliora più (e nemmeno il bit-score) 75

76 Iterazione # 4: allineamento con la subunità mu E non migliora più (e nemmeno il bit-score) 76

77 Iterazione # 5: allineamento con la subunità mu E non migliora più (e nemmeno il bit-score) 77

78 L'universo delle lipocaline (ogni punto è una proteina) retinol-binding protein apolipoprotein D odorant-binding protein 78

79 Le matrici di punteggio consentono di fare attenzione a caratteristiche generali o a dettagli retinol-binding protein RBP nella query 79

80 Le matrici di punteggio consentono di fare attenzione a caratteristiche generali o a dettagli PAM250 PAM30 RBP proteina proteina RBP Blosum80 Blosum45 80

81 PSI-BLAST genera matrici di punteggio più potenti delle PAM o BLOSUM proteina RBP proteina RBP 81

82 PSI-BLAST: il problema della corruzione PSI-BLAST è utile per rilevare relazioni tra le proteine deboli ma biologicamente significative. La principale fonte di falsi positivi è la falsa amplificazione di sequenze non correlate alla query. ESEMPIO: una query con un motif coiled-coil può rilevare migliaia di altre proteine con questo motivo che non sono omologhe. Una volta che anche una singola proteina spuria è inclusa in una ricerca PSI-BLAST oltre la soglia, non ne uscirà e influenzerà la iterazioni successive. 82

83 PSI-BLAST: il problema della corruzione La corruzione è definita come la presenza di almeno un falso allineamento positivo con un valore E <10-4 dopo cinque iterazioni. Tre approcci per arrestare la corruzioni: 1) applicare filtri alle regioni con composizione poco specifica 2) aggiustare il valore di E da (default) ad uno più basso, come E = ) controllare visivamente l'output di ogni iterazione. Rimuovere gli hit sospetti deselezionando la casella. 83

BLAST. W = word size T = threshold X = elongation S = HSP threshold

BLAST. W = word size T = threshold X = elongation S = HSP threshold BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query

Dettagli

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni

Dettagli

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.

Dettagli

Ricerca di omologia di sequenza

Ricerca di omologia di sequenza Ricerca di omologia di sequenza RICERCA DI OMOLOGIA DI SEQUENZA := Data una sequenza (query), una banca dati, un sistema per il confronto e una soglia statistica trovare le sequenze della banca più somiglianti

Dettagli

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente

Dettagli

Ricerche con BLAST (Laboratorio)

Ricerche con BLAST (Laboratorio) Laboratorio di Bioinformatica I Ricerche con BLAST (Laboratorio) Dott. Sergio Marin Vargas (2014 / 2015) NCBI BLAST BLAST: Basic Local Alignment Search Tool http://blast.ncbi.nlm.nih.gov/blast.cgi NCBI

Dettagli

La ricerca di similarità: i metodi

La ricerca di similarità: i metodi La ricerca di similarità: i metodi Pairwise alignment allineamenti a coppie 1. Analisi della matrice a punti (dot matrix) 2. Programmazione dinamica (dynamic programming) allineamenti locale e globale.

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche)

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche) Docente: Matteo Re UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2013-2014 semestre I 3 Allineamento veloce (euristiche) Banche dati primarie e secondarie Esistono due categorie

Dettagli

FASTA. Lezione del

FASTA. Lezione del FASTA Lezione del 10.03.2016 Omologia vs Similarità Quando si confrontano due sequenze o strutture si usano spesso indifferentemente i termini somiglianza o omologia per indicare che esiste un rapporto

Dettagli

Algoritmi di Allineamento

Algoritmi di Allineamento Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento

Dettagli

Allineamenti a coppie

Allineamenti a coppie Laboratorio di Bioinformatica I Allineamenti a coppie Dott. Sergio Marin Vargas (2014 / 2015) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Il sito http://myhits.isb-sib.ch/cgi-bin/dotlet

Dettagli

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche InfoBioLab I ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche Esercizio 1 - obiettivi: Ricerca di 2 proteine in ENTREZ Salva i flat file che descrivono le 2 proteine in formato testo Importa

Dettagli

Allineamenti Multipli di Sequenze

Allineamenti Multipli di Sequenze Allineamenti Multipli di Sequenze 1 Allineamento multiplo di sequenze: obiettivi di oggi Definire un allineamento multiplo di sequenze; com è generato; comprendere i principali metodi. Introdurre i database

Dettagli

Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini)

Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Collegatevi al sito www.ncbi.nlm.nih.gov/blast. Apparirà una pagina nella quale le versioni

Dettagli

La ricerca di similarità in banche dati

La ricerca di similarità in banche dati La ricerca di similarità in banche dati Uno dei problemi più comunemente affrontati con metodi bioinformatici è quello di trovare omologie di sequenza interrogando una banca dati. L idea di base è che

Dettagli

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato

Dettagli

Allineamenti di sequenze: concetti e algoritmi

Allineamenti di sequenze: concetti e algoritmi Allineamenti di sequenze: concetti e algoritmi 1 globine: a- b- mioglobina Precoce esempio di allineamento di sequenza: globine (1961) H.C. Watson and J.C. Kendrew, Comparison Between the Amino-Acid Sequences

Dettagli

Perché considerare la struttura 3D di una proteina

Perché considerare la struttura 3D di una proteina Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una

Dettagli

Allineamento e similarità di sequenze

Allineamento e similarità di sequenze Allineamento e similarità di sequenze Allineamento di Sequenze L allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; La similarità

Dettagli

Allineamento locale: BLAST

Allineamento locale: BLAST Allineamento locale: BLAST BLAST (Basic Local Alignment Search Tool) è il più diffuso programma di allineamento locale delle sequenze. Per vari anni il metodo FASTA (da non confondere con l omonimo formato)

Dettagli

ALLINEAMENTO DI SEQUENZE

ALLINEAMENTO DI SEQUENZE ALLINEAMENTO DI SEQUENZE Procedura per comparare due o piu sequenze, volta a stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che massimizzino la similarita

Dettagli

Introduzione alla programmazione

Introduzione alla programmazione Introduzione alla programmazione Risolvere un problema Per risolvere un problema si procede innanzitutto all individuazione Delle informazioni, dei dati noti Dei risultati desiderati Il secondo passo consiste

Dettagli

Programmazione dinamica

Programmazione dinamica Programmazione dinamica Violetta Lonati Università degli studi di Milano Dipartimento di Informatica Laboratorio di algoritmi e strutture dati Corso di laurea in Informatica Violetta Lonati Programmazione

Dettagli

Programmazione dinamica

Programmazione dinamica Programmazione dinamica Fornisce l allineamento ottimale tra due sequenze semplici variazioni dell algoritmo producono allineamenti globali o locali l allineamento calcolato dipende dalla scelta di alcuni

Dettagli

Metodi di Distanza. G.Allegrucci riproduzione vietata

Metodi di Distanza. G.Allegrucci riproduzione vietata Metodi di Distanza La misura più semplice della distanza tra due sequenze nucleotidiche è contare il numero di siti nucleotidici che differiscono tra le due sequenze Quando confrontiamo siti omologhi in

Dettagli

Omologia di sequenze: allineamento e ricerca

Omologia di sequenze: allineamento e ricerca Omologia di sequenze: allineamento e ricerca Genomi (organismi) e geni hanno un evoluzione divergente Sequenze imparentate per evoluzione divergente sono omologhe Le sequenze sono confrontabili tramite

Dettagli

q xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0;

q xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0; Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p1 p6 p i >0; 6! i=1 p i =1 Sequenza di dna/proteine x con probabilita q x Probabilita dell intera sequenza n " i!1 q xi Massima verosimiglianza

Dettagli

Laboratorio di Bioinformatica I. Parte 2. Dott. Sergio Marin Vargas (2014 / 2015)

Laboratorio di Bioinformatica I. Parte 2. Dott. Sergio Marin Vargas (2014 / 2015) Laboratorio di Bioinformatica I Banche dati Parte 2 Dott. Sergio Marin Vargas (2014 / 2015) Google Scholar https://scholar.google.it/ E un motore di ricerca di Google, specializzato nella ricerca di articoli

Dettagli

Lezione 6. Analisi di sequenze biologiche e ricerche in database

Lezione 6. Analisi di sequenze biologiche e ricerche in database Lezione 6 Analisi di sequenze biologiche e ricerche in database Schema della lezione Allinemento: definizioni Allineamento di due sequenze Ricerca di singola sequenza in banche dati (Alignment-based database

Dettagli

Lezione 7. Allineamento di sequenze biologiche

Lezione 7. Allineamento di sequenze biologiche Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra

Dettagli

Corso di Bioinformatica

Corso di Bioinformatica Corso di Bioinformatica Cortona - Novembre 2002 Metodi Computazionali per l'analisi delle sequenze Dr. Sabino Liuni Istituto di Tecnologie Biomediche- CNR Sezione di Bioinformatica e Genomica - Bari Sabino@area.ba

Dettagli

Informatica e biotecnologie II parte

Informatica e biotecnologie II parte Informatica e biotecnologie II parte Analisi di sequenze: allineamenti CGCTTCGGACGAAATCGCATCAGCATACGATCGCATGCCGGGCGGGATAAC CGAAATCGCATCAGCATACGATCGCATGC Bioinformatica La Bioinformatica è una disciplina

Dettagli

La struttura elettronica degli atomi

La struttura elettronica degli atomi 1 In unità atomiche: a 0 me 0,59A unità di lunghezza e H 7, ev a H=Hartree unità di energia L energia dell atomo di idrogeno nello stato fondamentale espresso in unità atomiche è: 4 0 me 1 e 1 E H 13,

Dettagli

Tesina di Biologia Molecolare II

Tesina di Biologia Molecolare II MELATO GIULIA 595033 Tesina di Biologia Molecolare II Mostra un albero filogenetico con la relazione tra Uomo, Topo e Ratto. Che banca dati è disponibile per quest'ultimo organismo? Descrivi alcune caratteristiche

Dettagli

ESERCITAZIONE 3. OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST

ESERCITAZIONE 3. OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST ESERCITAZIONE 3 OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST L'esercitazione prevede l'utilizzo di risorse web per effettuare ricerche di similarità con la proteina GRB2 (growth factor

Dettagli

Unità aritmetica e logica

Unità aritmetica e logica Aritmetica del calcolatore Capitolo 9 Unità aritmetica e logica n Esegue le operazioni aritmetiche e logiche n Ogni altra componente nel calcolatore serve questa unità n Gestisce gli interi n Può gestire

Dettagli

R. Cusani, F. Cuomo: Telecomunicazioni - DataLinkLayer: Gestione degli errori, Aprile 2010

R. Cusani, F. Cuomo: Telecomunicazioni - DataLinkLayer: Gestione degli errori, Aprile 2010 1 11. Data link layer: codici di rilevazione di errore, gestione degli errori La rilevazione di errore Un codice a rilevazione di errore ha lo scopo di permettere al ricevente di determinare se vi sono

Dettagli

Laboratorio di Bioinformatica I. Parte 1. Dott. Sergio Marin Vargas (2014 / 2015)

Laboratorio di Bioinformatica I. Parte 1. Dott. Sergio Marin Vargas (2014 / 2015) Laboratorio di Bioinformatica I Banche dati Parte 1 Dott. Sergio Marin Vargas (2014 / 2015) Introduzione a NCBI National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov/ NCBI Databases

Dettagli

La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione

La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione La mappatura dei geni umani SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione Un grande impulso alla costruzione di mappe genetiche è stato dato da le tecniche della

Dettagli

2.2 Alberi di supporto di costo ottimo

2.2 Alberi di supporto di costo ottimo . Alberi di supporto di costo ottimo Problemi relativi ad alberi hanno numerose applicazioni: progettazione di reti (comunicazione, teleriscaldamento,...) memorizzazione compatta di sequenze (DNA) diffusione

Dettagli

Lezione 2: Allineamento di sequenze. BLAST e CLUSTALW

Lezione 2: Allineamento di sequenze. BLAST e CLUSTALW Lezione 2: Allineamento di sequenze BLAST e CLUSTALW Allineamento di sequenze Allineamenti L avvento della genomica moderna permette di analizzare le similitudini e le differenze tra organismi a livello

Dettagli

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III) Derivazione numerica Introduzione al calcolo numerico Il calcolo della derivata di una funzione in un punto implica un processo al limite che può solo essere approssimato da un calcolatore. Supponiamo

Dettagli

Note sull implementazione in virgola fissa di filtri numerici

Note sull implementazione in virgola fissa di filtri numerici Note sull implementazione in virgola fissa di filtri numerici 4 settembre 2006 1 Introduction Nonostante al giorno d oggi i processori con aritmetica in virgola mobili siano molto comuni, esistono contesti

Dettagli

Lezione 6. Lo string matching

Lezione 6. Lo string matching Lezione 6 Lo string matching String matching Date due stringhe (sequenze di caratteri) vogliamo stabilire se sono uguali Nel caso dello string matching, due stringhe sono uguali se... sono uguali ( DNA

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

x 1 x 2 x 3 x 5 La base iniziale è B 0 = I e risulta x B 0 = , x N 0 = Iterazione 0. Calcolo dei costi ridotti. γ 0 = c N 0 (N 0 ) T c B 0 =

x 1 x 2 x 3 x 5 La base iniziale è B 0 = I e risulta x B 0 = , x N 0 = Iterazione 0. Calcolo dei costi ridotti. γ 0 = c N 0 (N 0 ) T c B 0 = 56 IL METODO DEL SIMPLESSO 7.4 IL METODO DEL SIMPLESSO In questo paragrafo sono riportati alcuni esercizi risolti sul metodo del simplesso. Alcuni sono risolti utilizzando la procedura di pivot per determinare,

Dettagli

Sviluppo di programmi

Sviluppo di programmi Sviluppo di programmi Per la costruzione di un programma conviene: 1. condurre un analisi del problema da risolvere 2. elaborare un algoritmo della soluzione rappresentato in un linguaggio adatto alla

Dettagli

Corso di Elementi di Bionformatica

Corso di Elementi di Bionformatica Corso di Elementi di Bionformatica Laurea Triennale in Informatica Il formato FASTQ per la qualità delle sequenze Anno Accademico 2015-2016 Docente del laboratorio: Raffaella Rizzi 1 La qualità delle sequenze

Dettagli

8. Sovrapposizione e confronto di strutture proteiche

8. Sovrapposizione e confronto di strutture proteiche 8. Sovrapposizione e confronto di strutture proteiche In questa esercitazione utilizzeremo il programma SwissPdbViewer (versione 4.0.1) per effettuare la sovrapposizione e il confronto di strutture proteiche.

Dettagli

Esplorazione grafica di dati multivariati. N. Del Buono

Esplorazione grafica di dati multivariati. N. Del Buono Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Filogenesi Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Introduzione alla

Dettagli

RELAZIONE di BIOLOGIA MOLECOLARE

RELAZIONE di BIOLOGIA MOLECOLARE NOME: Marini Selena MATRICOLA: 592330 RELAZIONE di BIOLOGIA MOLECOLARE CHE ORGANISMO MODELLO È DICTYOSTELIUM? CHE RISORSE BIOINFORMATICHE AGEVOLANO I RICERCATORI CHE LO STUDIANO? Dictyostelium è un genere

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Problemi, istanze, soluzioni

Problemi, istanze, soluzioni lgoritmi e Strutture di Dati II 2 Problemi, istanze, soluzioni Un problema specifica una relazione matematica tra dati di ingresso e dati di uscita. Una istanza di un problema è formata dai dati di un

Dettagli

FUNZIONI BOOLEANE. Vero Falso

FUNZIONI BOOLEANE. Vero Falso FUNZIONI BOOLEANE Le funzioni booleane prendono il nome da Boole, un matematico che introdusse un formalismo che opera su variabili (dette variabili booleane o variabili logiche o asserzioni) che possono

Dettagli

Programmazione Lineare: problema del trasporto Ing. Valerio Lacagnina

Programmazione Lineare: problema del trasporto Ing. Valerio Lacagnina Problemi di trasporto Consideriamo un problema di programmazione lineare con una struttura matematica particolare. Si può utilizzare, per risolverlo, il metodo del simplesso ma è possibile realizzare una

Dettagli

Esercitazione di Calcolo Numerico 1 22 Aprile Determinare la fattorizzazione LU della matrice a 1 1 A = 3a 2 a 2a a a 2 A =

Esercitazione di Calcolo Numerico 1 22 Aprile Determinare la fattorizzazione LU della matrice a 1 1 A = 3a 2 a 2a a a 2 A = Esercitazione di Calcolo Numerico 22 Aprile 29. Determinare la fattorizzazione LU della matrice a A = 3a 2 a 2a a a 2 ed utilizzarla per calcolare il det(a). 2. Calcolare il determinante della matrice

Dettagli

Informatica e Bioinformatica: Basi di Dati

Informatica e Bioinformatica: Basi di Dati Informatica e Bioinformatica: Date TBD Bioinformatica I costi di sequenziamento e di hardware descrescono vertiginosamente si hanno a disposizione sempre più dati e hardware sempre più potente e meno costoso...

Dettagli

Formattare il testo con gli stili

Formattare il testo con gli stili Formattare il testo con gli stili Capita spesso di dover applicare ripetutamente la stessa formattazione, o anche modificare il colore, le dimensioni e il tipo di carattere, per dare risalto a un testo.

Dettagli

ESERCITAZIONE MICROECONOMIA (CORSO B) 21-12-2009 ESEMPI DI ESERCIZI DI TEORIA DEI GIOCHI

ESERCITAZIONE MICROECONOMIA (CORSO B) 21-12-2009 ESEMPI DI ESERCIZI DI TEORIA DEI GIOCHI ESERCITZIONE MICROECONOMI (CORSO ) --009 ESEMPI DI ESERCIZI DI TEORI DEI GIOCHI Questo documento contiene alcuni esempi di esercizi di teoria dei giochi. Gli esercizi presentati non corrispondono esattamente

Dettagli

Array e Oggetti. Corso di Laurea Ingegneria Informatica Fondamenti di Informatica 1. Dispensa 12. A. Miola Dicembre 2006

Array e Oggetti. Corso di Laurea Ingegneria Informatica Fondamenti di Informatica 1. Dispensa 12. A. Miola Dicembre 2006 Corso di Laurea Ingegneria Informatica Fondamenti di Informatica 1 Dispensa 12 Array e Oggetti A. Miola Dicembre 2006 http://www.dia.uniroma3.it/~java/fondinf1/ Array e Oggetti 1 Contenuti Array paralleli

Dettagli

Biologia Molecolare Computazionale

Biologia Molecolare Computazionale Biologia Molecolare Computazionale Paolo Provero - paolo.provero@unito.it 2008-2009 Argomenti Allineamento di sequenze Ricostruzione di alberi filogenetici Gene prediction Allineamento Allineamento di

Dettagli

2. Modellazione dei casi d uso

2. Modellazione dei casi d uso 2. Modellazione dei casi d uso Andrea Polini Laboratorio di Ingegneria del Software Corso di Laurea in Informatica (Laboratorio di Ingegneria del Software) 2. Modellazione dei casi d uso 1 / 20 Sommario

Dettagli

SISTEMI OPERATIVI, RETI, INTERNET

SISTEMI OPERATIVI, RETI, INTERNET Competenze e Unità didattica formativa capitalizzabile 4.1 SISTEMI OPERATIVI, RETI, INTERNET Comprendere il significato dell'evoluzione dei sistemi operativi. Comprendere che cosa fa un sistema operativo

Dettagli

Anno 4 Matrice inversa

Anno 4 Matrice inversa Anno 4 Matrice inversa 1 Introduzione In questa lezione parleremo della matrice inversa di una matrice quadrata: definizione metodo per individuarla Al termine della lezione sarai in grado di: descrivere

Dettagli

Vai al sito: Incolla nel box vuoto la sequenza nucleotidica

Vai al sito:  Incolla nel box vuoto la sequenza nucleotidica Identificare il gene a cui appartiene la sequenza (sonda) e la sua posizione sul cromosoma. Per raggiungere l obiettivo della prima parte dell attività devi usare il software BLAT (BLAST- Like Alignment

Dettagli

Lezione 7. Allineamento di sequenze biologiche

Lezione 7. Allineamento di sequenze biologiche Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra

Dettagli

Relazione sequenza-struttura e funzione

Relazione sequenza-struttura e funzione Biotecnologie applicate alla progettazione e sviluppo di molecole biologicamente attive A.A. 2010-2011 Modulo di Biologia Strutturale Relazione sequenza-struttura e funzione Marco Nardini Dipartimento

Dettagli

A lezione sono stati presentati i seguenti passi per risolvere un problema:

A lezione sono stati presentati i seguenti passi per risolvere un problema: Calcolo delle radici di un polinomio Problema: Dati i coefficienti a,b,c di un polinomio di 2 grado della forma: ax^2 + bx + c = 0, calcolare le radici. A lezione sono stati presentati i seguenti passi

Dettagli

Appunti di informatica. Lezione 3 anno accademico Mario Verdicchio

Appunti di informatica. Lezione 3 anno accademico Mario Verdicchio Appunti di informatica Lezione 3 anno accademico 2015-2016 Mario Verdicchio Numeri binari in memoria In un calcolatore, i numeri binari sono tipicamente memorizzati in sequenze di caselle (note anche come

Dettagli

Metodi per la risoluzione di sistemi lineari

Metodi per la risoluzione di sistemi lineari Metodi per la risoluzione di sistemi lineari Sistemi di equazioni lineari. Rango di matrici Come è noto (vedi [] sez.0.8), ad ogni matrice quadrata A è associato un numero reale det(a) detto determinante

Dettagli

osservazione: 1 MCD(m,n) min(m,n) = si provano i numeri compresi tra 1 e min(m,n) conviene iniziare da min(m,n) e scendere verso 1

osservazione: 1 MCD(m,n) min(m,n) = si provano i numeri compresi tra 1 e min(m,n) conviene iniziare da min(m,n) e scendere verso 1 Esempio: Leggere due interi positivi e calcolarne il massimo comun divisore. MCD(12, 8) = 4 MCD(12, 6) = 6 MCD(12, 7) = 1 Sfruttando direttamente la definizione di MCD osservazione: 1 MCD(m,n) min(m,n)

Dettagli

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi GENOMA EVOLUZIONE CONTENUTO FUNZIONE STRUTTURA Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine Progetti genoma in centinaia di organismi Importante la sintenia tra i genomi The

Dettagli

DISPENSA ACCESS (OFFICE 2010 BETA)

DISPENSA ACCESS (OFFICE 2010 BETA) DISPENSA ACCESS (OFFICE 2010 BETA) 2. LE RELAZIONI. Una relazione può essere definita come un legame tra due tabelle basato sul valore di uno o più campi di ciascuna delle due tabelle. Di solito i campi

Dettagli

UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI INGEGNERIA. Matlab: esempi ed esercizi

UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI INGEGNERIA. Matlab: esempi ed esercizi UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI INGEGNERIA Matlab: esempi ed esercizi Sommario e obiettivi Sommario Esempi di implementazioni Matlab di semplici algoritmi Analisi di codici Matlab Obiettivi

Dettagli

CURRICOLO DI ISTITUTO

CURRICOLO DI ISTITUTO ISTITUTO COMPRENSIVO G.PERLSC Ferrara CURRICOLO DI ISTITUTO NUCLEO TEMTICO Il numero CONOSCENZE BILIT S C U O L P R I M R I classe 1^ L alunno conosce: i numeri naturali, nei loro aspetti cardinali e ordinali,

Dettagli

Programmazione Matematica: VI Estensioni dell algoritmo del Simplesso

Programmazione Matematica: VI Estensioni dell algoritmo del Simplesso Programmazione Matematica: VI Estensioni dell algoritmo del Simplesso Daniele Vigo D.E.I.S. Università di Bologna dvigo@deis.unibo.it rev. 1.0 Aprile 2004 Algoritmo del Simplesso L algoritmo del Simplesso

Dettagli

SISTEMI LINEARI. x y + 2t = 0 2x + y + z t = 0 x z t = 0 ; S 3 : ; S 5x 2y z = 1 4x 7y = 3

SISTEMI LINEARI. x y + 2t = 0 2x + y + z t = 0 x z t = 0 ; S 3 : ; S 5x 2y z = 1 4x 7y = 3 SISTEMI LINEARI. Esercizi Esercizio. Verificare se (,, ) è soluzione del sistema x y + z = x + y z = 3. Trovare poi tutte le soluzioni del sistema. Esercizio. Scrivere un sistema lineare di 3 equazioni

Dettagli

La codifica digitale

La codifica digitale La codifica digitale Codifica digitale Il computer e il sistema binario Il computer elabora esclusivamente numeri. Ogni immagine, ogni suono, ogni informazione per essere compresa e rielaborata dal calcolatore

Dettagli

Uso di BLAST. Premessa

Uso di BLAST. Premessa Uso di BLAST Premessa Una delle applicazioni più semplici ed utilizzate della bioinformatica è quello di comparare 2 o più sequenze tra di loro, per ricavare delle informazioni sulla possibile funzione,

Dettagli

Esercizi Capitolo 7 - Hash

Esercizi Capitolo 7 - Hash Esercizi Capitolo 7 - Hash Alberto Montresor 19 Agosto, 2014 Alcuni degli esercizi che seguono sono associati alle rispettive soluzioni. Se il vostro lettore PDF lo consente, è possibile saltare alle rispettive

Dettagli

Analisi Numerica. Debora Botturi ALTAIR. Debora Botturi. Laboratorio di Sistemi e Segnali

Analisi Numerica. Debora Botturi ALTAIR.  Debora Botturi. Laboratorio di Sistemi e Segnali Analisi Numerica ALTAIR http://metropolis.sci.univr.it Argomenti Argomenti Argomenti Rappresentazione di sistemi con variabili di stato; Tecniche di integrazione numerica Obiettivo: risolvere sistemi di

Dettagli

Abilità Informatiche

Abilità Informatiche Abilità Informatiche 2 Indice Excel: cartelle di lavoro, fogli e celle Aspetto dei dati Formule Riferimenti Funzioni Filtri Grafici 3 Cartelle di lavoro I file creati con Excel sono denominati cartelle

Dettagli

Esercizi per il corso di. Logistica I. a.a Daniela Favaretto. Dipartimento di Matematica Applicata Università Ca Foscari di Venezia

Esercizi per il corso di. Logistica I. a.a Daniela Favaretto. Dipartimento di Matematica Applicata Università Ca Foscari di Venezia sercizi per il corso di Logistica I a.a. - aniela avaretto ipartimento di Matematica pplicata Università a oscari di Venezia sercizio Individuare un albero di supporto di lunghezza minima (SST) sul seguente

Dettagli

Esplorazione grafica di dati multivariati. N. Del Buono

Esplorazione grafica di dati multivariati. N. Del Buono Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)

Dettagli

Fondamenti di Chimica Farmaceutica. La scoperta dei farmaci

Fondamenti di Chimica Farmaceutica. La scoperta dei farmaci Fondamenti di Chimica Farmaceutica La scoperta dei farmaci La scoperta di un farmaco è un processo che ha lo scopo di individuare un composto terapeuticamente utile per curare una malattia. Il punto di

Dettagli

la edit distance tra X e Y è la distanza relativa all allineamento (o agli allineamenti) che minimizza tale distanza.

la edit distance tra X e Y è la distanza relativa all allineamento (o agli allineamenti) che minimizza tale distanza. Algoritmica 14/15 EDIT DISTANCE Il problema della edit distance (distanza di edizione, in una versione in italiano scarsamente usata) è alla base dei problemi di confronto fra sequenze perché il meccanismo

Dettagli

Allineamenti multipli

Allineamenti multipli Allineamenti multipli Allineamenti multipli Finora ci siamo occupati di allineamenti a coppie (pairwise), ma il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte

Dettagli

Gestione della produzione e della supply chain Logistica distributiva

Gestione della produzione e della supply chain Logistica distributiva Gestione della produzione e della supply chain Logistica distributiva Paolo Detti Dipartimento di Ingegneria dell Informazione e Scienze Matematiche Università di Siena Convergenza dell algoritmo Se non

Dettagli

Cosa si intende con stato

Cosa si intende con stato Il concetto di stato Cosa si intende con stato I una particolare configurazione delle informazioni di una macchina, che in qualche modo memorizza le condizioni in cui si trova, e che cambia nel tempo passando

Dettagli

Ordinamento per inserzione e per fusione

Ordinamento per inserzione e per fusione Ordinamento per inserzione e per fusione Alessio Orlandi 15 marzo 2010 Fusione: problema Problema Siano A e B due array di n A e n B interi rispettivamente. Si supponga che A e B siano ordinati in modo

Dettagli

io e la mia calcolatrice

io e la mia calcolatrice io e la mia calcolatrice Si può usare la calcolatrice? Ma come si fa senza calcolatrice? È troppo difficile! Ma si può fare anche senza, non serve poi così tanto! Come faccio? Ho dimenticato la calcolatrice!

Dettagli

Corso di Calcolo Numerico

Corso di Calcolo Numerico Corso di Calcolo Numerico Dott.ssa M.C. De Bonis Università degli Studi della Basilicata, Potenza Facoltà di Ingegneria Corso di Laurea in Ingegneria Meccanica Risoluzione di Equazioni Algebriche Le equazioni

Dettagli

3. Confronto tra due sequenze

3. Confronto tra due sequenze 3. Confronto tra due sequenze Esercizio 1: uso di DotLet Il programma DotLet è accessibile dal sito http://myhits.isb-sib.ch/cgi-bin/dotlet, dove può essere utilizzato attraverso un interfaccia utente

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: similarità Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizioni

Dettagli

Informatica, Algoritmi, Linguaggi

Informatica, Algoritmi, Linguaggi Elementi di Informatica e Applicazioni Numeriche T Informatica, Algoritmi, Linguaggi Cos'è l'informatica? Che cos'è l'informatica? Cos'è l'informatica? Che cos'è l'informatica? Dell'informatica possiamo

Dettagli

Il Concetto Intuitivo di Calcolatore. Esercizio. I Problemi e la loro Soluzione. (esempio)

Il Concetto Intuitivo di Calcolatore. Esercizio. I Problemi e la loro Soluzione. (esempio) Il Concetto Intuitivo di Calcolatore Elementi di Informatica e Programmazione Ingegneria Gestionale Università degli Studi di Brescia Docente: Prof. Alfonso Gerevini Variabile di uscita Classe di domande

Dettagli

La chimica della vita

La chimica della vita La chimica della vita Ogni organismo vivente è una macchina sofisticata, risultato di un complesso insieme di reazioni chimiche. La costruzione e il funzionamento di questa macchina si devono all'esistenza

Dettagli

Insert > Object > Chart

Insert > Object > Chart Grafici Calc mette a disposizione un Wizard per creare diagrammi o grafici dai dati del foglio di calcolo (Insert > Object > Chart oppure icona in standard toolbar) Dopo che il grafico è stato creato come

Dettagli