Come si sceglie l algoritmo di allineamento? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione?
|
|
- Adelaide Giuliano
- 7 anni fa
- Visualizzazioni
Transcript
1 Come si sceglie l algoritmo di allineamento? Domande: le due proteine hanno domini simili? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione? hanno un antenato comune?
2 La risposta determina se è opportuno procedere ad un allineamento globale o locale quale algoritmo di allineamento è opportuno utilizzare quale matrice di somiglianza è opportuno utilizzare quali punteggi si attribuiscono a omologie apertura di gaps lunghezza dei gaps,...
3 Descrizione di un generico algoritmo di allineamento Siano date due sequenze, S 1 e S 2, formate rispettivamente da N 1 e N 2 monomeri (amino acidi o basi nucleotidiche) In assenza di gaps (es: Dot plot) # confronti ~ N 1 *N 2 In presenza di gaps arbitrariamente lunghi # confronti ~ Programmazione Dinamica si assegna un punteggio # ragionevole di confronti
4 MVHLTDAEKAbbAVSCLWGKVNSDEVGGEALGRLLVVYPWTQRYFDSFGDLSSASAIMGNAK VKAHGKKVITAFNDGLNHLDSLKGTFASLSELHCDKLHVDPENFRLLGNMIVIVLGHHLG KDFTPAAQAAFQKVVAGVATALAHKYH MALWTRLRPLLALLALWPPPPARAFVNQHLCGSHLbbVEbALYLVbCbbGbbbbbERGFF YTPKARREVEGPQVGALELAGGPGAGGLEGPPQKRGIVEQCCASVCSLYQLENYCN HLTDAEKAbbAVSCLWGKVNSDEVG HLbbVEbALYLVbCbbGbbbbbERG MLPSLALLLLAAWTVRALEVPTDGNAGLLAEPQIAMFCGKLNMHMNVQNGKWESDPSGTK TCIGTKEGILQYCQEVYPELQITNVVEANQPVTIQNWCKRGRKQCKTHTHIVIPYRCLVG EFVSDALLVPDKCKFLHQERMDVCETHLHWHTVAKETCSEKSTNLHDYGMLLPCGIDKFR GVEFVCCPLAEESDSVDSADAEEDDSDVWWGGADTDYADGGEDKVVEVAEEEEVADVEEE EADDDEDVEDGDEVEEEAEEPYEEATERTTSTATTTTTTTESVEEVVRVPTTAASTPDAV DKYLETPGDENEHAHFQKAKERLEAKHRERMSQVMREWEEAERQAKNLPKADKKAVIQHF QEKVESLEQEAANERQQLVETHMARVEAMLNDRRRLALENYITALQAVPPRPHHVFNMLK KYVRAEQKDRQHTLKHFEHVRMVDPKKAAQIRSQVMTHLRVIYERMNQSLSLLYNVPAVA EEIQDEVDELLQKEQNYSDDVLANMISEPRISYGNDALMPSLTETKTTVELLPVNGEFSL DDLQPWHPFGVDSVPANTENEVEPVDARPAADRGLTTRPGSGLTNIKTEEISEVKMDAEF GHDSGFEVRHQKLVFFAEDVGSNKGAIIGLMVGGVVIATVIVITLVMLKKKQYTSIHHGV VEVDAAVTPEERHLSKMQQNGYENPTYKFFEQMQN
5 Assegnazione del punteggio Si determinano: e f 1 2 a a i j frequenza di occorrenza della coppia di amino acidi (o basi) a i a j nelle due sequenze, 1 e 2, (e=esperimento) r f 1 2 a a i j frequenza di occorrenza della coppia di amino acidi (o basi) a i a j in due sequenze, 1 e 2, non-correlate o randomizzate (r) (tenendo conto della frequenza di occorrezza di ognuno dei due elementi della coppia nelle sequenze analizzate) MATRICE di SOSTITUZIONE (odds scores) O a a i j f f e 1 a a i r 1 a a i 2 j 2 j
6 Esempio: 100 uomini 90 hanno bevuto vino durante la scorsa settimana 100 donne 20 hanno bevuto vino durante la scorsa settimana L odds (la quotazione) per un uomo che abbia bevuto vino è 9:1 L odds (la quotazione) per un donna che abbia bevuto vino è 1:4 L odds-ratio è (0.9/0.1)/0.2/0.8)= 36 Anche se gli uomini che hanno bevuto vino sono 90/20=4.5 volte più delle donne Per questo si usa il logaritmo dell odds infatti Log 1/36=- Log36/1= più vicino a 4.5 in valore assoluto
7
8 Si attribuisce un punteggio negativo all apertura di un gap W( x) g r x x : lunghezza del gap oppure W( x) g r( x 1) si noti W( x) x W(1) Calcolo del punteggio positivo per una coppia di sequenze si moltiplicano (eventi indipendenti) gli O per ogni coppia di a.a. si sommano i logo per ogni coppia
9 La Matrice di Punteggio determina il tipo di allineamento Punteggio positivo a qualsiasi associazione Piccola penalitá per l apertura di un gap, g Allineamento Globale Penalità per la lunghezza del gap, r Punteggi negativi per i mismatches Penalitá elevata per l apertura di gaps Allineamento Locale Piccola (o nulla) penalità per la lunghezza N.B. Piccoli cambiamenti nel modo di attribuire i punteggi possono trasformare un algoritmo di allineamento globale in uno di allineamento locale e viceversa
10 V E D Q K L S K C N V 10 E 10 N 10 K L 10 T R P K C 10 D 10 N 1 = n = 11 N 2 = m = 10
11 Regole per riempire la matrice di n righe e m colonne: dato un S i,j 1. si individua S max i,j = max (S k>i, l>j ) 2. si aggiunge S max i,j a tutti gli S k,l per i quali k<i e l<j Esempio i (righe) = 10 j (colonne) = 2 S i,j = S 10,2 = 0 S max i,j = max (S k>i, l>j ) = S 11,3 =10
12 V E D Q K L S K C N V 10 E 10 N 10 K L 10 T R P K C 0 10 D 10 N 1 = n = 11 N 2 = m = 10 S 11,3 =10
13 V E D Q K L S K C N V 10 E 10 0 N 0 10 K L 10 0 T 0 R 0 P 0 K C D 10 0 i = 10 j = 2 S max i,j = max (S k>i, l>j )= S 11,3 = 10
14 V E D Q K L S K C N V 20 E N K L T 10 0 R 10 0 P 10 0 K C D 10 0 i = 10 j = 2 S max i,j = max (S k>i, l>j )= S 11,3 = 10
15 V E D Q K L S K C N V E N K L T R P K C 10 D 10 0 i = 9 j = 8 S max i,j = max (S k>i, l>j )= = S 10,11 =10
16 Una volta riempita la matrice la regola per trovare il miglior allineamento è: partendo dall angolo in alto a sinistra si uniscono le celle con i punteggi più alti con la condizione se i,j sono gli indici della cella che precede e k,l quelli della cella che segue allora si deve sempre avere i<k e contemporaneamente j<l
17 V E D Q K L S g g K C N V E g N K L T R P K C D V E D Q K L S K C N V E N K L T R P K C D
18 Matrici di similaritá
19 Matrici di punteggio o Matrici di sostituzione Le matrici PAM di Margaret Dayhoff (1978) PAM : Accepted Point Mutation (pseudoacronimo) Una matrice PAM é una misura della probabilitá che una certa sostituzione sia avvenuta dopo che é trascorso un certo tempo evolutivo dato L ipotesi é quella di divergenza evolutiva: sequenze con un comune progenitore sono tanto piú diverse quanto piú tempo é trascorso da quando si sono differenziate Le matrici sono costruite sotto ipotesi di processo Markoviano: La trasformazione in un sito specifico dall a.a. a all a.a. b non dipende dalla storia precedente dalla posizione lungo la sequenza
20 Definizione di unità PAM Due sequenze S 1 e S 2 sono considerare divergere di un unità PAM se il numero di mutazioni puntuali accettate (escluse le inserzioni e le delezioni) che hanno trasformtno S 1 in S 2 sono in media una ogni 100 aminoacidi. Mutazione accettata = mutazione passata alla progenie ovvero Mutazione accettata = mutazione indifferente o favorevole Si noti che due sequenze che divergono per una unità PAM non differiscono dell 1% perchè una singola posizione può essere sottoposta a più di una mutazione accettata. La differenza tra i due concetti cresce al crescere delle unità PAM.
21 Le sequenze studiate appartengono ad organismi attualmente viventi, ovvero non si conoscono le sequenze ancestrali. Questo problema è risolto supponendo che: a) la probabilità di mutazione è identica nelle due direzioni P( aai aa j ) P( aa j aai ) b) le matrici PAM godono della proprietà di additività. Ovvero date due sequenze S i and S j il cui ancestore sia S ij allora d( SiS j ) d( SiSij) d( S jsij) dove d(i,j) è la distanza PAM tra le sequenze i e j.
22 Preparazione delle matrici di Dayhoff Stima delle sostituzioni (tra coppie di aminoacidi): 1572 cambiamenti in 72 gruppi di sequenze che siano simili almeno all 85% Sostituzioni presenti in proteine strettamente correlate (gruppi) la mutazione non ha modificato la funzione la mutazione è stata accettata dalla selezione naturale accepted point mutation: PAM
23 Esempio di allineamento Immunoglobulina domini della regione C
24 Uno dei 72 allineamenti di gruppi di sequenze strettamente correlate che hanno contribuito alla formazione dei punteggi PAM. (Adapted from Alignment 30. Atlas of Protein Sequence and Structure, Suppl 3, 1978, M.O. Dayhoff, ed. National Biomedical Research Foundation, 1979.)
25 Una matrice di mutazione, M, è costituita dalle probabilità di mutazione di un amino acido per un periodo evolutivo definito. Pr amino acido i amino acido j =M ji La matrice di mutazione PAM1 si riferisce ad un tempo evolutivo in cui in media si siano modificati l 1% degli amino acidi. Matematicamente questo corrisponde ad una matrice tale che 20 i 1 f i (1 M ii ) 0.01 Dove f f i è la frequenza dell ith amino acido nel campione in studio, il vettore ( f1, f2,..., f20) descrive la frequenza «naturale» degli a.a., per cui. 20 i 1 f i 1 Gli elementi diagonali, M ii, rappresentano la probabilità che un dato amino acido non cambi
26 ACGH ABGH DBGH DBGH ABGH ACGH ADIJ ABIJ CBIJ CBIJ ABIJ ADIJ ABIH ABGH ABIH ABIJ ABIJ ABIH ABGH Albero filogenetico ipotetico. Le quattro proteine studiate sono mostrate in alto. Gli antenati supposti sono mostrati nei nodi sotto e i cambiamenti di sequenza lungo i rami. (Adapted from Figure 78. Atlas of Protein Sequence and Structure, Suppl 3, 1978, M.O. Dayhoff, ed. National Biomedical Research Foundation, 1979.)
27 Mutabilità Calcolo della mutabilità relativa Sequenze allineate Amino acidi ADA ADB A B D Sostituzioni osservate Composizione Mutabilità relativa La mutabilità è calcolata normalizzando il numero di sostituzioni osservate al numero di occorrenze di un dato aminoacido. (adapted from Figure 81. Atlas of Protein Sequence and Structure, Suppl 3, 1978, M.O. Dayhoff, ed. National Biomedical Research Foundation, 1979.)
28 Phe Tyr 0.15/0.04 = 3.75 frequenza nel gruppo Tyr Phe 0.20/0.03 = [(Log Log6.7)/2]=7 valore in Tabella # volte a i a j * mutabilitá relativa la somma dei 20 termini è normalizzata a 1
29 Log Odds Matrix per una distanza evolutiva di 250 PAM
30 I piú mutabili I meno mutabili Asn, N, Ser, S, Thr, T, Ala,A Cys,C, Trp, W Punteggio 0 Punteggio 0 Frequenza aspettata Frequenza aspettata es: il passaggio Gly Trp si verifica raramente punteggio = -7 La scelta della PAM dipende dal tempo di divergenza evolutiva ipotizzato 1 PAM ~ 10x10 6 anni = 10 my PAM250 per allineare sequenze con circa il 14-27% di similaritá PAM120 per allineare sequenze con circa il 40% di similaritá PAM80 per allineare sequenze con circa il 50% di similaritá PAM60 per allineare sequenze con circa il 60% di similaritá
31 Matrice delle distanze: costo delle mutazioni La matrice è generata calcolando il numero minimo di cambiamenti da fare nelle basi del codone per trasformare l amino acido nella riga i nell amino acido nella colonna j. Notare che la trasformazione Met Tyr è l unica che richiede che siano modificati tutti e tre i codoni
32 Leu: UUA; UUG; CUU;CUC;CUA;CUG Min ACA; ACG; ACU;ACC;ACA;ACG Thr: ACU;ACC;ACA;ACG
33
34
35
36 Calmodulina 8 motivi quasi-ripetuti: 148/20 ~ 2x148/36 ~ 4x148/73 ~ 8 M 33 (r) r Sequenza defettiva dell Acido Glutammico, E
37 Calmodulina Tr(M r ) r Intera sequenza amino-acidica
38 pdb
A W T V A S A V R T S I A Y T V A A A V R T S I A Y T V A A A V L T S I
COME CALCOLARE IL PUNTEIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi che, però, sono le due facce di una stessa medaglia al
DettagliAlgoritmi di Allineamento
Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento
DettagliCOME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi
COME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi che, però, sono le due facce di una stessa medaglia al
Dettagliq xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0;
Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p1 p6 p i >0; 6! i=1 p i =1 Sequenza di dna/proteine x con probabilita q x Probabilita dell intera sequenza n " i!1 q xi Massima verosimiglianza
DettagliMetodo della matrice a punti
Metodo della matrice a punti proposto da Gibbs and McIntyre (1970) consente di evidenziare ripetizioni dirette o inverse nelle sequenze prevedere regioni complementari nell RNA che possano potenzialmente
DettagliPairwise Sequence Alignment BIOINFORMATICA. Corso di Laurea in Ingegneria Informatica e Biomedica. Università Magna Graecia Catanzaro
Pairwise Sequence Alignment BIOINFORMATICA Corso di Laurea in Ingegneria Informatica e Biomedica Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento Esatto di Coppie
DettagliSAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing
SAGA: sequence alignment by genetic algorithm ALESSANDRO PIETRELLI Soft Computing Bologna, 25 Maggio 2007 Multi Allineamento di Sequenze (MSAs) Cosa sono? A cosa servono? Come vengono calcolati Multi Allineamento
DettagliALLINEAMENTO DI SEQUENZE
ALLINEAMENTO DI SEQUENZE Procedura per comparare due o piu sequenze, volta a stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che massimizzino la similarita
DettagliOmologia di sequenze: allineamento e ricerca
Omologia di sequenze: allineamento e ricerca Genomi (organismi) e geni hanno un evoluzione divergente Sequenze imparentate per evoluzione divergente sono omologhe Le sequenze sono confrontabili tramite
DettagliBioinformatics more basic notions
Bioinformatics more basic notions Alcune slides provengono dal materiale rilasciato da: Dr Sergio Marin Vargas - Verona Prof. Riccardo Percudari - Parma Bioinformatics Bio-inspired Computer science Gli
DettagliAllineamenti di sequenze: concetti e algoritmi
Allineamenti di sequenze: concetti e algoritmi 1 globine: a- b- mioglobina Precoce esempio di allineamento di sequenza: globine (1961) H.C. Watson and J.C. Kendrew, Comparison Between the Amino-Acid Sequences
DettagliLe sequenze consenso
Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica
DettagliFASTA. Lezione del
FASTA Lezione del 10.03.2016 Omologia vs Similarità Quando si confrontano due sequenze o strutture si usano spesso indifferentemente i termini somiglianza o omologia per indicare che esiste un rapporto
DettagliLezione 1. Le molecole di base che costituiscono la vita
Lezione 1 Le molecole di base che costituiscono la vita Le molecole dell ereditarietà 5 3 L informazione ereditaria di tutti gli organismi viventi, con l eccezione di alcuni virus, è a carico della molecola
DettagliLezione 6. Analisi di sequenze biologiche e ricerche in database
Lezione 6 Analisi di sequenze biologiche e ricerche in database Schema della lezione Allinemento: definizioni Allineamento di due sequenze Ricerca di singola sequenza in banche dati (Alignment-based database
DettagliProgrammazione dinamica
rogrammazione dinamica Fornisce l allineamento ottimale tra due sequenze semplici variazioni dell algoritmo producono allineamenti globali o locali l allineamento calcolato dipende dalla scelta di alcuni
DettagliLezione 7. Allineamento di sequenze biologiche
Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra
DettagliQuarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST
Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Filogenesi Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Introduzione alla
DettagliProbabilità congiunta
Una vera matrice di sostituzione F K M N P Q 4 5 5 4 3 3 5 6 5 4 3 5 4 4 3 6 4 3 4 5 3 F 8 5 5 4 5 5 4 5 3 4 3 3 6 3 5 K 5 3 3 6 4 3 3 3 M 6 N P 6 Q 4 6 V Y 3 3 3 3 V 4 4 6 8 6 6 6 3 5 3 4 4 6 5 5 6 7
DettagliCorso di Bioinformatica. Docente: Dr. Antinisca DI MARCO
Corso di Bioinformatica Docente: Dr. Antinisca DI MARCO Email: antinisca.dimarco@univaq.it Analisi Filogenetica Gene Ancestrale duplicazione genica La filogenesi è lo studio delle relazioni evolutive tra
DettagliFilogenesi molecolare
Filogenesi molecolare Geni ortologhi e geni paraloghi Geni ortologhi: geni simili riscontrabili in organismi correlati tra loro. Il fenomeno della speciazione porta alla divergenza dei geni e quindi delle
DettagliDistanza di Edit. Speaker: Antinisca Di Marco Data:
Distanza di Edit Speaker: Antinisca Di Marco Data: 14-04-2016 Confronto di sequenze Il confronto tra sequenze in biologia computazionale è la base per: misurare la similarità tra le sequenze allineamento
DettagliBLAST. W = word size T = threshold X = elongation S = HSP threshold
BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query
DettagliRichiami di Algebra Lineare
Richiami di Algebra Lineare Eduardo Rossi Università degli Studi di Pavia Corso di Econometria Marzo 2012 Rossi Algebra Lineare 2012 1 / 59 Vettori Prodotto interno a : (n 1) b : (n 1) a b = a 1 b 1 +
DettagliEsercizi
Esercizi Si implementi una funzione che riceve in input una matrice NxM di float. Definito picco un numero circondato in tutte le posizioni intorno solo da numeri strettamente inferiori alla sua metà,
DettagliAlberi filogenetici. File: alberi_filogenetici.odp. Riccardo Percudani 02/03/04
Alberi filogenetici The tree of life Albero filogenetico costruito con le sequenze della subunità piccola dell RNA ribosomale. Tutte le forme viventi condividono un comune ancestore (LCA, last common ancestor
DettagliEdit distance. v intner RIMDMDMMI wri t ers
L'allineamento Edit distance Le operazioni permesse sono: I: insert (inserimento, inserzione) D: delete (cancellazione, delezione, rimozione) R: replacement (substition, sostituzione) M: match (corrispondenza,
DettagliAllineamento multiplo
Allineamento multiplo Allineamenti multipli Il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte proteine a funzione analoga. I siti funzionalmente o strutturalmente
DettagliLezione 7. Allineamento di sequenze biologiche
Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra
DettagliBiologia Molecolare. CDLM in CTF La riparazione del DNA
Biologia Molecolare CDLM in CTF 2010-2011 La riparazione del DNA I tipi di mutazione e le conseguenze Le classi di danno al DNA Meccanismi di riparazione La necessità di codificare l informazione L informazione
DettagliLezione 7. Allineamento di sequenze biologiche
Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra
DettagliInformatica e Bioinformatica A. A
Purtroppo non esiste un modo univoco per indicare un gene. Ad esempio abbiamo visto che il gene tcap a seconda del record è riportato come titin-cap protein o telethonin. Questo crea confusione e non facilita
DettagliBioinformatica ed applicazioni di bioinformatica strutturale!
Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica! Le banche dati! Programmi per estrarre ed analizzare i dati! I numeri! Cellule nell uomo! Geni nell uomo! Genoma umano Il dogma
DettagliLuigi Piroddi
Automazione industriale dispense del corso (a.a. 2008/2009) 8. Reti di Petri: rappresentazione algebrica Luigi Piroddi piroddi@elet.polimi.it Rappresentazione matriciale o algebrica E possibile analizzare
DettagliCapitolo 8 Forme quadratiche e loro applicazioni Esercizi svolti Tutorato di geometria e algebra lineare. Marco Robutti
Capitolo 8 Forme quadratiche e loro applicazioni Esercizi svolti Tutorato di geometria e algebra lineare Marco Robutti 5 Ottobre 2017 1 Introduzione Gli esercizi di questo capitolo riguardano i seguenti
DettagliMatrici. Prof. Walter Pugliese
Matrici Prof. Walter Pugliese Le matrici Una matrice è un insieme di numeri reali organizzati in righe e colonne. Se n è il numero delle righe e m e il numero delle colonne si dice che la matrice è di
DettagliPossibile applicazione
p. 1/4 Assegnamento Siano dati due insiemi A e B entrambi di cardinalità n. Ad ogni coppia (a i,b j ) A B è associato un valore d ij 0 che misura la "incompatibilità" tra a i e b j, anche interpretabile
DettagliLezione 2. Le molecole di base che costituiscono la vita
Lezione 2 Le molecole di base che costituiscono la vita Graur and Li: Capitolo 1 5 3 Le molecole dell ereditarietà L informazione ereditaria di tutti gli organismi viventi, con l eccezione di alcuni virus,
DettagliLE PROTEINE: POLIMERI COSTITUITI DA 20 TIPI DI MONOMERI, I 20 AMINOACIDI
LE PROTEINE: POLIMERI OSTITUITI DA 20 TIPI DI MONOMERI, I 20 AMINOAIDI OGNI PROTEINA PUO ESSERE FORMATA DA MOLTE DEINE O ENTINAIA DI AMINOAIDI E SI LEGANO A FORMARE UNA ATENA NON RAMIFIATA La catena di
DettagliLaboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti Esercitazione 7 2.
Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti patti@di.unito.it Esercitazione 7 1 Info&Bio Bio@Lab Allineamento di sequenze Esercitazione 7 2 1 Es2: Allineamento
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: introduzione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Una definizione
DettagliAllineamento multiplo di sequenze
Allineamento multiplo di sequenze Bioinformatica a.a. 2008/2009 Letterio Galletta Università di Pisa 22 Maggio 2009 Letterio Galletta (Università di Pisa) Allineamento multiplo di sequenze 22 Maggio 2009
DettagliAllineamento e similarità di sequenze
Allineamento e similarità di sequenze Allineamento di Sequenze L allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; La similarità
DettagliAnalisi della struttura primaria delle proteine
Analisi della struttura primaria delle proteine Strumenti on-line La maggior parte degli strumenti per l analisi della struttura primaria si trovano on-line all indirizzo www.expasy.org Ottenere la sequenza
DettagliAllineamenti a coppie
Laboratorio di Bioinformatica I Allineamenti a coppie Dott. Sergio Marin Vargas (2014 / 2015) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Il sito http://myhits.isb-sib.ch/cgi-bin/dotlet
DettagliAnalisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
DettagliLezione 6. Confronti fra sequenze: distanze, allineamenti
Lezione 6 Confronti fra sequenze: distanze, allineamenti tempo Sostituzioni nucleotidiche La distanza tra due sequenze si definisce come il numero atteso di sostituzioni nucleotidiche per sito. Se il tasso
DettagliAllineamento di sequenze proteiche
Allineamento di sequenze proteiche Sequenze proteiche - definizioni Una proteina è composta da diversi amino acidi uniti da legami peptidici. Si definisce: struttura primaria: la sequenza dei residui struttura
DettagliUNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I 1 INTRODUZIONE
Docente: Matteo Re UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2013-2014 semestre I 1 INTRODUZIONE Motivazioni dell esistenza della biologia computazionale: Biologia Computazionale
DettagliSoluzione sistemi lineari
Soluzione sistemi lineari Laboratorio di programmazione e calcolo Chimica e Tecnologie chimiche Pierluigi Amodio Dipartimento di Matematica Università di Bari Soluzione sistemi lineari p. / matrice diagonale
DettagliPreCorso di Matematica - PCM Corso M-Z
PreCorso di Matematica - PCM Corso M-Z DOCENTE: M. Auteri Outline Docente: Auteri PreCorso di Matematica 2016 2 Definizione di matrice Una matrice (di numeri reali) è una tabella di m x n numeri disposti
DettagliRichiami di Algebra Lineare
Richiami di Algebra Lineare Eduardo Rossi Università degli Studi di Pavia Corso di Econometria Marzo 2015 Rossi Algebra Lineare 2015 1 / 41 Vettori Prodotto interno a : (n 1) b : (n 1) a b = a 1 b 1 +
DettagliCONTROLLI AUTOMATICI LS Ingegneria Informatica. Analisi modale
CONTROLLI AUTOMATICI LS Ingegneria Informatica Analisi modale Prof. Claudio Melchiorri DEIS-Università di Bologna Tel. 5 9334 e-mail: claudio.melchiorri@unibo.it http://www-lar.deis.unibo.it/~cmelchiorri
DettagliLinea di 4 macchine con buffer
La soluzione del 2JSP è la generalizzazione di quella data da Aker per 2 lavori J i di m operazioni in serie da eseguire su una linea con buffer intermedi: ciascuno di lunghezza temporale t i sulla macchina
DettagliLezione 5. Cambiamenti evolutivi nelle sequenze nucleotidiche Distanze
Lezione 5 Cambiamenti evolutivi nelle sequenze nucleotidiche Distanze Graur and Li ch 3 materiale La lezione 5 ci permetterà di capire 1. come possa evolvere una sequenza di nucleotidi 2. quanto due sequenze
DettagliLezione 2. costituiscono la vita
Lezione 2 Le molecole di base che costituiscono la vita Graur Gau and Li: Capitolo o 1 Graur lectures 5 6 7 5 3 Le molecole dell ereditarietà L informazione i ereditaria i di tutti ttigli organismi iviventi,
DettagliMarkov Chains and Markov Chain Monte Carlo (MCMC)
Markov Chains and Markov Chain Monte Carlo (MCMC) Alberto Garfagnini Università degli studi di Padova December 11, 2013 Catene di Markov Discrete dato un valore x t del sistema ad un istante di tempo fissato,
DettagliRichiami di Algebra Lineare
Università di Pavia Richiami di Algebra Lineare Eduardo Rossi Vettori a : (n 1) b : (n 1) Prodotto interno a b = a 1 b 1 + a 2 b 2 +... + a n b n Modulo (lunghezza): a = a 2 1 +... + a2 n Vettori ortogonali:
DettagliUNIVERSITÀ DEGLI STUDI DI MILANO. Giorgio Valentini. Bioinformatica. A.A semestre I 1 INTRODUZIONE
Docenti: Matteo Re Giorgio Valentini UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2014-2015 semestre I 1 INTRODUZIONE Motivazioni dell esistenza della biologia computazionale:
DettagliUlteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
DettagliLinguaggio C++ 8. Matrici
2009-2010 Ingegneria Aerospaziale Prof. A. Palomba - Elementi di Informatica (E-Z) Linguaggio C++ 8 Matrici Linguaggio C++ 8 1 Array a più dimensioni. Sintassi generale : tipo nome [dimensione 1][dimensione
DettagliAnalisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
DettagliDNA E PROTEINE IL DNA E RACCHIUSO NEL NUCLEO, MENTRE LA SINTESI PROTEICA SI SVOLGE NEL CITOPLASMA: COME VIENE TRASPORTATA L INFORMAZIONE?
DNA E PROTEINE NUMEROSI DATI SUGGERISCONO CHE IL DNA SVOLGA IL SUO RUOLO GENETICO CONTROLLANDO LA SINTESI DELLE PROTEINE, IN PARTICOLARE DETERMINANDONE LA SEQUENZA IN AMINOACIDI E NECESSARIO RISPONDERE
DettagliSistemi di equazioni lineari
Sistemi di equazioni lineari a 00 x 0 + a 01 x 1 + a 02 x 2 = b 0 a 10 x 0 + a 11 x 1 + a 12 x 2 = b 1 a 20 x 0 + a 21 x 1 + a 22 x 2 = b 2 Per N equazioni N 1 j=0 a ij x j = b i i = 0, N 1 sono equivalenti
DettagliSequenze nucleotidiche del DNA definite loci costituiscono i geni. Ogni gene codifica per una specifica proteina
sintesi proteica La sintesi proteica è il processo che porta alla formazione delle proteine da sequenze del DN definite geni. Si tratta di un processo a più fasi Nelle sue linee fondamentali questo processo
DettagliLezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni:
Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni: antonella.meloni@ifc.cnr.it Sequenza A= stringa formata da N simboli, dove i simboli apparterranno ad un certo alfabeto. A
DettagliStatistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1
Statistica Capitolo 13 Test sulla Bontà di Adattamento e Tabelle di Contingenza Cap. 16-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Usare il test sulla bontà di adattamento
DettagliFonti e strumenti statistici per la comunicazione
Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto
DettagliSi noti che la matrice trasposta A ha lo stesso determinante. Questa proprietà è generale;
Ottavio Serra Matrici e determinanti In questa nota estenderemo a matrici quadrate di ordine n qualsiasi il concetto di determinante introdotto nelle scuole secondarie per matrici di ordine 2 come tecnica
DettagliALLINEAMENTO DI SEQUENZE
ALLINEAMENTO DI SEQUENZE Gli obiettivi degli algoritmi di allineamento di sequenze di acidi nucleici o proteine sono molteplici. Possiamo ricordare la ricerca di similarità nelle banche dati, la costruzione
Dettagliλ : autovalore di ĵ 2, H λ : corrispondente autospazio di ĵ 2.
6/ TEORIA GENERALE DEL MOMENTO ANGOLARE 9/ TEORIA GENERALE DEL MOMENTO ANGOLARE In un qualsiasi spazio di Hilbert H, siano ĵ x ĵ, ĵ y ĵ 2 e ĵ z ĵ 3 tre operatori autoaggiunti con il significato di componenti
DettagliRappresentazione matriciale del Gruppo puntuale di simmetria C3v (ammoniaca)
Rappresentazione matriciale del Gruppo puntuale di simmetria C3v (ammoniaca) La prima cosa da fare è scegliere una BASE. Per l ammoniaca sceglieremo gli orbitali s di valenza dell azoto e degli atomi di
DettagliLa mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione
La mappatura dei geni umani SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione Un grande impulso alla costruzione di mappe genetiche è stato dato da le tecniche della
DettagliLe L z e io i ne n 6 Co C n o f n ro r n o t n i i fra r a se s q e u q e u n e z n e z : e di d s i t s a t nz n e z, e allineamenti
Lezione 6 Confronti fra sequenze: distanze, Confronti fra sequenze: distanze, allineamenti Distanze fra sequenze Per N siti ed n differenze: grado di divergenza = n/n AATGAAAGAA 10 siti; 3 differenze ACTGGAGGAA
DettagliArchitetture aritmetiche
Architetture aritmetiche Sommatori: : Full Adder, Ripple Carry Sommatori: Carry Look-Ahead Ahead, Carry Save, Add/Subtract Moltiplicatori: Combinatori, Wallace,, Sequenziali Circuiti per aritmetica in
DettagliSottosequenza comune piu' lunga (programmazione dinamica)
piu' (programmazione Laboratorio di Programmazione II Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario piu' piu' Il problema del turista a manhattan piu' Problema
DettagliLaboratorio di Chimica Fisica. Analisi Statistica
Università degli Studi di Bari Dipartimento di Chimica 9 giugno F.Mavelli- Laboratorio Chimica Fisica - a.a. 3-4 F.Mavelli Laboratorio di Chimica Fisica a.a. 3-4 Analisi Statistica dei Dati Analisi Statistica
DettagliGARA SECONDARIA DI SECONDO GRADO INDIVIDUALE
GARA2 2019 SECONDARIA DI SECONDO GRADO INDIVIDUALE ESERCIZIO 1 La tabella che segue descrive le attività di un progetto (indicate rispettivamente con le sigle A1, A2,...), riportando per ciascuna di esse
DettagliFASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento
Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente
DettagliIntroduzione allo Scilab Parte 4: matrici; esempi.
Introduzione allo Scilab Parte 4: matrici; esempi. Felice Iavernaro Dipartimento di Matematica Università di Bari http://dm.uniba.it/ iavernaro felix@dm.uniba.it 20 Giugno 2007 Felice Iavernaro (Univ.
DettagliFigura 1: 1) Si scriva la formulazione del problema come problema di PLI (con un numero minimo di vincoli) e la matrice dei vincoli.
ESERCIZIO 1 Sia dato il grafo orientato in Figura 1. Si consideri il problema di flusso a 1 2 4 Figura 1: costo minimo su tale grafo con b 1 = 4 b 2 = 2 b = b 4 = e c 12 = 2 c 1 = 4 c 14 = 1 c 2 = 1 c
DettagliEsercizi per il corso di Algoritmi, anno accademico 2011/12
Esercizi per il corso di Algoritmi, anno accademico 2011/12 Esercizi sulla Tecnica Divide et Impera N.B. Tutti gli algoritmi vanno scritti in pseudocodice (non in Java, nè in C++, etc. ). Di tutti gli
DettagliCapitolo 3 Matrici. Marco Robutti. Facoltà di ingegneria Università degli studi di Pavia. Anno accademico
Capitolo 3 Matrici Marco Robutti Facoltà di ingegneria Università degli studi di Pavia Anno accademico 2017-2018 Tutorato di geometria e algebra lineare Definizione (Matrice) Una matrice A M R (k, n) è
DettagliAPPUNTI DI ALGEBRA LINEARE
APPUNTI DI ALGEBRA LINEARE. Definizione Si dice spazio vettoriale (sul campo dei numeri reali R) un insieme V per il quale siano definite l operazione interna di somma (che ad ogni coppia di vettori e
DettagliPROGRAMMAZIONE DINAMICA. Prof. Reho Gabriella Olimpiadi di Informatica
PROGRAMMAZIONE DINAMICA Quando si usa P.D.? La programmazione dinamica si usa nei casi in cui esista una definizione ricorsiva del problema, ma la trasformazione diretta di tale definizione in un algoritmo
DettagliSequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:
Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza
DettagliTeoria dei Grafi Elementi di base della Teoria dei Grafi
L. Pallottino, Sistemi Robotici Distribuiti - Versione del 4 Marzo 2015 42 Teoria dei Grafi Elementi di base della Teoria dei Grafi Definizione 1. Un grafo G = (V, E) è composto da un insieme finito di
Dettagli25 - Funzioni di più Variabili Introduzione
Università degli Studi di Palermo Facoltà di Economia CdS Statistica per l Analisi dei Dati Appunti del corso di Matematica 25 - Funzioni di più Variabili Introduzione Anno Accademico 2013/2014 M. Tumminello
DettagliRISOLUZIONE DI SISTEMI LINEARI
RISOLUZIONE DI SISTEMI LINEARI Algebra lineare numerica 1 La risoluzione di un sistema lineare è il nucleo principale del processo di risoluzione di circa il 70% di tutti i problemi reali Per la risoluzione
DettagliTeoria dei Giochi Prova del 2 Dicembre 2011
Cognome, Nome, email: Teoria dei Giochi Prova del 2 Dicembre 2011 Esercizio 1 Si consideri un istanza dello Stable Marriage problem con 5 uomini e 5 donne. I seguenti insiemi ordinati rappresentano le
DettagliGARA SECONDARIA DI SECONDO GRADO INDIVIDUALE
GARA2 2019 SECONDARIA DI SECONDO GRADO INDIVIDUALE ESERCIZIO 1 Premessa La tabella che segue descrive le attività di un progetto (indicate rispettivamente con le sigle A1, A2,...), riportando per ciascuna
DettagliIl valore di flusso che si ottiene è
1) Si consideri un insieme di piste da sci e di impianti di risalita. Lo si modelli con un grafo orientato che abbia archi di due tipi: tipo D (discesa e orientato nel senso della discesa) e tipo R (risalita
DettagliCatene di Markov a tempo continuo. Richiami teorici
Catene di Marov a tempo continuo Richiami teorici Pagina di 55 Data ultima revisione 2/5/ Definizione di catena di Marov a Una catena di Marov a è definita come: M(X, P(t)) t R + dove gli stati x,...,
DettagliGestione della produzione e della supply chain Logistica distributiva
Gestione della produzione e della supply chain Logistica distributiva Paolo Detti Dipartimento di Ingegneria dell Informazione e Scienze Matematiche Università di Siena Convergenza dell algoritmo Se non
DettagliCOMPITO DI RICERCA OPERATIVA APPELLO DEL 08/01/04
COMPITO DI RICERCA OPERATIVA APPELLO DEL 08/01/04 Esercizio 1 Si risolva con il metodo branch-and-bound il seguente problema di PLI max x 1 + x 4x 1 + x + x = 0 x 1 + x + x 4 = x 1, x, x, x 4 0 x 1, x,
DettagliMateriale accessorio al Power Point ALLINEAMENTI DI SEQUENZE_2008. Corso di Bioinformatica per Biotecnologie (G. Colonna).
Materiale accessorio al Power Point ALLINEAMENTI DI SEQUENZE_2008. Corso di Bioinformatica per Biotecnologie (G. Colonna). Date due o più sequenze, inizialmente potremmo volere: misurarne il grado di similarità;
Dettagli4 Autovettori e autovalori
4 Autovettori e autovalori 41 Cambiamenti di base Sia V uno spazio vettoriale tale che dim V n Si è visto in sezione 12 che uno spazio vettoriale ammette basi distinte, ma tutte con la medesima cardinalità
Dettaglin +1 determinanti (D i, i =1,...,n e det A) n! prodotti per ciascun determinante n 1 moltiplicazioni per ciascun prodotto
METODI NUMERICI (A.A. 2007-2008) Prof. F.Pitolli Appunti delle lezioni sui sistemi lineari: metodi diretti; condizionamento Metodi diretti per la soluzione di sistemi lineari Metodi diretti Sono basati
Dettagli