A W T V A S A V R T S I A Y T V A A A V R T S I A Y T V A A A V L T S I
|
|
- Artemisia Bernadetta Masini
- 7 anni fa
- Visualizzazioni
Transcript
1 COME CALCOLARE IL PUNTEIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi che, però, sono le due facce di una stessa medaglia al lato pratico. 1) edit-distance o distanza di Levenshtein: in questo caso il punteggio dell allineamento è calcolato basandosi sul minimo numero di sostituzioni, inserzioni e delezioni che si devono fare per passare dalla sequenza A alla sequenza B (concetto dell evoluzione). Ad esempio ai match si attribuisce un valore di 0 ed ai mismatch un valore positivo tipo 1. 2) Punteggio di similarità: il punteggio dell allineamento è frutto del calcolo della similarità tra le due sequenze allineate in questione. Ovvero si deve trovare l allineamento con il punteggio più alto. Ai match si attribuisce un valore positivo. Processo addittivo. Nella maggior parte dei casi le due quantità sono correlate ma ci sono delle differenze concettuali. L edit-distance è adatta nel caso degli allineamenti globali. Per l editdistance deve valere la disuguaglianza triangolare. Se ho x, y e z e l evento di mutazione da x a y ha un costo > dell evento x->z + z->y allora ogni volta che devo sostituire x con y devo effettuare due sostituzioni prima con z e poi con y perché al fine del punteggio finale costano meno. L editdistance, infatti, prevede che si devono minimizzare i costi di eventi di mutazioni per passare da una sequenza all altra. Prevale il concetto che l evoluzione deve risparmiare. Specie A Specie B Specie C A W T V A S A V R T S I A Y T V A A A V R T S I A Y T V A A A V L T S I Edit-distance Da A si passa a B (1 mutazione) si passa a C (una nuova mutazione). Quindi da A a C ci sono state due mutazioni (edit-distance = 2). Ovvero per passare da A a C non si passa direttamente ma si passa attraverso lo stato intermedio di B poiché B è meno mutata rispetto ad A di quanto non lo sia C (A->B->C percorso = 2) e quindi non è possibile pensare un rapporto evolutivo che prevede di partire da A poi si arriva a C e da C si arriva a B (A->C->B percorso = 3) devo minimizzare il percorso!!!! Similarità A e B hanno 11 AA in comune A e C ne hanno 10 quindi il percorso anche in questo caso sarà A->B->C devo massimizzare il percorso (A->B = 11 A->C sarebbe 10. Preferisco passare prima attraverso B 1
2 EDIT-DISTANCE Problema di base: misurare la differenza o distanza tra due sequenze Trasformare una sequenza in un altra per mezzo di una serie di operazioni di editing su singoli caratteri Operazioni di editing: inserzione, delezione, sostituzione, match (non operazione) Edit distance: è definita come il numero minimo di operazioni di editing (inserzione, delezione e sostituzione) necessarie per trasformare la prima sequenza nella seconda RIMDMDMMI v intner wri t ers Edit distance: indica gli eventi di mutazione che hanno differenziato due sequenze (Processo) Allineamento: indica la relazione che intercorre tra due sequenze (Prodotto) SIMILARITA Date due sequenze A e B, costituite ognuna da una serie di residui, rispettivamente (a 1,a 2,a 3,..., a i ) e (b 1,b 2,b 3,..., b i ), il punteggio (score) di un qualsiasi allineamento tra tutti quelli possibili tra le due sequenze può essere calcolato con la formula sottostante. Lo score totale dell'allineamento è dato dalla somma degli scores relativi alle singole coppie di residui appaiati s (a i,, b i ) per tutti i valori di i compresi tra 1 e la lunghezza (L) dell'allineamento, a cui deve essere sottratta la somma delle penalità dovute ai gap; quindi per ciascuno dei gap deve essere calcolata una penalitaγper I'apertura del gap più una penalitaδper ogni sua singola estensione. Pur non essendo I'unico modo possibile di assegnare uno score di similarità il criterio riportato sopra è utilizzato dai principali programmi di allineamento. II migliore allineamento tra tutti quelli possibili tra due sequenze è quello che produce il massimo score, per cui generalmente si adotta lo score del migliore allineamento come score di similarità delle due sequenze. sequenza 1 M - N A L S D R T sequenza 2 M S D R T T E T punteggio = -5 2
3 ALLINEAMENTO A PARTIRE DA UNA MATRICE Congiungendo con una linea continua le due estremità il alto a sinistra e in basso a destra possono essere rappresentati diversi percorsi, cui corrispondono altrettanti allineamenti possibili. L A M I A S E Q U E N Z A S I A L L I N E A S E M P R E P E R C H E Q P T C L A M I A S I T D P R E P K N Costruendo delle matrici di similarità LAMIASEQUENZAALLINEASEMPREPERCHE capaci di assegnare valori numerici ad ogni possibile accoppiamento amminoacidico e sviluppando algoritmi capaci QPTCLAMIASITD PREPKN di identificare i percorsi con gli score LAMIASEQUENZ -AALLINEASEMPREPERCHE più alti è possibile trovare l allineamento ottimale di due sequenze. QPTCLAMIASITDPREPKN Le matrici di similarità A differenza degli acidi nucleici in cui gli appaiamenti tra basi complementari hanno tutti lo stesso valore di tipo tutto o niente: appaiamento o non appaiamento nel caso delle proteine abbiamo 20 amminoacidi e le singole sostituzioni amminoacidiche non hanno lo stesso peso. E intuitivo capire, per esempio che la sostituzione di una serina (S) con una treonina (T) oppure di un acido glutammico (E) con un acido aspartico (D) sono ben tollerate dalle proteine perché i corrispondenti amminoacidi sono molto simili tra loro. Su questi presupposti sono state costruite delle matrici di similarità costituite da tabelle in cui a ciascun tipo di sostituzione amminoacidica è assegnato un valore che ne indica il grado di similarità Sebbene queste matrici possano essere basate sulle proprietà chimico-fisiche dei singoli amminoacidi, le matrici più usate sono state sviluppate con metodi statistici che indicano la frequenza con cui un amminoacido si sostituisce ad un altro in famiglie di proteine omologhe. Allineando famiglie di proteine omologhe, infatti, è possibile calcolare la frequenza con cui un certo amminoacido viene sostituito con un altro, per esempio A V calcolato come numero di allineamenti A-V diviso il numero di sequenze allineate e si indica come f A V. Analogamente si calcolano la frequenza complessiva di A e di V, come f A e f V. Infine, da questi valori di frequenze si calcolano i valori delle matrici come log (f A V /(f A x f V ) ) Il prodotto delle frequenze indica la probabilità che l allineamento tra V e A avvenga casualmente (l atteso per eventi indipendenti) mentre il logaritmo per avere quantità trattabili (numeri con molti decimali) 3
4 Probabilità di AA non correlati (modello random) per tutto l allineamento lo score si formalizza come segue: P ( a, b R) = C( a, = q ai bj i j Nel caso invece di Probabilità di AA correlati (modello match) ovvero dovuti all osservazione che a e b in realtà sono AA che derivano da uno stesso antenato c sono cioè evolutivamente correlati il punteggio P ( a, b M ) = M ( a, pai, bi i Il rapporto di queste entità o likelihoods è noto come come odds ratio ed è il rapporto di un evento osservato con quello atteso: = M ( a, C( a, Per rendere trattabile queste quantità e non perdere decimali nelle moltiplicazioni da effettuare si trasformano in quantità additive con il logaritmo (log odds ratio): s( a, = log( q p ai, bi ai p bi ) q = S i q p ai = i ai,bi p bi s( a, Le matrici PAM M. Dayhoff (1978) Il problema fondamentale da affrontare per costruire una matrice di similarità è quello di convenire su una famiglia di proteine omologhe sulle quali basare i calcoli della matrice. Le matrici PAM ( Point accepted mutation) sono costruite su sequenze omologhe che presentano solo l 1% di mutazioni accettate, dove per accettate si intende mutazioni che non alterano la funzione della proteina. Due sequenze sono dette a 1 PAM di distanza se per convertirle l una nell altra si è verificata, in media, una mutazione ogni 100 amminoacidi. Da questi dati vengono inferiti tutti gli altri. Sapendo che la probabilità di due eventi indipendenti è uguale al prodotto delle probabilità possiamo ricavarci valori corrispondenti a proteine molto più divergenti moltiplicando i valori tra loro. Per esempio per ricavarci i valori PAM 2, corrispondenti a due proteine con 2 amminoacidi diversi/100 amminoacidi moltiplichiamo tra loro i valori PAM1 x PAM1. Naturalmente man mano che le sequenze divergono aumenta la probabilità che singole mutazioni revertano da cui deriva che i valori non coincidono più; per esempio una matrice PAM 80 non identifica proteine che divergono per l 80% dei loro residui ma solo del 50%. Per la PAM 250 in cui sono stati calcolati 250 passi evolutivi, ad esempio, il risultato è che le sequenze mantengono ancora un 20% di identità. 4
5 Calcolo di matrici PAM Basato su 1572 mutazioni in 71 gruppi di sequenze simili almeno all 85% per evitare più di una mutazione nella stessa posizione Le mutazioni non alterano significativamente la funzione delle proteine (mutazioni accettate) Le sequenze simili vengono organizzate in alberi filogenetici dai quali vengono desunte le mutazioni Calcolo di matrici PAM La comprensione delle matrici PAM è complicata dal fatto che con il termine PAM si possono intendere due cose diverse: 1) le matrici PAM di probabilità di sostituzione, 2) le matrici PAM di punteggi (scoring matrix) come la PAM 240, che sono utilizzate dai programmi di allineamento. Queste ultime sono calcolate a partire dalle matrici di probabilità, applicando la seguente formula: dove s (a, è il punteggio (score) da attribute all'appaiamento tra i due aminoacidi a e b, mentre M (a, e C (a, sono rispettivamente la probabilità di sostituzione espressa nella matrice PAM di cui al punto 1) e la probabilità di appaiamento casuale dei due amminoacidi. 5
6 Calcolo di matrici PAM La probabilità M (a, di sostituzione dell'aminoacido a in amminoacido b è calcolata a partire dalla matrice di probabilità PAM 1 ed equivale alla probabilità che, a una definita distanza PAM, i due amminoacidi siano correlati filogeneticamente, cioè siano omologhi. La probabilità di omologia definita in M(a, è divisa per la probabilità C (a, di trovare casualmente I'appaiamento degli stessi amminoacidi, calcolata in base alla frequenza media di ogni amminoacido, assumendo che tutti gli amminoacidi si possano appaiare senza alcuna preferenza. Per esempio, I'appaiamento tra due amminoacidi con frequenze di 0,1 e 0,05 avverrà con una probabilità di 0,005 dovuta al caso. Procedendo sistematicamente per tutti i valori della matrice, sono calcolati i rapporti di probabilità (definiti odds) che in pratica rappresentano quante volte la probabilità di omologia sia maggiore della probabilità casuale. Calcolo di matrici PAM I rapporti di probabilità calcolati sono convertiti nei loro logaritmi (log odds) in modo che nel calcolo globale del punteggio di un allineamento possano essere sommati piuttosto che moltiplicati tra loro, rendendo piu semplici i calcoli. Valori pari a 0 significano che la probabilità di omologia è uguale alla probabilità di appaiamento casuale, mentre valori positivi e negativi indicano rispettivamente una maggiore o minore probabilità di omologia o di appaiamento casuale. eneralmente i log odds sono moltiplicati per una costante e arrotondati a numero intero per costituire le matrici PAM comunemente usate dai programmi di allineamento. Più le sequenze sono distanti e più le PAM che devono essere usate avranno un numero alto. 6
7 Matrice BLOSUM (Henikoff & Henikoff, 1992) Blocks Amino Acid Substitution Matrices = BLOSUM Basata sulle sostituzioni amminoacidiche osservate in ~2000 blocchi conservati di sequenze. Questi blocchi sono stati estratti da una banca dati di 500 famiglie di proteine Sono contati gli scambi amminoacidici osservati in ciascuna colonna 7
8 Calcolo di matrici BLOSUM Il calcolo della matrice è simile a quello delle PAM ma il termine M(a, è relativo alla probabilità di sostituzione negli allineamenti delle famiglie proteiche del database BLOCKS. Il database BLOCKS ha allineamenti di sequenze che sono simili tra loro per una data soglia P che varia in genere da 35% a 95% di identità. Una famiglia di BLOCKS 50 ha sequenze allineate con >= 50% identità tra loro. 8
9 DIFFERENZE TRA PAM E BLOSUM 1) PAM minori servono per allineare sequenze strettamente correlate PAM maggiori servono per allineare sequenze tra loro distanti viceversa per le BLOSUM 2) Troppo poche sequenze utilizzate per ricavare la matrice di Dayhoff e propagazione dell errore dalla PAM1 alla PAM250 3) Per le matrici BLOSUM non si fa alcuna assunzione di omologia visto che derivano da blocchi conservati di sequenza. È una osservazione diretta 4) Le matrici PAM tendono a dare un peso maggiore alle sostituzioni aminoacidiche che derivano dalla mutazione di una singola base (tirosina/fenilalanina) penalizzando quelle più complesse. 5) Le matrici BLOSUM per tali ragione sono forse più adatte per la valutazione degli allineamenti T C A T TTT Phe (F) TTC " TTA Leu (L) TT " TCT Ser (S) TCC " TCA " TC " TAT Tyr (Y) TAC TAA Ter TA Ter TT Cys (C) TC TA Ter T Trp (W) Il codice genetico C CTT Leu (L) CTC " CTA " CT " CCT Pro (P) CCC " CCA " CC " CAT His (H) CAC " CAA ln (Q) CA " CT Arg (R) CC " CA " C " A ATT Ile (I) ATC " ATA " AT Met (M) ACT Thr (T) ACC " ACA " AC " AAT Asn (N) AAC " AAA Lys (K) AA " AT Ser (S) AC " AA Arg (R) A " TT Val (V) TC " TA " T " CT Ala (A) CC " CA " C " AT Asp (D) AC " AA lu (E) A " T ly () C " A " " DIFFERENZE TRA PAM E BLOSUM PAM è basato su un modello evolutivo BLOSUM è basato su famiglie proteiche. PAM è basato su allineamento globale. BLOSUM è basato su allineamento locale. 9
COME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi
COME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi che, però, sono le due facce di una stessa medaglia al
DettagliMetodo della matrice a punti
Metodo della matrice a punti proposto da Gibbs and McIntyre (1970) consente di evidenziare ripetizioni dirette o inverse nelle sequenze prevedere regioni complementari nell RNA che possano potenzialmente
DettagliAlgoritmi di Allineamento
Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento
DettagliLe sequenze consenso
Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica
DettagliCome si sceglie l algoritmo di allineamento? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione?
Come si sceglie l algoritmo di allineamento? Domande: le due proteine hanno domini simili? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione? hanno un antenato
DettagliSAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing
SAGA: sequence alignment by genetic algorithm ALESSANDRO PIETRELLI Soft Computing Bologna, 25 Maggio 2007 Multi Allineamento di Sequenze (MSAs) Cosa sono? A cosa servono? Come vengono calcolati Multi Allineamento
Dettagliq xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0;
Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p1 p6 p i >0; 6! i=1 p i =1 Sequenza di dna/proteine x con probabilita q x Probabilita dell intera sequenza n " i!1 q xi Massima verosimiglianza
DettagliALLINEAMENTO DI SEQUENZE
ALLINEAMENTO DI SEQUENZE Procedura per comparare due o piu sequenze, volta a stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che massimizzino la similarita
DettagliLezione 6. Lo string matching
Lezione 6 Lo string matching String matching Date due stringhe (sequenze di caratteri) vogliamo stabilire se sono uguali Nel caso dello string matching, due stringhe sono uguali se... sono uguali ( DNA
DettagliTRADUZIONE. 2. Transfer (legato agli aminoacidi) 3. Ribosomale (associato a proteine nei ribosomi)
enhancer promotore regione trascritta TATA trascrizione 5 3 splicing mrna 5 3 traduzione Proteina NH2 COOH Funzione biologica TRADUZIONE I tre ruoli svolti dall RNA: 1. Messaggero 2. Transfer (legato agli
DettagliQuarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST
Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni
DettagliBLAST. W = word size T = threshold X = elongation S = HSP threshold
BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query
DettagliBiologia Molecolare. CDLM in CTF La riparazione del DNA
Biologia Molecolare CDLM in CTF 2010-2011 La riparazione del DNA I tipi di mutazione e le conseguenze Le classi di danno al DNA Meccanismi di riparazione La necessità di codificare l informazione L informazione
DettagliPairwise Sequence Alignment BIOINFORMATICA. Corso di Laurea in Ingegneria Informatica e Biomedica. Università Magna Graecia Catanzaro
Pairwise Sequence Alignment BIOINFORMATICA Corso di Laurea in Ingegneria Informatica e Biomedica Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento Esatto di Coppie
DettagliBioinformatica ed applicazioni di bioinformatica strutturale!
Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica! Le banche dati! Programmi per estrarre ed analizzare i dati! I numeri! Cellule nell uomo! Geni nell uomo! Genoma umano Il dogma
DettagliBioinformatics more basic notions
Bioinformatics more basic notions Alcune slides provengono dal materiale rilasciato da: Dr Sergio Marin Vargas - Verona Prof. Riccardo Percudari - Parma Bioinformatics Bio-inspired Computer science Gli
DettagliEdit distance. v intner RIMDMDMMI wri t ers
L'allineamento Edit distance Le operazioni permesse sono: I: insert (inserimento, inserzione) D: delete (cancellazione, delezione, rimozione) R: replacement (substition, sostituzione) M: match (corrispondenza,
DettagliAnalisi della struttura primaria delle proteine
Analisi della struttura primaria delle proteine Strumenti on-line La maggior parte degli strumenti per l analisi della struttura primaria si trovano on-line all indirizzo www.expasy.org Ottenere la sequenza
DettagliSequenze nucleotidiche del DNA definite loci costituiscono i geni. Ogni gene codifica per una specifica proteina
sintesi proteica La sintesi proteica è il processo che porta alla formazione delle proteine da sequenze del DN definite geni. Si tratta di un processo a più fasi Nelle sue linee fondamentali questo processo
DettagliLezione 6. Confronti fra sequenze: distanze, allineamenti
Lezione 6 Confronti fra sequenze: distanze, allineamenti tempo Sostituzioni nucleotidiche La distanza tra due sequenze si definisce come il numero atteso di sostituzioni nucleotidiche per sito. Se il tasso
Dettaglimoli OH - /mole amminoacido
) ) Di seguito è riportata la curva di titolazione di un amminoacido. Osservando il grafico: a) stabilire il valore dei pka dell aminoacido b) calcolare il valore del pi e individuarlo sul grafico. c)
DettagliOmologia di sequenze: allineamento e ricerca
Omologia di sequenze: allineamento e ricerca Genomi (organismi) e geni hanno un evoluzione divergente Sequenze imparentate per evoluzione divergente sono omologhe Le sequenze sono confrontabili tramite
DettagliLezione 1. Le molecole di base che costituiscono la vita
Lezione 1 Le molecole di base che costituiscono la vita Le molecole dell ereditarietà 5 3 L informazione ereditaria di tutti gli organismi viventi, con l eccezione di alcuni virus, è a carico della molecola
DettagliProbabilità congiunta
Una vera matrice di sostituzione F K M N P Q 4 5 5 4 3 3 5 6 5 4 3 5 4 4 3 6 4 3 4 5 3 F 8 5 5 4 5 5 4 5 3 4 3 3 6 3 5 K 5 3 3 6 4 3 3 3 M 6 N P 6 Q 4 6 V Y 3 3 3 3 V 4 4 6 8 6 6 6 3 5 3 4 4 6 5 5 6 7
DettagliAllineamento e similarità di sequenze
Allineamento e similarità di sequenze Allineamento di Sequenze L allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; La similarità
DettagliLa ricerca di similarità in banche dati
La ricerca di similarità in banche dati Uno dei problemi più comunemente affrontati con metodi bioinformatici è quello di trovare omologie di sequenza interrogando una banca dati. L idea di base è che
DettagliFASTA. Lezione del
FASTA Lezione del 10.03.2016 Omologia vs Similarità Quando si confrontano due sequenze o strutture si usano spesso indifferentemente i termini somiglianza o omologia per indicare che esiste un rapporto
DettagliLezione 5. Cambiamenti evolutivi nelle sequenze nucleotidiche Distanze
Lezione 5 Cambiamenti evolutivi nelle sequenze nucleotidiche Distanze Graur and Li ch 3 materiale La lezione 5 ci permetterà di capire 1. come possa evolvere una sequenza di nucleotidi 2. quanto due sequenze
Dettagli3.3.2. ALIMENTI DI ORIGINE VEGETALE. 3.3.2.1. Verdure
3.3.2. ALIMENTI DI ORIGINE VEGETALE 3.3.2.1. Verdure Nella Tabella 9 sono riportati i valori degli aminoacidi liberi presenti in alcune fra le più diffuse verdure in commercio. In un passato recente era
DettagliLe L z e io i ne n 6 Co C n o f n ro r n o t n i i fra r a se s q e u q e u n e z n e z : e di d s i t s a t nz n e z, e allineamenti
Lezione 6 Confronti fra sequenze: distanze, Confronti fra sequenze: distanze, allineamenti Distanze fra sequenze Per N siti ed n differenze: grado di divergenza = n/n AATGAAAGAA 10 siti; 3 differenze ACTGGAGGAA
DettagliZ-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random
Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.
DettagliMateriale accessorio al Power Point ALLINEAMENTI DI SEQUENZE_2008. Corso di Bioinformatica per Biotecnologie (G. Colonna).
Materiale accessorio al Power Point ALLINEAMENTI DI SEQUENZE_2008. Corso di Bioinformatica per Biotecnologie (G. Colonna). Date due o più sequenze, inizialmente potremmo volere: misurarne il grado di similarità;
DettagliCaratteristiche generali
AMMINOACIDI Gli amminoacidi sono le unità costruttive (building blocks) delle proteine. Come dice il termine, gli amminoacidi naturali sono costituiti da un gruppo amminico (-NH 2 ) e da un gruppo carbossilico
DettagliLezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni:
Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni: antonella.meloni@ifc.cnr.it Sequenza A= stringa formata da N simboli, dove i simboli apparterranno ad un certo alfabeto. A
DettagliDNA E PROTEINE IL DNA E RACCHIUSO NEL NUCLEO, MENTRE LA SINTESI PROTEICA SI SVOLGE NEL CITOPLASMA: COME VIENE TRASPORTATA L INFORMAZIONE?
DNA E PROTEINE NUMEROSI DATI SUGGERISCONO CHE IL DNA SVOLGA IL SUO RUOLO GENETICO CONTROLLANDO LA SINTESI DELLE PROTEINE, IN PARTICOLARE DETERMINANDONE LA SEQUENZA IN AMINOACIDI E NECESSARIO RISPONDERE
DettagliLezione 7. Allineamento di sequenze biologiche
Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra
DettagliRicerca di omologia di sequenza
Ricerca di omologia di sequenza RICERCA DI OMOLOGIA DI SEQUENZA := Data una sequenza (query), una banca dati, un sistema per il confronto e una soglia statistica trovare le sequenze della banca più somiglianti
DettagliLaboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti Esercitazione 7 2.
Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti patti@di.unito.it Esercitazione 7 1 Info&Bio Bio@Lab Allineamento di sequenze Esercitazione 7 2 1 Es2: Allineamento
DettagliUNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I 1 INTRODUZIONE
Docente: Matteo Re UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2013-2014 semestre I 1 INTRODUZIONE Motivazioni dell esistenza della biologia computazionale: Biologia Computazionale
DettagliREPLICAZIONE DEL DNA
REPLICAZIONE DEL DNA La replicazione (o anche duplicazione) è il meccanismo molecolare attraverso cui il DNA produce una copia di sé stesso. Ogni volta che una cellula si divide, infatti, l'intero genoma
DettagliUNIVERSITÀ DEGLI STUDI DI MILANO. Giorgio Valentini. Bioinformatica. A.A semestre I 1 INTRODUZIONE
Docenti: Matteo Re Giorgio Valentini UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2014-2015 semestre I 1 INTRODUZIONE Motivazioni dell esistenza della biologia computazionale:
DettagliProteine strutturali Sostegno meccanico Cheratina: costituisce i capelli Collagene: costituisce le cartilagini Proteine di immagazzinamento
Tipo Funzione Esempi Enzimi Accelerano le reazioni chimiche Saccarasi: posiziona il saccarosio in modo che possa essere scisso nelle due unità di glucosio e fruttosio che lo formano Ormoni Messaggeri chimici
DettagliInformatica e Bioinformatica A. A
Purtroppo non esiste un modo univoco per indicare un gene. Ad esempio abbiamo visto che il gene tcap a seconda del record è riportato come titin-cap protein o telethonin. Questo crea confusione e non facilita
DettagliProgrammazione dinamica
rogrammazione dinamica Fornisce l allineamento ottimale tra due sequenze semplici variazioni dell algoritmo producono allineamenti globali o locali l allineamento calcolato dipende dalla scelta di alcuni
Dettagli10. VARIABILI CASUALI MULTIPLE
. VARIABILI CASUALI MULTIPLE.. Introduzione La definizione di v.c. può essere facilmente estesa al caso in cui a ciascun evento elementare che costituisce è associata una coppia di numeri reali così come
DettagliAllineamento di sequenze proteiche
Allineamento di sequenze proteiche Sequenze proteiche - definizioni Una proteina è composta da diversi amino acidi uniti da legami peptidici. Si definisce: struttura primaria: la sequenza dei residui struttura
DettagliMFN0366-A1 (I. Perroteau) -traduzione e indirizzamento delle proteine. Solo per uso didattico, vietata la riproduzione, la diffusione o la vendita
MFN0366-A1 (I. Perroteau) -traduzione e indirizzamento delle proteine MFN0366-A1 (I. Perroteau) -traduzione delle proteine trna Traduzione: mrna -------> proteine mrna MFN0366-A1 (I. Perroteau) -traduzione
DettagliMetodi di Distanza. G.Allegrucci riproduzione vietata
Metodi di Distanza La misura più semplice della distanza tra due sequenze nucleotidiche è contare il numero di siti nucleotidici che differiscono tra le due sequenze Quando confrontiamo siti omologhi in
DettagliFASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento
Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente
Dettagli06_citologia_SER_golgi 1
1 La sintesi proteica inizia sempre nello stesso modo: aggancio della piccola subunità ribosomale al estremità 5 dell mrna. si aggancio la grande subunità ribosomale In corrispondenza del codone di inizio
DettagliDa cosa dipendono le nostre caratteristiche? Come si trasmettono? Perché siamo simili o diversi?
Da cosa dipendono le nostre caratteristiche? Come si trasmettono? Perché siamo simili o diversi? La genetica, è la Scienza che studia i geni, l ereditarietà e la variabilità genetica degli organismi Il
DettagliLezione 6. Analisi di sequenze biologiche e ricerche in database
Lezione 6 Analisi di sequenze biologiche e ricerche in database Schema della lezione Allinemento: definizioni Allineamento di due sequenze Ricerca di singola sequenza in banche dati (Alignment-based database
DettagliLezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST
Lezione 8 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere
DettagliLezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST
Lezione 8 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere
DettagliInfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche
InfoBioLab I ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche Esercizio 1 - obiettivi: Ricerca di 2 proteine in ENTREZ Salva i flat file che descrivono le 2 proteine in formato testo Importa
DettagliAllineamenti di sequenze: concetti e algoritmi
Allineamenti di sequenze: concetti e algoritmi 1 globine: a- b- mioglobina Precoce esempio di allineamento di sequenza: globine (1961) H.C. Watson and J.C. Kendrew, Comparison Between the Amino-Acid Sequences
DettagliLE PROTEINE: POLIMERI COSTITUITI DA 20 TIPI DI MONOMERI, I 20 AMINOACIDI
LE PROTEINE: POLIMERI OSTITUITI DA 20 TIPI DI MONOMERI, I 20 AMINOAIDI OGNI PROTEINA PUO ESSERE FORMATA DA MOLTE DEINE O ENTINAIA DI AMINOAIDI E SI LEGANO A FORMARE UNA ATENA NON RAMIFIATA La catena di
DettagliElementi di matematica - dott. I. GRASSI
Gli assi cartesiani e la retta. Il concetto di derivata. È ormai d uso comune nei libri, in televisione, nei quotidiani descrivere fenomeni di varia natura per mezzo di rappresentazioni grafiche. Tali
DettagliALLINEAMENTO DI SEQUENZE
ALLINEAMENTO DI SEQUENZE 1 DATABASE DI SEQUENZE RICERCA TESTUALE Ricerca dei record i cui campi soddisfano determinati criteri (hanno certi valori) Abbiamo già visto nelle lezioni precedenti SIMILARITA
DettagliDistanza di Edit. Speaker: Antinisca Di Marco Data:
Distanza di Edit Speaker: Antinisca Di Marco Data: 14-04-2016 Confronto di sequenze Il confronto tra sequenze in biologia computazionale è la base per: misurare la similarità tra le sequenze allineamento
Dettagli2011 - G. Licini, Università di Padova. La riproduzione a fini commerciali è vietata
Ammino acidi Composto che contiene una funziome acida e amminica. Usualmente però con amminoacidi si intendono gli alfa- amminoacidi. Tra questi composti ve ne sono 20 che vengono definiti geneticamente
Dettagliα-amminoacidi O α O α R CH C O - NH 3 forma ionizzata sale interno (zwitterione) OH NH 2 forma non ionizzata (non esistente in realtà)
Amminoacidi 2 forma non ionizzata (non esistente in realtà) 3 forma ionizzata sale interno (zwitterione) In soluzione acquosa c'è equilibrio tra tre forme 3 forma cationica p molto acidi 3 forma zwitterionica
DettagliALLINEAMENTO DI SEQUENZE
ALLINEAMENTO DI SEQUENZE Gli obiettivi degli algoritmi di allineamento di sequenze di acidi nucleici o proteine sono molteplici. Possiamo ricordare la ricerca di similarità nelle banche dati, la costruzione
DettagliLE PROTEINE. SONO Polimeri formati dall unione di AMMINOACIDI (AA) Rende diversi i 20 AA l uno dall altro UN ATOMO DI C AL CENTRO
LE PROTEINE SONO Polimeri formati dall unione di ATOMI DI C, H, N, O CHE SONO AMMINOACIDI (AA) Uniti tra loro dal Legame peptidico 20 TIPI DIVERSI MA HANNO STESSA STRUTTURA GENERALE CON Catene peptidiche
DettagliMACROMOLECOLE. Polimeri (lipidi a parte)
MACROMOLECOLE Monomeri Polimeri (lipidi a parte) Le caratteristiche strutturali e funzionali di una cellula o di un organismo sono determinate principalmente dalle sue proteine. Ad esempio: Le proteine
DettagliMutagenesi: introduzione di alterazioni in una sequenza nucleotidica. Mutagenesi random: le mutazioni avvengono a caso su un tratto di DNA.
Mutagenesi: introduzione di alterazioni in una sequenza nucleotidica Mutagenesi random: le mutazioni avvengono a caso su un tratto di DNA. In genere si ottengono trattando il DNA con agenti chimici (es.
DettagliProbabilità: teoremi e distribuzioni
Probabilità: teoremi e distribuzioni OBIETTIVO DIDATTICO DELLA LEZIONE Illustrare le più importanti distribuzioni di probabilità che vengono utilizzate in statistica Distribuzioni di probabilità 1. La
Dettagliscaricato da I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE
Legame peptidico I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE tra il gruppo amminico di un aminoacido ed il gruppo carbossilico di un altro. 1 Catene contenenti
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: introduzione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Una definizione
DettagliL A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
DettagliMoltiplicazione. Divisione. Multipli e divisori
Addizione Sottrazione Potenze Moltiplicazione Divisione Multipli e divisori LE QUATTRO OPERAZIONI Una operazione aritmetica è quel procedimento che fa corrispondere ad una coppia ordinata di numeri (termini
DettagliPerché considerare la struttura 3D di una proteina
Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una
DettagliMatematica Lezione 4
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 4 Sonia Cannas 18/10/2018 Proporzioni Esempio Da un rubinetto di una vasca fuoriescono 60 litri di acqua in 4 minuti. Quanti litri
DettagliLa ricerca di similarità: i metodi
La ricerca di similarità: i metodi Pairwise alignment allineamenti a coppie 1. Analisi della matrice a punti (dot matrix) 2. Programmazione dinamica (dynamic programming) allineamenti locale e globale.
DettagliARITMETICA BINARIA. La somma viene eseguita secondo le regole per la somma di due bit, di seguito riportate:
ARITMETICA BINARIA Le operazioni che possono essere fatte sui numeri binari, sono le stesse che vengono effettuate sui numeri decimali. Due numeri binari possono essere quindi sommati, sottratti, moltiplicati
Dettaglii dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
DettagliCap. 1 Interazioni delle molecole con l acqua
Cap. 1 nterazioni delle molecole con l acqua Ci sono legami idrogeno nel metano liquido (CH 4 mantenuto a -165 C)? Perché? No, perché il legame C-H non è sufficientemente polare da avere una distribuzione
DettagliLezione 6. Ricerche in banche dati (databases) attraverso l uso di BLAST
Lezione 6 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere
DettagliAllineamenti a coppie
Laboratorio di Bioinformatica I Allineamenti a coppie Dott. Sergio Marin Vargas (2014 / 2015) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Il sito http://myhits.isb-sib.ch/cgi-bin/dotlet
DettagliLABORATORIO DI INFORMATICA ESERCITAZIONE VIII
LABORATORIO DI INFORMATICA ESERCITAZIONE VIII Cercate di eseguire gli esercizi da soli. Se non ci riuscite, cercate di capire i messaggi di errore. Se non ci riuscite, provateci di nuovo. Poi chiamate
DettagliLE MUTAZIONI. MUTAZIONE: MODIFICAZIONE DEL MESSAGGIO GENETICO, cambiamento raro, casuale, permanente ed EREDITABILE del DNA RIMESCOLAMENTO!!
LE MUTAZIONI MUTAZIONE: MODIFICAZIONE DEL MESSAGGIO GENETICO, cambiamento raro, casuale, permanente ed EREDITABILE del DNA RIMESCOLAMENTO!! NUOVI GENOTIPI LE MUTAZIONI POLIMORFISMO: un cambiamento presente
DettagliLezione 2: Allineamento di sequenze. BLAST e CLUSTALW
Lezione 2: Allineamento di sequenze BLAST e CLUSTALW Allineamento di sequenze Allineamenti L avvento della genomica moderna permette di analizzare le similitudini e le differenze tra organismi a livello
DettagliAppunti di matematica per le Scienze Sociali Parte 1
Appunti di matematica per le Scienze Sociali Parte 1 1 Equazioni 1.1 Definizioni preliminari 1.1.1 Monomi Si definisce monomio ogni prodotto indicato di fattori qualsiasi, cioè uguali o diseguali, numerici
DettagliInterazioni proteina-dna
Interazioni proteina-dna 1) Proteine che legano la doppia elica del DNA in maniera non sequenza-specifica: histone-like proteins (HU protein) 2) Proteine che legano strutture particolari del DNA: - single
DettagliLezione 2. Le molecole di base che costituiscono la vita
Lezione 2 Le molecole di base che costituiscono la vita Graur and Li: Capitolo 1 5 3 Le molecole dell ereditarietà L informazione ereditaria di tutti gli organismi viventi, con l eccezione di alcuni virus,
DettagliLezione 7. Allineamento di sequenze biologiche
Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra
Dettaglin +1 determinanti (D i, i =1,...,n e det A) n! prodotti per ciascun determinante n 1 moltiplicazioni per ciascun prodotto
METODI NUMERICI (A.A. 2007-2008) Prof. F.Pitolli Appunti delle lezioni sui sistemi lineari: metodi diretti; condizionamento Metodi diretti per la soluzione di sistemi lineari Metodi diretti Sono basati
DettagliClassificazione. I complessi. Le pietre miliari della tassonomia. Tassonomia del genere Mycobacterium. Pietre miliari nella tassonomia dei micobatteri
Le pietre miliari della tassonomia Tassonomia del genere Mycobacterium Enrico Tortoli Centro Regionale di Riferimento per i Micobatteri Firenze Adamo è autorizzato da Dio a dare un nome a tutti gli esseri
DettagliSoluzione nel dominio del tempo
Soluzione nel dominio del tempo Prof. Laura Giarré Laura.Giarre@UNIMORE.IT https://giarre.wordpress.com/ca/ Antitrasformate CA 2017 2018 Prof. Laura Giarré 1 Risposta nel dominio trasformato Ricordo che
DettagliESAME DI MATURITÀ. Opzione specifica biologia e chimica. giugno 2011
ESAME DI MATURITÀ Opzione specifica biologia e chimica giugno 2011 UCORRELAZIONI Cognome:.......... Nome:.......... Gruppo:.......... Numero:.......... Tempo a disposizione: 60 minuti Punteggio correlazioni:
DettagliProdotti notevoli Quadrato di un binomio
Prodotti notevoli Con l espressione prodotti notevoli si indicano alcune identità che si ottengono in seguito alla moltiplicazione di polinomi aventi caratteristiche particolari facili da ricordare.. Quadrato
DettagliAllineamento multiplo
Allineamento multiplo Allineamenti multipli Il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte proteine a funzione analoga. I siti funzionalmente o strutturalmente
DettagliAMINOACIDI Struttura. Funzione. Classificazione. Proprietà
AMINOACIDI Struttura Funzione Classificazione Proprietà 1 STRUTTURA Composti caratterizzati dalla presenza di un gruppo aminico (NH 2 ) e di un gruppo acido (COOH) legati al medesimo carbonio (C). In soluzione
DettagliStruttura delle Proteine
Chimica Biologica A.A. 2010-2011 Struttura delle Proteine Marco Nardini Dipartimento di Scienze Biomolecolari e Biotecnologie Università di Milano Macromolecole Biologiche Struttura Proteine Proteine:
DettagliEsercizi. 2. [Conteggio diretto] Due dadi vengono lanciati in successione. a) Qual è la probabilità che la somma dei due risultati faccia 7?
1 E. Vitali Matematica (Scienze Naturali) Esercizi 1. [Conteggio diretto] Quattro ragazzi, A, B, C e D, dispongono di due biglietti per il teatro e decidono di tirare a sorte chi ne usufruirà. a) Qual
DettagliLezione 2. costituiscono la vita
Lezione 2 Le molecole di base che costituiscono la vita Graur Gau and Li: Capitolo o 1 Graur lectures 5 6 7 5 3 Le molecole dell ereditarietà L informazione i ereditaria i di tutti ttigli organismi iviventi,
DettagliVariabili aleatorie. Variabili aleatorie e variabili statistiche
Variabili aleatorie Variabili aleatorie e variabili statistiche Nelle prime lezioni, abbiamo visto il concetto di variabile statistica : Un oggetto o evento del mondo reale veniva associato a una certa
DettagliCorso di Bioinformatica
Corso di Bioinformatica Cortona - Novembre 2002 Metodi Computazionali per l'analisi delle sequenze Dr. Sabino Liuni Istituto di Tecnologie Biomediche- CNR Sezione di Bioinformatica e Genomica - Bari Sabino@area.ba
Dettagli