Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti Esercitazione 7 2.

Documenti analoghi
InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche

Esercizio da portare all orale

BLAST. W = word size T = threshold X = elongation S = HSP threshold

Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti Esercitazione 6 2.

Informatica e biotecnologie

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random

FASTA. Lezione del

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST

Informatica e biotecnologie II parte

Ricerche con BLAST (Laboratorio)

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento

La ricerca di similarità: i metodi

Algoritmi di Allineamento

ALLINEAMENTO DI SEQUENZE

Lezione 6. Ricerche in banche dati (databases) attraverso l uso di BLAST

Allineamenti a coppie

Bioinformatica ed applicazioni di bioinformatica strutturale!

BLAST: Basic Local Alignment Search Tool

Il Corso sarà tenuto nei giorni di Lunedì, Mercoledì e Venerdì dalle ore 17 alle ore 19.

Cerca la tua sequenza ed analizzala. 4-Utilizzando l intera sequenza NM_ quante ORF trovate nella ORF +3?

SAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing

Metodi euristici di allineamento

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche)

Ricerca di omologia di sequenza

Allineamento e similarità di sequenze

Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini)

Lezione 6. Lo string matching

Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni:

Informatica e Bioinformatica A. A

Materiale accessorio al Power Point ALLINEAMENTI DI SEQUENZE_2008. Corso di Bioinformatica per Biotecnologie (G. Colonna).

Lezione 6. Analisi di sequenze biologiche e ricerche in database

Allineamenti Multipli di Sequenze

La ricerca di similarità in banche dati

Allineamenti di sequenze: concetti e algoritmi

Lezione 7. Allineamento di sequenze biologiche

UTILIZZO DI BLAST PER ALCUNE SEMPLICI APPLICAZIONI IN STUDI GENOMICI

Corso di Bioinformatica e analisi dei genomi, docente Silvia Fuselli. Esercizi ricerche in banche dati

MODELLO SCHEDA INSEGNAMENTO. II II Luigi Cerulo

Lezione 7. Allineamento di sequenze biologiche

Le sequenze consenso

Pairwise Sequence Alignment BIOINFORMATICA. Corso di Laurea in Ingegneria Informatica e Biomedica. Università Magna Graecia Catanzaro

Vai al sito: Incolla nel box vuoto la sequenza nucleotidica

Introduzione al Calcolo Scientifico A.A Lab. 11

Programmazione dinamica

3. Confronto tra due sequenze

Lezione 7. Allineamento di sequenze biologiche

8. Sovrapposizione e confronto di strutture proteiche

Informatica e biotecnologie I parte. Informatica e biotecnologie. Banche dati biologiche: sommario. Strumenti per

MANUALE OPERATIVO PROGRAMMA DI GESTIONE DATI DI SENSIBILITÀ AGLI ANTIBIOTICI.

RELAZIONE di BIOLOGIA MOLECOLARE

Lezione 2: Allineamento di sequenze. BLAST e CLUSTALW

Bioinformatica. Analisi del genoma

Sequence alignment... in parallel!!

Microsoft Excel VI parte: Frequenze & Grafici

Bioinformatics more basic notions

ESERCITAZIONE 3. OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST

Corso di Bioinformatica

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.

Allineamento multiplo di sequenze

MS Access: Tutorial Tabelle, Relazioni

La distribuzione dei veri e falsi positivi la ricerca della giusta soglia

Programmazione dinamica

Corso di Access. Prerequisiti. Modulo L2 A (Access) Le query

Banche Dati proteiche

Excel 3. Master Universitario di II livello in MANAGER NELLE AMMINISTRAZIONI PUBBLICHE A.A Prof.ssa Bice Cavallo

BANCA DATI ESPOSIZIONE SILICE

Modello computazionale per la predizione di siti di legame per fattori di trascrizione

Università degli studi di Pisa

Bioinformatica A.A semestre I

MANUALE PER IL REDATTORE DELL UFFICIO STAMPA

Piano di lavoro classe prima

Piccolo vademecum sull uso efficiente di Excel

Come creare una pianificazione che genera una spedizione in Contactsend

Informatica per Odontoiatria

Mini-guida sull utilizzo di Accesss

ALLINEAMENTO DI SEQUENZE

9In questa sezione. Ordinare e filtrare i dati. Dopo aver aggiunto dati ai fogli di lavoro, potresti voler

Sommario. Presentazione dell opera Ringraziamenti

Allineamento locale: BLAST

Gestione della configurazione Input/Output PLC Cosa c'è di nuovo?

Perché considerare la struttura 3D di una proteina

Esercitazione n 2 Costruzione di grafici

LE MASCHERE. Maschera standard. Maschera semplice. Questa maschera però non consente di nascondere alcuni campi e visualizza i record uno ad uno.

Informatica e Bioinformatica: Basi di Dati

Dipartimento di Elettronica, Informazione e Bioingegneria Politecnico di Milano

Laboratorio di Algoritmi

Prova di Laboratorio del [ Corso A-B di Programmazione (A.A. 2004/05) Esempio: Media Modalità di consegna:

ESAME 16/02/2016 (A) Prof. C. DE MAIO

Uso di BLAST. Premessa

U.T.E FOGLIO ELETTRONICO. Università della Terza Età. Sede di Novate Milanese. Corso Informatica Approfondimento. Docente: Giovanni Pozzi

U.T.E Università della Terza Età

4. Ricerca di sequenze in banche dati e allineamento multiplo

Uso di base dell ordinamento di dati in Microsoft Excel

Vettori Matrici Grafi. Renato Mainetti

Corso di Informatica di base: programma delle prime 5 lezioni di laboratorio. Viviana Patti matricola:

Biologia Molecolare Computazionale

SHL TalentCentral. Guida rapida. Indice: Creare un progetto. Gestire e modificare un progetto

Transcript:

Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti patti@di.unito.it Esercitazione 7 1 Info&Bio Bio@Lab Allineamento di sequenze Esercitazione 7 2 1

Es2: Allineamento globale Seconda fase - obiettivi: Effettuare l'allineamento di 2 delle sequenze trovate (P01958 e P01922), utilizzando il programmi di allineamento globale disponibile al sito: http://www.ebi.ac.uk/emboss/align/ Effettuare l'allineamento una prima volta mantenendo i valori di default per quanto riguarda i parametri che influenzano il punteggio: la matrice di valutazione e i gap penalties Riportare i risultati in una tabella su un nuovo foglio di lavoro del file Excel bioinfo.xls, evidenziando la matrice e i valori di gap usati (input), il punteggio (score), la percentuale di identità e di similarità restituita dal programma. Esercitazione 7 3 EMBOSS- Needle: Allineamento globale EMBOSS- needle (Needleman-Wunsch global alignment from EBI - European Bioinf. Inst.) http://www.ebi.ac.uk/emboss/align/ consente di usare matrici PAM o BLOSUM In output da informazioni su identità e similarità (proteine) specifica dei parametri di input: - algoritmo di allineamento globale/locale - tipo di sequenza: proteine/dna - scoring matrix - gap penalties Esercitazione 7 4 2

EMBOSS- Needle: Allineamento globale Per dare in input le 2 sequenze potete fare l'upload dei file contenenti le 2 sequenze in FASTA o il copia e incolla dal file Excel Esercitazione 7 5 EMBOSS- Needle: Allineamento globale clicca qui per avere una descrizione degli algoritmi di allineamento usati Esercitazione 7 6 3

Report Allineamenti In un nuovo foglio di bioinfo.xls- che chiamerete Allineamenti - create una tabella (vedi slide successiva) dove riportate il risultato dell'allineamento, specificando la matrice data in input al programma, le gap penalties date in input al programma, il punteggio (score) assegnato all'allineamento restituito come ottimo la percentuale di identità per l'allineamento ottimo le similarità per l'allineamento ottimo Rilanciate il programma di allineamento modificando i parametri in input (scoring matrix, gap penalties), e riportate i nuovi risultati nel foglio allinementi Riportate nella tabella i risultati di almeno 3 allineamenti Esercitazione 7 7 Report allineamenti hba_horse/hba_human(global) A1 A2 A3 identity 88,00% 88,00% 88,00% similarità 95,80% 90,80% 93,70% score 620 648 926 matrix PAM250 BLOSUM62 BLOSUM40 gap used used used gap penalties 10 10 10 gap extend 0,5 0,5 0,5 Esercitazione 7 8 4

Report allineamenti Create un grafico di tipo linee simile a quello in figura che visualizzi il variare del punteggio assegnato all'allineamento al variare delle matrici di valutazione Global alignment: variazione del punteggio al variare del parametro scoring matrix hba_human/hba_horse Punteggio 1000 900 800 700 600 500 400 300 200 100 0 PAM250 620 648 BLOSUM62 Matrix BLOSUM40 926 Posizionate il grafico sul foglio Allineamenti accanto alla tabella Esercitazione 7 9 Es2bis: Allineamento globale Effettuare l'allineamento globale di P01958 con la sequenza dell'emoglobina beta dello stesso animale (cavallo): http://www.ebi.ac.uk/emboss/align/ Rilanciate il programma di allineamento almeno 3 volte modificando i parametri in input (scoring matrix, gap penalties), e riportate i nuovi risultati nel foglio allinementi su una nuova tabella...scoprirete che ci sono più affinità fra catene alpha di 2 specie diverse che fra catene alfa e beta della stessa specie aggiungete nel grafico a dispersione una serie per rappresentare anche questi dati Esercitazione 7 10 5

Report allineamenti aggiungete nel grafico a dispersione una serie per rappresentare anche questi dati Global alignment: variazione del punteggio al variare del parametro scoring matrix hba_human/hba_horse hba_horse/hbb_horse Punteggio 1000 900 800 700 600 500 400 300 200 100 0 PAM250 620 648 335,5 274,5 BLOSUM62 Matrix BLOSUM40 926 426,5 Esercitazione 7 11 Es3. Allineamento locale di sequenze nucleotidiche con BLAST Terza fase: obiettivi Realizza l'allineamento locale delle 2 sequenze nucleotidiche contenute dei file di testo a_pig.txt e a_human.txt usando il programma BLAST Visualizzazione grafica della qualità dell'allineamento via dotplot http://www.ncbi.nlm.nih.gov/blast/ Esercitazione 7 12 6

BLAST Basic Local Alignment Search Tool: è il programma ad oggi più diffuso per ricerche su DB basate su sequenze Usato da molti server di ricerca Integrato in NCBI Molto veloce (migliaia di confronti/min): versione efficiente dell algoritmo di allineamento locale Cerca zone di similarità locali http://www.ncbi.nlm.nih.gov/blast/ Esercitazione 7 13 BLAST Programmi disponibili blastall (ricerche di tipo generali; modalità: blastp, blastn, blastx, tblastn) blastpgp (allineamenti multipli) bl2seq (allineamenti locali di due sequenze)... Esercitazione 7 14 7

Query Esercitazione 7 15 BLAST Allineamento nucleotidi Opzione blastn Realizzate un allineamento a coppie fra: a_pig.txt e a_human.txt Seq I: >A_PIG AGTCGGCGCATTTCGCACCGTACCCTGATGC ACTTTTGGGGAATCCCAAACTCACAGTTAAA SeqII: >A_HUMAN ACTCGGCCCATTTCCCCACCGTACCCTGATGC ACTTTGGGGAAATCCCAAAACTCACATTTAAA Esercitazione 7 16 8

Allineamento locale nucleotidi matrice di punteggio semplice penalità per gap singoli/ consecutivi upload della sequenza in FASTA Esercitazione 7 17 Risultato e dotplot gap caso semplice: ho solo match e mismatch Esercitazione 7 18 9

Dotplot e localizzazione della similarità il dotplot dà una veloce raffigurazione visiva generale del rapporto di similarità fra due sequenze è una matrice: le righe corrispondono ai residui di sequenza 2, le colonne ai residui della sequenza 1 quando i residui corrispondono le caselle corrispondenti vengono colorate regioni di residui corrispondenti costituiscono diagonali rappresentazione simil-dotplot della similarità Esercitazione 7 19 Dotplot e localizzazione della similarità il dotplot dà una veloce raffigurazione visiva del rapporto di similarità fra due sequenze Per esempio il dotplot che mette in relazione le nostre 2 sequenze mostra come la similarità sia localizzata nella parte finale localizzazione dell'allineamento Esercitazione 7 20 10

Dotplot e visualizzazione dei gap può capitare che regioni di similarità risultino spostate in modo da apparire su diagonali parallele ma non colineari -> questo indica che ci sono state inserzioni o delezioni nei segmenti tra le regioni di similarità gap: visualizzati come "salti" fra diagonali localizzazione dell'allineamento Esercitazione 7 21 Es4: BLAST Query a sequenze per ricerche in banca dati Quarta fase: obiettivi Realizza una query a sequenze per estrarre da una banca dati sequenze simili a 1 certa sequenza campione data in input Query: 1 sequenza campione nucleotidica nota Metodo: BLAST confronta la query campione con altre sequenze di un database selezionato usando l'algoritmo di allineamento locale con euristiche Output: elenco di sequenze del database ordinate in ordine crescente di similarità con la sequenza nota Esercizio: Prendete la sequenza di parziale di DNA ribosomale mitocondriale determinata su un campione di pelliccia (formato fasta): pelliccia.txt Utilizzare una ricerca in banca dati con BLAST per scoprire a che organismo appartiene Esercitazione 7 22 11

Query Esercitazione 7 23 Query copia e incolla sequenza campione scegli database da cui estrarre le sequenze simili Esercitazione 7 24 12

Cerca... BLAST sta confrontando la query campione con altre sequenze di database di nucleotidi utilizzando un algoritmo di allineamento locale ottimizzato Esercitazione 7 25 Risultato vengono restituite le sequenze per cui è stato trovato il punteggio di allineamento più alto con la sequenza campione la seq col punteggio di allineamento più alto con la sequenza campione, appartiene all'organismo Felis catus ogni linea rappresenta una sequenza estratta dal db Esercitazione 7 26 13

Risultato...scorri il documento html le sequenze della banca dati che hanno prodotto un allineamento locale significativo con la sequenza campione sono elencate in ordine di punteggio crescente assegnato all'allineamento click sul link del punteggio per visualizzare l'allineamento di questa sequenza della banca dati con la sequenza campione Esercitazione 7 27 Risultato...visualizza un allineamento -allineamento locale ottimo fra la sequenza campione (query) e la sequenza della banca dati Felis catus mitochondrion, complete genome -quest'ultima sequenza è quella per cui ho ottenuto un punteggio più alto per l'allineamento locale con la sequenza campione (98% identità) Esercitazione 7 28 14

Informazioni su BLAST Per saperne di più su BLAST: -Info -Tutorial - etc... http://www.ncbi.nlm.nih.gov/education/blastinfo/information3.html Esercitazione 7 29 15