Corso di Bioinformatica. Docente: Dr. Antinisca DI MARCO

Размер: px
Начинать показ со страницы:

Download "Corso di Bioinformatica. Docente: Dr. Antinisca DI MARCO"

Транскрипт

1 Corso di Bioinformatica Docente: Dr. Antinisca DI MARCO

2 Analisi Filogenetica Gene Ancestrale duplicazione genica La filogenesi è lo studio delle relazioni evolutive tra entità biologiche (non solo specie) che condividono antenati comuni Gene A Gene A1 Gene B1 Gene B speciazione ortologhi parologhi ortologhi Gene A2 Gene B2 Specie 1 Specie 2

3 Analisi Filogenetica La sua rappresentazione grafica è l albero filogenetico L albero filogenetico contiene i tempi e gli schemi temporali dei processi di divergenza Tutti gli organismi hanno un unico antenato comune nel passato Ogni coppia di organismi ha un antenato comune nel passato Eventi di speciazione si susseguono nel tempo creando nuove specie

4 Analisi Filogenetica Nodo Radice Ricostruzione di Filogenesi Una albero evolutivo, o filogenesi, è un albero con radice o senza radice i cui nodi interni hanno almeno grado 3 (ad eccezione della radice che ha grado 2) e rappresentano specie progenitrici, mentre le foglie rappresentano specie attuali. Gli archi dell albero solitamente rappresentano la distanza temporale tra due specie (nodi). Nodo Radice Nodo Antenato Nodo Antenato Orango Gorilla Uomo Scimpanzé

5

6

7

8

9

10

11 Analisi Filogenetica Nodo Radice Problema della Ricostruzione di Filogenesi Istanza: un insieme di specie S (es. S = {Orango, Gorilla, }) Questione: trovare la filogenesi T che rappresenta l evoluzione delle specie in S Nodo Radice Nodo Antenato Nodo Antenato Orango Gorilla Uomo Scimpanzé

12 Analisi Filogenetica Nodo Radice Proteine o acidi nucleici? In filogenesi vengono utilizzati entrambi: Sequenze proteiche - necessitano di matrici si sostituzione 20x20, molto complesse da trattare. - sono espressione di sole regioni codificanti. - aminoacidi identici possono essere espressione di più codoni

13 Analisi Filogenetica Nodo Radice Proteine o acidi nucleici? In filogenesi vengono utilizzati entrambi: Sequenze proteiche - necessitano di matrici si sostituzione 20x20, molto complesse da trattare. - sono espressione di sole regioni codificanti. - aminoacidi identici possono essere espressione di più codoni Sequenze nucleotidiche - sono descrivibili con matrici 4x4. - possono essere estratte da sequenze genomiche non codificanti, quindi con una tendenza alla variazione più ampia - non hanno degenerazione né ridondanza.

14 Analisi Filogenetica Nodo Radice Proteine o acidi nucleici? In filogenesi vengono utilizzati entrambi: Sequenze proteiche - necessitano di matrici si sostituzione 20x20, molto complesse da trattare. - sono espressione di sole regioni codificanti. - aminoacidi identici possono essere espressione di più codoni Sequenze nucleotidiche - sono descrivibili con matrici 4x4. - possono essere estratte da sequenze genomiche non codificanti, quindi con una tendenza alla variazione più ampia - non hanno degenerazione né ridondanza. Per la filogenesi molecolare è preferibile utilizzare sequenze nucleotidiche

15 Analisi Filogenetica Nodo Radice Assunzioni a priori Per calcolare una distanza evolutiva è necessario formulare un modello evolutivo: è quindi necessario considerare alcuni aspetti generali che possono essere considerati assunzioni a priori del modello: 1. tutti i siti evolvono in modo indipendente 2. tutti i siti mutano con la stessa probabilità 3. tutte le sostituzioni sono ugualmente probabili 4. la velocità di sostituzione è costante nel tempo 5. la composizione delle basi è costante maggiore è il numero di assunzioni a priori - maggiore è la semplicità del modello - minore è l attendibilità dei risultati

16 Analisi Filogenetica Nodo Radice Topologia Si definisce TOPOLOGIA la struttura generale di un albero. Se ai rami non si dà valenza di distanza evolutiva, ho un CLADOGRAMMA, altrimenti ho un FILOGRAMMA. Alberi CON RADICE accettano come vera l ipotesi dell orologio molecolare* e i nodi stanno in un preciso ordine temporale. UOMO MUCCA TOPO Alberi SENZA RADICE Non prevedono significati evolutivi in termini temporali e descrivono semplicemente le relazioni tra le sequenze * L evoluzione è un processo inevitabilmente divergente e il numero di mutazioni che si accumulano nel tempo è direttamente proporzionale al tempo intercorso dalla divergenza delle sequenze in analisi. Se questo è vero, data una distanza genetica calcolata osservando le divergenze, è possibile ottenere il tempo trascorso dal momento in cui due sequenze hanno cominciato a divergere. B A 1 2 C D 3 E

17 Analisi Filogenetica Nodo Radice Topologia Si definisce TOPOLOGIA la struttura generale di un albero. Se ai rami non si dà valenza di distanza evolutiva, ho un CLADOGRAMMA, altrimenti ho un FILOGRAMMA. Alberi CON RADICE accettano come vera l ipotesi dell orologio molecolare* e i nodi stanno in un preciso ordine temporale. Alberi SENZA RADICE Non prevedono significati evolutivi in termini temporali e descrivono semplicemente le relazioni tra le sequenze Il numero complessivo di alberi che si possono costruire con N sequenze (denominate OTU, cioè Operational Taxonomic Units) è dato da: Rooted N R = (2N - 3)! / (2 N-3 )*(N-3)! UnRooted N U = (2N - 5)! / (2 N-3 )*(N-3)! * L evoluzione è un processo inevitabilmente divergente e il numero di mutazioni che si accumulano nel tempo è direttamente proporzionale al tempo intercorso dalla divergenza delle sequenze in analisi. Se questo è vero, data una distanza genetica calcolata osservando le divergenze, è possibile ottenere il tempo trascorso dal momento in cui due sequenze hanno cominciato a divergere.

18 Analisi Filogenetica Nodo Radice Metodi per la creazione degli alberi I sistemi per costruire gli alberi possono essere distinti secondo due tipi di raggruppamenti, a seconde delle metodologie: Algoritmi di clusterizzazione (Unweighted Pair Group Method with Aritmetic mean (UPMGA), Neighbour Joining(NJ)): si basano sull osservazione delle distanze genetiche calcolate su allineamenti multipli. Algoritmi di ottimizzazione (Minima evoluzione): ottimizzazione degli alberi in base a criteri obiettivi di qualità. Oppure in base all origine dei dati Distanze genetiche pre-calcolate: tempi di calcolo minori. Sequenze omologhe multiallineate: tempi di calcolo molto superiori.

19 Analisi Filogenetica Nodo Radice MEGA: Per maggiori dettagli sugli algoritmi per studio filogenetico è possibile fare riferimento al file AlgoritmiPhylogenesis.pdf

20

21

22

23

24

25

26 Neighbour Joining Algorithm The Neighbour Joining method is a method for re-constructing phylogenetic trees, and computing the lengths of the branches of this tree. In each stage, the two nearest nodes of the tree are chosen and defined as neighbours in our tree. This is done recursively until all of the nodes are paired together. Neighbours are defined as a pair of OTU's (OTU=operational taxonomic units, or in other words leaves of the tree), who have one node connecting them. For instance, in the tree in figure 1, nodes A and B are neighbours (connected by only one internal node), and nodes C and D are neighbours, whereas nodes A and C (for example) are not neighbours.

27 Neighbour Joining Algorithm How do we find neighbours, and how de we construct our tree? 1. We start off with a star tree: 2. We define some kind of distance parameter between our nodes (1 through 5), and enter this parameter into a distance matrix. The columns and rows of the matrix represent nodes, and the value i,j of the matrix represent the distance between node i and node j. Note that the matrix is symmetric, and that the diagonal is irrelevant, therefore only the top half (or lower half) are enough. 3. We pick the two nodes with the lowest value in the matrix defined in step 2. These are defined as neighbours. For example, assuming nodes 1 and 2 are the nearest, we define them as neighbours

28 Neighbour Joining Algorithm Figure 2(b)

29

30

31 sostituzioni. L algoritmo ha due componenti

32

33

34

Filogenesi molecolare

Filogenesi molecolare Filogenesi molecolare Geni ortologhi e geni paraloghi Geni ortologhi: geni simili riscontrabili in organismi correlati tra loro. Il fenomeno della speciazione porta alla divergenza dei geni e quindi delle

Подробнее

Filogenesi molecolare

Filogenesi molecolare Filogenesi molecolare Evoluzione dei geni Gene ancestrale Gene duplicazione genica Gene speciazione Gene 1 Gene 1 ortologhi paraloghi ortologhi Gene 2 Gene 2 Specie 1 Specie 2 Proteine o acidi nucleici?

Подробнее

Alberi filogenetici. File: alberi_filogenetici.odp. Riccardo Percudani 02/03/04

Alberi filogenetici. File: alberi_filogenetici.odp. Riccardo Percudani 02/03/04 Alberi filogenetici The tree of life Albero filogenetico costruito con le sequenze della subunità piccola dell RNA ribosomale. Tutte le forme viventi condividono un comune ancestore (LCA, last common ancestor

Подробнее

Algoritmi di Allineamento

Algoritmi di Allineamento Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento

Подробнее

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Filogenesi Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Introduzione alla

Подробнее

EVOLUZIONE MOLECOLARE. Silvia Fuselli

EVOLUZIONE MOLECOLARE. Silvia Fuselli EVOLUZIONE MOLECOLARE Silvia Fuselli [email protected] TESTI Organizzazione del corso Graur and Li, Fundamentals of molecular evolution, Sinauer 2000 Michael Lynch, The Origins of Genome Architecture,

Подробнее

SAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing

SAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing SAGA: sequence alignment by genetic algorithm ALESSANDRO PIETRELLI Soft Computing Bologna, 25 Maggio 2007 Multi Allineamento di Sequenze (MSAs) Cosa sono? A cosa servono? Come vengono calcolati Multi Allineamento

Подробнее

Genomica Evoluzione e cambiamenti dei genomi. Dott.ssa Inga Prokopenko

Genomica Evoluzione e cambiamenti dei genomi. Dott.ssa Inga Prokopenko Genomica Evoluzione e cambiamenti dei genomi Dott.ssa Inga Prokopenko Sistematica in biologia La varietà degli organismi viventi richiede organizzaione delle nostre osservazioni Tassonomia in biologia

Подробнее

Metodi di Distanza. G.Allegrucci riproduzione vietata

Metodi di Distanza. G.Allegrucci riproduzione vietata Metodi di Distanza La misura più semplice della distanza tra due sequenze nucleotidiche è contare il numero di siti nucleotidici che differiscono tra le due sequenze Quando confrontiamo siti omologhi in

Подробнее

Filogenesi e alberi filogenetici. Darwin, 1837

Filogenesi e alberi filogenetici. Darwin, 1837 Filogenesi e alberi filogenetici Darwin, 1837 Definizione di filogenesi La filogenesi è lo studio delle relazioni evolutive tra entità biologiche (non solo specie) che condividono antenati comuni La sua

Подробнее

Genomics Session. Lezione 6. Filogenomica

Genomics Session. Lezione 6. Filogenomica Genomics Session Filogenomica Filogenetica Filogenesi: Ricostruzione della storia evolutiva Obiettivo: inferire la storia evolutiva fra entità biologiche mediante una serie di caratteri moderni osservati

Подробнее

Allineamento multiplo

Allineamento multiplo Allineamento multiplo Allineamenti multipli Il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte proteine a funzione analoga. I siti funzionalmente o strutturalmente

Подробнее

Ortologhi e paraloghi

Ortologhi e paraloghi Ortologhi e paraloghi Similarità e distanza Sequenza originaria GHSVLIWETS Gene Gene uplicazione Eventi di sostituzione: vvenuti = 12 Osservabili = 3 Speciazione Gene 1 Gene 2 Geni Ortologhi uplicazione

Подробнее

ALBERI FILOGENETICI. Genetica delle popolazioni a.a. 11-12 prof. S. Presciuttini

ALBERI FILOGENETICI. Genetica delle popolazioni a.a. 11-12 prof. S. Presciuttini ALBERI FILOGENETICI Questo documento è pubblicato sotto licenza Creative Commons Attribuzione Non commerciale Condividi allo stesso modo http://creativecommons.org/licenses/by-nc-sa/2.5/deed.it Che cosa

Подробнее

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato

Подробнее

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi GENOMA EVOLUZIONE CONTENUTO FUNZIONE STRUTTURA Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine Progetti genoma in centinaia di organismi Importante la sintenia tra i genomi The

Подробнее

Graphs: Cycles. Tecniche di Programmazione A.A. 2012/2013

Graphs: Cycles. Tecniche di Programmazione A.A. 2012/2013 Graphs: Cycles Tecniche di Programmazione Summary Definitions Algorithms 2 Definitions Graphs: Cycles Cycle A cycle of a graph, sometimes also called a circuit, is a subset of the edge set of that forms

Подробнее

Indice generale. Nozioni fondamentali. Prefazione XIII

Indice generale. Nozioni fondamentali. Prefazione XIII Prefazione XIII A Nozioni fondamentali CAPITOLO 1 La biologia essenziale 3 1.1 Genomi, genomica e avvento della Bioinformatica 3 1.2 Genoma dei procarioti 5 1.2.1 Struttura e dimensioni 5 1.2.2 Proprietà

Подробнее

BLAST. W = word size T = threshold X = elongation S = HSP threshold

BLAST. W = word size T = threshold X = elongation S = HSP threshold BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query

Подробнее

Informatica e Bioinformatica A. A

Informatica e Bioinformatica A. A Purtroppo non esiste un modo univoco per indicare un gene. Ad esempio abbiamo visto che il gene tcap a seconda del record è riportato come titin-cap protein o telethonin. Questo crea confusione e non facilita

Подробнее

RELAZIONE di BIOLOGIA MOLECOLARE

RELAZIONE di BIOLOGIA MOLECOLARE NOME: Marini Selena MATRICOLA: 592330 RELAZIONE di BIOLOGIA MOLECOLARE CHE ORGANISMO MODELLO È DICTYOSTELIUM? CHE RISORSE BIOINFORMATICHE AGEVOLANO I RICERCATORI CHE LO STUDIANO? Dictyostelium è un genere

Подробнее

TASSONOMIA E FILOGENESI

TASSONOMIA E FILOGENESI TASSONOMIA E FILOGENESI Evoluzione e filogenesi EVOLUZIONE rappresenta il cambiamento di una linea di discendenti che, nel tempo, porta alla formazione di nuove specie. FILOGENESI: studia le connessioni,

Подробнее

Allineamenti multipli

Allineamenti multipli Allineamenti multipli Allineamenti multipli Finora ci siamo occupati di allineamenti a coppie (pairwise), ma il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte

Подробнее

A.A. 2006/2007 Laurea di Ingegneria Informatica. Fondamenti di C++ Horstmann Capitolo 3: Oggetti Revisione Prof. M. Angelaccio

A.A. 2006/2007 Laurea di Ingegneria Informatica. Fondamenti di C++ Horstmann Capitolo 3: Oggetti Revisione Prof. M. Angelaccio A.A. 2006/2007 Laurea di Ingegneria Informatica Fondamenti di C++ Horstmann Capitolo 3: Oggetti Revisione Prof. M. Angelaccio Obbiettivi Acquisire familiarità con la nozione di oggetto Apprendere le proprietà

Подробнее

07/01/2015. Come si ferma una macchina in corsa? Il terminatore. Terminazione intrinseca (rho-indipendente)

07/01/2015. Come si ferma una macchina in corsa? Il terminatore. Terminazione intrinseca (rho-indipendente) Come si ferma una macchina in corsa? Il terminatore Terminazione intrinseca (rho-indipendente) Terminazione dipendente dal fattore Rho (r) 1 Operoni: gruppi di geni parte di una unica unità trascrizionale

Подробнее

Espressioni aritmetiche

Espressioni aritmetiche Espressioni aritmetiche Consideriamo espressioni costruite a partire da variabili e costanti intere mediante applicazione delle operazioni di somma, sottrazione, prodotto e divisione (intera). Ad esempio:

Подробнее

Lezione 7. Allineamento di sequenze biologiche

Lezione 7. Allineamento di sequenze biologiche Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra

Подробнее

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni

Подробнее

Tesi di Laurea Specialistica. Laureando: Silvio Zennaro. Accordo tra alberi filogenetici: dalla teoria allo sviluppo web 2.0

Tesi di Laurea Specialistica. Laureando: Silvio Zennaro. Accordo tra alberi filogenetici: dalla teoria allo sviluppo web 2.0 UNIVERSITÀ CA FOSCARI DI VENEZIA Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea Specialistica in Informatica Tesi di Laurea Specialistica Laureando: Silvio Zennaro Accordo tra alberi

Подробнее

Si faccia riferimento all Allegato A - OPS 2016, problema ricorrente REGOLE E DEDUZIONI, pagina 2.

Si faccia riferimento all Allegato A - OPS 2016, problema ricorrente REGOLE E DEDUZIONI, pagina 2. Scuola Sec. SECONDO Grado Gara 2 IND - 15/16 ESERCIZIO 1 Si faccia riferimento all Allegato A - OPS 2016, problema ricorrente REGOLE E DEDUZIONI, pagina 2. Sono date le seguenti regole: regola(1,[a],b)

Подробнее

Botanica (CFU 5+1) Martedì 11:00-13:00 Venerdì. scienza della diversità I turno 14:00-16:00 2 turno 16:00-18:00. aa

Botanica (CFU 5+1) Martedì 11:00-13:00 Venerdì. scienza della diversità I turno 14:00-16:00 2 turno 16:00-18:00. aa Botanica (CFU 5+1) Botanica o Biologia vegetale: Lezioni Morfologia vegetale Anatomia vegetale * Citologia vegetale * Martedì 11:00-13:00 Venerdì Fisiologia vegetale * Genetica dei vegetali Biologia molecolare

Подробнее

Attraversamento di un albero (binario)

Attraversamento di un albero (binario) Attraversamento di un albero (binario) 1) Preordine Algorithm binarypreorder( T, v) //caso di albero binario Visita il nodo v; binarypreorder( T, T.leftChild(v)); //Attraversamento ricorsivo sottoalbero

Подробнее

Introduzione all analisi di arrays: clustering.

Introduzione all analisi di arrays: clustering. Statistica per la Ricerca Sperimentale Introduzione all analisi di arrays: clustering. Lezione 2-14 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia

Подробнее

Patologie da analizzare

Patologie da analizzare Fasi cruciali Scelta della patologia da analizzare Scelta del campione da analizzare Scelta dell approccio da utilizzare Scelta della tecnica da utilizzare Analisi statistica del dati Conferme con approcci

Подробнее

scaricato da I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE

scaricato da  I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE Legame peptidico I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE tra il gruppo amminico di un aminoacido ed il gruppo carbossilico di un altro. 1 Catene contenenti

Подробнее

Allineamenti di sequenze: concetti e algoritmi

Allineamenti di sequenze: concetti e algoritmi Allineamenti di sequenze: concetti e algoritmi 1 globine: a- b- mioglobina Precoce esempio di allineamento di sequenza: globine (1961) H.C. Watson and J.C. Kendrew, Comparison Between the Amino-Acid Sequences

Подробнее

Data Alignment and (Geo)Referencing (sometimes Registration process)

Data Alignment and (Geo)Referencing (sometimes Registration process) Data Alignment and (Geo)Referencing (sometimes Registration process) All data aquired from a scan position are refered to an intrinsic reference system (even if more than one scan has been performed) Data

Подробнее

Algoritmi Priority-Driven RT. Corso di Sistemi RT Prof. Davide Brugali Università degli Studi di Bergamo

Algoritmi Priority-Driven RT. Corso di Sistemi RT Prof. Davide Brugali Università degli Studi di Bergamo Algoritmi Priority-Driven RT Corso di Sistemi RT Prof. Davide Brugali Università degli Studi di Bergamo 2 Algoritmi Real Time Earliest Due Date (statico) Seleziona il task con la deadline relativa più

Подробнее

TASSONOMIA O SISTEMATICA

TASSONOMIA O SISTEMATICA TASSONOMIA O SISTEMATICA È la branca della batteriologia responsabile della caratterizzazione degli organismi ed organizzazione in gruppi affini (TAXA). NOMENCLATURA CLASSIFICAZIONE IDENTIFICAZIONE taxon

Подробнее

LA BIOLOGIA MOLECOLARE E UNA BRANCA DELLA BIOLOGIA CHE STUDIA LE BASI MOLECOLARI DELLE FUNZIONI BIOLOGICHE, PONENDO UNA PARTICOLARE ATTENZIONE A QUEI

LA BIOLOGIA MOLECOLARE E UNA BRANCA DELLA BIOLOGIA CHE STUDIA LE BASI MOLECOLARI DELLE FUNZIONI BIOLOGICHE, PONENDO UNA PARTICOLARE ATTENZIONE A QUEI CONCETTI DI BASE LA BIOLOGIA MOLECOLARE E UNA BRANCA DELLA BIOLOGIA CHE STUDIA LE BASI MOLECOLARI DELLE FUNZIONI BIOLOGICHE, PONENDO UNA PARTICOLARE ATTENZIONE A QUEI PROCESSI CHE COINVOLGONO GLI ACIDI

Подробнее