Sequenziamento e analisi di genomi completi



Documenti analoghi
SEQUENZIAMENTO DEL DNA

Mappe fisiche. Si basano sulla localizzazione fisica delle molecole di DNA

Avanzamento dei sistemi di sequenziamento

Bioinformatica. Marin Vargas, Sergio Paul

Dr. Tommaso Giordani SEQUENZIAMENTO SANGER E ASSEMBLAGGIO DEI GENOMI

Genomica Servizio Sequenziamento DNA

I Genomi degli Eucarioti:

La possibilita di conoscere i geni deriva dalla capacita di manipolarli:

Dr. Tommaso Giordani SEQUENZIAMENTO SANGER E ASSEMBLAGGIO DEI GENOMI

Il sequenziamento del DNA

GENI GENOMI e GENOMICA

Introduzione al corso di bioinformatica e analisi dei genomi AA Docente: Silvia Fuselli fss@unife.it

I marcatori molecolari. Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Corso di Genetica Agraria Giovanna Attene

Il genoma umano. Cosa significa genoma? Ditelo con parole vostre

GENOMA. c varia da pochi kb nei virus a milioni di kb in piante e animali

HI-TECH IN SANITA'. MINI-INVASIVITA' 2.0: nuove tecnologie al servizio dell'appropriatezza e della bioetica professionale

Downloaded from Riarrangiamento dei geni per le Immunoglobuline e sviluppo dei linfociti B

Biologia Molecolare. CDLM in CTF L analisi del genoma

Nel 1997 un gruppo di ricercatori dell Università di Monaco, guidato. Genomi e genomica. DOMANDE CHIAVE Come si ottengono

Definizione di genoteca (o library) di DNA

DOMANDA FREQUENTE: QUALE E LA FUNZIONE DI UNA CERTA PROTEINA? SI AUMENTA O SI DIMINUISCE L ESPRESSIONE DELLA PROTEINA

ncdna Per ncdna si intende il DNA intronico, intergenico e altre zone non codificanti del genoma.

Vettori di espressione

Linkage. Lezione 4 (riprendere il testo di Genetica ) By NA

SOLUZIONI AI PROBLEMI DEL CAPITOLO 20

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi

Esercitazioni di Genomica

Sequenziamento ed analisi dell esoma intero (All Exon)

immagine Biologia applicata alla ricerca bio-medica Materiale Didattico Docente: Di Bernardo

I marcatori genetici e loro applicazioni nelle produzioni animali. Dott.ssa Chiara Targhetta

Corso di Biologia Molecolare

Bioinformatica (modulo bioinf. dei genomi moderni )

Dal grano Creso alle scienze omiche, nuove applicazioni e strategie future

Corso di Laurea in Biotecnologie Anno-Accademico Percorso nº 3: Clonaggio di segmenti di DNA

= femmina. = maschio. = fenotipo banda bianca. = fenotipo pezzato. =fenotipo colore uniforme

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi.

Lezioni di biotecnologie

Il genoma dinamico: gli elementi trasponibili

La reazione a catena della polimerasi (PCR) di Ofelia Leone e Vincenzo Mandarino

DNA sequencing. Reading Genomes. Giovanni Bacci

Indice dell'opera. Prefazione. Capitolo 1 Introduzione alla genetica Genetica classica e moderna Genetisti e ricerca genetica Sommario

Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY.

Quotidiano.

Acidi nucleici basi puriniche basi pirimidiniche

Dopo aver effettuato la PCR, all interno della soluzione oltre al tratto amplificato sono presenti: primers, dntps, Taq polimerasi e tampone di

Next-generation sequencing, annotazione, ed espressione genica. Giulio Pavesi Dip. Bioscienze Università di Milano

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine

Come studiare un genoma complesso. 1. Costruirne la mappa

Il flusso dell informazione genetica. DNA -->RNA-->Proteine

Polimorfismi LEZIONE 6. By NA 1

CAPITOLATO TECNICO PER DIAGNOSTICI PER TIPIZZAZIONE MOLECOLARE DA DESTINARSI AL LABORATORIO DI GENETICA MOLECOLARE-MEDICINA LEGALE P.O.

FINALITA : evidenziare la. cromosomiche fetali.

LA TRADUZIONE E IL CODICE GENETICO

Analisi molecolare dei geni

Dal DNA alle proteine: La trascrizione e la traduzione

Come si traccia un alimento di origine animale? Dalle lasagne con carne di cavallo. alla realtà di ogni giorno

TRASCRIZIONE

Come ordinare Geni sintetici Online

Varianti del genoma umano

Organizzazione del genoma umano II

Struttura e funzione dei geni. Paolo Edomi - Genetica

Alcuni aspetti legati al calcolo bioinformatico su CRESCO. Giuseppe Aprea UTMEA-CAL

ANALISI POST-GENOMICHE TRASCRITTOMA: CONTENUTO DI RNA DI UNA CELLULA.

Nuovi ruoli dei telomeri e della telomerasi

Francesca Ceroni. Biotecnologie tradizionali. Biologia Sintetica. F. Ceroni 16/09/2010. Bressanone GNB ) DNA ricombinante 2) PCR

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo

Ruolo dei test di clonalità nei disordini linfoproliferativi

Perché abbiamo deciso di sequenziare il genoma umano

Linguaggi di programmazione

DOLFINI DILETTA MATRICOLA

SCREENING NEONATALE RISPARMIO PER IL SERVIZIO SANITARIO NAZIONALE?

20 febbraio Muore Renato Dulbecco

Analisi della Malattia Minima Residua

LA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri

Fibrillina Sindrome di Marfan sindrome di Marfan sindrome di Marfan Sindrome di Marfan Fibrillina 1

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.

DNA non codificante ncdna

GENERALITÀ SULLA CUSTOMER SATISFACTION

Il sequenziamento del genoma umano

SAGE: Serial Analysis of Gene Expression

Un codice genetico per i mangimi, a tutela della qualità e della sicurezza nella produzione di latte, formaggi e carni Diego Breviario

Genetica dei microrganismi 3

Lo studio prenatale dei cromosomi fetali:

PCR (Polymerase Chain Reaction)

RNA polimerasi operone. L operatore è il tratto

Biotecnologie ed OGM. Prima parte: DNA ricombinante e microorganismi geneticamente modificati.

PROGRAMMA di BIOLOGIA/MICROBIOLOGIA per la classe IIIB Tecnologico

Dal seme alla farina: metodi tradizionali e innovativi per la tracciabilità genetica dei cereali

Safety Tutor UN SISTEMA PER LA SICUREZZA STADALE. Principi opera+vi, pun+ di forza ed efficacia del sistema

immagine Biologia applicata alla ricerca bio-medica Materiale Didattico Docente: Di Bernardo

Effetti sulla distribuzione del reddito

Il valore dell analisi prenatale non invasiva (non-invasive prenatal testing, NIPT). Un supplemento per il flipbook del consulente genetico

PCR. PCR o reazione di polimerizzazione a catena. Amplificazione esponenziale di DNA. Puo amplificare un tratto di DNA per piu di 1 milione di volte

SOLUZIONI AI PROBLEMI DEL CAPITOLO 21. Domande concettuali

Analisi di dati di sequenziamento del trascrittoma (RNA-Seq):

Meccanica degli Azionamenti

Transcript:

Sequenziamento e analisi di genomi completi

Genoma L'insieme del materiale genetico di un organismo o cellula. (Hans Winkler, 1920) Un genoma è sequenziato quando viene stabilita interamente la successione delle basi nei cromosomi.

Acquisizione di genomi completi Quali ragioni per sequenziare un genoma? Quali organismi sequenziare? Come ottenere una sequenza genomica?

Genomi a bassa risoluzione : mappature genetiche e fisiche MAPPA GENETICA: un set ordinato di geni sul cromosoma, la distanza tra i quali è espressa in unità di ricombinazione genetica (centimorgan) MAPPA FISICA: un set ordinato di frammenti di DNA sul cromosoma, la distanza tra i quali è espressa in unità fisiche (paia di basi).

Costruzione di una mappa genetica

Costruzione di una mappa fisica del genoma Diversi metodi: Radiation hybrid cell lines (applicabile solo a mammiferi), Methylation filtration, High C0t selection, Happy mapping, DNA fingerprinting. Quello più comunemente usato è il DNA fingerprinting

Mappe fisiche ottenute con DNA fingerprinting a) Libreria BAC (Bacterial artificial chromosome) dimensioni inserti ~100 kb b) DNA fingerprintig dei cloni c) Assemblaggio automatico dei cloni con bande condivise d) Raffinamento manuale; e) Verifica e allineamento con altre mappature.

Confronto tra mappe genetiche e mappe fisiche

Sequenziamento del DNA Metodo: terminazione della catena con dideossinucleotidi + elettroforesi (Sanger, 1970) Vantaggi: procedure robotizzate per la preparazione dei campioni. Strumenti capaci di diverse reazioni in parallelo. High throughput, low cost. Limiti: < 800 basi di sequenza di qualità per lettura

Metodi per ottenere sequenze contigue > 1kb Walking Shotgun

Assemblaggio sequenziamento shotgun Contig Scaffolds Complete

Ridondanza e copertura in un sequenziamento shotgun

Problema dell'assemblaggio shotgun : sequenze ripetute Regione ripetuta

Metodi di sequenziamento dei genomi Sequenziamento shotgun clone by clone Whole genome shotgun (WGS)

Sequenziamento shotgun clone by clone Libreria con larghi inserti cromosomici. Cloni BAC ~100-200 kb Costruzione di una mappa fisica del genoma, selezione del numero minimo di cloni per coprire il genoma (minimal tiling path) Frammentazione casuale e sequenziamento shotgun dei cloni. Assemblaggio delle sequenze

Minimal tiling path Clone Library Minimal Tiling Path

Whole genome shotgun (WGS) Libreria shotgun: corti inserti 1.5-3 kb Sequenziamento shotgun dei cloni. Assemblaggio delle sequenze

Qual'è la strategia migliore di sequenziamento? Organismi monocellulari con genomi piccoli (<20Mb) e poche regioni ripetute: WGS Organismi multicellulari con genomi grandi, ricchi in sequenze ripetute: clone by clone? WGS?

Strategie di sequenziamento per genomi di organismi multicellulari Nature Reviews Genetics 2; 573-583 (2001)

clone by clone Vs WGS Human Genome Consortium Celera Fisical map, 45.000 BAC 27.000.000 clones individual BAC shotgun sequencing whole shotgun sequencing Assembly 10 years 1 years Assembly

clone by clone Vs WGS: regioni ripetute Ripetizioni con identità >97% e lunghezza >15kb molto difficilmente risolvibili dall'approccio WGS

Miglior compromesso tra velocità e accuratezza: strategia ibrida di sequenziamento Clone by clone + WGS

Strategie di sequenziamento per genomi di organismi multicellulari Nature Reviews Genetics 2; 573-583 (2001)

Completamento delle sequenze genomiche Draft sequence Scaffol d Lacuna di sequenza Finished sequence >95% genoma <0.01% errore Scaffol d Buchi fisici Fase di finishing Lacuna di sequenza

Confronto tra sequenze Draft e Finished Nature 431, 931-945 (21 October 2004); Finishing the euchromatic sequence of the human genome Finished sequence gap inversioni Draft sequence

Costi e tempi per il sequenziamento di un genoma eucariotico (gennaio 2005) Organismo: Tuber borchii Dimensione stimata genoma: 30 Mb Laboratorio di sequenziamento: BGI - Beijing Genome Institute Costo sequenziamento WGS: 3.8 euro / 1 kb Costo genoma 1x: 114,000 euro Costo genoma 10x (>95%): 1,114,000 euro Tempo sequenziamento: ~ 1 Mb / h Tempo completamento 10x: 4 mesi

Analisi di genomi completi Identificazione e annotazione dei geni, predizioni funzionali Genomica comparativa: - Larga scala: evoluzione genomica (duplicazioni, riarrangiamenti) - Piccola scala: nascita di nuovi geni inattivazione di geni ancestrali

Identificazione delle ORFs (Open Reading Frames) Barre continue: codoni di stop Trattini: codoni d'inizio In sequenze non codificanti un codone di stop è atteso ogni ~20 codoni (3/64)

Identificazione di geni in genomi procariotici

Complicazioni nell'identificazione dei geni in genomi eucariotici Struttura interrotta dei geni. Grande quantità di DNA non codificante Presenza di pseudogeni Codon usage spesso più equilibrato Metodi per l'identificazione: Ab inizio (ricerca ORF, codon usage, modelli giunzione introni/esoni, elementi regolatori upstream e downstream) Comparativi (confronto con sequenze proteiche o sequenze EST)

Accuratezza dei gene-finder eucariotici Evaluation of Gene-Finding Programs on Mammalian Sequences Gen Res, 2001 (No. of sequences) number of sequences effectively analyzed by each program; in parentheses is the number of sequences where the absence of gene was predicted; (Sn) nucleotide level sensitivity; (Sp) nucleotide level specificity; (AC) approximate correlation; (CC) correlation coefficient; (ESn) exon level sensitivity; (ESp) exon level specificity; (ME) missed exons; (WE) wrong exons; (PCa) proportion of real exons that were partially predicted (only one exon boundary correct); (PCp) proportion of predicted exons that were only partially correct; (OL) proportion of predicted exons that overlap an actual exon. AC and (ESn+ESp)/2 are given with standard deviation. In assenza di una conferma sperimentale o di forti evidenze comparative una sequenza codificante identificata in un genoma è da considerarsi una realtà ipotetica: hypothetical protein

Caratteristiche notevoli del genoma umano The Sequence of the Human Genome, Science 2001

Uomo-scimpanzé Science Dec 12 2003: 1960-1963