DNA antico
Il DNA antico (adna) «Con Il termine DNA antico (ancient DNA = adna) si indica qualsiasi traccia di DNA proveniente da un organismo morto o da parte di esso, o anche DNA estratto da campioni biologici non recenti come il DNA contenuto in una goccia di sangue coagulata, nello sperma, o nelle poche cellule epiteliali che si possono ritrovare nel mozzicone di una sigaretta. Quindi se vogliamo essere più precisi si può considerare antico qualsiasi DNA che è stato sottoposto a processi autolitici o diagenetici.»
FATTORI CHE DETERMINANO LA DEGRADAZIONE DEL DNA ATTIVITÀ ENZIMATICA CELLULARE ATTIVITÀ MICROBICA ph AZIONE DELL OSSIGENO TEMPERATURA RADIAZIONI U.V. UMIDITÀ STRESS MECCANICO
Caratteristiche del DNA antico Post morten damages: - comparsa di siti abasici (depurinazione) - modificazione di residui glicosidici e di pirimidine - comparsa di cross-link intermolecolari filamento indebolito DNA altamente degradato
La deaminazione delle citosina rappresenta il danno più frequente durante la degradazione del DNA. Essa determina una misincorporazione durante la replicazione del DNA che è una sorta di signature del DNA antico: C T CITOSINA URACILE
Caratteristiche del DNA antico poche molecole grande frammentazione presenza di siti nucleotidici non identificabili presenza di composti chimici inquinanti procedure di determinazione delle sequenze molto laboriose grande attenzione all autenticità del risultato
La contaminazione Uno dei principali problemi per lo studio del DNA antico/degradato è la contaminazione da parte di DNA esogeno di origine moderna. Il DNA esogeno può essere di origine batterica (principale), vegetale, animale o umana, o può anche essere il prodotto di precedenti esperimenti (DNA amplificato). Nello studio del DNA antico umano la contaminazione da parte di DNA umano moderno è una delle principali limitazioni.
La contaminazione deposizione deposito scavo/museo laboratorio TEMPO adna adna/ moddna moddna moddna sepolture multiple, riti funerari, patogeni microorganismi, piante, animali CAUSE personale, archeologi, antropologi personale del laboratorio PCR
Ancient DNA do it right or not at all -Science 2000: Aree di lavoro fisicamente separate Controlli negativi sia in fase di estrazione che amplificazione Amplificazione di piccoli frammenti max 200 bp Riproducibilità del dato: stesso risultato da differenti estratti Clonaggio Riproducibilità dell intera fase sperimentale (da un altro operatore o in un altro laboratorio) Grado di preservazione biochimico (TGA Racemizzazione) Quantificazione delle molecole (PCR competitiva)
IL PROBLEMA DELLA CONTAMINAZIONE POST - PCR PRE - PCR LA STRUTTURA DEL LABORATORIO
Il controllo della contaminazione
COME SI EFFETTUA UNO STUDIO SUL DNA ANTICO
PREPARAZIONE dei CAMPIONI
PREPARAZIONE dei CAMPIONI
ESTRAZIONE DEL DNA Almeno due estrazioni per ogni campione, possibilmente da distretti ossei diversi
APPROCCIO TRADIZIONALE
SELEZIONE E AMPLIFICAZIONE DEL TARGET TRAMITE PCR (Polymerase Chain Reaction) MULTIPLE amplificazione di frammenti di piccole dimensioni (100-150bp) per poter analizzare regioni di dimensioni maggiori è necessario allestire reazioni multiple di regioni parzialmente sovrapposte e poi ricostruire manualmente la sequenze intera
CLONAGGIO DEI PRODOTTO DI PCR Recupero di cloni multipli (5-20, o anche di più, per ogni amplificato) Procedura preliminare al sequenziamento che permette di ottenere informazioni sul grado di preservazione delle molecole (misincorporazioni) e sulla presenza di eventuali contaminazioni da parte di altro DNA
SEQUENZIAMENTO DI CLONI MULTIPLI
RICOSTRUZIONE DELLA SEQUENZA CONSENSO 250 bp 120 bp 120 bp 120 bp procedura laboriosa, limitata all analisi di centinaia o poche migliaia di paia di basi
APPROCCIO DI NUOVA GENERAZIONE
amplificazione e sequenziamento simultaneo di numerose regioni di DNA (anche genomi completi) preparazione di librerie genomiche e utilizzo di sequenziatori automatici high throughput (Next Generation Sequencing, NGS)
EVOLUZIONE delle METODICHE di SEQUENZIAMENTO: Le tecnologie di sequenziamento del DNA ed RNA di nuova generazione (Next Generation Sequencing, NGS) hanno rappresentato negli ultimi anni una vera e propria rivoluzione nella ricerca biologica e biomedica, consentendo di osservare fenomeni biologici ad un livello di dettaglio finora impensabile. Queste nuove metodiche high throughput permettono di ottenere grandi quantità di informazioni genetiche in un unico ciclo di sequenziamento con costi estremamente più bassi rispetto al passato rendendo possibile l analisi simultanea di centinaia di migliaia di varianti genetiche così come il sequenziamento di genomi e trascrittomi completi. Parallelamente allo sviluppo tecnologico è seguita la necessità di sviluppare algoritmi bioinformatici specifici in grado di gestire l'ingente mole di dati prodotti dalle piattaforme NGS e permetterne la corretta interpretazione.
EVOLUZIONE delle METODICHE di SEQUENZIAMENTO: 2010 2005 2004 Illumina GA2 ~10 8 fragments per run 454 GS20 ~10 5 fragments per run ABI 3730 ~10 2 fragments per run
NGS procedure Target sample Llibrary preparation Library amplification Sequencing Reads analysis Signal detecion and analysis T C G A Final data T C G A
Library preparation - NGS Common steps Target DNA Fragmentation Nitrogen nebulization Sonication Shearing Fragment end polishing Adapters ligation Amplifiable Library
Library amplification Emulsion PCR, 454/Roche Library captured onto beads surface Water in oil emulsion creates microreactors millions of DNA fragments amplified onto beads surface recovery of DNA beads by emulsion breaking enrichment to eliminate null beads and recover positive bads
454 workflow Beads deposition onto PicoTiterPlate (PTP) Pyrosequencing
Library amplification - Illumina Bridge amplification High-density primers attached to the slide Solid-phase amplification 100 200 million spatially separated template clusters
Illumina sequencing technology I attachment of fragmented DNA to a optical surface bridge amplification : flow cell with >50 million clusters, each containing ~1,000 copies of the same template CRT and laser excitation
Illumina sequencing technology II
Pooling together more/different samples Multiplexing MID/Index/Barcodes ligation Multiplexed Amplifiable Library
Reads analysis - SeqMan Software Assembler Reference sequence Reads
Preparazione delle library in campioni antichi (Meyer and Kirker, 2010. Modificato)
I) Blunt-end repair: estremità sporgenti al 5 o 3 vengono pareggiate tramite rimozione o ricostruzione della sequenza, mediante T4 DNA polymerase. Gruppi fosfati vengono attaccati al 5 mediante T4 polynucleotide kinasi Mastermix for one reaction Temperature profile Reagents Volume T Time (min) (μl) ( C) NEBuffer 2 (10X) 5 15 15 dntps (2.5 mm) 2 25 15 ATP (10 mm) 5 T4 Polynucleotide 2 Kinase (10U/μL) T4 Polymerase (3 0.4 U/μL) BSA (10 mg/ml) 4 H 2 O 11.6 Template 20 Total 50
II) Adapter ligation: Due adattatori (P5 e P7) vengono legati ad entrambe le estremità dei filamenti mediante T4 DNA ligasi. Mastermix for one reaction Temperature profile Reagents Volume (μl) T ( C) Time (min) Quick Ligase Buffer 20 Room T 20 (2X) Solexa Adapter Mix 1 Template 18 Quick Ligase 1 Total 40
III) Adapter Fill-in: con Bst polymerase per rimuovere eventuali nicks Mastermix for one reaction Temperature profile Reagents Volume T Time (min) (μl) ( C) Thermopol Buffer 4 37 20 (10X) dntps (2.5 mm) 2 80 20 Bst Polymerase 2 (8U/µl) H 2 O 12 Template 20 Total 40
IV) Indexing PCR: inserimento degli indici individuali con amplificazione. Ciascun campione viene suddiviso in 4 reazioni per eliminare l effetto inibitore dei reagenti derivanti dalla precedente reazione Mastermix for one reaction Temperature profile Reagents Volume T Time (μl) ( C) NEBuffer 2 (10X) 9,27 95 12 min 25mM MgCl2 9,27 98 30 sec 25mM dntp mix 1,47 58 30 sec 10mg/ml BSA 2,21 72 45 sec AmpliTaq Gold 1,47 x 10 cicli H 2 O 63,11 72 10 min Template 9,25 10 Forever p7 Index Primer 2 P5 Index Primer 2 Total 100
V) Phusion PCR: per aumentare il numero di molecole fino a 1x10 12 copie/ µl e arrivare alla quantità necessaria come input per il sequenziamento vero e proprio Mastermix for one reaction Temperature profile Reagents Volume T Time (μl) ( C) Phusion HF Buffer 20 95 12 min (5X) Bridge Primer P7 3 95 30 sec (10µM) Bridge Primer P5 3 60 30 sec (10µM) 25mM dntp mix 1 72 40 sec Phusion 1 x 8-12 cicli Polymerase H 2 O 53 72 5 min Template 19 10 Forever Total 100
DNA extraction Adapters NGS library building 0.1% Endogenous DNA
NUOVO APPROCCIO METODOLOGICO: Target selection Genome enrichment per pescare o catturare solo alcune specifiche regioni genomiche all interno di una libreria NGS utilizza sonde a DNA complementari alle regioni genomiche di interesse per selezionarle sfrutta l interazione tra le molecole di biotina e di streptavidina coniugate a supporti magnetici (biglie) per catturare solo i frammenti di DNA selezionati dalle sonde
NUOVO APPROCCIO METODOLOGICO: Target selection Genome enrichment Vantaggi rispetto alla PCR: numero maggiore di target permette di analizzare anche frammenti molto corti (<50bp, fino a 30-20bp) Mantiene inalterate le caratteristiche molecolari delle molecole originali estratte dai campioni (lunghezza, siti di frammentazione)
Target selection Genome enrichment I PEC Primer Extension Capture Applicata al sequenziamento di 5 genomi mitocondriali neandertaliani 574 PEC primers per l intero mtdna
Primer Extension Capture (PEC) Complete mitochondrial DNA (mtdna) genomes of five Neandertals J Vis Exp. 2009 Sep 3;(31):1573. doi: 10.3791/1573. Briggs AW, Good JM, Green RE, Krause J, Maricic T, Stenzel U, Pääbo S. http://www.jove.com/video/1573/pri mer-extension-capture-targetedsequence-retrieval-fromheavily?id=1573 PEC hybridization PEC design PEC target discrimination Primer extension of target sequence Target recovery: Ready for 454 seq.
Target selection Genome enrichment II Sonde ottenute da LONG RANGE PCRs 2 long range PCR per ottenere prodotti parzialmente sovrapposti che coprono l intero mtdna, realizzate su DNA moderno estratto da saliva Frammentazione (100-400bp) Legame con adattatori biotinilati Immobilizzazione su biglie magnetiche
Sonde ottenute da LONG RANGE PCRs le sonde immobilizzate sulle biglie vengono incubate insieme alle librarie indicizzate ibridazione cattura eluizione e recupero solo delle molecole complementari alla sequenza delle sonde
CATTURA DEL DNA MITOCONDRIALE IN CAMPIONI ANTICHI (E NON) Vengono generati 2 prodotti di PCR long-range (crica 8500bp) parzialmente sovrapposti che coprono l intero mtdna, a partire da DNA moderno fresco (estratto da saliva) I 2 prodotti di PCR vengono frammentati per ultrasonicazione per produrre frammenti di circa 300pb I frammenti vengono biotinilati legandosi a corti adattatori biotinilati I frammenti vengono denaturati e immobilizzati su biglie magnetiche di streptavidina -> sonde
2µg di library indicizzata vengono incubati insieme alle sonde biotinilate in una Hybridizaton Mix in rotazione per 2 notti a 65 C Le biglie con la enriched library (catturato) vengono recuperate magneticamente ed eluite in NaOH L eluito viene purificato e amplificato per raggiungere 1x10 12 copie/µl circa, quantità ottimale per il sequenziamento
NGS Output
NGS Output
Fragment size Patterns of damage in adna Deamination C > T G > A