IL SEQUENZIAMENTO del GENOMA della VITE: PERCHE e COME M. Enrico PèP Scuola Superiore Sant Anna La RIVOLUZIONE GENOMICA: COME CAMBIA LA BIOLOGIA
SIGNIFICATO MODERNO DI GENOMA Il contenuto complessivo del MATERIALE GENETICO - DNA - In una cellula, organismo o specie Rappresenta il potenziale in termini di funzionalità di un organismo La Complessità di un Genoma è espressa come numero di paia di basi (base-pairs, bp) 1 Mbp = 1 milione di bp FLUSSO DELL INFORMAZIONE GENETICA: DAL DNA ALLE CARATTERISTICHE DI UN ORGANISMO GENOMA GENI RNA mrna TRASCRIZIONE TRADUZIONE PROTEINE METABOLISMO FISIOLOGIA FENOTIPO: aspetto, caratteri osservabili
REPLICAZIONE AMBIENTE INTERAZIONI COMPLESSE PORTANO AL FENOTIPO GENOMA GENI TRASCRIZIONE RNA mrna TRADUZIONE PROTEINE QUANTITA STRUTTURA ORGANIZZAZIONE STRUTTURA FUNZIONE REGOLAZIONE FENOTIPO METABOLISMO FISIOLOGIA MUTANTI PREVISIONE MODELLI ADATTAMENTO Several Overlapping Revolutions: 1. The Original One Nature 409, February 2001 3000 Mbp Plant Genomes Publicly Released Arabidopsis thaliana 2001 125 Mbp Rice 2002 370 Mbp Poplar 2006 530 Mbp Vitis vinifera 2007 490 Mbp Papaya 2008 380 Mbp Maize 2009 2300 Mbp Peach, Apple, Tomato, Potato 2010?? Sorghum, Citrus, Soya, Banana et al
Sequenziamento del DNA ACGTGACTGAGGACCGTG CGACTGAGACTGACTGGGT CTAGCTAGACTACGTTTTA TATATATATACGTCGTCGT ACTGATGACTAGATTACAG ACTGATTTAGATACCTGAC TGATTTTAAAAAAATATT METODO SANGER DELL INTERRUZIONE DELL ALLUNGAMENTO DELLA CATENA
Sequenziamento del DNA : separazione dei frammenti La Prima Rivoluzione - Based on Sanger chemistry (1968) - Very accurate - Complex organization - Specialized Centers - Time-consuming Years - Costly 500 Mbp = 1 Million
GENOMICA GENOMICA è la disciplina che analizza - Struttura - Contenuto Informativo - Funzione del Genoma nel suo insieme Metodi: 1. Analisi del genoma (produzione dati) 2. Informatica Acquisiszione, mantenimento e analisi (data mining) Structural and Functional Characterization of Vitis vinifera Genome The French - Italian Public Consortium for the Sequencing of the Grapevine Nuclear Genome
FILOSOFIA DELLA RICERCA Progetto Genomico Conoscitivo con la Vite come Organismo di Studio Obiettivi Genomici Ricerca Applicata Implementazione di Piattaforme Nazionali per l Analisi l Genomica a) upgrade tecnologico b) formazione di una nuova generazione di giovani ricercatori con solide competenze genomiche Sviluppare e Applicare Strumenti Genomici alla Vite a)progetti Applicativi Pilota b)interfaccia con specialisti e ricercatori del settore STRUTTURA del PROGETTO LIVELLO 1 Genomica Strutturale Identificare la sequenza del DNA, il numero e la posizione dei geni nei cromosomi LIVELLO 2 Genomica Funzionale Studia la funzione dei geni e la rete di connessioni tra i diversi geni e il metabolismo di un organismo LIVELLO 3 Progetti Applicativi Si focalizzano su aspetti molto particolari come la resistenza a malattie, la maturazione del frutto, la tipizzazione di diversi vitigni.
Gruppi Coinvolti Gruppi Consorzio Interuniversitario Nazionale + Consiglio per la Ricerca in Agricoltura (CRA) 17 gruppi di ricerca ENEA Centro Ricerche Casaccia, Roma CNR Dip. di Bioinformatica e Genomica, Bari CIB Consorzio Interuniversitario per le Biotecnologie, Trieste Università di Bari Università di Milano Scuola Superiore Sant Anna - Pisa Università di Padova Università di Siena Università di Udine Università di Verona Centro di Ricerca per la Viticoltura Conegliano Veneto Centro di Genomica e Post-Genomica Fiorenzuola d Arda COME SI SEQUENZIA IL GENOMA della VITE? ~500 milioni di paia di basi Clonazione Shotgun sequencing (genomi equivalenti) Assemblaggio Predizione genica Annotazione
SEQUENZIAMENTO GENOMA della VITE ~500 milioni di bp Obiettivo: 12 GENOMI EQUIVALENTI (12x) Clone omozigote (~ 93%) PN40024 Derivato da Pinot noir and Helfesteiner dopo 6 cicli di autofecondazione (Colmar, Fr) FRANCIA GENOSCOPE 7 x CRIBI Padova 2.0 x ITALIA 5 x IGA Udine 3.0 x AUTOMAZIONE del SEQUENZIAMENTO del DNA 8 MILIONI di Sequenze ~ 6 MILIARDI di bp Costo ~ 1 Milione di Euro per 500 milioni di bp Attività iniziata nel Gennaio 2006 Completata Agosto 2007
Dal Genoma della Vite Grandi Scoperte e Sorprese Annotazione dei Geni di Vite (1) Geni Predetti : 30,434-372 codoni e 5 esoni per gene - Esoni Codificanti ~ 7% del genoma - Introni ~ 36.7 % del genoma Confronto con le altre piante Vitis vinifera Arabidopsis Riso 30.434 ~ 30.000 45.555 37.544 Homo sapiens ~ 23.000 Pioppo
Y = Cromosomi di vite da 1 a 19 Il Genoma della Vite è un a Paleo-esaploide Originatosi da 3 Genomi Ancestrali 9, 4, 11 Ogni punto è una coppia di geni paraloghi 6, 8, 13 X = Cromosomi di vite da 1 a 19 Annotazione dei Geni di Vite (2) Ortologia con altre specie No. Proteine ortologhe Pioppo 12,999 Arabidopsis 11,404 Riso 9,731 Eudicotiledons 10,547
Vitis/Pioppo Ch.6 Ch..8 Ch.13 Vitis/Arabidopsis Vitis/Riso Poliploidizzazione ed Evoluzione delle Piante
Recostruzione del Genoma Ancestrale: 7 cromosomi? Il genoma della vite ha subito meno cambiamenti GAATTCACGC TTTAAGGCTA TGGCCACCTT TAAATAAAGT ACAGCATTAC TAAAAAAAAA La Regolazione dell espressione espressione genica è alla TAAATAAATA ACCAATACAA ATCTTTTCAG AGACAAATGC ATTCTCTGAC ATCTGAGGTT 1 ACAGCAAATC TCTTCTTCAC CTGTTTGCTT base della GTTTAGAGTT vita GTAATATTTG CTTTGGTGTA 1 GAGCTGAAGA CATAAATTGG TAACCAATGG AATTATCTGG CCTCAGACTT TATTTATTTT 1 CATCATTTAT TTCACTGATG TGCAAATTTA Genoma TTCCGTACCA GCAAATGTCA ATTTAATTAT 1 ATTCTACAGT ACACAGTGAA TCATGTATAC TTAGTCAAGT TGTAAATACA CTAAACCATA 1 TAAACTCACA ACAGTATATC AGCTCATGAT GGGTAAATGA CTTTTCCCTG AGAAAGAGTA 1 TCTGTTTAAC CTGCATGATC TCACTCTTTA GTATTTGCTT CTTTAGTCGA CGTTTGTTTC 1 CTAGTTTTGA ATATAATCAT Gene 5 GATATGGAGA GACAAGTGAA ATCACCACAA Gene 10 TTTTGTTTTC Gene 4 Gene 9 1 CAAAATGGGA GACTATGCAA ATGCTGAAAT GAGAATTAAT ACATCCAAAA TATCGAACCA Gene 3 Gene 8 1 CAATTATGGC TTTGCTTTAC TTTTTGCCCG TAAGAGACAT GTGGCCTAGA ATAGGTGGC Gene 2 Gene 7 1 GGTATTCCTA CCACAACCTT GCTTAGCATA GTGGTTGACT AAATATAAAT TTTAGAGATG Gene 1 Gene 6 1 AAGGTTGTTC TATACCCAGA TTTCAACGTG ATTGCTATGC CCACTTCACT TTCTTTAAAA 1 TACATATTTT TCTTACTTCT CACTTTCTTT TTCTTCTTGG TTGACATTTT TTGGCTCAGG 1 GATTTTTTTT TTCCTTATGA TCTCAAGAAA TTTTTCTCAT TGAAAAAGAC ATAATCGTGC 1 TGGGAGTGGT GGCTCATGCT TGTAATCCCA GCACTTTGGG AGGCTGAGGC TGGTGGAT 1 CCTGAGGTCA GCAGTTACAG ATGAGCCCGG CCAAAATGGT GAAACCTCAT CTCTACTAA 1 AATACAAAAA TTTGCCAGGT GTGGTGGCAG GCACTTGTAA TCCCAGCCAC TCGGGAGG 1 GAGGCAGGAG AATCGCTTGA ACCCAGGAGG CAGAGGTTGC AGTGAGCCAA GATCATT 1 TTGGACTCTA GCAGGGTGAC AAGAGCAAAA CTCCATCTCA GGAAAAAAAA AATCATAAA 1 TTTCCCATAT GAAAAAAATA ACACAAGATC CGGAATACAG AGAGGAGCAT AATCCTTTG 1 AGGTCATAGA TGTAATCTTT CTTCCAGGAA AAATTTATTT CAGATAAGAC CAGAATTGGA 1 AACATATTCC ATGCCGTCAG ATAGCACTGG CTTAGGAGAC GAATGAGGAG GAGCCTGC 1 GCTACCTCAA GGATAAGAAG CAGGCAAAAG GCAAGCACAG GGGCGGCATG CACTCAC 1 GGGGCTGCTC CTTCCTGGGC AAGTTTCAGA AACTCACTGA CAGAGCTAGC AGCTCCCA 1 GAGATGAATG CCCATGTTTT CCCGAAGGGA GAACTGATGC TTAGAAAGGC TGAATGAC
ANALISI DELLA STRUTTURA DI UN GENE: COSA SI PUO STUDIARE? Determinazione Colore del Frutto interruttore acceso VvmybA1 VvmybA1a interruttore spento VvmybA1b interruttore parzialmente acceso ANALISI DELL ESPRESSIONE ESPRESSIONE GENICA: QUALI INTERRUTTORI SI ACCENDONO E QUANDO? Su un unico chip in silicio si analizzano tutti i geni contemporaneamente
A total expressed genes common bud inflorescence_30.4 inflorescence_9.5 inflorescence_23.5 inflorescence_26.5 tendril_30.4 tendril_9.5 tendril_10.6 leaf_30.4 leaf_10.6 stem woody_stem seed_10.6 seed_30.6 berry_fruit_set berry_post_fruit_set berry_vèraison berry_pre_ripening berry_ripening berry_phw_i Atlante di Espressione 8,530 genes 18,214 genes total expressed genes common expressed genes bud inflorescence tendril leaf stem seed berry dried berry 0 2500 5000 7500 10000 12500 15000 17500 20000 Number of expressed genes ANALISI DELL ESPRESSIONE GENICA: QUALI INTERRUTTORI SI ACCENDONO E DOVE? Un raggio laser, guidato da un microscopio taglia singole cellule, per studiare l espressione l dei geni in gruppi di cellule distinti.
Campi di Applicazione: Sviluppo e Resistenza a Malattie PROGETTO SEQUENZIAMENTO: RISORSE FINANZIARIE MiPAF: 6.5 milioni nell ambito di un accordo bilaterale di cooperazione scientifica Italia Francia siglato tra CRA e INRA Instituto di Genomica Applicata, Udine 2 milioni Regione Veneto, Comparto Viti Vinicolo 1.5 milioni Fondazioni Bancarie Cariverona Monte dei Paschi di Siena 0.50 milioni 0.17 milioni
SECONDA RIVOLUZIONE GENOMICA 2 X 10 7 etichette di 100 bp 1 Esperimento di 7 giorni = 2 Miliardi di bp al costo di ~ 5 mila euro RISEQUENZIAMENTO
Alleles Identification is NO LONGER the Bottle Neck Alignement of TAGs to the reference sequence and identification of Single Nucleotide Polymorphisms High Through-put Genotyping Illumina Bead-array array Genotype Separation 3 micron diameter beads 50,000 SNP in one run
DEEP SEQUENCING OF TRANSCRIBED DNA (RNA Seq) Differential gene expression Genes missed Transcribed transposable element Validation of mirna prediction
Classic DEMOCRATIZATION of GENOME SEQUENCING Second-generation Sequencing Centers Single Labs A Few Remarks No Cutting Edge Research in Life Science wihout Genomics Not Enough Debate on this Issue GATTACA Scenario Fast Approaching Are we Ready? Complexity of Data Handling, Storage and Analysis Only Bioinformaticians? Necessity / Utility of a Reference Genome De novo Sequencing or Re-sequencing? Is Genomics really Democratic? Which Role for Small Labs? Genomics is and will be Expensive for quite a while Not Affordable by Emerging Countries
Second Generation Sequencers at the Joint Genome Institute OUR STRATEGY Genomics at Scuola Superiore Sant Anna Genomics will be one of the Pillar of Life Sciences at SSA Strategic Alliance with Istituto Genomica Applicata in Udine Establishment of a New Bio-informatics informatics Group Education and Training in Plant genomics is already a reality