Banche Dati Primarie di Biosequenze
|
|
- Saverio Savino
- 6 anni fa
- Visualizzazioni
Transcript
1 Descrizione Ie banche dati primarie delle sequenze nucleotidiche EMBL, GenBank e DDBJ sono una collezione di sequenze di DNA e RNA che provengono dalla letteratura scientifica e dalle sequenze brevettate. Le sequenze sono direttamente sottomesse alla banca dati dagli autori. La collezione e organizzata in divisioni e distribuita come flat-file.
2 Divisioni Le entries sono raggruppate in divisioni. Le suddivisioni sono determinate su base tassonomica. Alcune divisioni, come le EST rappresentano un eccezione in quanto raggruppa le Expressed sequences tags oppure le transcribed sequences fragments. Le sequenze EST, sono a loro volta suddivise in divisioni tassonomiche: Fungi ESTs Human ESTs Invertebrate ESTs Other Mammal ESTs Mouse ESTs Plant ESTs Prokaryote ESTs Other Rodent ESTs Vertebrate ESTs
3 Lista delle divisioni relative al Release 72 dell EMBL Division Entries Nucleotides Constructed ,651,039 ESTs 12,579,887 6,092,593,479 Fungi 66, ,701,680 GSSs 3,655,432 2,024,373,612 HTC 37,702 46,534,142 HTG 59,643 8,133,591,288 Human 224,748 3,514,807,268 Invertebrates 99, ,543,766 Other Mammals 41,221 63,140,744 Mus musculus 59, ,735,008 Organelles 158, ,281,571 Patents 702, ,836,041 Bacteriophage 2,172 6,839,416 Plants 127, ,154,945 Prokaryotes 154, ,654,436 Rodents 23,458 35,679,406 STSs 124,500 49,120,860 Synthetic 6,755 13,005,812 Unclassified 1,358 2,016,758 Viruses 161, ,788,744 Other Vertebrates 38,145 68,136,131 Total 18,324,246 23,090,186,146
4 Convenzione Dati di Sequenza Le sequenze nucleotidiche presenti nella banca dati sono memorizzate cosi come sottomesse dagli autori. Le sequenze sono sempre rappresentate nella direzione che va da 5 a 3. Le basi sono numerate in modo sequenziale a partire dalla prima posizione. Le sequenze cdna sono memorizzate nella banca dati come sequenze di RNA. Per i dati genomici viene memorizzata la strand codificante. I dati memorizzati corrispondono generalmente al wildtype prima delle mutazioni o manipolazione genetica Le sequenze delle molecole di trna sono memorizzate come trascritto prima delle modificazioni delle basi, le basi modificate sono riportate nelle feature table.
5 Classificazione e Identificazione degli Organismi La classificazione tassonomica utilizzata è comunemente condivisa dalle tre organizzazioni EMBL/GenBank e DDBJ ed e organizzata sulla base delle conoscenze filogenetiche. Queste informazioni derivano in gran parte da studi di evoluzione molecolare. Lo scopo di questa informazione e quella di fornire un utile aiuto al ricercatore, anche se a volte l informazione contenuta in queste linee, non è corretta. L informazione in queste linee è soggetta a rapidi cambi.
6 Struttura della Banca Dati - EMBL La banca dati delle sequenze nucleotidiche e costituita da entries. Ciascuna entry e costituita, a sua volta, da un unica sequenza contigua cosi come riportata in letteratura. In molti casi le entry sono assemblate come regioni di overlapping che derivano da vai lavori.
7 Struttura della Banca Dati Classificazione delle sequenze Al fine di rendere disponibili, quanto prima, i dati all utenza subito dopo la pubblicazione, le entry sono rilasciate prima di una loro completa revisione. Per fornire all utenza il grado di correttezza e il successivo lavoro da effettuare sull entry, queste sono classificate in classi. Le classi sono: Standard: Entry che rispondono perfettamente allo standard del formato Unreviewed: Entry che rispondono allo standard del formato, pero sono state riviste automaticamente e non da un esperto ; Preliminary: Solo la sequenza e le citazioni sono state sottoposte al controllo; Unannotated: Entry che contengono solamente un entry name, citazioni e sequenza Backbone: Entry che derivano dall NCBI e trasformate nel formato EMBL
8 Struttura della Banca Dati Divisioni della Banca Dati
9 Struttura della Banca Dati -EMBL Struttura dell entry La struttura delle entries, nel database, sono organizzate al fine di essere facilmente comprensibili dal ricercatore e gestibile con gli strumenti informatici. Il simbolismo utilizzato per la loro descrizione e classificazione è quello familiare al biologo molecolare. Ciascuna entry nel database e costituita da linee, dove ogni linea ha una sua definizione e formato.
10 Formato Entry ID TRBG361 standard; RNA; PLN; 1859 BP. AC X56734; S46826; SV X NI g21954 DT 12-SEP-1991 (Rel. 29, Created) DT 13-SEP-1993 (Rel. 37, Last updated, Version 8) DE Trifolium repens mrna for non-cyanogenic beta-glucosidase KW beta-glucosidase. OS Trifolium repens (white clover) OC Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; OC euphyllophytes; Spermatophyta; Magnoliophyta; eudicotyledons; Rosidae; OC Fabales; Fabaceae; Papilionoideae; Trifolium. RN [5] RP RA Oxtoby E., Dunn M.A., Pancoro A., Hughes M.A.; RT "Nucleotide and derived amino acid sequence of the cyanogenic RT beta-glucosidase (linamarase) from white clover (Trifolium repens L.)."; RL Plant Mol. Biol. 17: (1991). RN [6] RP RA Hughes M.A.; RT ; RL Submitted (19-NOV-1990) to the EMBL/GenBank/DDBJ databases. RL M.A. Hughes, UNIVERSITY OF NEWCASTLE UPON TYNE, MEDICAL SCHOOL, NEW RL CASTLE UPON TYNE, NE2 4HH, UK DR MENDEL; 11000; TRIrp;1162;1. DR SWISS-PROT; P26204; BGLS_TRIRP.
11 Formato Entry -2 FH Key Location/Qualifiers FH source /organism="trifolium repens" /db_xref="taxon:3899" /tissue_type="leaves" /clone_lib="lambda gt10" /clone="tre361" CDS /db_xref="pid:g21955" /db_xref="mendel:11000" /db_xref="swiss-prot:p26204" /note="non-cyanogenic" /EC_number=" " /product="beta-glucosidase" /protein_id="caa " /translation="mdfivaifalfvissitstnaveastlldignlsrssfprgfi FGAGSSAYQFEGAVNEGGRGPSIWDTHKYPEKIRDGSNADITVDQYHRYKEDVGIMK DQNMDSYRFSISWPRILPKGKLSGGINHEGIKYYNNLINELLANGIQPFVTLFHWDLPQ VLEDEYGGFLNSGVINDFRDYTDLCFKEFGDRVRYWSTLNEPWVFSNSGYALGTNAPGR CSASNVAKPGDSGTGPYIVTHNQILAHAEAVHVYKTKYQAYQKGKIGITLVSNWLMPLD DNSIPDIKAAERSLDFQFGLFMEQLTTGDYSKSMRRIVKNRLPKFSKFESSLVNGSFDF IGINYYSSSYISNAPSHGNAKPSYSTNPMTNISFEKHGIPLGPRAASIWIYVYPYMFIQ EDFEIFCYILKINITILQFSITENGMNEFNDATLPVEEALLNTYRIDYYYRHLYYIRSA IRAGSNVKGFYAWSFLDCNEWFAGVRFGLNFVD" mrna SQ /evidence=experimental Sequence 1859 BP; 609 A; 314 C; 355 G; 581 T; 0 other; aaacaaacca aatatggatt ttattgtagc catatttgct ctgtttgtta ttagctcatt..
12 Definizione Codici delle Linee Alcune entry possono non contenere tutti i tipi di linee, come alcune linee possono essere ripetute più volte. Tutte le entry iniziano sempre con il codice ID. Link
13 Struttura delle Linee Linea ID L identificatore ID e sempre la prima linea di un entry. La sua struttura e : ID entryname dataclass; molecule; division; sequencelength BP. ID HS7SLP standard; RNA; PRI; 377 BP. Nome Nome dell entry: dell entry: costituita costituita da da più più di di nove nove caratteri caratteri alfanumerici alfanumerici e e iniziano iniziano sempre sempre con con una una lettera. lettera. Prime Prime due due lettere lettere - - Genere Genere e e Specie Specie Altri Altri caratteri: caratteri: Associati Associati alla alla funzione funzione es. es. MMIG01,MMIG02 MMIG01,MMIG02 (Mus (Mus Musculus Musculus Immunoglobulin Immunoglobulin genes genes X X per per unannotated unannotated entry. entry. Se Se la la molecola molecola e e circolare circolare sara sara indicata indicata come come circular circular DNA DNA
14 Struttura delle Linee Linea AC La linea AC (ACcession Number), individua l accession number della sequenza. AC Y00321; J05348; Lo scopo dell accession number e quello di definire un modo stabile di identificare le entries da un release all altro release. Mentre il nome dell entry può cambiare da un release all altro, l accession number rimane invariato. I ricercatori che utilizzano le sequenze per i lori scopi e devono citare nel lavoro le sequenze utilizzate devono sempre citare il primo AC. La presenza di più AC è utilizzato per seguire le tracce delle variazioni delle entries: Ad esempio. : unione di due sequenze viene creato un nuovo AC primario e gli AC secondari sono quelli elencati dopo;
15 Struttura delle Linee Linea DT La linea DT (DaTe) indica quando un entry appare per la prima volta nella banca dati e quando e stata l ultima variazione. DT 07-NOV-1985 (Rel. 07, Created) DT 20-FEB-1990 (Rel. 23, Last updated, Version 1) Il valore assoluto relativo alla Version viene incrementato ogni qualvolta la sequenza ha subito una variazione. Permette di seguire il numero delle variazioni che la sequenza ha subito nel tempo.
16 Struttura delle Linee Linea DE Linea DE (DEscription) contiene una descrizione generale circa la sequenza. Questa può contenere il tipo di gene per la quale la sequenza codifica, la regione del genoma dalla quale deriva o altre informazioni utili a identificare la sequenza. DE Human mrna for 7SL RNA pseudogene
17 Struttura delle Linee Linea KW La linea KW (KeyWord) fornisce informazioni sulla funzionalità della sequenza. Spesso sono necessarie più linee per una singola entry. KW small nuclear RNA; pseudogene. Le keyword sono ordinate in ordine alfabetico. Se un entry non contiene nessun riferimento ad una keyword abbiamo una struttura: KW.
18 Struttura delle Linee Linea RN,RC,RP,RX,RA,RT,RL Tutte queste linee individuano i riferimenti bibliografici: RN [1] RP RX MEDLINE; RA Ullu E., Weiner A.M.; RT "Human genes and pseudogenes for the 7SL RNA component of signal RT recognition particle"; RL EMBO J. 3: (1984).
19 Struttura delle Linee Linea DR La linea DR (Database Cross-reference) riporta il link ad altri database i quali contengono informazioni in relazione con l entry. La struttura della linea: DR database_identifier; primary_identifier; secondary_identifier. DR SWISS-PROT; P03593; V90K_AMV.
20 Struttura delle Linee Linea La linea (Feature Table) fornisce un meccanismo per le annotazioni dei dati delle sequenze. In queste tabelle sono riportate tutte le regioni o i siti di interesse biologico. La strutturazione delle feature table è stata definita univocamente tra i tre gestori delle banche dati. EMBL/Genbank/DDBJ
21 Struttura delle Linee Linea SQ La linea SQ (SeQuence header) fornisce i dati relativi alla lunghezza della sequenza e alla sua composizione. SQ Sequence 462 BP; 110 A; 147 C; 135 G; 0 T; 70 other;
Banche Dati. Docente: Dr. Antinisca DI MARCO
Docente: Dr. Antinisca DI MARCO Email: antinisca.dimarco@di.univaq.it La biologia molecolare produce una grande mole di dati che può essere memorizzata in database general-purpose o specialized (es. immunological):
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2015/2016 Parsing di un file in formato EMBL (parte I) Docente del laboratorio: Raffaella Rizzi 1 Esercizio
DettagliTesina di Biologia Molecolare II
MELATO GIULIA 595033 Tesina di Biologia Molecolare II Mostra un albero filogenetico con la relazione tra Uomo, Topo e Ratto. Che banca dati è disponibile per quest'ultimo organismo? Descrivi alcune caratteristiche
DettagliInformatica e biotecnologie I parte. Informatica e biotecnologie. Banche dati biologiche: sommario. Strumenti per
Informatica e biotecnologie I parte Banche dati biologiche e analisi di sequenze CGCTTCGGACGAAATCGCATCAGCATACGATCGCATGCCGGGCGGGATAAC CGAAATCGCATCAGCATACGATCGCATGC Informatica e biotecnologie Strumenti
DettagliDataBase Biologici 1
DataBase Biologici 1 Lo sviluppo di tecnologie strumentali sempre più sofisticate ha portato ad una enorme produzione di dati biologici. Per la gestione di questi dati è quindi necessario disporre di potenti
DettagliBanche Dati proteiche
Banche Dati proteiche Un altro grande database è UniProt, The Universal Protein Resource (http://www.uniprot.org/) nel quale sono radunate le sequenze proteiche, e le annotazione delle stesse, ottenute
DettagliDatabase biologici (banche di dati biologici)
1 Lo sviluppo di tecnologie strumentali sempre più sofisticate ha portato ad una enorme produzione di dati biologici. Per la gestione di questi dati è quindi necessario disporre di potenti sistemi di archiviazione
DettagliInterazioni proteina-dna
Interazioni proteina-dna 1) Proteine che legano la doppia elica del DNA in maniera non sequenza-specifica: histone-like proteins (HU protein) 2) Proteine che legano strutture particolari del DNA: - single
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2016/2017 Formato GTF per annotare un gene Docente del laboratorio: Raffaella Rizzi 1 GTF (Gene Transfer
DettagliBanche dati molti dati sulle proteine derivano dalle banche dati primarie
Banche dati Banche dati Si possono raggruppare in varie categorie in base al tipo di dato biologico che raccolgono e organizzano, ma ce ne sono alcune che sono da considerarsi fondamentali: - banche dati
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2016/2017 I dati in Bioinformatica Docente del laboratorio: Raffaella Rizzi 1 Il DNA (oggetto biologico)
DettagliLA BIOLOGIA MOLECOLARE E UNA BRANCA DELLA BIOLOGIA CHE STUDIA LE BASI MOLECOLARI DELLE FUNZIONI BIOLOGICHE, PONENDO UNA PARTICOLARE ATTENZIONE A QUEI
CONCETTI DI BASE LA BIOLOGIA MOLECOLARE E UNA BRANCA DELLA BIOLOGIA CHE STUDIA LE BASI MOLECOLARI DELLE FUNZIONI BIOLOGICHE, PONENDO UNA PARTICOLARE ATTENZIONE A QUEI PROCESSI CHE COINVOLGONO GLI ACIDI
DettagliCorso di Elementi di Bioinformatica
Corso di Elementi di Bioinformatica Laurea Triennale in Informatica I dati e le banche dati in Bioinformatica Anno Accademico 2015-2016 Docente del laboratorio: Raffaella Rizzi 1 Il DNA (oggetto biologico)
DettagliIl progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.
Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato
Dettagli50 kb 4-5 milioni milioni 100 milioni 165 milioni Fago E. Coli S. cerevisiae C. elegans D. melanogaster. Human 3 miliardi
Genomi GENOMI 50 kb 4-5 milioni 12-13 milioni 100 milioni 165 milioni Fago E. Coli S. cerevisiae C. elegans D. melanogaster Human 3 miliardi Problematiche etiche, privacy, scelte lavorative, rapporto
DettagliDescrizione generale dell esame
Descrizione generale dell esame Ci saranno 15 domande a risposta multipla: le risposte corrette aggiungono punti le risposte sbagliate tolgono punti Ciascuna domanda avrà 2 risposte corrette e due sbagliate
DettagliBellini Lara matricola: Tesina di Biologia Molecolare 2
Bellini Lara matricola: 594736 Tesina di Biologia Molecolare 2 Argomento: Scegli una proteina di Drosophila e trovala in Uniprot.Descrivi le informazioni presenti nel record ed i collegamenti a risorse
DettagliCORSO BIOLOGIA MOLECOLARE I. Testi consigliati
CORSO BIOLOGIA MOLECOLARE I Dott. Massimo Pancione e.mail massimo.pancione@unisannio.it Obiettivo del corso: Comprendere i meccanismi molecolari dei processi biologici fondamentali, descrivere le tecniche
DettagliGENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi
GENOMA EVOLUZIONE CONTENUTO FUNZIONE STRUTTURA Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine Progetti genoma in centinaia di organismi Importante la sintenia tra i genomi The
DettagliDimensioni dei Genomi Eucariotici
Dimensioni dei Genomi Eucariotici plasmids viruses bacteria fungi plants algae insects mollusks bony fish amphibians Il Genoma umano è costituito da circa 3 miliardi di bp e contiene un numero di geni
Dettagli07/01/2015. Come si ferma una macchina in corsa? Il terminatore. Terminazione intrinseca (rho-indipendente)
Come si ferma una macchina in corsa? Il terminatore Terminazione intrinseca (rho-indipendente) Terminazione dipendente dal fattore Rho (r) 1 Operoni: gruppi di geni parte di una unica unità trascrizionale
DettagliII LEZIONE. Database di interesse per la genetica e la biologia molecolare. Portali per l'accesso a database e servizi bioinformatici
II LEZIONE Database di interesse per la genetica e la biologia molecolare Portali per l'accesso a database e servizi bioinformatici DATABASE DI GENETICA E BIOLOGIA MOLECOLARE OMIM Online Mendelian Inheritance
DettagliMappe fisiche. Si basano sulla localizzazione fisica delle molecole di DNA
Mappe fisiche Si basano sulla localizzazione fisica delle molecole di DNA Costruzione di una mappa fisica diversi metodi - Mappe a bassa risoluzione - Mappe ad alta risoluzione Risoluzione= distanza a
DettagliBioinformatica. Analisi del genoma
Bioinformatica Analisi del genoma GABRIELLA TRUCCO CREMA, 5 APRILE 2017 Cosa è il genoma? Insieme delle informazioni biologiche, depositate nella sequenza di DNA, necessarie alla costruzione e mantenimento
DettagliOttimizzazione del protocollo bioinformatico per l annotazione di geni codificanti proteine in genomi complessi. Marin Vargas, Sergio Paul
Ottimizzazione del protocollo bioinformatico per l annotazione di geni codificanti proteine in genomi complessi Marin Vargas, Sergio Paul 2012 Con l avvento del sequenziamento NGS a costi sempre più contenuti,
DettagliIPOTESI UN GENE-UN ENZIMA
IPOTESI UN GENE-UN ENZIMA DNA: contiene tutte le informazioni per definire lo sviluppo e la fisiologia della cellula: ma come svolge questa funzione? Beadle e Tatum (1941): studiando mutanti della comune
DettagliLezione 2. costituiscono la vita
Lezione 2 Le molecole di base che costituiscono la vita Graur Gau and Li: Capitolo o 1 Graur lectures 5 6 7 5 3 Le molecole dell ereditarietà L informazione i ereditaria i di tutti ttigli organismi iviventi,
DettagliNel codice genetico, una tripletta di nucleotidi codifica per un aminoacido
Il codice genetico: Come triplette dei quattro nucleotidi specificano 20 aminoacidi, rendendo possibile la traduzione dell informazione da catena nucleotidica a sequenza di aminoacidi. Come le mutazioni
DettagliCorso di Genetica -Lezione 12- Cenci
Corso di Genetica -Lezione 12- Cenci Il codice genetico: Come triplette dei quattro nucleotidi specificano 20 aminoacidi, rendendo possibile la traduzione dell informazione da catena nucleotidica a sequenza
DettagliGli rrnas sono gli RNAs più abbondanti nelle cellule. Nelle cellule in attiva proliferazione rappresentano l 80% dell RNA totale
Gli rrnas sono gli RNAs più abbondanti nelle cellule. Nelle cellule in attiva proliferazione rappresentano l 80% dell RNA totale I geni che codificano gli rrna sono presenti in copia multipla nel genoma
DettagliBasi di dati biologici
Basi di dati biologici Materiale da: The GenBank Sequence Database, A. D. Baxevanis. In Bioinformatics A practical Guide to the Analysis of Genes and Proteins Wiley-Liss 1998 Introduzione alla Bioinformatica
DettagliBasi di dati biologiche
Basi di dati biologiche Seminario per il corso di Basi di Dati II Luana Rinaldi luana.rinaldi@gmail.com AGENDA: Introduzione alla bioinformatica; Concetti Biologici; Banche dati biologiche; Collaborazioni
Dettagli(definizione nata nel 1994 da Mark Wilkins)
CL3 Biotecnologie Proteomics is the discipline that studies the proteome: it describes all possible protein products expressed by a cell as the timespecific and cell-specific complement of the genome.
DettagliEsempio di utilizzo del programma BLAST disponibile all NCBI Form di Nucleotide BLAST
Esempio di utilizzo del programma BLAST disponibile all NCBI www.ncbi.nlm.nih.gov/blast Form di Nucleotide BLAST Per un uso più avanzato, si possono impostare parametri particolari (es. cost to open gap,
DettagliLezione 2. Le molecole di base che costituiscono la vita
Lezione 2 Le molecole di base che costituiscono la vita Graur and Li: Capitolo 1 5 3 Le molecole dell ereditarietà L informazione ereditaria di tutti gli organismi viventi, con l eccezione di alcuni virus,
DettagliLaboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA
Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Bioinformatica - Scienza interdisciplinare coinvolgente la biologia, l informatica, la matematica e la statistica per l
DettagliLaboratorio di Bioinformatica I. Parte 1. Dott. Sergio Marin Vargas (2014 / 2015)
Laboratorio di Bioinformatica I Banche dati Parte 1 Dott. Sergio Marin Vargas (2014 / 2015) Introduzione a NCBI National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov/ NCBI Databases
DettagliESPRESSIONE DEL GENOMA CORSO DI BIOLOGIA, PER OSTETRICIA
ESPRESSIONE DEL GENOMA CORSO DI BIOLOGIA, PER OSTETRICIA IL DOGMA CENTRALE DELLA BIOLOGIA TRASCRIZIONE DEL DNA E TRADUZIONE DELL RNA ESPRESSIONE DEL DNA - Solo una frazione minore del DNA presente nelle
DettagliLaboratorio di Bioinformatica I. Parte 2. Dott. Sergio Marin Vargas (2014 / 2015)
Laboratorio di Bioinformatica I Banche dati Parte 2 Dott. Sergio Marin Vargas (2014 / 2015) Google Scholar https://scholar.google.it/ E un motore di ricerca di Google, specializzato nella ricerca di articoli
DettagliTecnologia del DNA ricombinante
Tecnologia del DNA ricombinante Scoperte rivoluzionarie che hanno permesso lo studio del genoma e della funzione dei singoli geni Implicazioni enormi nel progresso della medicina: comprensione malattie
DettagliDal gene alla proteina
Dal gene alla proteina Il collegamento tra geni e proteine La trascrizione e la traduzione sono i due principali processi che legano il gene alla proteina: uno sguardo panoramico Le informazioni genetiche
DettagliIntroduzione alla Genomica
Laboratorio di Bioinformatica I Introduzione alla Genomica Dott. Sergio Marin Vargas (2014 / 2015) Il Genoma umano Gene codificanti proteine Gene non codificanti proteine Geni codificanti proteine 3 Il
DettagliUtilizzo di marcatori molecolari in evoluzione e conservazione
Utilizzo di marcatori molecolari in evoluzione e conservazione Un marcatore genetico è qualsiasi elemento con una base genetica, in genere identificabile con facilità, che permette di caratterizzare un
DettagliGenomica, proteomica, genomica strutturale, banche dati.
Genomica, proteomica, genomica strutturale, banche dati. Alcune pietre miliari della biologia anno risultato 1866 Mendel scopre i geni 1944 il DNA è il materiale genetico 1951 prima sequenza di una proteina
DettagliVai al sito: Incolla nel box vuoto la sequenza nucleotidica
Identificare il gene a cui appartiene la sequenza (sonda) e la sua posizione sul cromosoma. Per raggiungere l obiettivo della prima parte dell attività devi usare il software BLAT (BLAST- Like Alignment
DettagliCorso di Bioinformatica e analisi dei genomi, docente Silvia Fuselli. Esercizi ricerche in banche dati
Corso di Bioinformatica e analisi dei genomi, docente Silvia Fuselli Esercizi ricerche in banche dati 1) Nel romanzo fantasy Jurassic Park di Michael Crichton sulla possibilità di clonare i dinosauri,
DettagliAutonoma valutazione delle informazioni su argomenti e problemi biologici fornite dai mezzi di comunicazione di massa
Anno scolastico 2017-2018 Classe 5 sez I Docente Ferrari Biancamaria Disciplina SCIENZE NATURALI- BIOLOGIA MOLECOLARE FINALITA DISCIPLINARI Fornire gli strumenti per conoscere le strutture e le funzioni
DettagliDatabase genomici primari
Esercitazione di laboratorio di bioinformatica Seconda parte: I principali database genomici e proteomici Slide ricavate dal corso di Laboratorio Integrato di Biologia Computazionale Francesca Cordero
DettagliModello computazionale per la predizione di siti di legame per fattori di trascrizione
Modello computazionale per la predizione di siti di legame per fattori di trascrizione Attività di tirocinio svolto presso il Telethon Institute of Genetics and Medicine Relatori Prof. Giuseppe Trautteur
DettagliSommario. Presentazione dell opera Ringraziamenti
Sommario Presentazione dell opera Ringraziamenti XI XII Capitolo 1 Introduzione alla bioinformatica 1 1.1 Cenni introduttivi 1 1.2 Pietre miliari della bioinformatica 2 1.3 Infrastrutture bioinformatiche
DettagliGli rrnas sono gli RNAs più abbondanti nelle cellule. Nelle cellule in attiva proliferazione rappresentano l 80% dell RNA totale
Gli rrnas sono gli RNAs più abbondanti nelle cellule. Nelle cellule in attiva proliferazione rappresentano l 80% dell RNA totale I geni che codificano gli rrna sono presenti in copia multipla nel genoma
DettagliBioinformatica ed applicazioni di bioinformatica strutturale!
Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica! Le banche dati! Programmi per estrarre ed analizzare i dati! I numeri! Cellule nell uomo! Geni nell uomo! Genoma umano Il dogma
DettagliLe NBT applicate all agricoltura. Michele Morgante Roma, 22 febrraio 2018
Le NBT applicate all agricoltura Michele Morgante Roma, 22 febrraio 2018 AGRICOLTURA E PROGRESSO TECNOLOGICO Genetica (miglioramento genetico) Chimica Tecniche agronomiche Genetica: >50% di aumento produttività
DettagliOgni tipo ha il suo alfabeto di riferimento, e metodi specifici, nonché metodi per la conversione da un tipo all altro (trascrizione, traduzione)
BioPython Descrizione Il progetto BioPython è un associazione di sviluppatori di codice Python liberamente disponibile per bioinformatica La homepage del progetto è http://www.biopython.org Il codice viene
DettagliInformatica e Bioinformatica A. A
GQuery (http://www.ncbi.nlm.nih.gov/gquery/) è il punto di partenza per eseguire query su tutti o parte dei database dell NCBI: si basa sul sistema di interrogazione ENTREZ Informatica e Bioinformatica
DettagliFORMAZIONE DEL LEGAME PEPTIDICO
AMINOACIDI FORMAZIONE DEL LEGAME PEPTIDICO SEQUENZA AMINOACIDICA DELL INSULINA STRUTTURA SECONDARIA DELLE PROTEINE STRUTTURA TERZIARIA DELLE PROTEINE STRUTTURA QUATERNARIA DELLE PROTEINE Definizione Processi
DettagliInformatica e Bioinformatica: Basi di Dati
Informatica e Bioinformatica: Date TBD Bioinformatica I costi di sequenziamento e di hardware descrescono vertiginosamente si hanno a disposizione sempre più dati e hardware sempre più potente e meno costoso...
DettagliDogma centrale DNA RNA PROTEINE
Dogma centrale DNA RNA PROTEINE Il DNA è un lungo polimero lineare che contiene l informazione genetica. L informazione genetica è contenuta nell ordine lineare dei nucleotidi. Si trova nel nucleo delle
DettagliProvate rispondere alle domande, se ci riuscirete, sarete pronti a superare l esame per quanto riguarda la parte di bioinformatica.
Per aiutarvi ho elaborato (frettolosamente) questi quesiti che dovrebbero aiutarvi ad individuare gli argomenti importanti del corso ed a darvi un idea delle domande che potrebbero esservi poste all esame.
DettagliRELAZIONE di BIOLOGIA MOLECOLARE
NOME: Marini Selena MATRICOLA: 592330 RELAZIONE di BIOLOGIA MOLECOLARE CHE ORGANISMO MODELLO È DICTYOSTELIUM? CHE RISORSE BIOINFORMATICHE AGEVOLANO I RICERCATORI CHE LO STUDIANO? Dictyostelium è un genere
DettagliBIOLOGIA MOLECOLARE CON ELEMENTI DI BIOINFORMATICA
DIPARTIMENTO DI SCIENZE BIOLOGICHE, GEOLOGICHE E AMBIENTALI Corso di laurea magistrale in Biologia sanitaria e cellularemolecolare Anno accademico 2017/2018-1 anno - Curriculum Biologia cellulare e molecolare
DettagliLezione 1. Le molecole di base che costituiscono la vita
Lezione 1 Le molecole di base che costituiscono la vita Le molecole dell ereditarietà 5 3 L informazione ereditaria di tutti gli organismi viventi, con l eccezione di alcuni virus, è a carico della molecola
DettagliDal Genoma all Epigenoma..
Dal Genoma all Epigenoma.. Nel 2001 sono stati pubblicati i risultati della mappatura del genoma umano (progetto genoma umano) che hanno mostrato la sequenze delle basi che formano il nostro materiale
DettagliPrincipi di biologia Introduzione alla biologia
Principi di biologia Introduzione alla biologia Prof.ssa Flavia Frabetti BIOLOGIA è la scienza della vita, che indaga le caratteristiche dei sistemi viventi biologia animale biologia cellulare biologia
DettagliCodice Genetico (segue)
CODICE GENETICO Nucleotidi, acidi nucleici CODICE GENETICO Codice mediante il quale la sequenza nucleotidica di una molecola di DNA o di RNA specifica la sequenza amminoacidica di un polipeptide. Consiste
DettagliContenuto di DNA aploide in alcune specie
Contenuto di DNA aploide in alcune specie 1-10 2 kb 10 3 kb 10 4 kb 10 5-10 8 kb Dimensioni del genoma Paradosso del valore C Non c è una correlazione tra la quantità di DNA e la complessità di un organismo
DettagliIbridazione in situ per mrna: tecnica e interpretazione
Patologia nodulare della tiroide: focus sugli approcci diagnostici Ibridazione in situ per mrna: tecnica e interpretazione Isabella Giovannoni U.O.C. Anatomia Patologica Ibridazione -> appaiamento di sequenze
DettagliJay Phelan, Maria Cristina Pignocchino. Scopriamo la biologia
Jay Phelan, Maria Cristina Pignocchino Scopriamo la biologia Capitolo 6 Il DNA in azione 3 1. Il DNA è il materiale genetico Il DNA è composto da una sequenza di nucleotidi. Ogni nucleotide comprende:
DettagliGenomi dei procarioti
Genomi dei procarioti Una molecola circolare di DNA E.coli circa 4 x 10 6 coppie di basi Il genoma è quasi tutto codificante Viene trascritto in mrna policistronici Il genoma eucariotico Il genoma eucariotico
Dettaglimicrorna Struttura e Funzione
microrna Struttura e Funzione Cinzia Di Pietro Università degli Studi di Catania Dipartimento di Scienze Biomediche e Biotecnologiche Sezione di Biologia e Genetica G. Sichel I MicroRNAs (mirnas) sono
DettagliGenomi vegetali Da 7x10 7 bp per genoma aploide (130Mbp diploide, 5 cromosomi) di Arabidopsis thaliana alle 1,5x10 11 bp ( Mbp=150Gbp) di una
Genomi vegetali Da 7x10 7 bp per genoma aploide (130Mbp diploide, 5 cromosomi) di Arabidopsis thaliana alle 1,5x10 11 bp (150.000Mbp=150Gbp) di una Liliacea. Tra le graminacee il frumento ha un genoma
DettagliL organizzazione del genoma. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie
L organizzazione del genoma L organizzazione del genoma Fino ad ora abiamo studiato la regolazione dell espressione genica prendendo come esempio singoli geni dei batteri. Ma quanti geni ci sono in un
DettagliPrincipi di biologia
Principi di biologia Prof.ssa Flavia Frabetti Tecnici di lab. 2009-10 BIOLOGIA è la scienza della vita, che indaga le caratteristiche dei sistemi viventi biologia animale biologia cellulare biologia molecolare
DettagliIL CODICE GENETICO E I CARATTERI EREDITARI
IL CODICE GENETICO E I CARATTERI EREDITARI Il DNA porta le informazioni genetiche scritte nella sequenza di basi. Qualunque sequenza è possibile. Il DNA virus più semplici: 5000 basi appaiate; 46 cromosomi
DettagliVirus Classe IV e V. From Wagner and Hewlett Basic virology (2003) Blackwell Science Press
Virus Classe IV e V From Wagner and Hewlett Basic virology (2003) Blackwell Science Press Replicazione genomi ad RNA dei virus delle Classi IV e V vrna è lo stampo in RI-1 In RI-1 viene prodotto lo stampo
DettagliImportanza della genetica dei microrganismi
Importanza della genetica dei microrganismi 1.I microrganismi rappresentano un mezzo essenziale per comprendere la genetica di tutti gli organismi. 2.Vengono usati per isolare e duplicare specifici geni
DettagliTRE PAROLE CHIAVE DELLA GENETICA
TRE PAROLE CHIAVE DELLA GENETICA Questo documento è pubblicato sotto licenza Creative Commons Attribuzione Non commerciale Condividi allo stesso modo http://creativecommons.org/licenses/by-nc-sa/2.5/deed.it
DettagliRilevamento e tracciabilità dei prodotti delle NBT
Incontro tecnico-scientifico sulle nuove tecniche di miglioramento genetico in agricoltura Roma 22 febbraio 2018 Sala Polifunzionale della Presidenza del Consiglio dei Ministri Ugo Marchesi Rilevamento
DettagliLezione 3. Genoma umano come esempio di genoma eucariote
Lezione 3 Genoma umano come esempio di genoma eucariote 3.2 x 10 9 bp Genoma umano 22 autosomi + xx (femmina) o xy (maschio) Primo draft di sequenza: 2001 Genotipo: sequenza di DNA, sia nucleare che mitocondriale.
DettagliInformatica e biotecnologie I parte
Informatica e biotecnologie I parte Banche dati biologiche Bioinformatica La Bioinformatica è una disciplina che affronta con metodiche proprie delle Scienze dell'informazione problemi propri della Biologia.
DettagliSistemi Operativi 1. Mattia Monga. 6 giugno Dip. di Informatica e Comunicazione Università degli Studi di Milano, Italia
1 Dip. di Informatica e Comunicazione Università degli Studi di Milano, Italia mattia.monga@unimi.it 6 giugno 2008 1 c 2008 M. Monga. Creative Commons Attribuzione-Condividi allo stesso modo 2.5 Italia
DettagliIntroduzione al corso di bioinformatica e analisi dei genomi AA Docente: Silvia Fuselli
Introduzione al corso di bioinformatica e analisi dei genomi AA 2017-2018 Docente: Silvia Fuselli fss@unife.it Chi sono io Ricercatore del gruppo di genetica di popolazione (Unife, SVeB) Mi occupo di Farmacogenetica
DettagliDavid Sadava, H. Craig Heller, Gordon H. Orians, William K. Purves, David M. Hillis. Biologia La scienza della vita
1 David Sadava, H. Craig Heller, Gordon H. Orians, William K. Purves, David M. Hillis Biologia La scienza della vita 2 B - L ereditarietà e l evoluzione La regolazione genica negli eucarioti 3 I genomi
DettagliMarcatori molecolari per l analisi genica, genetica e genomica
Marcatori molecolari per l analisi genica, genetica e genomica (RFLP e PCR-derivati, inclusi SSR e SNP) DNA fingerprinting DNA genotyping DNA haplotyping cp/mtdna barcoding MG/QTL mapping MAS breeding
DettagliSistemi Operativi. Bruschi Martignoni Monga. File system Astrazioni utente Metadati Tecniche implementative. Sistemi Operativi
1 Mattia Lezione XXX: Dip. di Informatica e Comunicazione Università degli Studi di Milano, Italia mattia.monga@unimi.it a.a. 2008/09 1 c 2009 M.. Creative Commons Attribuzione-Condividi allo stesso modo
DettagliStrategie di annotazione di geni e genomi
Strategie di annotazione di geni e genomi Dr. Giovanni Emiliani giovanni.emiliani@unifi.it Bioinformatica A.A. 2011-1012 Concetti generali Le nuove tecnologie consentono l ottenimento di una grande mole
DettagliDogma centrale DNA RNA PROTEINE
Dogma centrale DNA RNA PROTEINE Il Genoma cellulare specifica: La struttura primaria delle proteine Destinazione delle proteine all interno della cellula Presenza o assenza della proteina in un determinato
DettagliEVOLUZIONE MOLECOLARE. Silvia Fuselli
EVOLUZIONE MOLECOLARE Silvia Fuselli silvia.fuselli@unife.it TESTI Organizzazione del corso Graur and Li, Fundamentals of molecular evolution, Sinauer 2000 Michael Lynch, The Origins of Genome Architecture,
DettagliBiotecnologie. Screening delle genoteche con le sonde geniche
Biotecnologie Screening delle genoteche con le sonde geniche Giancarlo Dessì http://www.giand.it Licenza Creative Commons BY-NC-SA (BY: attribuzione, NC: uso non commerciale, SA: condividi allo stesso
DettagliIl DNA come molecola in grado di veicolare informazione ereditabile (genetica)
Il DNA come molecola in grado di veicolare informazione ereditabile (genetica) Essenz. Alberts: cap 6 La trasmissione dell informazione replicazione trascrizione traduzione DNA RNA Proteina da, dg, dc,
DettagliIl Corso sarà tenuto nei giorni di Lunedì, Mercoledì e Venerdì dalle ore 17 alle ore 19.
Docente: Prof. Alfredo Ferro Il Corso sarà tenuto nei giorni di Lunedì, Mercoledì e Venerdì dalle ore 17 alle ore 19. Programma del Corso DATA ARGOMENTO 09/03/2011 Introduzione al corso. Slides Panoramica
DettagliIn molecular terms, a gene commonly is defined as the entire nucleic acid sequence that is necessary for the synthesis of a functional polypeptide.
In molecular terms, a gene commonly is defined as the entire nucleic acid sequence that is necessary for the synthesis of a functional polypeptide. Lodish et al. Molecular Cell Biology In molecular terms,
DettagliPrincipali Database biologici
Principali Database biologici Acidi nucleici: -Sequenze DNA genomico -Sequenze di trascritti (mrna) La maggior quantità di dati biologici presenti nei database è rappresentata da sequenze di acidi nucleici
DettagliFrontiere della Biologia Molecolare
Prof. Giorgio DIECI Dipartimento di Bioscienze Università degli Studi di Parma Frontiere della Biologia Molecolare Milano, 4 marzo 2016 Fotografia al microscopio elettronico di una plasmacellula NUCLEO
DettagliDOGMA CENTRALE DELLA BIOLOGIA. Secondo il dogma centrale della biologia, il DNA dirige la. sintesi del RNA che a sua volta guida la sintesi delle
DOGMA CENTRALE DELLA BIOLOGIA Secondo il dogma centrale della biologia, il DNA dirige la sintesi del RNA che a sua volta guida la sintesi delle proteine. Tuttavia il flusso unidirezionale di informazioni
DettagliMetodologie citogenetiche. Metodologie molecolari. Formulare la domanda Utilizzare la metodica appropriata
In base al potere di risoluzione della tecnica Metodologie citogenetiche Metodologie molecolari Formulare la domanda Utilizzare la metodica appropriata 1 DNA RNA PROTEINE DNA Cromosomi (cariotipo, FISH,
DettagliClassificazione dei virus
Classificazione dei virus Criteri di classificazione International Committee on Taxonomy of Viruses Ospiti: animali, piante, batteri. Natura dell acido nucleico nel virione : RNA o DNA Simmetria del capside:
DettagliTRASCRIZIONE DEL DNA. Formazione mrna
TRASCRIZIONE DEL DNA Formazione mrna Trascrizione Processo mediante il quale l informazione contenuta in una sequenza di DNA (gene) viene copiata in una sequenza complementare di RNA dall enzima RNA polimerasi
DettagliDa cosa dipendono le nostre caratteristiche? Come si trasmettono? Perché siamo simili o diversi?
Da cosa dipendono le nostre caratteristiche? Come si trasmettono? Perché siamo simili o diversi? La genetica, è la Scienza che studia i geni, l ereditarietà e la variabilità genetica degli organismi Il
DettagliMODELLO SCHEDA INSEGNAMENTO
Corso di Laurea Denominazione insegnamento: Numero di Crediti: Anno: Semestre: Docente Titolare: MODELLO SCHEDA INSEGNAMENTO Triennale in Scienze Biologiche Biologia molecolare 9 CFU II II Lina Sabatino
Dettagli