Strategie di annotazione di geni e genomi
|
|
|
- Gloria Guglielmi
- 9 anni fa
- Visualizzazioni
Transcript
1 Strategie di annotazione di geni e genomi Dr. Giovanni Emiliani [email protected] Bioinformatica A.A
2 Concetti generali Le nuove tecnologie consentono l ottenimento di una grande mole di dati ad esempio: dati di espressione genica per geni (microarray, RNAseq) dati genomici, migliaia di geni identificati in un genoma Come ottenere informazioni di significato biologico da questa mole di dati?
3 Concetti generali Esempio 1: in un esperimento di espressione genica, poniamo individuo sano vs individuo malato, sono risultati differenzialmente espressi 1000 geni; Per quali proteine codificano? A quale/i via/e metabolica/he appartengono? Esempio 2: genomica comparativa di 2 o più organismi; Per quali caratteristiche funzionali si differenziano?
4 Concetti generali È necessario dunque procedere ad una annotazione funzionale dei geni. Nel caso di neo-sequenziamenti di genomi annotazione può significare anche l identificazione di geni all interno del genoma (ORF finding) L annotazione si effettua attraverso software (dati in numero elevato, difficilmente gestibili manualmente ) che si basano sulla disponibilità di banche dati costruite ed aggiornate continuamente sulla base di dati sperimentali
5 Concetti generali L approccio generale di analisi si basa inizialmente sulla ricerca di similarità di sequenza (BLAST) tra il dataset sperimentale e le banche dati Una volta trovata una corrispondenza in banca dati (se esistente) si possono avere in automatico tutte le informazioni disponibili riguardo al dato gene/proteina
6 Problemi È ormai più facile sequenziare un genoma che descrivere nel dettaglio una reazione metabolica Si stanno perciò accumulando moltissimi dati che si basano sulla similarità di sequenza rispetto a dati già presenti Ciò significa che spesso troviamo proteine senza annotazione perché non è stata chiarita la sua funzione
7 Database generali e specifici Esistono database specifici (legati ad esempio ad un particolare organismo) o database generali su cui effettuare le analisi
8 Database generali Gene Ontology ( Contiene informazioni multi-organismo sulla funzione delle proteine. È organizzato in maniera gerarchica (scatole cinesi) dal processo generale a quello più specifico È diviso in tre settori principali: Biological process Molecular function Cellular component
9 Gene Ontology
10 Gene Ontology
11 Gene Ontology Un analisi lanciata contro il database restituisce tutti GO terms associati a quella proteina
12 Gene Ontology Questo è un approccio pigro sensato solo se si hanno una o poche proteine da annotare
13 Esempio Esempio di file di output di un esperimento microarray
14 Gene Ontology Si possono però inserire le sequenze ed effettuare analisi batch
15 KEGG KEGG: Kyoto Encyclopedia of Genes and Genomes Contiene informazioni multi-organismo È particolarmente utile perché fornisce mappe metaboliche dei processi biologici
16 KEGG
17 KEGG
18 KEGG
19 KEGG
20 KEGG
21 KEGG
22 KEGG
23 KEGG KEGG può essere interrogato con una proteina oppure effettuare analisi batch fornendo un file multi-fasta al tool di analisi KAAS (Kegg Automatic Annotaion Server) KAAS effettua un analisi BLAST e recupera le informazioni relative raggruppando le queries in via/ mappe metaboliche
24 KEGG
25 KEGG
26 KEGG
27 KEGG
28 KEGG
29 KEGG
30 COG COG: Clusters of Orthologous Groups
31 COG
32 COG
33 InterPro Cerca domini funzionali nelle proteine
34 InterPro
35 InterPro
36 InterPro
37 Tools Blast2GO di analisi BLAST2GO A partire da sequenze consente l annotazione complessiva delle proteine (GO + KEGG + Interpro)
38 Tools Blast2GO di analisi Blast2GO Blast2GO effettua dei Blast in banche dati, poi automaticamente ottiene da altri databases (GO, KEGG, ecc) tutte le informazioni connesse.
39 Tools Blast2GO di analisi BLAST2GO A partire da sequenze consente l annotazione complessiva delle proteine (GO + KEGG + Interpro)
40 Tools Blast2GO di analisi BLAST2GO
41 Tools Blast2GO di analisi BLAST2GO
42 Tools Blast2GO di analisi BLAST2GO
Bioinformatica. Analisi del genoma
Bioinformatica Analisi del genoma GABRIELLA TRUCCO CREMA, 5 APRILE 2017 Cosa è il genoma? Insieme delle informazioni biologiche, depositate nella sequenza di DNA, necessarie alla costruzione e mantenimento
RELAZIONE di BIOLOGIA MOLECOLARE
NOME: Marini Selena MATRICOLA: 592330 RELAZIONE di BIOLOGIA MOLECOLARE CHE ORGANISMO MODELLO È DICTYOSTELIUM? CHE RISORSE BIOINFORMATICHE AGEVOLANO I RICERCATORI CHE LO STUDIANO? Dictyostelium è un genere
Analisi dei dati di espressione genica in esperimenti realizzati mediante microarray. Erika Melissari
Analisi dei dati di espressione genica in esperimenti realizzati mediante microarray Erika Melissari ESPRESSIONE GENICA E un processo molto complesso e finemente regolato che permette ad una cellula di
Tesina di Biologia Molecolare II
MELATO GIULIA 595033 Tesina di Biologia Molecolare II Mostra un albero filogenetico con la relazione tra Uomo, Topo e Ratto. Che banca dati è disponibile per quest'ultimo organismo? Descrivi alcune caratteristiche
GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi
GENOMA EVOLUZIONE CONTENUTO FUNZIONE STRUTTURA Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine Progetti genoma in centinaia di organismi Importante la sintenia tra i genomi The
Indice generale. Nozioni fondamentali. Prefazione XIII
Prefazione XIII A Nozioni fondamentali CAPITOLO 1 La biologia essenziale 3 1.1 Genomi, genomica e avvento della Bioinformatica 3 1.2 Genoma dei procarioti 5 1.2.1 Struttura e dimensioni 5 1.2.2 Proprietà
Bioinformatica. Marin Vargas, Sergio Paul
Bioinformatica Marin Vargas, Sergio Paul 2014 Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici. La bioinformatica
La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione
La mappatura dei geni umani SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione Un grande impulso alla costruzione di mappe genetiche è stato dato da le tecniche della
HI-TECH IN SANITA'. MINI-INVASIVITA' 2.0: nuove tecnologie al servizio dell'appropriatezza e della bioetica professionale
HI-TECH IN SANITA'. MINI-INVASIVITA' 2.0: nuove tecnologie al servizio dell'appropriatezza e della bioetica professionale Analisi dell esoma e la medicina predittiva Domenico Coviello Direttore Medico
Laboratorio di Bioinformatica I. Parte 2. Dott. Sergio Marin Vargas (2014 / 2015)
Laboratorio di Bioinformatica I Banche dati Parte 2 Dott. Sergio Marin Vargas (2014 / 2015) Google Scholar https://scholar.google.it/ E un motore di ricerca di Google, specializzato nella ricerca di articoli
Dal Genotipo al Fenotipo
Dal Genotipo al Fenotipo Dal Fenotipo normale al Fenotipo patologico Regolazione dell espressione genica Figure 7-1 Molecular Biology of the Cell ( Garland Science 2008) Una cellula differenziata contiene
Genomica, proteomica, genomica strutturale, banche dati.
Genomica, proteomica, genomica strutturale, banche dati. Alcune pietre miliari della biologia anno risultato 1866 Mendel scopre i geni 1944 il DNA è il materiale genetico 1951 prima sequenza di una proteina
Biologia Molecolare e Bioinformatica
Biologia Molecolare e Bioinformatica Molecular Biology and Bioinformatics CFU 12 SSD BIO/11 a.a. 2018-2019 Corso di laurea in Biotecnologie Agro-Ambientali e Alimentari Docente: Maria Luisa Chiusano Tel.
BIOTECNOLOGIE PER IL MIGLIORAMENTO GENETICO A.A
BIOTECNOLOGIE PER IL MIGLIORAMENTO GENETICO A.A. 2011-2012 E ancora importante l agricoltura? E la produzione alimentare? da L Espresso, febbraio 2011 Cosa significa miglioramento genetico? Significa migliorare
Le biotecnologie. Sadava et al. Biologia La scienza della vita Zanichelli editore 2010
Le biotecnologie 1 Cosa sono le biotecnologie? Le biotecnologie sono tutte quelle tecniche utilizzate (fin dall antichità) per produrre sostanze specifiche a partire da organismi viventi o da loro derivati.
L organizzazione del genoma. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie
L organizzazione del genoma L organizzazione del genoma Fino ad ora abiamo studiato la regolazione dell espressione genica prendendo come esempio singoli geni dei batteri. Ma quanti geni ci sono in un
Relazione sequenza-struttura e funzione
Biotecnologie applicate alla progettazione e sviluppo di molecole biologicamente attive A.A. 2010-2011 Modulo di Biologia Strutturale Relazione sequenza-struttura e funzione Marco Nardini Dipartimento
10/30/16. non modificato CAP al 5 e poly-a al 3. RNA messaggero: soggetto a splicing
procarioti eucarioti poli-cistronico mono-cistronico non modificato CAP al 5 e poly-a al 3 RNA messaggero: procarioti eucarioti policistronico monocistronico non modificato CAP al 5 e poly-a al 3 continuo
Laboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E30Q6) AA 205/206 Esempio di workflow Docente del laboratorio: Raffaella Rizzi Scopo del workflow Scopo: dato un insieme
Patologie da analizzare
Fasi cruciali Scelta della patologia da analizzare Scelta del campione da analizzare Scelta dell approccio da utilizzare Scelta della tecnica da utilizzare Analisi statistica del dati Conferme con approcci
La metagenomica al servizio dell agricoltura
La metagenomica al servizio dell agricoltura Marco Bazzicalupo Department of Biology University of Florence, Firenze, Italy http://www.unifi.it/dblage/mdswitch.html L albero della vita è microbico RNA
Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.
Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato
Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini)
Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Collegatevi al sito www.ncbi.nlm.nih.gov/blast. Apparirà una pagina nella quale le versioni
VERIFICA MATRICOLE e STAMPA CERTIFICATO INTEGRATIVO DI GARANZIA
VERIFICA MATRICOLE e STAMPA CERTIFICATO INTEGRATIVO DI GARANZIA Con riferimento alle disposizioni GSE sul riciclo e recupero dei pannelli fotovoltaici a fine vita, Consorzio Remedia ha reso disponibile
Decode NGS data: search for genetic features
Decode NGS data: search for genetic features Valeria Michelacci NGS course, June 2015 Blast searches What we are used to: online querying NCBI database for the presence of a sequence of interest ONE SEQUENCE
SOLUZIONE AL TEMA DI INFORMATICA (PROGETTO ABACUS)
Punto 1 SOLUZIONE AL TEMA DI INFORMATICA (PROGETTO ABACUS) Da una prima analisi del testo appare evidente che per la costruzione della base di dati si possono individuare le seguenti tre entità fondamentali:
I database. Introduzione alla teoria delle basi di dati
I database Introduzione alla teoria delle basi di dati 1 Cosa sono e a cosa servono i Database Un database (o base di dati) e' una raccolta organizzata di dati correlati. Il principale scopo di un database
Corso di Laurea triennale in BIOLOGIA MOLECOLARE AA
Corso di Laurea triennale in BIOLOGIA MOLECOLARE AA. 2016-17 http://http://biologia-molecolare.biologia.unipd.it La laurea in Biologia Molecolare approfondisce gli aspetti genetico-molecolari, cellulari
Compito A. Esercizio 1 (13 punti) Minimizzare l automa descritto dalla seguente tabella degli stati
Compito A Esercizio 1 (13 punti) Minimizzare l automa descritto dalla seguente tabella degli stati stato/input x=0 x=1 A B/0 A/0 B C/0 A/0 C B/0 D/1 D B/0 E/0 E B/0 D/1 Esercizio 2. (17 punti) Realizzare
ESERCITAZIONE MICROECONOMIA (CORSO B) 21-12-2009 ESEMPI DI ESERCIZI DI TEORIA DEI GIOCHI
ESERCITZIONE MICROECONOMI (CORSO ) --009 ESEMPI DI ESERCIZI DI TEORI DEI GIOCHI Questo documento contiene alcuni esempi di esercizi di teoria dei giochi. Gli esercizi presentati non corrispondono esattamente
Dal Genoma all Epigenoma..
Dal Genoma all Epigenoma.. Nel 2001 sono stati pubblicati i risultati della mappatura del genoma umano (progetto genoma umano) che hanno mostrato la sequenze delle basi che formano il nostro materiale
Legami chimici. Covalente. Legami deboli
Legami chimici Covalente Legami deboli Legame fosfodiesterico Legami deboli Legami idrogeno Interazioni idrofobiche Attrazioni di Van der Waals Legami ionici STRUTTURA TERZIARIA La struttura tridimensionale
PROCEDURA DI INSTALLAZIONE E ATTIVAZIONE DI DARWEB PRO versione 1.0
PROCEDURA DI INSTALLAZIONE E ATTIVAZIONE DI DARWEB PRO versione 1.0 INSTALLAZIONE Per installazione seguire i passi operativi indicati all interno della confezione contenente il CD ricevuto; Le mappe che
SINTESI DELLE PROTEINE
SINTESI DELLE PROTEINE IN UN GIORNO DI UN INDIVIDUO ADULTO NORMALE: -100 grammi vengono introdotti con la dieta -400 grammi vengono degradati -400 grammi vengono sintetizzati -100 grammi vengono consumati
Corso di BIOINFORMATICA. Pietro BUFFA. Applicazioni BIO-Mediche. - Livelli di complessità delle proteine e visualizzazione computazionale
Corso di BIOINFORMATICA Applicazioni BIO-Mediche - Introduzione alla Bioinformatica ed alla Biologia Strutturale - Livelli di complessità delle proteine e visualizzazione computazionale Pietro BUFFA Responsabile
David Sadava, H. Craig Heller, Gordon H. Orians, William K. Purves, David M. Hillis. Biologia La scienza della vita
1 David Sadava, H. Craig Heller, Gordon H. Orians, William K. Purves, David M. Hillis Biologia La scienza della vita 2 B - L ereditarietà e l evoluzione La regolazione genica negli eucarioti 3 I genomi
Marcatori molecolari per l analisi genica, genetica e genomica
Marcatori molecolari per l analisi genica, genetica e genomica (RFLP e PCR-derivati, inclusi SSR e SNP) DNA fingerprinting DNA genotyping DNA haplotyping cp/mtdna barcoding MG/QTL mapping MAS breeding
Perché considerare la struttura 3D di una proteina
Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una
18. LA CROMATINA E IL CONTROLLO TRASCRIZIONALE DELLA ESPRESSIONE GENICA! DR. GIUSEPPE LUPO!
18. LA CROMATINA E IL CONTROLLO TRASCRIZIONALE DELLA ESPRESSIONE GENICA! DR. GIUSEPPE LUPO! Il DNA Eʼ ORGANIZZATO IN CROMOSOMI! I CROMOSOMI SONO! COSTITUITI DA CROMATINA:! DNA ASSOCIATO A PROTEINE.! LO
Il Centro Tematico Biomolecolare - Strumenti e Servizi Molecolari - Monica Santamaria & Bachir Balech IBBE-CNR, Bari
Il Centro Tematico Biomolecolare - Strumenti e Servizi Molecolari - Monica Santamaria & Bachir Balech IBBE-CNR, Bari Roma, 17 Febbraio 2016 Nel Centro Tematico Biomolecolare (CTB) competenze e facilities
Manuale Utente. La Tavola B invece riporta il dettaglio dei vincoli presenti e consente di sapere quali vincoli operano in una determinata locazione.
Manuale Utente Per operare la pubblicazione del Piano Territoriale Paesistico Regionale sono state definite due applicazioni simili che consentano all utente di navigare sulla Tavola A e sulla Tavola B
La struttura covalente delle proteine (la sequenza amminoacidica)
La struttura covalente delle proteine (la sequenza amminoacidica) Sequenza amminoacidica dell ormone insulina bovino (Frederick Sanger, 1953) Il primo passo per determinare la sequenza di un peptide è
Introduzione all analisi di arrays: clustering.
Statistica per la Ricerca Sperimentale Introduzione all analisi di arrays: clustering. Lezione 2-14 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia
ArcGIS - ArcView ArcCatalog
ArcGIS - ArcView ArcCatalog Marco Negretti Politecnico di Milano Polo Regionale di Como e-mail: [email protected] http://geomatica.como.polimi.it 04/04/06 - v 1.1 2 ArcCatalog ArcCatalog: strumento
Indice. Ricerca richiesta d offerta. Risultati della ricerca Navigazione Stati
Indice Ricerca richiesta d offerta Risultati della ricerca Navigazione Stati Dettaglio richiesta d offerta Codice materiale cliente Note di posizione Aggiungi al carrello 1 di 8 Ricerca richiesta d offerta
Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random
Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.
ESPERIMENTO DEL LANCIO DEI DADI
ANNO SCOLASTICO 214/215 SCUOLA SECONDARIA DI PRIMO GRADO UGO FOSCOLO SCHEDA SPERIMENTALE DI MATEMATICA ESPERIMENTO DEL LANCIO DEI DADI ALUNNA: MARTINA PETRARULO CLASSE: III B PROFESSORE: DANIELE BALDISSIN
07/01/2015. Come si ferma una macchina in corsa? Il terminatore. Terminazione intrinseca (rho-indipendente)
Come si ferma una macchina in corsa? Il terminatore Terminazione intrinseca (rho-indipendente) Terminazione dipendente dal fattore Rho (r) 1 Operoni: gruppi di geni parte di una unica unità trascrizionale
