Strategie di annotazione di geni e genomi

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Strategie di annotazione di geni e genomi"

Transcript

1 Strategie di annotazione di geni e genomi Dr. Giovanni Emiliani [email protected] Bioinformatica A.A

2 Concetti generali Le nuove tecnologie consentono l ottenimento di una grande mole di dati ad esempio: dati di espressione genica per geni (microarray, RNAseq) dati genomici, migliaia di geni identificati in un genoma Come ottenere informazioni di significato biologico da questa mole di dati?

3 Concetti generali Esempio 1: in un esperimento di espressione genica, poniamo individuo sano vs individuo malato, sono risultati differenzialmente espressi 1000 geni; Per quali proteine codificano? A quale/i via/e metabolica/he appartengono? Esempio 2: genomica comparativa di 2 o più organismi; Per quali caratteristiche funzionali si differenziano?

4 Concetti generali È necessario dunque procedere ad una annotazione funzionale dei geni. Nel caso di neo-sequenziamenti di genomi annotazione può significare anche l identificazione di geni all interno del genoma (ORF finding) L annotazione si effettua attraverso software (dati in numero elevato, difficilmente gestibili manualmente ) che si basano sulla disponibilità di banche dati costruite ed aggiornate continuamente sulla base di dati sperimentali

5 Concetti generali L approccio generale di analisi si basa inizialmente sulla ricerca di similarità di sequenza (BLAST) tra il dataset sperimentale e le banche dati Una volta trovata una corrispondenza in banca dati (se esistente) si possono avere in automatico tutte le informazioni disponibili riguardo al dato gene/proteina

6 Problemi È ormai più facile sequenziare un genoma che descrivere nel dettaglio una reazione metabolica Si stanno perciò accumulando moltissimi dati che si basano sulla similarità di sequenza rispetto a dati già presenti Ciò significa che spesso troviamo proteine senza annotazione perché non è stata chiarita la sua funzione

7 Database generali e specifici Esistono database specifici (legati ad esempio ad un particolare organismo) o database generali su cui effettuare le analisi

8 Database generali Gene Ontology ( Contiene informazioni multi-organismo sulla funzione delle proteine. È organizzato in maniera gerarchica (scatole cinesi) dal processo generale a quello più specifico È diviso in tre settori principali: Biological process Molecular function Cellular component

9 Gene Ontology

10 Gene Ontology

11 Gene Ontology Un analisi lanciata contro il database restituisce tutti GO terms associati a quella proteina

12 Gene Ontology Questo è un approccio pigro sensato solo se si hanno una o poche proteine da annotare

13 Esempio Esempio di file di output di un esperimento microarray

14 Gene Ontology Si possono però inserire le sequenze ed effettuare analisi batch

15 KEGG KEGG: Kyoto Encyclopedia of Genes and Genomes Contiene informazioni multi-organismo È particolarmente utile perché fornisce mappe metaboliche dei processi biologici

16 KEGG

17 KEGG

18 KEGG

19 KEGG

20 KEGG

21 KEGG

22 KEGG

23 KEGG KEGG può essere interrogato con una proteina oppure effettuare analisi batch fornendo un file multi-fasta al tool di analisi KAAS (Kegg Automatic Annotaion Server) KAAS effettua un analisi BLAST e recupera le informazioni relative raggruppando le queries in via/ mappe metaboliche

24 KEGG

25 KEGG

26 KEGG

27 KEGG

28 KEGG

29 KEGG

30 COG COG: Clusters of Orthologous Groups

31 COG

32 COG

33 InterPro Cerca domini funzionali nelle proteine

34 InterPro

35 InterPro

36 InterPro

37 Tools Blast2GO di analisi BLAST2GO A partire da sequenze consente l annotazione complessiva delle proteine (GO + KEGG + Interpro)

38 Tools Blast2GO di analisi Blast2GO Blast2GO effettua dei Blast in banche dati, poi automaticamente ottiene da altri databases (GO, KEGG, ecc) tutte le informazioni connesse.

39 Tools Blast2GO di analisi BLAST2GO A partire da sequenze consente l annotazione complessiva delle proteine (GO + KEGG + Interpro)

40 Tools Blast2GO di analisi BLAST2GO

41 Tools Blast2GO di analisi BLAST2GO

42 Tools Blast2GO di analisi BLAST2GO

Bioinformatica. Analisi del genoma

Bioinformatica. Analisi del genoma Bioinformatica Analisi del genoma GABRIELLA TRUCCO CREMA, 5 APRILE 2017 Cosa è il genoma? Insieme delle informazioni biologiche, depositate nella sequenza di DNA, necessarie alla costruzione e mantenimento

Dettagli

RELAZIONE di BIOLOGIA MOLECOLARE

RELAZIONE di BIOLOGIA MOLECOLARE NOME: Marini Selena MATRICOLA: 592330 RELAZIONE di BIOLOGIA MOLECOLARE CHE ORGANISMO MODELLO È DICTYOSTELIUM? CHE RISORSE BIOINFORMATICHE AGEVOLANO I RICERCATORI CHE LO STUDIANO? Dictyostelium è un genere

Dettagli

Analisi dei dati di espressione genica in esperimenti realizzati mediante microarray. Erika Melissari

Analisi dei dati di espressione genica in esperimenti realizzati mediante microarray. Erika Melissari Analisi dei dati di espressione genica in esperimenti realizzati mediante microarray Erika Melissari ESPRESSIONE GENICA E un processo molto complesso e finemente regolato che permette ad una cellula di

Dettagli

Tesina di Biologia Molecolare II

Tesina di Biologia Molecolare II MELATO GIULIA 595033 Tesina di Biologia Molecolare II Mostra un albero filogenetico con la relazione tra Uomo, Topo e Ratto. Che banca dati è disponibile per quest'ultimo organismo? Descrivi alcune caratteristiche

Dettagli

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi GENOMA EVOLUZIONE CONTENUTO FUNZIONE STRUTTURA Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine Progetti genoma in centinaia di organismi Importante la sintenia tra i genomi The

Dettagli

Indice generale. Nozioni fondamentali. Prefazione XIII

Indice generale. Nozioni fondamentali. Prefazione XIII Prefazione XIII A Nozioni fondamentali CAPITOLO 1 La biologia essenziale 3 1.1 Genomi, genomica e avvento della Bioinformatica 3 1.2 Genoma dei procarioti 5 1.2.1 Struttura e dimensioni 5 1.2.2 Proprietà

Dettagli

Bioinformatica. Marin Vargas, Sergio Paul

Bioinformatica. Marin Vargas, Sergio Paul Bioinformatica Marin Vargas, Sergio Paul 2014 Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici. La bioinformatica

Dettagli

La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione

La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione La mappatura dei geni umani SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione Un grande impulso alla costruzione di mappe genetiche è stato dato da le tecniche della

Dettagli

HI-TECH IN SANITA'. MINI-INVASIVITA' 2.0: nuove tecnologie al servizio dell'appropriatezza e della bioetica professionale

HI-TECH IN SANITA'. MINI-INVASIVITA' 2.0: nuove tecnologie al servizio dell'appropriatezza e della bioetica professionale HI-TECH IN SANITA'. MINI-INVASIVITA' 2.0: nuove tecnologie al servizio dell'appropriatezza e della bioetica professionale Analisi dell esoma e la medicina predittiva Domenico Coviello Direttore Medico

Dettagli

Laboratorio di Bioinformatica I. Parte 2. Dott. Sergio Marin Vargas (2014 / 2015)

Laboratorio di Bioinformatica I. Parte 2. Dott. Sergio Marin Vargas (2014 / 2015) Laboratorio di Bioinformatica I Banche dati Parte 2 Dott. Sergio Marin Vargas (2014 / 2015) Google Scholar https://scholar.google.it/ E un motore di ricerca di Google, specializzato nella ricerca di articoli

Dettagli

Dal Genotipo al Fenotipo

Dal Genotipo al Fenotipo Dal Genotipo al Fenotipo Dal Fenotipo normale al Fenotipo patologico Regolazione dell espressione genica Figure 7-1 Molecular Biology of the Cell ( Garland Science 2008) Una cellula differenziata contiene

Dettagli

Genomica, proteomica, genomica strutturale, banche dati.

Genomica, proteomica, genomica strutturale, banche dati. Genomica, proteomica, genomica strutturale, banche dati. Alcune pietre miliari della biologia anno risultato 1866 Mendel scopre i geni 1944 il DNA è il materiale genetico 1951 prima sequenza di una proteina

Dettagli

Biologia Molecolare e Bioinformatica

Biologia Molecolare e Bioinformatica Biologia Molecolare e Bioinformatica Molecular Biology and Bioinformatics CFU 12 SSD BIO/11 a.a. 2018-2019 Corso di laurea in Biotecnologie Agro-Ambientali e Alimentari Docente: Maria Luisa Chiusano Tel.

Dettagli

BIOTECNOLOGIE PER IL MIGLIORAMENTO GENETICO A.A

BIOTECNOLOGIE PER IL MIGLIORAMENTO GENETICO A.A BIOTECNOLOGIE PER IL MIGLIORAMENTO GENETICO A.A. 2011-2012 E ancora importante l agricoltura? E la produzione alimentare? da L Espresso, febbraio 2011 Cosa significa miglioramento genetico? Significa migliorare

Dettagli

Le biotecnologie. Sadava et al. Biologia La scienza della vita Zanichelli editore 2010

Le biotecnologie. Sadava et al. Biologia La scienza della vita Zanichelli editore 2010 Le biotecnologie 1 Cosa sono le biotecnologie? Le biotecnologie sono tutte quelle tecniche utilizzate (fin dall antichità) per produrre sostanze specifiche a partire da organismi viventi o da loro derivati.

Dettagli

L organizzazione del genoma. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie

L organizzazione del genoma. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie L organizzazione del genoma L organizzazione del genoma Fino ad ora abiamo studiato la regolazione dell espressione genica prendendo come esempio singoli geni dei batteri. Ma quanti geni ci sono in un

Dettagli

Relazione sequenza-struttura e funzione

Relazione sequenza-struttura e funzione Biotecnologie applicate alla progettazione e sviluppo di molecole biologicamente attive A.A. 2010-2011 Modulo di Biologia Strutturale Relazione sequenza-struttura e funzione Marco Nardini Dipartimento

Dettagli

10/30/16. non modificato CAP al 5 e poly-a al 3. RNA messaggero: soggetto a splicing

10/30/16. non modificato CAP al 5 e poly-a al 3. RNA messaggero: soggetto a splicing procarioti eucarioti poli-cistronico mono-cistronico non modificato CAP al 5 e poly-a al 3 RNA messaggero: procarioti eucarioti policistronico monocistronico non modificato CAP al 5 e poly-a al 3 continuo

Dettagli

Laboratorio di Elementi di Bioinformatica

Laboratorio di Elementi di Bioinformatica Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E30Q6) AA 205/206 Esempio di workflow Docente del laboratorio: Raffaella Rizzi Scopo del workflow Scopo: dato un insieme

Dettagli

Patologie da analizzare

Patologie da analizzare Fasi cruciali Scelta della patologia da analizzare Scelta del campione da analizzare Scelta dell approccio da utilizzare Scelta della tecnica da utilizzare Analisi statistica del dati Conferme con approcci

Dettagli

La metagenomica al servizio dell agricoltura

La metagenomica al servizio dell agricoltura La metagenomica al servizio dell agricoltura Marco Bazzicalupo Department of Biology University of Florence, Firenze, Italy http://www.unifi.it/dblage/mdswitch.html L albero della vita è microbico RNA

Dettagli

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato

Dettagli

Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini)

Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Collegatevi al sito www.ncbi.nlm.nih.gov/blast. Apparirà una pagina nella quale le versioni

Dettagli

VERIFICA MATRICOLE e STAMPA CERTIFICATO INTEGRATIVO DI GARANZIA

VERIFICA MATRICOLE e STAMPA CERTIFICATO INTEGRATIVO DI GARANZIA VERIFICA MATRICOLE e STAMPA CERTIFICATO INTEGRATIVO DI GARANZIA Con riferimento alle disposizioni GSE sul riciclo e recupero dei pannelli fotovoltaici a fine vita, Consorzio Remedia ha reso disponibile

Dettagli

Decode NGS data: search for genetic features

Decode NGS data: search for genetic features Decode NGS data: search for genetic features Valeria Michelacci NGS course, June 2015 Blast searches What we are used to: online querying NCBI database for the presence of a sequence of interest ONE SEQUENCE

Dettagli

SOLUZIONE AL TEMA DI INFORMATICA (PROGETTO ABACUS)

SOLUZIONE AL TEMA DI INFORMATICA (PROGETTO ABACUS) Punto 1 SOLUZIONE AL TEMA DI INFORMATICA (PROGETTO ABACUS) Da una prima analisi del testo appare evidente che per la costruzione della base di dati si possono individuare le seguenti tre entità fondamentali:

Dettagli

I database. Introduzione alla teoria delle basi di dati

I database. Introduzione alla teoria delle basi di dati I database Introduzione alla teoria delle basi di dati 1 Cosa sono e a cosa servono i Database Un database (o base di dati) e' una raccolta organizzata di dati correlati. Il principale scopo di un database

Dettagli

Corso di Laurea triennale in BIOLOGIA MOLECOLARE AA

Corso di Laurea triennale in BIOLOGIA MOLECOLARE AA Corso di Laurea triennale in BIOLOGIA MOLECOLARE AA. 2016-17 http://http://biologia-molecolare.biologia.unipd.it La laurea in Biologia Molecolare approfondisce gli aspetti genetico-molecolari, cellulari

Dettagli

Compito A. Esercizio 1 (13 punti) Minimizzare l automa descritto dalla seguente tabella degli stati

Compito A. Esercizio 1 (13 punti) Minimizzare l automa descritto dalla seguente tabella degli stati Compito A Esercizio 1 (13 punti) Minimizzare l automa descritto dalla seguente tabella degli stati stato/input x=0 x=1 A B/0 A/0 B C/0 A/0 C B/0 D/1 D B/0 E/0 E B/0 D/1 Esercizio 2. (17 punti) Realizzare

Dettagli

ESERCITAZIONE MICROECONOMIA (CORSO B) 21-12-2009 ESEMPI DI ESERCIZI DI TEORIA DEI GIOCHI

ESERCITAZIONE MICROECONOMIA (CORSO B) 21-12-2009 ESEMPI DI ESERCIZI DI TEORIA DEI GIOCHI ESERCITZIONE MICROECONOMI (CORSO ) --009 ESEMPI DI ESERCIZI DI TEORI DEI GIOCHI Questo documento contiene alcuni esempi di esercizi di teoria dei giochi. Gli esercizi presentati non corrispondono esattamente

Dettagli

Dal Genoma all Epigenoma..

Dal Genoma all Epigenoma.. Dal Genoma all Epigenoma.. Nel 2001 sono stati pubblicati i risultati della mappatura del genoma umano (progetto genoma umano) che hanno mostrato la sequenze delle basi che formano il nostro materiale

Dettagli

Legami chimici. Covalente. Legami deboli

Legami chimici. Covalente. Legami deboli Legami chimici Covalente Legami deboli Legame fosfodiesterico Legami deboli Legami idrogeno Interazioni idrofobiche Attrazioni di Van der Waals Legami ionici STRUTTURA TERZIARIA La struttura tridimensionale

Dettagli

PROCEDURA DI INSTALLAZIONE E ATTIVAZIONE DI DARWEB PRO versione 1.0

PROCEDURA DI INSTALLAZIONE E ATTIVAZIONE DI DARWEB PRO versione 1.0 PROCEDURA DI INSTALLAZIONE E ATTIVAZIONE DI DARWEB PRO versione 1.0 INSTALLAZIONE Per installazione seguire i passi operativi indicati all interno della confezione contenente il CD ricevuto; Le mappe che

Dettagli

SINTESI DELLE PROTEINE

SINTESI DELLE PROTEINE SINTESI DELLE PROTEINE IN UN GIORNO DI UN INDIVIDUO ADULTO NORMALE: -100 grammi vengono introdotti con la dieta -400 grammi vengono degradati -400 grammi vengono sintetizzati -100 grammi vengono consumati

Dettagli

Corso di BIOINFORMATICA. Pietro BUFFA. Applicazioni BIO-Mediche. - Livelli di complessità delle proteine e visualizzazione computazionale

Corso di BIOINFORMATICA. Pietro BUFFA. Applicazioni BIO-Mediche. - Livelli di complessità delle proteine e visualizzazione computazionale Corso di BIOINFORMATICA Applicazioni BIO-Mediche - Introduzione alla Bioinformatica ed alla Biologia Strutturale - Livelli di complessità delle proteine e visualizzazione computazionale Pietro BUFFA Responsabile

Dettagli

David Sadava, H. Craig Heller, Gordon H. Orians, William K. Purves, David M. Hillis. Biologia La scienza della vita

David Sadava, H. Craig Heller, Gordon H. Orians, William K. Purves, David M. Hillis. Biologia La scienza della vita 1 David Sadava, H. Craig Heller, Gordon H. Orians, William K. Purves, David M. Hillis Biologia La scienza della vita 2 B - L ereditarietà e l evoluzione La regolazione genica negli eucarioti 3 I genomi

Dettagli

Marcatori molecolari per l analisi genica, genetica e genomica

Marcatori molecolari per l analisi genica, genetica e genomica Marcatori molecolari per l analisi genica, genetica e genomica (RFLP e PCR-derivati, inclusi SSR e SNP) DNA fingerprinting DNA genotyping DNA haplotyping cp/mtdna barcoding MG/QTL mapping MAS breeding

Dettagli

Perché considerare la struttura 3D di una proteina

Perché considerare la struttura 3D di una proteina Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una

Dettagli

18. LA CROMATINA E IL CONTROLLO TRASCRIZIONALE DELLA ESPRESSIONE GENICA! DR. GIUSEPPE LUPO!

18. LA CROMATINA E IL CONTROLLO TRASCRIZIONALE DELLA ESPRESSIONE GENICA! DR. GIUSEPPE LUPO! 18. LA CROMATINA E IL CONTROLLO TRASCRIZIONALE DELLA ESPRESSIONE GENICA! DR. GIUSEPPE LUPO! Il DNA Eʼ ORGANIZZATO IN CROMOSOMI! I CROMOSOMI SONO! COSTITUITI DA CROMATINA:! DNA ASSOCIATO A PROTEINE.! LO

Dettagli

Il Centro Tematico Biomolecolare - Strumenti e Servizi Molecolari - Monica Santamaria & Bachir Balech IBBE-CNR, Bari

Il Centro Tematico Biomolecolare - Strumenti e Servizi Molecolari - Monica Santamaria & Bachir Balech IBBE-CNR, Bari Il Centro Tematico Biomolecolare - Strumenti e Servizi Molecolari - Monica Santamaria & Bachir Balech IBBE-CNR, Bari Roma, 17 Febbraio 2016 Nel Centro Tematico Biomolecolare (CTB) competenze e facilities

Dettagli

Manuale Utente. La Tavola B invece riporta il dettaglio dei vincoli presenti e consente di sapere quali vincoli operano in una determinata locazione.

Manuale Utente. La Tavola B invece riporta il dettaglio dei vincoli presenti e consente di sapere quali vincoli operano in una determinata locazione. Manuale Utente Per operare la pubblicazione del Piano Territoriale Paesistico Regionale sono state definite due applicazioni simili che consentano all utente di navigare sulla Tavola A e sulla Tavola B

Dettagli

La struttura covalente delle proteine (la sequenza amminoacidica)

La struttura covalente delle proteine (la sequenza amminoacidica) La struttura covalente delle proteine (la sequenza amminoacidica) Sequenza amminoacidica dell ormone insulina bovino (Frederick Sanger, 1953) Il primo passo per determinare la sequenza di un peptide è

Dettagli

Introduzione all analisi di arrays: clustering.

Introduzione all analisi di arrays: clustering. Statistica per la Ricerca Sperimentale Introduzione all analisi di arrays: clustering. Lezione 2-14 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia

Dettagli

ArcGIS - ArcView ArcCatalog

ArcGIS - ArcView ArcCatalog ArcGIS - ArcView ArcCatalog Marco Negretti Politecnico di Milano Polo Regionale di Como e-mail: [email protected] http://geomatica.como.polimi.it 04/04/06 - v 1.1 2 ArcCatalog ArcCatalog: strumento

Dettagli

Indice. Ricerca richiesta d offerta. Risultati della ricerca Navigazione Stati

Indice. Ricerca richiesta d offerta. Risultati della ricerca Navigazione Stati Indice Ricerca richiesta d offerta Risultati della ricerca Navigazione Stati Dettaglio richiesta d offerta Codice materiale cliente Note di posizione Aggiungi al carrello 1 di 8 Ricerca richiesta d offerta

Dettagli

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.

Dettagli

ESPERIMENTO DEL LANCIO DEI DADI

ESPERIMENTO DEL LANCIO DEI DADI ANNO SCOLASTICO 214/215 SCUOLA SECONDARIA DI PRIMO GRADO UGO FOSCOLO SCHEDA SPERIMENTALE DI MATEMATICA ESPERIMENTO DEL LANCIO DEI DADI ALUNNA: MARTINA PETRARULO CLASSE: III B PROFESSORE: DANIELE BALDISSIN

Dettagli

07/01/2015. Come si ferma una macchina in corsa? Il terminatore. Terminazione intrinseca (rho-indipendente)

07/01/2015. Come si ferma una macchina in corsa? Il terminatore. Terminazione intrinseca (rho-indipendente) Come si ferma una macchina in corsa? Il terminatore Terminazione intrinseca (rho-indipendente) Terminazione dipendente dal fattore Rho (r) 1 Operoni: gruppi di geni parte di una unica unità trascrizionale

Dettagli