Laboratorio di Elementi di Bioinformatica

Documenti analoghi
Laboratorio di Elementi di Bioinformatica

Corso di Elementi di Bionformatica

Laurea in Biotecnologie Sanitarie, Universita' di Padova Docente: Dr. Stefania Bortoluzzi

Laboratorio di Elementi di Bioinformatica

Bioinformatica e Biostatistica. Esercitazione di laboratorio: allineamento di reads ad un genoma di riferimento

Esercitazioni di Genomica

Introduzione alla Genomica

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.

Lezione 8. DNA sequencing informatics

Esercitazioni di Genomica

DNA sequencing. Reading Genomes. Giovanni Bacci

Analisi di dati di sequenziamento del trascrittoma (RNA-Seq):

Vai al sito: Incolla nel box vuoto la sequenza nucleotidica

Bioinformatica. Analisi del genoma

Corso di Laurea in Medicina e Chirurgia A.A anno / I semestre (ottobre-dicembre 2017) Sedi delle Attività Didattiche

RELAZIONE di BIOLOGIA MOLECOLARE

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi

Corso di BioMedicina Molecolare Genomica e dei Sistemi Complessi

Mappe fisiche. Si basano sulla localizzazione fisica delle molecole di DNA

Next Generation Sequencers: from the bacterial culture to raw data. Valeria Michelacci NGS course, June 2015

Bioinformatica ed applicazioni di bioinformatica strutturale!

ID: /12/2015

Algoritmi di Allineamento

ANALISI MOLECOLARE DEL GENOMA

Next-generation sequencing, annotazione, ed espressione genica. Giulio Pavesi Dip. Bioscienze Università di Milano

Tesina di Biologia Molecolare II

Fondamenti di Informatica

Strategie di annotazione di geni e genomi

Summer School Alloreattività e trapianti nell uomo: le nuove metodiche di studio e i trapianti alternativi

Il Centro Tematico Biomolecolare - Strumenti e Servizi Molecolari - Monica Santamaria & Bachir Balech IBBE-CNR, Bari

Genomi dei procarioti

Bioinformatica (modulo bioinf. dei genomi moderni )

Lezione 3. Genoma umano come esempio di genoma eucariote

Come facciamo ad isolare un gene da un organismo? Utilizziamo una libreria ovvero una collezione dei geni del genoma del cromosoma di un organismo

NGS su ceppi di Listeria monocytogenes isolati da matrici alimentari. Cesare Cammà Massimiliano Orsini

GENOMICA STRUTTURALE: GENOMICA FUNZIONALE:

Metodologie informa/che per l analisi dei genomi

7. Gruppi genici e sequenza ripetute

Nuove Hyundai Go! Brasil Limited Edition STANDARD POSE 4 fuoriclasse per la Coppa del Mondo.

Graziella Bongioni, Sabina Arabi e Rossana Capoferri. Istituto Spallanzani

A Descrizione: ruota effetti opzionale con supporto/ optional effects wheel with support/ iprofile FLEX MODIFICHE. Codice assemblato:

Le biotecnologie. Sadava et al. Biologia La scienza della vita Zanichelli editore 2010

CORSO DI LAUREA IN SCIENZE DELLA FORMAZIONE PRIMARIA

CORSO DI LAUREA IN SCIENZE DELLA FORMAZIONE PRIMARIA

Human Genome Variants Analysis. Marin Vargas, Sergio Paul

Frontiere della Biologia Molecolare

Laboratorio di Bioinformatica I. Parte 1. Dott. Sergio Marin Vargas (2014 / 2015)

Marcatori molecolari per l analisi genica, genetica e genomica

Esercitazione UCSC Table Browser. Obiettivi dell'esercitazione:

FREQUENZE GENOTIPICHE E GENICHE

Laboratorio di Bioinformatica I. Parte 2. Dott. Sergio Marin Vargas (2014 / 2015)

Marcatori molecolari

IL GENOMA DELLA CELLULA VEGETALE

Prof. Mario Ventura. Mappatura fisica

Genetica, genomica ed innovazione varietale UO9, Parco Tecnologico Padano Pietro Piffanelli, Pamela Abbruscato, barbara Menin

Traccia 1. Nome Cognome Matricola Firma. Spazio Riservato alla Commissione. Esercizio 1 Esercizio 2 Esercizio 3 Esercizio 4 Esercizio 5 Totale

Decode NGS data: search for genetic features

Avanzamento dei sistemi di sequenziamento

Valutazione statistica della ripetibilità di esperimenti di sequenziamento del DNA in specie batteriche

ATTIVITA DI BIOINFORMATICA SU CROMOSOMI E ANOMALIE CROMOSOMICHE. SITO INTERNET:

Applicazioni biotecnologiche in systems biology

Bioinformatica NGS Next Generation Sequencing

UNA BASE DATI PER IL KNOWLEDGE DISCOVERY IN GENETICA MEDICA

GENETICA. Modulo di 6 CFU. Esame integrato di BIOCHIMICA&GENETICA Secondo anno del corso di laurea triennale in SCIENZE AMBIENTALI

Whole genome SNPs comparison: SNPtree, NDtree, CSI Phylogeny and kmer-based analysis

BIOTECNOLOGIE PER IL MIGLIORAMENTO GENETICO A.A

Varianti del genoma umano

La metagenomica al servizio dell agricoltura

Applicazioni biotecnologiche in systems biology

TESI DI LAUREA IN INFORMATICA

Genetica dei caratteri quantitativi

LA BIOLOGIA MOLECOLARE E UNA BRANCA DELLA BIOLOGIA CHE STUDIA LE BASI MOLECOLARI DELLE FUNZIONI BIOLOGICHE, PONENDO UNA PARTICOLARE ATTENZIONE A QUEI

Dimensioni dei Genomi Eucariotici

Genomi vegetali Da 7x10 7 bp per genoma aploide (130Mbp diploide, 5 cromosomi) di Arabidopsis thaliana alle 1,5x10 11 bp ( Mbp=150Gbp) di una

La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione

POPOLAZIONE. Gruppo di individui della stessa specie che occupa una particolare area geografica nella quale essi possono accoppiarsi liberamente

Genomica, proteomica, genomica strutturale, banche dati.

Elementi ripetuti del Genoma Umano. Milioni di anni

Transcript:

Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E30Q6) AA 205/206 Esempio di workflow Docente del laboratorio: Raffaella Rizzi

Scopo del workflow Scopo: dato un insieme R di reads genomici (ottenuti con tecnologia NGS) e i locus genici del cromosoma, stimare, per ogni gene, il numero di reads che hanno origine dal suo locus.

Scopo del workflow Ogni gene è fornito come locus Scopo: dato un insieme [start, R end] di reads sul DNA genomici genomico (ottenuti con tecnologia NGS) e à i locus file genes-chr.csv genici del cromosoma, stimare, per ogni gene, il numero di reads che hanno origine dal suo locus. 5 G G2 G3 3 start end chr

Scopo del workflow Scopo: dato un insieme R di reads genomici (ottenuti con tecnologia NGS) e i locus genici del cromosoma, stimare, per ogni gene, il numero di reads che hanno origine dal suo locus. 5 G G2 G3 3 chr Set R

Scopo del workflow Scopo: dato un insieme R di reads genomici (ottenuti con tecnologia NGS) e i locus genici del cromosoma, stimare, per ogni gene, il numero di reads che hanno origine dal suo locus. 5 G G2 G3 3 chr Set R

Scopo del workflow Scopo: dato un insieme R di reads genomici (ottenuti con tecnologia NGS) e i locus genici del cromosoma, stimare, per ogni gene, il numero di reads che hanno origine dal suo locus. 5 G G2 G3 3 In G hanno origine 2 reads. In G2 hanno origine 0 reads. In G3 ha origine reads chr

Recuperare un file di NGS reads in formato FASTQ da SRA (Sequence Read Archive)

2 Recuperare un file di NGS reads in formato FASTQ da SRA (Sequence Read Archive) Allineare i read al genoma

2 3 Recuperare un file di NGS reads in formato FASTQ da SRA (Sequence Read Archive) Allineare i read al genoma Scrivere un programma Ruby: INPUT: allineamenti prodotti allo step 2 (in formato SAM), il file genes-chr.csv dei geni sul cromosoma e una soglia di qualità Q. OUTPUT: una tabella che descrive per ognuno dei geni del cromosoma il numero di allineamenti di reads, con qualità media al di sopra di Q, che cadono all interno del locus del gene.

2 3 Recuperare un file di NGS reads in formato FASTQ da SRA (Sequence Read Archive) Allineare i read al genoma Scrivere un programma Ruby: INPUT: allineamenti prodotti allo step 2 (in formato SAM), il file genes-chr.csv dei geni sul cromosoma e una soglia di qualità Q. OUTPUT: una tabella che descrive per ognuno dei geni NB: del dato cromosoma il locus [start, end] il numero di un gene di diciamo allineamenti di reads, con qualità media al di sopra di Q, che cadono del campo all interno POS nel file del SAM locus è compreso del gene. in [start, end] l allineamento di un read cade all interno del gene se il valore

2 3 Recuperare un file di NGS reads in formato FASTQ da SRA (Sequence Read Archive) Allineare i read al genoma Scrivere un programma Ruby: INPUT: allineamenti Galaxy à https://usegalaxy.org/ prodotti allo step 2 (in formato SAM), il file genes-chr.csv https://orione.crs4.it/ dei geni sul cromosoma e una soglia di qualità Q. OUTPUT: una tabella che descrive per ognuno dei geni del cromosoma il numero di allineamenti di reads, con qualità media al di sopra di Q, che cadono all interno del locus del gene.

Recuperare un file di input (di NGS reads) in formato FASTQ da SRA (Sequence Read Archive) Tool Galaxy: Get Data à EBI SRA ENA SRA ID del set di NGS read: SRR57298

Recuperare un file di input (di NGS reads) in formato FASTQ da SRA (Sequence Read Archive) Tool Galaxy: Get Data à EBI SRA ENA SRA ID del set di NGS read: SRR57298 In alternativa, scaricare il set SRR57298 direttamente all indirizzo http://www.ebi.ac.uk/ena e caricare poi il file in Galaxy Tool Galaxy: Get Data à Upload File from your computer

Recuperare un file di input (di NGS reads) in formato FASTQ da SRA (Sequence Read Archive) Tool Galaxy: Get Data à EBI SRA ENA SRA ID del set di NGS read: SRR57298 In alternativa, scaricare il set SRR57298 direttamente all indirizzo http://www.ebi.ac.uk/ena e caricare poi il file in Galaxy Tool Galaxy: Get Data à Upload File from your computer Convertire in formato Sanger FASTQ il file dei reads Tool Galaxy: NGS: QC and manipulation à FASTQ Groomer convert between various FASTQ quality formats Tipo di input: Illumina.3.7

2 Allineare il set di reads al genoma usando BWA (Burrows-Wheeler Aligner) Tool Galaxy: NGS: mapping à BWA - map short reads (< 00 bp) against reference genome Genoma: Human (Homo Sapiens) (b38): hg38

2 3 Allineare il set di reads al genoma usando BWA (Burrows-Wheeler Aligner) Tool Galaxy: NGS: mapping à BWA - map short reads (< 00 bp) against reference genome Genoma: Human (Homo Sapiens) (b38): hg38 Scrivere il programma Ruby