Corso di Elementi di Bionformatica
|
|
- Roberta Puglisi
- 7 anni fa
- Visualizzazioni
Transcript
1 Corso di Elementi di Bionformatica Laurea Triennale in Informatica Il formato FASTQ per la qualità delle sequenze Anno Accademico Docente del laboratorio: Raffaella Rizzi 1
2 La qualità delle sequenze L aspetto legato alla qualità delle sequenze è attualmente importantissimo: ü le nuove tecnologie di sequenziamento (Next- Generation Sequencing, NGS) producono reads (sequenze) corti per i quali la conoscenza della qualità risulta di fondamentale importanza ü i software tools che processano sequenze NGS devono tenere conto della qualiltà della sequenza Ad ogni base di un read viene dunque associato un indice di qualità.
3 La qualità delle sequenze L aspetto legato alla qualità delle sequenze è attualmente importantissimo: ü le nuove tecnologie di sequenziamento (Next- Generation Sequencing, NGS) producono reads (sequenze) corti per i quali la conoscenza della qualità risulta di fondamentale importanza ü i software tools che processano sequenze NGS devono tenere conto della qualiltà della sequenza Ad ogni base di un read viene dunque associato un indice Repository di qualità. di NGS data: Sequence Read Archive (SRA):
4 Il formato FASTQ FASTQ: ü è un formato di puro testo facilmente leggibile ü è pensato (da Wellcome Trust Sanger Institute) per associare ad una sequenza la qualità di ogni sua singola base ü è un formato standard per l output di strumenti di sequenziamento NGS ü ha estensione: *.fq oppure *.fastq
5 Il formato FASTQ FASTQ: ü è un formato di puro testo facilmente leggibile ü è pensato (da Wellcome Trust Sanger Institute) per associare ad una sequenza la qualità di ogni sua singola base ü è un formato FASTQ standard = FASTA per + qualità l output di strumenti di sequenziamento NGS ü ha estensione: *.fq oppure *.fastq
6 Sanger VS Next-Generation Sequencing (NGS) Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costoso (attorno al milione di dollari per sequenziare il genoma umano) ð Processa tanti reads in un run (milioni) (copertura da 10 a 100 volte superiore quella Sanger) ð Reads relativamente corti ð Qualità relativamente bassa
7 Sanger VS Next-Generation Sequencing (NGS) Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costoso (attorno al milione di dollari per sequenziare il genoma umano) ð Processa tanti reads in un run (milioni) (copertura da 10 a 100 volte superiore quella Sanger) ð Reads relativamente corti ð Qualità relativamente bassa
8 Sanger VS Next-Generation Sequencing (NGS) Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per FASTA Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costoso (attorno al milione di dollari per sequenziare il genoma umano) ð Processa tanti reads in un run (milioni) (copertura da 10 a 100 volte FASTQ superiore quella Sanger) ð Reads relativamente corti ð Qualità relativamente bassa
9 Base calling Un esperimento di sequenziamento produce in generale un cromatogramma da cui si deriva la sequenza delle base tramite il cosiddetto processo di base calling
10 Base calling Un esperimento di sequenziamento produce in generale un cromatogramma da cui si deriva la sequenza delle base tramite il cosiddetto processo di base calling
11 Base calling La lettura di un cromatogramma permette l associazione di un indice di qualità ad ogni base chiamata. Oltre alla sequenza di basi, si ottiene dunque anche la corrispondente sequenza di indici di qualità.
12 Base calling La lettura di un cromatogramma permette l associazione di un indice di qualità ad ogni base chiamata. Oltre alla sequenza di basi, si ottiene dunque anche la corrispondente sequenza di indici di qualità. L indice di qualità più usato attualmente è il Phred Quality Score
13 Phred Quality Score Phred Quality Score è stato sviluppato all interno del software Phred base-calling nei primi anni Novanta dal gruppo di Phil Green (Washington University). La qualità q, relativa ad una certa base b nella sequenza, è: q = -10 log 10 (p) dove p è la probabilità che la base b sia errata. (Il valore calcolato viene arrotondato all intero più vicino)
14 Phred Quality Score Esercizio 1. Calcolare il phred value q di una base che ha una probabilità dell 1% di essere errata (cioè una probabilità del 99% di essere corretta).
15 Phred Quality Score Esercizio 1. Calcolare il phred value q di una base che ha una probabilità dell 1% di essere errata (cioè una probabilità del 99% di essere corretta). q = - 10 log 10 (0.01) = 20
16 Phred Quality Score Esercizio 2. Calcolare il phred value q di una base che ha una probabilità del 100% di essere errata (cioè una probabilità dello 0% di essere corretta).
17 Phred Quality Score Esercizio 2. Calcolare il phred value q di una base che ha una probabilità del 100% di essere errata (cioè una probabilità dello 0% di essere corretta). q = - 10 log 10 (1.0) = 0
18 Phred Quality Score Esercizio 3. Calcolare il phred value q di una base che ha una probabilità dello 0% di essere errata (cioè una probabilità del 100% di essere corretta).
19 Phred Quality Score Esercizio 3. Calcolare il phred value q di una base che ha una probabilità dello 0% di essere errata (cioè una probabilità del 100% di essere corretta). q = - 10 log 10 (0.0) = +infinito
20 Phred Quality Score Esercizio 3. Calcolare il phred value q di una base che ha una probabilità dello 0% di essere errata (cioè una probabilità del 100% di essere corretta). q = - 10 log 10 (0.0) = +infinito Una base con q maggiore o uguale a 50 è considerata praticamente corretta.
21 Phred Quality Score Esercizio 3. Calcolare il phred value q di una base che ha una probabilità dello 0% di essere errata (cioè una probabilità del 100% di essere corretta). q = - 10 log 10 (0.0) = +infinito Una base con q maggiore o uguale a 30 (e inferiore a 50) è considerata buona.
22 Phred Quality Score Esercizio 4. Calcolare la probabilità di errore di una base con phred value pari a 50.
23 Phred Quality Score Esercizio 4. Calcolare la probabilità di errore di una base con phred value pari a 50. p = 10 ^(q/-10) = 10 ^ (-5) =
24 Phred Quality Score Esercizio 4. Calcolare la probabilità di errore di una base con phred value pari a 50. p = 10 ^(q/-10) = 10 ^ (-5) = Una base con phred value pari a 50, ha una probabilità dello 0.001% di essere sbagliata.
25 Phred Quality Score Esercizio 4. Calcolare la probabilità di errore di una base con phred value pari a 50. p = 10 ^(q/-10) = 10 ^ (-5) = Le basi che hanno una probabilità inferiore allo 0.001% di essere sbagliate sono considerate corrette
26 Phred Quality Score Esercizio 5. Calcolare il phred value q di una base che ha una probabilità del 75% di essere corretta.
27 Phred Quality Score Esercizio 5. Calcolare il phred value q di una base che ha una probabilità del 75% di essere corretta. q = - 10 log 10 (1-0.75) = 6
28 Phred Quality Score Esercizio 6. Data una base, avente phred value q pari a 10, calcolare la probabilità p c che la base sia stata chiamata correttamente.
29 Phred Quality Score Esercizio 6. Data una base, avente phred value q pari a 10, calcolare la probabilità p c che la base sia stata chiamata correttamente. p = 10 ^(q/-10) = 10 ^ (-1) = 0.1 p c = 1 - p = = 0.9
30 Formato FASTQ Il formato FASTQ è composto da quattro righe:
31 Formato FASTQ Il formato FASTQ è composto da quattro righe: 1. Header della sequenza contenente l identificatore del read simbolo
32 Formato FASTQ Il formato FASTQ è composto da quattro righe: 1. Header della sequenza contenente l identificatore del read simbolo 2. Sequenza delle basi del read
33 Formato FASTQ Il formato FASTQ è composto da quattro righe: 1. Header della sequenza contenente l identificatore del read simbolo 2. Sequenza delle basi del read 3. Header della sequenza dei phred values simbolo iniziale: +
34 Formato FASTQ Il formato FASTQ è composto da quattro righe: 1. Header della sequenza contenente l identificatore del read simbolo 2. Sequenza delle basi del read 3. Header della sequenza dei phred values simbolo iniziale: + 4. Sequenza dei phred values corrispondenti alle basi del read (codificata in caratteri stampabili)
35 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx
36 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Header della sequenza: dopo il c è l ID del read
37 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Sequenza delle basi del read
38 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Header della sequenza dei phred values: dopo il simbolo + c è l ID (opzionale) del read
39 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Header della sequenza dei phred values: dopo il simbolo + c è l ID (opzionale) del read
40 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Sequenza dei phred values: il carattere i-esimo codifica Il phred value q della i-esima base del read
41 Conversione di q in carattere Ogni phred value q viene convertito in un carattere stampabile su file Ogni sequenziatore NGS ha una propria funzione f che specifica la conversione da phred value q a carattere c: c = f(q)
42 Conversione di q in carattere Una tipica conversione è la seguente: cioé: c = ASCII(min(q,93)+33) 1. se q è maggiore di 93, si pone q=93 2. si aggiunge a q il valore si converte in ASCII l intero ottenuto al punto 2
43 Conversione di q in carattere Una tipica conversione è la seguente: cioé: c = ASCII(min(q,93)+33) 1. se q è maggiore di 93, si pone q=93 2. si aggiunge a q il valore si converte Il codice in ASCII l intero è una tabella ottenuto che al punto fa 2 corrispondere a un intero in [0, 127] un carattere
44
45 Rappresentazione in base 10
46 Rappresentazione in base 16
47 Rappresentazione in base 8
48 Ad esempio, all intero 50 corrisponde il carattere 2
49 I caratteri stampabili corrispondono agli interi nell intervallo [32, 127]
50 Conversione di q in carattere Una tipica conversione è la seguente: c = ASCII(min(q,93)+33) Esercizio 7: trovare il carattere che corrisponde a un valore q = 32 secondo la conversione riportata sopra.
51 Conversione di q in carattere Una tipica conversione è la seguente: c = ASCII(min(q,93)+33) Esercizio 7: trovare il carattere che corrisponde a un valore q = 32 secondo la conversione riportata sopra. q=32 à A
52 Conversione di q in carattere Una tipica conversione è la seguente: c = ASCII(min(q,93)+33) Esercizio 8: trovare il valore di q che corrisponde al carattere a secondo la conversione riportata sopra.
53 Conversione di q in carattere Una tipica conversione è la seguente: c = ASCII(min(q,93)+33) Esercizio 8: trovare il valore di q che corrisponde al carattere a secondo la conversione riportata sopra. a à q=64 (probabilità di errore dello %)
54 Conversione di q in carattere Una tipica conversione: c = ASCII(min(q,93)+33) Esercizio 9: trovare la probabilità che la dodicesima base del read (riportato nell esempio precedente) sia corretta.
55 Conversione di q in carattere Una tipica conversione: c = ASCII(min(q,93)+33) Esercizio 9: trovare la probabilità p c che la dodicesima base del read (riportato nell esempio precedente) sia corretta. ] à 93 (dalla tabella ASCII) q = = 60 q = 60 à p = 0, p c = 1 p = 0,999999
56 Trimming dei reads La conoscenza della qualità dei reads consente di effettuare il trimming delle sequenze prima di qualsiasi processamento. Il trimming consiste in: 1. eliminare (eventualmente) un prefisso e/o un suffisso di bassa qualità (al di sotto di una prefissata soglia) 2. eliminare un read che risulti troppo corto dopo avere effettuato il trimming
57 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Si supponga di volere tenere solo le basi che hanno un phred value q maggiore o uguale a una soglia prefissata q*, ad esempio q*=58.
58 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Considero il carattere c* che corrisponde al valore q*=58: c* =
59 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Considero il carattere c* che corrisponde al valore q*=58: c* = [
60 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Una strategia è quella di trovare la più lunga parte della sequenza dei phred values che non contenga caratteri il cui valore intero (nella tabella ASCII) sia minore o uguale a quello del carattere [.
61 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Una strategia è quella di trovare la più lunga parte della sequenza dei phred values che non contenga caratteri il cui valore intero (nella tabella ASCII) sia minore o uguale a quello del carattere [.
62 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Una strategia è quella di trovare la più lunga parte della sequenza dei phred values che non contenga caratteri il cui valore intero (nella tabella ASCII) sia minore o uguale a quello del carattere [. Significa cioè trovare la più lunga parte del read la cui qualità non vada al di sotto della soglia q*=58.
63 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Se tale parte è troppo corta, allora elimino il read
64 Esercizio Scrivere un programma che prenda in input un file in formato FASTQ, una soglia Q di qualità e un valore T compreso tra 0 e 1, e produca in output un file FASTQ contenente le sole sequenze in cui la percentuale di basi con qualità >= Q è pari ad almeno T.
65 TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] TCTGCCAACTTCTTATGGAGGCCTGTATTCACAGGT +HWUSI-EAS522:8:5:662:693#0/1 Aaaa`aa`aa`] TCTGCCAGAGGCCTGTATTCACAGGTACTTCTTATG +HWUSI-EAS522:8:5:662:694#0/1 aaaa`aa`aa`] TCGCCTGTATTCACAGGTTGCCAACTTCTTATGGAG +HWUSI-EAS522:8:5:662:695#0/1 AaaA`aa`aa`] `:A`_U;_A`^\\UTWZ`X^QX example.fq Con Q=58 e T=0.7 vengono tenuti solo Il primo e il terzo read
66 TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] TCTGCCAACTTCTTATGGAGGCCTGTATTCACAGGT +HWUSI-EAS522:8:5:662:693#0/1 Aaaa`aa`aa`] TCTGCCAGAGGCCTGTATTCACAGGTACTTCTTATG +HWUSI-EAS522:8:5:662:694#0/1 aaaa`aa`aa`] TCGCCTGTATTCACAGGTTGCCAACTTCTTATGGAG +HWUSI-EAS522:8:5:662:695#0/1 AaaA`aa`aa`] `:A`_U;_A`^\\UTWZ`X^QX example.fq Con Q=58 e T=0.7 vengono tenuti solo Il primo e il terzo read
Laboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E30Q6) AA 205/206 Esempio di workflow Docente del laboratorio: Raffaella Rizzi Scopo del workflow Scopo: dato un insieme
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2016/2017 Formato GTF per annotare un gene Docente del laboratorio: Raffaella Rizzi 1 GTF (Gene Transfer
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2017/2018 ati in Bioinformatica ocente: Raffaella Rizzi 1 Outline ü Cos è un NA genomico e un RNA? Outline
DettagliDNA sequencing. Reading Genomes. Giovanni Bacci
Reading Genomes Giovanni Bacci Evoluzione del sequenziamento 1977 Frederick Sanger Prima tecnica di sequenziamento 1987 Applyed Biosystems Prima macchina automatica per il sequenziamento del DNA 1998 Phil
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2016/2017 I dati in Bioinformatica Docente del laboratorio: Raffaella Rizzi 1 Il DNA (oggetto biologico)
DettagliBioinformatica e Biostatistica / Lezione7. Lezione 7: Allineamento delle reads ad un genoma di riferimento
Bioinformatica e Biostatistica / Lezione7 Lezione 7: Allineamento delle reads ad un genoma di riferimento Il formato fastq Un sequenziatore NGS produce milioni di reads cioè combinazioni di 4 righe di
DettagliCorso di Elementi di Bioinformatica
Corso di Elementi di Bioinformatica Laurea Triennale in Informatica I dati e le banche dati in Bioinformatica Anno Accademico 2015-2016 Docente del laboratorio: Raffaella Rizzi 1 Il DNA (oggetto biologico)
DettagliArchitettura degli Elaboratori e Laboratorio
Architettura degli Elaboratori e Laboratorio Docente: Francesco Giacomini Assistente: Matteo Manzali Università di Ferrara, Anno Accademico 2013/2014 Rappresentazione binaria delle informazioni 12 Rappresentazione
DettagliRappresentazione dei numeri
Corso di Calcolatori Elettronici I Rappresentazione dei numeri: sistemi di numerazione posizionale Prof. Roberto Canonico Università degli Studi di Napoli Federico II Dipartimento di Ingegneria Elettrica
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2015/2016 Parsing di un file in formato EMBL (parte I) Docente del laboratorio: Raffaella Rizzi 1 Esercizio
DettagliLezione 4. Il sequenziamento del DNA, Sanger
Lezione 4 Il sequenziamento del DNA, Sanger Schema della lezione Polymerase chain reaction (PCR) Dal prodotto di PCR al sequenziamento di Sanger Lettura dei prodotti di sequenziamento con sequenziatori
DettagliCorso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale
Corso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale Paolo Mereghetti DISCo Dipartimento di Informatica, Sistemistica e Comunicazione Rappresentazione dell Informazione Prima
DettagliLezione 8. DNA sequencing informatics
Lezione 8 DNA sequencing informatics Il materiale di questa lezione è contenuto nel libro Next-generation DNA sequencing informatics Edited by Stuart M Brown Disponibile in biblioteca (CHIOSTRO 572.8633
DettagliCorso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione dei numeri relativi
Codice BCD Prima di passare alla rappresentazione dei numeri relativi in binario vediamo un tipo di codifica che ha una certa rilevanza in alcune applicazioni: il codice BCD (Binary Coded Decimal). È un
DettagliApplicazioni biotecnologiche in systems biology
Applicazioni biotecnologiche in systems biology Lezione #2 Dr. Marco Galardini AA 2012/2013 Contatti Dr. Marco Galardini Dip. Di Biologia Via Madonna del Piano 6, Polo Scientifico S. Fiorentino (c/o Incubatore
DettagliNotazione posizionale. Codifica binaria. Rappresentazioni medianti basi diverse. Multipli del byte
Codifica binaria Rappresentazione di numeri Notazione di tipo posizionale (come la notazione decimale). Ogni numero è rappresentato da una sequenza di simboli Il valore del numero dipende non solo dalla
DettagliCodifica di Huffman e Lempel-Ziv-Welch
Codifica di e Lempel-Ziv-Welch 1 ALBERTO BELUSSI ANNO ACCADEMICO 2009/2010 Tipi di compressione Senza perdita (lossless lossless): permettono di ricostruire perfettamente la rappresentazione del dato originale,
DettagliCorso di Calcolatori Elettronici I A.A Lezione 2 Rappresentazione dei numeri: sistemi di numerazione posizionale ing. Alessandro Cilardo
Corso di Calcolatori Elettronici I A.A. 2012-2013 Lezione 2 Rappresentazione dei numeri: sistemi di numerazione posizionale ing. Alessandro Cilardo Accademia Aeronautica di Pozzuoli Corso Pegaso V GArn
DettagliPolymerase chain reaction (PCR) qualche ora
Lezione 3 Metodologie di sequenziamemento di DNA ed RNA. Da Sanger sequencing ad High Throughput (HTS) o di Next Generation (NGS) o di seconda generation Polymerase chain reaction (PCR) qualche ora 25
DettagliL informazione numerica
L informazione numerica Sorgenti di informazione Abbiamo esaminato delle sorgenti di informazione analogiche (audio, video). Abbiamo visto come trasmetterle a distanza per mezzo di sistemi analogici. Come
DettagliTecniche di compressione senza perdita
FONDAMENTI DI INFORMATICA Prof. PIER LUCA MONTESSORO Facoltà di Ingegneria Università degli Studi di Udine Tecniche di compressione senza perdita 2000 Pier Luca Montessoro (si veda la nota di copyright
DettagliI/O e strutture di controllo
Dipartimento di Elettronica ed Informazione Politecnico di Milano Informatica e CAD (c.i.) - ICA Prof. Pierluigi Plebani A.A. 2009/2010 I/O e strutture di controllo La presente dispensa e da utilizzarsi
DettagliCodifica dell informazione
Codifica dell informazione Gli algoritmi sono costituiti da istruzioni (blocchi sequenziali, condizionali, iterativi) che operano su dati. Per trasformare un programma in una descrizione eseguibile da
DettagliLezione 6. Ricerche in banche dati (databases) attraverso l uso di BLAST
Lezione 6 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere
DettagliLaboratorio di Algoritmi e Strutture Dati
Laboratorio di Algoritmi e Strutture Dati Docente: Camillo Fiorentini 8 gennaio 8 Il problema è simile all esercizio 5.6 del libro di testo di algoritmi (Introduzione agli algoritmi e strutture dati, T.
DettagliCodifica di Huffman e Lempel-Ziv-Welch
e Lempel-Ziv-Welch 1 A L B E R T O B E L U S S I A N N O A C C A D E M I C O 2 0 1 0 / 2 0 1 1 Tipi di compressione Senza perdita (lossless): permettono di ricostruire perfettamente la rappresentazione
DettagliDispensa di Informatica I.2
CENNI Una variabile il cui valore appartenga ad un insieme di simboli può indicare un numero di informazioni pari al numero di elementi di cui è composto l insieme. Ad esempio se a può assumere i valori
DettagliCRYPTO-CURRENCY LA CRITTOGRAFIA E LA BLOCKCHAIN
CRYPTO-CURRENCY LA CRITTOGRAFIA E LA BLOCKCHAIN LA BOLLA ethereum https://www.etoro.com/it/discover/markets/cryptocurrencies LE MONETE VIRTUALI FRA TRADING E VIRTÙ PERCHÉ CRYPTO ALGEBRA, PROBABILITÀ E
DettagliCodifica di Huffman e Lempel-Ziv-Welch A L B E R T O B E L U S S I A N N O A C C A D E M I C O /
Codifica di Huffman e Lempel-Ziv-Welch 1 A L B E R T O B E L U S S I A N N O A C C A D E M I C O 2 0 1 0 / 2 0 1 1 Tipi di compressione Senza perdita (lossless): permettono di ricostruire perfettamente
DettagliModello di sistema di comunicazione
Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2006-07 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di
DettagliInformazione e sua rappresentazione: codifica
Corso di Calcolatori Elettronici I A.A. 2011-2012 Informazione e sua rappresentazione: codifica Lezione 2 Prof. Antonio Pescapè Università degli Studi di Napoli Federico II Facoltà di Ingegneria Corso
DettagliIl concetto di informazione
Il concetto di informazione Qualunque informazione è definita tramite tre caratteristiche fondamentali: 1. Valore indica il particolare elemento assunto dall informazione 2. Tipo indica l insieme degli
DettagliEsercitazione 0. Alberto Marchesi Informatica A Ingegneria Matematica (sez. 2) 25 Settembre 2019
Esercitazione Alberto Marchesi Informatica A Ingegneria Matematica (sez. 2) 25 Settembre 219 Gli esercizi visti a lezione sono segnalati con ( ). Esercizio.1 ( ). Convertire in base 1 il numero (1111)2
DettagliEsercitazioni di Fondamenti di Informatica - Lez. 1 02/10/2018
Esercitazioni di Fondamenti di Informatica - Lez. 1 02/10/2018 Esercizi sulla codifica binaria 1. Quanti bit sono necessari per codificare il numero di auto presenti in un parcheggio da 20 posti? Devo
DettagliCodifica dei caratteri
Codifica dei caratteri Argomenti Codifica ASCII a 7-bit ( US-ASCII ) Codifiche ASCII estese ISO 8859-1 (Latin 1) Standard Unicode Codifica UTF-8 Codifica UTF-16 Codifica UTF-32 Prof. Marco Camurri 98 ASCII
DettagliALGORITMI: PROPRIETÀ FONDAMENTALI
ALGORITMI: PROPRIETÀ FONDAMENTALI Non si può risolvere un problema senza prima fissare un insieme di azioni, i di mosse elementari possibili per l'esecutore. Bisogna conoscerne le caratteristiche, le mosse
DettagliCodifica dell Informazione
Francesco Folino CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati e istruzioni in un formato tale che l esecutore automatico
DettagliEsercizi di introduzione alla programmazione
Esercizi di introduzione alla programmazione Federico Reghenzani Informatica ed Elementi di Informatica Medica 2017-18 1 Esercizi di codifica 1.1 Conversione da base 10 a un altra base Trovare x: 203 10
DettagliCorrettezza (prima parte)
Fondamenti di informatica Oggetti e Java (prima parte) Capitolo 16 ottobre 2015 1 Contenuti Introduzione alla correttezza dei programmi specifica di un programma correttezza di un programma verifica di
DettagliSistemi di Elaborazione delle Informazioni
SCUOLA DI MEDICINA E CHIRURGIA Università degli Studi di Napoli Federico II Corso di Sistemi di Elaborazione delle Informazioni Dott. Francesco Rossi a.a. 2016/2017 1 I linguaggi di programmazione e gli
DettagliPolitecnico di Bari Sede di Foggia. docente: Prof. Ing. Michele Salvemini
Corso di Laurea in Ingegneria Civile Politecnico di Bari Sede di Foggia Fondamenti di Informatica Anno Accademico 2011/2012 docente: Prof. Ing. Michele Salvemini Sommario I Codici I Sistemi di numerazione
DettagliSommario. Sistema binario. I Sistemi di numerazione. Codifica ASCII. Valori Numerici Negativi. Valori Numerici Reali. Posizionali e non posizionali
Corso di Laurea in Ingegneria Civile Politecnico di Bari Sede di Foggia Fondamenti di Informatica Anno Accademico 2011/2012 docente: Prof. Ing. Michele Salvemini Sommario I Codici I Sistemi di numerazione
DettagliSommario. I Sistemi di numerazione Posizionale e non Posizionale (1/2) I Codici. I Codici I Sistemi di numerazione Posizionali e non posizionali
Corso di Laurea in Ingegneria Civile Politecnico di Bari Sede di Foggia Fondamenti di Informatica Anno Accademico 2011/2012 docente: Prof. Ing. Michele Salvemini Sommario I Codici I Sistemi di numerazione
DettagliAnalisi di dati di sequenziamento del trascrittoma (RNA-Seq):
Il vostro progetto Analisi di dati di sequenziamento del trascrittoma (RNA-Seq): 1. Analisi di qualità 2. Mappatura sul genoma 3. Calcolo dell espressione 4. Test di espressione differenziale 5. Visualizzazione
DettagliDr. Tommaso Giordani SEQUENZIAMENTO SANGER E ASSEMBLAGGIO DEI GENOMI
Dr. Tommaso Giordani SEQUENZIAMENTO SANGER E ASSEMBLAGGIO DEI GENOMI Programma - Strategie di sequenziamento Sanger dei GENOMI COMPLETI sequenziamento gerarchico (clone by clone) sequenziamento shotgun
DettagliElementi di informatica
Elementi di informatica problema della rappresentazione dei valori delle informazioni la rappresentazione deve essere effettuata attraverso un insieme finito di simboli disponibili il numero di simboli
DettagliCostanti e Variabili
Parte 3 Costanti e Variabili Identificatori Un identificatore è un nome che viene associato a diverse entità (costanti, tipi, variabili, funzioni, ecc.) e serve ad identificare la particolare entità Gli
Dettaglimodificato da andynaz Cambiamenti di base Tecniche Informatiche di Base
Cambiamenti di base Tecniche Informatiche di Base TIB 1 Il sistema posizionale decimale L idea del sistema posizionale: ogni cifra ha un peso Esempio: 132 = 100 + 30 + 2 = 1 10 2 + 3 10 1 + 2 10 0 Un numero
DettagliLa codifica dei caratteri di un testo
La codifica dei caratteri di un testo L obiettivo è quello di comunicare con il calcolatore usando il nostro linguaggio. Dobbiamo rappresentare le lettere dell alfabeto L insieme di simboli comunemente
Dettagli1.2d: La codifica Digitale dei caratteri
1.2d: La codifica Digitale dei caratteri 2 12 ott 2011 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi 3 12 ott 2011 La codifica dei caratteri Un testo
DettagliCodifica dell Informazione
Introduzione all Informatica Fabrizio Angiulli Codifica dell Informazione CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati
DettagliTeoria dell informazione
Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2008-09 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di
DettagliLa rappresentazione delle Informazioni
La rappresentazione delle Informazioni Nella vita di tutti i giorni siamo abituati ad avere a che fare con vari tipi di informazioni, di natura e forma diversa, così come siamo abituati a diverse rappresentazioni
DettagliInformazione e sua rappresentazione: codifica. Il concetto di informazione
Corso di Calcolatori Elettronici I A.A. 2011-2012 Informazione e sua rappresentazione: codifica Lezione 2 Prof. Roberto Canonico Università degli Studi di Napoli Federico II Facoltà di Ingegneria Corso
DettagliEsercitazioni di Fondamenti di Informatica - Lez. 1 - Soluzioni
Esercitazioni di Fondamenti di Informatica - Lez. 1 - Soluzioni 25 Settembre 2017 1 Esercizi sulla codifica binaria Esercizio 1: Quanti bit sono necessari per codificare il numero di auto presenti in un
DettagliAnalogico vs. Digitale. LEZIONE II La codifica binaria. Analogico vs digitale. Analogico. Digitale
Analogico vs. Digitale LEZIONE II La codifica binaria Analogico Segnale che può assumere infiniti valori con continuità Digitale Segnale che può assumere solo valori discreti Analogico vs digitale Il computer
DettagliModulo 1: Le I.C.T. UD 1.2d: La codifica Digitale dei caratteri
Modulo 1: Le I.C.T. : La codifica Digitale dei caratteri Prof. Alberto Postiglione Corso di Informatica Generale (AA 07-08) Corso di Laurea in Scienze della Comunicazione Università degli Studi di Salerno
DettagliInformazione e sua rappresentazione: codifica
Corso di Calcolatori Elettronici I Informazione e sua rappresentazione: codifica ing. Alessandro Cilardo Corso di Laurea in Ingegneria Biomedica Il concetto di informazione Qualunque informazione è definita
DettagliFondamenti Teorici. Antonio Pescapè e Marcello Esposito Parte Terza v1.0
Fondamenti Teorici Antonio Pescapè e Marcello Esposito Parte Terza v1.0 Agenda Concetto di Informazione Codifica Rappresentazione dei numeri Elementi di Informatica Fondamenti Teorici, A. Pescapè e M.
DettagliInformazione e sua rappresentazione: codifica
Corso di Calcolatori Elettronici I A.A. 2010-2011 Informazione e sua rappresentazione: codifica Lezione 1-2 Università degli Studi di Napoli Federico II Facoltà di Ingegneria Informazione Quale è il centravanti
DettagliLABORATORIO DI INFORMATICA
LABORATORIO DI INFORMATICA Corso di laurea in Scienze della Formazione Primaria a.a.2014/2015 A cura del Prof. Sergio Miranda 2 LEZIONE N.5 Codifica delle Informazioni LA CODIFICA DEI NUMERI Obiettivo:
DettagliNumeri Frazionari. Numeri Frazionari
Numeri Frazionari Conversione da decimale a binario: si convertono separatamente parte intera e parte frazionaria per la parte intera si segue la procedura di conversione già vista; per la parte frazionaria
DettagliInformatica, Informazione e Telecomunicazioni. La codifica dell informazione. Supporto e informazione. Il concetto di informazione
La codifica dell informazione Fondamenti di Informatica A Ingegneria Gestionale Università degli Studi di Brescia Docente: Prof. Alfonso Gerevini Informatica, Informazione e Telecomunicazioni l informatica
DettagliCodifica CCITT Fax. Introduzione Codifica monodimensionale Codifica bidimensionale. Codifica CCITT Fax. Codifica JBIG2
Codifica CCITT Fax Metodo per la codifica senza perdita di immagini bitonali, standardizzato nel 1988 dal CCITT (ora ITU-T) Sviluppato per la trasmissione di fax, ma utilizzato anche per l archiviazione
DettagliNumeri e caratteri in binario. Prof.ssa Antonella Serra
Numeri e caratteri in binario SISTEMI DI NUMERAZIONE Viene definito sistema di numerazione o numerazione l'insieme delle regole e dei simboli per rappresentare i numeri. Assumono particolare caratteristica
DettagliInformatica, Informazione e Telecomunicazioni. La codifica dell informazione. Il concetto di informazione. Supporto e informazione
La codifica dell informazione Elementi di Informatica e Programmazione Ingegneria Gestionale Università degli Studi di Brescia Docente: Prof. Ivan Serina Prof. Alfonso Gerevini Informatica, Informazione
DettagliProgrammare in C. Maurizio Palesi Salvatore Serrano. Valori. Operazioni. Un insieme di valori del tipo. Per operare su tali valori Tipi
MASTER Information Technology Excellence Road (I.T.E.R.) Programmare in C Maurizio Palesi Salvatore Serrano Master ITER Informatica di Base Maurizio Palesi, Salvatore Serrano 1 Tipi di Dati Valori Un insieme
DettagliLezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST
Lezione 8 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere
DettagliLezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST
Lezione 8 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere
DettagliBioinformatica e Biostatistica. Esercitazione di laboratorio: allineamento di reads ad un genoma di riferimento
Bioinformatica e Biostatistica Esercitazione di laboratorio: allineamento di reads ad un genoma di riferimento Specie Mammuth lanoso (Mammuthus primigenius), da 200 a 5 mila anni fa Aerale di distribuzione
DettagliCorso di Informatica B - Sezione D
Facoltà di Ingegneria Industriale Laurea in Ingegneria Energetica, Meccanica e dei Trasporti Corso di Informatica B - Sezione D Esercitazioni Linguaggio C 1 Facoltà di Ingegneria Industriale Laurea in
DettagliDati due punti sul piano calcolare la loro distanza
Introduzione al C Primo esempio in C Dati due punti sul piano calcolare la loro distanza Soluzione: la distanza fra due punti si calcola secondo il teorema di Pitagora, con la formula: y Distanza = (lato12
DettagliFunzioni, Stack e Visibilità delle Variabili in C
Funzioni, Stack e Visibilità delle Variabili in C Laboratorio di Programmazione I Corso di Laurea in Informatica A.A. 2018/2019 Argomenti del Corso Ogni lezione consta di una spiegazione assistita da slide,
DettagliRappresentazione di interi
Rappresentazione dei numeri Rappresentazione di interi Supponiamo 2 byte (16 bit) 2 16 = 65536 [-32767, 32768] con m bit 2 m -1 numeri Se prendiamo come segno il primo bit abbiamo ad esempio (01111111)
DettagliLinguaggio C: introduzione
Dipartimento di Elettronica ed Informazione Politecnico di Milano Informatica e CAD (c.i.) - ICA Prof. Pierluigi Plebani A.A. 2008/2009 Linguaggio C: introduzione La presente dispensa e da utilizzarsi
DettagliLaboratorio di Architettura degli Elaboratori A.A. 2014/15 Programmazione Assembly
Laboratorio di Architettura degli Elaboratori A.A. 2014/15 Programmazione Assembly Scrivere il codice ARM che implementi le specifiche richieste e quindi verificarne il comportamento usando il simulatore
DettagliArgomenti trattati. Informazione Codifica Tipo di un dato Rappresentazione dei numeri Rappresentazione dei caratteri e di altre informazioni
Argomenti trattati Informazione Codifica Tipo di un dato Rappresentazione dei numeri Rappresentazione dei caratteri e di altre informazioni Informazione mi dai il numero di Andrea? 0817651831 Il numero
DettagliLa codifica dei numeri
La codifica dei numeri La rappresentazione dei numeri con il sistema decimale può essere utilizzata come spunto per definire un metodo di codifica dei numeri all interno degli elaboratori: la sequenza
DettagliLa codifica binaria. Fondamenti di Informatica. Daniele Loiacono
La codifica binaria Fondamenti di Informatica Come memorizzo l informazione nel calcolatore? 1 bit di informazione 1 bit di informazione La memoria del calcolatore Introduzione q Il calcolatore usa internamente
DettagliFunzioni, Stack e Visibilità delle Variabili in C
Funzioni, Stack e Visibilità delle Variabili in C Programmazione I e Laboratorio Corso di Laurea in Informatica A.A. 2016/2017 Calendario delle lezioni Lez. 1 Lez. 2 Lez. 3 Lez. 4 Lez. 5 Lez. 6 Lez. 7
DettagliBasi metodologiche della ricerca in ambito sportivo
Università degli Studi di Roma «Tor Vergata» Facoltà di Medicina e Chirurgia Laurea Magistrale in Scienze e Tecniche dello Sport Insegnamento Professore Argomento Basi metodologiche della ricerca in ambito
DettagliInformazione binaria: Codici per la rilevazione e correzione di errori Codici di compressione
Informazione binaria: Codici per la rilevazione e correzione di errori Codici di compressione Percorso di Preparazione agli Studi di Ingegneria Università degli Studi di Brescia Docente: Massimiliano Giacomin
DettagliPremessa. Input /output e gestione dei file. I file e gli stream. Il puntatore al file. 21. I FILE NEL LINGUAGGIO C Versione 1.
Input /output e gestione dei file Premessa Iniziamo la lezione dicendo subito che per INPUT/OUTPUT si intende l insieme delle operazioni di ingresso ed uscita, ossia lo scambio di informazioni tra il programma
DettagliCodifica binaria. Rappresentazioni medianti basi diverse
Codifica binaria Rappresentazione di numeri Notazione di tipo posizionale (come la notazione decimale). Ogni numero è rappresentato da una sequenza di simboli Il valore del numero dipende non solo dalla
DettagliLaboratorio di Algoritmi e Strutture Dati
Laboratorio di Algoritmi e Strutture Dati Docente: Camillo Fiorentini 16 ottobre 2007 1 Rappresentazioni di caratteri in C In C un carattere è una costante intera il cui valore è dato dal codice ASCII
DettagliCorso di Informatica
CdLS in Odontoiatria e Protesi Dentarie Corso di Informatica Prof. Crescenzio Gallo crescenzio.gallo@unifg.it Immagini in movimento 2 Immagini in movimento Memorizzazione mediante sequenze di fotogrammi.
DettagliLa codifica dei numeri
La codifica dei numeri La rappresentazione dei numeri con il sistema decimale può essere utilizzata come spunto per definire un metodo di codifica dei numeri all interno degli elaboratori: la sequenza
DettagliFISICA. Elaborazione dei dati sperimentali. Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica
FISICA Elaborazione dei dati sperimentali Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica LA MISURA GLI STRUMENTI DI MISURA Gli strumenti di misura possono essere analogici o digitali.
DettagliRappresentazione e Codifica dell Informazione
Rappresentazione e Codifica dell Informazione Capitolo 1 Chianese, Moscato, Picariello, Alla scoperta dei fondamenti dell informatica un viaggio nel mondo dei BIT, Liguori editore. ***disclaimer *** Quest
DettagliDefinizione della variabile c 2 Distribuzione della variabile c 2
Definizione della variabile c Distribuzione della variabile c In queste definizioni ho N variabili indipendenti, nessun vincolo e quindi N coincide con i gradi di libertà In un sistema fisico dove il numero
DettagliLa codifica binaria. Fondamenti di Informatica. Daniele Loiacono
La codifica binaria Fondamenti di Informatica Introduzione q Il calcolatore usa internamente una codifica binaria (0 e 1) per rappresentare: i dati da elaborare (numeri, testi, immagini, suoni, ) le istruzioni
DettagliModello computazionale per la predizione di siti di legame per fattori di trascrizione
Modello computazionale per la predizione di siti di legame per fattori di trascrizione Attività di tirocinio svolto presso il Telethon Institute of Genetics and Medicine Relatori Prof. Giuseppe Trautteur
DettagliSistemi Operativi (M. Cesati)
Sistemi Operativi (M. Cesati) Compito scritto del 9 luglio 2012 Nome: Matricola: Corso di laurea: Cognome: Crediti da conseguire: 5 6 9 Scrivere i dati richiesti in stampatello. Al termine consegnare tutti
DettagliESPRESSIONI. Ivan Lanese
ESPRESSIONI Ivan Lanese Argomenti Espressioni Spaziatura e commenti Per domani Domani sarete divisi in 2 gruppi Il gruppo coi portatili qui in aula Controllate di essere in grado di avviare Eclipse sul
Dettagli