Corso di Elementi di Bionformatica

Размер: px
Начинать показ со страницы:

Download "Corso di Elementi di Bionformatica"

Транскрипт

1 Corso di Elementi di Bionformatica Laurea Triennale in Informatica Il formato FASTQ per la qualità delle sequenze Anno Accademico Docente del laboratorio: Raffaella Rizzi 1

2 La qualità delle sequenze L aspetto legato alla qualità delle sequenze è attualmente importantissimo: ü le nuove tecnologie di sequenziamento (Next- Generation Sequencing, NGS) producono reads (sequenze) corti per i quali la conoscenza della qualità risulta di fondamentale importanza ü i software tools che processano sequenze NGS devono tenere conto della qualiltà della sequenza Ad ogni base di un read viene dunque associato un indice di qualità.

3 La qualità delle sequenze L aspetto legato alla qualità delle sequenze è attualmente importantissimo: ü le nuove tecnologie di sequenziamento (Next- Generation Sequencing, NGS) producono reads (sequenze) corti per i quali la conoscenza della qualità risulta di fondamentale importanza ü i software tools che processano sequenze NGS devono tenere conto della qualiltà della sequenza Ad ogni base di un read viene dunque associato un indice Repository di qualità. di NGS data: Sequence Read Archive (SRA):

4 Il formato FASTQ FASTQ: ü è un formato di puro testo facilmente leggibile ü è pensato (da Wellcome Trust Sanger Institute) per associare ad una sequenza la qualità di ogni sua singola base ü è un formato standard per l output di strumenti di sequenziamento NGS ü ha estensione: *.fq oppure *.fastq

5 Il formato FASTQ FASTQ: ü è un formato di puro testo facilmente leggibile ü è pensato (da Wellcome Trust Sanger Institute) per associare ad una sequenza la qualità di ogni sua singola base ü è un formato FASTQ standard = FASTA per + qualità l output di strumenti di sequenziamento NGS ü ha estensione: *.fq oppure *.fastq

6 Sanger VS Next-Generation Sequencing (NGS) Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costoso (attorno al milione di dollari per sequenziare il genoma umano) ð Processa tanti reads in un run (milioni) (copertura da 10 a 100 volte superiore quella Sanger) ð Reads relativamente corti ð Qualità relativamente bassa

7 Sanger VS Next-Generation Sequencing (NGS) Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costoso (attorno al milione di dollari per sequenziare il genoma umano) ð Processa tanti reads in un run (milioni) (copertura da 10 a 100 volte superiore quella Sanger) ð Reads relativamente corti ð Qualità relativamente bassa

8 Sanger VS Next-Generation Sequencing (NGS) Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per FASTA Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costoso (attorno al milione di dollari per sequenziare il genoma umano) ð Processa tanti reads in un run (milioni) (copertura da 10 a 100 volte FASTQ superiore quella Sanger) ð Reads relativamente corti ð Qualità relativamente bassa

9 Base calling Un esperimento di sequenziamento produce in generale un cromatogramma da cui si deriva la sequenza delle base tramite il cosiddetto processo di base calling

10 Base calling Un esperimento di sequenziamento produce in generale un cromatogramma da cui si deriva la sequenza delle base tramite il cosiddetto processo di base calling

11 Base calling La lettura di un cromatogramma permette l associazione di un indice di qualità ad ogni base chiamata. Oltre alla sequenza di basi, si ottiene dunque anche la corrispondente sequenza di indici di qualità.

12 Base calling La lettura di un cromatogramma permette l associazione di un indice di qualità ad ogni base chiamata. Oltre alla sequenza di basi, si ottiene dunque anche la corrispondente sequenza di indici di qualità. L indice di qualità più usato attualmente è il Phred Quality Score

13 Phred Quality Score Phred Quality Score è stato sviluppato all interno del software Phred base-calling nei primi anni Novanta dal gruppo di Phil Green (Washington University). La qualità q, relativa ad una certa base b nella sequenza, è: q = -10 log 10 (p) dove p è la probabilità che la base b sia errata. (Il valore calcolato viene arrotondato all intero più vicino)

14 Phred Quality Score Esercizio 1. Calcolare il phred value q di una base che ha una probabilità dell 1% di essere errata (cioè una probabilità del 99% di essere corretta).

15 Phred Quality Score Esercizio 1. Calcolare il phred value q di una base che ha una probabilità dell 1% di essere errata (cioè una probabilità del 99% di essere corretta). q = - 10 log 10 (0.01) = 20

16 Phred Quality Score Esercizio 2. Calcolare il phred value q di una base che ha una probabilità del 100% di essere errata (cioè una probabilità dello 0% di essere corretta).

17 Phred Quality Score Esercizio 2. Calcolare il phred value q di una base che ha una probabilità del 100% di essere errata (cioè una probabilità dello 0% di essere corretta). q = - 10 log 10 (1.0) = 0

18 Phred Quality Score Esercizio 3. Calcolare il phred value q di una base che ha una probabilità dello 0% di essere errata (cioè una probabilità del 100% di essere corretta).

19 Phred Quality Score Esercizio 3. Calcolare il phred value q di una base che ha una probabilità dello 0% di essere errata (cioè una probabilità del 100% di essere corretta). q = - 10 log 10 (0.0) = +infinito

20 Phred Quality Score Esercizio 3. Calcolare il phred value q di una base che ha una probabilità dello 0% di essere errata (cioè una probabilità del 100% di essere corretta). q = - 10 log 10 (0.0) = +infinito Una base con q maggiore o uguale a 50 è considerata praticamente corretta.

21 Phred Quality Score Esercizio 3. Calcolare il phred value q di una base che ha una probabilità dello 0% di essere errata (cioè una probabilità del 100% di essere corretta). q = - 10 log 10 (0.0) = +infinito Una base con q maggiore o uguale a 30 (e inferiore a 50) è considerata buona.

22 Phred Quality Score Esercizio 4. Calcolare la probabilità di errore di una base con phred value pari a 50.

23 Phred Quality Score Esercizio 4. Calcolare la probabilità di errore di una base con phred value pari a 50. p = 10 ^(q/-10) = 10 ^ (-5) =

24 Phred Quality Score Esercizio 4. Calcolare la probabilità di errore di una base con phred value pari a 50. p = 10 ^(q/-10) = 10 ^ (-5) = Una base con phred value pari a 50, ha una probabilità dello 0.001% di essere sbagliata.

25 Phred Quality Score Esercizio 4. Calcolare la probabilità di errore di una base con phred value pari a 50. p = 10 ^(q/-10) = 10 ^ (-5) = Le basi che hanno una probabilità inferiore allo 0.001% di essere sbagliate sono considerate corrette

26 Phred Quality Score Esercizio 5. Calcolare il phred value q di una base che ha una probabilità del 75% di essere corretta.

27 Phred Quality Score Esercizio 5. Calcolare il phred value q di una base che ha una probabilità del 75% di essere corretta. q = - 10 log 10 (1-0.75) = 6

28 Phred Quality Score Esercizio 6. Data una base, avente phred value q pari a 10, calcolare la probabilità p c che la base sia stata chiamata correttamente.

29 Phred Quality Score Esercizio 6. Data una base, avente phred value q pari a 10, calcolare la probabilità p c che la base sia stata chiamata correttamente. p = 10 ^(q/-10) = 10 ^ (-1) = 0.1 p c = 1 - p = = 0.9

30 Formato FASTQ Il formato FASTQ è composto da quattro righe:

31 Formato FASTQ Il formato FASTQ è composto da quattro righe: 1. Header della sequenza contenente l identificatore del read simbolo

32 Formato FASTQ Il formato FASTQ è composto da quattro righe: 1. Header della sequenza contenente l identificatore del read simbolo 2. Sequenza delle basi del read

33 Formato FASTQ Il formato FASTQ è composto da quattro righe: 1. Header della sequenza contenente l identificatore del read simbolo 2. Sequenza delle basi del read 3. Header della sequenza dei phred values simbolo iniziale: +

34 Formato FASTQ Il formato FASTQ è composto da quattro righe: 1. Header della sequenza contenente l identificatore del read simbolo 2. Sequenza delle basi del read 3. Header della sequenza dei phred values simbolo iniziale: + 4. Sequenza dei phred values corrispondenti alle basi del read (codificata in caratteri stampabili)

35 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx

36 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Header della sequenza: dopo il c è l ID del read

37 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Sequenza delle basi del read

38 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Header della sequenza dei phred values: dopo il simbolo + c è l ID (opzionale) del read

39 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Header della sequenza dei phred values: dopo il simbolo + c è l ID (opzionale) del read

40 Formato FASTQ TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Sequenza dei phred values: il carattere i-esimo codifica Il phred value q della i-esima base del read

41 Conversione di q in carattere Ogni phred value q viene convertito in un carattere stampabile su file Ogni sequenziatore NGS ha una propria funzione f che specifica la conversione da phred value q a carattere c: c = f(q)

42 Conversione di q in carattere Una tipica conversione è la seguente: cioé: c = ASCII(min(q,93)+33) 1. se q è maggiore di 93, si pone q=93 2. si aggiunge a q il valore si converte in ASCII l intero ottenuto al punto 2

43 Conversione di q in carattere Una tipica conversione è la seguente: cioé: c = ASCII(min(q,93)+33) 1. se q è maggiore di 93, si pone q=93 2. si aggiunge a q il valore si converte Il codice in ASCII l intero è una tabella ottenuto che al punto fa 2 corrispondere a un intero in [0, 127] un carattere

44

45 Rappresentazione in base 10

46 Rappresentazione in base 16

47 Rappresentazione in base 8

48 Ad esempio, all intero 50 corrisponde il carattere 2

49 I caratteri stampabili corrispondono agli interi nell intervallo [32, 127]

50 Conversione di q in carattere Una tipica conversione è la seguente: c = ASCII(min(q,93)+33) Esercizio 7: trovare il carattere che corrisponde a un valore q = 32 secondo la conversione riportata sopra.

51 Conversione di q in carattere Una tipica conversione è la seguente: c = ASCII(min(q,93)+33) Esercizio 7: trovare il carattere che corrisponde a un valore q = 32 secondo la conversione riportata sopra. q=32 à A

52 Conversione di q in carattere Una tipica conversione è la seguente: c = ASCII(min(q,93)+33) Esercizio 8: trovare il valore di q che corrisponde al carattere a secondo la conversione riportata sopra.

53 Conversione di q in carattere Una tipica conversione è la seguente: c = ASCII(min(q,93)+33) Esercizio 8: trovare il valore di q che corrisponde al carattere a secondo la conversione riportata sopra. a à q=64 (probabilità di errore dello %)

54 Conversione di q in carattere Una tipica conversione: c = ASCII(min(q,93)+33) Esercizio 9: trovare la probabilità che la dodicesima base del read (riportato nell esempio precedente) sia corretta.

55 Conversione di q in carattere Una tipica conversione: c = ASCII(min(q,93)+33) Esercizio 9: trovare la probabilità p c che la dodicesima base del read (riportato nell esempio precedente) sia corretta. ] à 93 (dalla tabella ASCII) q = = 60 q = 60 à p = 0, p c = 1 p = 0,999999

56 Trimming dei reads La conoscenza della qualità dei reads consente di effettuare il trimming delle sequenze prima di qualsiasi processamento. Il trimming consiste in: 1. eliminare (eventualmente) un prefisso e/o un suffisso di bassa qualità (al di sotto di una prefissata soglia) 2. eliminare un read che risulti troppo corto dopo avere effettuato il trimming

57 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Si supponga di volere tenere solo le basi che hanno un phred value q maggiore o uguale a una soglia prefissata q*, ad esempio q*=58.

58 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Considero il carattere c* che corrisponde al valore q*=58: c* =

59 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Considero il carattere c* che corrisponde al valore q*=58: c* = [

60 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Una strategia è quella di trovare la più lunga parte della sequenza dei phred values che non contenga caratteri il cui valore intero (nella tabella ASCII) sia minore o uguale a quello del carattere [.

61 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Una strategia è quella di trovare la più lunga parte della sequenza dei phred values che non contenga caratteri il cui valore intero (nella tabella ASCII) sia minore o uguale a quello del carattere [.

62 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Una strategia è quella di trovare la più lunga parte della sequenza dei phred values che non contenga caratteri il cui valore intero (nella tabella ASCII) sia minore o uguale a quello del carattere [. Significa cioè trovare la più lunga parte del read la cui qualità non vada al di sotto della soglia q*=58.

63 Trimming dei TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] `aa`_u[_a`^\\utwz`x^qx Se tale parte è troppo corta, allora elimino il read

64 Esercizio Scrivere un programma che prenda in input un file in formato FASTQ, una soglia Q di qualità e un valore T compreso tra 0 e 1, e produca in output un file FASTQ contenente le sole sequenze in cui la percentuale di basi con qualità >= Q è pari ad almeno T.

65 TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] TCTGCCAACTTCTTATGGAGGCCTGTATTCACAGGT +HWUSI-EAS522:8:5:662:693#0/1 Aaaa`aa`aa`] TCTGCCAGAGGCCTGTATTCACAGGTACTTCTTATG +HWUSI-EAS522:8:5:662:694#0/1 aaaa`aa`aa`] TCGCCTGTATTCACAGGTTGCCAACTTCTTATGGAG +HWUSI-EAS522:8:5:662:695#0/1 AaaA`aa`aa`] `:A`_U;_A`^\\UTWZ`X^QX example.fq Con Q=58 e T=0.7 vengono tenuti solo Il primo e il terzo read

66 TATGGAGGCCCAACTTCTTGTATTCACAGGTTCTGC +HWUSI-EAS522:8:5:662:692#0/1 aaaa`aa`aa`] TCTGCCAACTTCTTATGGAGGCCTGTATTCACAGGT +HWUSI-EAS522:8:5:662:693#0/1 Aaaa`aa`aa`] TCTGCCAGAGGCCTGTATTCACAGGTACTTCTTATG +HWUSI-EAS522:8:5:662:694#0/1 aaaa`aa`aa`] TCGCCTGTATTCACAGGTTGCCAACTTCTTATGGAG +HWUSI-EAS522:8:5:662:695#0/1 AaaA`aa`aa`] `:A`_U;_A`^\\UTWZ`X^QX example.fq Con Q=58 e T=0.7 vengono tenuti solo Il primo e il terzo read

Laboratorio di Elementi di Bioinformatica

Laboratorio di Elementi di Bioinformatica Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E30Q6) AA 205/206 Esempio di workflow Docente del laboratorio: Raffaella Rizzi Scopo del workflow Scopo: dato un insieme

Подробнее

DNA sequencing. Reading Genomes. Giovanni Bacci

DNA sequencing. Reading Genomes. Giovanni Bacci Reading Genomes Giovanni Bacci Evoluzione del sequenziamento 1977 Frederick Sanger Prima tecnica di sequenziamento 1987 Applyed Biosystems Prima macchina automatica per il sequenziamento del DNA 1998 Phil

Подробнее

Laboratorio di Elementi di Bioinformatica

Laboratorio di Elementi di Bioinformatica Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2015/2016 Parsing di un file in formato EMBL (parte I) Docente del laboratorio: Raffaella Rizzi 1 Esercizio

Подробнее

Lezione 4. Il sequenziamento del DNA, Sanger

Lezione 4. Il sequenziamento del DNA, Sanger Lezione 4 Il sequenziamento del DNA, Sanger Schema della lezione Polymerase chain reaction (PCR) Dal prodotto di PCR al sequenziamento di Sanger Lettura dei prodotti di sequenziamento con sequenziatori

Подробнее

Lezione 8. DNA sequencing informatics

Lezione 8. DNA sequencing informatics Lezione 8 DNA sequencing informatics Il materiale di questa lezione è contenuto nel libro Next-generation DNA sequencing informatics Edited by Stuart M Brown Disponibile in biblioteca (CHIOSTRO 572.8633

Подробнее

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione dei numeri relativi

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione dei numeri relativi Codice BCD Prima di passare alla rappresentazione dei numeri relativi in binario vediamo un tipo di codifica che ha una certa rilevanza in alcune applicazioni: il codice BCD (Binary Coded Decimal). È un

Подробнее

Applicazioni biotecnologiche in systems biology

Applicazioni biotecnologiche in systems biology Applicazioni biotecnologiche in systems biology Lezione #2 Dr. Marco Galardini AA 2012/2013 Contatti Dr. Marco Galardini Dip. Di Biologia Via Madonna del Piano 6, Polo Scientifico S. Fiorentino (c/o Incubatore

Подробнее

Notazione posizionale. Codifica binaria. Rappresentazioni medianti basi diverse. Multipli del byte

Notazione posizionale. Codifica binaria. Rappresentazioni medianti basi diverse. Multipli del byte Codifica binaria Rappresentazione di numeri Notazione di tipo posizionale (come la notazione decimale). Ogni numero è rappresentato da una sequenza di simboli Il valore del numero dipende non solo dalla

Подробнее

L informazione numerica

L informazione numerica L informazione numerica Sorgenti di informazione Abbiamo esaminato delle sorgenti di informazione analogiche (audio, video). Abbiamo visto come trasmetterle a distanza per mezzo di sistemi analogici. Come

Подробнее

Tecniche di compressione senza perdita

Tecniche di compressione senza perdita FONDAMENTI DI INFORMATICA Prof. PIER LUCA MONTESSORO Facoltà di Ingegneria Università degli Studi di Udine Tecniche di compressione senza perdita 2000 Pier Luca Montessoro (si veda la nota di copyright

Подробнее

Dispensa di Informatica I.2

Dispensa di Informatica I.2 CENNI Una variabile il cui valore appartenga ad un insieme di simboli può indicare un numero di informazioni pari al numero di elementi di cui è composto l insieme. Ad esempio se a può assumere i valori

Подробнее

Codifica di Huffman e Lempel-Ziv-Welch A L B E R T O B E L U S S I A N N O A C C A D E M I C O /

Codifica di Huffman e Lempel-Ziv-Welch A L B E R T O B E L U S S I A N N O A C C A D E M I C O / Codifica di Huffman e Lempel-Ziv-Welch 1 A L B E R T O B E L U S S I A N N O A C C A D E M I C O 2 0 1 0 / 2 0 1 1 Tipi di compressione Senza perdita (lossless): permettono di ricostruire perfettamente

Подробнее

ALGORITMI: PROPRIETÀ FONDAMENTALI

ALGORITMI: PROPRIETÀ FONDAMENTALI ALGORITMI: PROPRIETÀ FONDAMENTALI Non si può risolvere un problema senza prima fissare un insieme di azioni, i di mosse elementari possibili per l'esecutore. Bisogna conoscerne le caratteristiche, le mosse

Подробнее

Codifica dell Informazione

Codifica dell Informazione Francesco Folino CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati e istruzioni in un formato tale che l esecutore automatico

Подробнее

Correttezza (prima parte)

Correttezza (prima parte) Fondamenti di informatica Oggetti e Java (prima parte) Capitolo 16 ottobre 2015 1 Contenuti Introduzione alla correttezza dei programmi specifica di un programma correttezza di un programma verifica di

Подробнее

Sistemi di Elaborazione delle Informazioni

Sistemi di Elaborazione delle Informazioni SCUOLA DI MEDICINA E CHIRURGIA Università degli Studi di Napoli Federico II Corso di Sistemi di Elaborazione delle Informazioni Dott. Francesco Rossi a.a. 2016/2017 1 I linguaggi di programmazione e gli

Подробнее

Politecnico di Bari Sede di Foggia. docente: Prof. Ing. Michele Salvemini

Politecnico di Bari Sede di Foggia. docente: Prof. Ing. Michele Salvemini Corso di Laurea in Ingegneria Civile Politecnico di Bari Sede di Foggia Fondamenti di Informatica Anno Accademico 2011/2012 docente: Prof. Ing. Michele Salvemini Sommario I Codici I Sistemi di numerazione

Подробнее

Analisi di dati di sequenziamento del trascrittoma (RNA-Seq):

Analisi di dati di sequenziamento del trascrittoma (RNA-Seq): Il vostro progetto Analisi di dati di sequenziamento del trascrittoma (RNA-Seq): 1. Analisi di qualità 2. Mappatura sul genoma 3. Calcolo dell espressione 4. Test di espressione differenziale 5. Visualizzazione

Подробнее

Dr. Tommaso Giordani SEQUENZIAMENTO SANGER E ASSEMBLAGGIO DEI GENOMI

Dr. Tommaso Giordani SEQUENZIAMENTO SANGER E ASSEMBLAGGIO DEI GENOMI Dr. Tommaso Giordani SEQUENZIAMENTO SANGER E ASSEMBLAGGIO DEI GENOMI Programma - Strategie di sequenziamento Sanger dei GENOMI COMPLETI sequenziamento gerarchico (clone by clone) sequenziamento shotgun

Подробнее

Elementi di informatica

Elementi di informatica Elementi di informatica problema della rappresentazione dei valori delle informazioni la rappresentazione deve essere effettuata attraverso un insieme finito di simboli disponibili il numero di simboli

Подробнее

Costanti e Variabili

Costanti e Variabili Parte 3 Costanti e Variabili Identificatori Un identificatore è un nome che viene associato a diverse entità (costanti, tipi, variabili, funzioni, ecc.) e serve ad identificare la particolare entità Gli

Подробнее

modificato da andynaz Cambiamenti di base Tecniche Informatiche di Base

modificato da andynaz Cambiamenti di base Tecniche Informatiche di Base Cambiamenti di base Tecniche Informatiche di Base TIB 1 Il sistema posizionale decimale L idea del sistema posizionale: ogni cifra ha un peso Esempio: 132 = 100 + 30 + 2 = 1 10 2 + 3 10 1 + 2 10 0 Un numero

Подробнее

La codifica dei caratteri di un testo

La codifica dei caratteri di un testo La codifica dei caratteri di un testo L obiettivo è quello di comunicare con il calcolatore usando il nostro linguaggio. Dobbiamo rappresentare le lettere dell alfabeto L insieme di simboli comunemente

Подробнее

1.2d: La codifica Digitale dei caratteri

1.2d: La codifica Digitale dei caratteri 1.2d: La codifica Digitale dei caratteri 2 12 ott 2011 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi 3 12 ott 2011 La codifica dei caratteri Un testo

Подробнее

Codifica dell Informazione

Codifica dell Informazione Introduzione all Informatica Fabrizio Angiulli Codifica dell Informazione CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati

Подробнее

Teoria dell informazione

Teoria dell informazione Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2008-09 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di

Подробнее

Analogico vs. Digitale. LEZIONE II La codifica binaria. Analogico vs digitale. Analogico. Digitale

Analogico vs. Digitale. LEZIONE II La codifica binaria. Analogico vs digitale. Analogico. Digitale Analogico vs. Digitale LEZIONE II La codifica binaria Analogico Segnale che può assumere infiniti valori con continuità Digitale Segnale che può assumere solo valori discreti Analogico vs digitale Il computer

Подробнее

Numeri Frazionari. Numeri Frazionari

Numeri Frazionari. Numeri Frazionari Numeri Frazionari Conversione da decimale a binario: si convertono separatamente parte intera e parte frazionaria per la parte intera si segue la procedura di conversione già vista; per la parte frazionaria

Подробнее

Numeri e caratteri in binario. Prof.ssa Antonella Serra

Numeri e caratteri in binario. Prof.ssa Antonella Serra Numeri e caratteri in binario SISTEMI DI NUMERAZIONE Viene definito sistema di numerazione o numerazione l'insieme delle regole e dei simboli per rappresentare i numeri. Assumono particolare caratteristica

Подробнее

Programmare in C. Maurizio Palesi Salvatore Serrano. Valori. Operazioni. Un insieme di valori del tipo. Per operare su tali valori Tipi

Programmare in C. Maurizio Palesi Salvatore Serrano. Valori. Operazioni. Un insieme di valori del tipo. Per operare su tali valori Tipi MASTER Information Technology Excellence Road (I.T.E.R.) Programmare in C Maurizio Palesi Salvatore Serrano Master ITER Informatica di Base Maurizio Palesi, Salvatore Serrano 1 Tipi di Dati Valori Un insieme

Подробнее

Bioinformatica e Biostatistica. Esercitazione di laboratorio: allineamento di reads ad un genoma di riferimento

Bioinformatica e Biostatistica. Esercitazione di laboratorio: allineamento di reads ad un genoma di riferimento Bioinformatica e Biostatistica Esercitazione di laboratorio: allineamento di reads ad un genoma di riferimento Specie Mammuth lanoso (Mammuthus primigenius), da 200 a 5 mila anni fa Aerale di distribuzione

Подробнее

Linguaggio C: introduzione

Linguaggio C: introduzione Dipartimento di Elettronica ed Informazione Politecnico di Milano Informatica e CAD (c.i.) - ICA Prof. Pierluigi Plebani A.A. 2008/2009 Linguaggio C: introduzione La presente dispensa e da utilizzarsi

Подробнее

Laboratorio di Architettura degli Elaboratori A.A. 2014/15 Programmazione Assembly

Laboratorio di Architettura degli Elaboratori A.A. 2014/15 Programmazione Assembly Laboratorio di Architettura degli Elaboratori A.A. 2014/15 Programmazione Assembly Scrivere il codice ARM che implementi le specifiche richieste e quindi verificarne il comportamento usando il simulatore

Подробнее

La codifica dei numeri

La codifica dei numeri La codifica dei numeri La rappresentazione dei numeri con il sistema decimale può essere utilizzata come spunto per definire un metodo di codifica dei numeri all interno degli elaboratori: la sequenza

Подробнее

La codifica binaria. Fondamenti di Informatica. Daniele Loiacono

La codifica binaria. Fondamenti di Informatica. Daniele Loiacono La codifica binaria Fondamenti di Informatica Come memorizzo l informazione nel calcolatore? 1 bit di informazione 1 bit di informazione La memoria del calcolatore Introduzione q Il calcolatore usa internamente

Подробнее

Funzioni, Stack e Visibilità delle Variabili in C

Funzioni, Stack e Visibilità delle Variabili in C Funzioni, Stack e Visibilità delle Variabili in C Programmazione I e Laboratorio Corso di Laurea in Informatica A.A. 2016/2017 Calendario delle lezioni Lez. 1 Lez. 2 Lez. 3 Lez. 4 Lez. 5 Lez. 6 Lez. 7

Подробнее

Codifica binaria. Rappresentazioni medianti basi diverse

Codifica binaria. Rappresentazioni medianti basi diverse Codifica binaria Rappresentazione di numeri Notazione di tipo posizionale (come la notazione decimale). Ogni numero è rappresentato da una sequenza di simboli Il valore del numero dipende non solo dalla

Подробнее

FISICA. Elaborazione dei dati sperimentali. Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica

FISICA. Elaborazione dei dati sperimentali. Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica FISICA Elaborazione dei dati sperimentali Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica LA MISURA GLI STRUMENTI DI MISURA Gli strumenti di misura possono essere analogici o digitali.

Подробнее

La codifica binaria. Fondamenti di Informatica. Daniele Loiacono

La codifica binaria. Fondamenti di Informatica. Daniele Loiacono La codifica binaria Fondamenti di Informatica Introduzione q Il calcolatore usa internamente una codifica binaria (0 e 1) per rappresentare: i dati da elaborare (numeri, testi, immagini, suoni, ) le istruzioni

Подробнее