Applicazioni biotecnologiche in systems biology

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Applicazioni biotecnologiche in systems biology"

Transcript

1 Applicazioni biotecnologiche in systems biology Lezione #3 Dr. Marco Galardini AA 2012/2013

2 Analisi dati sequenziamento massivo Lezione #3 Dr. Marco Galardini AA 2012/2013

3 NGS: Next Generation Sequencing MacLean et al., 2009

4 Sequenziamento del genoma Genoma: intera sequenza nucleotidica di un organismo Sequenziamento: determinazione di una sequenza nucleotidica Le tecniche di sequenziamento Generazione 0 Sequenziamento chimico Generazione 1 Dye-terminator Generazione 2 NGS con pre-amplificazione Generazione 3 NGS su singola molecola NGS: Next Generation Sequencing

5 Le tecniche di sequenziamento Generazione 0 Sequenziamento chimico Generazione 1 Dye-terminator Generazione 2 NGS con pre-amplificazione Generazione 3 NGS su singola molecola Generazione 4???

6 Tutte le tecniche di sequenziamento portano alla produzione di molte sequenze corte ( bp) Il genoma batterico più corto è circa 1Mb (500 volte la reads più lunga) Un gene batterico è lungo in media 300 bp Necessario unire insieme le varie reads per ottenere un genoma Trimming, Assembling, Scaffolding

7 Controllo qualità Il trimmaggio delle reads

8 Qualità e Probabilità BASES A C T G ERROR 1% 0.1% 0.01% 0.001% QUALITY Base scartata Qualità generalmente accettata

9 Identificativo sequenza (ID) Il formato FASTA Sequenza (DNA, RNA o proteina) Formato file per immagazzinare sequenze biologiche Uno dei formati più semplici (contiene solo la sequenza e il suo nome ) Un file può contenere più di una sequenza Quando si incontra il carattere > all inizio di una riga parte una nuova sequenza

10 Identificativo sequenza (ID) E la qualità? Sequenza (DNA, RNA o proteina) Non c è modo di conoscere il valore di qualità delle singole basi Formato non adatto ai dati di sequenziamento grezzi Il formato FASTA viene usato per sequenze finite, la cui qualità è stata controllata

11 Il formato TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC + bbbeeeeegggggiiiiiiiihighiiiiiiiigggeeedeedacccccccacacdddc

12 Il formato TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC + bbbeeeeegggggiiiiiiiihighiiiiiiiigggeeedeedacccccccacacdddc «@» Precede l id univoco della sequenza «+» Separa la sequenza nucleotidica dalla qualità Esempio di codifica della qualità: b = 98 e = 101 g = 103 i = 105 h = 104 c = 99 a = 97 d = 100

13 Codifica della TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC + bbbeeeeegggggiiiiiiiihighiiiiiiiigggeeedeedacccccccacacdddc «@» Precede l id univoco della sequenza «+» Separa la sequenza nucleotidica dalla qualità Esempio di codifica della qualità: b = 98 e = 101 g = 103 i = 105 h = 104 c = 99 a = 97 d = TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC

14 Codifica della TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC + bbbeeeeegggggiiiiiiiihighiiiiiiiigggeeedeedacccccccacacdddc «@» Precede l id univoco della sequenza «+» Separa la sequenza nucleotidica dalla qualità Esempio di codifica della qualità: b = 98 e = 101 g = 103 i = 105 h = 104 c = 99 a = 97 d = TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC

15 Codifica della TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC + bbbeeeeegggggiiiiiiiihighiiiiiiiigggeeedeedacccccccacacdddc «@» Precede l id univoco della sequenza «+» Separa la sequenza nucleotidica dalla qualità Esempio di codifica della qualità: b = 98 e = 101 g = 103 i = 105 h = 104 c = 99 a = 97 d = TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC

16 Codifica della TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC + bbbeeeeegggggiiiiiiiihighiiiiiiiigggeeedeedacccccccacacdddc «@» Precede l id univoco della sequenza «+» Separa la sequenza nucleotidica dalla qualità Esempio di codifica della qualità: b = 98 e = 101 g = 103 i = 105 h = 104 c = 99 a = 97 d = TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC

17 Codifica della TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC + bbbeeeeegggggiiiiiiiihighiiiiiiiigggeeedeedacccccccacacdddc «@» Precede l id univoco della sequenza «+» Separa la sequenza nucleotidica dalla qualità La qualità deve essere codificata con un unico carattere come la sequenza, In modo da evitare interpretazioni ambigue (e risparmiare TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC

18 Codifica della La qualità viene codificata usando i caratteri ASCII (lettere, numeri e simboli) Esiste una tabella per convertire ogni carattere ad un determinato valore di qualità Ogni produttore di macchinari di sequenziamento utilizza una propria tabella

19 Codifica della qualità Le varie ditte produttrici di macchine per il sequenziamento NGS, non hanno (ancora?) concordato uno standard comune di qualità Di fatto, ogni tipologia di reads deve essere trattata utilizzando parametri di conversione propri dello strumento che l ha generata SSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS......XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX......IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII......JJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJ... LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL...!"#$%&'()*+,-./ :;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijk

20 Controllo qualità Basi di scarsa qualità Analisi della qualità delle reads tramite il programma FastQC

21 Controllo qualità Basi di scarsa qualità

22 Trimming Eliminazione delle basi a bassa qualità Eliminazione totale delle reads troppo corte dopo la rimozione delle basi a bassa qualità

23 Esempio: Streaming-Trim algorithm A C T G A C C A G C T A G C T T G G A A C G T A G G C A G T T A A C C A Dr. Giovanni Bacci

24 Streaming-Trim algorithm A C T G A C C A G C T A G C T T G G A A C G T A G G C A G T T A A C C A Q A - Cutoff > 0? NO La base viene rimossa e si ripete il test con la base precedente

25 Streaming-Trim algorithm A C T G A C C A G C T A G C T T G G A A C G T A G G C A G T T A A C C Q C - Cutoff > 0? SI NO La base viene mantenuta e la finestra allargata La base viene rimossa e si ripete il test con la base precedente

26 Streaming-Trim algorithm A C T G A C C A G C T A G C T T G G A A C G T A G G C A G T T A A C C (Q C Cutoff) + (Q C Cutoff) > 0? SI NO La base viene mantenuta e la finestra allargata Le basi vengono rimosse e si ripete il test con la base precedente

27 Streaming-Trim algorithm A C T G A C C A G C T A G C T T G G A A C G T A G G C A G T T A A C C (Q C Cutoff) + (Q C Cutoff) > 0? SI NO La base viene mantenuta e la finestra allargata Le basi vengono rimosse e si ripete il test con la base precedente

28 Streaming-Trim algorithm A C T G A C C A G C T A G C T T G G A A C G T A G G C A G T T A A (Q A - Cutoff) > 0? SI NO La base viene mantenuta e la finestra allargata La base viene rimossa e si ripete il test con la base precedente

29 Streaming-Trim algorithm A C T G A C C A G C T A G C T T G G A A C G T A G G C A G T T A A min max Σ min n=max(q n - Cutoff) > 0? SI NO La base viene mantenuta e la finestra allargata Le basi vengono rimosse e si ripete il test con la base precedente

30 Streaming-Trim algorithm Eliminazione delle basi a bassa qualità Eliminazione totale delle reads troppo corte dopo la rimozione delle basi a bassa qualità

31 Assemblaggio

32 Assemblaggio Assemblaggio: processo con il quale le singole reads vengono allineate e unite fra loro a formare una sequenza di lunghezza maggiore Nel migliore dei casi si ottiene la sequenza completa (senza gap) del genoma di interesse Nella maggior parte dei casi si ottengono una serie di sequenze di varia lunghezza chiamate contigs

33 Profondità del sequenziamento Read singola Genoma completo Il campione genomico viene frammentato (casualmente) ed amplificato Dato l alto numero di frammenti letti dal sequenziamento, statisticamente ogni parte del genoma viene letta più volte La profondità (o coverage) indica quante volte in media ogni base è stata letta durante il sequenziamento

34 1X 2X 3X 4X La profondità minima accettata è circa 30X (ogni base è stata letta almeno 30 volte) Le tecnologie NGS producono una quantità maggiore di reads: profondità > 100X

35 Assemblaggio L assemblaggio delle reads prevede la codifica delle reads (e delle relazioni reciproche) in un grafo (o network)

36 Assemblaggio Introduzione ai network

37 Introduzione ai grafi E possibile visitare tutti i quartieri attraversando i ponti esattamente una volta e tornando al punto di partenza? Concetto introdotto da Eulero nel 1735 Ogni quartiere è rappresentato da un nodo (o vertice), mentre ogni ponte è rappresentato da un arco

38 Introduzione ai grafi C A D Nodi: A, B, C, D Archi: (A,C) (A,C) (A,B) (A,B) (A,D) (C,D) (B,D) B

39 Introduzione ai grafi Grafo indiretto: Gli archi non hanno direzione Possono essere percorsi in entrambi i versi Grafo diretto (digrafo): Gli archi possiedono una direzione Archi orientati Un grafo indiretto può essere trasformato in un grafo diretto: ogni arco viene trasformato in due archi con direzioni opposte e medesimi vertici

40 Introduzione ai grafi Quartiere 1 Quartiere 4 100m 70m 60m 50m 50m Quartiere 3 100m 70m Quartiere 2 I nodi e gli archi possono possedere degli attributi, che ne definiscono delle proprietà Esempio: Nodi (nomi dei quartieri della città) Archi (lunghezza dei ponti)

41 Introduzione ai grafi Grado: 3 Grado: 5 Grado: 3 Grado: 3 Grado: Numero di archi incidenti su un vertice Indica il grado di connessione di un singolo vertice o dell intero grafo Grafo k-regolare: tutti i vertici hanno medesimo grado Nei network biologici il grado ha implicazioni importanti

42 Esempio: social network I vertici rappresentano le persone (attributi: nome, sesso, età) Gli archi rappresentano relazioni (ad es. amicizia) (attributi: numero di interazioni) Vertici ad alto grado rappresentano persone con molte amicizie

43 Introduzione ai grafi V3 V4 V0 V2 Vn V1 V5 Percorso: Serie di vertici V0 Vn e di archi (V0, V1) (Vn-1, Vn) Un cammino prevede che i due vertici agli estremi del percorso siano diversi

44 Introduzione ai grafi V2 V1 V3 V0 Vn V4 Ciclo: Percorso i cui vertici agli estremi coincidono

45 Introduzione ai grafi V2 V1 V3 V0 Vn V4 E possibile visitare tutti i quartieri attraversando i ponti esattamente una volta e tornando al punto di partenza? Ciclo: Percorso i cui vertici agli estremi coincidono

46 Assemblaggio Metodo Sanger e grafo de Bruijn

47 Assemblaggio Genome length: 10bp // Reads length: 7bp L assemblaggio delle reads prevede la codifica delle reads (e delle relazioni reciproche) in un grafo (o network) Per chiudere il genoma è necessario individuare un ciclo all interno del grafo

48 Assemblaggio Metodo Sanger Le reads vengono divise in frammenti più piccoli lunghi k (k-mers) I vertici rappresentano i k-mers Gli archi rappresentano gli allineamenti fra i k- mers L assemblaggio avviene cercando all interno del grafo un ciclo hamiltoniano Un ciclo in cui ogni vertice viene visitato al massimo una volta

49 Assemblaggio Metodo Sanger

50 Assemblaggio Metodo Sanger Metodo usato nei sequenziamenti Sanger Metodo computazionalmente costoso Tutti gli allineamenti fra i k-mers devono essere calcolati per costruire il grafo 10 6 reads = allineamenti 10 9 reads = allineamenti La ricerca del ciclo hamiltoniano è un algoritmo che richiede molto tempo Impossibile usare questo approccio per l NGS

51 Assemblaggio Metodo de Bruijn Le reads vengono divise in frammenti più piccoli lunghi k (k-mers) Gli archi rappresentano i k-mers I vertici rappresentano i prefissi e suffissi dei k-mers lunghi k-1 L assemblaggio avviene cercando all interno del grafo un ciclo euleriano Un ciclo in cui ogni arco viene visitato al massimo una volta

52 Assemblaggio Metodo de Bruijn

53 Assemblaggio Metodo de Bruijn Metodo meno costoso Il tempo di calcolo è circa proporzionale al numero di reads Non è necessario allineare fra loro i k- mers Tutti i moderni programmi di assemblaggio (assemblatori) sfruttano questo grafo Abyss, velvet, ray, SOAPdenovo,

54 Assemblaggio - Problemi Errori nel sequenziamento portano alla formazione di bolle nel grafo Difficile determinare quale ramo della bolla rappresenta l assemblaggio corretto

55 Assemblaggio - Problemi Sequenze duplicate portano a leggere più volte lo stesso k-mer Necessario aggiungere tanti archi quante sono le ripetizioni Stimare il numero di duplicazioni è difficile Le sequenze ripetute sono molto comuni nei genomi (es. trasposasi nei batteri)

56 Assemblaggio - Problemi Cromosomi multipli e cromosomi lineari Il genoma di interesse può contenere cromosomi multipli Bisogna trovare un ciclo euleriano per ogni cromosoma Difficile conoscere in anticipo il numero di cromosomi (o plasmidi) presenti in un genoma Scelta del miglior numero k I vari problemi di assemblaggio fanno sì che si ottengano contig (o contigui) K più grandi significano un minor numero di bolle e quindi contig più lunghi Maggior costo computazionale Inclusione di errori nella sequenza

57 Reads Contigs Genome Assemblaggio

58 Assemblaggio Controllo qualità

59 Assemblaggio Controllo qualità Parametri di controllo di un assemblaggio Numero di contig (basso è meglio) Lunghezza media dei contig (alta è meglio) Valore N50: lunghezza del contig oltre il quale se si usano contig di lunghezza maggiore si stanno considerando il 50% delle basi dell assemblaggio (alto è meglio) N80, N90, N70, ecc ecc Se il genoma chiuso è disponibile (o comunque un genoma molto vicino): Numero di misassemblies: Porzioni di contig invertiti o traslocati

60 Assemblaggio Controllo qualità

61 Assemblaggio Dal FASTQ al FASTA

62 Conservazione dati NGS Sanger sequencing Bassa quantità di dati prodotti Ridotto spazio per la conservazione sia delle reads che dei contig/genomi Genoma batterico in formato FASTA: 1Mb ogni milione di basi Un genoma di E.coli = 4/5 Mb Un genoma batterico in formato FASTQ: La dimensione dipende dal numero di reads Il formato FASTQ contiene almeno il doppio di informazioni rispetto al FASTA Per ogni base ho il valore della qualità

63 Conservazione dati TTACCGCGGCTGCTGGCACGGAGTTAGCCGGGGCTTCTTCTCCGGCTACCGTCATTATC + bbbeeeeegggggiiiiiiiihighiiiiiiiigggeeedeedacccccccacacdddc Esempio di sequenziamento NGS: Dimensione genoma (FASTA): 7Mb Reads in formato FASTQ: 2.4 GB

64 Scaffolding Dai contig ai supercontig

65 Scaffolding Reads Contigs Genome Se il genoma chiuso è disponibile (o comunque un genoma molto vicino): Possiamo stimare la posizione relativa dei contig ottenuti tramite un allineamento contro il genoma chiuso più vicino L avvento delle tecniche NGS ha fatto sì che ad oggi siano disponibili 2303 genomi batterici completi E molto probabile che per ogni nuovo sequenziamento sia disponibile un genome di riferimento vicino

66 Example: the CONTIGuator algorithm Allineamento al genoma di riferimento: BLAST Applicazione di una serie di cut-offs: Lunghezza minima di allineamento Contig coverage (%): per essere considerato mappato il contig deve avere una percentuale minima della sua lunghezza presente nell allineamento I contig mappati in più punti (trasposasi, IS) sono scartati

67 Example: the CONTIGuator algorithm Reference Contig // Scaffold Estrazione dell ordinamento relativo dei contigs: generazione di uno scaffold I buchi nello scaffold possono essere riempiti progettando delle reazioni di PCR fra i contig

68 Example: the CONTIGuator algorithm

69 Annotation From sequences to genes

70

71 Where are the genes?

72 Annotation or Gene calling

73

74 (Common) start codons: ATG, GTG, TTG Assuming that all the codons are equiprobable 5% of the codons are stop codons (3/64) ~ every 60bp we should encounter a stop codon BUT The average bacterial gene size is ~ 300bp Naive annotation method: Find all the DNA region starting with a start codon and long more than 60bp Open Reading Frames (ORFs)

75 Forward Reverse Problems: Each one of the 6 frames has to be considered Which frame should be considered in case of multiple ORFs?

76 Problems: Many start codons can be found inside an ORF Which one is the right one?

77 Other proof of the presence of an ORF: A ribosomal binding site (RBS) In case of an operon it may not be present Problems: Microbial genomes are dense Small intergenic regions ORFs can overlap each other

78 We assumed that all the codons are equiprobable BUT In bacterial genomes we have: different codon usages variable GC content * different intergenic distances ** Each genome has a particular codon frequency * High GC means lower stop codon frequency ** related to the species lifestyle

79 Eukaryotes are even more complicated: Lower gene frequency (more junk DNA) Presence of exons and introns

80 Annotation methods: Experimental: Through proteomics and transcriptomics Expensive and time-consuming Some genes may not be expressed in vitro Extrinsic: Similarity-based methods BLAST is often used Alignments using transcriptomics data and similar genomes Intrinsic: Ab initio methods: based only on the sequence Mostly statistical methods, based on ORF length, RBS, intergenic distances Dynamic programming, HMM Methods validated with manually curated gene predictions

81 Ab-initio methods: Dynamic programming Computational approach Used to solve complex problems The overall problem is divided in smaller (and simpler) pieces The results of the smaller pieces are stored for quick lookup Used also in alignments

82 Ab-initio methods: Dynamic programming In gene annotation: Used to find the best gene models The overall problem is to find all the genes The smaller problem is the prediction of single genes Each gene model is related to its neighborhoods with a score The sequence of genes with the best score is the most probable

83 Ab-initio methods: Hidden Markov Models Statistical approach A series of states with transitions having different probabilities Used to model sequences of connected objects/events In gene annotation: General features of annotated genomes can be used to build an HMM to be used in the annotation Features like ORFs length, stat codon preference, intergenic distance, Species specific HMMs

84 Ab-initio methods Glimmer (HMM, used at TIGR) Prodigal (Prokaryotic Dynamic Programming Genefinding Algorithm) GeneMarkHMM (HMM, used for Haemophilus influenzae) EasyGene (HMM, with species specific HMMs) Med (Sequence entropy estimations) Most of the gene predictions are similar despite of the approach The biggest differences are on the start codon position Errors in gene annotation can be propagated to other new genomes Combination of various methods can be used for manual curation

85 Prodigal: dynamic programming score

86 Prodigal: other parameters Many corrections have to be made to maximize the predictions

DNA sequencing. Reading Genomes. Giovanni Bacci

DNA sequencing. Reading Genomes. Giovanni Bacci Reading Genomes Giovanni Bacci Evoluzione del sequenziamento 1977 Frederick Sanger Prima tecnica di sequenziamento 1987 Applyed Biosystems Prima macchina automatica per il sequenziamento del DNA 1998 Phil

Dettagli

Avanzamento dei sistemi di sequenziamento

Avanzamento dei sistemi di sequenziamento Avanzamento dei sistemi di sequenziamento Sistemi di sequenziamento capillare basati su: Lunghezza delle read: 800 basi Poche sequenze prodotte in una singola corsa Second Generation Sequencing (SGS):

Dettagli

Applicazioni biotecnologiche in systems biology

Applicazioni biotecnologiche in systems biology Applicazioni biotecnologiche in systems biology Lezione #6 Dr. Marco Galardini AA 2012/2013 Gene regulation analysis Lezione #6 Dr. Marco Galardini AA 2012/2013 Regolazione genica Elementi molecolari e

Dettagli

A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.

A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini. Algoritmi di routing dinamici (pag.89) UdA2_L5 Nelle moderne reti si usano algoritmi dinamici, che si adattano automaticamente ai cambiamenti della rete. Questi algoritmi non sono eseguiti solo all'avvio

Dettagli

PROVA FINALE V. AULETTA G. PERSIANO ALGORITMI II - -MAGIS INFO

PROVA FINALE V. AULETTA G. PERSIANO ALGORITMI II - -MAGIS INFO PROVA FINALE V. AULETTA G. PERSIANO ALGORITMI II - -MAGIS INFO 1. Load Balancing Un istanza del problema del load balancing consiste di una sequenza p 1,..., p n di interi positivi (pesi dei job) e un

Dettagli

Alcuni aspetti legati al calcolo bioinformatico su CRESCO. Giuseppe Aprea UTMEA-CAL

Alcuni aspetti legati al calcolo bioinformatico su CRESCO. Giuseppe Aprea UTMEA-CAL Alcuni aspetti legati al calcolo bioinformatico su CRESCO Giuseppe Aprea UTMEA-CAL Principali attività bioinformatiche ENEA legate al calcolo Assemblaggio de Novo* Trascrittomica Analisi filogenetica Metagenomica*

Dettagli

Strutturazione logica dei dati: i file

Strutturazione logica dei dati: i file Strutturazione logica dei dati: i file Informazioni più complesse possono essere composte a partire da informazioni elementari Esempio di una banca: supponiamo di voler mantenere all'interno di un computer

Dettagli

Decode NGS data: search for genetic features

Decode NGS data: search for genetic features Decode NGS data: search for genetic features Valeria Michelacci NGS course, June 2015 Blast searches What we are used to: online querying NCBI database for the presence of a sequence of interest ONE SEQUENCE

Dettagli

PROGRAMMA SVOLTO NELLA SESSIONE N.

PROGRAMMA SVOLTO NELLA SESSIONE N. Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE

Dettagli

Uso di base delle funzioni in Microsoft Excel

Uso di base delle funzioni in Microsoft Excel Uso di base delle funzioni in Microsoft Excel Le funzioni Una funzione è un operatore che applicato a uno o più argomenti (valori, siano essi numeri con virgola, numeri interi, stringhe di caratteri) restituisce

Dettagli

Algoritmi e strutture dati. Codici di Huffman

Algoritmi e strutture dati. Codici di Huffman Algoritmi e strutture dati Codici di Huffman Memorizzazione dei dati Quando un file viene memorizzato, esso va memorizzato in qualche formato binario Modo più semplice: memorizzare il codice ASCII per

Dettagli

Sequenziamento e analisi di genomi completi

Sequenziamento e analisi di genomi completi Sequenziamento e analisi di genomi completi Genoma L'insieme del materiale genetico di un organismo o cellula. (Hans Winkler, 1920) Un genoma è sequenziato quando viene stabilita interamente la successione

Dettagli

Esercitazioni di Genomica

Esercitazioni di Genomica Bioinformatica ai tempi del NGS, PhD CRIBI Biotechnology Center, University of Padua BMR Genomics srl, Spin-Off Giovanni Birolo, PhD CRIBI Biotechnology Center, University of Padua Perché bioinformatica?

Dettagli

SEQUENZIAMENTO DEL DNA

SEQUENZIAMENTO DEL DNA SEQUENZIAMENTO DEL DNA Il metodo di Sanger per determinare la sequenza del DNA Il metodo manuale La reazione enzimatica Elettroforesi in gel denaturante di poliacrilammide Autoradiografia Il metodo automatico

Dettagli

Funzioni in C. Violetta Lonati

Funzioni in C. Violetta Lonati Università degli studi di Milano Dipartimento di Scienze dell Informazione Laboratorio di algoritmi e strutture dati Corso di laurea in Informatica Funzioni - in breve: Funzioni Definizione di funzioni

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

Bioinformatica (modulo bioinf. dei genomi moderni )

Bioinformatica (modulo bioinf. dei genomi moderni ) Bioinformatica (modulo bioinf. dei genomi moderni ) Dr. Marco Fondi Lezione # 5 Corso di Laurea in Scienze Biologiche, AA 2011-2012 giovedì 3 novembre 2011 1 Sequenziamento ed analisi di genomi: la genomica

Dettagli

La reazione a catena della polimerasi (PCR) di Ofelia Leone e Vincenzo Mandarino

La reazione a catena della polimerasi (PCR) di Ofelia Leone e Vincenzo Mandarino La reazione a catena della polimerasi (PCR) di Ofelia Leone e Vincenzo Mandarino La Polymerase Chain Reaction (PCR) o reazione di amplificazione a catena è una tecnica che permette di amplificare una specifica

Dettagli

Organizzazione della memoria

Organizzazione della memoria Memorizzazione dati La fase di codifica permette di esprimere qualsiasi informazione (numeri, testo, immagini, ecc) come stringhe di bit: Es: di immagine 00001001100110010010001100110010011001010010100010

Dettagli

MATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010

MATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010 elementi di teoria dei grafi anno acc. 2009/2010 Grafi semplici Un grafo semplice G è una coppia ordinata (V(G), L(G)), ove V(G) è un insieme finito e non vuoto di elementi detti vertici o nodi di G, mentre

Dettagli

Il genoma dinamico: gli elementi trasponibili

Il genoma dinamico: gli elementi trasponibili Il genoma dinamico: gli elementi trasponibili Anni trenta: studi sul mais ribaltano la visione classica secondo cui i geni si trovano solo in loci fissi sul cromosoma principale Esistono elementi genetici

Dettagli

OSSERVAZIONI TEORICHE Lezione n. 4

OSSERVAZIONI TEORICHE Lezione n. 4 OSSERVAZIONI TEORICHE Lezione n. 4 Finalità: Sistematizzare concetti e definizioni. Verificare l apprendimento. Metodo: Lettura delle OSSERVAZIONI e risoluzione della scheda di verifica delle conoscenze

Dettagli

ARCHITETTURA DI RETE FOLEGNANI ANDREA

ARCHITETTURA DI RETE FOLEGNANI ANDREA ARCHITETTURA DI RETE FOLEGNANI ANDREA INTRODUZIONE È denominata Architettura di rete un insieme di livelli e protocolli. Le reti sono organizzate gerarchicamente in livelli, ciascuno dei quali interagisce

Dettagli

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine Prof.ssa Gamba Sabrina Lezione 7: IL DNA Duplicazione e sintesi delle proteine concetti chiave della lezione Costituzione fisico-chimica del DNA Basi azotate Duplicazione Concetto di geni Rna Trascrizione

Dettagli

Il linguaggio SQL. è di fatto lo standard tra i linguaggi per la gestione di data base relazionali.

Il linguaggio SQL. è di fatto lo standard tra i linguaggi per la gestione di data base relazionali. (Structured Query Language) : Il linguaggio è di fatto lo standard tra i linguaggi per la gestione di data base relazionali. prima versione IBM alla fine degli anni '70 per un prototipo di ricerca (System

Dettagli

Come modificare la propria Home Page e gli elementi correlati

Come modificare la propria Home Page e gli elementi correlati Come modificare la propria Home Page e gli elementi correlati Versione del documento: 3.0 Ultimo aggiornamento: 2006-09-15 Riferimento: webmaster (webmaster.economia@unimi.it) La modifica delle informazioni

Dettagli

Metodi Computazionali

Metodi Computazionali Metodi Computazionali Elisabetta Fersini fersini@disco.unimib.it A.A. 2009/2010 Catene di Markov Applicazioni: Fisica dinamica dei sistemi Web simulazione del comportamento utente Biologia evoluzione delle

Dettagli

Capitolo 13. Interrogare una base di dati

Capitolo 13. Interrogare una base di dati Capitolo 13 Interrogare una base di dati Il database fisico La ridondanza è una cosa molto, molto, molto brutta Non si devono mai replicare informazioni scrivendole in più posti diversi nel database Per

Dettagli

Sistemi Operativi. Interfaccia del File System FILE SYSTEM : INTERFACCIA. Concetto di File. Metodi di Accesso. Struttura delle Directory

Sistemi Operativi. Interfaccia del File System FILE SYSTEM : INTERFACCIA. Concetto di File. Metodi di Accesso. Struttura delle Directory FILE SYSTEM : INTERFACCIA 8.1 Interfaccia del File System Concetto di File Metodi di Accesso Struttura delle Directory Montaggio del File System Condivisione di File Protezione 8.2 Concetto di File File

Dettagli

Informatica 3. LEZIONE 21: Ricerca su liste e tecniche di hashing. Modulo 1: Algoritmi sequenziali e basati su liste Modulo 2: Hashing

Informatica 3. LEZIONE 21: Ricerca su liste e tecniche di hashing. Modulo 1: Algoritmi sequenziali e basati su liste Modulo 2: Hashing Informatica 3 LEZIONE 21: Ricerca su liste e tecniche di hashing Modulo 1: Algoritmi sequenziali e basati su liste Modulo 2: Hashing Informatica 3 Lezione 21 - Modulo 1 Algoritmi sequenziali e basati su

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Dispositivi di rete. Ripetitori. Hub

Dispositivi di rete. Ripetitori. Hub Ripetitori Dispositivi di rete I ripetitori aumentano la distanza che può essere ragginta dai dispositivi Ethernet per trasmettere dati l'uno rispetto all'altro. Le distanze coperte dai cavi sono limitate

Dettagli

De-constructing and Reconstructing. Life. (smontare e costruire oggetti biologici)

De-constructing and Reconstructing. Life. (smontare e costruire oggetti biologici) De-constructing and Reconstructing Life (smontare e costruire oggetti biologici) ogni oggetto biologico rappresenta un particolare stato di aggregazione e di organizzazione della materia, corrispondente

Dettagli

Attività 9. La città fangosa Minimal Spanning Trees

Attività 9. La città fangosa Minimal Spanning Trees Attività 9 La città fangosa Minimal Spanning Trees Sommario la nostra società ha molti collegamenti in rete: la rete telefonica, la rete energetica, la rete stradale. Per una rete in particolare, ci sono

Dettagli

Informazione analogica e digitale

Informazione analogica e digitale L informazione L informazione si può: rappresentare elaborare gestire trasmettere reperire L informatica offre la possibilità di effettuare queste operazioni in modo automatico. Informazione analogica

Dettagli

Banche Dati Secondarie. geni trascritti proteine profili strutture

Banche Dati Secondarie. geni trascritti proteine profili strutture Banche Dati Secondarie geni trascritti proteine profili strutture definizione Banca dati il cui contenuto deriva da una banca dati primaria DB sec DB primario informazione PROSITE SWISS Prot patterns Profiles

Dettagli

Macchine sequenziali

Macchine sequenziali Corso di Calcolatori Elettronici I A.A. 2010-2011 Macchine sequenziali Lezione 14 Università degli Studi di Napoli Federico II Facoltà di Ingegneria Automa a Stati Finiti (ASF) E una prima astrazione di

Dettagli

Facoltà di Scienze e Tecnologie

Facoltà di Scienze e Tecnologie Corso di Laurea in Informatica Applicata Estratto da: Tesi di laurea di: Matteo Parlani Anno Accademico 2006-2007 Indice 1. Introduzione 2. Cepstrum Analysis 3. Caso di studio 4. Esperimenti 5. Risultati

Dettagli

Appunti sulla Macchina di Turing. Macchina di Turing

Appunti sulla Macchina di Turing. Macchina di Turing Macchina di Turing Una macchina di Turing è costituita dai seguenti elementi (vedi fig. 1): a) una unità di memoria, detta memoria esterna, consistente in un nastro illimitato in entrambi i sensi e suddiviso

Dettagli

Come ordinare Geni sintetici Online

Come ordinare Geni sintetici Online Come ordinare Geni sintetici Online I geni sintetici di Eurofins MWG Operon possono essere ordinati online grazie all esclusivo software GENEius. Di seguito una guida dettagliata per effettuare la richiesta

Dettagli

Reti di Telecomunicazione Lezione 8

Reti di Telecomunicazione Lezione 8 Reti di Telecomunicazione Lezione 8 Marco Benini Corso di Laurea in Informatica marco.benini@uninsubria.it Livello di trasporto Programma della lezione relazione tra lo strato di trasporto e lo strato

Dettagli

15. Antico gioco russo

15. Antico gioco russo 15. Antico gioco russo In un antico gioco russo, attraverso i risultati casuali ottenuti dall allacciamento di cordicelle, i giovani cercavano una previsione sul tipo di legame che si sarebbe instaurata

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

Manuale di Aggiornamento BOLLETTINO. Rel. 5.20.1H4. DATALOG Soluzioni Integrate a 32 Bit

Manuale di Aggiornamento BOLLETTINO. Rel. 5.20.1H4. DATALOG Soluzioni Integrate a 32 Bit Manuale di Aggiornamento BOLLETTINO Rel. 5.20.1H4 DATALOG Soluzioni Integrate a 32 Bit - 2 - Manuale di Aggiornamento Sommario 1 2 PER APPLICARE L AGGIORNAMENTO... 3 1.1 Aggiornamento Patch Storica...

Dettagli

Luigi Piroddi piroddi@elet.polimi.it

Luigi Piroddi piroddi@elet.polimi.it Automazione industriale dispense del corso 10. Reti di Petri: analisi strutturale Luigi Piroddi piroddi@elet.polimi.it Analisi strutturale Un alternativa all analisi esaustiva basata sul grafo di raggiungibilità,

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Fogli Elettronici: MS Excel

Fogli Elettronici: MS Excel Fogli Elettronici: MS Excel Informatica - A.A. 2010/2011 - Excel 7.0 Foglio Elettronico Un foglio elettronico (o spreadsheet) è un software applicativo nato dall esigenza di: organizzare insiemi di dati

Dettagli

Polimorfismi LEZIONE 6. By NA 1

Polimorfismi LEZIONE 6. By NA 1 Polimorfismi LEZIONE 6 By NA 1 * Polimorfismo Variazione presente nella popolazione con una frequenza superiore a 1% Variazioni nell aspetto By NA 2 Polimorfismo proteico Variazione presente nella popolazione

Dettagli

Gerarchia delle memorie

Gerarchia delle memorie Memorie Gerarchia delle memorie Cache CPU Centrale Massa Distanza Capacità Tempi di accesso Costo 2 1 Le memorie centrali Nella macchina di Von Neumann, le istruzioni e i dati sono contenute in una memoria

Dettagli

Sistemi Operativi. 5 Gestione della memoria

Sistemi Operativi. 5 Gestione della memoria Gestione della memoria Compiti del gestore della memoria: Tenere traccia di quali parti della memoria sono libere e quali occupate. Allocare memoria ai processi che ne hanno bisogno. Deallocare la memoria

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Bioinformatica: DNA e Algoritmi

Bioinformatica: DNA e Algoritmi Bioinformatica: DNA e Algoritmi Alberto Policriti Dpt. of Mathematics and Informatics, University of Udine. Applied Genomics Institute Di cosa parleremo In generale Deniamo i termini: DNA & Algoritmi Tecnologie

Dettagli

Dispensa di database Access

Dispensa di database Access Dispensa di database Access Indice: Database come tabelle; fogli di lavoro e tabelle...2 Database con più tabelle; relazioni tra tabelle...2 Motore di database, complessità di un database; concetto di

Dettagli

Sistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate

Sistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate MODULO BASE Quanto segue deve essere rispettato se si vuole che le immagini presentate nei vari moduli corrispondano, con buona probabilità, a quanto apparirà nello schermo del proprio computer nel momento

Dettagli

Genomica Servizio Sequenziamento DNA

Genomica Servizio Sequenziamento DNA Genomica Servizio Sequenziamento DNA Listino prezzi 1 maggio 2005 Value Read Codice Descrizione Prezzo / Lettura 1001-000000 Tubi 13,50 1001-000010 Tubi con etichetta codice a barre 12,00 1094-000050 Etichette

Dettagli

Reti sequenziali sincrone

Reti sequenziali sincrone Reti sequenziali sincrone Un approccio strutturato (7.1-7.3, 7.5-7.6) Modelli di reti sincrone Analisi di reti sincrone Descrizioni e sintesi di reti sequenziali sincrone Sintesi con flip-flop D, DE, T

Dettagli

Il foglio elettronico: Excel

Il foglio elettronico: Excel Il foglio elettronico: Excel Laboratorio di Informatica Corso di Laurea triennale in Biologia Dott. Fabio Aiolli (aiolli@math.unipd.it) Dott.ssa Elisa Caniato (ecaniato@gmail.com) Anno accademico 2007-2008

Dettagli

Piano di gestione della qualità

Piano di gestione della qualità Piano di gestione della qualità Pianificazione della qualità Politica ed obiettivi della qualità Riferimento ad un eventuale modello di qualità adottato Controllo della qualità Procedure di controllo.

Dettagli

Un ripasso di aritmetica: Rappresentazione binaria - operazioni. riporti

Un ripasso di aritmetica: Rappresentazione binaria - operazioni. riporti Un ripasso di aritmetica: Rappresentazione binaria - operazioni A queste rappresentazioni si possono applicare le operazioni aritmetiche: riporti 1 1 0 + 1 0 = 1 0 0 24 Un ripasso di aritmetica: Rappresentazione

Dettagli

www.atoolsoftware.it

www.atoolsoftware.it www.atoolsoftware.it import / export dxf import ascii import macchine (configurazione attrezzaggio) Aspan è un programma che tramite il suo CAD/CAM interno permette di realizzare in modo semplice ed immediato

Dettagli

Applicazioni biotecnologiche in systems biology

Applicazioni biotecnologiche in systems biology Applicazioni biotecnologiche in systems biology Lezione #2 Dr. Marco Galardini AA 2012/2013 Contatti Dr. Marco Galardini Dip. Di Biologia Via Madonna del Piano 6, Polo Scientifico S. Fiorentino (c/o Incubatore

Dettagli

LA MISURAZIONE DEL CARATTERE

LA MISURAZIONE DEL CARATTERE TPO PROGETTAZIONE UD 03 GESTIONE DEL CARATTERE IL TIPOMETRO LA MISURAZIONE DEL CARATTERE A.F. 2011/2012 MASSIMO FRANCESCHINI - SILVIA CAVARZERE 1 IL TIPOMETRO: PARTI FONDAMENTALI Il tipometro è uno strumento

Dettagli

5.3 TABELLE 5.3.1 RECORD 5.3.1.1 Inserire, eliminare record in una tabella Aggiungere record Eliminare record

5.3 TABELLE 5.3.1 RECORD 5.3.1.1 Inserire, eliminare record in una tabella Aggiungere record Eliminare record 5.3 TABELLE In un sistema di database relazionali le tabelle rappresentano la struttura di partenza, che resta poi fondamentale per tutte le fasi del lavoro di creazione e di gestione del database. 5.3.1

Dettagli

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video Video Librerie digitali Gestione di video Ogni filmato è composto da più parti Video Audio Gestito come visto in precedenza Trascrizione del testo, identificazione di informazioni di interesse Testo Utile

Dettagli

16/05/2008. Continua sporadicamente ad occuparsi di matematica; muore tra le convulsioni, probabilmente per una lesione al cervello

16/05/2008. Continua sporadicamente ad occuparsi di matematica; muore tra le convulsioni, probabilmente per una lesione al cervello La probabilità Gli inizi della teoria della probabilità possono farsi risalire a Fermat e a un grande genio matematico che si dedicò invece al misticismo: Blaise (1623-1669) si dedicò alla matematica fin

Dettagli

Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A. 2013-14. Pietro Frasca.

Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A. 2013-14. Pietro Frasca. Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A. 2013-14 Pietro Frasca Lezione 11 Martedì 12-11-2013 1 Tecniche di allocazione mediante free list Generalmente,

Dettagli

Database. Si ringrazia Marco Bertini per le slides

Database. Si ringrazia Marco Bertini per le slides Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida

Dettagli

Cosa è un foglio elettronico

Cosa è un foglio elettronico Cosa è un foglio elettronico Versione informatica del foglio contabile Strumento per l elaborazione di numeri (ma non solo...) I valori inseriti possono essere modificati, analizzati, elaborati, ripetuti

Dettagli

Codici a barre. Marco Dell Oro. January 4, 2014

Codici a barre. Marco Dell Oro. January 4, 2014 Codici a barre Marco Dell Oro January 4, 2014 1 Cosa sono i codici a barre I codici a barre sono dei codici utilizzati nel settore della produzione e del commercio, oltre che nel settore pubblicitario

Dettagli

Sistemi Operativi IMPLEMENTAZIONE DEL FILE SYSTEM. D. Talia - UNICAL. Sistemi Operativi 9.1

Sistemi Operativi IMPLEMENTAZIONE DEL FILE SYSTEM. D. Talia - UNICAL. Sistemi Operativi 9.1 IMPLEMENTAZIONE DEL FILE SYSTEM 9.1 Implementazione del File System Struttura del File System Implementazione Implementazione delle Directory Metodi di Allocazione Gestione dello spazio libero Efficienza

Dettagli

Informatica grafica e Multimedialità. 4 Immagini grafiche

Informatica grafica e Multimedialità. 4 Immagini grafiche Immagini raster e vettoriali Le immagini grafiche si distinguono in due classi differenti: immagini raster e immagini vettoriali. Le immagini raster, dette anche pittoriche o pixel-oriented, dividono l

Dettagli

EXCEL PER WINDOWS95. sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area di lavoro, detta foglio di lavoro,

EXCEL PER WINDOWS95. sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area di lavoro, detta foglio di lavoro, EXCEL PER WINDOWS95 1.Introduzione ai fogli elettronici I fogli elettronici sono delle applicazioni che permettono di sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area

Dettagli

RISOLUTORE AUTOMATICO PER SUDOKU

RISOLUTORE AUTOMATICO PER SUDOKU RISOLUTORE AUTOMATICO PER SUDOKU Progetto Prolog - Pierluigi Tresoldi 609618 INDICE 1.STORIA DEL SUDOKU 2.REGOLE DEL GIOCO 3.PROGRAMMAZIONE CON VINCOLI 4.COMANDI DEL PROGRAMMA 5.ESEMPI 1. STORIA DEL SUDOKU

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Biologia Molecolare. CDLM in CTF 2010-2011 L analisi del genoma

Biologia Molecolare. CDLM in CTF 2010-2011 L analisi del genoma Biologia Molecolare CDLM in CTF 2010-2011 L analisi del genoma L analisi del genoma n La tipizzazione del DNA n La genomica e la bioinformatica n La genomica funzionale La tipizzazione del DNA DNA Fingerprinting

Dettagli

Introduzione all analisi dei segnali digitali.

Introduzione all analisi dei segnali digitali. Introduzione all analisi dei segnali digitali. Lezioni per il corso di Laboratorio di Fisica IV Isidoro Ferrante A.A. 2001/2002 1 Segnali analogici Si dice segnale la variazione di una qualsiasi grandezza

Dettagli

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux Scheduling della CPU Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux Sistemi multiprocessori Fin qui si sono trattati i problemi di scheduling su singola

Dettagli

La possibilita di conoscere i geni deriva dalla capacita di manipolarli:

La possibilita di conoscere i geni deriva dalla capacita di manipolarli: La possibilita di conoscere i geni deriva dalla capacita di manipolarli: -isolare un gene (enzimi di restrizione) -clonaggio (amplificazione) vettori -sequenziamento -funzione Il gene o la sequenza

Dettagli

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 4 Reti neurali per la classificazione Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com

Dettagli

Esercitazioni di Genomica

Esercitazioni di Genomica Esercitazioni di Genomica Bioinformatica ai tempi del NGS, PhD CRIBI Biotechnology Center, University of Padua BMR Genomics srl, Spin-Off Giovanni Birolo, PhD CRIBI Biotechnology Center, University of

Dettagli

Regione Toscana. ARPA Fonte Dati. Manuale Amministratore. L. Folchi (TAI) Redatto da

Regione Toscana. ARPA Fonte Dati. Manuale Amministratore. L. Folchi (TAI) Redatto da ARPA Fonte Dati Regione Toscana Redatto da L. Folchi (TAI) Rivisto da Approvato da Versione 1.0 Data emissione 06/08/13 Stato DRAFT 1 Versione Data Descrizione 1,0 06/08/13 Versione Iniziale 2 Sommario

Dettagli

Sequenziamento a minimo costo di commutazione in macchine o celle con costo lineare e posizione home (In generale il metodo di ottimizzazione

Sequenziamento a minimo costo di commutazione in macchine o celle con costo lineare e posizione home (In generale il metodo di ottimizzazione Sequenziamento a minimo costo di commutazione in macchine o celle con costo lineare e posizione home (In generale il metodo di ottimizzazione presentato in questo file trova la seq. a costo minimo per

Dettagli

GENOMA. c varia da pochi kb nei virus a milioni di kb in piante e animali

GENOMA. c varia da pochi kb nei virus a milioni di kb in piante e animali GENOMA Insieme del materiale genetico presente in una cellula (DNA nucleare, plastidiale e mitocondriale) Contiene tutte le informazioni necessarie per consentire la vita alla cellula e all individuo Nei

Dettagli

I motori di ricerca. Che cosa sono. Stefania Marrara Corso di Sistemi Informativi

I motori di ricerca. Che cosa sono. Stefania Marrara Corso di Sistemi Informativi I motori di ricerca Stefania Marrara Corso di Sistemi Informativi a.a 2002/2003 Che cosa sono Un motore di ricerca è uno strumento per mezzo del quale è possibile ricercare alcuni termini (parole) all

Dettagli

Appunti di informatica. Lezione 2 anno accademico 2015-2016 Mario Verdicchio

Appunti di informatica. Lezione 2 anno accademico 2015-2016 Mario Verdicchio Appunti di informatica Lezione 2 anno accademico 2015-2016 Mario Verdicchio Sistema binario e logica C è un legame tra i numeri binari (0,1) e la logica, ossia la disciplina che si occupa del ragionamento

Dettagli

Isolamento e purificazione di DNA e RNA. -Separare gli acidi nucleici da altri componenti cellulari (lipidi e proteine)

Isolamento e purificazione di DNA e RNA. -Separare gli acidi nucleici da altri componenti cellulari (lipidi e proteine) Isolamento e purificazione di DNA e RNA -Rompere la membrana cellulare -Separare gli acidi nucleici da altri componenti cellulari (lipidi e proteine) -Separare gli acidi nucleici tra loro -Rompere la membrana

Dettagli

Codifiche a lunghezza variabile

Codifiche a lunghezza variabile Sistemi Multimediali Codifiche a lunghezza variabile Marco Gribaudo marcog@di.unito.it, gribaudo@elet.polimi.it Assegnazione del codice Come visto in precedenza, per poter memorizzare o trasmettere un

Dettagli

TEMPO E RISCHIO. Il valore del denaro è funzione del tempo in cui è disponibile

TEMPO E RISCHIO. Il valore del denaro è funzione del tempo in cui è disponibile Esercitazione TEMPO E RISCHIO Il valore del denaro è funzione del tempo in cui è disponibile Un capitale - spostato nel futuro si trasforma in montante (capitale iniziale più interessi), - spostato nel

Dettagli

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa.

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa. Una sperimentazione Probabilità Si sta sperimentando l efficacia di un nuovo farmaco per il morbo di Parkinson. Duemila pazienti partecipano alla sperimentazione: metà di essi vengono trattati con il nuovo

Dettagli

Corso di Fisica generale

Corso di Fisica generale Corso di Fisica generale Liceo Scientifico Righi, Cesena Anno Scolastico 2014/15 1C Introduzione alla Incertezza della Misura Sperimentale I Riccardo Fabbri 1 (Dispense ed esercizi su www.riccardofabbri.eu)

Dettagli

Guida all uso del web service SDMX

Guida all uso del web service SDMX Guida all uso del web service SDMX Introduzione L obiettivo di questo documento è l illustrazione sintetica degli step che tecnicamente bisogna compiere affinché un generico client sia in grado di interagire

Dettagli

Join in SQL (primo modo) Informatica. Tabella Dipartimento. Interrogazione 4a. Interrogazione 4b. Interrogazione 4a

Join in SQL (primo modo) Informatica. Tabella Dipartimento. Interrogazione 4a. Interrogazione 4b. Interrogazione 4a Join in SQL (primo modo) Informatica Lezione 7 Laurea magistrale in Psicologia Laurea magistrale in Psicologia dello sviluppo e dell'educazione Anno accademico: 09- Per formulare interrogazioni che coinvolgono

Dettagli

ESERCIZI DI PROBLEM SOLVING E COMPOSIZIONE DEI DIAGRAMMI DI FLUSSO per le classi terza

ESERCIZI DI PROBLEM SOLVING E COMPOSIZIONE DEI DIAGRAMMI DI FLUSSO per le classi terza ESERCIZI DI PROBLEM SOLVING E COMPOSIZIONE DEI DIAGRAMMI DI FLUSSO per le classi terza vers.3 in lavorazione Docente SAFFI FABIO Contenuti 01.Esercizi generici sul diagramma di flusso - flow chart... 2

Dettagli

9. Urti e conservazione della quantità di moto.

9. Urti e conservazione della quantità di moto. 9. Urti e conservazione della quantità di moto. 1 Conservazione dell impulso m1 v1 v2 m2 Prima Consideriamo due punti materiali di massa m 1 e m 2 che si muovono in una dimensione. Supponiamo che i due

Dettagli

Informatica 3. LEZIONE 23: Indicizzazione. Modulo 1: Indicizzazione lineare, ISAM e ad albero Modulo 2: 2-3 trees, B-trees e B + -trees

Informatica 3. LEZIONE 23: Indicizzazione. Modulo 1: Indicizzazione lineare, ISAM e ad albero Modulo 2: 2-3 trees, B-trees e B + -trees Informatica 3 LEZIONE 23: Indicizzazione Modulo 1: Indicizzazione lineare, ISAM e ad albero Modulo 2: 2-3 trees, B-trees e B + -trees Informatica 3 Lezione 23 - Modulo 1 Indicizzazione lineare, ISAM e

Dettagli

Un ripasso di aritmetica: Conversione dalla base 10 alla base 16

Un ripasso di aritmetica: Conversione dalla base 10 alla base 16 Un ripasso di aritmetica: Conversione dalla base 1 alla base 16 Dato un numero N rappresentato in base dieci, la sua rappresentazione in base sedici sarà del tipo: c m c m-1... c 1 c (le c i sono cifre

Dettagli

SAGE: Serial Analysis of Gene Expression

SAGE: Serial Analysis of Gene Expression SAGE: Serial Analysis of Gene Expression L insieme di tutti gli mrna presenti in una cellula si definisce trascrittoma. Ogni trascrittoma ha una composizione complessa, con migliaia di mrna diversi, ciascuno

Dettagli

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004 ESAME DI STAT DI LICE SCIENTIFIC CRS SPERIMENTALE P.N.I. 004 Il candidato risolva uno dei due problemi e 5 dei 0 quesiti in cui si articola il questionario. PRBLEMA Sia la curva d equazione: ke ove k e

Dettagli

Modulo 1: Motori di ricerca

Modulo 1: Motori di ricerca Contenuti Architettura di Internet Principi di interconnessione e trasmissione World Wide Web Posta elettronica Motori di ricerca Antivirus Personal firewall Tecnologie delle reti di calcolatori Servizi

Dettagli

Gestione della memoria centrale

Gestione della memoria centrale Gestione della memoria centrale Un programma per essere eseguito deve risiedere in memoria principale e lo stesso vale per i dati su cui esso opera In un sistema multitasking molti processi vengono eseguiti

Dettagli