Laboratorio di Elementi di Bioinformatica
|
|
- Fabiola Blasi
- 6 anni fa
- Visualizzazioni
Transcript
1 Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2016/2017 I dati in Bioinformatica Docente del laboratorio: Raffaella Rizzi 1
2 Il DNA (oggetto biologico) Il DNA è una catena polinucleotidica. Il mattoncino che compone una catena di DNA prende il nome di nucleotide. D b P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata
3 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D b P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi:
4 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D A P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A)
5 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D G P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G)
6 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D C P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C)
7 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D T P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C) - timina (T)
8 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D T P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) purine - guanina (G) - citosina (C) - timina (T)
9 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D T P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C) pirimidine - timina (T)
10 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) direzione T D 5 P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C) - timina (T)
11 Il DNA (oggetto biologico) D T P D A Legame fosfodiesterico è legame tra D e P P D C P
12 Il DNA (oggetto biologico) 3 D T La sequenza delle basi azotate elencate dal 5 al 3 fornisce la sequenza primaria della molecola di DNA P D A Nell esempio della figura la sequenza primaria è quindi CAT (e non TAC) P D C 5 P
13 Il DNA (oggetto biologico) 3 D T La sequenza delle basi azotate elencate dal 5 al 3 fornisce la sequenza primaria della molecola di DNA P D A Nell esempio della figura la sequenza primaria è quindi CAT (e non TAC) P nucleotide coincide con base azotata D C 5 P
14 Il DNA genomico Il DNA genomico (genoma) è la lunga molecola di DNA che contiene le informazioni che regolano la vita di un organismo vivente: è contenuto nel nucleo di tutte le cellule dell organismo è una doppia catena avvolta ad elica è suddiviso in cromosomi
15 Il DNA genomico Il DNA genomico (genoma) è la lunga molecola di DNA che contiene le informazioni che regolano la vita di un organismo vivente: è contenuto nel nucleo di tutte le cellule dell organismo è una doppia catena avvolta ad elica è suddiviso in cromosomi Genoma umano (3,2 miliardi di basi): 22 coppie di autosomi (chr1, chr2,, chr22) cromosomi X e Y (XX=femmina, XY=maschio) il cromosoma 1 è il più lungo (circa 245 milioni di basi)
16 Il DNA genomico P 5 3 D T A D P P D A T D P P D C G D 3 5 P
17 Il DNA genomico A è complementare a T à due legami idrogeno C è complementare a G à tre legami idrogeno P 5 3 D T A D P P D A T D P P D C G D 3 5 P
18 Il DNA genomico 3 D T A D P 5 strand (reverse) P P D A T D P P strand + (forward) 5 P D C G D 3
19 Il DNA genomico 3 D T A D P 5 strand (reverse) P P D A T D P P Catena forward è CAT D strand + (forward) 5 P C G D 3
20 Il DNA genomico 3 P D T A D P P 5 strand (reverse) Catena reverse è ATG D A T D P P Catena forward è CAT D strand + (forward) 5 P C G D 3
21 Il DNA (dato informatico) La sequenza primaria di un catena di DNA è dunque rappresentata da una stringa di simboli appartenenti all alfabeto Σ={A,C,G,T}
22 Il DNA (dato informatico) La sequenza primaria di un catena di DNA è dunque rappresentata da una stringa di simboli appartenenti all alfabeto Σ={A,C,G,T} La lunghezza di una sequenza di DNA si misura in base pair (bp). Quindi una sequenza lunga 1000bp è composta da 1000 basi.
23 Il DNA (dato informatico) Operazione fondamentale à Reverse&Complement per ottenere, data la sequenza primaria di una catena di DNA, la sequenza primaria della sua catena appaiata: si trasforma ogni singola base nella sua complementare: A in T (e viceversa), C in G (e viceversa) si inverte la sequenza ottenuta
24 Il DNA (dato informatico) Esempio di Reverse&Complement: A C G T A G
25 Il DNA (dato informatico) Esempio di Reverse&Complement: A C G T A G complement T G C A T C
26 Il DNA (dato informatico) Esempio di Reverse&Complement: A C G T A G complement T G C A T C reverse C T A C G T
27 L RNA (oggetto biologico) Il nucleotide (il mattoncino dell RNA) R b P D: zucchero pentoso è ribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C) - uracile (U) uracile al posto della timina
28 L RNA (dato informatico) La sequenza primaria di un catena di RNA è rappresentata tramite una stringa simboli appartenenti all alfabeto Σ={A,C,G,U} L RNA si trova in catene singole
29 Le proteine Una proteina è una catena di aminoacidi e la sua sequenza primaria è rappresentata da una stringa definita su un alfabeto di 20 simboli (20 sono gli aminoacidi presenti in natura). Glu Ile Phe Thr Val His
30 Il sequenziamento Sequenziare significa determinare la sequenza primaria delle molecole biologiche (DNA/RNA e proteine) è sequenza delle basi {A,C,G,T U} per DNA e RNA è sequenza degli aminoacidi per le proteine
31 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola biologica? è single-end read DNA/RNA GTTGTGCAGTGACGGA
32 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair insertion size DNA/RNA A B
33 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair insertion size DNA/RNA A B A = B
34 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair insertion size DNA/RNA A B A = B
35 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair insertion size DNA/RNA A B Output è + insertion size A = B
36 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair F R insertion size DNA/RNA agttgcgt A aatgcctg B Output è agttgcgt gtccgtaa Insertion size <= 1000 bp A = B
37 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair R F insertion size DNA/RNA agttgcgt A aatgcctg B Output è tgcgttga aatgcctg Insertion size <= bp A = B
38 Il sequenziamento Attenzione agli errori di sequenziamento!!! Le stringhe che rappresentano la sequenza primaria di DNA e RNA sono in realtà definite su di un alfabeto esteso che prende il nome di IUPAC code
39 IUPAC code per DNA SIMBOLO DESCRIZIONE A Adenine C Cytosine G Guanine T Thymine R Purine (A or G) Y Pyrimidine (C or T) M C or A K T, or G W T, or A S C or G B C, T or G (not A) D A, T or G (not C) H A, T or C (not G) V A, C or G (not T) N any base (A, C, G, T)
40 IUPAC code per RNA SIMBOLO DESCRIZIONE A Adenine C Cytosine G Guanine U Uracil R Purine (A or G) Y Pyrimidine (C or U) M C or A K U or G W U or A S C or G B C, U or G (not A) D A, U or G (not C) H A, U or C (not G) V A, C or G (not U) N any base (A, C, G or U)
41 Sanger VS Next-Generation Sequencing (NGS) Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costosi (attorno al milione di dollari per sequenziare il genoma umano) ð Processano tanti reads in un run (milioni) (copertura da 10 a 100 volte superiore quella Sanger) ð Reads relativamente corti ð Qualità relativamente bassa
42 Cos è un gene? Un gene è una regione (locus) del DNA genomico che codifica una proteina.
43 Cos è un gene? Un gene è una regione (locus) del DNA genomico che codifica una proteina. Un gene viene identificato tramite il suo HUGO NAME (
44 Cos è un gene? Un gene è una regione (locus) del DNA genomico che codifica una proteina. Un gene viene identificato tramite il suo HUGO NAME ( Esempio di HUGO NAME: ATP6AP1 (ATPase, H+ transporting, lysosomal accessory protein 1)
45 Cos è un gene? La sequenza primaria del locus di DNA di un gene prende il nome di sequenza genomica.
46 Cos è un gene? La sequenza primaria del locus di DNA di un gene prende il nome di sequenza genomica. Sequenza genomica è un termine generale per indicare la sequenza di una qualsiasi regione di DNA genomico Una sequenza genomica è dunque in Bioinformatica una sottostringa della sequenza primaria del DNA genomico
47 Sequenza genomica In genere una sequenza genomica viene memorizzata in formato FASTA che è: un formato di puro testo nato come formato di input del software di allineamento FASTA pensato per memorizzare sequenze nucleotidiche (DNA e RNA) e qualche informazione aggiuntiva diventato un formato standard di input di molti tools di analisi di sequenze Il nome di un file in formato FASTA ha estensione fa oppure fasta
48 Formato FASTA (esempio) >X dna:chromosome chromosome:grch38:x: : :1 GGGGGCAACGGTCACCTGATCTGCGGCTGTCGAGGCCGCTGAGGCAGTGGAGGCTGAGGC TATGATGGCGGCCATGGCGACGGCTCGAGTGCGGATGGGGCCGCGGTGCGCCCAGGCGCT CTGGCGCATGCCGTGGCTGCCGGTGTTTTTGTCGTTGGCGGCGGCGGCGGCGGCGGCAGC GGCGGAGCAGCAGGTCCCGCTGGTGCTGTGGTCGAGTGACCGGTGAGCGGGCCGGGGTGG GATGCGCTGTGGCGGCTGAGGCGCCCTCGCCCGACTCCGGCGCTGTCCTAGGCGAGGGGT GGTGAGGCCCGGAGGTGGACTGTTCCTTGCTCGGGGGCTCGCAGCGAATCTGCCGGCGAC AGAGCTCCAGTCCACATGCGCCCCCGTCTGACAGCACCTCTTCTGTGCCCTGCCAGGGAC TTGTGGGCTCCTGCGGCCGACACTCATGAAGGCCACATCACCAGCGACTTGCAGCTCTCT ACCTACTTAGATCCCGCCCTGGAGCTGGGTCCCAGGAATGTGCTGCTGTTCCTGCAGGAC AAGGTGCGCCCGCCCCAGCCCACTCTCCCCCGGTCATCGGGAGGCAGCCAGGCCCCCTCC CCCCATGACACTGACGCCCATTCCCCAAGGGAAGCTTCAGTGACCTTGTCCCAACTGTAG GGAGGTGTGGGTCGTCTCATGGGAAGGCCTGTAGTAAACGCTTCAGTGGGCATGGCGACA GCCTCGGAAATGGCACCAACTTGATTGGAGGAAGCGACGGACCAGAGGCCAGGTACCTAC TGAGTACCAAGCACTTTGGATATCTGACTTAGTCCAATATGGTGGGTGGGGATTATCGTC [ ]
49 Formato FASTA (esempio) >X dna:chromosome chromosome:grch38:x: : :1 GGGGGCAACGGTCACCTGATCTGCGGCTGTCGAGGCCGCTGAGGCAGTGGAGGCTGAGGC TATGATGGCGGCCATGGCGACGGCTCGAGTGCGGATGGGGCCGCGGTGCGCCCAGGCGCT CTGGCGCATGCCGTGGCTGCCGGTGTTTTTGTCGTTGGCGGCGGCGGCGGCGGCGGCAGC Header FASTA à il primo simbolo deve essere > GGCGGAGCAGCAGGTCCCGCTGGTGCTGTGGTCGAGTGACCGGTGAGCGGGCCGGGGTGG GATGCGCTGTGGCGGCTGAGGCGCCCTCGCCCGACTCCGGCGCTGTCCTAGGCGAGGGGT GGTGAGGCCCGGAGGTGGACTGTTCCTTGCTCGGGGGCTCGCAGCGAATCTGCCGGCGAC AGAGCTCCAGTCCACATGCGCCCCCGTCTGACAGCACCTCTTCTGTGCCCTGCCAGGGAC TTGTGGGCTCCTGCGGCCGACACTCATGAAGGCCACATCACCAGCGACTTGCAGCTCTCT ACCTACTTAGATCCCGCCCTGGAGCTGGGTCCCAGGAATGTGCTGCTGTTCCTGCAGGAC AAGGTGCGCCCGCCCCAGCCCACTCTCCCCCGGTCATCGGGAGGCAGCCAGGCCCCCTCC CCCCATGACACTGACGCCCATTCCCCAAGGGAAGCTTCAGTGACCTTGTCCCAACTGTAG GGAGGTGTGGGTCGTCTCATGGGAAGGCCTGTAGTAAACGCTTCAGTGGGCATGGCGACA GCCTCGGAAATGGCACCAACTTGATTGGAGGAAGCGACGGACCAGAGGCCAGGTACCTAC TGAGTACCAAGCACTTTGGATATCTGACTTAGTCCAATATGGTGGGTGGGGATTATCGTC [ ]
50 Formato FASTA (esempio) >X dna:chromosome chromosome:grch38:x: : :1 GGGGGCAACGGTCACCTGATCTGCGGCTGTCGAGGCCGCTGAGGCAGTGGAGGCTGAGGC TATGATGGCGGCCATGGCGACGGCTCGAGTGCGGATGGGGCCGCGGTGCGCCCAGGCGCT CTGGCGCATGCCGTGGCTGCCGGTGTTTTTGTCGTTGGCGGCGGCGGCGGCGGCGGCAGC GGCGGAGCAGCAGGTCCCGCTGGTGCTGTGGTCGAGTGACCGGTGAGCGGGCCGGGGTGG GATGCGCTGTGGCGGCTGAGGCGCCCTCGCCCGACTCCGGCGCTGTCCTAGGCGAGGGGT GGTGAGGCCCGGAGGTGGACTGTTCCTTGCTCGGGGGCTCGCAGCGAATCTGCCGGCGAC AGAGCTCCAGTCCACATGCGCCCCCGTCTGACAGCACCTCTTCTGTGCCCTGCCAGGGAC La sequenza viene di solito spezzata in parti di 60/80 caratteri TTGTGGGCTCCTGCGGCCGACACTCATGAAGGCCACATCACCAGCGACTTGCAGCTCTCT ACCTACTTAGATCCCGCCCTGGAGCTGGGTCCCAGGAATGTGCTGCTGTTCCTGCAGGAC AAGGTGCGCCCGCCCCAGCCCACTCTCCCCCGGTCATCGGGAGGCAGCCAGGCCCCCTCC CCCCATGACACTGACGCCCATTCCCCAAGGGAAGCTTCAGTGACCTTGTCCCAACTGTAG GGAGGTGTGGGTCGTCTCATGGGAAGGCCTGTAGTAAACGCTTCAGTGGGCATGGCGACA GCCTCGGAAATGGCACCAACTTGATTGGAGGAAGCGACGGACCAGAGGCCAGGTACCTAC TGAGTACCAAGCACTTTGGATATCTGACTTAGTCCAATATGGTGGGTGGGGATTATCGTC [ ]
51 Cos è un gene? Entrambe le catene del DNA genomico contengono geni. 5 strand + (forward) 3 3 strand - (reverse) 5
52 Cos è un gene? Entrambe le catene del DNA genomico contengono geni. 5 strand + (forward) 3 3 strand - (reverse) 5 Genoma umano è circa geni codificanti Tutte le cellule di un organismo contengono l intero set di geni dell organismo
53 Espressione di un gene locus genico
54 Espressione di un gene locus genico 5 3
55 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 Esone = regione codificante Introne = regione non-codificante
56 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon splice site (confine esone-introne) 3 splice site (confine introne-esone) Esone = regione codificante Introne = regione non-codificante
57 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3
58 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3 Il pre-mrna è la copia della sequenza di DNA genomico con la sostituzione di T con U
59 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3 SPLICING mrna exon 1 exon 2 exon 3 trascritto
60 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3 SPLICING mrna trascritto coding sequence (CDS) AUG [stop] [stop] start codon stop codon UAG UAA UGA
61 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3 SPLICING mrna trascritto coding sequence (CDS) AUG [stop] [stop] 5 UTR 3 UTR UAG UAA UGA
62 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG La CDS viene suddivisa in triplette (codoni) e ogni codone viene mappato a un aminoacido attraverso il codice genetico. Codice genetico da Wikipedia
63 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Proteina: Met Codice genetico da Wikipedia
64 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Proteina: Met Pro Codice genetico da Wikipedia
65 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Proteina: Met Pro Ser Codice genetico da Wikipedia
66 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Proteina: Met Pro Ser Asp Codice genetico da Wikipedia
67 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Met Pro Ser Asp [stop] Codice genetico da Wikipedia
68 Pattern di un introne 5 exon 1 exon 2 exon 3 3 Introne canonico % GT AG Introni non canonici GC 0.69 % AG AT 0.05 % AC ALTRO 0.02 % Burset et al., Nucleic Acids Res. 2000, 28:
69 Espressione di un gene Numero dei geni umani: circa Numero delle proteine umane: centinaia di migliaia La corrispondenza 1 a 1 non è rispettata. Perché?
70 Espressione di un gene Numero dei geni umani: circa Numero delle proteine umane: centinaia di migliaia La corrispondenza 1 a 1 non è rispettata. Perché? ALTERNATIVE SPLICING (AS) è un gene è in grado di esprimere una molteplicità di trascritti
71 Perché AS è importante? AS avviene nel 40-60% dei geni umani (Modrek and Lee, 2002)
72 Perché AS è importante? AS avviene nel 40-60% dei geni umani (Modrek and Lee, 2002) AS è specifico al tessuto in cui si trova la cellula (Graveley, 2001)
73 Perché AS è importante? AS avviene nel 40-60% dei geni umani (Modrek and Lee, 2002) AS è specifico al tessuto in cui si trova la cellula (Graveley, 2001) AS è specifico alle condizioni in cui si trova la cellula (es. stadio di sviluppo)
74 Perché AS è importante? AS avviene nel 40-60% dei geni umani (Modrek and Lee, 2002) AS è specifico al tessuto in cui si trova la cellula (Graveley, 2001) AS è specifico alle condizioni in cui si trova la cellula (es. stadio di sviluppo) AS è specifico allo stato di salute in cui si trova la cellula (correlazione con malattie)
75 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref
76 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref mrna1 exon 1 exon 1 intron retention exon 2 exon 3
77 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref mrna1 exon 1 exon 1 exon 2 exon 3 mrna2 exon 1 exon skipping exon 3
78 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref mrna1 exon 1 exon 1 exon 2 exon 3 mrna2 exon 1 exon 3 mrna3 exon 1 5 competing sites exon 2 exon 3
79 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref mrna1 exon 1 exon 1 exon 2 exon 3 mrna2 exon 1 exon 3 mrna3 exon 1 exon 2 exon 3 mrna4 exon 1 exon 2 exon 3 3 competing sites
80 Alternative Splicing (AS) Gene2 5 exon 1 exon 2 exon 3 exon 4 3 mrna ref exon 1 exon 2 exon 3 exon 4
81 Alternative Splicing (AS) Gene2 exon 1 5 exon 2 exon 3 exon 4 3 exon 1 exon 2 exon 3 exon 4 mrna ref mrna1 exon 1 exon 3 exon 4 mrna2 exon 1 exon 2 exon 4
82 Alternative Splicing (AS) Gene2 exon 1 5 exon 2 exon 3 exon 4 3 exon 1 exon 2 exon 3 exon 4 mrna ref mrna1 exon 1 exon 3 exon 4 mrna2 exon 1 exon 2 exon 4 mutually exclusive exons
83 Alternative Splicing (AS) Gene2 exon 1 exon 2 exon 3 exon mrna ref exon 1 exon 2 exon 3 exon 4 mrna1 exon 1 exon 3 exon 4 mrna2 exon 1 exon 2 exon 4 exon 1 exon 2 exon 3 exon 4 mrna3 multiple poly(a) sites
84 Alternative Splicing (AS) Gene2 5 exon 1 exon 2 exon 3 exon 4 3 mrna ref exon 1 exon 2 exon 3 exon 4 mrna1 exon 1 exon 3 exon 4 mrna2 exon 1 exon 2 exon 4 exon 1 exon 2 exon 3 exon 4 mrna3 exon 1 exon 2 exon 3 exon 4 mrna4 multiple promoters
85 Alternative Splicing (AS) Gene2 5 exon 1 exon 2 exon 3 exon 4 3 mrna ref exon 1 exon 2 exon 3 exon 4 mrna1 exon 1 exon 3 exon 4 Isoforma = trascritto (mrna) che il gene è in grado di esprimere mrna2 exon 1 exon 2 exon 4 exon 1 exon 2 exon 3 exon 4 mrna3 exon 1 exon 2 exon 3 exon 4 mrna4 multiple promoters
86 Alternative Splicing (AS) Gene2 5 exon 1 exon 2 exon 3 exon 4 3 mrna ref exon 1 exon 2 exon 3 exon 4 mrna1 exon 1 exon 3 exon 4 Isoforma = proteina che il gene è in grado di produrre mrna2 exon 1 exon 2 exon 4 exon 1 exon 2 exon 3 exon 4 mrna3 exon 1 exon 2 exon 3 exon 4 mrna4 multiple promoters
87 Problema computazionale di Alternative Splicing In Bioinformatica si ha la necessità di algoritmi e tools per predire la struttura in esoni-introni di un gene predire le isoforme alternative quantificare le isoforme alternative
88 Dati importanti Dati fondamentali in Bioinformatica sono i dati ottenuti dal sequenziamento di trascritti (mrna) che prendono il nome di: q EST (Expressed Sequence Tag) se ottenuti con metodo (tradizionale) Sanger q RNA-seq se ottenuti tramite tecnologie NGS
89 EST vs RNA-seq Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costosi (attorno al milione di dollari per sequenziare il genoma umano) ð Processano tanti reads in un run (milioni) (copertura da 10 a 100 volte superiore quella Sanger) ð Lunghezza relativamente bassa ð Qualità relativamente bassa
90 EST vs RNA-seq Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) Expressed Sequence Tag (EST) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costosi (attorno al milione di dollari per sequenziare il genoma umano) ð Processano tanti reads in un run (milioni) (copertura da 10 a 100 RNA-seq volte superiore quella Sanger) ð Lunghezza relativamente bassa ð Qualità relativamente bassa
91 Risorse dati in Bioinformatica Risorse a disposizione Banche dati genomiche Browser Genomici Sistemi integrati Software tools
92 Banche dati genomiche Scopo: archiviare e diffondere i dati ottenuti da esperimenti biologici Oggetti contenuti (entries): sequenze nucleotidiche (DNA, RNA) Geni trascritti Expressed Sequence Tag (EST) proteine strutture proteiche 3D etc
93 Banche dati genomiche Non è detto che siano DB relazionali L entry è identificata univocamente da un ID (Accession Number) e di solito è un file di puro testo: human-readable facile da sottoporre a parsing (con Ruby, Perl, Python, etc.) Due tipi principali di banche: primarie oggetti di tipo eterogeneo archiviati con un minimo di informazione (ad esempio sequenze nucleotidiche) specializzate: oggetti omogenei per tassonomia, funzione, etc. (ad esempio frammenti di trascritto)
94 Banche dati genomiche Le storiche banche primarie di sequenze nucleotidiche sono: EMBL Data Bank sviluppata da EMBL-EBI (European Bioinformatics Institute, parte dell European Molecular Biology Laboratory, EMBL) formato entry file: EMBL
95 Banche dati genomiche Le storiche banche primarie di sequenze nucleotidiche sono: EMBL Data Bank sviluppata da EMBL-EBI (European Bioinformatics Institute, parte dell European Molecular Biology Laboratory, EMBL) GenBank formato entry file: EMBL sviluppata da NCBI (National Center for Biotechnology Information, USA) formato entry file: GenBank
96 Banche dati genomiche Le storiche banche primarie di sequenze nucleotidiche sono: DDBJ DNA Data Bank of Japan sviluppata dal National Institute of Genetics in Mishima formato entry file: GenBank
97 Banche dati genomiche Le storiche banche primarie di sequenze nucleotidiche sono: DDBJ DNA Data Bank of Japan sviluppata dal National Institute of Genetics in Mishima formato entry file: GenBank La stessa sequenza nucleotidica è identificata in queste tre banche dallo stesso Accession Number
98 Banche dati genomiche Esercizio q Recuperare la sequenza con Accession Number M10051 da EMBL ( scaricarla sia in formato EMBL che in formato FASTA
99 Banche dati genomiche Una banca specializzata UniGene banca di trascritti (EST e mrna) mette a disposizione i trascritti raggruppati in cluster. Ogni cluster riguarda un gene e un organismo sviluppata da NCBI (National Center for Biotechnology Information, USA) formato entry file: FASTA
100 Browser genomici Database che conservano i dati relativi a interi genomi e mettono a disposizione dell utente un interfaccia sofisticata per esplorarli Ensembl sviluppato da EMBL-EBI + Wellcome Trust Sanger Institute UCSC Genome Browser sviluppato da University of California Santa Cruz
101 Sistemi integrati Sistemi per interrogare contemporaneamente più banche dati Entrez sviluppato da NCBI (National Center for Biotechnology Information, USA)
Corso di Elementi di Bioinformatica
Corso di Elementi di Bioinformatica Laurea Triennale in Informatica I dati e le banche dati in Bioinformatica Anno Accademico 2015-2016 Docente del laboratorio: Raffaella Rizzi 1 Il DNA (oggetto biologico)
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2016/2017 Formato GTF per annotare un gene Docente del laboratorio: Raffaella Rizzi 1 GTF (Gene Transfer
DettagliCorso di Elementi di Bionformatica
Corso di Elementi di Bionformatica Laurea Triennale in Informatica Il formato FASTQ per la qualità delle sequenze Anno Accademico 2015-2016 Docente del laboratorio: Raffaella Rizzi 1 La qualità delle sequenze
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2015/2016 Parsing di un file in formato EMBL (parte I) Docente del laboratorio: Raffaella Rizzi 1 Esercizio
DettagliLaboratorio di Elementi di Bioinformatica
Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E30Q6) AA 205/206 Esempio di workflow Docente del laboratorio: Raffaella Rizzi Scopo del workflow Scopo: dato un insieme
DettagliBioinformatica. Analisi del genoma
Bioinformatica Analisi del genoma GABRIELLA TRUCCO CREMA, 5 APRILE 2017 Cosa è il genoma? Insieme delle informazioni biologiche, depositate nella sequenza di DNA, necessarie alla costruzione e mantenimento
DettagliDNA E PROTEINE IL DNA E RACCHIUSO NEL NUCLEO, MENTRE LA SINTESI PROTEICA SI SVOLGE NEL CITOPLASMA: COME VIENE TRASPORTATA L INFORMAZIONE?
DNA E PROTEINE NUMEROSI DATI SUGGERISCONO CHE IL DNA SVOLGA IL SUO RUOLO GENETICO CONTROLLANDO LA SINTESI DELLE PROTEINE, IN PARTICOLARE DETERMINANDONE LA SEQUENZA IN AMINOACIDI E NECESSARIO RISPONDERE
DettagliIl progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.
Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato
DettagliCELLULA PROCARIOTICA PROCARIOTE
CELLULA PROCARIOTICA O PROCARIOTE CELLULA EUCARIOTICA O EUCARIOTE Sany0196.jpg IL NUCLEO Provvisto di due membrane (interna ed esterna) che congiungendosi in alcuni punti formano i pori nucleari attraverso
DettagliCodice Genetico (segue)
CODICE GENETICO Nucleotidi, acidi nucleici CODICE GENETICO Codice mediante il quale la sequenza nucleotidica di una molecola di DNA o di RNA specifica la sequenza amminoacidica di un polipeptide. Consiste
DettagliCOME È FATTO? Ogni filamento corrisponde ad una catena di nucleotidi
Il DNA Il DNA è una sostanza che si trova in ogni cellula e contiene tutte le informazioni sulla forma e sulle funzioni di ogni essere vivente: eppure è una molecola incredibilmente semplice. COME È FATTO?
DettagliIntroduzione alla Genomica
Laboratorio di Bioinformatica I Introduzione alla Genomica Dott. Sergio Marin Vargas (2014 / 2015) Il Genoma umano Gene codificanti proteine Gene non codificanti proteine Geni codificanti proteine 3 Il
DettagliIPOTESI UN GENE-UN ENZIMA
IPOTESI UN GENE-UN ENZIMA DNA: contiene tutte le informazioni per definire lo sviluppo e la fisiologia della cellula: ma come svolge questa funzione? Beadle e Tatum (1941): studiando mutanti della comune
DettagliLA SINTESI PROTEICA LE MOLECOLE CHE INTERVENGONO IN TALE PROCESSO SONO:
LA SINTESI PROTEICA La sintesi proteica è il processo che porta alla formazione delle proteine utilizzando le informazioni contenute nel DNA. Nelle sue linee fondamentali questo processo è identico in
DettagliCorso di Laurea in Chimica e Tecnologie Farmaceu6che a.a Università di Catania. La stru(ura del gene. Stefano Forte
Corso di Laurea in Chimica e Tecnologie Farmaceu6che a.a. 2014-2015 Università di Catania La stru(ura del gene Stefano Forte I Geni Il gene è l'unità ereditaria e funzionale degli organismi viventi. La
DettagliDal gene alla proteina
Dal gene alla proteina Il collegamento tra geni e proteine La trascrizione e la traduzione sono i due principali processi che legano il gene alla proteina: uno sguardo panoramico Le informazioni genetiche
DettagliGENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi
GENOMA EVOLUZIONE CONTENUTO FUNZIONE STRUTTURA Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine Progetti genoma in centinaia di organismi Importante la sintenia tra i genomi The
DettagliStruttura ed espressione del Gene
Struttura ed espressione del Gene PowerPoint Lectures for Essential Biology, Third Edition Neil Campbell, Jane Reece, and Eric Simon Essential Biology with Physiology, Second Edition Neil Campbell, Jane
Dettagli07/01/2015. Come si ferma una macchina in corsa? Il terminatore. Terminazione intrinseca (rho-indipendente)
Come si ferma una macchina in corsa? Il terminatore Terminazione intrinseca (rho-indipendente) Terminazione dipendente dal fattore Rho (r) 1 Operoni: gruppi di geni parte di una unica unità trascrizionale
DettagliNozioni base di Biologia
Nozioni base di Biologia Ripercorriamo velocemente i principali concetti di biologia indispensabili per capire la Bioinformatica: verranno approfonditi in altri corsi. Gli organismi viventi possiedono
DettagliSperimenta il BioLab Attività di Bioinformatica Caccia al gene
Sperimenta il BioLab Attività di Bioinformatica Caccia al gene Università degli Studi di Milano Settore Didattico, via Celoria 20, Milano Laboratorio 105 INTRODUZIONE Questa attività pratica ha come scopo
DettagliIPOTESI UN GENE-UN ENZIMA
IPOTESI UN GENE-UN ENZIMA DNA: contiene tutte le informazioni per definire lo sviluppo e la fisiologia della cellula: ma come svolge questa funzione? Beadle e Tatum (1941): studiando mutanti della comune
DettagliLa genetica molecolare
La genetica molecolare 1 Il materiale genetico Varia di quantità da specie a specie. Regola lo sviluppo della cellula. Ha la capacità di duplicarsi. Nome comune Numero di coppie di cromosomi zanzara 3
DettagliGli Acidi Nucleici DNA RNA
Gli Acidi Nucleici DNA RNA Gli Acidi nucleici Gli acidi nucleici sono il: DNA (acido desossiribonucleico) RNA (acido ribonucleico) Essi sono formati dai polimeri (molecole molto grosse) i cui monomeri
DettagliNext-generation sequencing, annotazione, ed espressione genica. Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi.
Next-generation sequencing, annotazione, ed espressione genica Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi.it Il primo passo... Abbiamo la sequenza completa del DNA di un organismo:
DettagliGENE. Fattore trasformante? Riproduzione del ceppo S. Preparazione del fattore trasformante. Trasformazione del ceppo R. ceppo S. deceduto.
ceppo S 1 Griffith and Avery 1930 deceduto ceppo R 2 vivo ceppo S ucciso al calore 3 ceppo R 4 vivo ceppo S ucciso al calore deceduto Riproduzione del ceppo S Preparazione del fattore trasformante lisi
DettagliBiologia Molecolare. CDLM in CTF La riparazione del DNA
Biologia Molecolare CDLM in CTF 2010-2011 La riparazione del DNA I tipi di mutazione e le conseguenze Le classi di danno al DNA Meccanismi di riparazione La necessità di codificare l informazione L informazione
DettagliTRASCRIZIONE DEL DNA. Formazione mrna
TRASCRIZIONE DEL DNA Formazione mrna Trascrizione Processo mediante il quale l informazione contenuta in una sequenza di DNA (gene) viene copiata in una sequenza complementare di RNA dall enzima RNA polimerasi
DettagliProvate rispondere alle domande, se ci riuscirete, sarete pronti a superare l esame per quanto riguarda la parte di bioinformatica.
Per aiutarvi ho elaborato (frettolosamente) questi quesiti che dovrebbero aiutarvi ad individuare gli argomenti importanti del corso ed a darvi un idea delle domande che potrebbero esservi poste all esame.
DettagliLE BASI AZOTATE PIRIMIDINE PURINE
LE BASI AZTATE PURIE PIRIMIDIE Le basi azotate sono composti eterociclici aromatici con azoti portanti doppietti basici. Possono avere un solo anello (pirimidine) o due (purine). Le basi adenina, guanina
DettagliDNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi.
DNA - RNA Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Esistono 4 basi azotate per il DNA e 4 per RNA Differenze
DettagliCodice Genetico (segue) 04/11/2015. «Wobble base pairs» (appaiamento tentennante di basi) CODICE GENETICO
«Wobble base pairs» (appaiamento tentennante di basi) CODICE GENETICO http://www.atdbio.com/img/articles/rna wobble base pairs large.png CODICE GENETICO Codice mediante il quale la sequenza nucleotidica
DettagliIl DNA conserva l informazione genetica
Il DNA conserva l informazione genetica Gli esperimenti di Frederick Griffith (1928) Gli esperimenti di Oswald Avery (1944) + Estratti dal ceppo IIIS ucciso al calore di Polisaccaridi Lipidi Proteine Acidi
DettagliIntroduzione alla biologia della cellula. Lezione 3 Le biomolecole DNA e RNA
Introduzione alla biologia della cellula Lezione 3 Le biomolecole DNA e RNA Acidi nucleici DNA (acido desossiribonucleico) RNA (acido ribonucleico) Sono polimeri di monomeri detti NUCLEOTIDI Un nucleotide
DettagliL ACQUA E LE SUE PROPRIETÀ
L ACQUA E LE SUE PROPRIETÀ L acqua è una sostanza indispensabile per tutte le forme di vita. Ogni molecola di acqua (H2O) è formata da due atomi di idrogeno e un atomo di ossigeno, uniti tramite due legami
DettagliDNA DNA DNA Legge di complementarietà delle basi Se in un filamento è presente una T nell altro filamento deve essere presente una A. Se è presente una C nell altro ci dovrà essere una G. E possibile
DettagliSINTESI E MATURAZIONE DEGLI RNA CELLULARI
SINTESI E MATURAZIONE DEGLI RNA CELLULARI PER TRASCRIZIONE SI INTENDE LA SINTESI DI UNA MOLECOLA DI RNA COMPLEMENTARE AD UNO STAMPO DI DNA. GLI RNA CELLULARI SONO DISTINTI IN TRE PRINCIPALI CATEGORIE:
DettagliSINTESI E MATURAZIONE DEGLI RNA CELLULARI
SINTESI E MATURAZIONE DEGLI RNA CELLULARI PER TRASCRIZIONE SI INTENDE LA SINTESI DI UNA MOLECOLA DI RNA COMPLEMENTARE AD UNO STAMPO DI DNA. GLI RNA CELLULARI SONO DISTINTI IN TRE PRINCIPALI CATEGORIE:
Dettagli2. DUPLICAZIONE DNA. 1. COMPOSIZIONE e STRUTTURA 3. CROMOSOMI
2. DUPLICAZIONE DNA 1. COMPOSIZIONE e STRUTTURA 3. CROMOSOMI 1 1. COMPOSIZIONE e STRUTTURA Ma che cos è il DNA? è un contenitore di informazioni... scritte come sequenza di basi azotate 2 Acidi Nucleici:
DettagliLe molecole di RNA possono assumere particolari strutture che conferiscono loro particolari funzioni.
Traduzione: t-rna Le molecole di RNA possono assumere particolari strutture che conferiscono loro particolari funzioni. Singola catena alta flessibilità ripiegamento su stessa legami deboli con se stessa
DettagliLezione 1. Le molecole di base che costituiscono la vita
Lezione 1 Le molecole di base che costituiscono la vita Le molecole dell ereditarietà 5 3 L informazione ereditaria di tutti gli organismi viventi, con l eccezione di alcuni virus, è a carico della molecola
DettagliModulo Laboratorio A.A. 2014/2015
Biochimica - Laboratorio di Bioinformatica I (CdL. Bioinformatica) Bioinformatica e banche dati biologiche (CdL. Biotecnologie) Modulo Laboratorio A.A. 2014/2015 Docente: Dr. Sergio Marin Vargas Mail:
DettagliLA TRASCRIZIONE NEGLI EUCARIOTI
LA TRASCRIZIONE NEGLI EUCARIOTI NEGLI EUCARIOTI TRASCRIZIONE E TRADUZIONE SONO DUE EVENTI SEPARATI CHE AVVENGONO IN DUE DIVERSI COMPARTIMENTI CELLULARI: NUCLEO E CITOPLASMA. INOLTRE, A DIFFERENZA DEI
DettagliLA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri
LA GENETICA DNA e RNA Prof. Daniele Verri L'acido desossiribonucleico o deossiribonucleico (DNA) è un acido nucleico che contiene le informazioni necessarie per la formazione di RNA e proteine. LA GENETICA:
DettagliAcidi Nucleici: DNA = acido deossiribonucleico
Acidi Nucleici: DNA = acido deossiribonucleico depositario dell informazione genetica RNA: acido ribonucleico trascrizione e traduzione dell informazione genetica dogma centrale della biologia molecolare
DettagliIl DNA: istruzioni per la vita Bibliografia I colori della Biologia Gatti- Giusti- Anelli Ed. Pearson
Il DNA: istruzioni per la vita Bibliografia I colori della Biologia Gatti- Giusti- Anelli Ed. Pearson Una divisione equa Quando una cellula si divide, si formano due nuove cellule che contengono esattamente
DettagliIL MATERIALE EREDITARIO. Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene
IL MATERIALE EREDITARIO Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene Caratteristiche del materiale ereditario 1 Replicarsi accuratamente durante crescita e divisione
DettagliElementi di Bioinformatica. Genomica. Introduzione
Corso di Elementi di Bioinformatica Ingegneria Biomedica AA 2013-14 Elementi di Bioinformatica Genomica Introduzione Genomica Genomica (genomics) Riguarda lo studio del genoma degli organismi viventi e,
DettagliSDD Seconde Gli acidi nucleici. Gli acidi nucleici
1 Capire come le informazioni genetiche sono immagazzinate nelle cellule e come avviene la trasformazione di queste informazioni nei meccanismi metabolici delle cellule. Quattro mattoncini La cellula ha
DettagliLA TRASCRIZIONE. Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene
LA TRASCRIZIONE Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene GLI ACIDI RIBONUCLEICI Nelle cellule nucleate la sintesi proteica avviene nel citoplasma, mentre il DNA si
DettagliNucleotidi e Acidi Nucleici. Struttura di DNA e RNA
Nucleotidi e Acidi Nucleici Nucleosidi Nucleotidi Funzioni biologiche dei nucleotidi Struttura di DNA e RNA Concatenazione e appaiamento dei nucleotidi Lo scheletro degli acidi nucleici Componenti degli
DettagliModello computazionale per la predizione di siti di legame per fattori di trascrizione
Modello computazionale per la predizione di siti di legame per fattori di trascrizione Attività di tirocinio svolto presso il Telethon Institute of Genetics and Medicine Relatori Prof. Giuseppe Trautteur
DettagliACIDI NUCLEICI ESPERIMENTI
ACIDI NUCLEICI ESPERIMENTI 1869 FRIEDRICK MIESCHER Isolò per la prima volta una sostanza zuccherina leggermente acida contenente fosforo Questa sostanza venne chiamata: acido nucleico perché scoperta nel
DettagliStruttura e funzione dei geni. Paolo Edomi - Genetica
Struttura e funzione dei geni 1 Il DNA è il materiale genetico La molecola di DNA conserva l informazione genetica: topi iniettati con solo DNA di batteri virulenti muoiono 2 Proprietà del DNA Il DNA presenta
DettagliCorso di Biologia Molecolare
Corso di Biologia Molecolare Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Acidi nucleici Il ruolo degli acidi nucleici è quello di custodire e trasmettere
DettagliRisposta: 2. Uracile. Risposta: 2. legami idrogeno. Adenina, Citosina e Guanina si trovano sia nell RNA che nel DNA.
Risposta: 2. Uracile Adenina, Citosina e Guanina si trovano sia nell RNA che nel DNA. La Timina si trova soltanto nel DNA; l Uracile si sostituisce alla Timina nelle molecole dell RNA. Risposta: 2. legami
DettagliIL GENOMA DELLA CELLULA VEGETALE
IL GENOMA DELLA CELLULA VEGETALE I GENOMI DELLE CELLULE VEGETALI Genoma nucleare Geni per il funzionamento globale della cellula vegetale Condivisi o specifici per la cellula vegetale Genoma plastidiale
DettagliIl dogma centrale della biologia. molecolare
Il dogma centrale della biologia Cell molecolare Transcription Translation Ribosome DNA mrna Polypeptide (protein) L informazione per la sintesi delle proteine è contenuta nel DNA. La trascrizione e la
DettagliIntroduzione al corso di bioinformatica e analisi dei genomi AA 2015-2016. Docente: Silvia Fuselli fss@unife.it
Introduzione al corso di bioinformatica e analisi dei genomi AA 2015-2016 Docente: Silvia Fuselli fss@unife.it Possibili testi di riferimento Introduction to Genomics, A.M. Lesk, Oxford Capitoli 1, 3,
DettagliIL CODICE GENETICO E I CARATTERI EREDITARI
IL CODICE GENETICO E I CARATTERI EREDITARI Il DNA porta le informazioni genetiche scritte nella sequenza di basi. Qualunque sequenza è possibile. Il DNA virus più semplici: 5000 basi appaiate; 46 cromosomi
DettagliSTRUTTURE DEGLI ACIDI NUCLEICI, CODICE GENETICO E REPLICAZIONE DEL DNA
IL LABORATORIO DI BIOLOGIA MOLECOLARE: Introduzione alle tecniche e alle loro applicazioni STRUTTURE DEGLI ACIDI NUCLEICI, Il DNA nell arte: Susan Rankaitis 2002, DNA2 CODICE GENETICO E REPLICAZIONE DEL
DettagliACIDI GRASSI INSATURI
LIPIDI ACIDI GRASSI SATURI ACIDI GRASSI INSATURI TRIGLICERIDI TRIGLICERIDI Grassi neutri o lipidi semplici glicerolo + 1 acido grasso monogliceride glicerolo + 2 acidi grassi digliceride glicerolo + 3
Dettaglilati esterni altamente Idrofilici
I due filamenti complementari del DNA sono antiparalleli: uno è in direzione 5-3 e l altro in direzione 3-5. parte interna idrofobica lati esterni altamente Idrofilici APPAIAMENTO DELLE BASI AZOTATE: 2
DettagliRelazione DNA. Giulia Carbonara classe 3 A
Giulia Carbonara classe 3 A Relazione DNA Il DNA (la sigla dell'acido desossiribonucleico ) è una macromolecola biologica sede delle informazioni genetiche e dell'unicità di un organismo che appartiene
DettagliGenomi dei procarioti
Genomi dei procarioti Una molecola circolare di DNA E.coli circa 4 x 10 6 coppie di basi Il genoma è quasi tutto codificante Viene trascritto in mrna policistronici Il genoma eucariotico Il genoma eucariotico
DettagliRiarrangiamento genico
Riarrangiamento genico 1 3 quesiti per la comprensione Ø l esistenza nello stesso anticorpo di una parte variabile ed una costante; Ø l esistenza della enorme variabilità (diversità) del sito combinatorio;
DettagliNel codice genetico, una tripletta di nucleotidi codifica per un aminoacido
Il codice genetico: Come triplette dei quattro nucleotidi specificano 20 aminoacidi, rendendo possibile la traduzione dell informazione da catena nucleotidica a sequenza di aminoacidi. Come le mutazioni
DettagliConcetti Biologici basilari Per approfondire (in inglese)
Le prossime lezioni saranno incentrate sulla struttura delle principali macromolecole della cellula (DNA, RNA e proteine) e sul processo di traduzione della sequenza di DNA in proteine. Lo scopo è quello
DettagliSequenze nucleotidiche del DNA definite loci costituiscono i geni. Ogni gene codifica per una specifica proteina
sintesi proteica La sintesi proteica è il processo che porta alla formazione delle proteine da sequenze del DN definite geni. Si tratta di un processo a più fasi Nelle sue linee fondamentali questo processo
DettagliAcidi nucleici ed informazione genetica
cidi nucleici ed informazione genetica Flavia Frabetti ecnici di laboratorio 2010/2011 IDI NULEII DN acido desossiribonucleico RN acido ribonucleico nel DN sono codificate le istruzioni che programmano
Dettagli1) Un gene-un enzima 2) Un gene- una catena polipeptidica
1) Un gene-un enzima 2) Un gene- una catena polipeptidica 3) Un gene è una unità funzionale di DNA che codifica per la sequenza amminoacidica di uno o più polipeptidi o alternativamente per uno o più tipi
DettagliIl DNA, acido desossiribonucleico, è la molecola che
Il DNA, acido desossiribonucleico, è la molecola che contiene le informazioni necessarie per il funzionamento di ogni essere vivente: le informazioni genetiche, che ciascuno di noi eredita dai propri genitori.
DettagliGli acidi nucleici, DNA (acido deossiribonucleico) e RNA (acido. ribonucleico), sono polimeri biologicamente importanti in quanto
Gli acidi nucleici, DA (acido deossiribonucleico) e RA (acido ribonucleico), sono polimeri biologicamente importanti in quanto svolgono ruoli fondamentali nell ereditarietà e nella sintesi proteica. Sono
DettagliI MOTORI DELL EVOLUZIONE PT2. POMERIGGIO DI AGGIORNAMENTO PROF. M.A. ZORDAN, Ph.D UNIVERSITÀ DEGLI STUDI DI PADOVA
I MOTORI DELL EVOLUZIONE PT2 POMERIGGIO DI AGGIORNAMENTO 23.03.2011 PROF. M.A. ZORDAN, Ph.D UNIVERSITÀ DEGLI STUDI DI PADOVA 1 IL MATERIALE GENETICO 2 2 Per svolgere il proprio ruolo, il materiale genetico
DettagliContenuto di DNA aploide in alcune specie
Contenuto di DNA aploide in alcune specie 1-10 2 kb 10 3 kb 10 4 kb 10 5-10 8 kb Dimensioni del genoma Paradosso del valore C Non c è una correlazione tra la quantità di DNA e la complessità di un organismo
DettagliLaboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA
Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Bioinformatica - Scienza interdisciplinare coinvolgente la biologia, l informatica, la matematica e la statistica per l
DettagliGenomica, proteomica, genomica strutturale, banche dati.
Genomica, proteomica, genomica strutturale, banche dati. Alcune pietre miliari della biologia anno risultato 1866 Mendel scopre i geni 1944 il DNA è il materiale genetico 1951 prima sequenza di una proteina
DettagliRegolazione dell espressione genica
Regolazione dell espressione genica definizioni Gene attivato quando viene trascritto in RNA e il suo messaggio tradotto in molecole proteiche specifiche Espressione genica processo complessivo con cui
DettagliCorso di Genetica -Lezione 12- Cenci
Corso di Genetica -Lezione 12- Cenci Il codice genetico: Come triplette dei quattro nucleotidi specificano 20 aminoacidi, rendendo possibile la traduzione dell informazione da catena nucleotidica a sequenza
DettagliCodice Genetico (segue) 29/10/2014 CODICE GENETICO
CODICE GENETICO Codice mediante il quale la sequenza nucleotidica di una molecola di DNA o di RNA specifica la sequenza amminoacidica di un polipeptide. CODICE GENETICO Consiste di codoni a tre nucleotidi
DettagliBIOLOGIA BIOCHIMICA Il codice genetico
REPUBBLICA ITALIANA ISTITUTO COMPRENSIVO DI SCUOLA PRIMARIA E SECONDARIA DI PRIMIERO Via delle Fonti 10, 38054, località Transacqua, Primiero San Martino di Castrozza, (TN) Tel. 0439 62435 Fax 0439 762466
DettagliEspressione ed utilizzo della informazione genetica II Trascrizione e Traduzione
Espressione ed utilizzo della informazione genetica II Trascrizione e Traduzione CdL Tecnici di Lab Biomedico AA. 2011-12 - Prof.ssa Frabetti Come si esprime l informazione? Per i geni classici vedremo:
DettagliDNA. simile ad una scala a chiocciola. I pioli della scala corrispondono
DNA Il DNA o acido desossiribonucleico è una grossa molecola chimica contenuta nel nucleo della cellula. Il DNA può essere paragonato ad un importante libro delle istruzioni che contiene l informazione
DettagliProgetto Tandem Biologia saperi minimi Anno accademico Marzo 2012 COGNOME...
Progetto Tandem Biologia saperi minimi Anno accademico 2011-2012 2 Marzo 2012 COGNOME... NOME 1) Quali delle seguenti affermazioni sulla struttura primaria delle proteine è falsa? a) può essere ramificata
Dettaglimrna + 20 aminoacidi In vitro nulla
La sintesi proteica mrna + 20 aminoacidi In vitro nulla Il codice genetico I geni controllano la struttura delle proteine: in che modo? 4 nucleotidi A, T, C, G 20 aminoacidi Esiste un codice che converte
DettagliMalattie genetiche. Dott. Giovanni LONGO
Malattie genetiche Dott. Giovanni LONGO Il ruolo della ricerca scientifica Esistono una quantità quasi infinita di rimedi o cure contro un'altrettanta quantità di malattie. La ricerca scientifica si occupa
DettagliBanche Dati. Docente: Dr. Antinisca DI MARCO
Docente: Dr. Antinisca DI MARCO Email: antinisca.dimarco@di.univaq.it La biologia molecolare produce una grande mole di dati che può essere memorizzata in database general-purpose o specialized (es. immunological):
DettagliDott.ssa Renata Tisi. Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it
Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Il ruolo degli acidi nucleici è quello di custodire e trasmettere l informazione genetica nelle cellule,
DettagliSommario. Presentazione dell opera Ringraziamenti
Sommario Presentazione dell opera Ringraziamenti XI XII Capitolo 1 Introduzione alla bioinformatica 1 1.1 Cenni introduttivi 1 1.2 Pietre miliari della bioinformatica 2 1.3 Infrastrutture bioinformatiche
DettagliBioinformatica. Marin Vargas, Sergio Paul
Bioinformatica Marin Vargas, Sergio Paul 2013 Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici. La bioinformatica
DettagliGENOMICA STRUTTURALE: GENOMICA FUNZIONALE:
GENOMICA STRUTTURALE: GENOMICA FUNZIONALE: 1. Anatomia dei genomi 8. Funzionamento dei genomi Il genoma dei procarioti Modificazioni della cromatina e l espressione del Il genoma degli eucarioti genoma
DettagliIl flusso e la regolazione dell informazione genica. Lezione nr. 8 Psicobiologia
Il flusso e la regolazione dell informazione genica Lezione nr. 8 Psicobiologia L informazione che viene trascritta non riguarda tutto il DNA ma solo delle particolari sequenze definite GENI. Tipologie
DettagliBasi Teoriche e Applicazioni delle Nuove Tecnologie Genomiche
Corsi di laurea magistrale in: Biotecnologie agrarie e ambientali (LM-7) Biologia cellulare e molecolare (LM-6) Sicurezza e qualitàagroalimentare (LM-69 & LM-70) insegnamento di Basi Teoriche e Applicazioni
DettagliCodice genetico CODICE GENETICO [1]
Codice genetico CODICE GENETICO [1] Codice mediante il quale la sequenza nucleotidica di una molecola di DNA, tramite un mrna, specifica la sequenza amminoacidica di un polipeptide. Consiste di codoni
Dettagliwww.fisiokinesiterapia.biz TRASCRIZIONE
www.fisiokinesiterapia.biz TRASCRIZIONE TRASCRIZIONE Processo mediante il quale una sequenza di DNA (un gene) viene copiata in una sequenza di RNA Dalla trascrizione derivano gli mrna, che verranno tradotti
DettagliProf.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine
Prof.ssa Gamba Sabrina Lezione 7: IL DNA Duplicazione e sintesi delle proteine concetti chiave della lezione Costituzione fisico-chimica del DNA Basi azotate Duplicazione Concetto di geni Rna Trascrizione
Dettagli02/12/2014. Tutti gli esseri viventi sono composti da cellule LA CELLULA E L UNITA STRUTTURALE E FUNZIONALE DEGLI ORGANISMI VIVENTI
Tutti gli esseri viventi sono composti da cellule Eubatteri Procarioti unicellulari Archebatteri LA CELLULA E L UNITA STRUTTURALE E FUNZIONALE DEGLI ORGANISMI VIVENTI -Autoconservazione mantenimento della
DettagliGli acidi nucleici sono eteropolimeri lineari costituiti da subunità nucleotidiche (monomeri).
Gli acidi nucleici sono eteropolimeri lineari costituiti da subunità nucleotidiche (monomeri). Un nucleotide è formato da: uno zucchero: (Ribosio o Deossiribosio), a 5 atomi di carbonio in forma ciclica
DettagliDal DNA alle proteine: La trascrizione e la traduzione
Dal DNA alle proteine: La trascrizione e la traduzione DNA RNA Trascrizione RNA PROTEINE Traduzione Dove avvengono? GLI EUCARIOTI I PROCARIOTI Cambell, Reece Biologia ZANICHELLI Trascrizione Sintesi di
Dettagli