Laboratorio di Elementi di Bioinformatica

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Laboratorio di Elementi di Bioinformatica"

Transcript

1 Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2016/2017 I dati in Bioinformatica Docente del laboratorio: Raffaella Rizzi 1

2 Il DNA (oggetto biologico) Il DNA è una catena polinucleotidica. Il mattoncino che compone una catena di DNA prende il nome di nucleotide. D b P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata

3 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D b P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi:

4 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D A P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A)

5 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D G P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G)

6 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D C P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C)

7 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D T P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C) - timina (T)

8 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D T P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) purine - guanina (G) - citosina (C) - timina (T)

9 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) D T P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C) pirimidine - timina (T)

10 Il DNA (oggetto biologico) Il nucleotide ( mattoncino del DNA) direzione T D 5 P D: zucchero pentoso è deossiribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C) - timina (T)

11 Il DNA (oggetto biologico) D T P D A Legame fosfodiesterico è legame tra D e P P D C P

12 Il DNA (oggetto biologico) 3 D T La sequenza delle basi azotate elencate dal 5 al 3 fornisce la sequenza primaria della molecola di DNA P D A Nell esempio della figura la sequenza primaria è quindi CAT (e non TAC) P D C 5 P

13 Il DNA (oggetto biologico) 3 D T La sequenza delle basi azotate elencate dal 5 al 3 fornisce la sequenza primaria della molecola di DNA P D A Nell esempio della figura la sequenza primaria è quindi CAT (e non TAC) P nucleotide coincide con base azotata D C 5 P

14 Il DNA genomico Il DNA genomico (genoma) è la lunga molecola di DNA che contiene le informazioni che regolano la vita di un organismo vivente: è contenuto nel nucleo di tutte le cellule dell organismo è una doppia catena avvolta ad elica è suddiviso in cromosomi

15 Il DNA genomico Il DNA genomico (genoma) è la lunga molecola di DNA che contiene le informazioni che regolano la vita di un organismo vivente: è contenuto nel nucleo di tutte le cellule dell organismo è una doppia catena avvolta ad elica è suddiviso in cromosomi Genoma umano (3,2 miliardi di basi): 22 coppie di autosomi (chr1, chr2,, chr22) cromosomi X e Y (XX=femmina, XY=maschio) il cromosoma 1 è il più lungo (circa 245 milioni di basi)

16 Il DNA genomico P 5 3 D T A D P P D A T D P P D C G D 3 5 P

17 Il DNA genomico A è complementare a T à due legami idrogeno C è complementare a G à tre legami idrogeno P 5 3 D T A D P P D A T D P P D C G D 3 5 P

18 Il DNA genomico 3 D T A D P 5 strand (reverse) P P D A T D P P strand + (forward) 5 P D C G D 3

19 Il DNA genomico 3 D T A D P 5 strand (reverse) P P D A T D P P Catena forward è CAT D strand + (forward) 5 P C G D 3

20 Il DNA genomico 3 P D T A D P P 5 strand (reverse) Catena reverse è ATG D A T D P P Catena forward è CAT D strand + (forward) 5 P C G D 3

21 Il DNA (dato informatico) La sequenza primaria di un catena di DNA è dunque rappresentata da una stringa di simboli appartenenti all alfabeto Σ={A,C,G,T}

22 Il DNA (dato informatico) La sequenza primaria di un catena di DNA è dunque rappresentata da una stringa di simboli appartenenti all alfabeto Σ={A,C,G,T} La lunghezza di una sequenza di DNA si misura in base pair (bp). Quindi una sequenza lunga 1000bp è composta da 1000 basi.

23 Il DNA (dato informatico) Operazione fondamentale à Reverse&Complement per ottenere, data la sequenza primaria di una catena di DNA, la sequenza primaria della sua catena appaiata: si trasforma ogni singola base nella sua complementare: A in T (e viceversa), C in G (e viceversa) si inverte la sequenza ottenuta

24 Il DNA (dato informatico) Esempio di Reverse&Complement: A C G T A G

25 Il DNA (dato informatico) Esempio di Reverse&Complement: A C G T A G complement T G C A T C

26 Il DNA (dato informatico) Esempio di Reverse&Complement: A C G T A G complement T G C A T C reverse C T A C G T

27 L RNA (oggetto biologico) Il nucleotide (il mattoncino dell RNA) R b P D: zucchero pentoso è ribosio P: gruppo fosfato b: base azotata di quattro tipi: - adenina (A) - guanina (G) - citosina (C) - uracile (U) uracile al posto della timina

28 L RNA (dato informatico) La sequenza primaria di un catena di RNA è rappresentata tramite una stringa simboli appartenenti all alfabeto Σ={A,C,G,U} L RNA si trova in catene singole

29 Le proteine Una proteina è una catena di aminoacidi e la sua sequenza primaria è rappresentata da una stringa definita su un alfabeto di 20 simboli (20 sono gli aminoacidi presenti in natura). Glu Ile Phe Thr Val His

30 Il sequenziamento Sequenziare significa determinare la sequenza primaria delle molecole biologiche (DNA/RNA e proteine) è sequenza delle basi {A,C,G,T U} per DNA e RNA è sequenza degli aminoacidi per le proteine

31 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola biologica? è single-end read DNA/RNA GTTGTGCAGTGACGGA

32 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair insertion size DNA/RNA A B

33 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair insertion size DNA/RNA A B A = B

34 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair insertion size DNA/RNA A B A = B

35 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair insertion size DNA/RNA A B Output è + insertion size A = B

36 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair F R insertion size DNA/RNA agttgcgt A aatgcctg B Output è agttgcgt gtccgtaa Insertion size <= 1000 bp A = B

37 Il sequenziamento Cosa si ottiene dal sequenziamento di una molecola di DNA/RNA è paired-end read è mate-pair R F insertion size DNA/RNA agttgcgt A aatgcctg B Output è tgcgttga aatgcctg Insertion size <= bp A = B

38 Il sequenziamento Attenzione agli errori di sequenziamento!!! Le stringhe che rappresentano la sequenza primaria di DNA e RNA sono in realtà definite su di un alfabeto esteso che prende il nome di IUPAC code

39 IUPAC code per DNA SIMBOLO DESCRIZIONE A Adenine C Cytosine G Guanine T Thymine R Purine (A or G) Y Pyrimidine (C or T) M C or A K T, or G W T, or A S C or G B C, T or G (not A) D A, T or G (not C) H A, T or C (not G) V A, C or G (not T) N any base (A, C, G, T)

40 IUPAC code per RNA SIMBOLO DESCRIZIONE A Adenine C Cytosine G Guanine U Uracil R Purine (A or G) Y Pyrimidine (C or U) M C or A K U or G W U or A S C or G B C, U or G (not A) D A, U or G (not C) H A, U or C (not G) V A, C or G (not U) N any base (A, C, G or U)

41 Sanger VS Next-Generation Sequencing (NGS) Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costosi (attorno al milione di dollari per sequenziare il genoma umano) ð Processano tanti reads in un run (milioni) (copertura da 10 a 100 volte superiore quella Sanger) ð Reads relativamente corti ð Qualità relativamente bassa

42 Cos è un gene? Un gene è una regione (locus) del DNA genomico che codifica una proteina.

43 Cos è un gene? Un gene è una regione (locus) del DNA genomico che codifica una proteina. Un gene viene identificato tramite il suo HUGO NAME (

44 Cos è un gene? Un gene è una regione (locus) del DNA genomico che codifica una proteina. Un gene viene identificato tramite il suo HUGO NAME ( Esempio di HUGO NAME: ATP6AP1 (ATPase, H+ transporting, lysosomal accessory protein 1)

45 Cos è un gene? La sequenza primaria del locus di DNA di un gene prende il nome di sequenza genomica.

46 Cos è un gene? La sequenza primaria del locus di DNA di un gene prende il nome di sequenza genomica. Sequenza genomica è un termine generale per indicare la sequenza di una qualsiasi regione di DNA genomico Una sequenza genomica è dunque in Bioinformatica una sottostringa della sequenza primaria del DNA genomico

47 Sequenza genomica In genere una sequenza genomica viene memorizzata in formato FASTA che è: un formato di puro testo nato come formato di input del software di allineamento FASTA pensato per memorizzare sequenze nucleotidiche (DNA e RNA) e qualche informazione aggiuntiva diventato un formato standard di input di molti tools di analisi di sequenze Il nome di un file in formato FASTA ha estensione fa oppure fasta

48 Formato FASTA (esempio) >X dna:chromosome chromosome:grch38:x: : :1 GGGGGCAACGGTCACCTGATCTGCGGCTGTCGAGGCCGCTGAGGCAGTGGAGGCTGAGGC TATGATGGCGGCCATGGCGACGGCTCGAGTGCGGATGGGGCCGCGGTGCGCCCAGGCGCT CTGGCGCATGCCGTGGCTGCCGGTGTTTTTGTCGTTGGCGGCGGCGGCGGCGGCGGCAGC GGCGGAGCAGCAGGTCCCGCTGGTGCTGTGGTCGAGTGACCGGTGAGCGGGCCGGGGTGG GATGCGCTGTGGCGGCTGAGGCGCCCTCGCCCGACTCCGGCGCTGTCCTAGGCGAGGGGT GGTGAGGCCCGGAGGTGGACTGTTCCTTGCTCGGGGGCTCGCAGCGAATCTGCCGGCGAC AGAGCTCCAGTCCACATGCGCCCCCGTCTGACAGCACCTCTTCTGTGCCCTGCCAGGGAC TTGTGGGCTCCTGCGGCCGACACTCATGAAGGCCACATCACCAGCGACTTGCAGCTCTCT ACCTACTTAGATCCCGCCCTGGAGCTGGGTCCCAGGAATGTGCTGCTGTTCCTGCAGGAC AAGGTGCGCCCGCCCCAGCCCACTCTCCCCCGGTCATCGGGAGGCAGCCAGGCCCCCTCC CCCCATGACACTGACGCCCATTCCCCAAGGGAAGCTTCAGTGACCTTGTCCCAACTGTAG GGAGGTGTGGGTCGTCTCATGGGAAGGCCTGTAGTAAACGCTTCAGTGGGCATGGCGACA GCCTCGGAAATGGCACCAACTTGATTGGAGGAAGCGACGGACCAGAGGCCAGGTACCTAC TGAGTACCAAGCACTTTGGATATCTGACTTAGTCCAATATGGTGGGTGGGGATTATCGTC [ ]

49 Formato FASTA (esempio) >X dna:chromosome chromosome:grch38:x: : :1 GGGGGCAACGGTCACCTGATCTGCGGCTGTCGAGGCCGCTGAGGCAGTGGAGGCTGAGGC TATGATGGCGGCCATGGCGACGGCTCGAGTGCGGATGGGGCCGCGGTGCGCCCAGGCGCT CTGGCGCATGCCGTGGCTGCCGGTGTTTTTGTCGTTGGCGGCGGCGGCGGCGGCGGCAGC Header FASTA à il primo simbolo deve essere > GGCGGAGCAGCAGGTCCCGCTGGTGCTGTGGTCGAGTGACCGGTGAGCGGGCCGGGGTGG GATGCGCTGTGGCGGCTGAGGCGCCCTCGCCCGACTCCGGCGCTGTCCTAGGCGAGGGGT GGTGAGGCCCGGAGGTGGACTGTTCCTTGCTCGGGGGCTCGCAGCGAATCTGCCGGCGAC AGAGCTCCAGTCCACATGCGCCCCCGTCTGACAGCACCTCTTCTGTGCCCTGCCAGGGAC TTGTGGGCTCCTGCGGCCGACACTCATGAAGGCCACATCACCAGCGACTTGCAGCTCTCT ACCTACTTAGATCCCGCCCTGGAGCTGGGTCCCAGGAATGTGCTGCTGTTCCTGCAGGAC AAGGTGCGCCCGCCCCAGCCCACTCTCCCCCGGTCATCGGGAGGCAGCCAGGCCCCCTCC CCCCATGACACTGACGCCCATTCCCCAAGGGAAGCTTCAGTGACCTTGTCCCAACTGTAG GGAGGTGTGGGTCGTCTCATGGGAAGGCCTGTAGTAAACGCTTCAGTGGGCATGGCGACA GCCTCGGAAATGGCACCAACTTGATTGGAGGAAGCGACGGACCAGAGGCCAGGTACCTAC TGAGTACCAAGCACTTTGGATATCTGACTTAGTCCAATATGGTGGGTGGGGATTATCGTC [ ]

50 Formato FASTA (esempio) >X dna:chromosome chromosome:grch38:x: : :1 GGGGGCAACGGTCACCTGATCTGCGGCTGTCGAGGCCGCTGAGGCAGTGGAGGCTGAGGC TATGATGGCGGCCATGGCGACGGCTCGAGTGCGGATGGGGCCGCGGTGCGCCCAGGCGCT CTGGCGCATGCCGTGGCTGCCGGTGTTTTTGTCGTTGGCGGCGGCGGCGGCGGCGGCAGC GGCGGAGCAGCAGGTCCCGCTGGTGCTGTGGTCGAGTGACCGGTGAGCGGGCCGGGGTGG GATGCGCTGTGGCGGCTGAGGCGCCCTCGCCCGACTCCGGCGCTGTCCTAGGCGAGGGGT GGTGAGGCCCGGAGGTGGACTGTTCCTTGCTCGGGGGCTCGCAGCGAATCTGCCGGCGAC AGAGCTCCAGTCCACATGCGCCCCCGTCTGACAGCACCTCTTCTGTGCCCTGCCAGGGAC La sequenza viene di solito spezzata in parti di 60/80 caratteri TTGTGGGCTCCTGCGGCCGACACTCATGAAGGCCACATCACCAGCGACTTGCAGCTCTCT ACCTACTTAGATCCCGCCCTGGAGCTGGGTCCCAGGAATGTGCTGCTGTTCCTGCAGGAC AAGGTGCGCCCGCCCCAGCCCACTCTCCCCCGGTCATCGGGAGGCAGCCAGGCCCCCTCC CCCCATGACACTGACGCCCATTCCCCAAGGGAAGCTTCAGTGACCTTGTCCCAACTGTAG GGAGGTGTGGGTCGTCTCATGGGAAGGCCTGTAGTAAACGCTTCAGTGGGCATGGCGACA GCCTCGGAAATGGCACCAACTTGATTGGAGGAAGCGACGGACCAGAGGCCAGGTACCTAC TGAGTACCAAGCACTTTGGATATCTGACTTAGTCCAATATGGTGGGTGGGGATTATCGTC [ ]

51 Cos è un gene? Entrambe le catene del DNA genomico contengono geni. 5 strand + (forward) 3 3 strand - (reverse) 5

52 Cos è un gene? Entrambe le catene del DNA genomico contengono geni. 5 strand + (forward) 3 3 strand - (reverse) 5 Genoma umano è circa geni codificanti Tutte le cellule di un organismo contengono l intero set di geni dell organismo

53 Espressione di un gene locus genico

54 Espressione di un gene locus genico 5 3

55 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 Esone = regione codificante Introne = regione non-codificante

56 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon splice site (confine esone-introne) 3 splice site (confine introne-esone) Esone = regione codificante Introne = regione non-codificante

57 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3

58 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3 Il pre-mrna è la copia della sequenza di DNA genomico con la sostituzione di T con U

59 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3 SPLICING mrna exon 1 exon 2 exon 3 trascritto

60 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3 SPLICING mrna trascritto coding sequence (CDS) AUG [stop] [stop] start codon stop codon UAG UAA UGA

61 Espressione di un gene locus genico 5 exon 1 intron1 exon 2 intron2 exon 3 3 TRASCRIZIONE (in un RNA) pre-mrna 5 exon 1 intron1 exon 2 intron2 exon 3 3 SPLICING mrna trascritto coding sequence (CDS) AUG [stop] [stop] 5 UTR 3 UTR UAG UAA UGA

62 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG La CDS viene suddivisa in triplette (codoni) e ogni codone viene mappato a un aminoacido attraverso il codice genetico. Codice genetico da Wikipedia

63 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Proteina: Met Codice genetico da Wikipedia

64 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Proteina: Met Pro Codice genetico da Wikipedia

65 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Proteina: Met Pro Ser Codice genetico da Wikipedia

66 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Proteina: Met Pro Ser Asp Codice genetico da Wikipedia

67 Espressione di un gene mrna trascritto coding sequence (CDS) AUGCCAAGCGAUUAG Met Pro Ser Asp [stop] Codice genetico da Wikipedia

68 Pattern di un introne 5 exon 1 exon 2 exon 3 3 Introne canonico % GT AG Introni non canonici GC 0.69 % AG AT 0.05 % AC ALTRO 0.02 % Burset et al., Nucleic Acids Res. 2000, 28:

69 Espressione di un gene Numero dei geni umani: circa Numero delle proteine umane: centinaia di migliaia La corrispondenza 1 a 1 non è rispettata. Perché?

70 Espressione di un gene Numero dei geni umani: circa Numero delle proteine umane: centinaia di migliaia La corrispondenza 1 a 1 non è rispettata. Perché? ALTERNATIVE SPLICING (AS) è un gene è in grado di esprimere una molteplicità di trascritti

71 Perché AS è importante? AS avviene nel 40-60% dei geni umani (Modrek and Lee, 2002)

72 Perché AS è importante? AS avviene nel 40-60% dei geni umani (Modrek and Lee, 2002) AS è specifico al tessuto in cui si trova la cellula (Graveley, 2001)

73 Perché AS è importante? AS avviene nel 40-60% dei geni umani (Modrek and Lee, 2002) AS è specifico al tessuto in cui si trova la cellula (Graveley, 2001) AS è specifico alle condizioni in cui si trova la cellula (es. stadio di sviluppo)

74 Perché AS è importante? AS avviene nel 40-60% dei geni umani (Modrek and Lee, 2002) AS è specifico al tessuto in cui si trova la cellula (Graveley, 2001) AS è specifico alle condizioni in cui si trova la cellula (es. stadio di sviluppo) AS è specifico allo stato di salute in cui si trova la cellula (correlazione con malattie)

75 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref

76 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref mrna1 exon 1 exon 1 intron retention exon 2 exon 3

77 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref mrna1 exon 1 exon 1 exon 2 exon 3 mrna2 exon 1 exon skipping exon 3

78 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref mrna1 exon 1 exon 1 exon 2 exon 3 mrna2 exon 1 exon 3 mrna3 exon 1 5 competing sites exon 2 exon 3

79 Alternative Splicing (AS) Gene1 5 exon 1 exon 2 exon 3 3 exon 1 exon 2 exon 3 mrna ref mrna1 exon 1 exon 1 exon 2 exon 3 mrna2 exon 1 exon 3 mrna3 exon 1 exon 2 exon 3 mrna4 exon 1 exon 2 exon 3 3 competing sites

80 Alternative Splicing (AS) Gene2 5 exon 1 exon 2 exon 3 exon 4 3 mrna ref exon 1 exon 2 exon 3 exon 4

81 Alternative Splicing (AS) Gene2 exon 1 5 exon 2 exon 3 exon 4 3 exon 1 exon 2 exon 3 exon 4 mrna ref mrna1 exon 1 exon 3 exon 4 mrna2 exon 1 exon 2 exon 4

82 Alternative Splicing (AS) Gene2 exon 1 5 exon 2 exon 3 exon 4 3 exon 1 exon 2 exon 3 exon 4 mrna ref mrna1 exon 1 exon 3 exon 4 mrna2 exon 1 exon 2 exon 4 mutually exclusive exons

83 Alternative Splicing (AS) Gene2 exon 1 exon 2 exon 3 exon mrna ref exon 1 exon 2 exon 3 exon 4 mrna1 exon 1 exon 3 exon 4 mrna2 exon 1 exon 2 exon 4 exon 1 exon 2 exon 3 exon 4 mrna3 multiple poly(a) sites

84 Alternative Splicing (AS) Gene2 5 exon 1 exon 2 exon 3 exon 4 3 mrna ref exon 1 exon 2 exon 3 exon 4 mrna1 exon 1 exon 3 exon 4 mrna2 exon 1 exon 2 exon 4 exon 1 exon 2 exon 3 exon 4 mrna3 exon 1 exon 2 exon 3 exon 4 mrna4 multiple promoters

85 Alternative Splicing (AS) Gene2 5 exon 1 exon 2 exon 3 exon 4 3 mrna ref exon 1 exon 2 exon 3 exon 4 mrna1 exon 1 exon 3 exon 4 Isoforma = trascritto (mrna) che il gene è in grado di esprimere mrna2 exon 1 exon 2 exon 4 exon 1 exon 2 exon 3 exon 4 mrna3 exon 1 exon 2 exon 3 exon 4 mrna4 multiple promoters

86 Alternative Splicing (AS) Gene2 5 exon 1 exon 2 exon 3 exon 4 3 mrna ref exon 1 exon 2 exon 3 exon 4 mrna1 exon 1 exon 3 exon 4 Isoforma = proteina che il gene è in grado di produrre mrna2 exon 1 exon 2 exon 4 exon 1 exon 2 exon 3 exon 4 mrna3 exon 1 exon 2 exon 3 exon 4 mrna4 multiple promoters

87 Problema computazionale di Alternative Splicing In Bioinformatica si ha la necessità di algoritmi e tools per predire la struttura in esoni-introni di un gene predire le isoforme alternative quantificare le isoforme alternative

88 Dati importanti Dati fondamentali in Bioinformatica sono i dati ottenuti dal sequenziamento di trascritti (mrna) che prendono il nome di: q EST (Expressed Sequence Tag) se ottenuti con metodo (tradizionale) Sanger q RNA-seq se ottenuti tramite tecnologie NGS

89 EST vs RNA-seq Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costosi (attorno al milione di dollari per sequenziare il genoma umano) ð Processano tanti reads in un run (milioni) (copertura da 10 a 100 volte superiore quella Sanger) ð Lunghezza relativamente bassa ð Qualità relativamente bassa

90 EST vs RNA-seq Metodo Sanger ð Piuttosto costoso (centinaia di milioni di dollari per Human Genome Project) Expressed Sequence Tag (EST) ð Processa pochissimi reads in un run (copertura relativamente bassa) ð Lunghezza dei reads fino a 1000 bp ð Qualità elevata Metodi NGS ð Poco costosi (attorno al milione di dollari per sequenziare il genoma umano) ð Processano tanti reads in un run (milioni) (copertura da 10 a 100 RNA-seq volte superiore quella Sanger) ð Lunghezza relativamente bassa ð Qualità relativamente bassa

91 Risorse dati in Bioinformatica Risorse a disposizione Banche dati genomiche Browser Genomici Sistemi integrati Software tools

92 Banche dati genomiche Scopo: archiviare e diffondere i dati ottenuti da esperimenti biologici Oggetti contenuti (entries): sequenze nucleotidiche (DNA, RNA) Geni trascritti Expressed Sequence Tag (EST) proteine strutture proteiche 3D etc

93 Banche dati genomiche Non è detto che siano DB relazionali L entry è identificata univocamente da un ID (Accession Number) e di solito è un file di puro testo: human-readable facile da sottoporre a parsing (con Ruby, Perl, Python, etc.) Due tipi principali di banche: primarie oggetti di tipo eterogeneo archiviati con un minimo di informazione (ad esempio sequenze nucleotidiche) specializzate: oggetti omogenei per tassonomia, funzione, etc. (ad esempio frammenti di trascritto)

94 Banche dati genomiche Le storiche banche primarie di sequenze nucleotidiche sono: EMBL Data Bank sviluppata da EMBL-EBI (European Bioinformatics Institute, parte dell European Molecular Biology Laboratory, EMBL) formato entry file: EMBL

95 Banche dati genomiche Le storiche banche primarie di sequenze nucleotidiche sono: EMBL Data Bank sviluppata da EMBL-EBI (European Bioinformatics Institute, parte dell European Molecular Biology Laboratory, EMBL) GenBank formato entry file: EMBL sviluppata da NCBI (National Center for Biotechnology Information, USA) formato entry file: GenBank

96 Banche dati genomiche Le storiche banche primarie di sequenze nucleotidiche sono: DDBJ DNA Data Bank of Japan sviluppata dal National Institute of Genetics in Mishima formato entry file: GenBank

97 Banche dati genomiche Le storiche banche primarie di sequenze nucleotidiche sono: DDBJ DNA Data Bank of Japan sviluppata dal National Institute of Genetics in Mishima formato entry file: GenBank La stessa sequenza nucleotidica è identificata in queste tre banche dallo stesso Accession Number

98 Banche dati genomiche Esercizio q Recuperare la sequenza con Accession Number M10051 da EMBL ( scaricarla sia in formato EMBL che in formato FASTA

99 Banche dati genomiche Una banca specializzata UniGene banca di trascritti (EST e mrna) mette a disposizione i trascritti raggruppati in cluster. Ogni cluster riguarda un gene e un organismo sviluppata da NCBI (National Center for Biotechnology Information, USA) formato entry file: FASTA

100 Browser genomici Database che conservano i dati relativi a interi genomi e mettono a disposizione dell utente un interfaccia sofisticata per esplorarli Ensembl sviluppato da EMBL-EBI + Wellcome Trust Sanger Institute UCSC Genome Browser sviluppato da University of California Santa Cruz

101 Sistemi integrati Sistemi per interrogare contemporaneamente più banche dati Entrez sviluppato da NCBI (National Center for Biotechnology Information, USA)

Corso di Elementi di Bioinformatica

Corso di Elementi di Bioinformatica Corso di Elementi di Bioinformatica Laurea Triennale in Informatica I dati e le banche dati in Bioinformatica Anno Accademico 2015-2016 Docente del laboratorio: Raffaella Rizzi 1 Il DNA (oggetto biologico)

Dettagli

Laboratorio di Elementi di Bioinformatica

Laboratorio di Elementi di Bioinformatica Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2016/2017 Formato GTF per annotare un gene Docente del laboratorio: Raffaella Rizzi 1 GTF (Gene Transfer

Dettagli

Corso di Elementi di Bionformatica

Corso di Elementi di Bionformatica Corso di Elementi di Bionformatica Laurea Triennale in Informatica Il formato FASTQ per la qualità delle sequenze Anno Accademico 2015-2016 Docente del laboratorio: Raffaella Rizzi 1 La qualità delle sequenze

Dettagli

Laboratorio di Elementi di Bioinformatica

Laboratorio di Elementi di Bioinformatica Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2015/2016 Parsing di un file in formato EMBL (parte I) Docente del laboratorio: Raffaella Rizzi 1 Esercizio

Dettagli

Laboratorio di Elementi di Bioinformatica

Laboratorio di Elementi di Bioinformatica Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E30Q6) AA 205/206 Esempio di workflow Docente del laboratorio: Raffaella Rizzi Scopo del workflow Scopo: dato un insieme

Dettagli

Bioinformatica. Analisi del genoma

Bioinformatica. Analisi del genoma Bioinformatica Analisi del genoma GABRIELLA TRUCCO CREMA, 5 APRILE 2017 Cosa è il genoma? Insieme delle informazioni biologiche, depositate nella sequenza di DNA, necessarie alla costruzione e mantenimento

Dettagli

DNA E PROTEINE IL DNA E RACCHIUSO NEL NUCLEO, MENTRE LA SINTESI PROTEICA SI SVOLGE NEL CITOPLASMA: COME VIENE TRASPORTATA L INFORMAZIONE?

DNA E PROTEINE IL DNA E RACCHIUSO NEL NUCLEO, MENTRE LA SINTESI PROTEICA SI SVOLGE NEL CITOPLASMA: COME VIENE TRASPORTATA L INFORMAZIONE? DNA E PROTEINE NUMEROSI DATI SUGGERISCONO CHE IL DNA SVOLGA IL SUO RUOLO GENETICO CONTROLLANDO LA SINTESI DELLE PROTEINE, IN PARTICOLARE DETERMINANDONE LA SEQUENZA IN AMINOACIDI E NECESSARIO RISPONDERE

Dettagli

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato

Dettagli

CELLULA PROCARIOTICA PROCARIOTE

CELLULA PROCARIOTICA PROCARIOTE CELLULA PROCARIOTICA O PROCARIOTE CELLULA EUCARIOTICA O EUCARIOTE Sany0196.jpg IL NUCLEO Provvisto di due membrane (interna ed esterna) che congiungendosi in alcuni punti formano i pori nucleari attraverso

Dettagli

Codice Genetico (segue)

Codice Genetico (segue) CODICE GENETICO Nucleotidi, acidi nucleici CODICE GENETICO Codice mediante il quale la sequenza nucleotidica di una molecola di DNA o di RNA specifica la sequenza amminoacidica di un polipeptide. Consiste

Dettagli

COME È FATTO? Ogni filamento corrisponde ad una catena di nucleotidi

COME È FATTO? Ogni filamento corrisponde ad una catena di nucleotidi Il DNA Il DNA è una sostanza che si trova in ogni cellula e contiene tutte le informazioni sulla forma e sulle funzioni di ogni essere vivente: eppure è una molecola incredibilmente semplice. COME È FATTO?

Dettagli

Introduzione alla Genomica

Introduzione alla Genomica Laboratorio di Bioinformatica I Introduzione alla Genomica Dott. Sergio Marin Vargas (2014 / 2015) Il Genoma umano Gene codificanti proteine Gene non codificanti proteine Geni codificanti proteine 3 Il

Dettagli

IPOTESI UN GENE-UN ENZIMA

IPOTESI UN GENE-UN ENZIMA IPOTESI UN GENE-UN ENZIMA DNA: contiene tutte le informazioni per definire lo sviluppo e la fisiologia della cellula: ma come svolge questa funzione? Beadle e Tatum (1941): studiando mutanti della comune

Dettagli

LA SINTESI PROTEICA LE MOLECOLE CHE INTERVENGONO IN TALE PROCESSO SONO:

LA SINTESI PROTEICA LE MOLECOLE CHE INTERVENGONO IN TALE PROCESSO SONO: LA SINTESI PROTEICA La sintesi proteica è il processo che porta alla formazione delle proteine utilizzando le informazioni contenute nel DNA. Nelle sue linee fondamentali questo processo è identico in

Dettagli

Corso di Laurea in Chimica e Tecnologie Farmaceu6che a.a Università di Catania. La stru(ura del gene. Stefano Forte

Corso di Laurea in Chimica e Tecnologie Farmaceu6che a.a Università di Catania. La stru(ura del gene. Stefano Forte Corso di Laurea in Chimica e Tecnologie Farmaceu6che a.a. 2014-2015 Università di Catania La stru(ura del gene Stefano Forte I Geni Il gene è l'unità ereditaria e funzionale degli organismi viventi. La

Dettagli

Dal gene alla proteina

Dal gene alla proteina Dal gene alla proteina Il collegamento tra geni e proteine La trascrizione e la traduzione sono i due principali processi che legano il gene alla proteina: uno sguardo panoramico Le informazioni genetiche

Dettagli

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi GENOMA EVOLUZIONE CONTENUTO FUNZIONE STRUTTURA Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine Progetti genoma in centinaia di organismi Importante la sintenia tra i genomi The

Dettagli

Struttura ed espressione del Gene

Struttura ed espressione del Gene Struttura ed espressione del Gene PowerPoint Lectures for Essential Biology, Third Edition Neil Campbell, Jane Reece, and Eric Simon Essential Biology with Physiology, Second Edition Neil Campbell, Jane

Dettagli

07/01/2015. Come si ferma una macchina in corsa? Il terminatore. Terminazione intrinseca (rho-indipendente)

07/01/2015. Come si ferma una macchina in corsa? Il terminatore. Terminazione intrinseca (rho-indipendente) Come si ferma una macchina in corsa? Il terminatore Terminazione intrinseca (rho-indipendente) Terminazione dipendente dal fattore Rho (r) 1 Operoni: gruppi di geni parte di una unica unità trascrizionale

Dettagli

Nozioni base di Biologia

Nozioni base di Biologia Nozioni base di Biologia Ripercorriamo velocemente i principali concetti di biologia indispensabili per capire la Bioinformatica: verranno approfonditi in altri corsi. Gli organismi viventi possiedono

Dettagli

Sperimenta il BioLab Attività di Bioinformatica Caccia al gene

Sperimenta il BioLab Attività di Bioinformatica Caccia al gene Sperimenta il BioLab Attività di Bioinformatica Caccia al gene Università degli Studi di Milano Settore Didattico, via Celoria 20, Milano Laboratorio 105 INTRODUZIONE Questa attività pratica ha come scopo

Dettagli

IPOTESI UN GENE-UN ENZIMA

IPOTESI UN GENE-UN ENZIMA IPOTESI UN GENE-UN ENZIMA DNA: contiene tutte le informazioni per definire lo sviluppo e la fisiologia della cellula: ma come svolge questa funzione? Beadle e Tatum (1941): studiando mutanti della comune

Dettagli

La genetica molecolare

La genetica molecolare La genetica molecolare 1 Il materiale genetico Varia di quantità da specie a specie. Regola lo sviluppo della cellula. Ha la capacità di duplicarsi. Nome comune Numero di coppie di cromosomi zanzara 3

Dettagli

Gli Acidi Nucleici DNA RNA

Gli Acidi Nucleici DNA RNA Gli Acidi Nucleici DNA RNA Gli Acidi nucleici Gli acidi nucleici sono il: DNA (acido desossiribonucleico) RNA (acido ribonucleico) Essi sono formati dai polimeri (molecole molto grosse) i cui monomeri

Dettagli

Next-generation sequencing, annotazione, ed espressione genica. Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi.

Next-generation sequencing, annotazione, ed espressione genica. Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi. Next-generation sequencing, annotazione, ed espressione genica Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi.it Il primo passo... Abbiamo la sequenza completa del DNA di un organismo:

Dettagli

GENE. Fattore trasformante? Riproduzione del ceppo S. Preparazione del fattore trasformante. Trasformazione del ceppo R. ceppo S. deceduto.

GENE. Fattore trasformante? Riproduzione del ceppo S. Preparazione del fattore trasformante. Trasformazione del ceppo R. ceppo S. deceduto. ceppo S 1 Griffith and Avery 1930 deceduto ceppo R 2 vivo ceppo S ucciso al calore 3 ceppo R 4 vivo ceppo S ucciso al calore deceduto Riproduzione del ceppo S Preparazione del fattore trasformante lisi

Dettagli

Biologia Molecolare. CDLM in CTF La riparazione del DNA

Biologia Molecolare. CDLM in CTF La riparazione del DNA Biologia Molecolare CDLM in CTF 2010-2011 La riparazione del DNA I tipi di mutazione e le conseguenze Le classi di danno al DNA Meccanismi di riparazione La necessità di codificare l informazione L informazione

Dettagli

TRASCRIZIONE DEL DNA. Formazione mrna

TRASCRIZIONE DEL DNA. Formazione mrna TRASCRIZIONE DEL DNA Formazione mrna Trascrizione Processo mediante il quale l informazione contenuta in una sequenza di DNA (gene) viene copiata in una sequenza complementare di RNA dall enzima RNA polimerasi

Dettagli

Provate rispondere alle domande, se ci riuscirete, sarete pronti a superare l esame per quanto riguarda la parte di bioinformatica.

Provate rispondere alle domande, se ci riuscirete, sarete pronti a superare l esame per quanto riguarda la parte di bioinformatica. Per aiutarvi ho elaborato (frettolosamente) questi quesiti che dovrebbero aiutarvi ad individuare gli argomenti importanti del corso ed a darvi un idea delle domande che potrebbero esservi poste all esame.

Dettagli

LE BASI AZOTATE PIRIMIDINE PURINE

LE BASI AZOTATE PIRIMIDINE PURINE LE BASI AZTATE PURIE PIRIMIDIE Le basi azotate sono composti eterociclici aromatici con azoti portanti doppietti basici. Possono avere un solo anello (pirimidine) o due (purine). Le basi adenina, guanina

Dettagli

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi.

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi. DNA - RNA Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Esistono 4 basi azotate per il DNA e 4 per RNA Differenze

Dettagli

Codice Genetico (segue) 04/11/2015. «Wobble base pairs» (appaiamento tentennante di basi) CODICE GENETICO

Codice Genetico (segue) 04/11/2015. «Wobble base pairs» (appaiamento tentennante di basi) CODICE GENETICO «Wobble base pairs» (appaiamento tentennante di basi) CODICE GENETICO http://www.atdbio.com/img/articles/rna wobble base pairs large.png CODICE GENETICO Codice mediante il quale la sequenza nucleotidica

Dettagli

Il DNA conserva l informazione genetica

Il DNA conserva l informazione genetica Il DNA conserva l informazione genetica Gli esperimenti di Frederick Griffith (1928) Gli esperimenti di Oswald Avery (1944) + Estratti dal ceppo IIIS ucciso al calore di Polisaccaridi Lipidi Proteine Acidi

Dettagli

Introduzione alla biologia della cellula. Lezione 3 Le biomolecole DNA e RNA

Introduzione alla biologia della cellula. Lezione 3 Le biomolecole DNA e RNA Introduzione alla biologia della cellula Lezione 3 Le biomolecole DNA e RNA Acidi nucleici DNA (acido desossiribonucleico) RNA (acido ribonucleico) Sono polimeri di monomeri detti NUCLEOTIDI Un nucleotide

Dettagli

L ACQUA E LE SUE PROPRIETÀ

L ACQUA E LE SUE PROPRIETÀ L ACQUA E LE SUE PROPRIETÀ L acqua è una sostanza indispensabile per tutte le forme di vita. Ogni molecola di acqua (H2O) è formata da due atomi di idrogeno e un atomo di ossigeno, uniti tramite due legami

Dettagli

DNA DNA DNA Legge di complementarietà delle basi Se in un filamento è presente una T nell altro filamento deve essere presente una A. Se è presente una C nell altro ci dovrà essere una G. E possibile

Dettagli

SINTESI E MATURAZIONE DEGLI RNA CELLULARI

SINTESI E MATURAZIONE DEGLI RNA CELLULARI SINTESI E MATURAZIONE DEGLI RNA CELLULARI PER TRASCRIZIONE SI INTENDE LA SINTESI DI UNA MOLECOLA DI RNA COMPLEMENTARE AD UNO STAMPO DI DNA. GLI RNA CELLULARI SONO DISTINTI IN TRE PRINCIPALI CATEGORIE:

Dettagli

SINTESI E MATURAZIONE DEGLI RNA CELLULARI

SINTESI E MATURAZIONE DEGLI RNA CELLULARI SINTESI E MATURAZIONE DEGLI RNA CELLULARI PER TRASCRIZIONE SI INTENDE LA SINTESI DI UNA MOLECOLA DI RNA COMPLEMENTARE AD UNO STAMPO DI DNA. GLI RNA CELLULARI SONO DISTINTI IN TRE PRINCIPALI CATEGORIE:

Dettagli

2. DUPLICAZIONE DNA. 1. COMPOSIZIONE e STRUTTURA 3. CROMOSOMI

2. DUPLICAZIONE DNA. 1. COMPOSIZIONE e STRUTTURA 3. CROMOSOMI 2. DUPLICAZIONE DNA 1. COMPOSIZIONE e STRUTTURA 3. CROMOSOMI 1 1. COMPOSIZIONE e STRUTTURA Ma che cos è il DNA? è un contenitore di informazioni... scritte come sequenza di basi azotate 2 Acidi Nucleici:

Dettagli

Le molecole di RNA possono assumere particolari strutture che conferiscono loro particolari funzioni.

Le molecole di RNA possono assumere particolari strutture che conferiscono loro particolari funzioni. Traduzione: t-rna Le molecole di RNA possono assumere particolari strutture che conferiscono loro particolari funzioni. Singola catena alta flessibilità ripiegamento su stessa legami deboli con se stessa

Dettagli

Lezione 1. Le molecole di base che costituiscono la vita

Lezione 1. Le molecole di base che costituiscono la vita Lezione 1 Le molecole di base che costituiscono la vita Le molecole dell ereditarietà 5 3 L informazione ereditaria di tutti gli organismi viventi, con l eccezione di alcuni virus, è a carico della molecola

Dettagli

Modulo Laboratorio A.A. 2014/2015

Modulo Laboratorio A.A. 2014/2015 Biochimica - Laboratorio di Bioinformatica I (CdL. Bioinformatica) Bioinformatica e banche dati biologiche (CdL. Biotecnologie) Modulo Laboratorio A.A. 2014/2015 Docente: Dr. Sergio Marin Vargas Mail:

Dettagli

LA TRASCRIZIONE NEGLI EUCARIOTI

LA TRASCRIZIONE NEGLI EUCARIOTI LA TRASCRIZIONE NEGLI EUCARIOTI NEGLI EUCARIOTI TRASCRIZIONE E TRADUZIONE SONO DUE EVENTI SEPARATI CHE AVVENGONO IN DUE DIVERSI COMPARTIMENTI CELLULARI: NUCLEO E CITOPLASMA. INOLTRE, A DIFFERENZA DEI

Dettagli

LA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri

LA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri LA GENETICA DNA e RNA Prof. Daniele Verri L'acido desossiribonucleico o deossiribonucleico (DNA) è un acido nucleico che contiene le informazioni necessarie per la formazione di RNA e proteine. LA GENETICA:

Dettagli

Acidi Nucleici: DNA = acido deossiribonucleico

Acidi Nucleici: DNA = acido deossiribonucleico Acidi Nucleici: DNA = acido deossiribonucleico depositario dell informazione genetica RNA: acido ribonucleico trascrizione e traduzione dell informazione genetica dogma centrale della biologia molecolare

Dettagli

Il DNA: istruzioni per la vita Bibliografia I colori della Biologia Gatti- Giusti- Anelli Ed. Pearson

Il DNA: istruzioni per la vita Bibliografia I colori della Biologia Gatti- Giusti- Anelli Ed. Pearson Il DNA: istruzioni per la vita Bibliografia I colori della Biologia Gatti- Giusti- Anelli Ed. Pearson Una divisione equa Quando una cellula si divide, si formano due nuove cellule che contengono esattamente

Dettagli

IL MATERIALE EREDITARIO. Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene

IL MATERIALE EREDITARIO. Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene IL MATERIALE EREDITARIO Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene Caratteristiche del materiale ereditario 1 Replicarsi accuratamente durante crescita e divisione

Dettagli

Elementi di Bioinformatica. Genomica. Introduzione

Elementi di Bioinformatica. Genomica. Introduzione Corso di Elementi di Bioinformatica Ingegneria Biomedica AA 2013-14 Elementi di Bioinformatica Genomica Introduzione Genomica Genomica (genomics) Riguarda lo studio del genoma degli organismi viventi e,

Dettagli

SDD Seconde Gli acidi nucleici. Gli acidi nucleici

SDD Seconde Gli acidi nucleici. Gli acidi nucleici 1 Capire come le informazioni genetiche sono immagazzinate nelle cellule e come avviene la trasformazione di queste informazioni nei meccanismi metabolici delle cellule. Quattro mattoncini La cellula ha

Dettagli

LA TRASCRIZIONE. Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene

LA TRASCRIZIONE. Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene LA TRASCRIZIONE Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Giovanna Attene GLI ACIDI RIBONUCLEICI Nelle cellule nucleate la sintesi proteica avviene nel citoplasma, mentre il DNA si

Dettagli

Nucleotidi e Acidi Nucleici. Struttura di DNA e RNA

Nucleotidi e Acidi Nucleici. Struttura di DNA e RNA Nucleotidi e Acidi Nucleici Nucleosidi Nucleotidi Funzioni biologiche dei nucleotidi Struttura di DNA e RNA Concatenazione e appaiamento dei nucleotidi Lo scheletro degli acidi nucleici Componenti degli

Dettagli

Modello computazionale per la predizione di siti di legame per fattori di trascrizione

Modello computazionale per la predizione di siti di legame per fattori di trascrizione Modello computazionale per la predizione di siti di legame per fattori di trascrizione Attività di tirocinio svolto presso il Telethon Institute of Genetics and Medicine Relatori Prof. Giuseppe Trautteur

Dettagli

ACIDI NUCLEICI ESPERIMENTI

ACIDI NUCLEICI ESPERIMENTI ACIDI NUCLEICI ESPERIMENTI 1869 FRIEDRICK MIESCHER Isolò per la prima volta una sostanza zuccherina leggermente acida contenente fosforo Questa sostanza venne chiamata: acido nucleico perché scoperta nel

Dettagli

Struttura e funzione dei geni. Paolo Edomi - Genetica

Struttura e funzione dei geni. Paolo Edomi - Genetica Struttura e funzione dei geni 1 Il DNA è il materiale genetico La molecola di DNA conserva l informazione genetica: topi iniettati con solo DNA di batteri virulenti muoiono 2 Proprietà del DNA Il DNA presenta

Dettagli

Corso di Biologia Molecolare

Corso di Biologia Molecolare Corso di Biologia Molecolare Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Acidi nucleici Il ruolo degli acidi nucleici è quello di custodire e trasmettere

Dettagli

Risposta: 2. Uracile. Risposta: 2. legami idrogeno. Adenina, Citosina e Guanina si trovano sia nell RNA che nel DNA.

Risposta: 2. Uracile. Risposta: 2. legami idrogeno. Adenina, Citosina e Guanina si trovano sia nell RNA che nel DNA. Risposta: 2. Uracile Adenina, Citosina e Guanina si trovano sia nell RNA che nel DNA. La Timina si trova soltanto nel DNA; l Uracile si sostituisce alla Timina nelle molecole dell RNA. Risposta: 2. legami

Dettagli

IL GENOMA DELLA CELLULA VEGETALE

IL GENOMA DELLA CELLULA VEGETALE IL GENOMA DELLA CELLULA VEGETALE I GENOMI DELLE CELLULE VEGETALI Genoma nucleare Geni per il funzionamento globale della cellula vegetale Condivisi o specifici per la cellula vegetale Genoma plastidiale

Dettagli

Il dogma centrale della biologia. molecolare

Il dogma centrale della biologia. molecolare Il dogma centrale della biologia Cell molecolare Transcription Translation Ribosome DNA mrna Polypeptide (protein) L informazione per la sintesi delle proteine è contenuta nel DNA. La trascrizione e la

Dettagli

Introduzione al corso di bioinformatica e analisi dei genomi AA 2015-2016. Docente: Silvia Fuselli fss@unife.it

Introduzione al corso di bioinformatica e analisi dei genomi AA 2015-2016. Docente: Silvia Fuselli fss@unife.it Introduzione al corso di bioinformatica e analisi dei genomi AA 2015-2016 Docente: Silvia Fuselli fss@unife.it Possibili testi di riferimento Introduction to Genomics, A.M. Lesk, Oxford Capitoli 1, 3,

Dettagli

IL CODICE GENETICO E I CARATTERI EREDITARI

IL CODICE GENETICO E I CARATTERI EREDITARI IL CODICE GENETICO E I CARATTERI EREDITARI Il DNA porta le informazioni genetiche scritte nella sequenza di basi. Qualunque sequenza è possibile. Il DNA virus più semplici: 5000 basi appaiate; 46 cromosomi

Dettagli

STRUTTURE DEGLI ACIDI NUCLEICI, CODICE GENETICO E REPLICAZIONE DEL DNA

STRUTTURE DEGLI ACIDI NUCLEICI, CODICE GENETICO E REPLICAZIONE DEL DNA IL LABORATORIO DI BIOLOGIA MOLECOLARE: Introduzione alle tecniche e alle loro applicazioni STRUTTURE DEGLI ACIDI NUCLEICI, Il DNA nell arte: Susan Rankaitis 2002, DNA2 CODICE GENETICO E REPLICAZIONE DEL

Dettagli

ACIDI GRASSI INSATURI

ACIDI GRASSI INSATURI LIPIDI ACIDI GRASSI SATURI ACIDI GRASSI INSATURI TRIGLICERIDI TRIGLICERIDI Grassi neutri o lipidi semplici glicerolo + 1 acido grasso monogliceride glicerolo + 2 acidi grassi digliceride glicerolo + 3

Dettagli

lati esterni altamente Idrofilici

lati esterni altamente Idrofilici I due filamenti complementari del DNA sono antiparalleli: uno è in direzione 5-3 e l altro in direzione 3-5. parte interna idrofobica lati esterni altamente Idrofilici APPAIAMENTO DELLE BASI AZOTATE: 2

Dettagli

Relazione DNA. Giulia Carbonara classe 3 A

Relazione DNA. Giulia Carbonara classe 3 A Giulia Carbonara classe 3 A Relazione DNA Il DNA (la sigla dell'acido desossiribonucleico ) è una macromolecola biologica sede delle informazioni genetiche e dell'unicità di un organismo che appartiene

Dettagli

Genomi dei procarioti

Genomi dei procarioti Genomi dei procarioti Una molecola circolare di DNA E.coli circa 4 x 10 6 coppie di basi Il genoma è quasi tutto codificante Viene trascritto in mrna policistronici Il genoma eucariotico Il genoma eucariotico

Dettagli

Riarrangiamento genico

Riarrangiamento genico Riarrangiamento genico 1 3 quesiti per la comprensione Ø l esistenza nello stesso anticorpo di una parte variabile ed una costante; Ø l esistenza della enorme variabilità (diversità) del sito combinatorio;

Dettagli

Nel codice genetico, una tripletta di nucleotidi codifica per un aminoacido

Nel codice genetico, una tripletta di nucleotidi codifica per un aminoacido Il codice genetico: Come triplette dei quattro nucleotidi specificano 20 aminoacidi, rendendo possibile la traduzione dell informazione da catena nucleotidica a sequenza di aminoacidi. Come le mutazioni

Dettagli

Concetti Biologici basilari Per approfondire (in inglese)

Concetti Biologici basilari Per approfondire  (in inglese) Le prossime lezioni saranno incentrate sulla struttura delle principali macromolecole della cellula (DNA, RNA e proteine) e sul processo di traduzione della sequenza di DNA in proteine. Lo scopo è quello

Dettagli

Sequenze nucleotidiche del DNA definite loci costituiscono i geni. Ogni gene codifica per una specifica proteina

Sequenze nucleotidiche del DNA definite loci costituiscono i geni. Ogni gene codifica per una specifica proteina sintesi proteica La sintesi proteica è il processo che porta alla formazione delle proteine da sequenze del DN definite geni. Si tratta di un processo a più fasi Nelle sue linee fondamentali questo processo

Dettagli

Acidi nucleici ed informazione genetica

Acidi nucleici ed informazione genetica cidi nucleici ed informazione genetica Flavia Frabetti ecnici di laboratorio 2010/2011 IDI NULEII DN acido desossiribonucleico RN acido ribonucleico nel DN sono codificate le istruzioni che programmano

Dettagli

1) Un gene-un enzima 2) Un gene- una catena polipeptidica

1) Un gene-un enzima 2) Un gene- una catena polipeptidica 1) Un gene-un enzima 2) Un gene- una catena polipeptidica 3) Un gene è una unità funzionale di DNA che codifica per la sequenza amminoacidica di uno o più polipeptidi o alternativamente per uno o più tipi

Dettagli

Il DNA, acido desossiribonucleico, è la molecola che

Il DNA, acido desossiribonucleico, è la molecola che Il DNA, acido desossiribonucleico, è la molecola che contiene le informazioni necessarie per il funzionamento di ogni essere vivente: le informazioni genetiche, che ciascuno di noi eredita dai propri genitori.

Dettagli

Gli acidi nucleici, DNA (acido deossiribonucleico) e RNA (acido. ribonucleico), sono polimeri biologicamente importanti in quanto

Gli acidi nucleici, DNA (acido deossiribonucleico) e RNA (acido. ribonucleico), sono polimeri biologicamente importanti in quanto Gli acidi nucleici, DA (acido deossiribonucleico) e RA (acido ribonucleico), sono polimeri biologicamente importanti in quanto svolgono ruoli fondamentali nell ereditarietà e nella sintesi proteica. Sono

Dettagli

I MOTORI DELL EVOLUZIONE PT2. POMERIGGIO DI AGGIORNAMENTO PROF. M.A. ZORDAN, Ph.D UNIVERSITÀ DEGLI STUDI DI PADOVA

I MOTORI DELL EVOLUZIONE PT2. POMERIGGIO DI AGGIORNAMENTO PROF. M.A. ZORDAN, Ph.D UNIVERSITÀ DEGLI STUDI DI PADOVA I MOTORI DELL EVOLUZIONE PT2 POMERIGGIO DI AGGIORNAMENTO 23.03.2011 PROF. M.A. ZORDAN, Ph.D UNIVERSITÀ DEGLI STUDI DI PADOVA 1 IL MATERIALE GENETICO 2 2 Per svolgere il proprio ruolo, il materiale genetico

Dettagli

Contenuto di DNA aploide in alcune specie

Contenuto di DNA aploide in alcune specie Contenuto di DNA aploide in alcune specie 1-10 2 kb 10 3 kb 10 4 kb 10 5-10 8 kb Dimensioni del genoma Paradosso del valore C Non c è una correlazione tra la quantità di DNA e la complessità di un organismo

Dettagli

Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA

Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Bioinformatica - Scienza interdisciplinare coinvolgente la biologia, l informatica, la matematica e la statistica per l

Dettagli

Genomica, proteomica, genomica strutturale, banche dati.

Genomica, proteomica, genomica strutturale, banche dati. Genomica, proteomica, genomica strutturale, banche dati. Alcune pietre miliari della biologia anno risultato 1866 Mendel scopre i geni 1944 il DNA è il materiale genetico 1951 prima sequenza di una proteina

Dettagli

Regolazione dell espressione genica

Regolazione dell espressione genica Regolazione dell espressione genica definizioni Gene attivato quando viene trascritto in RNA e il suo messaggio tradotto in molecole proteiche specifiche Espressione genica processo complessivo con cui

Dettagli

Corso di Genetica -Lezione 12- Cenci

Corso di Genetica -Lezione 12- Cenci Corso di Genetica -Lezione 12- Cenci Il codice genetico: Come triplette dei quattro nucleotidi specificano 20 aminoacidi, rendendo possibile la traduzione dell informazione da catena nucleotidica a sequenza

Dettagli

Codice Genetico (segue) 29/10/2014 CODICE GENETICO

Codice Genetico (segue) 29/10/2014 CODICE GENETICO CODICE GENETICO Codice mediante il quale la sequenza nucleotidica di una molecola di DNA o di RNA specifica la sequenza amminoacidica di un polipeptide. CODICE GENETICO Consiste di codoni a tre nucleotidi

Dettagli

BIOLOGIA BIOCHIMICA Il codice genetico

BIOLOGIA BIOCHIMICA Il codice genetico REPUBBLICA ITALIANA ISTITUTO COMPRENSIVO DI SCUOLA PRIMARIA E SECONDARIA DI PRIMIERO Via delle Fonti 10, 38054, località Transacqua, Primiero San Martino di Castrozza, (TN) Tel. 0439 62435 Fax 0439 762466

Dettagli

Espressione ed utilizzo della informazione genetica II Trascrizione e Traduzione

Espressione ed utilizzo della informazione genetica II Trascrizione e Traduzione Espressione ed utilizzo della informazione genetica II Trascrizione e Traduzione CdL Tecnici di Lab Biomedico AA. 2011-12 - Prof.ssa Frabetti Come si esprime l informazione? Per i geni classici vedremo:

Dettagli

DNA. simile ad una scala a chiocciola. I pioli della scala corrispondono

DNA. simile ad una scala a chiocciola. I pioli della scala corrispondono DNA Il DNA o acido desossiribonucleico è una grossa molecola chimica contenuta nel nucleo della cellula. Il DNA può essere paragonato ad un importante libro delle istruzioni che contiene l informazione

Dettagli

Progetto Tandem Biologia saperi minimi Anno accademico Marzo 2012 COGNOME...

Progetto Tandem Biologia saperi minimi Anno accademico Marzo 2012 COGNOME... Progetto Tandem Biologia saperi minimi Anno accademico 2011-2012 2 Marzo 2012 COGNOME... NOME 1) Quali delle seguenti affermazioni sulla struttura primaria delle proteine è falsa? a) può essere ramificata

Dettagli

mrna + 20 aminoacidi In vitro nulla

mrna + 20 aminoacidi In vitro nulla La sintesi proteica mrna + 20 aminoacidi In vitro nulla Il codice genetico I geni controllano la struttura delle proteine: in che modo? 4 nucleotidi A, T, C, G 20 aminoacidi Esiste un codice che converte

Dettagli

Malattie genetiche. Dott. Giovanni LONGO

Malattie genetiche. Dott. Giovanni LONGO Malattie genetiche Dott. Giovanni LONGO Il ruolo della ricerca scientifica Esistono una quantità quasi infinita di rimedi o cure contro un'altrettanta quantità di malattie. La ricerca scientifica si occupa

Dettagli

Banche Dati. Docente: Dr. Antinisca DI MARCO

Banche Dati. Docente: Dr. Antinisca DI MARCO Docente: Dr. Antinisca DI MARCO Email: antinisca.dimarco@di.univaq.it La biologia molecolare produce una grande mole di dati che può essere memorizzata in database general-purpose o specialized (es. immunological):

Dettagli

Dott.ssa Renata Tisi. Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it

Dott.ssa Renata Tisi. Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Il ruolo degli acidi nucleici è quello di custodire e trasmettere l informazione genetica nelle cellule,

Dettagli

Sommario. Presentazione dell opera Ringraziamenti

Sommario. Presentazione dell opera Ringraziamenti Sommario Presentazione dell opera Ringraziamenti XI XII Capitolo 1 Introduzione alla bioinformatica 1 1.1 Cenni introduttivi 1 1.2 Pietre miliari della bioinformatica 2 1.3 Infrastrutture bioinformatiche

Dettagli

Bioinformatica. Marin Vargas, Sergio Paul

Bioinformatica. Marin Vargas, Sergio Paul Bioinformatica Marin Vargas, Sergio Paul 2013 Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici. La bioinformatica

Dettagli

GENOMICA STRUTTURALE: GENOMICA FUNZIONALE:

GENOMICA STRUTTURALE: GENOMICA FUNZIONALE: GENOMICA STRUTTURALE: GENOMICA FUNZIONALE: 1. Anatomia dei genomi 8. Funzionamento dei genomi Il genoma dei procarioti Modificazioni della cromatina e l espressione del Il genoma degli eucarioti genoma

Dettagli

Il flusso e la regolazione dell informazione genica. Lezione nr. 8 Psicobiologia

Il flusso e la regolazione dell informazione genica. Lezione nr. 8 Psicobiologia Il flusso e la regolazione dell informazione genica Lezione nr. 8 Psicobiologia L informazione che viene trascritta non riguarda tutto il DNA ma solo delle particolari sequenze definite GENI. Tipologie

Dettagli

Basi Teoriche e Applicazioni delle Nuove Tecnologie Genomiche

Basi Teoriche e Applicazioni delle Nuove Tecnologie Genomiche Corsi di laurea magistrale in: Biotecnologie agrarie e ambientali (LM-7) Biologia cellulare e molecolare (LM-6) Sicurezza e qualitàagroalimentare (LM-69 & LM-70) insegnamento di Basi Teoriche e Applicazioni

Dettagli

Codice genetico CODICE GENETICO [1]

Codice genetico CODICE GENETICO [1] Codice genetico CODICE GENETICO [1] Codice mediante il quale la sequenza nucleotidica di una molecola di DNA, tramite un mrna, specifica la sequenza amminoacidica di un polipeptide. Consiste di codoni

Dettagli

www.fisiokinesiterapia.biz TRASCRIZIONE

www.fisiokinesiterapia.biz TRASCRIZIONE www.fisiokinesiterapia.biz TRASCRIZIONE TRASCRIZIONE Processo mediante il quale una sequenza di DNA (un gene) viene copiata in una sequenza di RNA Dalla trascrizione derivano gli mrna, che verranno tradotti

Dettagli

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine Prof.ssa Gamba Sabrina Lezione 7: IL DNA Duplicazione e sintesi delle proteine concetti chiave della lezione Costituzione fisico-chimica del DNA Basi azotate Duplicazione Concetto di geni Rna Trascrizione

Dettagli

02/12/2014. Tutti gli esseri viventi sono composti da cellule LA CELLULA E L UNITA STRUTTURALE E FUNZIONALE DEGLI ORGANISMI VIVENTI

02/12/2014. Tutti gli esseri viventi sono composti da cellule LA CELLULA E L UNITA STRUTTURALE E FUNZIONALE DEGLI ORGANISMI VIVENTI Tutti gli esseri viventi sono composti da cellule Eubatteri Procarioti unicellulari Archebatteri LA CELLULA E L UNITA STRUTTURALE E FUNZIONALE DEGLI ORGANISMI VIVENTI -Autoconservazione mantenimento della

Dettagli

Gli acidi nucleici sono eteropolimeri lineari costituiti da subunità nucleotidiche (monomeri).

Gli acidi nucleici sono eteropolimeri lineari costituiti da subunità nucleotidiche (monomeri). Gli acidi nucleici sono eteropolimeri lineari costituiti da subunità nucleotidiche (monomeri). Un nucleotide è formato da: uno zucchero: (Ribosio o Deossiribosio), a 5 atomi di carbonio in forma ciclica

Dettagli

Dal DNA alle proteine: La trascrizione e la traduzione

Dal DNA alle proteine: La trascrizione e la traduzione Dal DNA alle proteine: La trascrizione e la traduzione DNA RNA Trascrizione RNA PROTEINE Traduzione Dove avvengono? GLI EUCARIOTI I PROCARIOTI Cambell, Reece Biologia ZANICHELLI Trascrizione Sintesi di

Dettagli