Corso di Elementi di Bioinformatica Ingegneria Biomedica AA 2013-14 Elementi di Bioinformatica Genomica Introduzione
Genomica Genomica (genomics) Riguarda lo studio del genoma degli organismi viventi e, per ogni organismo, l'uso dei geni codificati all'interno del genoma Principali concetti informativi basi, DNA, RNA, geni, cromosomi mrna, trna, rrna, cdna, EST polimorfismo e mutazioni di sequenze geniche... 2
Era Genomica 1953 Rosalind Franklin, Maurice Wilkins, James Watson e Francis Crick pubblicano su Nature tre articoli sulla struttura del DNA 1962 Wilkins, Watson e Crick ricevono il premio Nobel 3
Tipologie di Organismi Due grandi categorie di cellule procariote (per esempio, i batteri) il materiale genetico si trova libero nel citoplasma eucariote (quelle che formano il corpo delle piante, degli animali e dell'uomo) il materiale genetico si trova segregato all interno di un nucleo circondato da membrana 4
Il Genoma Umano - Caratteristiche Cellule eucariote circa 3 miliardi di basi circa 30.000 geni recanti istruzioni per la sintesi di decine di migliaia di proteine e di alcune strutture (per esempio, ribosomi) ogni proteina conterrà a sua volta (in media) alcune centinaia di amminoacidi in fase di mitosi (meiosi) i geni sono localizzati su 23 coppie di cromosomi presenti nel nucleo di ciascuna cellula 5
DNA Il DNA è formato da due lunghi filamenti costituiti da singole catene polinucleotidiche, avvolte una sull'altra a formare una doppia elica ( desossiribonucleico DNA = DesossiriboNucleic Acid (acido 6
DNA Composizione chimica quattro diverse basi: A, G, T, C adenina (A) e guanina (G) sono purine timina (T) e citosina(c) sono pirimidine molecole di 2'-desossiribosio, che è uno zucchero (più precisamente un glucide) molecole di fosfato (H3PO4) 7
DNA Conformazione Le quattro basi si connettono tra di loro (sono complementari) secondo lo schema: T 1 A e G 1 C All esterno di ogni base si lega una molecola di 2'-desossiribosio All esterno del 2'-desossiribosio si lega il fosfato 8
DNA Conformazione Avremo quindi le seguenti aggregazioni possibili f g T A g f f g G C g f f g A T g f f g C G g f I fosfati si legano tra di loro a formare una impalcatura che si allunga con l'aggiunta di altri elementi
DNA Conformazione Possiamo così immaginare il DNA come una scala con le seguenti caratteristiche Le due impalcature costituite da fosfato e 2 - desossiribosio hanno direzioni opposte La scala subisce una torsione su se stessa (a chiocciola) ed è destrorsa
DNA Codice Ogni organismo vivente possiede un programma genetico che contiene le istruzioni necessarie per la produzione di molte molecole Le istruzioni sono scritte in un codice conservato nel DNA sotto forma di geni La sequenza lineare del DNA deve essere tradotta in modo che il codice possa essere espresso
DNA Trasferimento dell informazione Duplicazione: Il DNA duplica se stesso Trascrizione: l informazione viene resa disponibile tramite la produzione di RNA Traduzione: l RNA rende possibile il trasferimento dell informazione per la produzione di proteine ( ribonucleico RNA = RiboNucleic Acid (acido
DNA Codice La sequenza lineare dei residui nucleotidici in un acido nucleico specifica la sequenza degli amminoacidi in una proteina Si è visto che il modo più plausibile per usare tale sequenza lineare è di utilizzare un segnale costituito da tre residui nucleotidici o triplette, a cui si è dato nome di codone Dei 64 codoni possibili solo 61 specificano per gli amminoacidi, i tre restanti sono detti codoni di terminazione o codoni di stop
Codoni 15
Amminoacidi A ala alanine C cys cysteine D asp aspartate E glu glutamate F phe phenylalanine G gly glycine H his histidine I ile isoleucine K lys lysine L leu leucine M met N asn P pro Q gln R arg S ser T thr V val W trp Y tyr methionine asparagine proline glutamine arginine serine threonine valine tryptophan tyrosine 16
RNA Struttura L ossatura dell RNA consiste in un polimero di unità ribonucleotidiche, unite da legami fosfodiestere NB L RNA e non il DNA costituisce l intero materiale genetico di alcuni virus batterici e animali
RNA... e DNA L RNA differisce dal DNA per tre aspetti fondamentali: Lo zucchero dell RNA è il ribosio, non il 2 - desossiribosio La timina (una delle quattro basi) è sostituita dall uracile La molecola di RNA è formata normalmente da un unico filamento
RNA Tre differenti tipi (principali) di RNA RNA messaggero (m-rna) RNA ribosomiale (r-rna) RNA di trasporto (t-rna) Negli eucarioti si hanno anche altri tipi caratterizzati da grande e piccolo peso molecolare
RNA Approfondimento... In realtà negli eucarioti si hanno anche altri tipi caratterizzati da grande e piccolo peso molecolare hnrna (RNA nucleare eterogeneo) è il precursore del mrna maturo snrna (RNA nucleare piccolo) legato a proteine in complessi noti come piccole particelle ribonucleoproteiche nucleari ( snurps ), che svolgono una funzione importante nella sintesi del mrna.
Geni Il gene è l'unità ereditaria degli organismi viventi La maggior parte dei geni codifica per proteine, le macromolecole maggiormente coinvolte nei processi biochimici e metabolici della cellula NB Molti geni, però, non codificano per proteine, ma producono RNA che può comunque giocare un ruolo fondamentale nella biosintesi delle proteine e nell'espressione genica 22
Geni Negli organismi procarioti la parte codificante fa parte di una singola porzione di DNA Negli organismi eucarioti la parte codificante (esoni) può essere interrotta da uno o più introni 23
Geni Negli eucarioti parte del contenuto dei geni non viene in ogni caso trascritto, ma può coordinare la stessa espressione genica Tra queste regioni figurano i promotori i terminatori gli introni 24
Geni SNP (Single Nucleotide Polymorphism) Una variazione nella sequenza di DNA che differisce rispetto ad altri organismi della stessa specie e che occorre in uno specifico nucleotide Le due versioni del nucleotide si chiamano alleli Esempio (gli alleli sono C e T in quinta posizione): AAGCCTA AAGCTTA 26
Geni Mutazioni Differenze nella sequenza di DNA in un individuo che sono rare e possono essere uniche dell'individuo (o della sua linea familiare) Polimorfismi Differenze nella sequenza di DNA che si ritrovano in molti individui, a una specifica frequenza (tipicamente 1% o maggiore in una popolazione) 27
Geni Polimorfismi e Mutazioni Tutti i polimorfismi iniziano come mutazioni, ma se vengono fissati nella popolazione e raggiungono una frequenza sufficiente diventano polimorfismi Polimorfismi e SNP Polimorfismi puntiformi = SNP (Single Nucleotide Polymorphisms) sono memorizzati in specifiche banche dati 28
Geni Mutazioni patogene Le mutazioni possono essere patogene se si esprimono nel fenotipo in maniera più o meno conclamata Ci possono essere però fenomeni di compensazione che sfuggono alla contrapposizione patogeno / non patogeno (per es. anemia falciforme negli umani) 29
Cromosomi Un cromosoma è una (grande) macromolecula di DNA È costituito da un lungo pezzo di DNA e contiene geni, elementi regolatori ecc. 30
Cromosomi Non hanno esistenza fisica se non al momento della divisione cellulare quando si manifestano all interno del nucleo sotto forma di corpiccioli visibili al microscopio di varie forme e numero a seconda delle specie 31
Cromosomi Negli organismi eucarioti i cromosomi sono impacchettati da specifiche proteine (in particolare istoni) in cromatina per poter fare in modo che le molecole di DNA siano pronte per dar corso al processo di mitosi o meiosi 32
EST e cdna Le Expressed Sequence Tags (ESTs) sono dei brevi frammenti di DNA trascritti e sequenziati da una sequenza di cdna (trascrizione all'indietro di mrna risultante dopo il processo di splicing) più lunga 33
EST e cdna In sostanza le EST rappresentano parti di geni espressi e possono venire utilizzate ad esempio come sonde per identificare quali proteine vengono espresse in una cellula (ricorrendo ai microarray) la scoperta di nuovi geni per la determinazione della sequenza di un gene e della sua posizione nel genoma 34