- PCR - Digestione enzimatica - Elettroforesi TEMPO DI REALIZZAZIONE - 2 ore Biolab - 2 moduli di 4 ore hands-on Lab PREREQUISITI

Documenti analoghi
I marcatori molecolari. Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Corso di Genetica Agraria Giovanna Attene

Dal DNA all RNA. La trascrizione nei procarioti e negli eucarioti

Polimorfismi LEZIONE 6. By NA 1

Isolamento e purificazione di DNA e RNA. -Separare gli acidi nucleici da altri componenti cellulari (lipidi e proteine)

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi.

RNA polimerasi operone. L operatore è il tratto

Dal DNA alle proteine: La trascrizione e la traduzione

La regolazione genica nei eucarioti

SINTESI DELL RNA. Replicazione. Trascrizione. Traduzione

TRASCRIZIONE

Il metabolismo dell RNA. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie

SEQUENZIAMENTO DEL DNA

Struttura e funzione dei geni. Paolo Edomi - Genetica

Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY.

INTOLLERANZA AL LATTOSIO: ESEMPIO DI BIODIVERSITA GENETICA

LE MOLECOLE INFORMAZIONALI. Lezioni d'autore Treccani

PROGETTO BIOFORM Corso didattico sperimentale. Esercizio. Tipizzazione del gene PV92

RNA non codificanti ed RNA regolatori

GENETICA seconda parte

PCR. PCR o reazione di polimerizzazione a catena. Amplificazione esponenziale di DNA. Puo amplificare un tratto di DNA per piu di 1 milione di volte

LA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri

GENOMA. c varia da pochi kb nei virus a milioni di kb in piante e animali

Alberto Viale I CROMOSOMI

La reazione a catena della polimerasi (PCR) di Ofelia Leone e Vincenzo Mandarino

L adattamento dei batteri. Strategie di adattamento

I marcatori genetici e loro applicazioni nelle produzioni animali. Dott.ssa Chiara Targhetta

Metodiche di analisi del DNA (cenni) (Ingegneria genetica)

Genetica. Mendel e la genetica

Come si traccia un alimento di origine animale? Dalle lasagne con carne di cavallo. alla realtà di ogni giorno

ELETTROFORESI SU GEL

REGOLAZIONE DELL'ESPRESSIONE GENICA

Progetto della classe II C

Analisi Molecolare di sequenze di acidi nucleici

Indice dell'opera. Prefazione. Capitolo 1 Introduzione alla genetica Genetica classica e moderna Genetisti e ricerca genetica Sommario

Regolazione dell espressione genica EUCARIOTI

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine

PCR. (Reazione a catena della polimerasi) ESTRAZIONE del DNA da gel di AGAROSIO. Corso di INGEGNERIA GENETICA, Prof. Renato Fani,

Il genoma dinamico: gli elementi trasponibili

Dopo aver effettuato la PCR, all interno della soluzione oltre al tratto amplificato sono presenti: primers, dntps, Taq polimerasi e tampone di

NUCLEOTIDI e ACIDI NUCLEICI

REPLICAZIONE DEL DNA

CORSO INTEGRATO DI GENETICA

La trasmissione dei caratteri ereditari. Le leggi di Mendel ( )

COME VIENE REALIZZATA UNA RICERCA SPERIMENTALE IN BIOLOGIA MOLECOLARE?

Downloaded from Riarrangiamento dei geni per le Immunoglobuline e sviluppo dei linfociti B

= femmina. = maschio. = fenotipo banda bianca. = fenotipo pezzato. =fenotipo colore uniforme

Corso di Biologia Molecolare

Come archiviare i dati per le scienze sociali

Organizzazione del genoma umano III

A.A. 2015/2016. Statistica Medica. Corso di. CdL in Fisioterapia CdL in Podologia

TEORIA CROMOSOMICA : ALLEGATI

SUPERAVVOLGIMENTO DEL DNA (ORGANIZZAZIONE TERZIARIA DEL DNA)

Replicazione del DNA

Il flusso dell informazione genetica. DNA -->RNA-->Proteine

Linkage. Lezione 4 (riprendere il testo di Genetica ) By NA

Una proteina qualsiasi assume costantemente un unica conformazione ben definita, cui è legata la sua azione biologica.

Analisi di polimorfismi usati per la caratterizzazione di profili genetici in campioni di. DNA umano giugno 2009

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

REAZIONE A CATENA DELLA POLIMERASI. ( PCR =Polymerase Chain Reaction)

TEST BIOLOGIA 1 ANNO ABEI Da inviare a connesso@alice.it entro e non oltre il 6 novembre 2015

I libri di testo. Carlo Tarsitani

Estrazione del DNA. 1. Introduzione

STUDI SU MATERIALE GENETICO

La trascrizione negli eucarioti. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie

SINTESI PROTEICA. Replicazione. Trascrizione. Traduzione

Le Biomolecole I parte. Lezioni d'autore di Giorgio Benedetti

SAGE: Serial Analysis of Gene Expression

Come funzionano gli oligo Antisenso? RNA WORLD. mrna. Regolare l espressione genica tramite molecole di RNA. Come funzionano gli oligo antisenso?

Parte I. Prima Parte

immagine Biologia applicata alla ricerca bio-medica Materiale Didattico Docente: Di Bernardo

TECNICHE DI BIOLOGIA MOLECOLARE. LA REAZIONE POLIMERASICA A CATENA Principi teorici e aspetti pratici

Corso di. Dott.ssa Donatella Cocca

PROJECT SRL DISTRIBUZIONE DI DISPOSITIVI MEDICI E TEST RAPIDI IN VITRO

eucarioti Cellula umana contiene circa geni

LE LEGGI DI MENDEL

DOMANDA FREQUENTE: QUALE E LA FUNZIONE DI UNA CERTA PROTEINA? SI AUMENTA O SI DIMINUISCE L ESPRESSIONE DELLA PROTEINA

Maria Antonietta Lepore. Principali tecniche di biologia molecolare clinica

La traduzione: dall mrna alle proteine

Macromolecole Biologiche. I domini (III)

immagine Biologia applicata alla ricerca bio-medica Materiale Didattico Docente: Di Bernardo

Dott.ssa Ilaria Barchetta

Dott.ssa Renata Tisi. Dip. Biotecnologie e Bioscienze Ed. U4 Tel renata.tisi@unimib.it

La mutazione è una modificazione della sequenza delle basi del DNA

Biosintesi non ribosomiale di metaboliti peptidici bioattivi

Appunti sulla Macchina di Turing. Macchina di Turing

Uso di base delle funzioni in Microsoft Excel

Vettori di espressione

PRINCIPALI TIPI DI PCR a) PRINCIPALI TIPI DI PCR b)

GENETICA MENDELIANA NELL UOMO

Banca dati Professioniste in rete per le P.A. Guida all uso per le Professioniste

GENETICA... lessico. Genetica: studio dei geni e dell'ereditarietà

Figura 1. Rappresentazione della doppia elica di DNA e struttura delle differenti basi.

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Corso di Biologia Molecolare

Analisi molecolare dei geni

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Legami chimici. Covalente. Legami deboli

Applicazioni biotecnologiche in systems biology

Come modificare la propria Home Page e gli elementi correlati

MUTAZIONI ED EVOLUZIONE

Transcript:

GENETIC LAB LABORATORIO DIDATTICO DI GENETICA MOLECOLARE TITOLO: La Lattasi e il carattere Persistenza della Lattasi in eta adulta associato al polimorfismo rs 4988235 QUADRO GENERALE DELL ATTIVITA MODULO DI GENETICA MOLECOLARE: MATERIALE: - Laboratorio di bioinformatica Copie del testo - Laboratorio di Genetica molecolare - Testi TECNICHE UTILIZZATE IN LABORATORIO - Estrazione di DNA dalle cellule ADATTA PER : della mucosa boccale Triennio della scuola superiore - PCR - Digestione enzimatica - Elettroforesi TEMPO DI REALIZZAZIONE - 2 ore Biolab - 2 moduli di 4 ore hands-on Lab PREREQUISITI 1. CHE COS E IL DNA 9. SPLICING 2. LA STRUTTURA DEL DNA 10. SINTESI PROTEICA 3. DAL DNA AL CROMOSOMA 11. REGOLAZIONE DELL ESPRESSIONE GENICA 4. APLOIDIA E DIPLOIDIA 12. PROMOTORE 5. GENE/LOCUS/ALLELE 13. ENZIMI DI RESTRIZIONE 6. GENOTIPO/FENOTIPO 14. POLIMORFISMI 7. DUPLICAZIONE DEL DNA 15. POLIMORFISMO ALLELICO 8. TRASCRIZIONE IN mrna 16. POLIMORFISMI DI SEQUENZA CONCETTI CHIAVE ATTIVITA WEBSITE - STRUTTURA DEL DNA http://learn.genetics.utah.edu/ - GENE/LOCUS/ALLELI Virtual lab - ENZIMI DI RESTRIZIONE - POLIMORFISMO ALLELICO - APLOTIPO - LINKAGE DISEQUILIBRIUM

INDICE GUIDA PER IL DOCENTE A. Obiettivi Pag. 3 B. Background di conoscenze da fornire allo studente C. Argomenti correlati all attività di Laboratorio: Pag. 4 1. Trascrizione e maturazione dell RNA 2. Struttura ed espressione dei geni. Il promotore Pag.5 3. Polimorfismi di sequenza del DNA Pag. 8 4. Enzimi di restrizione Pag. 9 5. SNPs Pag. 10 6. Aplotipi Pag. 12 7. Analisi di Linkage Pag. 14 D. Strategia d insegnamento: 1. Attività di Bioinformatica Abstract. Prerequisiti. Concetti chiave 2. Attività hands-on in laboratorio Abstract. Prerequisiti Tecniche utilizzate in laboratorio per Pag. 16 l Analisi molecolare del DNA: PCR Termociclatori Taq polimerasi Scelta dei primer Digestione con gli enzimi di restrizione Elettroforesi su gel di agarosio Strumentazione e materiale a disposizione Principali prefissi e unità di misura usate in biologia molecolare e cellulare Testo: Bioinformatica Pag.19 Il Lattosio Pag. 25 Che cos è l intolleranza al Lattosio Pag. 26 Genetica Pag. 27 Laboratorio Pag. 28 Evoluzione Pag. 29 Letteratura scientifica sulla Lattasi Pag. 30 Glossario Pag. 31 Pagine per lo studente - Background di conoscenze Pag.32 - Istruzioni per l attività - Questionario: PRE-Test POST-Test 2

Guida per il docente A. Obiettivi: In questa attività si studia la condizione nota come Intolleranza al Lattosio correlata con l assenza dell enzima Lattasi. In alcune popolazioni (es. nord-europee) si osserva il carattere Persistenza della Lattasi, carattere mendeliano dominante che è stato correlato con uno polimorfismo a singolo nucleotide (SNP) nel gene che codifica per la Lattasi. B. Background di conoscenze da fornire allo studente 1.Leggi di Mendel e terminologia della Genetica mendeliana 2.Struttura chimica del DNA e livelli di organizzazione molecolare. 3.Duplicazione, trascrizione, traduzione 4.Meccanismi di regolazione C. Argomenti correlati all attività di laboratorio 1.Meccanismi di regolazione 2.I polimorfismi di sequenza del DNA: Enzimi di restrizione I RFLP e gli SNP Frequenza degli SNP e individuazione degli SNP 3.Aplotipi 4.Sudi di Linkage D. Strategia d insegnamento: 1. Attività di Bioinformatica: Abstract: Gli studenti navigano nel Modulo Percorso di Bioinformatica per compiere una ricerca web e per: imparare l approccio metodologico di un lavoro di ricerca Materiale: Computers con accesso a Internet Durata: Due ore Prerequisiti : Nessuno Concetti chiave: Geni, alleli, SNP, 2. Laboratorio di Genetica Molecolare Età: 16-18 anni Abstract: Il DNA genomico viene estratto dalle cellule della mucosa buccale. Il polimorfismo C/T-13910 è identificato mediante PCR. I prodotti della PCR vengono quindi digeriti con l enzima di restrizione HinfI. La succesiva corsa elettroforetica evidenza il genotipo relativo al polimorfismo: CC, TT, o CT. Prerequisiti: DNA, cromosomi, proteine, ereditarietà mendeliana Concetti chiave: Il meccanismo e il significato evolutivo di questa variazione definita come Persistenza della Lattasi introduce alla comprensione delle interazioni geneambiente. 3

Argomenti correlati all attività di laboratorio 1. I meccanismi di regolazione della trascrizione L informazione genetica contenuta nelle sequenze del DNA viene trasferita all RNA e dall RNA al polipeptide corrispondente. Durante la trascrizione, un complesso proteico, comprendente l enzima RNA polimerasi, sintetizza le molecole di RNA sullo stampo delle sequenze di DNA che costituiscono le unità di trascrizione. La RNA polimerasi si lega al sito d inizio della trascrizione insieme ad altre proteine, dette fattori di trascrizione. Questi fattori, mediante l interazione con brevi sequenze di DNA presenti nella regione a monte dell inizio della trascrizione (promotore), servono a posizionare la RNA polimerasi nel sito giusto e a separare i due filamenti di DNA per formare la bolla di trascrizione. L enzima usa come stampo uno dei due filamenti di DNA in direzione 5 ->3, catalizzando il legame fosfodiestere tra il gruppo ossidrilico legato al C3 del ribonucleotide precedente e il fosfato del nuovo ribonucleotide. Il processo continua fino a che la polimerasi incontra una sequenza di arresto. A questo punto si stacca e libera la catena di RNA, mentre la bolla di trascrizione si richiude e il DNA riassume la conformazione a doppia elica. L RNA neosintetizzato ha la sequenza di basi identica a quella di uno dei due filamenti di DNA (il filamento senso), anche se la Timina è sostituita dall Uracile. Da uno stesso gene possono essere trascritte consecutivamente numerose copie di RNA e il livello di trascrizione dipende da complessi meccanismi (vedi la regolazione della trascrizione). E importante ricordare che le cellule eucariotiche possiedono tre tipi di RNA polimerasi: - RNA polimerasi I trascrive i geni degli RNA ribosomiali - RNA polimerasi II trascrive i geni che codificano proteine sintetizzando i precursori degli RNA messaggeri e anche alcuni piccoli RNA - RNA polimerasi III trascrive i geni di tutti gli RNA transfer, un RNA ribosomiale e altri piccoli RNA. I precursori degli mrna neosintetizzati (trascritti primari) devono subire una serie di modificazioni prima di essere trasferiti nel citoplasma per venire tradotti sui ribosomi. Questo processo di maturazione degli mrna include le seguenti modificazioni. Aggiunta all estremità 5 di un cappuccio (cap). Al primo nucleotide all estremità 5 della molecola di RNA nascente viene rimosso il fosfato terminale e viene aggiunta una molecola di Guanosina monofosfato (GMP) metilata in posizione 7. Il capping serve per proteggere il trascritto dall attacco delle esonucleasi che lo degraderebbero, e per facilitare il trasporto dal nucleo al citoplasma. Rimozione di alcune sequenze che non vengono tradotte (processo di splicing). Quasi tutti i geni eucariotici sono divisi in sequenze codificanti, chiamate esoni, e sequenze non tradotte, dette introni. Questi ultimi vengono rimossi dai trascritti primari mediante il processo di splicing. Gli introni sono quindi sequenze di DNA, situate tra due esoni, le quali sono trascritte ma non tradotte. Salvo rare eccezioni, gli introni iniziano sempre con i nucleotidi GT e terminano con i nucleotidi AG (regola GT-AG). Nel processo di splicing si verifica prima la scissione all inizio dell introne (5 ), poi l estremità libera dell introne si ripiega su se stessa formando una struttura simile ad un laccio e infine avviene il taglio a livello della giunzione 3 dell introne. Quindi i due esoni si uniscono mentre l introne va perso. Una struttura macromolecolare (costituita da varie subunità di molecole di piccoli RNA nucleari, gli snrnp, e da una serie di proteine specifiche) promuove e controlla le reazioni dello splicing. Aggiunta all estremità 3 di una coda poli-a. La maggior parte delle unità di trascrizione hanno una breve sequenza (AATAAA) che specifica il sito di termine della trascrizione. Circa 15-30 nucleotidi a valle di questo sito, l RNA neosintetizzato viene scisso da un enzima, una endonucleasi, e alla molecola di RNA vengono aggiunti circa 200 residui di Adenosina monofosfato (AMP). Questa coda di poli-a ha lo scopo di stabilizzare le molecole degli mrna maturi e di facilitare il loro trasporto dal nucleo al citoplasma. 4

2. STRUTTURA ED ESPRESSIONE DEI GENI Dal punto di vista della genetica molecolare per gene s intende una sequenza di DNA potenzialmente trascrivibile in RNA funzionalmente attivo. Tale RNA può svolgere direttamente una funzione strutturale e/o catalitica (rrna, trna) oppure trasportare l informazione per la sintesi di una proteina (mrna). Nel genoma umano si stima che siano presenti circa 23.000 geni codificanti proteine e 1000-2000 geni codificanti RNA strutturali. Da recenti studi emergerebbe però l esistenza di diverse migliaia (o decine di migliaia) di trascritti non codificanti che potrebbero non avere alcuna funzione o, viceversa, svolgere un ruolo fondamentale nella regolazione della conformazione della cromatina e della trascrizione di geni codificanti proteine. IL PROMOTORE La regione a monte del sito d inizio della trascrizione è detta promotore. La numerazione dei nucleotidi inizia da -1, che corrisponde al nucleotide che precede il sito d inizio della trascrizione (indicato con +1). In questa regione, di lunghezza variabile, si trova una serie di brevi sequenze che vengono riconosciute e legate da fattori di trascrizione. I fattori di trascrizione favoriscono il legame dell RNA polimerasi al sito giusto per iniziare la sintesi di RNA. I geni che presentano elevati livelli di trascrizione, presentano nel promotore delle sequenze specifiche ( i TATA box a circa -25 bp dal sito d inizio della trascrizione; il CAAT box, a -80 bp dal sito d inizio della trascrizione, i GC box). Accanto a sequenze comuni a molti promotori vi sono elementi che sono riconosciuti da fattori di trascrizione tessuto-specifici. Anche i geni che mostrano un espressione tessuto-specifica vengono spesso trascritti a livelli molto bassi in tutte le cellule. Vi sono altre sequenze che vengono riconosciute da fattori di trascrizione quali gli elementi di risposta, localizzati nel promotore o nella regione 5 del gene, e gli elementi indicati come enhancer (intensificatori), che servono per aumentare i livelli basali della trascrizione e sono localizzati a distanza variabile dal gene, talvolta anche a valle del sito d inizio della trascrizione, vale a dire all interno della regione trascritta. promotore CG CG CAAT TATA box Box box box Sito d inizio della trascrizione +1 5 UTR ATG >>>>>>>>>>>>> TRASCRIZIONE direzione di lettura del gene segnale di polia sito polia codone di stop GT AG GT AG esone 1 introne 1 esone 2 introne 2 esone 3 3 UTR precursore dell mrna CAP GT AG GT AG AAA SPLICING mrna MATURO CAP AAAAA 5

3. REGOLAZIONE DELLA TRASCRIZIONE Due sono le condizioni perché si abbia una efficace trascrizione: 1. La presenza nella cellula di specifici fattori di trascrizione che interagiscono con brevi sequenze nel promotore del gene e con sequenze enhancer e consentono l assemblaggio del complesso di trascrizione 2. Una conformazione della cromatina del gene aperta,ovvero i nucleosomi non compattati e, possibilmente, il DNA non associato agli istoni nel promotore. Il controllo dell espressione genica mediante il legame di fattori proteici con le sequenze di regolazione è estremamente complesso e coinvolge numerosi fattori che possono essere grossolanamente distinti in fattori ubiquitari e tessuto-specifici. L interazione di fattori specifici con gli elementi enhancer è importante per l espressione genica tessuto-specifica. Elementi regolatori della trascrizione 1.fattori di trascrizione 2.elementi cis-acting 3.elementi di regolazione distanti anche 1 Mb 4.Promotori alternativi/multipli 5.Modificazioni in DNA e istoni(acetilazioni o mutilazione)/accessibilità alla cromatina 6.piccoli RNAs di tanti tipi. Enhancers Gli enhancers sono sequenze nucleotidiche cis-agenti che esplicano la loro funzione aumentando notevolmente (fino a 200 volte) la frequenza di trascrizione del gene che controllano. Dal punto di vista strutturale, un enhancer non differisce molto da un promotore.gli enhancers non devono necessariamente essere vicini ai promotori: è possibile infatti trovare degli enhancer a parecchie centinaia di migliaia di paia di basi di distanza a valle o a monte del sito d'inizio della trascrizione. Elementi cis-acting Cis-acting generalmente significa che agisce sulla stessa molecola. Nel contesto della regolazione della trascrizione, sono generalmente considerati elementi cisacting delle sequenze di DNA, che attraverso i fattori di trascrizione,regolano l espressione dei geni sullo stesso cromosoma. Un esempio di sequenza regolatoria cis-acting è l operatore dell operone lac. 6

Questa sequenza di DNA è legata dal repressore lac che impedisce la trascrizione dei geni adiacenti sulla stessa molecola di DNA. Possiamo dire quindi che l operatore lac agisce in cis nella regolazione dei geni vicini. L operatore non codifica per alcuna proteina o RNA. Vi sono inoltre numerosi altri meccanismi da cui dipende il meccanismo dell espressione genica, come l attivazione dei fattori di trascrizione in seguito al legame di un ligando, per esempio un ormone, ad uno specifico recettore sulla superficie cellulare. Infatti l espressione di molti geni è controllata da un ormone, da un fattore di crescita o da una molecola di segnale intracellulare (es. camp) i quali legandosi a recettori specifici determinano l attivazione o inattivazione di determinati fattori di trascrizione (es. mediante la loro fosforilazione o defosforilazione). I fattori attivati interagiscono quindi con gli elementi di risposta presenti nel promotore e inducono l espressione del gene corrispondente. Notevoli progressi sono stati fatti recentemente nell identificazione di modificazioni della cromatina associate a una conformazione aperta (attiva) o compatta (inattiva). Tali modificazioni sono dette epigenetiche, perché non modificano la sequenza primaria del DNA. Generalmente la cromatina attiva è caratterizzata da un alto livello di acetilazione degli istoni H3 e H4. Al contrario, gli istoni associati alla cromatina inattiva, non trascritta, sono tutti deacetilati. Un altra modifica degli istoni è la metilazione. La metilazione epigenetica più studiata riguarda però lo stesso DNA e consiste nella metilazione delle citosine, tipica delle regioni non trascritte e dei promotori di geni trascrizionalmente inattivi. Le citosine metilate vengono riconosciute da proteine determinando il reclutamento di altre proteine che modificano la cromatina e la compattano, facilitando l inattivazione trascrizionale del gene stesso. STRUTTURA ESONI-INTRONI Il primo esone comincia al sito d inizio della trascrizione, ma il primo tratto (fatto di 200-300 bp) non è codificante; questo segmento pertanto è trascritto, ma non tradotto e viene indicato come regione 5 UTR ( UnTraslated Region). La regione 5 UTR è importante per l efficienza della traduzione in quanto facilita il legame dell mrna ai ribosomi. La regione tradotta inizia generalmente con ATG, nel 1 esone. Il numero degli esoni presenti nei geni umani è altamente variabile. Vi sono geni piccoli costituiti da un singolo esone e altri che possiedono più di 100 esoni. Il numero medio è di 9-10 esoni per gene. I singoli esoni sono generalmente piuttosto piccoli con dimensioni medie di circa 200bp, ma esistono alcuni esoni eccezionalmente lunghi che possono superare anche le 5 kb. Al contrario degli esoni, la dimensione degli introni è molto variabile. Generalmente i geni piccoli hanno introni piccoli, mentre in quelli più grandi gli introni possono avere anche una lunghezza di 10-20 kb. Quasi tutti gli introni cominciano con GT (sito donatore di splicing) e terminano con AG (sito accettore di splicing). Questi dinucleotidi sono circondati da sequenze consenso, altamente conservate nel corso dell evoluzione e molto simili tra loro. Il processo di splicing deve essere molto preciso dato che lo spostamento anche di un singolo nucleotide determinerebbe lo slittamento del modulo di lettura e quindi la sintesi di una proteina alterata. L ultimo esone, così come il primo, contiene una sequenza trascritta, ma non tradotta, detta regione 3 UTR. TRASCRITTI ALTERNATIVI E ISOFORME PROTEICHE Un tempo si riteneva che ogni gene codificasse per un unico prodotto polipeptidico o molecola di RNA, mentre oggi si sa che la maggioranza di geni umani specifica due o più forme alternative di proteine (isoforme). I meccanismi con i quali vengono generate queste diverse isoforme sono: - l uso di promotori alternativi 7

- lo splicing alternativo - la poliadenilazione alternativa Si conoscono diversi geni umani che hanno due o più promotori che sono attivi specificamente in determinati tessuti e dirigono la sintesi di isoforme tessutospecifiche oppure vengono attivati durante un particolare stadio dello sviluppo. Il meccanismo più frequente con il quale si generano delle isoforme diverse è lo splicing alternativo, che consiste nell assemblaggio diffrenziale di esoni durante la maturazione dell RNA. Si stima che oltre il 60% dei geni umani produca due o più proteine mediante questo meccanismo. Molti esoni specificano domini proteici strutturali distinti che possono essere combinati in modo diverso nelle cellule dei diversi tessuti nei quali il gene è espresso. Pertanto a partire da un singolo gene possono venire generate proteine simili, ma non identiche che possono avere funzioni diverse nei vari tessuti. 4. POLIMORFISMI DI SEQUENZA DEL DNA Il termine polimorfismo significa esistenza di forme diverse. In genetica, il polimorfismo può essere analizzato sia a livello proteico che di materiale genetico. In questo secondo caso, le forme diverse, ossia le varianti genetiche possono riguardare un gene, vale a dire un tratto di DNA codificante una proteina (polimorfismo allelico), oppure un tratto di DNA non codificante (polimorfismo di sequenza). Queste diversità di sequenza si definiscono polimorfismi e dato che più del 98% del DNA umano è DNA non codificante, e che quindi la maggior parte di queste differenze è localizzata in sequenze non codificanti, il fenotipo di un polimorfismo di sequenza del DNA non è riconoscibile dall esterno (ex. nei gruppi sanguigni). Dato l elevato numero di loci polimorfici, i polimorfismi di sequenza sono molto più frequenti dei polimorfismi allelici tradizionali (gruppi sanguigni, albinismo, colore degli occhi, ecc..) e conseguentemente più utili nella ricerca biologica e medica. E stato osservato che il DNA di due individui differisce per circa un nucleotide ogni 500/1000. Quando un polimorfismo interessa una sequenza riconosciuta da un Enzima di Restrizione, la variazione, creando o distruggendo il sito di restrizione, darà luogo a differenze nei siti di taglio di quel dato enzima all interno della popolazione. Digerendo con quell enzima il DNA di individui diversi, si osserva quindi un polimorfismo di lunghezza dei frammenti di restrizione RFLP - e cioè dal DNA di individui diversi si generano frammenti di restrizione diversi. Come tutti i polimorfismi, i RFLP possono essere equiparati ad alleli codominanti di un locus mendeliano: la presenza o assenza di uno o dell altro allele può essere riconosciuta in ogni individuo, consentendo la distinzione in omozigoti ed eterozigoti. Il fenotipo di un RFLP è evidenziabile in termini di differenze di numero e/o dimensione dei frammenti di DNA ottenuti con la digestione con un certo enzima di restrizione. I frammenti sono visibili dopo migrazione elettroforetica su un gel. L avvento della genetica molecolare ha permesso di identificare i polimorfismi del DNA, che sono diventati i marcatori genetici più comunemente usati. Attualmente si utilizzano tre tipi di polimorfismi del DNA: i Polimorfismi di Lunghezza dei Frammenti di Restrizione, o RFLP i Polimorfismi del Singolo Nucleotide, o SNP i Polimorfismi di Lunghezza di Sequenze Semplici, o SSLP che vengono poi distinti in VNTR (Variable Number of Tandem Repeats) o minisatelliti, e i STR (Simple Tandem Repeats ) o microsatelliti. 8

5. GLI ENZIMI DI RESTRIZIONE Un sito di restrizione o sequenza consenso viene definito come una particolare sequenza di DNA riconosciuta da un enzima di restrizione o endonucleasi come il punto in cui tagliare la molecola di DNA. Questi siti sono generalmente palindromici (cioè possono essere letti in entrambe le direzioni) la cui successione di basi è identica su entrambi i filamenti quando ciascuno di essi venga letto in direzione 5 -> 3. La sequenza riconosciuta non è unica e varia da enzima ad enzima, anche se con la stessa specificità di sequenza. Infatti, sebbene gli enzimi di restrizione isolati siano oltre 3500, le sequenze bersaglio che possono essere tagliate sono molto meno numerose (poco più di 200 ). I siti di restrizione sono delle normali sequenze di basi, lunghi dai 4 fino a diverse decine di paia di basi, per cui si possono trovare più o meno facilmente nel genoma. Un enzima di restrizione può tagliare all interno di una sequenza o nelle sue vicinanze, oppure la sequenza consenso può anche essere distante diverse centinaia di basi. Il taglio prodotto dagli enzimi può generare frammenti di DNA con estremità piatte (blunt), o sporgenti ( 5 -protruding e 3 -protruding). Le estremità prodotte sono appiccicose, cioè possono formare ponti Idrogeno tra le due code a filamento singolo complementari. Le estremità coesive facilitano inoltre la reazione della DNA ligasi. L enzima EcoRI produce un taglio sfalsato creando due estremità coesive a singolo filamento al 5 (5 -protruding): 5...G/ AATTC.. 3 3...CTTAA /G...5 L enzima HhaI opera un taglio sfalsato creando due estremità coesive a singolo filamento al 3 (3 -protruding ) : 5 G C G /C 3 3 C/G C G 5 Nome enzima Organismo di provenienza Sequenza d riconoscimento e posizione di taglio Pronuncia EcoRI E.Coli RY13 G/A A T T C C T T A A/G HindIII BamHI Haemophilus influenzae Rd Bacillus amyloliquefaciens A/A G C T T T T C G A /A G/G A T C C C C T A G/G Eco-ri-uno Acca-ind-tre Bam-acca-uno ENZIMI DI RESTRIZIONE. Sono prodotti dai batteri che li utilizzano per difendersi da un DNA estraneo, esempio un virus Altri enzimi (le metilasi ) proteggono il DNA batterico grazie all azione delle proprie endonucleasi di restrizione. Gli ER si indicano con un sistema di lettere e numeri che si riferisce al ceppo batterico da cui sono stati isolati. 9

6. Polimorfismo a singolo nucleotide o SNPs (Single nucleotide polymorphism / Polimorfismo di sequenza di un singolo nucleotide) Un polimorfismo a singolo nucleotide (in inglese Single Nucleotide Polymorphism o SNP, pronunciato snip) è un polimorfismo (cioè una variazione a livello di una sequenza di acidi nucleici) che si presenta tra individui della stessa specie, caratterizzata da una differenza a carico di un unico nucleotide C T A A/G G T A SNP Gli SNPs sono sostituzioni di un singolo nucleotide di una base con un altra. Naturalmente, possiamo avere 4 versioni per ogni SNP, una per ogni nucleotide,a,c,g e T e la distribuzione nella popolazione potrebbe risultare in una delle seguenti combinazioni. Gli SNP si verificano nella popolazione con una frequenza maggiore all 1%. Sono stati individuati molti SNPs nella sequenza del DNA e la sfida per la ricerca è identificare gli SNPs correlati con un particolare effetto nel fenotipo. Nel genoma umano si verificano SNPs all incirca uno ogni 300 paia di basi. Questo significa che su 3 miliardi di nucleotidi presenti nel genoma umano - avremo circa 10 milioni di SNPs. Gli SNPs costituiscono il 90% di tutte le variazioni genetiche umane. Un polimorfismo noto è quello dei gruppi sanguigni, ~20 loci Non bisogna confondere una mutazione puntiforme con uno SNP! Anche se si assomigliano, non sono la stessa cosa. - sono entrambe differenze di singoli nucleotidi, ma per parlare di SNP bisogna che questo sia presente in almeno l 1% della popolazione. - molte mutazioni correlate a malattie si trovano all interno delle regioni codificanti del gene o in quelle regolatorie e interessano la proteina corrispondente a quel gene. Viceversa, gli SNPs non sono necessariamente localizzati nei geni, e non sempre alterano la funzione di una proteina. Gli SNPs sono divisi in due principali categorie: Linked SNPs (detti anche indicative SNPs) non si trovano all interno dei geni e non alterano la funzione della proteina. Tuttavia sono correlati con una particolare risposta ai farmaci o al rischio di ammalarsi di una certa malattia prodotta. Causative SNPs alterano il funzionamento di una proteina, correlando con una malattia o influenzando la risposta individuale ad una terapia (farmaco).si distinguono 2 tipi di Causative SNPs: - Coding SNPs,localizzati nella regione codificante del gene, cambiano la sequenza di aminoacidi nella proteina 10

- Non-coding SNPs, localizzati nelle sequenze regolatorie del gene, modificano il livello di espressione del gene e quindi la quantitò di RNA e di proteina prodotta. I POLIMORFISMI DEL DNA sono utili come: IDENTIFICATORI INDIVIDUALITA : o controllo relazioni parentali in famiglie con malattie mendeliane o Genetica di popolazione o Indagini di paternità o Indagini di medicina legale MARCATORI GENETICI ANALISI DI LINKAGE o per identificare geni-malattia ( diagnosi portatore) o mappaggio sia genetico (ordinamento dei geni sui cromosomi) che fisico (distanza fisica tra i geni) Come si individuano i Polimorfismi? Per analisi diretta della sequenza del DNA : PCR + elettroforesi ( agarosio+ et.br./acrilamide+ et.br./acrilamide+fluoresc.) microchip Un metodo utile per individuare gli SNPs è la valutazione dei cosiddetti polimorfismi di lunghezza dei frammenti di restrizione (Restriction fragment length polymorphisms) o RFLP. Se un allele contiene un sito di riconoscimento per un enzima di restrizione ed un altro no, la digestione dei due alleli genererà due frammenti di dimensione differente. In realtà oggi gli SNPs sono studiati principalmente attraverso i microarrays, che permettono l analisi simultanea di centinaia di migliaia di diversi SNPs ed una veloce analisi elaborata da un computer. 11

7. APLOTIPO Al fine di trovare una associazione tra SNPs e la risposta a un farmaco, gli scienziati hanno considerato una serie di SNPs su un segmento più lungo di DNA. C T/C G A C T A A/G G A C C G/T A SNP SNP SNP Questi tre SNPs possono combinarsi in 2 3 ( ognuno dei tre SNPs con i due possibili nucleotidi), cioè otto differenti combinazioni. C T G A C T A A G T A C C G A C T G A C T A A G T A C C T A C T G A C T A G G T A C C G A C T G A C T A G G T A C C T A C C G A C T A A G T A C C G A C C G A C T A A G T A C C T A C C G A C T A G G T A C C G A C C G A C T A G G T A C C T A POSSIBILI COMBINAZIONI DI SNPs Ogni combinazione di SNPs è chiamata APLOTIPO. Quindi, possiamo dire che in questa regione di DNA ci sono 8 possibili aplotipi. C T G A C T A A G T A C C G A APLOTIPO 1 C T G A C T A A G T A C C T A APLOTIPO 2 C T G A C T A G G T A C C G A APLOTIPO 3 C T G A C T A G G T A C C T A APLOTIPO 4 C C G A C T A A G T A C C G A APLOTIPO 5 C C G A C T A A G T A C C T A APLOTIPO 6 C C G A C T A G G T A C C G A APLOTIPO 7 C C G A C T A G G T A C C T A APLOTIPO 8 Quando studiamo i campioni di DNA di un vasto gruppo di popolazione,possiamo notare che solo quattro di queste combinazioni sono presenti. Infatti, anche nella realtà, spesso noi possiamo vedere solo alcuni dei possibili aplotipi C T G A C T A A G T A C C G A APLOTIPO 1 C T G A C T A G G T A C C G A APLOTIPO 3 C C G A C T A A G T A C C T A APLOTIPO 6 C C G A C T A G G T A C C T A APLOTIPO 8 12

aplotipo 6 aplotipo 8 aplotipo 1 aplotipo 3 RICORDA! Nel mondo della Genetica, ogni cosa è in paia : noi riceviamo un aplotipo dalla madre e uno dal padre. Questo significa che abbiamo due aplotipi ( o un paio di aplotipi). mamma papa C C G A C T A A G T A C C T A aplotipo della mamma C T G A C T A A G T A C C G A aplotipo del padre I due aplotipi ereditati dal figlio sono differenti figlio f C T G A C T A A G T A C C G A aplotipo della madre C T G A C T A A G T A C C G A aplotipo del padre I due aplotipi ereditati dal figlio sono identici SNP PROFILE.. che cos è? LA COPPIA DI APLOTIPI è lo SNP PROFILE SNP PROFILE C C G A C T A A G T A C C T A aplotipo della mamma C T G A C T A A G T A C C G A aplotipo del padre C T G A C T A A G T A C C G A aplotipo del padre C T G A C T A A G T A C C G A aplotipo della madre C T G A C T A A G T A C C G A aplotipo del padre Quando i ricercatori studiano la risposta di un individuo ad un farmaco, essi devono considerare quello SNP profile, unico della persona C T G A C T A A G T A C C G A aplotipo del padre 8. ANALISI DI LINKAGE (o di Associazione o di Concatenazione) 13

Permette di determinare la posizione cromosomica del locus responsabile di un carattere genetico o di una determinata malattia rispetto a marcatori genetici di cui è nota la posizione. Un marcatore genetico è un qualunque carattere che risponde alle seguenti caratteristiche: - è polimorfico - è facile da identificare e stabile nelle generazioni - segrega in modo mendeliano Quali sono? RFLP,VNTR, STR, SNP. Ogni individuo possiede due copie di ciascun allele, uno ereditato dal padre e uno dalla madre. Durante la meiosi i cromosomi omologhi segregano separatamente. Quindi, se consideriamo due loci polimorfici situati su cromosomi diversi, un particolare allele del primo locus avrà il 50% di probabilità di segregare insieme ad un particolare allele del secondo locus. Se consideriamo invece due loci situati sullo stesso cromosoma, ci aspettiamo che i loro alleli vengano ereditati insieme ( cioè co-segregano) in base alla distanza che intercorre tra loro sul cromosoma. Più grande è la loro distanza, più è facile che un evento di crossing over separi i due alleli. L evento di crossing over dà luogo alla formazione di gameti ricombinanti La probabilità che avvenga questa ricombinazione, espressa in percentuale, è nota come frequenza di ricombinazione. La frequenza di ricombinazione ci dice quindi la distanza genetica tra loci diversi. L analisi di concatenazione nell uomo si basa sullo studio degli alberi genealogici e sulla ricerca delle meiosi informative (cioè quelle in cui si può identificare se un gamete è o non è ricombinante). Allo stesso modo si può mappare anche un numero consistente di loci,considerandone sempre due per volta. Un altro approccio è quello di studiare gli aplotipi, ovvero l ordine degli alleli sui rispettivi cromosomi omologhi. E quindi necessaria una rielaborazione statistica dei dati riguardanti l associazione tra i marcatori e la comparsa della malattia. Quali sono i problemi di uno studio di linkage? 1.le famiglie da analizzare solitamente contano pochi individui 2. in famiglie poco numerose vi è un basso numero di ricombinanti 3. i risultati così ottenuti hanno una bassa significatività statistica Quali sono le possibili soluzioni? 1. Analizzare più famiglie insieme Quali popolazioni studiare? 1.Popolazioni geneticamente isolate 2.Popolazioni giovani, con poche generazioni dal momento del fondatore, con pochi crossing over, con poche ricombinazioni 3.Popolazioni omogenee, cioè con poche famiglie fondatrici Esempi di popolazioni che presentano queste caratteristiche sono: - I Finlandesi: geneticamente e linguisticamente molto diversi dai loro vicini slavi.la popolazione è giovane in quanto fondata circa 2000 anni fa da poche famiglie fondatrici - I Sardi in Italia LINKAGE EQUILIBRIUM: indica una combinazione casuale di alleli a loci associati. Consideriamo per esempio il caso di due loci associati 1 e 2 con 2 possibili alleli ciascuno (A e a per il locus 1 e B e b per il locus 2) Gli aplotipi possibili in una determinata popolazione (AB, 14

Ab, ab, ab) si verificheranno con una frequenza che è il prodotto delle frequenze dei singoli alleli per ciascun aplotipo. Esempio: A = 0,2 B = 0,6 a = 0,8 b = 0,4-4 aplotipi possibili: AB Ab ab ab AB 0,2 x 0,6 = 0,12 Ab 0,2 x 0,4 = 0,08 ab 0,8 x 0,6 = 0,48 ab 0,8 x 0,4 = 0,32 equilibrio di linkage LINKAGE DISEQUILIBRIUM: indica una combinazione non casuale di alleli a loci associati. Il linkage disequilibrium è spesso la conseguenza di un effetto "founder" (fondatore), cioè di una mutazione in un singolo individuo. Perchè l'effetto fondatore sia evidenziabile in una popolazione è necessario che i due loci siano vicini, in maniera tale che gli eventi di ricombinazione siano rari tra i due loci, e che non sia trascorso abbastanza tempo dalla comparsa del fondatore poichè la ricombinazione puo' ristabilire nel tempo l'equilibrio. Il linkage disequilibrium (LD) indica la presenza di associazione preferenziale tra specifici alleli relativi a due o più loci, presenti sullo stesso cromosoma, che costituiscono di solito un particolare aplotipo ancestrale, diffuso nella popolazione in cui è rilevato, perché trasmesso lungo la discendenza da un comune progenitore. Riprendiamo l esempio dei 4 aplotipi AB, Ab, ab, ab. Se si trovassero questi valori AB = 0,04 Ab = 0,16 + ab = 0,56 + ab = 0,24 - - linkage disequilibrium TECNICHE UTILIZZATE PER L ANALISI MOLECOLARE DEL DNA 15

1. ESTRAZIONE DEL DNA. Il DNA può essere estratto da qualunque cellula nucleata. I tipi cellulari più utilizzati sono rappresentati dai leucociti di sangue periferico, colture cellulari (fibroblasti, amniociti, villi coriali). L isolamento del DNA richiede l utilizzo di enzimi capaci di distruggere le membrane cellulari e nucleari e di solventi organici in grado di separare le proteine dagli acidi nucleici. Nella procedura classica di estrazione del DNA genomico, le cellule vengono lisate e sottoposte a trattamento proteolitico con Proteinasi K, eliminata successivamente con estrazioni fenoliche. Il DNA purificato viene precipitato in Etanolo. La determinazione quantitativa della concentrazione del DNA estratto, calcolata in ng/µl, viene effettuata mediante lettura spettrofotometrica valutando l assorbanza del campione a 260 nm. 2. LA TECNICA DELLA PCR PER L ANALISI DEI RFLP L introduzione della PCR, la tecnica che consente di amplificare selettivamente un tratto di DNA, ha rivoluzionato la genetica molecolare e le sue applicazioni sono praticamente infinite. Uno degli ambiti di utilizzo è la diagnosi di malattie genetiche mediante analisi di RFLP. L utilizzo della PCR semplifica molte cose. Ad esempio, la PCR consente di analizzare uno specifico tratto di DNA, invece di dover lavorare su tutto il DNA nucleare di una cellula,ossia sul DNA genomico. La PCR (Polymerase Chain Reaction) è una tecnica di amplificazione in vitro di un frammento di DNA di cui si conosca la sequenza nucleotidica delle regioni terminali. Il principio è molto semplice. Data una sequenza di DNA genomico a doppio filamento e due corte sequenze oligonucleotidiche (primer), di cui una complementare ad un tratto di filamento a una estremità del DNA da amplificare (forward primer) e l altra complementare ad un altro tratto posto all altra estremità (reverse primer), in presenza di una DNA polimerasi termostabile e di una miscela di desossinucleotiditrifosfati(dntps), in appropriate condizioni di reazione, è possibile copiare numerosissime volte (30-40 volte) il tratto compreso tra i due primer, semplicemente facendo variare ciclicamente la temperatura di reazione. Infatti, raggiunta la temperatura di denaturazione (92-95 C), la doppia elica si apre (fase di denaturazione), rendendo disponibile lo stampo per la sintesi delle catene complementari. Se la temperatura si abbassa, in virtù delle loro minori dimensioni e della loro concentrazione, i primer si legheranno (fase di appaiamento o annealing) al DNA stampo prima che si rinaturi e in presenza di una DNA polimerasi con un optimum di temperatura elevato (circa 72 C), inizierà la sintesi di DNA a partire dai primer (fase di sintesi del DNA o extension), procedendo lungo i filamenti singoli. Al termine del primo ciclo di PCR da una doppia elica di DNA se ne ottengono due. Ripetendo il ciclo denaturazione annealing extension numerose volte (in genere da 30 a 40 volte), si ottiene una massiccia amplificazione specifica di un dato tratto di DNA, corrispondente a DNA in quantità tale da essere visualizzabile in un gel di agarosio mediante colorazione specifica. Il metodo di analisi del DNA mediante PCR presenta vantaggi molto evidenti: 1. è molto rapido (da 60 a 90 minuti), 2. la manualità è semplicissima, 3. è automatizzato, 16

4. i risultati sono visualizzabili con facilità. Il limite più grosso è rappresentato dalla necessità di conoscere le sequenze fiancheggianti il tratto di DNA che si vuole amplificare, per poter costruire i primer specifici. La PCR ha rivoluzionato la genetica molecolare. Le applicazioni della PCR sono praticamente infinite. I principali ambiti di utilizzo sono la diagnosi prenatale delle malattie genetiche e le indagini di medicina legale. I termociclatori Il successo della PCR è dovuto in gran parte alla possibilità di far avvenire l intero processo in modo automatico all interno di strumenti detti termociclatori (thermal cyclers) in grado di variare ciclicamente la temperatura tra le varie fasi di ogni ciclo di PCR. Un esempio di profilo di amplificazione standard impostato mediante un termociclatore è il seguente: 1. denaturazione del DNA: 30 sec. a 94 C 2. appaiamento(annealing)deiprimer: 30 sec. a 50-60 C 35 cicli 3. sintesi (extension)di DNA: 30 sec-5 min. a 72 C Il successo della PCR è stato possibile grazie anche all uso di una DNA polimerasi termostabile estratta da batteri termofili (che vivono ad elevate temperature). Una DNA polimerasi utilizzata nelle reazioni della PCR è la Taq polimerasi, estratta dal batterio Thermus aquaticus. L isolamento di DNA polimerasi termostabili ha sollevato gli operatori dall ingrato compito di aggiungere enzima fresco ad ogni ciclo di reazione! Scelta dei primer Per ogni PCR, è necessario usare due primer (forward e reverse). La scelta della coppia di primer è critica per una buona riuscita della PCR, ovvero per ottenere l amplificazione di un tratto di DNA in modo specifico. I primer devono essere disegnati a monte e a valle dei siti di restrizione. Si tratta di oligonucleotidi, con dimensioni comprese tra le 15 e le 30 basi che ibridano su filamenti opposti in posizioni fiancheggianti la regione di interesse del DNA. Per minimizzare la formazione di artefatti è importante che le loro sequenze non contengano basi complementari (all interno dello stesso primer o tra i due primer); inoltre la Temperatura di fusione dei due oligonucleotidi deve essere identica o almeno molto vicina. 3. Digestione con enzimi di restrizione (ER) Come abbiamo detto, gli ER sono endonucleasi che tagliano il legame fosfodiesterico nel DNA a doppia elica a livello di sequenze specifiche (siti di restrizione). La digestione con ER va condotta a 37 C in una soluzione tampone (fornita insieme all enzima dal produttore) che garantisce le condizioni ottimali (di salinità e ph) per la digestione. Il tempo di incubazione varia a seconda se si digerisce DNA genomico o frammenti di DNA corti.nel primo caso la digestione richiede almeno 8 ore (o tutta la notte). Nel secondo caso sono sufficienti da 1-4 ore. Gli ER sono reagenti costosi e delicati. Temono le contaminazioni (usare precauzioni nel prelevare l enzima dalla soluzione stock) e l inattivazione (si devono conservare a -20 C e, al momento dell uso, mantenere sempre in un bagno di ghiaccio). 4.Elettroforesi su gel di agarosio E una tecnica che consente di separare in base alle loro dimensioni (peso molecolare) molecole dotate di carica, facendole migrare su un gel in presenza di un campo elettrico. Il gel può essere immaginato come una rete tridimensionale attraverso le cui maglie migrano le molecole sotto l azione di un campo elettrico. Il campo elettrico è generato da un apparecchio, detto alimentatore. Per separare molecole di DNA si usano gel di agarosio. Le molecole di DNA sono cariche negativamente per la presenza di gruppi fosfato e migrano dal polo negativo (catodo) verso il polo positivo (anodo). Per un certo intervallo di pesi molecolari, la velocità di migrazione è funzione del loro peso molecolare: tanto più grande è la molecola di DNA, tanto minore è la velocità di migrazione. E, viceversa, tanto più piccola è la molecola di DNA, tanto più velocemente migra. Le molecole di DNA di diversa lunghezza vengono pertanto separate in base alla diversa velocità di migrazione. Per poter determinare la lunghezza delle molecole di DNA in esame separate mediante elettroforesi, vengono caricati sul gel anche i cosiddetti marcatori di peso molecolare,ossia 17

una miscela di frammenti di DNA di cui è noto il peso molecolare. Confrontando la posizione dei frammenti a peso molecolare noto con quella dei frammenti di DNA in esame, è possibile calcolarne il peso molecolare, ossia la lunghezza. Dato che il peso molecolare di un frammento di DNA è proporzionale al numero di coppie di nucleotidi (basi) che lo costituiscono, di solito esso viene espresso in paia di basi (bp). La separazione elettroforetica dura circa 45 minuti circa. Al termine, i vari frammenti di DNA, essendo incolori, possono essere visualizzati, con particolari sistemi di colorazione. Il DNA delle diverse classi di peso molecolare è visibile sotto forma di bande distinte: sono le cosiddette bande di DNA. Comunemente, per poter visualizzare il DNA, durante la preparazione del gel si aggiunge all agarosio il bromuro di etidio, una sostanza che ha la proprietà di legarsi al DNA e di emettere fluorescenza se esposta a luce UV. Alla fine della corsa, le bande si visualizzano esponendo il gel alla luce ultravioletta. Il bromuro di etidio va maneggiato con estrema cautela in quanto è un agente intercalante del DNA e, come tale, ha proprietà mutagene. Noi utilizzeremo il GEL RED, intercalante non tossico che non richiede precauzioni particolari. ATTIVITA DI BIOINFORMATICA PREMESSA: 18

Principali siti di riferimento www.ncbi.nlm.nih.gov L NCBI (National Centre for Biotecnology Information) sorto nel 1988, crea database pubblici, conduce ricerche in bioinformatica, sviluppa software per analizzare dati genomici e divulga informazioni biomediche. L obiettivo è una migliore comprensione dei processi molecolari riguardanti la salute umana e le malattie. Sul sito si trovano banche dati relative al genoma umano e di altri organismi, a sequenze nucleotidiche e aminoacidiche, a strutture molecolari, a pubblicazioni scientifiche (come PubMed, la principale banca dati bibliografica, pubblica e gratuita, del settore biomedico). In particolare NCBI Entrez comprende un database di strutture biomolecolari 3D determinate sperimentalmente: MMDB ossia Molecular Modeling DataBase. Tali strutture sono ottenute principalmente con cristallografia a raggi e spettroscopia di risonanza magnaticanucleare (NMR); forniscono informazioni sulla funzione biologica, la storia evolutiva e le relazioni tra le macromolecole. Il database è ovviamente più piccolo rispetto ai data base proteici o nucleotidici (solo di una frazione delle proteine si è determinata la struttura 3D), ma molte proteine possono considerarsi omologhe a quelle presenti. http://genome.ucsc.edu/ UCSC ( University of California Santa Cruz). Questo sito contiene le sequenze di riferimento e le schermate che mostrano un ampia collezione di genomi. Fornisce inoltre un portale di accesso al Progetto Encode. www.ensembl.org ENSAMBL ( un gioco di parole tra ensamble -insieme- e EMBL, European Molecular Biology Laboratory) è un progetto sviluppato in collaborazione tra il Sanger Center di Cambridge e EMBL per sviluppare un software di annotazione automatica dei genomi animali.con il termine annotazione si intende l inserimento di tutte le informazioni riguardanti la funzione di una determinata sequenza. Ensambl aggiorna i dati almeno 10 volte l anno. OBIETTIVO DELL ATTIVITA : 1. Cos è la Lattasi? 2. Come si fa a localizzare il gene d interesse? 3. Una volta che l ho localizzato, come trovo tutte le informazioni necessarie? 4. Come si caratterizza il gene? 6. Come riconoscere esoni ed introni? 7. Come trovare il polimorfismo a singolo nucleotide rs 4988235 correlato con LP? 8. Come interpretare i dati statistici sulle frequenze alleliche nelle popolazioni? 1. OBIETTIVO: COS E LA LATTASI? 19

Andare su GOOGLE. digitare NCBI. Aprire la Home Page. Search OMIM for LCT. Go DESCRIPTION In humans, the activities of lactase and most of the other digestive hydrolases are maximal at birth. The majority of the world's human population experiences a decline in production of the digestive enzyme lactase-phlorizin hydrolase during maturation, with the age of onset ranging from the toddler years to young adulthood. Due to the reduced lactase level, lactose present in dairy products cannot be digested in the small intestine and instead is fermented by bacteria in the distal ileum and colon. The fermentative products result in symptoms of diarrhea, gas bloat, flatulence, and abdominal pain. However, in a minority of adults, high levels of lactase activity persist in adulthood. Lactase persistence is a heritable autosomal dominant condition that results in a sustained ability to digest the milk sugar lactose throughout adulthood 20

2 OBIETTIVO Come si fa a localizzare il gene LCT? Ritorna sulla pagina iniziale del sito NCBI. Search nucleotide for lep homo sapiens. Clicca su GO. Cliccare su LCT (Homo Sapiens) Si aprirà un tipico file di GenBank. Questa pagina non è facile da leggere, ma alcune informazioni sono chiare. 3 OBIETTIVO: Come si trovano tutte le informazioni necessarie? In questa pagina leggiamo: - le Reference. Cliccando qui troverai le citazioni alle pubblicazioni in letteratura scientifica che riguardano la nostra sequenza.per leggere un abstract dell articolo che descrive il gene clicca sul link PubMed. - la posizione del gene Lct. Il gene si trova sul cromosoma 2. - Il Sommario. Qui vengono descritte le principali funzioni della Proteina Il gene 2q21 si trova sul cromosoma 2 in un enhancer noto come MCM6 4 OBIETTIVO: Come si caratterizza il gene LCT? Go to reference sequence details

Cliccare su GenBank. Compare una pagina con tutte le informazioni sul gene per la Lattasi. MA NON E QUESTO IL GENE CHE CONTIENE LO SNP!! Torna indietro Clicca su MCM6. Che cos è? Leggi Summary Clicca su NM 005915+4 Si apre la pagina con le informazioni sul gene MCM6, sugli esoni e introni di cui è fatto. Lo SNP che ci interessa sta sull introne 6. 5. Individuazione del Polimorfismo SNP rs 4988235 Ritorna in cima alla pagina dell NCBI. Su Search cerca SNP for MCM6 22

Clicca su rs 4988235 Scorrendo la pagina si ha la sequenza contenente lo SNP Sotto ancora Cliccare su Open sequence viewer in a new window.si apre una nuova finestra sullo SNP VAI SU GO TO POSITION/RANGE SE VADO SU SEQUENCE E SCRIVO L INIZIO E LA FINE DELLA SEQUENZA AMPLIFICATA 26611-26811 OTTENGO 23

6. Genetica delle popolazioni Quali frequenze alleliche di riferimento si riscontrano nella popolazione caucasica? 24

Il Lattosio Il lattosio è uno zucchero riducente destrogiro. E costituito da una molecola di ß D-(+)-galattosio e da una di ß D-(+)-glucosio uniti da un legame β(1 4) glicosidico. È l'unità del D-(+)-glucosio ad avere il gruppo aldeidico "libero" responsabile delle proprietà riducenti del lattosio. Il lattosio rappresenta il 98% degli zuccheri presenti nel latte (di mucca, di capra, di asina oltre che nel latte di donna). E contenuto oltre che nel latte (circa il 40 % della massa secca, 3.5-4% sul tal quale), anche nei suoi derivati (formaggi e yogurt) e in prodotti a base di siero di latte Lattasi La Lattasi,nota anche come Lattasi-Florizina Idrolasi è una ß-galattosidasi responsabile dell idrolisi del Lattosio in Glucosio e Galattosio. I due monosaccaridi vengono assorbiti dagli enterociti intestinali e passano nel circolo sanguigno; il Glucosio viene utilizzato come fonte energetica e il Galattosio diventa un componente dei Glicolipidi e delle Glicoproteine. La Lattasi ha due attività: un attività ß-glicosidica idrolizzante il Lattosio e un attività ß-glicosidica per l idrolisi della Florizina,un disaccaride trovato nelle radici e nella corteccia di piante della famiglia delle Raosacee e di alcune alghe marine. La Lattasi è sintetizzata come Pro-Lattasi, un polipeptide di 220 Kda che subisce una considerevole modificazione post-trascrizionale durante il trasporto alla superficie cellulare nella forma matura di Lattasi di 150 Kda. Dimerizza sulla membrana dell orletto a spazzola per formare l enzima attivo. Anche fattori presenti nel lume intestinale contribuiscono alla modifica della proteina per produrre l enzima attivo mediante separazione di due ulteriori aminoacidi da parte della Tripsina pancreatica. Il polipeptide scisso non ha apparentemente una funzione enzimatica,ma può funzionare come una molecola adiuvante (chaperone). La Lattasi ha un dominio C-terminale sulla membrana che sporge verso il lume gastrointestinale. Il sito della Florizina è utilizzato per diverse funzioni e questo spiega perché l attività di alcuni enzimi che fa seguito alla diminuzione dell espressione enzimatica dopo lo svezzamento con il latte materno. ( Fig.1) Fig.1 25

Che cos è l intolleranza al lattosio? È l incapacità dell intestino a scindere il lattosio (si trova nel latte di mucca, di capra, di asina oltre che nel latte di donna) nei due zuccheri semplici, il glucosio e il galattosio, che sono assorbibili dall intestino. L intolleranza al Lattosio è una condizione molto comune caratterizzata dalla mancanza di Lattasi,un enzima che si trova nell orletto a spazzola della mucosa intestinale e idrolizza il Lattosio a galattosio e glucosio. Nei neonati sono presenti alte concentrazioni di questo enzima. Dopo l allattamento si verifica una riduzione della sua attività, irreversibile e geneticamente programmata e che si manifesta come un malassorbimento primario di Lattosio,la più comune carenza enzimatica. Tale incapacità è data dalla mancanza totale o parziale dell enzima lattasi che si trova a livello della superficie delle cellule che rivestono l intestino. La permanenza del lattosio come tale nell'intestino ne determina l'utilizzo da parte della flora batterica intestinale responsabile della fermentazione (da questo processo si ha una grande produzione di gas e acidi organici) ed essendo il lattosio una sostanza osmoticamente attiva richiama nel colon acqua e sodio impedendo la formazione delle feci solide. I sintomi più comuni dell intolleranza al lattosio sono: * dolori addominali di tipo crampiforme * meteorismo intestinale * diarrea * in rari casi è anche presente perdita di peso e malnutrizione La gravità della sintomatologia dipende dalla quantità di lattosio che ogni individuo riesce a tollerare. Molto spesso i sintomi, soprattutto i dolori addominali e la diarrea, compaiono poco dopo l assunzione di alimenti contenenti lattosio. L'intolleranza al lattosio può essere congenita,primaria, secondaria e transitoria. CARENZA CONGENITA DI LATTASI è estremamente rara è dovuta a mutazioni nella regione codificante del gene per la lattasi (autosomal recessively inherited severe gastrointestinal disorder of infants). CARENZA PRIMARIA DI LATTASI è dovuta alla totale o parziale assenza di Lattosio che si sviluppa nell infanzia a varie età in differenti gruppi razziali. E la più comune causa di intolleranza al Lattosio ed è anche conosciuta come IPOLATTASIA ADULT TYPE o NON PERSISTENZA DELLA LATTASI o CARENZA EREDITARIA DI LATTASI. E la carenza enzimatica più diffusa nel mondo.e una condizione autosomica recessiva derivante dalla diminuzione dell attività dell enzima Lattasi-Forizina nelle cellule intestinali. CARENZA SECONDARIA DI LATTASI è solitamente dovuta ad un deterioramento della mucosa intestinale secondario ad un processo infiammatorio o infettivo. Il problema in questo caso è temporaneo e dura fino a che non si sia risolta la causa primaria. Può comparire ad ogni età, ma è più comune nell infanzia. CARENZA TRANSITORIA DI LATTASI è oggi definita come una carenza di lattosio relativa osservata tra i neonati pretermine di meno di 34 settimane di gestazione. Sebbene la Lattasi sia un enzima non inducibile, una alimentazione supplementare con Lattasi può favorire la produzione e l espressione dell enzima. 26