La trascrizione nei procarioti
Concetti base Nucleoside base purinica o pirimidinica legata alla posizione 1 dell anello pentoso Nucleotide base azotata-pentoso-fosfato
Concetti base La trascrizione comporta la sintesi di una catena di RNA che ha la stessa sequenza di un filamento di una doppia elica di DNA. Il filamento di DNA identico in sequenza all RNA è chiamato filamento codificante il filamento codificante è ovviamente complementare all altro filamento, che funge da stampo per la sintesi dell RNA, ed è chiamato per questa ragione filamento stampo o filamento noncodificante. La sintesi della catena di RNA è catalizzata dall enzima RNA polimerasi. La trascrizione comincia quando la RNA polimerasi si lega ad una particolare regione di DNA, chiamata promotore, che si trova all inizio del gene. fa parte della sequenza del promotore la prima coppia di basi trascritta in RNA, chiamata sito di inizio o punto di inizio della trascrizione. Partendo dal sito di inizio, la polimerasi si muove lungo lo stampo sintetizzando l RNA, fino a che non raggiunge una sequenza chiamata terminatore quest azione definisce l unità di trascrizione, che si estende dal promotore al terminatore; l unità di trascrizione è quindi una sequenza di DNA che viene espressa mediante la sintesi di una singola molecola di RNA una unità di trascrizione può codificare per più di una proteina.
Concetti base Le regioni più vicine al promotore sono descritte come prossimali, mentre quelle più lontane sono descritte come distali. Le sequenze precedenti al punto di inizio sono definite sequenze a monte; quelle dopo il punto di inizio (cioè all interno della sequenza trascritta) sono definite sequenze a valle. Per convenzione, le sequenze vengono scritte in modo che la trascrizione procede da sinistra (a monte) a destra (a valle). Ciò equivale a scrivere l RNA nella solita direzione 5 3. Spesso la sequenza di DNA è scritta in modo da mostrare il filamento la cui sequenza è la stessa dell RNA. Le posizioni delle basi sono numerate in entrambe le direzioni a partire dal punto di inizio, al quale è assegnato il valore +1, e i numeri vanno poi aumentando verso valle. Procedendo verso la regione a monte, le posizioni sono numerate a partire da -1, ed aumentano allontanandosi dal punto di inizio. Il numero 0 non è assegnato a nessuna base. Il prodotto della trascrizione è chiamato trascritto primario: è una molecola di RNA che si estende dal sito di inizio al terminatore, che inizia con l estremità 5 originale e che termina con l estremità 3 originale. Il trascritto primario è sempre molto instabile. La trascrizione è il primo stadio dell espressione genica. Le proteine regolatrici determinano se un particolare gene sarà trascritto oppure no dalla RNA polimerasi. La prima (e spesso l unica) fase di regolazione dell espressione genica è la decisione se trascrivere o no un gene. Come fa la polimerasi a trovare i promotori nel DNA? questo è un esempio particolare di una domanda più generale: come fanno le proteine che legano specificamente il DNA (come gli enzimi di restrizizione) a distinguere il loro specifico sito di legame dalle altre sequenze? Come interagiscono con la polimerasi le proteine regolatrici per attivare o reprimere la trascrizione?
I due filamenti di DNA si separano per formare la bolla di trascrizione La trascrizione avviene mediante il normale processo di appaiamento di basi complementari. La sintesi dell RNA avviene all interno di una bolla di trascrizione, una regione in cui i due filamenti di DNA sono separati in maniera transiente un filamento è usato come stampo per la sintesi della catena di RNA: filamento stampo o non-codificante; l altro filamento di DNA ha la sequenza identica a quella della catena di RNA: filamento codificante. La catena di RNA è sintetizzata dall estremità 5 all estremità 3. Il gruppo 3 -OH dell ultimo nucleotide aggiunto alla catena reagisce con il nucleoside 5 trifosfato entrante, che perde i due fosfati terminali (β e γ). Per la RNA polimerasi batterica, la velocità di sintesi è di circa 40 nucleotidi/sec.
La bolla di trascrizione si muove assieme alla RNA polimerasi La RNA polimerasi crea la bolla di trascrizione quando si lega al promotore. All interno della bolla, l RNA è sintetizzato mediante appaiamento di basi con il filamento stampo del DNA. Quando la RNA polimerasi si sposta lungo il DNA, la bolla di trascrizione si sposta con l enzima, la doppia elica di DNA si riforma alle sue spalle, spiazzando la catena di RNA. Nel processo, la catena di RNA si allunga. I processi di - appaiamento delle basi - aggiunta di nucleotidi alla catena nascente di RNA sono supervisionati dalla RNA polimerasi.
Le 4 fasi della trascrizione Riconoscimento dello stampo comincia con il legame della RNA polimerasi al DNA a doppio filamento, con formazione di un complesso chiuso ; poi i filamenti di DNA vengono separati, formando un complesso aperto : la bolla di trascrizione è creata grazie ad uno srotolamento locale che comincia nel sito legato dalla RNA polimerasi. Inizio della trascrizione sintesi del primo legame nucleotidico nell RNA; l enzima resta sul promotore mentre sintetizza i primi 9 legami nucleotidici. La fae di inizio è resa più lunga dal succedersi di eventi abortivi, nei quali l enzima sintetizza brevi trascritti (<9 basi), li rilascia e ricomincia la sintesi. La fase di inizio termina quando l enzima riesce ad estendere la catena e lascia il promotore. La sequenza di DNA necessaria per il legame della polimerasi allo stampo e per l effettuazione della reazione di inizio definisce il promotore. Elongazione l enzima si muove lungo il DNA ed estende la catena di RNA. Muovendosi, l enzima srotola la doppia elica esponendo esponendo una nuova porzione dello stampo a singolo filamento. I nucleotidi vengono aggiunti all estremità 3 della catena nascente di RNA, formando un ibrido DNA-RNA nella regione srotolata. Alle spalle della regione srotolata, il filamento stampo si riappaia con il filamento codificante, riformando la doppia elica e spiazzando la catena di RNA. Terminazione riconoscimento di un punto nel quale l enzima cessa di aggiungere nucleotidi alla catena di RNA in crescita: dopo l aggiunta dell ultima base, l ibrido DNA-RNA si dissocia, la bolla di trascrizione collassa riformando la doppa elica, l enzima e l RNA si dissociano dal DNA. La sequenza di DNA che innesca questa reazioni è chiamata terminatore.
La RNA polimerasi batterica Come può un singolo enzima eseguire così tanti compiti (legame al DNA, denaturazione dei filamenti, inizio, elongazione e terminazione)? La RNA polimerasi batterica ha dimensioni di 90x95x160 Å. La struttura mostra che nell enzima c è un canale sulla superficie, largo circa 25 Å. Le dimensioni del canale permettono di contenere circa 16 paia di basi di DNA a doppia elica, ma questo rappresenta solo una parte della regione di DNA legata dall enzima durante la trascrizione. Il DNA viene srotolato nel sito attivo, dove viene sintetizzata la catena di RNA (appena iniziata nella struttura cristallografica). Nei batteri, una singola RNA polimerasi sintetizza tutto il mrna e tutti gli rrna ed i trna. Ci sono circa 7000 molecole di RNA polimerasi in una cellula batterica di E. coli e, di queste, tra i 2000 e i 5000 enzimi sono in fase attiva di sintesi.
Le subunità della RNA polimerasi batterica L enzima completo o oloenzima ha una composizione α 2 ββ σ. Il nucleo enzimatico (enzima core ) ha una composizione α 2 ββ. La subunità α è necessaria per l assemblaggio del nucleo enzimatico, ha un ruolo secondario nel riconoscimento del promotore e partecipa nell interazione della polimerasi con alcuni fattori di regolazione. La subunità σ (chiamato anche fattore σ) ha un ruolo specifico nel riconoscimento delle sequenze del promotore. Le subunità β e β formano in centro catalitico. Il canale nel quale passa il DNA è formato dall interfaccia tra le due subunità. Sia il filamento stampo che il filamento codificante interagiscono con le due subunità nella regione della bolla di trascrizione: in questa maniera l enzima stabilizza i due filamenti separati. Anche la catena di RNA interagisce con le due subunità nella regione della bolla di trascrizione. L antibiotico rifampicina (una delle cure principali contro la tubercolosi) blocca la trascrizione della RNA polimerasi batterica legandosi alla subunità β a 12 Å di distanza dal sito attivo, impedendo l uscita della catena di RNA in allungamento.
Le funzioni del nucleo enzimatico e del fattore σ Il nucleo enzimatico può sintetizzare RNA su uno stampo di DNA, ma non può iniziare la trascrizione al promotore. Il fattore σ fa si che la RNA polimeasi si leghi al promotore il fattore σ può essere o non essere rilasciato quando la catena di RNA raggiunge le 8-9 basi, eventualmente lasciando al nucleo enzimatico il compito di portare avanti l elongazione. Solo l oloenzima può iniziare la trascrizione. Il nucleo enzimatico ha una certa capacità di legare il DNA in maniera non specifica, su quello che viene chiamato sito di legame debole; il DNA in questo caso resta a doppia elica il complesso a un sito del genere è stabile, con un emivita di dissociazione di circa 60 minuti Il fattore σ riduce la capacità di legare i siti deboli di 10.000 volte, e l emivita di dissociazione diventa meno di 1 secondo. Il fattore σ conferisce anche la capacità di legare specificamente i promotori: l oloenzima riconosce un promotore circa 10 7 volte meglio di una sequenza non specifica.
L inizio della trascrizione La reazione oloenzima promotore inizia con la formazione di un complesso chiuso binario il DNA è a doppia elica; la reazione è reversibile e l affinità è dettata dalla sequenza del promotore. Il complesso chiuso è trasformato in un complesso aperto dalla fusione di una breve regione di DNA all interno della sequenza legata dall enzima (il fattore σ è coinvolto nella reazione). La serie di eventi che conduce alla formazione di un complesso aperto è chiamata legame stretto. Lo stadio successivo è l incorporazione dei primi due nucleotidi, con la successiva formazione del legame fosfodiesterico. Questo genera un complesso ternario, che contiene DNA, RNA ed enzima. Altri nucleotidi possono essere aggiunti senza che l enzima si muova, fino a generare una catena di RNA di 9 basi. Dopo l aggiunta di ogni base, c è una certa probabilità che la catena di RNA venga rilasciata, determinando un inizio abortivo, dopo il quale l enzima ricomincia dalla prima base. Superata la fase di inizio, il fattore σ non è più necessario e l enzima supera la transizione a complesso di elongazione ternario (enzima-dna-rna). Il parametro critico è il tempo necessario a lasciare il promotore, di modo che un altra polimerasi possa iniziare: il tempo minimo è 1-2 sec.
La polimerasi cambia forma durante le varie fasi di inizio Quando l oloenzima lega il DNA, copre 75-80 paia di basi, estendendosi da -55 a +20 le dimensioni della RNA polimerasi (160 Å) fanno si che essa possa coprire al massimo 50 paia di basi di DNA in forma estesa, quindi ci deve essere qualche forma di torsione in questa fase. Nella trasnsizione da inizio ad elongazione, l enzima perde contatto con la regione da -55 a -35, quindi le paia di basi coperte dalla polimerasi diventano 60 la parte distale del promotore è coinvolta nel legame iniziale della polimerasi, ma non negli stadi successivi Quando la catena di RNA raggiunge i 15-20 nucleotidi, c è una ulteriore transizione e l enzima copre a questo punto 30-40 paia di basi non si sa se è l enzima che cambia conformazione o se è il DNA che assume una struttura più estesa. Si credeva che il fattore σ si staccasse dopo la fase di inizio: in realtà, il 70% delle polimerasi in elongazione sono ancora associate al fattore σ ma la natura dell associazione deve essere cambiata, perchè la polimerasi in elongazione non riconosce più il promotore.
Il fattore σ controlla il legame al DNA La RNA polimerasi ha diverse necessità durante le fasi di inizio e di elongazione durante l inizio si deve legare solo ai promotori; durante l elongazione deve legare tutte le sequenze. Il problema è risolto grazie all associazione reversibile tra il fattore σ e il nucleo enzimatico. Quando il fattore σ si associa al nucleo enzimatico, l oloenzima lega il promotore. Terminata la fase di inizio, il fattore σ si dissocia (30% dei casi) o cambia la sua associazione (70% dei casi) con il nucleo enzimatico, che adesso mantiene la sua affinità non specifica per il DNA e può effettuare l elongazione. Terminata l elongazione, il nucleo enzimatico viene rilasciato e può riassociarsi con un altro il fattore σ per ricominciare un nuovo ciclo. Il fattore σ ha un dominio che riconosce il DNA al promotore. Di per se, σ non lega il DNA, ma quando l oloenzima forma un legame stretto, σ lega il DNA a monte del sito di inizio: la regione N-terminale σ blocca la regione di legame al DNA nel fattore libero, ma quando σ lega il nucleo enzimatico, la regione di legame al DNA può agire.
Il promotore L informazione per la funzione del promotore è fornita dalla sequenza del DNA: la sua struttura è il segnale (min 12 bp) è il caso delle sequenze di DNA la cui funzione è quella di essere riconosciute da proteine, i cosiddetti siti cis-agenti; al contrario le regioni che vengono espresse aquistano un significato solo dopo che l informazione è stata trasferita in un altro acido nucleico o in una proteina. Ogni sequenza essenziale dovrebbe essere presente in tutti i promotori: si dice che la sequenza è conservata. Ci sono 4 caratteristiche conservate nei promotori batterici il sito di inizio: è una purina (>90% dei casi), spesso CAT; la sequenza -10: T 80 A 95 T 45 A 60 A 50 T 96 ; la sequenza -35: T 82 T 84 G 78 A 65 C 54 A 45 ; la distanza tra la sequenza -35 e la sequenza -10. Mutazioni in giù (down) del promotore diminuiscono l efficienza e la similitudine al consenso Mutazioni in su (up) del promotore aumentano l efficienza e la similitudine al consenso Mutazioni in giù: sequenza -35: riducono la formazione del complesso chiuso ma non bloccano la conversione a complesso aperto sequenza -10: riducono la conversione a complesso aperto ma non bloccano la formazione del complesso chiuso Sequenza -35: dominio di riconoscimento. Sequenza -10: dominio di srotolamento (ricco in A. T).
La tecnica dell impronta La tecnica dell impronta è utilizzata per determinare quale parte di un acido nucleico è coperta da una proteina ad esso legata. Una variante della tecnica della impronta consiste nel trattare il complesso DNA-proteina con reagenti che modifichino una base, di modo che successivamente il corrispondente legame venga rotto si può legare la proteina al DNA e poi vedere quali basi sono protette da modificazione alcune bande possono aumentare in intensità, identificando siti in cui il legame della proteina ha creato una conformazione più esposta si può modificare il DNA e poi legare la proteina; le molecole che (a causa della modificazione) non hanno legato la proteina vengono recuperate e analizzate.
La RNA polimerasi contatta solo una faccia della doppia elica Le sequenze -35 e -10 contengono la maggior parte dei punti di contatto con la RNA polimerasi La regione di DNA che viene srotolata può essere identificata con il cambiamanto alla suscettibilità ad agenti chimici quando i filamenti sono separati, le basi non appaiate divengono suscettibili ad agenti che non possono modificarle quando sono in forma di doppia elica. Lo srotolamento iniziale avviene tra la posizione -9 e la +3. I punti di contatto a monte della sequenza -10 si trovano tuti dallo stesso lato della doppia elica: all inizio la polimerasi contatta la doppia elica da un lato solo; poi l enzima comincia lo srotolamento e siti che originariamente si trovavano dall altro lato (a valle della sequenza -10) entrano in contatto con l enzima.
Le 4 fasi della trascrizione Riconoscimento dello stampo comincia con il legame della RNA polimerasi al DNA a doppio filamento, con formazione di un complesso chiuso ; poi i filamenti di DNA vengono separati, formando un complesso aperto : la bolla di trascrizione è creata grazie ad uno srotolamento locale che comincia nel sito legato dalla RNA polimerasi. Inizio della trascrizione sintesi del primo legame nucleotidico nell RNA;l enzima resta sul promotore mentre sintetizza i primi 9 legami nucleotidici. La fae di inizio è resa più lunga dal succedersi di eventi abortivi, nei quali l enzima sintetizza brevi trascritti (<9 basi), li rilascia e ricomincia la sintesi. La fase di inizio termina quando l enzima riesce ad estendere la catena e lascia il promotore. La sequenza di DNA necessaria per il legame della polimerasi allo stampo e per l effettuazione della reazione di inizio definisce il promotore. Elongazione l enzima si muove lungo il DNA ed estende la catena di RNA. Muovendosi, l enzima srotola la doppia elica esponendo esponendo una nuova porzione dello stampo a singolo filamento. I nucleotidi vengono aggiunti all estremità 3 della catena nascente di RNA, formando un ibrido DNA-RNA nella regione srotolata. Alle spalle della regione srotolata, il filamento stampo si riappaia con il filamento codificante, riformando la doppia elica e spiazzando la catena di RNA. Terminazione riconoscimento di un punto nel quale l enzima cessa di aggiungere nucleotidi alla catena di RNA in crescita: dopo l aggiunta dell ultima base, l ibrido DNA-RNA si dissocia, la bolla di trascrizione collassa riformando la doppa elica, l enzima e l RNA si dissociano dal DNA. La sequenza di DNA che innesca questa reazioni è chiamata terminatore.
La terminazione Si distinguono due tipi di terminatori: terminatori intrinseci o rho-indipendenti il nucleo enzimatico può terminare a questi siti senza l ausilio di altri fattori terminatori rho-dipendenti il nucleo enzimatico necessita del fattore rho (ρ) per terminare la trascrizione. La struttura dei terminatori intrinseci presenta due caratteristiche peculiari (entrambe necessarie per la terminazione): una struttura secondaria a forcina contiene una regione ricca in G. C alla base una serie di residui U (circa 6) a valle della forcina. La polimerasi rallenta o si ferma (circa a 60 secondi) quando ha trascritto la sequenza che forma la forcina. La serie di U è necessaria per la dissociazione della RNA polimerasi durante l arresto alla forcina se si accorcia le serie di U, la polimerasi si ferma, ma non termina la trascrizione. Le sequenze ricche in A. T sono importanti sia nell inizio che nella terminazione rho-indipendente della trascrizione.
La terminazione rho-dipendente Rho è una proteina essenziale di E. coli, che funziona solamente nella reazione di terminazione; agisce come un esamero di 6 subunità identiche (non un tetramero come scritto su alcuni testi più vecchi). Circa le metà dei terminatori di E. coli sono rho-dipendenti. La caratteristica di un terminatore rho-dipendente è una sequenza lunga 50-90 basi, che si trova a monte del sito di terminazione. Caratteristica tipica di queste sequenze è che i residui C sono molto frequenti mentre i residui G sono piuttosto rari. L efficienza di un terminatore rho-dipendente aumenta con la lunghezza della regione ricca di C e povera di G.
La terminazione rho-dipendente Rho ha una attività di ATPasi, dipendente dalla presenza di un poliribonucleotide lungo più di 50 basi. Probabilmente rho lega la catena di RNA in elongazione o all estremità 5 o su alcune specifiche sequenze esposte. Successivamente, rho trasloca lungo la catena di RNA e, infine, raggiunge la RNA polimerasi. Rho ha una attività di elicasi 5-3 (l energia è fornita dall idrolisi di ATP) e questo suggerisce che possa direttamente srotolare l ibrido DNA- RNA nella bolla di trascrizione alternativamente, rho potrebbe interagire con la RNA polimerasi causando indirettamente il rilascio della catena di RNA. Il risultato finale è la terminazione della trascrizione.