Biotecnologie applicate alla progettazione e sviluppo di molecole biologicamente attive A.A. 2010-2011 Modulo di Biologia Strutturale Relazione sequenza-struttura e funzione Marco Nardini Dipartimento di Scienze Biomolecolari e Biotecnologie Università di Milano
Relazione sequenza-struttura-funzione relazione sequenza struttura-funzione confronto tra sequenze provenienti da organismi differenti (BLAST) per riconoscere sequenze correlate assunzione che proteine correlate in sequenza lo siano anche in struttura e funzione predizioni buone per la struttura, meno per la funzione (predizioni molto buone solo se la correlazione in sequenza è molto elevata) identità di sequenza 40%, residui importanti per la funzione (sito attivo) conservati funzione biochimica predicibile percentuale di coppie di proteine dotate di stessa funzione biochimica in funzione dell identità di sequenza enzimi non-enzimi predizione struttura e funzione attendibile predizione struttura attendibile ma non funzione predizione struttura e funzione poco attendibile Sequenza-struttura-funzione
Sequenza-struttura-funzione Relazione sequenza-struttura-funzione predizione accurata non possibile se le proteine sono espresse da organismi evolutivamente così distanti da non lasciare traccia di identità di sequenza predizioni più attendibili per procarioti e organismi unicellulari rispetto agli eucarioti e pluricellulari con l aumento della distanza evolutiva le sequenze di proteine con stessa struttura e funzione biochimica possono divergere marcatamente simile funzione biochimica non significa necessariamente simile funzione cellulare (molte proteine sono multifunzionali) Esempio: Analisi delle funzioni assegnate a sequenze codificanti proteine nel genoma di lievito
Motivi e domini Relazione sequenza-struttura-funzione funzione dedotta dalla sequenza allineamenti locali di motivi funzionali nella sequenza identificazione di almeno una funzione biochimica motivo di sequenza esteso e non contiguo identificazione dominio o modulo strutturale con fold e funzione riconoscibili Esempi (a) motivo elica-turn-elica (b) motivo zinc-finger legame a DNA elica-turn-elica zinc-fingr
Relazione sequenza-struttura-funzione Motivi e domini (c) motivo Walker siti di legame di ATP e GTP H-RAS Chinasi - 3 porzioni differenti non-contigue di sequenza (Walker A, B, C) Walker A lega il gruppo trifosfato del nucleotide Walker B e C interagiscono con le basi del nucleotide (più difficilmente riconoscibili rispetto ad A)
Relazione sequenza-struttura-funzione Motivi e domini (c) motivo Walker H-RAS Chinasi Walker A o loop P: [A/G]XXXXGK[S/T] loop flessibile compreso tra α-elica e filamento β la presenza del motivo in sequenza non chiarisce a cosa serve il legame del nucleotide fold complessivo delle varie proteine può essere anche molto diverso (ATP-sintetasi, catena pesante miosina, elicasi, timidina chinasi, RAS ecc)
Evoluzione divergente Relazione sequenza-struttura-funzione - proteine con elevata identità di sequenza discendono da un ancestore comune - avranno strutture molto simili casi limite 1) proteine con bassa similarità di sequenza ma struttura complessiva e di sito attivo simili sono probabilmente omologhe conservazione selettiva di residui strutturalmente e funzionalmente importanti 2) strutture e sequenze simili ma funzioni biochimiche differenti le strutture divergono più lentamente delle funzioni durante l evoluzione Evoluzione convergente - proteine che differiscono in sequenza e struttura Evoluzione divergente e convergente - presentano però una configurazione del sito attivo che converge verso una medesima struttura, che ne determina la funzione biochimica
Relazione sequenza-struttura-funzione evoluzione divergente o evoluzione convergente?? Evoluzione divergente e convergente - bassa identità di sequenza - struttura 3D molto simile - catene laterali residui catalitici conservano la loro posizione spaziale ma non la loro posizione in sequenza 2 possibilità: (a) data la somiglianza strutturale esse discendono in modo divergente da un comune ancestore benzoato-formil decarbossilasi 21% identità di sequenza piruvato decarbossilasi tiamina pirofosfato (b) le 2 proteine si sono evolute indipendentemente e sono confluite verso una comune strategia chimica per la decarbossilazione di un alfa-chetoacido livello di identità di sequenza troppo basso impossibile distinguere fra le 2 possibilità con certezza
La struttura dalla sequenza: modelli per omologia - quando le sequenze divergono lo fanno anche le strutture, ma con velocità diversa la struttura varia più lentamente della sequenza - piccole differenze in sequenza non hanno effetti sulla struttura Modelli per omologia - per grosse divergenze in sequenza (identità 20%) le strutture divergono esponenzialmente - con identità di sequenza < 40% le strutture possono essere marcatamente differenti
La struttura dalla sequenza: modelli per omologia zona grigia (20%-40%) in cui è difficile determinare l esistenza di una relazione fra le 2 proteine - molto dipende da come sono distribuiti i residui identici Modelli per omologia a volte anche proteine che non hanno una identità di sequenza statisticamente significativa possono avere strutture molto simili e funzioni correlate in questo caso non sono possibili predizioni strutturali accurate sulla base del confronto delle sequenze
La struttura dalla sequenza: modelli per omologia - quando le sequenze divergono lo fanno anche le strutture, ma con velocità diversa la struttura varia più lentamente della sequenza - piccole differenze in sequenza non hanno effetti sulla struttura - per grosse divergenze in sequenza (identità 20%) le strutture divergono esponenzialmente Modelli per omologia - con identità di sequenza < 40% le strutture possono essere marcatamente differenti