Computer vs. Proteine Alberto Massarotti alberto.massarotti@pharm.unipmn.it 1 Le slide www.symech.it/didattica.asp 2
1. Giovedì 12 gennaio, h. 14 16 Le proteine Il Protein Data Bank Panoramica di Pymol Il programma 2. Mercoledì 18 gennaio, h. 16 18 Aula informatica I piano, Sessione pratica 3 1948 Un pizzico di storia... Linus Pauling predice l alfa elica delle proteine 1958/1959 Kendrew e Perutz risolvono la struttura della prima proteina 1965 Prima struttura ai raggi X di un enzima 1971 Nasce il Protein Data Bank al Brookhaven National Laboratory, contiene 7 strutture 1980/1981 Prima struttura ai raggi X del DNA (Id. 1bna) chimica 1954 "per le sue ricerche nel campo dell'attrazione 1962 molecolare e le sue applicazioni "per i loro studi per lasulla spiegazione struttura della delle struttura proteine globulari" di sostanze complesse" 2000 2003 2011 Sequenziamento del genoma umano Nasce il world wide Protein Data Bank (wwpdb) Più di 75000 strutture depositate 4 chimica pace 1962 "promotore della campagna contro i test nucleari" 2013 2015 Tutte le proteine umane depositate nel PDB? Struttura di un intera cellula a livello atomico?
Le proteine Per comprendere la funzione di una proteina è necessario conoscere la sua struttura. 5 Perché determinarne la struttura? 1. Determinazione di strutture non ancora note: È tuttora il principale obiettivo della cristallografia 2. Studi di meccanismi enzimatici: Gli enzimi possono essere cristallizzati in presenza di substrati, analoghi dei substrati o di prodotti di reazione, che consentono di identificare gruppi reattivi nel sito attivo nelle vicinanze del substrato. È possibile anche ricavare informazione strutturali sugli stadi intermedi della reazione mediante co cristallizzazione con analoghi dello stato di transizione. 3. Analisi delle interazioni enzima ligando: Ligandi a basso peso molecolare come substrati, inibitori ed effettori spesso possono essere ospitati nella struttura cristallina senza provocare variazioni rilevanti nell impacchettamento cristallino. Cristalli di complessi di proteine con altre macromolecole possono essere preparati per cocristallizzazione. 4. Analisi di mobilità e variazioni conformazionali La cristallografia produce immagini statiche, ma una struttura cristallina rappresenta una media delle n molecole proteiche presenti nel cristallo, e la conformazione media di queste molecole nel tempo necessario per raccogliere uno spettro completo di diffrazione. Il movimento di molecole nel cristallo provoca elementi di perturbazione nella mappa di densità elettronica; in casi estremi ad esempio alcuni loops diventano totalmente invisibili nelle mappe di densità elettronica. 6
Purificazione delle proteine La purificazione di una proteina costituisce il primo passaggio nello studio delle sue proprietà. Una proteina per poter essere purificata deve, dapprima, essere estratta dalla sua matrice biologica e quindi allontanata selettivamente dalle altre proteine. Le proteine di membrana presentano problemi particolari; le parti che attraversano la membrana devono essere mantenute in un ambiente idrofobico (per impedirne l aggregazione e mantenere l attività). Recettore β2 adrenergico (PDB id: 2RH1) 7 Tecniche di frazionamento Ci sono diverse tecniche di frazionamento che consentono di arricchire una miscela complessa di un determinato enzima. Il frazionamento è efficace se, ad ogni passaggio, aumenta la percentuale di proteina desiderata rispetto al contenuto totale di proteine presenti nel campione. 8
Tecniche cromatografiche Tali tecniche consentono di raggiungere un più alto grado di purezza. In generale tutti i sistemi cromatografici consistono di una fase stazionaria immobilizzata, che può essere solida, gel, liquida o una miscela solido/liquido, e di una fase mobile liquida o gassosa che flussa sopra o all interno della fase stazionaria. 9 Nata negli anni 50, è ancora la tecnica più usata per determinare la struttura tridimenzionale delle proteine. Richiede che le proteine siano trasformate in cristalli statici. Fasci di raggi X con una lunghezza d onda abbastanza corta da risolvere gli atomi (0,1 0,2 nm) sono fatti passare attraverso un cristallo di proteina. La struttura della proteina viene ricavata dallo schema di diffrazione. Cristallografia ai raggi X 10
I cristalli Dopo aver lasciato il tempo ai cristalli di crescere si osservano le gocce al microscopio sono diversi i fenomeni che si possono osservare: 11 Spettroscopia NMR L NMR permette lo studio della dinamica delle proteine in soluzione a risoluzione atomica. In questa tecnica, una soluzione concentrata della proteina è posta in un campo magnetico. Si misurano gli effetti di radiofrequenze diverse sulla risonanza di differenti atomi. Poiché è eseguita in soluzione, può rilevare i movimenti Intramolecolari. Il comportamento di un atomo è influenzato dagli atomi circostanti dei residui adiacenti. I residui più vicini, pertanto, sono perturbati da quelli più distanti. Dalle dimensioni dell effetto si possono calcolare le distanze tra i residui. Queste distanze sono usate per generare un modello della struttura tridimensionale della proteina. L NMR si limita a proteine più piccole di 20kDa e a analizzare domini proteici. 12
Spettroscopia NMR 13 Microscopia crioelettronica La microscopia crioelettronica è utile per determinare la struttura di grandi complessi proteici che sono difficili da cristallizzare. Il campione proteico viene congelato di colpo a temperatura estremamente basse in elio liquido (da 180 a 260 C). Quando è congelata così rapidamente, la proteina è completamente idratata senza cristalli d acqua. La struttura è esaminata in un microscopio crioelettronico e le immagini sono registrate su lastre usando una bassa dose di elettroni per impedire danni alla struttura indotti da radiazioni. Ciò permette di analizzare una proteina nella sua forma nativa, rispetto al materiale fissato nella microscopia elettronica convenzionale. 14
Le tecniche a confronto Limiti nello studio della struttura delle macromolecole biologiche: Cristallografia a raggi X il problema e ottenere il cristallo Spettroscopia di risonanza magnetica nucleare (NMR) il problema e la dimensione ( 30 50 kd) Microscopia elettronica è limitata ai casi in cui si possano ottenere cristalli bidimensionali molto grandi Homology Modelling per proteine con > 30 50% identità 15 Co-cristallizazzione Il complesso si forma in soluzione addizionando il ligando (conc» 1mM) alla soluzione della proteina e successivamente il complesso viene cristallizzato Vantaggi: Si possono ottenere cristalli del complesso per ligandi ad alto peso molecolare Eventuali variazioni conformazionali indotte dal ligando non sono ostacolate e si evidenzieranno nella struttura cristallina, poiché il complesso si forma in soluzione La qualità di diffrazione dei cristalli non è compromessa dalla procedura di soaking Svantaggi: A volte le condizioni di cristallizzazione sono leggermente diverse o perfino completamente diverse dalle condizioni di cristallizzazione dei composti puri (proteina, ligando), costringendo a ricominciare daccapo la ricerca delle condizioni di cristallizzazione La co cristallizzazione dei complessi impiega da alcune settimane ad alcuni mesi e non tutti i ligandi sono stabili per tempi cosi lunghi 16
Cristallografia ai raggi X 17 Dati sperimentali e modello Una volta ottenuti i dati iniziali sulle fasi, un modello di proteina (ciò che lo sperimentatore pensa sia vero) viene adattato nella mappa di densità elettronica iniziale. What you see + What you think = What you get Se vi sono errori nelle strutture cristalline questi sono dovuti all interpretazione (soggettiva) delle mappe elettroniche da parte del cristallografo!! 18
Qualità dei dati sperimentali La risoluzione corrisponde alla minore distanza tra i piani reticolari i cui riflessi sono usati nel calcolo della mappa e nell affinamento. Minore è la risoluzione più nette e dettagliate saranno le mappe di densità elettronica. 19 http://ruppweb.dyndns.org/ Flessibilità e fattori di temperatura La maggior parte delle proteine sono flessibili e molte proteine anche allo stato cristallino contengono delle zone flessibili. La mobilità degli atomi in un cristallo è espressa in termini di fattori di temperatura, ofattorib. Rosso = Alto B factor = alta mobilità Blu = Basso B factor = bassa mobilità 20
X-ray vs. NMR X-ray NMR 21 http://ruppweb.dyndns.org/ 22
Il Protein Data Bank 23 Acetylcholinesterase 24
25 26
27 28
colchicine 29 30
31 32
33 34
Struttura di un pdb Tipologia atomo N atomo Elemento Residuo Catena Res.n X, Y, Z % occupazione B factor 35 PyMol Warren Lyford DeLano 1972-2009 36
L interfaccia grafica External GUI Viever Internal GUI 37 Come caricare un pdb? Download diretto di un pdb (necessita di una connessione ad internet) Plugin > PDB Load Service Scrivere il PDB ID appare un oggetto col nome del PDB ID Caricare un file.pdb locale File > Open selezionare il file.pdb appare un oggetto col nome del file 38
Opzioni utili Display > Background > white Display > orthoscopic view imposta il colore di sfondo rimuove le distorsioni della prospettiva 39 L uso del mouse Comandi base: sinistro ruota centrale trasla destro zoom rotella clip 40
Object menu: A, S, H, L, C 41 A per Action Navigazione Disegno veloce Legami idrogeno Gestione oggetti 42
S per Show Lines Sticks Spheres Cartoon 43 Hper Hide Stesso contenuto del menù Show. 44
L per Label Mostra il numero dell amminoacido 45 C per Color 46
Menu contestuale Tasto destro sull oggetto da manipolare (+/ le stesse opzioni del menu ASHLC) 47 Mostrare la sequenza Display > Sequence S nel Mouse Menu 48
Wizard Per misurare distanze, angoli e angoli diedri: Wizard > Measurement 49 Altre opzioni Settings > Edit all 50
Salvare il lavoro File > Save session 51 Creare immagini 1. Ray 2. File > Save image as > 52
Es. 0: tirosina chinasi Ligando PDB: 1IRK 53 Es. 0: tirosina chinasi Ligando PDB: 1IR3 54
1. Giovedì 12 gennaio, h. 14 16 Le proteine Il Protein Data Bank Panoramica di Pymol Il programma 2. Mercoledì 18 gennaio, h. 16 18 Aula informatica I piano, Sessione pratica 55 Caricare il file PDB Aggiungere gli idrogeni, A>hydrogens>add Visualizzo la proteina come cartoon, S > as > cartoon Mostro la sequenza proteica Individuare e selezionare il ligando principale Visualizzo il ligando come sticks, S>as>sticks Cambio il colore del ligando Calcolare le interazioni polari, A > find > polar contacts > to any atoms Estendere la selezione agli amminoacidi circostanti, A > modify > around > residues within 4 A Visualizzo il sito attivo come sticks, S>sticks Nascondo gli idrogeni non polari, H > hydrogens > non polar 56
Es. 1: diidropterato sintetasi Ligando PDB: 2BMB 57 Es. 2: adenosina deamminasi Ligando PDB: 3IAR 58
Es. 3: ornitina decarbossilasi Ligando PDB: 1QU4 59 Es. 4: recettore estrogeni Ligando PDB: 3ERT 60
Es. 5: recettore progesterone Ligando PDB: 2W8Y 61 62