LE PROTEINE. Le proteine sono i biopolimeri piu' abbondanti negli organismi viventi e svolgono funzioni biologiche di fondamentale importanza:

LE PRTEINE Le proteine sono i biopolimeri piu' abbondanti negli organismi viventi e svolgono funzioni biologiche di fondamentale importanza: PRTEINE CATALITICHE PRTEINE REGLATRICI PRTEINE DIFESA PRTEINE STRUTTURALI Maltasi, tripsina, lipasi, lisozima Insulina, ormone della crescita Falloina (funghi), Tetrodotossina e dendrotossina (veleni di serpente), tossine batteriche (tetano e botulino), immunoglobuline (anticorpi), gossipolo (cotone), ricina Cheratina (peli, lana, pelle, corno, unghie), fibroina (seta), capside virale, collagene (tendini e cartilagini), PRTEINE DI TRASPRT Emoglobina, citocromi, canali ionici PRTEINE DI RISERVA Caseina, albumina, gliadina(grano), zeina(mais)

Proteine di difesa Proteine strutturali Canali ionici Catalizzatori chimici

Chimicamente sono dei polimeri(poliammidi) composte da circa 20 alfa amminoacidi legati fra loro In natura sono presenti moltissimi amminoacidi, ma nelle proteine diqualunqueorganismosene'trovanosolo20ditipol CH C - H 2 N H H N + H H 3 + carbonio alfa R catena laterale R a ph 7 Ad eccezione della prolina e dei suoi derivati, tutti gli amminoacidi che si trovano comunemente nelle proteine possiedono questo tipo di struttura.

Strutture predominanti a ph 7 Amminoacidi con gruppi R apolari

Amminoacidi con gruppi R polari

Amminoacidi con gruppi R acidi Amminoacidi con gruppi R basici

Amminoacidi naturali rari C - C - + H 3 N H + H 3 N H C H 2 SeH 21 Selenocisteina Sec, U 1986 NH H 3 C N 22 Pirrolisina Pyl, 2004 (archeobatteri)

PRPRIETA FISICHE Quando un amminoacido(sale con PF: 200 C) viene sciolto in H 2 diventaunoionedipolare(zwitterione)chepuòagiresia come acido (donatore di protoni) che come base (accettore di protoni) Le sostanze che hanno questa doppia natura si definiscono anfòtere o anfoliti. Al ph fisiologico (valore attorno a 7,4) tutti gli amminoacidi hanno: il gruppo carbossilico dissociato, si forma lo ione negativo carbossilato(-c - ) ilgruppoamminicoprotonato(-nh 3+ )

Stereochimica Gly = 0 Thr, Ile = 4 Tutti gli altri = 2 Pro=ammina 2

Ambiente acido Ambiente neutro Ambiente basico pk 2 ~ 9 NH + NH + 3 3 R-C-H R-C-H CH C - NH 2 R-C-H C - pk 1 ~ 2 5.5 +1 0-1 P i

ph 12 9 6 3 NH 3 + pk 2 H-C-R Isoelectric point = C - pi pk 1 + pk 2 2 pk 1 0 [H]

pka of Amino Acids Amino acids -CH -NH 2 -R Gly G 2.34 9.60 Ala A 2.34 9.69 Val V 2.32 9.62 Leu L 2.36 9.68 Ile I 2.36 9.68 Ser S 2.21 9.15 Thr T 2.63 10.4 Met M 2.28 9.21 Phe F 1.83 9.13 Trp W 2.38 9.39 ph pk 2 pk 1 two pka three pka pi pk 1 + pk 2 2 Asn N 2.02 8.80 Gln Q 2.17 9.13 Pro P 1.99 10.6 pk 3? Asp D 2.09 9.82 3.86 Glu E 2.19 9.67 4.25 His H 1.82 9.17 6.0 Cys C 1.71 10.8 8.33 pk 2 pk 1? pi? Tyr Y 2.20 9.11 10.07 Lys K 2.18 8.95 10.53 [H - ] Arg R 2.17 9.04 12.48

H first HC-CH 2 -C-CH NH 3 + second H HC-CH 2 -C-C - NH 3 + +1 pk 1 = 2.1 0 pk 2 = 3.9 Acido aspartico Isoelectric point is the average of the two pka flanking the zero netcharged form 2.1 + 3.9 2 = 3.0 Punto isoelettrico H - C-CH 2 -C-C - NH 3 + third -1 pk 3 = 9.8 pk 3 pk 2 0-1 -2 H - C-CH 2 -C-C - NH 2-2 pk 1 +1 [H]

α amminoacido 3 lettere 1 lettera pk 1 -CH pk 2 -NH 3 + pk R gruppo R Pi % Gruppi R apolari (9) Alanina Ala A 2.34 9.69 5,97 7,8 Glicina Gly G 2,34 9,60 5,97 7,2 Prolina Pro P 1,99 10,96 6,48 5,2 Valina Val V 2.29 9.74 6.0 6,6 Leucina leu L 2,36 9,60 5,98 9,1 Isoleucina Ile I 2,36 9,68 6,02 5,3 Metionina Met M 2,28 9,21 5,74 2,3 Triptofano Trp W 2,38 9,39 5,89 1,4 Fenilalanina Phe F 1,83 9,13 5,48 3,9 Gruppi R polari (6) Serina Ser S 2,21 9,15 5,68 6,8 Treonina Thr T 2,11 9,62 5,87 5,9 Asparagina Asn N 2.02 8.80 5.41 4,3 Cisteina Cys C 1,96 10,28 8,18 5,07 1,9 Glutamina Gln Q 2,17 9,13 5,65 4,2 Tirosina Tyr Y 2,20 9,11 10,07 5,66 3,2 Gruppi R basici Arginina Arg R 2,17 9,04 12.48 10.76 5,1 Istidina His H 1,82 9,17 6,00 7,59 2,3 Lisina Lys K 2,18 8,95 10,53 9,74 5,9 Gruppi R acidi Acido Aspartico Asp D 1.88 9.60 3.65 2,77 5,3 Acido Glutamico Glu E 2.19 9.67 4.25 3.22 6,3

Danno le reazioni dei gruppi funzionali presenti Lo stato di ione dipolare consente di applicare metodi cromatografici e elettroforetici per la loro separazione + H 2 N CH H calore R N - + C 2 +4H 2 + RCH

STRUTTURA PRTEINE AMMINACID C-TERMINALE R NH 2 H R 1 + H -H 2 N H H R 1 R N H 2 N H H AMMINACID N-TERMINALE LEGAME PEPTIDIC 2-7 aa = oligopeptide 8-49 aa = peptide (senza struttura 3 ) > 50 aa = proteina (con struttura 3 )

2 aa 4 aa + H 3 N 1 aa 3 aa 5 aa

Caratteristiche di un legame peptidico 1. Inerte 2. Planare per permettere la coniugazione 3. Rotazione impedita attorno al legame ammidico 4. Rotazione dei gruppi R e R legati al legame ammidico relativamente libera

Il legame peptidico ha delle caratteristiche di doppio legame e costringe i due atomo adiacenti a giacere sullo stesso piano. La rotazione della molecola avviene intorno al carbonio alfa, ma non tutti gli angoli di rotazione sono permessi a causa degli ingombri sterici delle diverse catene laterali e dello scheletro stesso.

Combinazioni possibili con 20 aa 20 2 =400 dipeptididiversi 20 3 =8000tripeptididiversi Una proteina contenente una copia di ognuno dei 20 aa potra averecirca20!=20x19x18x17 =2x10 18 diversesequenze + H 3 N H H CH 3 N H N N H N H - H H Seril-glicil-tirosil-alanil-leucina (Ser-Gly-Tyr-Ala-Leu)

PRPRIETA DELLE PRTEINE PRTEINA M.M. AA SUBUNITA INSULINA 5733 51 2 CITCRM C 13000 104 1 MIGLBINA 16.890 153 1 EMGLBINA 64500 574 4 ESCHINASI 102.000 972 2 RNA PLIMERASI 450.000 4158 5

Struttura primaria Sequenza degli amminoacidi legati tra loro da legami covalenti peptidico ed eventuali ponti disolfuro Struttura secondaria Disposizione regolare e ricorrente in una dimensione dello spazio della catena peptidica per mezzo di legami a idrogeno Struttura terzaria Descrive tutte le curve e i ripiegamenti tridimensionali dovuti principalmente a legami secondari Struttura quaternaria Unione di piu catene proteiche dette subunita

Tecniche di separazione e purificazione delle proteine Le proteine possono essere separate con metodi cromatografici o elettroforesi, sfruttando le differenze in dimensioni, affinità di legame e carica dopo essere state estratte da un tessuto o da una cellula microbica: 1. Cromatografia a scambio ionico 2. Cromatografia per esclusione molecolare (gel filtrazione) 3. Cromatografia per affinità 4. Elettroforesi

CRMATGRAFIA A SCAMBI INIC contenente un polimero con gruppi carichi Le proteine passano attraverso la colonna ad una velocità che dipende dalla carica netta generata dal ph della soluzione tampone usata

CRMATGRAFIA AD ESCLUSINE MLECLARE In questo tipo di cromatografia, detta anche a gel filtrazione, le molecole vengono separate in base alle dimensioni e alla forma

La miscela di proteine viene caricata su una colonna contenente un polimero che porta legato un ligando specifico per la proteina di interesse Le proteine non di interesse vengono lavate via dalla colonna La proteina di interesse è eluita dalla soluzione di ligando

Dr. Frederick Sanger, Nobel Prize for Chemistry 1958 and 1980 Peptide sequencing Prof. R. B. Merrifield Nobel Prize for Chemistry 1984 Automated Peptide Synthesis

Le differenze nelle funzioni delle proteine derivano da differenze nella loro composizione e nella loro sequenza In particolare la struttura primaria di una proteina determina il suo ripiegamento in una specifica struttura tridimensionale, che a sua volta stabilisce la funzione della proteina stessa La proteina da sequenziare deve essere scissa in frammenti sufficientemente brevi da poter essere sequenziati individualmente, poi, partendo dalla sequenza dei tratti sovrapposti, si ricostruisce la struttura primaria della proteina intatta

1) Idrolizzarelaproteina conhcl6ma100 Cda10a100ore(distruzione o modifica di parecchi amminoacidi); attraverso la cromatografia o elettroforesi si determina il tipo e la quantità di aa liberi (nessuna informazione sulla sequenza) 2) Determinazione degli amminoacidi N-terminali reattivo di Sanger (DNFB); NB: ci sono proteine formate da più catene polipeptidiche (2 inizie2fine)oppureproteinechiuse(neinizionefine) 3) Degradazione di Edman: rimozione di un amminoacido alla volta dall estremità N-terminale; dopo circa 40 cicli diventa difficile determinare la sequenza amminoacidica. Infatti dopo un numero elevato di cicli, gli effetti cumulativi di reazioni incomplete e di reazioni secondarie del processo di degradazione di Edman rendono impossibile una identificazione certa dell amminoacido rilasciato e quindi della sequenza amminoacidica. Per tale motivo la proteina da sequenziare è scissa in piccoli frammenti polipeptidici.

Sanger

1. Il reagente di Edman, fenilisotiocianato, reagisce con il gruppo amminico N-terminale di un polipeptide in condizioni blandamente alcaline, per formare il feniltiocarbamile 2. Tale addotto è trattato con acido trifluoroacetico anidro (F 3 CCH), che libera il residuo N-terminale sotto forma di derivato tiazolinonico, senza idrolizzare gli altri legami peptidici

Le proteine invece devono essere suddivise in frammenti piu' piccoli Rompere i legami disolfuro irreversibilmente Effettuare diverse idrolisi parziali per via chimica, ma soprattutto per via enzimatica utilizzando enzimi specifici che portano alla formazione di frammenti peptidici piu piccoli: Tripsina Lys, Arg(lato C) Chimotripsina Phe, Tyr, Trp(lato C) Bromuro di cianogeno Met(lato C) Carbossipeptidasi aa terminale Pepsina Phe, Tyr, Trp(lato N) Tutti i frammenti peptidici vengono separati e sequenziati con la degradazione di Edman; I frammenti identificati vengono sovrapposti per riconoscere la sequenza originale

STRUTTURA PRIMARIA rdine con cui gli amminoacidi si susseguono nella catena polipeptidica Tale ordine non è casuale, ma è rigorosamente immutabile per ogni particolare proteina di un organismo. gni proteina ha in ogni individuo appartenente alla stessa specie sempre la stessa composizione in amminoacidi, legati l'uno all'altro sempre con lo stesso ordine.

Struttura Primaria dell insulina ponti disolfurici

Le principali strutture secondarie di una proteina I fattori che determinano la struttura secondaria di una proteina e che hanno l'effetto di rendere minima l'energia potenziale della molecola sono: minimizzazione dell'ingombro sterico fra i gruppi R ottimizzazione della formazione di legami H intracatena Il risultato di queste restrizioni fa sì che gli elementi di struttura secondaria si possano ricondurre sostanzialmente a tre diverse tipologie stabili: anse o ripegamenti

α elica a) Elica destrorsa; b) Si evidenziano i legami idrogeno; c) Il passo dell elica è 5.4 Å o 3.6 residui amminoacidici d) Particolarmente frequente con gruppi R molto voluminosi

β-foglietto I segmenti adiacenti possono anche essere lontani nella sequenza amminoacidica Le catene adiacenti possono essere parallele o antiparallele I legami idrogeno si formano tra catene adiacenti La conformazione beta si estende a zig-zag invece che a elica. I gruppi R devono essere abbastanza piccoli (ingombro sterico).

RIPIEGAMENTI E ANSE Nelle proteine sono presenti tratti di catena apparentemente disorganizzati, di lunghezza anche molto variabile: questi tratti, definiti loop, fanno da collegamento fra α eliche o filamenti β ed hanno un ruolo assai importante nella organizzazione 3D della catena peptidica. Sono relativamente flessibili e, soprattutto, consentono cambi di direzione, anche repentini, Molto comuni sono i brevi loop di 3-5 residui che collegano due filamenti β consecutivi, orientati in modo antiparallelo(β-turns). Inoltre, i loop partecipano spesso alla formazione di siti di legame o del sito attivo degli enzimi. Nelle regioni loop è quasi costante la presenza degli amminoacidi glicina o prolina

La struttura di giro di 180 comprende 4 aminoacidi di cui il primo forma un legame idrogeno col quarto.

Motivi strutturali Gli elementi fondamentali di struttura secondaria si trovano combinati in particolari motivi strutturali di struttura supersecondaria Spesso è anche possibile associare alcuni motivi strutturali, o più propriamente la loro organizzazione in domini, a particolari funzioni di una proteina. I motivi strutturali più ricorrenti sono: α elica-loop-α elica β-turn due filamenti β antiparalleli uniti da un breve loop di 2-5 residui. chiave greca quattro filamenti β (minimo), due brevi loop e un loop più lungo. β-α-β due filamenti β paralleli, intercalati da un α-elica.

STRUTTURA TERZIARIA E' la struttura tridimensionale della proteina ed è determinata dall interazione dei gruppi laterali della catena principale mediante legami deboli (London, idrogeno) ma anche forze elettrostatiche e covalenti come il ponte disolfuro; La catena proteica tende a disporsi in modo da orientare i gruppi R polari verso l'esterno dove vengono solvatati dall'acqua, e i gruppi R idrofobi verso l'interno. In questo modo la proteina si piega e si contorce per ottenere una conformazione a minore energia. La struttura tridimensionale si ricava attraverso tecniche cristallografiche, NMR, MS

Proteine globulari di forma compatta, sferica, (struttura 2 e 3 ) solubili in acqua capaci di spostarsi nell'ambiente della cellula (funzione catalica, trasporto, ormonale, deposito) Proteine fibrose sono costituite da catene polipeptidiche disposte fianco a fianco in lunghi filamenti(struttura 2 ). Essendo insolubili in acqua, la natura le utilizza come materiali costruttivi come muscoli, tendini, zoccoli, corna, peli, unghie, capelli, seta (collageno, cheratina, fibroina)

STRUTTURA QUATERNARIA 1. La struttura quaternaria riguarda proteine costituite da più catene polipeptidiche; ogni catena è chiamata subunità(2-12) 2. Le subunità sono tenute insieme da legami non covalenti( forze elettrostatiche e idrofobiche)

Strutture quaternarie simmetriche

La funzionalita' biologica di una proteina e' strettamente correlata alla sua struttura. Nella normali condizioni di ph e temperatura la proteina si trova nella struttura terziaria, che corrisponde al minimo di energia libera. Se tali condizioni vengono modificate si ha un parziale srotolamento con conseguente denaturazione Calore: vengono rotti i legami piu deboli a 60 C Solventi organici modificano le interazioni idrofobiche Valori estremi di ph alterano la carica netta della proteina modificandone i legami

SINTESI DI PEPTIDI E PICCLE PRTEINE (100) 1. Estrazione dalle cellule, reso difficile dalla bassa concentrazione 2. Ingegneria genetica 3. Sintesi chimica normale e in fase solida Sintesi in fase solida di Merrifield permette di ottenere un peptide fino a 100 aa in qualche giorno con una buona resa(una cellula impiega 5 secondi) Cl N C N R Cl Fmoc DCC 9-fluorenilmetossicarbonile Dicicloesilcarbodiimide Resina di Merrifiel

+ C R H carboxylic acid H N H H ammonia NH 2 C R NH 4 ammonium carboxylate salt (solid) H Leu Activate the Acid H 2 N Gly H X NH 2 NH 2 N H H Dipeptide - LeuGly

2 X H 2 N X If X= F, Cl, Br, I R Unprotected Coupling Three Competing Nucleophiles R NH HN R Diketopiperazine X NH 2 X H 2 N H NH 2 H 2 N H Three Criteria for a Good Protecting Group?

Protecting Groups Protecting NH 2 CH 3 H 3 N CH 3 H 3 N PRTECT (Boc) 2 Di-tert-butyl dicarbonate (Boc-anhydride) Protecting NH 2 Cbz-Cl Ph Ph Cl Benzyl Chloroformate Cbz N H CH 3 N H CH 3 H 3 C CH 3 C CH 3 Leu C N H CH 3 CH 3 H t Boc = N H PEPTIDE SYNTHESIS De-PRTECT mild acid and neutralize H H 3 N CH 3 H 2, Pt 2 De-Protect Fmoc-Cl Base N H CH 3 CH 3 H H 3 N N C Cl = Fmoc-Cl

Protecting C - H acid or base hydrolysis + CH 3 CH 2 H, H Et C NH 2 NH 2 Much Milder Conditions are required to Break an ester as compared to an amide bond. H R NH 2 isobutene in sulfuric acid H SN1 mechanism H +, H 2 HEAT NH 2

What is the best way to activate the Carboxyl group? t Boc N H CH 3 H + H 2 N R N C N Dicyclohexylcarbodiimide (DCC) Boc t N H CH 3 H N R H H N C N Dicyclohexylurea (DCU)

Si protegge il gruppo amminico dell aa c-terminale Attacco dell aa al gruppo reattivo della resina Rimozione del gruppo protettivo

Il gruppo carbossilico del 2 aa e attivato con DCC, mentre il gruppo amminico e protetto con Fmoc Gruppo amminico del 1 aa attacca il gruppo carbossilico del 2 formando un dipeptide Si riparte da capo