Predizione della struttura secondaria

Похожие документы
Rappresentazione dei Dati Biologici

Visualizzazioni 3D. Informatica. Matrice di voxel. Tipi di dato. Dati vettoriali. Tecniche di rappresentazione

LE PROTEINE. SONO Polimeri formati dall unione di AMMINOACIDI (AA) Rende diversi i 20 AA l uno dall altro UN ATOMO DI C AL CENTRO

Chimica Biologica A.A α-elica foglietto β reverse turn

Struttura delle Proteine

Caratteristiche generali

MACROMOLECOLE. Polimeri (lipidi a parte)

amminico è legato all atomo di carbonio immediatamente adiacente al gruppo carbonilico e hanno la seguente

AMMINOACIDI E PROTEINE

Predizione della struttura terziaria

Predire la struttura terziaria

9) Scrivere un disaccaride formato dal β-d-galattosio e dall α-d-n-acetil-glucosammina legati da un legame glicosidico β(1-4).

Perché considerare la struttura 3D di una proteina

Diagramma di Ramachandran

Struttura degli amminoacidi

G. Licini, Università di Padova. La riproduzione a fini commerciali è vietata

Parametri dell α-elica. residui/giro 3.6. passo dell elica

La struttura delle proteine

sono le unità monomeriche che costituiscono le proteine hanno tutti una struttura comune

Formazione del legame peptidico:

Prof. Maria Nicola GADALETA

AMMINOACIDI E PROTEINE

E il server più utilizzato, permette di tracciare tutte le operazioni che svolge e di impostare alcuni parametri importanti per il risultato finale.

10. Previsione della struttura tridimensionale di una proteina

Chimotripsina Una proteina globulare. Glicina Un amminoacido

REPLICAZIONE DEL DNA

Proprietà comuni. Il gruppo α-carbossilico b è un acido più forte del gruppo carbossilico degli acidi alifatici

Aminoacidi. Gli α-aminoacidi sono molecole con almeno due gruppi funzionali legati al carbonio α

le porzioni con strutture secondarie sono avvicinate e impaccate mediante anse e curve della catena. STRUTTURA TERZIARIA

Metodi predittivi 1D

MFN0366-A1 (I. Perroteau) -traduzione e indirizzamento delle proteine. Solo per uso didattico, vietata la riproduzione, la diffusione o la vendita

Vittoria Patti MACROMOLECOLE BIOLOGICHE. 4. proteine

LE PROTEINE -struttura tridimensionale-

Capitolo 3 Le biomolecole

Introduzione alla Bioinformatica Strutturale. Dalla sequenza alla struttura delle proteine

ALIMENTI DI ORIGINE VEGETALE Verdure

α-amminoacidi O α O α R CH C O - NH 3 forma ionizzata sale interno (zwitterione) OH NH 2 forma non ionizzata (non esistente in realtà)

Visualizzazione Molecolare

Continua. Peptidasi H 2 O

Macromolecole Biologiche. I domini (III)

Una proteina nella rete: Caccia al tesoro bioinformatica

Corso di Laurea in Farmacia Insegnamento di BIOCHIMICA. Angela Chambery Lezione 6

FUNZIONI DELLE PROTEINE

La chimica della pelle

7. Introduzione a PyMol

Rappresentazione grafica di sistemi atomici e molecolari: editor e visualizzatori ESERCITAZIONE 5

scaricato da Proteine semplici costituite dai soli amminoacidi

COMPORTAMENTO ANFOTERO DEGLI AA

Introduzione al programma grafico Pymol

Macromolecole Biologiche. I domini (II)

Le proteine. Polimeri composto da 20 diversi aminoacidi

8. Sovrapposizione e confronto di strutture proteiche

Prof. Fulvio Ursini Dipartimento di Chimica Biologica (Vallisneri IV piano Nord) Viale G. Colombo, Padova. Tel.

Amminoacidi. Struttura base di un a-amminoacido

mediante proteasi industriali

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento

STRUTTURA E FUNZIONE DELLE PROTEINE

Markov Chains and Markov Chain Monte Carlo (MCMC)

Ø Gel Elettroforesi (GE) Ø Spettrometria di Massa (MS)

Informatica. Lezione VIII. Visualizzazione 3D A.A. 2010/11 SSCTA. 1 Lezione VIII Immagini 3D

I gruppi R differenziano i 20 amminoacidi standard. Tratto da D. Voet, G. Voet e C.W. Pratt Fondamenti di biochimica

strutture di Proteine

AMINOACIDI - 1 AMINOACIDI - 2

dieta vengono convertiti in composti dei corpi chetonici.

Funzioni delle proteine

CORSO DI BIOCHIMICA PER INGEGNERIA BIOMEDICA I ESERCITAZIONE

AMINOACIDI. GENE PROTEINA EFFETTO. calore. idrolisi acida (o alcalina) Struttura generale degli α-aminoacidi primari (standard, normali):

LE PROTEINE SINTESI PROTEICA. funzione delle proteine nel nostro organismo

Introduzione alla biologia della cellula. Lezione 2 Le biomolecole

Formazione. di un peptide.

Polimorfismo genetico del collageno

E il server più utilizzato, permette di tracciare tutte le operazioni che svolge e di impostare alcuni parametri importanti per il risultato finale.

Traduzione dell informazione genetica (1)

3.3. UMAMI NEGLI ALIMENTI

FUNZIONE DELLE PROTEINE RAPPORTO STRUTTURA-FUNZIONE

PROTEINE. sono COMPOSTI ORGANICI QUATERNARI

PROTIDI: LE PROTEINE E GLI AMMINOACIDI

OBIETTIVI MINIMI Anno scolastico TIC-TIT. 1. Foglio elettronico: funzioni fondamentali (Excel)

LE BIOMOLECOLE DETTE ANCHE MOLECOLE ORGANICHE; CARBOIDRATI PROTEINE. sono ACIDI NUCLEICI. molecole complesse = POLIMERI. formate dall'unione di

BIOMOLECOLE. I mattoni delle cellule.

CARBOIDRATI C H O ZUCCHERO SACCARIDE GLUCIDE CARBOIDRATO

Le Biomolecole I parte. Lezioni d'autore di Giorgio Benedetti

MODIFICAZIONI POST-TRADUZIONALI DELLE PROTEINE

Intervalli di confidenza

STRUTTURA E FUNZIONE DELLE PROTEINE

STUDIO E SPERIMENTAZIONE DI METODOLOGIE

Database Modulo 6 CREAZIONE DI MASCHERE

La struttura delle proteine e. organizzazione. ramificati di aminoacidi

Analisi della varianza

gruppo amminico Gli aminoacidi polimerizzano durante la sintesi delle proteine mediante la formazione di legami peptidici. gruppo carbossilico

BIOINFORMATICA PER LA BIOLOGIA STRUTTURALE

Utilizzo delle Maschere in Microsoft Access

Транскрипт:

Predizione della struttura secondaria

Predire la struttura secondaria Mediamente il 50% dei residui in una proteina si trovano in conformazione strutturata classica (alfa o beta) o altre conformazioni meno tipiche ma ugualmente strutturate. La struttura secondaria si forma grazie alla natura polare dei gruppi C=O e N-H del legame peptidico, quindi è una stabilizzazione caratteristica del BACKBONE delle proteine, non delle catene laterali. Le strutture α- elica sono molto dipendenti dal susseguirsi dei residui nella catena, quindi sono più facili da predire. Le struttura β-strand è influenzata da β-strand vicini che originano dei foglietti, quindi è molto difficile da predire.

Quando effettuare la predizione La predizione è per sua natura una stima basata su assunzioni ed emessa secondo regole di probabilità. In molti casi la predizione più appropriata è direttamente quella tridimensionale, es. se si trovano in banca dati PDB delle proteine che hanno un alto livello di similarità con quella in esame. Molti sistemi automatici di predizione avvertono chiaramente su questa possiblità

Metodo statistico di Chou & Fasman L algoritmo nasce dall osservazione che bastano 6 aminoacidi contigui per nucleare un α-elica e solo 3 per un β-strand. La propensione degli aminoacidi a stare in struttura viene presa in termini di frequenza dalla banca dati PDB e si procede in questo modo: 1 - Osservazione della frequenza di ogni residuo in una struttura in ogni entry del database. 2 - Costruzione di una tabella di probabilità per ogni residuo in ogni struttura, comprese le frequenze degli aa contigui a 1, 2 e 3 AA di distanza.

Metodo statistico di Chou & Fasman Eliche α 1. Tovare una regione in cui 4/6 AA hanno P(α) > 100 2. Estendere in entrambe le direzioni finchè 4 AA hanno P(α) media < 100. 3. E α-elica se il segmento è > 5 residui e la sua P(α) media > P(β) media. Strand-β 1. Tovare una regione in cui 3/5 AA hanno P(β) > 100 2. Estendere in entrambe le direzioni finchè 4 AA hanno P(β) media < 100. 3. E strand-β se P(β) media > 105 e P media (β) > P media (α). β-turn 1. Calcolare per ogni residuo p(t) = f(j)f(j+1)f(j+2)f(j+3) 2. E β-turn se (a) p(t) > 0.000075 (b) P(turn) media > 100 (c) P(turn) media > P(α) media (d) P(turn) media > P(β) media GTRFSYADEQSERTIDSV P(α) media < 100 P(β) media = 104.5 P(α) media = 112.5 => ALPHA!!! 4/6 P(α) > 100 P(α) media < 100 affidabilità: 64%

Metodo statistico di Chou & Fasman http://bioinfo.hku.hk/fasta/chofas.htm

Metodo termodinamico Agadir http://www.embl-heidelberg.de/services/serrano/agadir/agadir-start.html Non predice la struttura secondaria, ma analizza una sequenza alla ricerca di zone ad alta probabilità di formare una α-elica. L approccio non è statistico, ma TERMODINAMICO, in pratica simula la strutturazione in silico di frammenti contigui, valutando i possibili ponti H che si possono formare.

Uso delle reti neurali (perceptroni) α Strato di output p(α) p(β) p(-) Pesi variabili definiti durante l apprendimento Strato di input Gruppi di input (21 elementi) Sequenza input (13 residui) MVLRST L FWENSA

PHD (Profile network from HeiDelberg) http://www.predictprotein.org E basato sul metodo dei profili utilizzati su allineamenti multipli. La considerazione biologica è che da questi allineamenti si possono osservare delle conservazioni che rispettano la struttura tridimensionale della famiglia proteica. PHD oggi è integrato nel pacchetto online PredictProtein col nome di PROFsec. 1 - La singola query viene mandata contro Swiss-Prot per trovare proteine simili 2 - Le proteine trovate vengono multiallineate 3 - Viene generato un profilo, che entra in una rete neurale (PHD) che è stata precedentemente addestrata con allineamenti di strutture note. I risultati che si ottengono sono sottoposti ad una analisi statistica per valutare l attendibilità delle predizioni per ogni residuo. => affidabilità: dal 72% fino al 90%

Le due fasi principali di PHD

PSIPRED http://bioinf.cs.ucl.ac.uk/psipred/ Utilizza un sistema composto da due reti neurali che analizzano i risultati della prima interazione di PSI-BLAST. 1 - Esecuzione di PSI-BLAST con la query desiderata. 2 - Generazione di una PSSM (matrice posizionale di scoring) dai risultati della prima iterazione 3 - Predizione della struttura secondaria con una rete neurale opportunamente addestrata 4 - Una seconda rete neurale di correzione filtra il risultato e genera l output definitivo, valutando la confidenza per ogni residuo.

JPRED http://www.compbio.dundee.ac.uk/www-jpred/ Lancia automaticamente molti programmi per la predizione della struttura secondaria e poi crea una sequenza consenso pesata.

Database di strutture secondarie DSSP (Kabsh & Sander): generato tramite il programma DSSP che ricostruisce le strutture secondarie da un file PDB in cui sono contenute informazioni tridimensionali, analizzando i ponti idrogeno. HSSP (Sander & Schneider): nasce dall allineamento di proteine ad alta similarità, a cui viene fatto corrispondere un profilo di struttura secondaria comune. Esiste una entry hssp per ogni struttura proteica nota. L importanza di questi database sta nel fatto che molti metodi per la predizione li consultano per cercare delle similarità.

Una entry di HSSP Viene riportato, per ogni aminoacido della proteina - la struttura secondaria che forma - che tipo di legami intercorrono - l accessibilità al solvente - la variabilità (entropia) della posizione nella famiglia.

E la banca dati delle strutture tridimensionali delle proteine Si effettuano per lo più ricerche di tipo testuale, anche se si può usare una specie di BLAST che cerca contro le sequenze primarie delle strutture del database.

Il file di struttura tridimensionale (file.pdb) Un file PDB è un file di testo in cui sono riportate le coordinate di tutti gli atomi di una proteina, oltre a numerose altre annotazioni di varia natura. HEADER ACYLPHOSPHATASE 08-NOV-96 2ACY TITLE ACYL-PHOSPHATASE (COMMON TYPE) FROM BOVINE TESTIS COMPND MOL_ID: 1; COMPND 2 MOLECULE: ACYLPHOSPHATASE; COMPND 3 CHAIN: NULL; COMPND 4 SYNONYM: ACP; COMPND 5 EC: 3.6.1.7; COMPND 6 BIOLOGICAL_UNIT: MONOMER SOURCE MOL_ID: 1; SOURCE 2 ORGANISM_SCIENTIFIC: BOS TAURUS; SOURCE 3 ORGANISM_COMMON: BOVINE; SOURCE 4 ORGAN: TESTIS; SOURCE 5 CELLULAR_LOCATION: CYTOPLASM KEYWDS ACYLPHOSPHATASE, PHOSPHORIC MONOESTER HYDROLASE EXPDTA X-RAY DIFFRACTION AUTHOR M.M.G.M.THUNNISSEN,P.NORDLUND

Il file di struttura tridimensionale (file.pdb) Nel file PDB possono essere inclusi dati di struttura secondaria, ma non è per questo che sono stati fatti Esistono delle sezioni precise del file in cui inserire certe informazioni HELIX 1 H1 PHE 22 LYS 32 1 11 HELIX 2 H2 ALA 55 THR 67 1 13 SHEET 1 S1 5 HIS 74 VAL 85 0 SHEET 2 S1 5 LEU 6 LYS 16-1 N ASP 10 O HIS 81 SHEET 3 S1 5 VAL 47 PRO 54-1 N GLY 53 O ILE 7 SHEET 4 S1 5 VAL 36 ASN 41-1 N VAL 36 O GLN 52 SHEET 5 S1 5 PHE 94 VAL 97 1 N VAL 97 O ASN 41 TURN 1 T1 PHE 22 THR 5 TYPE II' TURN 2 T2 PHE 14 VAL 17 TYPE IV TURN 3 T3 VAL 17 VAL 20 TYPE IV TURN 4 T4 THR 42 GLY 45 TYPE I TURN 5 T5 SER 70 SER 73 TYPE I

Tipo atomo Coordinata X Tag Coordinata Y n atomo Residuo Coordinata Z Flessibilità n residuo ATOM 1 N ALA 1 13.196 6.710 0.033 1.00 80.57 N ATOM 2 CA ALA 1 11.875 6.755-0.583 1.00 78.70 C ATOM 3 C ALA 1 10.858 6.436 0.487 1.00 77.39 C ATOM 4 O ALA 1 11.101 5.567 1.314 1.00 80.16 O ATOM 5 CB ALA 1 11.811 5.706-1.691 1.00 79.51 C ATOM 6 N GLU 2 9.727 7.120 0.496 1.00 66.64 N ATOM 7 CA GLU 2 8.741 6.765 1.493 1.00 65.50 C ATOM 8 C GLU 2 7.398 6.494 0.835 1.00 65.06 C ATOM 9 O GLU 2 7.316 6.375-0.396 1.00 62.92 O ATOM 10 CB GLU 2 8.748 7.578 2.788 1.00 66.75 C ATOM 11 CG GLU 2 9.232 6.756 3.974 1.00 67.60 C ATOM 12 CD GLU 2 9.572 7.604 5.177 1.00100.00 C ATOM 13 OE1 GLU 2 8.631 8.227 5.725 1.00100.00 O ATOM 14 OE2 GLU 2 10.759 7.641 5.577 1.00100.00 O ATOM 15 N GLY 3 6.346 6.331 1.627 1.00 57.60 N ATOM 16 CA GLY 3 5.059 6.045 1.024 1.00 54.68 C ATOM 17 C GLY 3 4.967 4.552 0.630 1.00 51.19 C

Visualizzatori tridimensionali per proteine I programmi per la visualizzazione delle strutture tridimensionali delle proteine interpretano i file PDB posizionando sfere di diametro adeguato all atomo nelle posizioni specificate nel file. I legami vengono posizionati secondo i criteri imposti dal tipo di residuo es. tutti i carboni α (CA) saranno legati insieme, ogni residuo avrà i suoi atomi legati tra loro ecc. Oggi esistono svariati programmi per la visualizzazione tridimensionale delle proteine, la maggior parte dei quali sono liberi. I più semplici e probabilmente più utilizzati sono: RasMol : per la visualizzazione e l osservazione delle proteine Deep View Swiss PDB Viewer: per una analisi dettagliata e per apportare modificazioni alla proteina

RasMol Presenta 2 finestre: la linea di comando e la parte grafica, in cui viene effettuato il rendering delle strutture. Si possono effettuare moltissime operazioni con il mouse senza scrivere nulla, ma molte altre non sono disponibili.

Display wireframe backbone sticks spacefill ball&stick ribbons strands cartoon

Comandi di RasMol Si possono caricare degli script, cioè una lista di operazioni da svolgere in sequenza scritti in un unico file di testo con l opportuna sintassi. Le selezioni si effettuano indicando o il numero dei residui o utilizzando dei gruppi predefiniti (es. select 10-20 seleziona i residui da 10 a 20, select 10,20 seleziona solo i residui 10 e 20, select arg seleziona tutte le arginine, select alpha seleziona tutte le α eliche). Combinando select, restrict e colour è possibile mettere in rilievo particolari sezioni della molecola, per studiarne dal vivo le caratteristiche geometriche e spaziali.