- Lo studio della struttura delle proteine mediante metodi computazionali -
|
|
- Ambra Angeli
- 7 anni fa
- Visualizzazioni
Transcript
1 - Lo studio della struttura delle proteine mediante metodi computazionali - Lo scopo della Bioinformatica e della Biologia Computazionale è quello di offrire strumenti e metodologie capaci di gestire ed analizzare la grande quantità di informazioni prodotte nel campo della ricerca biologica, determinata soprattutto dall enorme produzione di sequenze di acidi nucleici e di proteine, che è il risultato degli studi relativi alle due discipline omiche, genomica e proteomica. L obiettivo dell era post-genomica è quello di comprendere i meccanismi molecolari che determinano l attività biologica di tutte le proteine codificate da ciascun genoma sequenziato. Per poter raggiungere questo obiettivo, gli strumenti computazionali e bioinformatici sono di grande aiuto, anche se essi devono essere considerati naturalmente complementari e non alternativi alle normali tecniche sperimentali. Questi strumenti sono, infatti, utili per comprendere come le proteine si ripiegano nelle strutture native ( protein folding ), per predire la struttura tridimensionale di una proteina, in modo veloce ed accurato, dalla sola conoscenza della sua sequenza amminoacidica, e per formulare ipotesi sull attività biologica della proteina in esame. Tuttavia, è ovviamente da ricordare che qualunque applicazione pratica di quanto ipotizzato può essere realizzata solo mediante ulteriori studi di tipo sperimentale
2 1.1 Protein folding Le proteine svolgono nelle cellule degli organismi viventi un gran numero di funzioni che vanno dal semplice trasporto e immagazzinamento di piccole molecole e ioni a ruoli più complessi quali i processi enzimatici che sono necessari per la vita. Queste macromolecole sono costituite da venti tipi diversi di amminoacidi, legati in successione mediante il legame peptidico. Le diverse possibili sequenze di amminoacidi determinano strutture diverse dal punto di vista sia della struttura covalente sia della conformazione assunta nello spazio dalla proteina. Ed è proprio la struttura 3D di una proteina che determina la sua funzione. In realtà, non è realistico ipotizzare una semplice assegnazione sequenza->struttura, dal momento che sono conosciute molte proteine che, pur avendo un valore di omologia di sequenza molto basso, hanno strutture tridimensionali molto simili. Il numero di conformazioni strutturali (struttura tridimensionale di una proteina o fold), osservate finora, è minore di 700, anche perché queste derivano dalla combinazione di un piccolo numero di elementi semplici quali i due elementi principali di struttura secondaria presenti nelle proteine, eliche e foglietti. Il meccanismo di avvolgimento della catena polipeptidica (folding), mediante il quale una proteina assume in condizioni fisiologiche la sua struttura tridimensionale funzionalmente attiva, rappresenta il passaggio conclusivo del trasferimento dell informazione genetica dal DNA al suo prodotto finale (proteina attiva). La comprensione dei meccanismi, attraverso cui una catena polipeptidica giunge alla sua struttura tridimensionale attiva, affascina gli studiosi da vari decenni. Nel 1931, quando - 9 -
3 non era noto niente riguardo la sequenza e la struttura tridimensionale delle proteine, Wu [Wu, 1931] ha analizzato il processo di denaturazione delle proteine ed il loro ritorno allo stato nativo. Negli anni 30 sono stati pubblicati molti articoli, che mostrano che il processo di unfolding delle proteine è reversibile, sottolineando in questo modo che il protein folding è un processo spontaneo. Negli anni 50 le nuove conoscenze termodinamiche hanno sottolineato l importanza delle interazioni non covalenti riguardo la stabilità delle proteine; in particolare, Kauzmann ha suggerito che l effetto idrofobico è la forza guida, che dirige il processo del folding [Kauzmann, 1959]. La determinazione della prima struttura 3D di una proteina (cioè della mioglobina) nel 1958 ad opera di John Kendrew mediante il metodo di diffrazione ai Raggi X ha fornito una nuova base per l analisi della struttura delle proteine e per lo studio del processo di folding. Anfinsen ha dimostrato che alcune proteine in vitro possono essere sottoposte, introducendo agenti denaturanti quali la guanidina e l urea, ad un processo reversibile di denaturazione, durante il quale perdono la loro struttura tridimensionale [Anfinsen et al., 1961; Anfinsen et al., 1962; Anfinsen, 1973]. Rimuovendo questi agenti denaturanti si riottiene la struttura tridimensionale attiva caratterizzata da una struttura tridimensionale compatta [Figura 1.1]. Questa osservazione ha consentito ad Anfinsen di affermare che l informazione necessaria per ottenere la conformazione nativa (N) di una proteina in una data condizione fisiologica è contenuta nella sua sequenza amminoacidica. Ciò, da un punto di vista termodinamico, si traduce nella possibilità di affermare che lo stato N nelle condizioni fisiologiche costituisce un minimo dell Energia Libera di Gibbs
4 Schema dell esperimento di Anfinsen Figura 1.1 Schema relativo all esperimento di Anfinsen. Le osservazioni di Anfinsen sono state ulteriormente ampliate e discusse da Levinthal, che si pose il problema del tempo necessario affinché un sistema potesse raggiungere il suo stato di equilibrio [Levinthal, 1968]. Infatti, supponendo che il numero di conformazioni accessibili al singolo amminoacido sia uguale a due (elica e foglietto beta), per una catena polipeptidica di 100 amminoacidi il numero totale di conformazioni possibili è 2 100, che corrisponde a più di Se noi assumiamo che il tempo di interconversione da una conformazione alla sua alternativa è pari a
5 secondi, il tempo necessario per una ricerca casuale di tutte le conformazioni è di anni. Dato che i tempi di folding spaziano da qualche secondo ad alcuni minuti è evidente che l evoluzione ha trovato una soluzione efficace a questo procedimento. La soluzione di Levinthal a questo paradosso, ampliata e portata avanti anche da altri autori, è stata che il meccanismo di folding è sottoposto ad un controllo di tipo cinetico, ovvero che esistono dei veri e propri percorsi definiti, che conducono dalla struttura casuale e lineare (U) alla struttura nativa e funzionale (N). Da questo momento molti autori cominciarono a valutare se gli stati parzialmente strutturati, evidenziati sperimentalmente, rappresentassero degli intermedi produttivi (on pathway), cioè delle tappe fondamentali nel percorso del folding, o degli intermedi improduttivi (off pathway). Agli inizi degli anni 80 è stato evidenziato che gli intermedi on pathway hanno una struttura secondaria in grado di formare un nucleo compatto, ma più espanso della proteina nativa a causa dell assenza di specifiche interazioni terziarie (molten globule) [Figura 1.2]. Gli studi sono poi continuati negli anni fino ad arrivare ad una nuova visione del protein folding (folding funnel). In questa nuova visione, il concetto di percorso di folding, costituito da eventi sequenziali, è stato sostituito dal concetto di imbuto (funnel) di eventi paralleli rappresentato da diagrammi energetici [Figura 1.3]. In questi diagrammi l asse verticale rappresenta l energia libera interna di ogni specifica conformazione mentre gli assi orizzontali rappresentano le coordinate conformazionali necessarie per specificare ogni singola conformazione (ad esempio gli angoli diedri). La forma ad imbuto descrive la progressiva riduzione dello spazio conformazionale
6 accessibile, a partire dai molti gradi di libertà disponibili per le catene denaturate, fino ad arrivare alla proteina nello stato nativo che è caratterizzata, in prima approssimazione, da un unico sottostato conformazionale. Nella Figura 1.3a è rappresentato l imbuto che descrive il panorama energetico (energy landscape) più semplice cioè quello di una reazione a due stati, in cui non c è nessuno stato intermedio. Se si prendono in considerazione la formazione di intermedi, di trappole cinetiche e la presenza di barriere energetiche, il panorama diviene più vario [Figura 1.3b]. Il modello ad imbuto supera il paradosso di Levinthal, in quanto, pur ammettendo un gran numero di diversi cammini, alcuni dei quali possono dare origine ad intermedi inizialmente improduttivi, non consente un campionamento completamente casuale ma spinge il sistema verso il suo minimo di energia favorendo alcuni riarrangiamenti che portano verso lo stato nativo e rendendo estremamente improbabili i percorsi che risalgono l imbuto energetico. La nuova visione sul folding ha fornito uno spunto per altri studi, che si propongono di comprendere la relazione esistente tra le caratteristiche intrinseche di una proteina e la sua velocità di folding allo scopo di identificare parametri utili a predire l una in base alle altre. Qualche anno fa, da un analisi di proteine appartenenti a famiglie non omologhe, per le quali era disponibile una grande quantità di dati strutturali e cinetici, è emersa una correlazione tra la distanza media nella sequenza fra i residui che interagiscono nello stato nativo e la velocità di folding
7 Figura 1.2 Rappresentazione schematica del molten globule a confronto con la struttura dello stato nativo. Figura 1.3 Rappresentazione schematica attraverso diagrammi energetici a tre dimensioni ( folding funnels ) del processo di folding a due stati (a) e multistato (b)
8 Questo parametro è stato definito contact order. A questi lavori sperimentali si sono affiancati una serie di lavori teorici di Dinamica Molecolare, con il fine di simulare le proprietà strutturali fondamentali degli intermedi, che si formano durante il folding e che sono risultate essere correlate alle proprietà topologiche dello stato nativo [Clementi et al., 2000]. Inoltre, è stato anche determinato il ruolo giocato dalla posizione geometrica degli amminoacidi nel processo del folding in alcune proteine. Il protein folding è un argomento di grande interesse soprattutto dopo che è stato completato il sequenziamento del genoma di vari organismi (732 Batteri, 44 Archea e 786 Eucarioti). Infatti, il problema maggiore dell era post-genomica è quello di individuare i singoli geni e le proteine da essi codificate e, soprattutto, di avere informazioni sulla loro struttura tridimensionale, perché è essa, più della sequenza, che definisce la loro funzione biologica. La comprensione approfondita dei meccanismi molecolari, che sono alla base del folding delle proteine, rappresenterebbe un traguardo per tutta la comunità scientifica, in quanto essa fornirebbe la possibilità di curare molte patologie associate ai processi di misfolding e di aggregazione di proteine, quali le encefalopatie spongiformi, che si possono originare in seguito a disordini genetici sporadici e/o infettivi, che coinvolgono il cambiamento conformazionale della proteina. Ad esempio, quella del prione è una proteina di cui non si conosce ancora la funzione. Essa è presente nella cellula nella sua conformazione normale PrP C, che è costituita principalmente da -eliche, e si converte nella forma patologica PrP SC in cui parte delle -eliche si trasforma in foglietti. Il meccanismo dell azione infettiva del prione sembra essere quello di agire come stampo per la conversione di altre proteine sane
9 nella forma patologica. In pratica, le proteine patologiche sono in grado di indurre in proteine sane una cambiamento conformazionale che produce un riarrangiamento conformazionale (misfolding). Come il prione si converte dalla forma normale a quella patologica e cosa favorisce questo processo è ancora sconosciuto. La pubblicazione della sequenza completa del genoma di vari organismi, ha portato alla scoperta delle sequenze di molte proteine, di cui non sono note né le strutture né le funzioni. Al momento sono riportate nella banca dati GenBank sequenze nucleotidiche, in UniProt/Swiss-Prot sequenze proteiche e in PDB strutture proteiche. Come si vede da questi dati, il numero di proteine, di cui è stata determinata sperimentalmente la struttura 3D, è molto più basso di quello delle sequenze note; ciò è dovuto certamente sia al fatto che i metodi sperimentali non sono sempre applicabili sia al fatto che il loro utilizzo richiederebbe troppo tempo. 1.2 Metodi di predizione della struttura delle proteine La struttura di una proteina può essere ottenuta sperimentalmente mediante Spettroscopia di Risonanza Magnetica (NMR) e mediante diffrazione ai Raggi X (RX). L NMR permette di esaminare una proteina in soluzione e di generare anche un quadro della sua dinamica ma è applicabile solo a proteine che non superano i residui. La diffrazione ai Raggi X offre dati molto precisi ma le strutture costrette in cristalli non sempre rappresentano immagini fedeli di proteine nella loro conformazione attiva. Questi metodi sperimentali spesso non possono essere utilizzati dal momento che non
10 tutte le proteine sono cristallizzabili o solubili nelle quantità sufficienti per misure NMR. In alternativa ai metodi sperimentali, si sono sviluppati dei metodi computazionali aventi lo scopo di predire la struttura tridimensionale di una proteina, in modo veloce ed accurato, dalla sola conoscenza della sua sequenza amminoacidica e di comprendere come le proteine si ripiegano nelle strutture native. Attualmente ci sono vari metodi di predizione di struttura secondaria delle proteine e di struttura terziaria, tra i quali si possono distinguere tre categorie: modellamento per omologia, riconoscimento di fold e metodi ab-initio. 1.3 Metodi di predizione di struttura secondaria Negli ultimi anni le tecniche di predizione di struttura secondaria sono arrivate ad offrire un alto grado di affidabilità. In generale, si possono distinguere due tipi di metodi: metodi statistici e metodi connessionistici. Essi si propongono di assegnare gli elementi di struttura secondaria a sequenze proteiche partendo dalla conoscenza della struttura di proteine, utilizzate come campioni esemplari, delle quali siano note sia la sequenza sia la conformazione tridimensionale. Una delle tecniche di predizione su base statistica più usate è quella elaborata da Chou e Fasman, che va a valutare la propensità di ciascun amminoacido a trovarsi in una particolare struttura secondaria (elica, -strand e coil) [Chou & Fasman, 1974]. Questo metodo fornisce una tabella nella quale ciascun amminoacido viene classificato con un
11 coefficiente, che riflette la frequenza con la quale esso forma, interrompe o è indifferente alla formazione di ciascun tipo di struttura secondaria. Un altro criterio statistico di predizione è quello di Garnier, Osguthorpe e Robson. L idea basilare su cui tale metodo è fondato è che lo stato conformazionale di un dato amminoacido è determinato non solo dalla sua stessa natura ma anche da quella degli altri amminoacidi ad esso adiacenti. Quindi un dato amminoacido R nella posizione j+m esercita un influenza sullo stato confomazionale del residuo j-mo misurata come I(S j, R j+m ), dove S j è lo stato conformazionale del residuo j. Ciò significa che se il residuo nella posizione j-1 si trova in un dato elemento strutturale, è probabile che anche il residuo j faccia parte di esso. In pratica si considera significativa l influenza di 8 residui amminoacidici a sinistra ed a destra di quello considerato. La probabilità che il residuo j adotti la conformazione S viene calcolata come L(S j ) = I(S j,r j+m ) dove m = -8,., +8 e per il residuo j viene predetto lo stato conformazionale al quale corrisponde il maggiore valore di probabilità. Questi metodi statistici non raggiungono un accuratezza maggiore del 65%. L informazione evolutiva presente nell allineamento multiplo di un insieme di proteine omologhe può consentire un incremento significativo dell accuratezza della predizione delle strutture secondarie. Infatti, il metodo connessionistico più utilizzato è PHDsec (a Profile fed neural network system from Heidelberg for secondary structure prediction). Esso utilizza l informazione evolutiva derivante dall allineamento multiplo di un insieme di sequenze di proteine omologhe. In particolare, sottomessa una singola
12 sequenza, il programma cerca in modo automatico nella banche dati proteine omologhe a quella di partenza, ne esegue l allineamento multiplo e procede all applicazione dell algoritmo. Questo algoritmo di predizione utilizza una rete neurale a più strati tarata da una fase di apprendimento effettuata su una serie di proteine a struttura tridimensionale nota. Questo metodo connessionistico raggiunge una accuratezza media del 72%. 1.4 Modellamento per omologia Il modellamento per omologia è il metodo più affidabile per ottenere una predizione della struttura tridimensionale di una proteina ed è applicabile quando la percentuale di identità di sequenza tra la proteina da modellare e quella di riferimento è compresa tra il 20-40%. Infatti, due proteine omologhe, cioè derivanti da uno stesso progenitore per un processo evoluzionistico, hanno subito durante l evoluzione solo mutazioni che non hanno distrutto nè la loro funzione biologica né la loro struttura 3D. Da ciò consegue che, quando due proteine hanno sequenze simili e la stessa funzione, avranno sicuramente anche strutture 3D simili. Si può, inoltre, sottolineare che esiste una relazione non biunivoca tra la similarità di due sequenze proteiche (numero di amminoacidi identici o simili) e la somiglianza tra le rispettive strutture tridimensionali; infatti, sono anche note proteine che, pur non avendo sequenze simili, hanno strutture simili
13 Dal momento che il modello per omologia si basa sull osservazione empirica che la similarità fra le sequenze di due proteine implica una similarità nella loro struttura, le coordinate della catena principale degli amminoacidi della proteina presa come riferimento (template) possono essere usate come un approssimazione delle coordinate delle regioni corrispondenti (secondo l allineamento) della proteina da modellare (target). Il modellamento per omologia si articola in vari stadi: identificazione della proteina di struttura nota che si userà come riferimento (template); identificazione delle regioni che ci si aspetta siano strutturalmente conservate tra il template e la proteina target; allineamento delle sequenze amminoacidiche di queste regioni; costruzione del modello delle regioni conservate usando come coordinate quelle della catena principale della proteina template secondo la corrispondenza dettata dall allineamento delle sequenze; costruzione del modello delle regioni strutturalmente variabili: regioni in cui ci sono delezioni ed inserzioni; modellamento delle catene laterali del modello; rifinitura del modello. È ormai ben noto, che la similarità della catena principale nel core (nucleo strutturalmente conservato tra proteine omologhe) di due proteine aumenta all aumentare della somiglianza tra le loro sequenze. Qualche anno fa, Cyrus Chothia e
14 Arthur Lesk (1986) hanno analizzato una trentina di coppie di proteine omologhe di struttura nota e sono andati a valutare la relazione tra l RMSD (deviazione quadratica media) del core delle due strutture sovrapposte e la percentuale di identità tra le loro sequenze. Questa analisi è stata fatta nel 1986 ma i risultati ottenuti sono stati successivamente confermati da vari autori che hanno utilizzato un numero maggiore di strutture proteiche [Hilbert et al., 1993]. È stato visto che l RMSD degli atomi della catena principale del core tra due proteine con identità di sequenza maggiore del 50% è minore di 1.0 Angstrom ed il core comprende il 90% delle strutture. Inoltre per coppie di proteine con identità di sequenza minore del 20%, la regione del core può comprendere non più del 50% delle strutture con una RMSD della catena principale in questa regione maggiore di 1.8 Angstrom; fuori dal core le deviazioni possono essere significative. Infine, coppie di proteine con identità in sequenza tra il 20% ed il 50 % hanno un grado di similarità intermedio [Figura 1.4]. Da ciò consegue che per costruire un modello il migliore template è quello che ha la maggiore identità di sequenza con la proteina target. Quando esistono più di una proteina di struttura nota con la stessa percentuale di identità di sequenza con la proteina target, è consigliabile scegliere la migliore, in base alla completezza ed alla risoluzione. Deciso quale o quali proteine possono essere utilizzate come riferimento, è necessario allineare le sequenze in modo da rendere massima la loro identità di sequenza (cioè il numero di amminoacidi identici in posizioni corrispondenti) o la loro similarità (assegnando un punteggio che descriva in qualche modo la similarità di ciascuna possibile coppia di amminoacidi)
15 RMSD (C ) [Å] 3 2,5 2 1,5 1 0, Identità [%] Figura 1.4 Relazione tra la percentuale di identità di sequenza di coppie di proteine ed i valori di RMSD relativi ai Carboni alfa (C ), ottenuti dopo aver sovrapposto le loro strutture tridimensionali [Hilbert et al., 1993]. Gli algoritmi di allineamento di sequenze permettono di misurare ed ottimizzare l identità e la similarità fra sequenze in modo sufficientemente accurato. Questo però non corrisponde alla migliore sovrapposizione strutturale fra proteine, che è quello di cui abbiamo bisogno per costruire un modello accurato. Pertanto dopo aver allineato le sequenze in modo automatico, è necessario controllare manualmente l allineamento ottenuto sfruttando informazioni varie quali la predizione di struttura secondaria, le sequenze di altre proteine della stessa famiglia della proteina target, la struttura tridimensionale della proteina template ed informazioni sperimentali su una o tutte le proteine. In particolare, le inserzioni e le delezioni, che sono le regioni più difficili da modellare, determinano variazioni strutturali locali. Pertanto tenendo presente la struttura tridimensionale della proteina di riferimento, bisogna controllare che le delezioni e le inserzioni non capitino in elementi di struttura secondaria, e aggiustare manualmente l allineamento. Spesso è utile allineare tutte le sequenze appartenenti alla
16 famiglia della proteina di riferimento; ciò permette di verificare quali regioni sono più conservate strutturalmente nella famiglia, anche perché queste saranno probabilmente conservate anche nella proteina target. Infine, le informazioni sperimentali sono importanti perché se la proteina target e quella di riferimento hanno la stessa funzione, gli amminoacidi del sito attivo devono essere allineati. Ottenuto un buon allineamento è possibile modellare le regioni strutturalmente conservate (SCR) della proteina target ma rimane il problema di come modellare i loop e le catene laterali. I loop, definiti come regioni strutturalmente variabili, non possono essere costruiti per omologia. Essi sono, di solito, regioni che connettono elementi di struttura secondaria, sono esposti sulla superficie e meno regolari di -eliche e foglietti. Al momento per modellare i loop vengono utilizzati o metodi di ricerca in banche dati o metodi abinitio. Il metodo di ricerca in banca dati si basa sull osservazione che regioni di conformazione simile si trovano in proteine sia omologhe sia non omologhe e, quindi, costruite per omologia le strutture delle regioni che fiancheggiano il loop, il numero di modi per unire tali strutture con un loop di lunghezza nota non può essere infinito e si possono ricercare nelle banche dati frammenti di proteine che si adattano a queste regioni, che sono definite stem. In pratica, si va a ricercare nella banca dati di strutture note delle regioni, che siano simili agli stem e che siano separate da un numero di residui uguale a quello del loop, che si deve modellare. I metodi ab-initio per la predizione dei loop si basano su simulazioni energetiche; quindi si generano le coordinate tridimensionali di tutti i loop (o quasi) che potrebbero congiungere gli stem
17 andando a valutare l energia dell intera proteina nei vari casi e scegliendo il loop, per il quale l energia totale assume il valore minimo. Per quanto riguarda le catene laterali di ciascun amminoacido si è andati a valutare la frequenza, con cui ciascun amminoacido viene osservato in una certa conformazione nelle proteine di struttura nota. Gli angoli corrispondenti a queste conformazioni sono raccolti in librerie di rotameri, che possono essere utilizzate per assegnare la conformazione agli amminoacidi della proteina target. Vari studi hanno confermato che se esiste una relazione evoluzionistica fra la proteina di riferimento e quella target, ci si può aspettare che anche le catene laterali delle due proteine tendono ad assumere conformazioni simili e quindi possono essere modellate le une sulle altre. Pertanto, molti metodi copiano gli angoli della catena dell amminoacido del template fin dove la lunghezza relativa delle catene laterali lo permette ed usano le librerie di rotameri per la parte restante. Spesso si utilizzano anche calcoli energetici; infatti, assegnato a ciascun amminoacido il suo rotamero più frequente, l energia totale della molecola viene sottoposta ad un processo di minimizzazione per rifinire gli angoli. L accuratezza di questi metodi diminuisce all aumentare della deviazione della catena principale del modello dalla struttura di riferimento; da ciò si deduce che, se vengono migliorati i metodi per costruire la catena principale, si riuscirà ad ottenere anche una migliore predizione delle catene laterali. 1.5 I metodi di riconoscimento di fold
18 È noto che ci sono proteine che esibiscono lo stesso fold anche in assenza di una rilevante similarità di sequenza e che il numero di fold, rappresentati in natura, è relativamente limitato (meno di 700) Thornton et al., Proteine con lo stesso fold ma con nessun similarità significativa di sequenza possono essersi evolute da un ancestore comune ma essersi diversificate tanto che la loro origine comune non è più facilmente deducibile dal confronto tra le loro sequenze, oppure è anche possibile che la similitudine sia dovuta al fatto che quella architettura è favorita per ragioni chimicofisiche. In presenza di una proteina, che non ha similarità di sequenza con nessuna delle proteine note, il modellamento per omologia non può essere utilizzato e, quindi, si va a ricercare se la sua sequenza è compatibile con uno dei fold già noti, valutando la probabilità con cui la sequenza target possa assumere una delle strutture presenti nella banca dati, indipendentemente dalla loro similarità di sequenza (target/template). Questo metodo viene chiamato riconoscimento di fold. I due approcci più usati sono quelli basati su profili e quelli cosiddetti di threading. I metodi basati su profili si basano sulla possibilità di dedurre dall analisi di proteine di struttura nota alcune proprietà caratteristiche per ciascun amminoacido, quali la frequenza relativa con cui ciascun amminoacido è osservato in uno dei tipi di struttura secondaria (preferibilmente, preferibilmente e nessuna preferenza), la frequenza con cui è osservato sulla superficie di una proteina (alta, bassa ed intermedia) e la frequenza con cui è osservato in un ambiente idrofobico (alta, bassa). In questo modo è possibile
19 associare a ciascun amminoacido una lettera, che rappresenta le modalità con cui esso è più frequentemente osservato nelle strutture note [Tabella 1.1]. Tabella 1.1 Possibile codifica delle propensità degli amminoacidi Più spesso in.. Frequenza di presenza in superficie Bassa ambiente idrofobico (a) Altra ambiente idrofobico (b) ambiente idrofobico (c) Alta ambiente idrofilico (d) ambiente idrofobico (g) ambiente idrofilico (e) ambiente idrofobico (h) ambiente idrofilico (f) ambiente idrofobico (i) Intermedia ambiente idrofilico (j) ambiente idrofobico (m) ambiente idrofilico (k) ambiente idrofobico (n) ambiente idrofilico (l) ambiente idrofobico (o) ambiente idrofilico (p) ambiente idrofilico (q) ambiente idrofilico (r) Ripetendo questo tipo di analisi per tutte le proteine di struttura nota, la banca dati di struttura tridimensionale diventa una banca dati lineare come quella relativa alle sequenze. Mediante i metodi classici di ricerca in banca dati, la sequenza delle propensità della proteina target può essere confrontata con la banca dati che rappresenta le caratteristiche strutturali delle proteine note. In questo modo, le proteine, che mostrano similarità significativamente più alta con la proteina target, sono quelle che possono essere utilizzate come riferimento
20 Nei metodi di threading si costruiscono tanti possibili modelli della proteina usando come riferimento (template) le proteine di struttura nota ed esplorando un gran numero di possibili allineamenti che includono inserzioni e delezioni. Tra questi modelli vengono scelti quelli che risultano migliori andando a fare per ciascuno di essi una valutazione energetica a livello degli amminoacidi e non dei singoli atomi. 1.6 Folding ab-initio I metodi descritti finora (modellamento per omologia e metodo basato sul riconoscimento del fold) si basano sempre sull osservazione di proteine note ma non ci permettono di capire come fa una proteina a raggiungere la sua struttura nativa in natura dal momento che le proteine non consultano banche dati. Una proteina si struttura nella sua conformazione nativa perché questa è energeticamente più favorevole di qualunque altra possibile conformazione; pertanto, se si riuscissero a generare tutte le possibili conformazioni di una proteina ed a valutare correttamente la loro energia, basterebbe andare a scegliere la conformazione a energia più bassa. Questo procedimento, però, non è applicabile poiché richiederebbe troppo tempo. I metodi ab-initio si basano sulla ricerca dei minimi di energia conformazionale e necessitano di due requisiti fondamentali: la determinazione della funzione energia che permetta di discriminare la conformazione nativa dalle altre ed un criterio affidabile ed efficiente di ricerca dei minimi energetici nello spazio delle conformazioni. Per valutare tutti i contributi energetici coinvolti nel calcolo dell energia conformazionale si deve tener conto sia di fattori intramolecolari (legami chimici, interazioni di van der
21 Waals, legami idrogeno, interazioni coulombiane, entropia conformazionale) sia dell interazione con il solvente (polarizzazione del mezzo, formazione di cavità, interazioni soluto-solvente, variazioni di struttura del solvente). Un modo per cercare la conformazione a energia minima è di minimizzare la funzione rispetto alla posizione degli atomi. Praticamente, partendo da una certa conformazione si variano le posizioni degli atomi e si calcola l energia della nuova conformazione. Se questa è minore della precedente, si ripete il procedimento effettuando un altra piccola variazione, altrimenti si ritorna indietro e si prova una variazione diversa. Mediante questo procedimento di minimizzazione è possibile trovare il minimo locale ma non quello globale, cioè quello più vicino alla conformazione di partenza ma non il più basso possibile nel caso in cui ci sono delle barriere di potenziale tra quest ultimo e la conformazione iniziale. Questo problema può essere superato o esplorando in maniera casuale lo spazio conformazionale senza preoccuparsi del fatto che esiste un modo fisicamente permesso per andare da una conformazione all altra (metodi stocastici) o fornendo agli atomi un energia cinetica che permetta a questi di superare la barriera di potenziale (dinamica molecolare). Molti studi sperimentali e teorici hanno dimostrato che il processo di folding è influenzato dalle proprietà topologiche dello stato nativo. Baker et al. [Plaxco et al., 1998] hanno indicato che esiste una correlazione tra le cinetiche del folding e la complessità topologica dello stato nativo. Koga e Takada [Koga e Takata, 2001] hanno studiato le relazioni tra la topologia di una proteina ed i folding pathways. Questi autori sono riusciti a descrivere i folding pathways di piccole proteine a singolo dominio,
22 considerando solo i C della catena polipeptidica ed usando una funzione di energia libera che tiene conto della connettività della catena, delle interazioni e dell entropia. Un interessante approccio topologico al problema del protein folding è stato proposto recentemente dal gruppo di Banavar e Maritan [Banavar et al., 2002, 2003a, 2003b]. Secondo questo approccio una proteina è modellata come un tubo di spessore non nullo. Mediante la procedura Metropolis Monte Carlo questi autori hanno simulato delle strutture di tipo elica e strand simili a quelle presenti nelle proteine. I risultati ottenuti sono incoraggianti e possono essere utilizzati in studi futuri []. 1.7 CASP Una valutazione dell affidabilità di questi metodi (modellamento per omologia, metodo di riconoscimento di fold, metodi ab-initio) viene fatta ogni due anni dalla comunità scientifica internazionale che ha istituito nel 1994 un esperimento chiamato CASP (Critical Assessment of Methods for Protein Structure Prediction). Questo esperimento valuta l efficacia di un metodo, confrontando la predizione con un risultato sperimentale. In pratica, ogni due anni viene chiesto a cristallografi ed a spettroscopisti NMR, che stanno per risolvere la struttura di una proteina, di rendere disponibile la sua sequenza. Queste sequenze (target) vengono assegnate ad una serie di predittori che devono depositare i loro modelli prima che la struttura sia resa pubblica. Un insieme di valutatori (assessors) confronta i modelli e le strutture, appena queste ultime sono rese disponibili, e cerca di valutare le predizioni e di trarre conclusioni generali. I risultati
23 vengono poi discussi in un convegno dove i valutatori ed i predittori si incontrano per discutere dei risultati. Dai risultati del CASP5 [Proteins 2003, 53 Suppl. 6, ] si può avere una valutazione dell accuratezza raggiunta dai tre metodi. Il modellamento comparativo è risultato ancora il metodo predittivo più affidabile. Ottimi risultati sono stati ottenuti soprattutto per le zone strutturalmente conservate (definite come core ) della proteina target. I limiti maggiori restano sempre quelli del modellamento delle catene laterali e dei loop; infatti, molti metodi sono stati sviluppati ma i risultati non sono ancora positivi. Sono stati ottenuti buoni risultati, nel caso di bassa percentuale di identità di sequenza tra la proteina target e quella/e template, migliorando l allineamento mediante i modelli di Markov ed i metodi basati sui profili. Gli esperimenti del CASP prevedono anche una sezione di valutazione di server automatici (CAFASP). Molti sono stati i server automatici di modellamento per omologia, che hanno ottenuto risultati migliori della media dei predittori ma è anche da sottolineare che per lo stesso target si sono registrate sia predizioni di ottima qualità sia predizioni completamente improbabili. Lo stesso si può dire per il metodo del riconoscimento di fold. Alcune volte i modelli ottenuti per riconoscimento di fold sono risultati più simili alla struttura sperimentale di qualunque delle strutture presenti nella banca dati. Inoltre, i predittori, che hanno ottenuto i migliori risultati, hanno combinato i loro metodi ed hanno organizzato un paio di workshop per poter discutere dei risultati ottenuti. Le proteine per cui si è riusciti ad avere risultati migliori, sono state quelle su
24 cui uno dei partecipanti lavorava sperimentalmente. Ciò ha fatto dedurre che un qualsiasi metodo funziona meglio se è abbinato ad una approfondita conoscenza delle caratteristiche biologiche delle proteine. Per quanto riguarda i metodi ab-initio, dai risultati del CASP5 si è potuto dedurre che nessuno dei metodi (minimizzazione, dinamica molecolare, Monte Carlo, algoritmi genetici) è in grado di trovare la conformazione a minima energia di una proteina. Ma la combinazione di questi metodi può dare buoni risultati per predire strutture di frammenti proteici. Il metodo di maggior successo nella categoria dei metodi ab-initio sia nel CASP4 sia nel CASP5 è stato il metodo ROSETTA. In questo metodo, la sequenza di una proteina target viene divisa in frammenti contigui di 3 e 9 amminoacidi. Tutti i frammenti di proteine di struttura nota che hanno sequenze uguali o simili a queste regioni vengono combinati, utilizzando il Metodo di Monte Carlo, al fine di predire la possibile conformazione della proteina target. 1.8 La Predizione delle interazioni proteina-proteina Quando è nota la struttura di due proteine e si sa che esse interagiscono, predire la loro orientazione relativa nel complesso rappresenta un problema non facile da risolvere. La simulazione fatta in silico della formazione del complesso molecolare a partire dalle strutture tridimensionali delle proteine, che lo compongono, viene definita con il termine docking. Il problema maggiore relativo alla predizione delle interazioni proteina-proteina è che la struttura delle proteine in un complesso è abbastanza diversa da quella assunta dalle
25 stesse proteine nella loro forma libera soprattutto nelle regioni dell interazione. Ciò è certamente dovuto al fatto che le catene laterali dei residui delle proteine sono relativamente mobili e talora seguono il formarsi del complesso con movimenti che determinano una migliore complementarità tra i residui delle proteine interagenti. Questi movimenti coinvolgono non solo le catene laterali dei residui ma talvolta comportano anche spostamenti di interi segmenti di strutture secondarie. Diversi metodi di docking sono stati sviluppati (DOCK, AUTODOCK, FlexX, ESCHER) sia per la ricostruzione di complessi proteina-proteina sia per l analisi di complessi tra proteine e ligandi. Il docking è molto utilizzato anche per la ricerca di nuovi inibitori di una proteina data mediante l utilizzo di banche dati di possibili ligandi. I metodi, finora sviluppati, si basano o su criteri geometrici o energetici. I metodi energetici sfruttano il fatto che le proteine formano complessi poiché questi sono energeticamente favoriti mentre quelli geometrici si basano sulla considerazione che le superfici di interazione delle due proteine, che formano il complesso, devono essere complementari. Una valutazione delle procedure di docking proteina-proteina, finora sviluppate, viene fatta periodicamente mediante un esperimento, analogo a quello del CASP, denominato CAPRI (Critical Assessment of PRedicted Interactions). Proprio come per il CASP, le predizioni vengono fatte e confrontate con le strutture dei complessi, ottenute mediante diffrazione ai Raggi X, prima che queste vengano rese pubbliche. In una delle ultime edizioni (CAPRI round 3) è emerso che molti metodi di docking trattano i componenti molecolari come corpi rigidi, mentre altri fanno ciò solo nei primi passaggi della
26 simulazione, in modo da eliminare le soluzioni più improbabili, e poi modellano le catene laterali e/o il backbone. Il maggiore limite di questi metodi è nel fatto che essi, quando tentano di predire strutture di complessi, raramente sono in grado di fornire una sola soluzione. Infatti, la maggior parte delle volte forniscono una lista di possibili modi di interazioni e scegliere la migliore tra queste non è facile. Recentemente, analizzando strutture di complessi note, si è cercato di studiare quali possono essere i parametri legati all interfaccia proteina-proteina. Ma eccetto l ampiezza dell interfaccia, che, in generale anche se non sempre, tende ad essere più larga nei complessi biologicamente attivi, altri parametri, come il numero di legami ad idrogeno per unità di superficie e le propensità di contatto tra residui, non sono risultati discriminatori. Per la predizione dell interazione proteina-proteina sono stati ottenuti buoni risultati combinando i metodi di docking con i due approcci classici, modellamento per omologia e threading, i quali rappresentano una strategia integrata, capace di predire i siti di interazione, i contatti tra i residui e, nei casi più fortunati, anche un modello dettagliato del complesso. Infatti, questi due metodi usano la struttura di un complesso noto come riferimento (template) per costruire il modello del complesso target. Però il limite di questo approccio è certamente legato alla percentuale di somiglianza, che c è tra le proteine target e quelle template. Russell ed i suoi collaboratori hanno recentemente dimostrato che proteine con una percentuale di omologia pari al 30-40% interagiscono allo stesso modo mentre il modo di interagire è raramente conservato per proteine con percentuale di identità di sequenza più bassa
Perché considerare la struttura 3D di una proteina
Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una
DettagliDiagramma di Ramachandran
Chimica Biologica A.A. 2010-2011 Diagramma di Ramachandran Diagramma di Ramachandran Catena polipeptidica La formazione in successione di legami peptidici genera la cosiddetta catena principale o scheletro
Dettagli30/10/2015. Molte proteine sono. intrinsecamente disordinate. o destrutturate (IDP/IUP), cioè non hanno una struttura
Molte proteine sono intrinsecamente disordinate o destrutturate (IDP/IUP), cioè non hanno una struttura terziaria e/o secondaria stabile. Le IUP sono caratterizzate da - scarso contenuto in aa apolari,
DettagliChimica Biologica A.A α-elica foglietto β reverse turn
Chimica Biologica A.A. 2010-2011 α-elica foglietto β reverse turn Str. Secondaria sperimentalmente osservata: Si distinguono fondamentalmente tre tipi di strutture secondarie: α elica foglietto β reverse
DettagliRicevimento Studenti: Lunedì previa prenotazione. Cenci lab
Cenci lab Giovanni Cenci Dip.to Biologia e Biotecnologie C. Darwin Sezione Genetica Piano 2 -Citofono 3/4 0649912-655 (office) 0649912-843 (lab) giovanni.cenci@uniroma1.it Ricevimento Studenti: Lunedì
DettagliLa struttura delle proteine
La struttura delle proteine Funzioni delle proteine Strutturali Contrattili Trasporto Riserva Ormonali Enzimatiche Protezione Struttura della proteina Struttura secondaria: ripiegamento locale della catena
DettagliProprietà comuni. Il gruppo α-carbossilico b è un acido più forte del gruppo carbossilico degli acidi alifatici
Gli aminoacidi Proprietà comuni Il gruppo α-carbossilico b è un acido più forte del gruppo carbossilico degli acidi alifatici paragonabili Il gruppo α-aminico è un acido più forte (o una base più debole
DettagliLE PROTEINE -struttura tridimensionale-
LE PROTEINE -struttura tridimensionale- Struttura generale di una proteina Ceruloplasmina Cosa sono??? Sono biopolimeri con forme ben definite. composti da molteplici amminoacidi, legati con legami peptidici
Dettaglisono le unità monomeriche che costituiscono le proteine hanno tutti una struttura comune
AMINO ACIDI sono le unità monomeriche che costituiscono le proteine sono 20 hanno tutti una struttura comune sono asimmetrici La carica di un amino acido dipende dal ph Classificazione amino acidi Glicina
DettagliCorso di BIOINFORMATICA Applicazioni BIO-Mediche
Corso di BIOINFORMATICA Applicazioni BIO-Mediche - Introduzione al Molecular Docking (algoritmi di ricerca e Moderni software) Pietro BUFFA Responsabile Unità Operativa di Bioinformatica Dipartimento di
DettagliAutorità per le Garanzie nelle Comunicazioni
Autorità per le Garanzie nelle Comunicazioni METODO PER IL RENDERING DEI DIAGRAMMI DI IRRADIAZIONE VERTICALI BASATO SUI DATI PREVISTI DALLE SPECIFICHE DI FORMATO DEL CATASTO AGCOM 1. Premessa Per calcolare
DettagliRelazione sequenza-struttura e funzione
Biotecnologie applicate alla progettazione e sviluppo di molecole biologicamente attive A.A. 2010-2011 Modulo di Biologia Strutturale Relazione sequenza-struttura e funzione Marco Nardini Dipartimento
DettagliSTRUTTURA E FUNZIONE DELLE PROTEINE
STRUTTURA E FUNZIONE DELLE PROTEINE PROTEINE 50% DEL PESO SECCO DI UNA CELLULA STRUTTURA intelaiatura citoscheletrica strutture cellulari impalcatura di sostegno extracellulare FUNZIONE catalisi enzimatica
DettagliLe macromolecole dei tessuti - 1
Le macromolecole dei tessuti - 1 Che cosa sono le proteine? Sono macromolecole complesse ad alta informazione Sono costituite da una o più catene polipeptidiche Ogni catena peptidica è composta da centinaia
DettagliFunzioni delle proteine
Funzioni delle proteine ENZIMI Proteine di trasporto Proteine di riserva Proteine contrattili o motili Proteine strutturali Proteine di difesa Proteine regolatrici Proteine di trasporto Emoglobina Lipoproteine
Dettagli5. Applicazione ai dati sperimentali, un modello di previsione delle temperature
5. Applicazione ai dati sperimentali, un modello di previsione delle temperature 5.1 Ricostruzione dello spazio delle fasi L utilizzo del teorema di embedding per ricostruire lo spazio delle fasi relativo
DettagliChimotripsina Una proteina globulare. Glicina Un amminoacido
Chimotripsina Una proteina globulare Glicina Un amminoacido - In teoria un numero enorme di differenti catene polipeptidiche potrebbe essere sintetizzato con i 20 amminoacidi standard. 20 4 = 160.000 differenti
DettagliLa struttura elettronica degli atomi
1 In unità atomiche: a 0 me 0,59A unità di lunghezza e H 7, ev a H=Hartree unità di energia L energia dell atomo di idrogeno nello stato fondamentale espresso in unità atomiche è: 4 0 me 1 e 1 E H 13,
DettagliENZIMI. Durante la reazione l enzima può essere temporaneamente modificato ma alla fine del processo ritorna nel suo stato originario, un enzima viene
ENZIMI Tutti gli enzimi sono PROTEINE che funzionano da catalizzatori biologici nelle reazioni cellulari, e lavorano in condizioni blande di temperatura e ph (sono in grado di aumentare la velocità delle
DettagliSCHEDA N 8 DEL LABORATORIO DI FISICA
SCHEDA N 1 IL PENDOLO SEMPLICE SCHEDA N 8 DEL LABORATORIO DI FISICA Scopo dell'esperimento. Determinare il periodo di oscillazione di un pendolo semplice. Applicare le nozioni sugli errori di una grandezza
DettagliCostituenti chimici della materia vivente
Costituenti chimici della materia vivente Le macromolecole biologiche Macromolecole (dal greco macros = grande) biologiche. Classi di composti biologici multifunzionali: Polisaccaridi proteine acidi
DettagliPredizione della struttura terziaria
Predizione della struttura terziaria Metodi di predizione La predizione della struttura tridimensionale è di gran lunga la predizione più complessa che si possa fare su una proteina. Esistono 3 metodi
DettagliRappresentazione grafica di sistemi atomici e molecolari: editor e visualizzatori ESERCITAZIONE 5
Rappresentazione grafica di sistemi atomici e molecolari: editor e visualizzatori ESERCITAZIONE 5 Editor e visualizzatori Spesso è utile rappresentare graficamente la struttura atomica o molecolare del
DettagliAMMINOACIDI E PROTEINE
AMMINOACIDI E PROTEINE 1 AMMINOACIDI Gli amminoacidi sono composti organici composti da atomi di carbonio, idrogeno, ossigeno e azoto e in alcuni casi anche da altri elementi come lo zolfo. Gli amminoacidi
DettagliParametri dell α-elica. residui/giro 3.6. passo dell elica
GRAFICO DI RAMACHANDRAN Parametri dell α-elica residui/giro 3.6 spazio/residuo passo dell elica 1.5 Å 5.4 Å 1 L α-elica può essere destabilizzata da interazioni tra i gruppi R: repulsione/attrazione elettrostatica
DettagliBiochimica delle proteine Prof. M. Bolognesi a.a. 2007/2008. Eloise Mastrangelo
Biochimica delle proteine Prof. M. Bolognesi a.a. 2007/2008 Eloise Mastrangelo Perché è importante determinare la struttura primaria delle proteine? 1. La conoscenza della sequenza amminoacidica delle
DettagliLE PROTEINE. SONO Polimeri formati dall unione di AMMINOACIDI (AA) Rende diversi i 20 AA l uno dall altro UN ATOMO DI C AL CENTRO
LE PROTEINE SONO Polimeri formati dall unione di ATOMI DI C, H, N, O CHE SONO AMMINOACIDI (AA) Uniti tra loro dal Legame peptidico 20 TIPI DIVERSI MA HANNO STESSA STRUTTURA GENERALE CON Catene peptidiche
DettagliFormazione del legame peptidico:
Formazione del legame peptidico: Planare, ha una forza intermedia tra il legame semplice ed il legame doppio. 2^ lezione N R C C O O O + R N R C O C O O N R C C N C C O Ogni piano delle unità peptidiche
DettagliPredire la struttura terziaria
Predire la struttura terziaria E di gran lunga la predizione più complessa che si possa fare su una proteina. Esistono 3 metodi principali di predizione: 1 - Homology modelling: se si conoscono proteine
DettagliGeometria analitica di base. Equazioni di primo grado nel piano cartesiano Funzioni quadratiche Funzioni a tratti Funzioni di proporzionalità inversa
Equazioni di primo grado nel piano cartesiano Funzioni quadratiche Funzioni a tratti Funzioni di proporzionalità inversa Equazioni di primo grado nel piano cartesiano Risoluzione grafica di un equazione
DettagliCORSO DI PERFEZIONAMENTO
UNIVERSITÀ DEGLI STUDI DI SIENA DIPARTIMENTO DI FISICA CORSO DI PERFEZIONAMENTO PERCORSI DIDATTICI DI FISICA E MATEMATICA: MODELLI, VERIFICHE SPERIMENTALI, STATISTICA ATOMI E CARICA ELETTRICA: PROPOSTA
DettagliMODULO BIMESTRALE N.1:Le Grandezze in Fisica
CLASSE PRIMAFISICA MODULO BIMESTRALE N.1:Le Grandezze in Fisica Conoscere il concetto di grandezza, di misura, di unità di misura, di equivalenza e gli strumenti matematici per valutare le grandezze. ABILITA
Dettagliε 340 nm A 260 nm A 260nm = 1.36 A 340 nm = A 340nm A = c [NADH] = : 6.22 x 10 3 = x 10-6 M
ESERCIZI 2 Esercizio n.1 Trovare la concentrazione di NAD e NADH in una soluzione miscelata basandosi sui seguenti dati ottenuti in una cuvetta da 1 cm : I coefficienti di estinzione molare a 260 nm sono
Dettagli7 Disegni sperimentali ad un solo fattore. Giulio Vidotto Raffaele Cioffi
7 Disegni sperimentali ad un solo fattore Giulio Vidotto Raffaele Cioffi Indice: 7.1 Veri esperimenti 7.2 Fattori livelli condizioni e trattamenti 7.3 Alcuni disegni sperimentali da evitare 7.4 Elementi
DettagliLe interazioni deboli:
Le interazioni deboli: sono legami non covalenti sono da 1 a 3 ordini di grandezza più deboli dei legami covalenti sono alcune volte maggiori della tendenza a dissociare dovuta all agitazione termica delle
DettagliLA STRUTTURA DELLE MOLECOLE. Orbitali molecolari e legame chimico
LA STRUTTURA DELLE MOLECOLE Orbitali molecolari e legame chimico GLI ORBITALI MOLECOLARI Quando degli atomi collidono tra di loro i loro nuclei ed elettroni vengono a trovarsi in prossimità influenzandosi
DettagliLe trasformazioni chimiche e fisiche della materia. Lezioni d'autore di Giorgio Benedetti
Le trasformazioni chimiche e fisiche della materia Lezioni d'autore di Giorgio Benedetti INTRODUZIONE (I) VIDEO INTRODUZIONE (II) La comprensione delle proprietà delle sostanze e le trasformazioni che
DettagliTeoria e tecniche dei test
Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario
Dettagligruppo amminico Gli aminoacidi polimerizzano durante la sintesi delle proteine mediante la formazione di legami peptidici. gruppo carbossilico
gruppo amminico Gli aminoacidi polimerizzano durante la sintesi delle proteine mediante la formazione di legami peptidici. gruppo carbossilico Il legame peptidico si ha quando il gruppo carbossilico (-
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliTOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo
TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L
Dettagli30/10/2015 LIVELLI DI ORGANIZZAZIONE STRUTTURALE DELLE PROTEINE
LIVELLI DI ORGANIZZAZIONE STRUTTURALE DELLE PROTEINE 1 CARATTERISTICHE DEL LEGAME PEPTIDICO lunghezza intermedia tra un legame singolo e uno doppio ibrido di risonanza per il parziale carattere di doppio
DettagliLezione 20: Atomi e molecole
Lezione 20 - pag.1 Lezione 20: Atomi e molecole 20.1. Il punto della situazione Abbiamo visto, nella lezione precedente, come il modello atomico sia in grado di spiegare la grande varietà di sostanze che
DettagliCROMATINA ISTONI. Proteine relativamente piccole, con forte carica positiva per la presenza degli aminoacidi lisina e arginina
CROMATINA Complesso molecolare formato da DNA, istoni e proteine non istoniche ISTONI Proteine relativamente piccole, con forte carica positiva per la presenza degli aminoacidi lisina e arginina Si conoscono
DettagliReti Neurali in Generale
istemi di Elaborazione dell Informazione 76 Reti Neurali in Generale Le Reti Neurali Artificiali sono studiate sotto molti punti di vista. In particolare, contributi alla ricerca in questo campo provengono
DettagliFARMACODINAMICA. La farmacodinamica studia gli effetti biochimici e il meccanismo d azione dei farmaci.
FARMACODINAMICA La farmacodinamica studia gli effetti biochimici e il meccanismo d azione dei farmaci. La farmacodinamica si propone di: * identificare i siti d azione dei farmaci * delineare le interazioni
DettagliIl tipo di legame chimico influenza in maniera fondamentale le caratteristiche macroscopiche del materiale.
Il tipo di legame chimico influenza in maniera fondamentale le caratteristiche macroscopiche del materiale. 1 Nei materiali si distinguono cinque tipi di legame. Nei ceramici solo tre sono importanti:
DettagliIL LEGAME CHIMICO. Per descrivere come gli elettroni si distribuiscono nell atomo attorno al nucleo si può far riferimento al MODELLO A GUSCI
IL LEGAME CIMICO Come dagli atomi si costruiscono le molecole 02/19/08 0959 PM 1 Per descrivere come gli elettroni si distribuiscono nell atomo attorno al nucleo si può far riferimento al MODELLO A GUSCI
DettagliMacromolecole Biologiche Interazioni non covalenti
Interazioni non covalenti D H A δ - δ + δ - Le interazioni non covalenti Interazioni fra atomi che non sono legati da legami covalenti. Le interazioni non covalenti sono molto meno intense rispetto alle
DettagliLegami chimici. Covalente. Legami deboli
Legami chimici Covalente Legami deboli Legame fosfodiesterico Legami deboli Legami idrogeno Interazioni idrofobiche Attrazioni di Van der Waals Legami ionici STRUTTURA TERZIARIA La struttura tridimensionale
Dettaglile porzioni con strutture secondarie sono avvicinate e impaccate mediante anse e curve della catena. STRUTTURA TERZIARIA
STRUTTURA TERZIARIA le porzioni con strutture secondarie sono avvicinate e impaccate mediante anse e curve della catena. Le proteine globulari dopo aver organizzato il proprio scheletro polipeptidico con
DettagliConfigurazioni elettroniche e periodicità
Configurazioni elettroniche e periodicità Le configurazioni elettroniche dei vari elementi sono una funzione periodica del numero atomico Z. Gli elementi che appartengono allo stesso gruppo nella tavola
DettagliGrandezze fisiche e loro misura
Grandezze fisiche e loro misura Cos è la fisica? e di che cosa si occupa? - Scienza sperimentale che studia i fenomeni naturali suscettibili di sperimentazione e caratterizzati da entità o grandezze misurabili.
DettagliGrandezze fisiche e loro misura
Grandezze fisiche e loro misura Cos è la fisica? e di che cosa si occupa? - Scienza sperimentale che studia i fenomeni naturali suscettibili di sperimentazione e che implicano grandezze misurabili. - Sono
DettagliB6. Sistemi di primo grado
B6. Sistemi di primo grado Nelle equazioni l obiettivo è determinare il valore dell incognita che verifica l equazione. Tale valore, se c è, è detto soluzione. In un sistema di equazioni l obiettivo è
DettagliGIUSTIFICAZIONE TEORICA DELLA FORMULA DI PETRY MEDIANTE L ANALISI DIMENSIONALE
M. G. BUSATO GIUSTIFICAZIONE TEORICA DELLA FORMULA DI PETRY MEDIANTE L ANALISI DIMENSIONALE NOTA TECNICA MGBSTUDIO.NET SOMMARIO La formula di Petry è una formula semiempirica che consente di stimare,
DettagliCapitolo 2 Le misure delle grandezze fisiche
Capitolo 2 Le misure delle grandezze fisiche Gli strumenti di misura Gli errori di misura Il risultato di una misura Errore relativo ed errore percentuale Propagazione degli errori Rappresentazione di
DettagliLa mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione
La mappatura dei geni umani SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione Un grande impulso alla costruzione di mappe genetiche è stato dato da le tecniche della
DettagliImmagini e concetti della biologia
Sylvia S. Mader Immagini e concetti della biologia 2 A3 Le molecole biologiche 3 Il carbonio è l elemento di base delle biomolecole Una cellula batterica può contenere fino a 5000 tipi diversi di composti
DettagliLA RETTA. La retta è un insieme illimitato di punti che non ha inizio, né fine.
LA RETTA La retta è un insieme illimitato di punti che non ha inizio, né fine. Proprietà: Per due punti del piano passa una ed una sola retta. Nel precedente modulo abbiamo visto che ad ogni punto del
DettagliLe competenze in Fisica e Scienze
Le competenze in Fisica e Scienze Indicazioni Nazionali: cosa prevedono Azioni per l esame di stato: Quadro di riferimento Rubric di valutazione Simulazioni Nazionali 1. Osservare e identificare fenomeni;
DettagliAdenina Adenine H H N N N N N Z
Adenina Adenine Z Guanina O GUAIA Z Citosina CITOSIA Z O Timina Thymine C3 O Z O Siti di attacco elettrofilo 3 Thymine Basi appaiate: Timina-Adenina Adenine C 3 O O 3.ooA Basi appaiate: Citosina-Guanina
Dettagliscaricato da www.sunhope.it Proteine semplici costituite dai soli amminoacidi
Proteine semplici costituite dai soli amminoacidi Proteine coniugate costituite dagli amminoacidi + porzioni di natura non amminoacidica dette GRUPPI PROSTETICI Le Proteine coniugate prive del gruppo prostetico
DettagliChimica Fisica Biologica
Chimica Fisica Biologica Università degli Studi di Padova Variazione della concentrazione [1] La variazione nel tempo della composizione di un sistema oggetto della cinetica chimica Le concentrazione delle
DettagliAmplificatori in classe A con accoppiamento capacitivo
Ottobre 00 Amplificatori in classe A con accoppiamento capacitivo amplificatore in classe A di Fig. presenta lo svantaggio che il carico è percorso sia dalla componente di segnale, variabile nel tempo,
DettagliMarkov Chains and Markov Chain Monte Carlo (MCMC)
Markov Chains and Markov Chain Monte Carlo (MCMC) Alberto Garfagnini Università degli studi di Padova December 11, 2013 Catene di Markov Discrete dato un valore x t del sistema ad un istante di tempo fissato,
DettagliUNITÀ DIDATTICA 5 LA RETTA
UNITÀ DIDATTICA 5 LA RETTA 5.1 - La retta Equazione generica della retta Dalle considerazioni emerse nel precedente capitolo abbiamo compreso come una funzione possa essere rappresentata da un insieme
DettagliIntervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
DettagliSCUOLA PRIMARIA SCIENZE (Classe 1ª)
SCUOLA PRIMARIA SCIENZE (Classe 1ª) scientifico. all ambiente. Osservare e descrivere i cambiamenti della natura in rapporto al trascorrere delle stagioni. Analizzare oggetti e coglierne le principali
DettagliGLI ORBITALI ATOMICI
GLI ORBITALI ATOMICI Orbitali atomici e loro rappresentazione Le funzioni d onda Ψ n che derivano dalla risoluzione dell equazione d onda e descrivono il moto degli elettroni nell atomo si dicono orbitali
DettagliModelli e Metodi per la Simulazione (MMS)
Modelli e Metodi per la Simulazione (MMS) adacher@dia.uniroma3.it Programma La simulazione ad eventi discreti, è una metodologia fondamentale per la valutazione delle prestazioni di sistemi complessi (di
DettagliPrincipi di Biochimica
Principi di Biochimica Augusto Innocenti Biologo Nutrizionista Perfezionamento in Biochimica e Biologia Molecolare Phd in Neurobiologia e Neurofisiologia Materia: Atomi e Molecole La materie è costituita
DettagliCAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
DettagliSistemi Web per il turismo - lezione 3 -
Sistemi Web per il turismo - lezione 3 - Software Si definisce software il complesso di comandi che fanno eseguire al computer delle operazioni. Il termine si contrappone ad hardware, che invece designa
DettagliØ Gel Elettroforesi (GE) Ø Spettrometria di Massa (MS)
Tecniche di indagine nello studio delle PTMs Ø Gel Elettroforesi (GE) Ø Tecniche cromatografiche (LC, HPLC) Ø Spettrometria di Massa (MS) Possono essere utilizzate da sole o in combinazione, direttamente
Dettaglicaratteristiche dei viventi
caratteristiche dei viventi teoria cellulare Teoria cellulare La Teoria Cellulare formulata da Schleiden e Schwann tra il 1838 e il 1839 afferma che Tutti gli organismi viventi sono formati da cellule.
DettagliCOMPORTAMENTO ANFOTERO DEGLI AA
Proprietà acido-basiche degli aminoacidi FORMA NON IONICA Non esiste a nessun valore di ph FORMA ZWITTERIONICA È la forma prevalente a ph 7 COMPORTAMENTO ANFOTERO DEGLI AA CARICA NETTA +1 CARICA NETTA
DettagliNote sulla probabilità
Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15
DettagliGenomica, proteomica, genomica strutturale, banche dati.
Genomica, proteomica, genomica strutturale, banche dati. Alcune pietre miliari della biologia anno risultato 1866 Mendel scopre i geni 1944 il DNA è il materiale genetico 1951 prima sequenza di una proteina
DettagliMACROMOLECOLE. Polimeri (lipidi a parte)
MACROMOLECOLE Monomeri Polimeri (lipidi a parte) Le caratteristiche strutturali e funzionali di una cellula o di un organismo sono determinate principalmente dalle sue proteine. Ad esempio: Le proteine
DettagliDECLINAZIONE COMPETENZE SCUOLA PRIMARIA: MATEMATICA CLASSI 1 a 2 a 3 a
DECLINAZIONE COMPETENZE SCUOLA PRIMARIA: MATEMATICA CLASSI 1 a 2 a 3 a COMPETENZE 1. Operare con i numeri nel calcolo scritto e mentale CONOSCENZE CONTENUTI A. I numeri da 0 a 20 B. I numeri da 20 a 100
DettagliLaurea Magistrale in Biologia
Laurea Magistrale in Biologia Laboratorio del corso di Chimica Fisica Biologica Anno accademico 2009/10 SCOPO Determinazione dei parametri termodinamici associati alla denaturazione termica di una piccola
DettagliSerie storiche Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Serie storiche Introduzione Per alcuni dataset, l attributo target è soggetto ad un evoluzione temporale e risulta associato ad istanti di tempo successivi. I modelli di analisi delle serie storiche si
Dettaglidelle curve isoterme dell anidride carbonica
COMPORTAMENTO DEI GAS REALI l andamento delle curve isoterme dell anidride carbonica mostra che: a temperature elevate le isoterme assomigliano a quelle di un gas perfetto Diagramma di Andrews a temperature
DettagliLa matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
DettagliESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)
ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI () Calibrazione intrinseca Spesso risulta utile calibrare la sola componente intrinseca di un sistema di visione (matrice K), e non si dispone di oggetti di forma
DettagliLa ricerca sociale: metodologia e tecniche
La ricerca sociale: metodologia e tecniche [Corso di Sociologia generale] a.a. 2014 2015 Docenza: Pierpaola Pierucci - Mail: pierpaola.pierucci@unife.it Quali metodi? Quali tecniche? Ricerca quantitativa
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliLa chimica della vita: i composti organici. CARBOIDRATI LIPIDI PROTEINE ACIDI NUCLEICI (DNA, RNA)
La chimica della vita: i composti organici. CARBOIDRATI LIPIDI PROTEINE ACIDI NUCLEICI (DNA, RNA) L atomo del carbonio (C).. C. Atomo tetravalente. C C C C Gli idrocarburi I legami del carbonio 109.5 gradi
DettagliStruttura degli amminoacidi
AMMINOACIDI, PEPTIDI E PROTEINE AMMINOACIDI, PEPTIDI E PROTEINE AMMINOACIDI, PEPTIDI E PROTEINE Le proteine sono macromolecole costituite dall unione di un grande numero di unità elementari: gli amminoacidi
DettagliLA SINTESI PROTEICA LE MOLECOLE CHE INTERVENGONO IN TALE PROCESSO SONO:
LA SINTESI PROTEICA La sintesi proteica è il processo che porta alla formazione delle proteine utilizzando le informazioni contenute nel DNA. Nelle sue linee fondamentali questo processo è identico in
DettagliPRIMI ELEMENTI DI TERMODINAMICA. La termodinamica studia le leggi con cui i sistemi scambiano (cedono e ricevono) energia con l ambiente.
PRIMI ELEMENTI DI TERMODINAMICA Un sistema è un insieme di corpi che possiamo immaginare avvolti da una superficie chiusa, ma permeabile alla materia e all energia. L ambiente è tutto ciò che si trova
DettagliDisciplina: SCIENZE MATEMATICHE UNITÀ DI APPRENDIMENTO 1
Disciplina: SCIENZE MATEMATICHE UNITÀ DI APPRENDIMENTO 1 OBIETTIVO FORMATIVO Avviare alla conoscenza di termini e simboli matematici. Utilizza ed interpreta il linguaggio matematico e ne coglie il rapporto
DettagliLE ORIGINI BIOLOGICHE DEL PENSIERO
Jean Piaget Maggiore teorico della psicologia dello sviluppo cognitivo; segna le origini del cognitivismo e rappresenta un punto di riferimento per le ricerche sul funzionamento dei processi cognitivi
DettagliIBRIDAZIONE e GEOMETRIA MOLECOLARE
IBRIDAZIONE e GEOMETRIA MOLECOLARE Esempio: struttura della molecola del metano CH 4 1s 2s 2p Configurazione elettronica del C Per esempio il carbonio può utilizzare la configurazione in cui un elettrone
DettagliStruttura dell atomo atomo particelle sub-atomiche - protoni positiva - neutroni } nucleoni - elettroni negativa elemento
Struttura dell atomo L atomo è la più piccola parte dell elemento che conserva le proprietà dell elemento Negli atomi ci sono tre diverse particelle sub-atomiche: - protoni (con carica positiva unitaria)
DettagliIntroduzione alla biologia della cellula. Lezione 2 Le biomolecole
Introduzione alla biologia della cellula Lezione 2 Le biomolecole Tutte le molecole contenute nelle cellule sono costituite da composti del carbonio Zuccheri Lipidi Proteine Acidi nucleici Polimeri Sono
DettagliUniversità degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali
Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si
DettagliINDICI PER FILE. Accesso secondario. Strutture ausiliarie di accesso
INDICI PER FILE Strutture ausiliarie di accesso 2 Accesso secondario Diamo per scontato che esista già un file con una certa organizzazione primaria con dati non ordinati, ordinati o organizzati secondo
DettagliLE PROTEINE SINTESI PROTEICA. funzione delle proteine nel nostro organismo
LE PTEIE Le proteine sono sostanze organiche presenti in tutte le cellule di tutti gli organismi viventi Le proteine sono costituite da,,,, (S) Struttura delle proteine Le proteine sono macromolecole (
Dettagli