Modelling. Perché considerare la struttura 3D di una proteina
|
|
- Chiara Randazzo
- 6 anni fa
- Visualizzazioni
Transcript
1 Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una proteina Metodi sperimentali: Xray, NMR Metodi computazionali: Da templato (C.M, F.R), senza Templato (N.F.) Vantaggi: Forniscono strutture affidabili Svantaggi: Non sempre applicabili Costosi e con tempi lunghi Vantaggi: Veloci Economici e sempre applicabili Svantaggi: Forniscono predizioni in cui il margine di errore può essere alto. 1
2 Structural Genomics Assegnare strutture 3D alle proteine codificate da genomi interi Grand goal : asssegnare una struttura ad ogni sequenza esistente. Combinazione di esperimenti & predizioni Structural genomics I metodi di predizione dovrebbero essere in grado di produrre strutture 3D per tutte le sequenze senza soluzione sperimentale Homology modelling & fold recognition 0 Sequenze Comparative Models Strutture Metodi Computazionali: predizioni da templato. Comparative Modeling Fold Recognition Approccio Comune Individuazione struttura del templato o dei templati Allineamento del target con i templati. Costruzione modello. Valutazione del modello. Livello di predizione diverso 2
3 Risultati Ottenibili dai metodi Computazionali Necessaria una valutazione oggettiva dei metodi. CASP: stato dell arte CASP Critical Assessment of Techniques for Protein Structure Prediction. CAFASP Critical Assessment of Fully Authomated Techniques for Protein Structure Prediction. Valutazione gruppi migliori Valutazione server automatici migliori Dall analisi dei metodi migliori e più innovativi partono nuovi filoni di ricerca per migliorare la capacità predittiva dei metodi bioinformatici. 3
4 CASP 6 (2004) Il problema del folding delle proteine è stato risolto??? Dichiarazioni contrastanti fino a circa dieci anni fa. Critical Assessment of Techniques for Protein Structure Prediction blind test che coinvolge tutti i principali gruppi, ripetuto ogni 2 anni CASP-6 (e CAFASP-4) nel 2004 Oltre 250 gruppi di predittori, oltre 85 targets Cerca di misurare lo stato dell arte ed i miglioramenti in tutti i maggiori settori della predizione di strutture proteiche (Stabilisce un ranking dei migliori gruppi) CASP 6 Le principali categorie del CASP: Homology modelling Fold recognition Ab initio / novel folds Predizioni 1D Struttura secondaria Disordine Contatti domini Valutazione energetica modelli 4
5 T0137 Model Real Structure 135 residui. 40% di identità tra target e templato. L RMSD su tutta la struttura è di 0.98 A. CASP4 TargetT0100 Wrong Prediction from SAM-T99 Real Structure 5
6 COME COSTRUIRE UN MODELLO DELLA PROTEINA A PARTIRE DALLA SEQUENZA AMINOACIDICA COME COSTRUIRE UN MODELLO DELLA PROTEINA A PARTIRE DALLA SEQUENZA AMINOACIDICA A seconda di quanto la nostra proteina è simile a qualcche struttura già nota possiamo distinguere varie categorie per la predizione: 1.Comparative o homology modelling 2.Fold recognition e Threading 3.Ab initio 6
7 Target: Sequenza di cui si cerca la struttura Templato: Sequenza con struttura nota, stampo per il modello Comparative o homology modeling Ricerca in database Modello costruito da struttura omologa Fold recognition (Threading) Tenta di riconoscere omologie remote Approcci differenti che utilizzano struttura secondaria, profili di sequenza, funzioni energetiche specializzate,... Target: Sequenza di cui si cerca la struttura Templato: Sequenza con struttura nota, stampo per il modello 7
8 Similarità di sequenza similarità di struttura? Coppie di proteine con struttura simile (Rost, 1999) Coppie di proteine con struttura diversa Osservazione: Se un allineamento contiene più del 30% ca. di residui identici, allora le strutture molto probabilmente apparterranno allo stesso fold. Per allineamenti più corti la soglia è più alta. Però: in alcuni casi proteine con meno del 20% di identità di sequenza appartengono alla stessa classe di fold ( twilight zone ). 8
9 Ricerca in database Ricerca in database per trovare sequenze omologhe. Produce uno o più allineamenti tra le sequenze. Generalmente usato: PSI-BLAST I domini sono spesso identificabili dall allineamento multiplo. Utilizzo di dati sperimentali Cosa si sa della proteina da modellare? Ci sono evidenze sperimentali utili? P.es. attività enzimatica, domini noti, residui funzionali, proteine omologhe, ecc. Queste ed altre informazioni si trovano nelle banche dati di sequenze, in particolare Swiss-Prot Pfam Prima di iniziare il modelling è buona norma raccogliere tutte le informazioni disponibili per semplificare il lavoro e validare al meglio il modello. 9
10 Il problema dei domìni Molte proteine sono composte da più di un dominio, che possono essere presenti in diverse combinazioni sia a livello di sequenza (p.es. in SWISS-PROT) che di struttura risolta con dati sperimentali (PDB). Molte strutture PDB contengono singoli domìni. Comparative modelling 10
11 COME TROVARE UN TEMPLATO PER LA PROTEINA TARGET PDB-BLAST BLAST (il protocollo più semplice di fold recognition ora utilizzato per trovare templati ovvi per il target) Il protocollo più semplice di fold recognition. Utilizza il fatto che PSI-BLAST permette di salvare il PSSM e ripartire con una nuova ricerca usando lo stesso PSSM. Per massimizzare l informazione su sequenze simili, si inizia con una ricerca contro NR (non-redundant, = tutte le sequenze note) per 4-5 iterazioni, costruendo un PSSM. Questo PSSM viene utilizzato per cercare strutture simili nel database PDBAA (= sequenze con struttura nota). Il metodo, chiamato PDB-BLAST, è molto più sensibile di PSI-BLAST contro PDBAA, dato il maggior numero di sequenze utilizzate per creare il PSSM. Allo stesso tempo permette una ricerca mirata di sequenze in PDB nel secondo passaggio. In pratica viene utilizzato per distinguere casi di fold recognition facili e difficili. 11
12 COME COSTRUIRE IL MODELLO Dalla sequenza al modello 12
13 Comparative Modelling Schema classico: 1. Template 2. Alignment Raw model Loop modeling Side chain placement Refinement 3. Raw model (conserved regions) 4. Loop modeling (divergent regions) 5. Sidechain placement 6. Refinement Scelta del templato Criteri: X-ray o NMR? flessibilità Qualità della struttura X-ray: Risoluzione e B- factor NMR: Numero di vincoli Similarità Percentuale di identità Punteggio dell allineamento X-ray Generalmente è preferibile utilizzare il templato più simile. A parità di similarità è buona norma, salvo alcune eccezzioni, scegliere la struttura X-ray con la risoluzione migliore. NMR 13
14 Allineamento delezione inserzione target templato Ricerca in database per trovare sequenze omologhe con struttura nota. Assegna le posizioni di residui equivalenti fra target e templato. Determina inserzioni e delezioni. L allineamento determina la qualità del modello che si sta costruendo. L allineamento di sequenza non è sempre ottimale per construire i modelli. Generalmente usato: PSI-BLAST Come migliorare l allineamento L allineamento detta la qualità del modello finale Errori commessi durante l allineamento non possono essere più corretti! problema: il migliore allineamento di sequenza spesso non è ottimale per la struttura Esperienza... Alcune buone regole: Mantenere la geometria di residui conservati Considerare la struttura secondaria Inserzioni e delezioni possono essere spostate Collar extension : è possibile estendere una α-helix o β-strand? 14
15 Conclusioni dal CASP6/CAFASP4 Non compatibile con legame peptidico Miglior allineameno fra sequenze Allineameno alternativo e subottimale Compatibile con legame peptidico Metodi profilo profilo Allineamento ottimizzato Blast (sequenza sequenza) è stato sostituito dal più potente PSI-Blast (profilo sequenza), quindi... Allineamenti strutturali per la costruzione dei profili Basati su FSSP, HOMSTRAD, CATH, ecc. Costruzione del modello Valutazione della qualità di modelli alternativi Come scegliere il modello più giusto in mezzo a tante alternative. Modelli compositi Come combinare le parti migliori dei singoli modelli. 15
16 Individuazione struttura del templato o dei templati Allineamento del target con i templati Costruzione del modello Valutazione del modello Approccio classico: approssimazione di un allineamento strutturale con il migliore allineamento fra sequenze per sfruttare le coordinate del templato e ricostruire il target. Nuovi approcci: costruire una serie di modelli a partire da allineamenti fra sequenze non ottimali (allineamenti alternativi o subottimali). Allineamento del target con i templati Tanto maggiori sono le alternative, tanto maggiori è la probalibilità di avere la struttura più vicina alla nativa. Valutazione del modello CONSEGUENZA: Valutazione dei modelli alternativi prodotti tramite una funzione energetica e scelta della struttura energeticamente più favorita.? 3D SHOTGUN (Fischer, Proteins 2003) Un Meta-server che utilizza le predizioni di vari metodi per costruire modelli ibridi di tipo consensus. Assembla frammenti 3D di struttura Osservazione: Se più metodi predicono modelli simili (in 3D) è probabile che il risultato sia corretto. 16
17 Comparative protein structure modeling by iterative alignment, model building and model assessment (John & Sali, NAR 2003) Utilizza MODELLER per costruire i singoli modelli 17
18 Creazione allineamenti alternativi (un esempio) GAIA: Generator of Alignments by Inverse Approach Motivazione: aumentare il numero di allineamenti alternativi fra target e templato permette di aumentare il numero di modelli prodotti e aumenta la probabilità il modello strutturalmente migliore. Allineamento singolo Allineamento alternativi (suboptimal) Amplificazione alternative Variazione parametri allineamento Reconstruct Alignment Reconstruct Alignment Sequenza target e templato Reconstruct Alignment Alternative Alignment 18
19 Reconstruct Alignment Fasi della costruzione del modello finale: Pre-modello (mantenere le posizioni conservate nell allineamento) Loop modelling (costruire le parti mancanti gap nell allineamento) Catene laterali (posizionare le catene laterali mancanti) 19
20 Costruzione del pre-modello La struttura del templato viene utilizzata come stampo per costruire il modello seguendo l allineamento. flexible Regioni strutturalmente conservate e divergenti. Residui allineati e inserzioni/delezioni (indel). conserved Costruzione del pre-modello Le coordinate 3D dei residui strutturalmente conservati si possono utilizzare direttamente. flexible Le regioni variabili della struttura (generalmente loop) ed in particolare le posizioni vicine a indel devono essere predette. Due metodi principali per la costruzione: Fragment-based Restrained-based conserved 20
21 Costruzione fragment-based Idea: Copia le coordinate dei frammenti conservati più adatti. Costruisce un insieme spigoloso Mantiene meglio la geometria, p.es. del sito attivo Software: 3D-JIGSAW (Bates et al.) COMPOSER (Blundell et al.) HOMER (Tosatto et al.) Costruzione restrained-based Idea: Utilizza i templati per derivare restrizzioni alle posizioni atomiche. Ottimizza la struttura in base a queste. Spalma gli errori su tutta la struttura, minimizzandoli globalmente Non garantisce la geometria locale, p.es. del sito attivo Software: MODELLER (Šali et al.) 21
22 Loop modeling Al pre-modello possono mancare interi frammenti di catena principale non conservati nella famiglia proteica Inserzioni Delezioni loop Descrizione del problema: Si cerca un fold che colleghi il frammento N- terminale (pre-loop) con quello C-terminale (postloop) tramite k residui (φ,ψ) sono gli unici parametri liberi pre-loop post-loop Loop modeling Metodi di database Estrai frammenti di loop dalla PDB. Scegli il frammento che rispetta meglio i vincoli geometrici. Problema: non tutti i frammenti possibili sono disponibili in PDB. loop Metodi ab initio Genera molti frammenti alternativi basati sui vincoli geometrici (angoli torsionali). Seleziona il frammento migliore. Problema: tempi di calcolo. pre-loop post-loop 22
23 Loop Modeling: Divide & Conquer 1. Dividi ricorsivamente il loop di lunghezza n in due parti di lunghezza n/2 con un punto centrale C. C 2. Se n=1 calcola la coordinate atomiche (trasformazione geometrica). 3. Ricomponi le soluzioni per ricreare il loop originale. A B Come si può trovare C? Loop Modeling: Realization Genera un database di possibili punti centrali e posizioni finali per loop di tutte le lunghezze Usa il Monte Carlo sampling per limitarne la dimensione ed assicurare una buona distribuzione Selezione random di k punti di sampling Costruisci frammenti più grandi tramite concatenazione di frammenti corti (n + n = 2n) 23
24 Loop Modeling: : Ranking Selezione e ranking si basano su sequenza, geometria ed energia. Propensioni dei residui (filter) Backbone RMSD prima/dopo il loop RAPDF Knowledge-based potential (Samudrala & Moult, JMB 1998) Catene laterali Problema: Applicando le coordinate del templato sulla sequenza del target cambiano tipo, dimensione e posizione delle catene laterali. Assumendo un 50% di identità di sequenza vuol dire che ogni seconda catena laterale è stata sostituita. L RMSD cambia relativamente poco, però possono cambiare le conformazioni di residui importanti (p.es. del sito attivo). Esistono metodi standard per risolvere questo problema, p.es. SCWRL. 24
25 Catene laterali Hα g - (-60 ) t (180 ) Rotameri 3 posizioni preferite per angolo torsionale χ Cβ La propensione ad assumere uno dei rotameri varia a seconda delgli angoli torsionali (ϕ,ψ) e del tipo di aminoacido N g + (60 ) C Interdipendenza, effetto domino Dove possibile è meglio mantenere le conformazioni delle catene laterali del templato. Side-Chains With Rotamer Library Bower, Cohen & Dunbrack, JMB Metodo euristico molto veloce ed efficace Best practice al CASP Idea: Utilizza le probabilità dei rotameri Se possibile, scegli le soluzioni più probabili Dove questo non è possibile forma cluster di residui da risolvere con ricerca combinatoria Funzione energetica semplice: Collision detection Entropia (= bonus per rotameri più probabili) 25
26 Refinement Per ridurre tutti quei piccoli errori che si accumulano durante il processo di modelling si può ricorrere ai campi di forza (p.es. CHARMM o AMBER) per minimizzare l energia del modello. Riducono le collisioni molecolari e rendono il modello più bello. Non modificano significativamente il modello e richiedono relativamente tanto tempo di calcolo. In caso di eccesso possono incrementare l RMSD complessiva del modello. Valutazione dei modelli (un esempio) 26
27 Campi di forza e potenziali statistici Come in altri settori, anche per il calcolo delle energie di una conformazione proteica si possono distinguere due approcci diversi: Campo di forza = modello di tipo predittivo, parametri derivati da dati sperimentali; Potenziale statistico = modello statistico basato sulla distribuzione di AA nelle proteine note. In generale si può dire che i campi di forza sono più precisi mentre i potenziali statistici danno una migliore approssimazione della distanza dalla struttura nativa. Problema dei minimi locali nello spazio conformazionale... Un campo di forza tipico (CHARMM, AMBER o GROMACS) contiene le seguenti componenti energetiche: bonded: 1. bond stretching 2. angle bending 3. bond rotation (torsion) non-bonded: 1. van-der-waals 2. electrostatic Campi di forza Il contributo di solvatazione generalmente non viene calcolato. 27
28 Campi di forza van-der-waals elettrostatica (cariche di segno opposto) Potenziali statistici Knowledge-based: poiché molti aspetti della predizione di fold sono difficili, lacunosi e computazionalmente intrattabili è stato proposto di derivare una funzione di energia delle strutture reali osservate da paragonare con quelle predette. Sin dal 1990 da Sippl il termine Knowledge-based potential si usa per espressione del tipo: Dove P observed e P expected sta per probabilità o frequenza di un evento osservato nei confronti di uno atteso (reale). Ad esempio la vicinanza di due atomi ad una certa distanza nella struttura ecc. sono potenziali statistici. 28
29 Potenziali statistici Esempio: RAPDF (Residue-specific Allatom Probability Discriminatory Function; Samudrala & Moult, 1998) Potenziale statistico che distingue gli atomi pesanti per tutti e 20 i tipi di AA (168 tipi di atomi). P.es. Cα Val e Cα Trp sono atomi diversi. Le energie sono discretizzate in finestre di 1 A, da 2 (= distanze 0-2 A) a 20 A. Buon livello di discriminazione della nativa. Liberamente disponibile. Potenziali statistici solvatazione Uno degli esempi può essere l energia di solvatazione (proteine nel solvente) il cui calcolo richiede complessi calcoli di interazione delle particelle di acqua con la proteina. Jones nel 1999 propose di valutare: 1. Non gli atomi ma gli AA come singole entità. 2. Anziché calcolare l accessibilità al solvente calcolare il numero di residui che ricadono in un certo raggio (esempio 10 Ǻ) dall AA considerato. 3. Rapporto tra osservato e atteso dà una idea della distribuzione e se ci sono AA distribuiti male nel modello. Esempio AA carichi nel core proteico (molti AA nel suo intorno) che nelle strutture reali sono circondati da pochi AA perché esposti al solvente. 29
30 Potenziali Statistici: Knowledge based potential -Restituiscono valori di pseudo-energia. Basati su: Pregi: Veloci Difetti: Non basati su leggi fisiche reali, non restituiscono valori assoluti e applicabili solo in ambito comparativo Knowledge TOP500 (Lovell et al., Proteins 2003): Valutazione Energetica Tentano di approssimare Torsion Potential Nei potenziali statistici si premiano le soluzioni più frequenti rispetto ad una media presunta e si penalizzano le soluzioni meno frequenti. Le medie sono calcolate su un knowledge rappresentativo dell universo delle proteine. potenziale statistico basato sulla propensione degli angoli torsionali misurabili in un modello. Angoli considerati pre-phi pre-psi phi psi chi2 chi1 omega Valutazione del modello Una volta costruito è possibile valutare il modello con vari parametri di qualità. P.es.: Profili di frequenza o energia Ingombro sterico e collisioni Deviazione della geometria da parametri standard Per questo scopo esistono programmi dedicati, p.es. PROCHECK WHAT-CHECK VERIFY-3D PROSA-II 30
31 Valutazione del modello Come si risolvono questi problemi del modello senza crearne altri che possono essere peggiori?! Il CASP insegna la filosofia del Don t touch it Non conviene modificare localmente le strutture. Creare modelli con allineamenti alternativi da scegliere tramite profili di energia può permettere di migliorare il modello finale Bisogna sapere valutare quali parti dell allineamento si possono variare e quali no... Errori tipici Catene laterali Scostamento Loops Allineamento errato Templato errato 31
32 32
Perché considerare la struttura 3D di una proteina
Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una
DettagliPerché considerare la struttura 3D di una proteina
Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una
DettagliStructural Genomics. Grand goal : asssegnare una struttura ad ogni sequenza esistente.
Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una
DettagliAllineamento ottimizzato. Costruzione del modello
Metodi profilo profilo Allineamento ottimizzato Blast (sequenza sequenza) è stato sostituito dal più potente PSI-Blast (profilo sequenza), quindi... Allineamenti strutturali per la costruzione dei profili
DettagliPredizione della struttura terziaria
Predizione della struttura terziaria Metodi di predizione La predizione della struttura tridimensionale è di gran lunga la predizione più complessa che si possa fare su una proteina. Esistono 3 metodi
DettagliPredire la struttura terziaria
Predire la struttura terziaria E di gran lunga la predizione più complessa che si possa fare su una proteina. Esistono 3 metodi principali di predizione: 1 - Homology modelling: se si conoscono proteine
DettagliE il server più utilizzato, permette di tracciare tutte le operazioni che svolge e di impostare alcuni parametri importanti per il risultato finale.
Homology Modelling Homology modelling L omology modeling delle proteine è il tipo di predizione di struttura terziaria più semplice ed affidabile. Viene richiesta soltanto una (o più) sequenze di riferimento
DettagliDiagramma di Ramachandran
Chimica Biologica A.A. 2010-2011 Diagramma di Ramachandran Diagramma di Ramachandran Catena polipeptidica La formazione in successione di legami peptidici genera la cosiddetta catena principale o scheletro
DettagliLe Biomolecole II parte. Lezioni d'autore di Giorgio Benedetti
Le Biomolecole II parte Lezioni d'autore di Giorgio Benedetti LA STRUTTURA TERZIARIA DI UNA PROTEINA La struttura tridimensionale adottata da una proteina è detta struttura terziaria. Essa prende in considerazione
DettagliE il server più utilizzato, permette di tracciare tutte le operazioni che svolge e di impostare alcuni parametri importanti per il risultato finale.
Homology modelling L omology modeling delle proteine è il tipo di predizione di struttura terziaria più semplice ed affidabile. Viene richiesta soltanto una (o più) sequenze di riferimento su cui modellare
DettagliCENNI SUL TIPO DI FORZE
CENNI SUL TIPO DI FORZE Forze deboli che influenzano la struttura delle proteine: le interazioni di van der Waals repulsione attrazione Forze attrattive dovute a interazioni istantanee che si generano
DettagliChimica Biologica A.A α-elica foglietto β reverse turn
Chimica Biologica A.A. 2010-2011 α-elica foglietto β reverse turn Str. Secondaria sperimentalmente osservata: Si distinguono fondamentalmente tre tipi di strutture secondarie: α elica foglietto β reverse
DettagliRelazione Laboratorio di bioinformatica
Relazione Laboratorio di bioinformatica Davide Cittaro La predizione della struttura tridimensionale di una proteina sulla base della sequenza è un risultato ambito. L utilizzo di sole considerazioni fisico-chimiche
DettagliProtein folding. Un gran numero di interazioni deboli + ΔH
Protein folding -ΔS Un gran numero di interazioni deboli +ΔS + ΔH E r Protein structure modelling: A digression I polimeri (inclusi quelli di amino acidi) in generale non hanno una struttura unica. Le
DettagliQuarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST
Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni
DettagliApplicazioni BIO-Mediche. - Metodi Sperimentali di Determinazione & Metodi Computazionali di d i Predizione
Corso di BIOINFORMATICA Applicazioni BIO-Mediche - Metodi Sperimentali di Determinazione & Metodi Computazionali di d i Predizione - Banche dati strutturali, Files di coordinate atomiche e softwares di
DettagliMacromolecole Biologiche. Metodi di simulazione
Metodi di simulazione Dinamica molecolare Tecnica di simulazione che permette lo studio del moto e delle proprietà di un sistema di particelle. Moti localizzati (da 0.01 a 5 Å, da 10-15 a 10-1 s) - fluttuazioni
DettagliMacromolecole Biologiche. La struttura secondaria (II)
La struttura secondaria (II) Nello stesso anno (1951) in cui proposero l α elica, Pauling e Corey postularono anche l esistenza di un altra struttura secondaria: il foglietto β (β-sheet). Dopo l α elica,
Dettagligruppo amminico Gli aminoacidi polimerizzano durante la sintesi delle proteine mediante la formazione di legami peptidici. gruppo carbossilico
gruppo amminico Gli aminoacidi polimerizzano durante la sintesi delle proteine mediante la formazione di legami peptidici. gruppo carbossilico Il legame peptidico si ha quando il gruppo carbossilico (-
Dettagli8. Sovrapposizione e confronto di strutture proteiche
8. Sovrapposizione e confronto di strutture proteiche In questa esercitazione utilizzeremo il programma SwissPdbViewer (versione 4.0.1) per effettuare la sovrapposizione e il confronto di strutture proteiche.
DettagliMacromolecole Biologiche. La struttura secondaria (III)
La struttura secondaria (III) Reverse turn Le proteine globulari hanno una forma compatta, dovuta a numerose inversioni della direzione della catena polipeptidica che le compone. Molte di queste inversioni
DettagliLe sequenze consenso
Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica
DettagliBLAST. W = word size T = threshold X = elongation S = HSP threshold
BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query
DettagliSVILUPPO DI UN METODO PER LA COSTRUZIONE AUTOMATICA DI STRUTTURE PROTEICHE DA ALLINEAMENTI DI SEQUENZA
UNIVERSITÀ DEGLI STUDI DI PADOVA DIPARTIMENTO DI INGEGNERIA DELL INFORMAZIONE CORSO DI LAUREA MAGISTRALE IN INGEGNERIA INFORMATICA TESI DI LAUREA SVILUPPO DI UN METODO PER LA COSTRUZIONE AUTOMATICA DI
Dettagliscaricato da I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE
Legame peptidico I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE tra il gruppo amminico di un aminoacido ed il gruppo carbossilico di un altro. 1 Catene contenenti
DettagliMacromolecole Biologiche. La struttura secondaria (I)
La struttura secondaria (I) La struttura secondaria Struttura primaria PRPLVALLDGRDETVEMPILKDVATVAFCDAQSTQEIHE Struttura secondaria La struttura secondaria Le strutture secondarie sono disposizioni regolari
Dettagli- Lo studio della struttura delle proteine mediante metodi computazionali -
- Lo studio della struttura delle proteine mediante metodi computazionali - Lo scopo della Bioinformatica e della Biologia Computazionale è quello di offrire strumenti e metodologie capaci di gestire ed
DettagliLa struttura delle proteine e e descritta da quattro livelli di organizzazione
La struttura delle proteine e e descritta da quattro livelli di organizzazione Struttura Primaria- - la sequenza di aminoacidi Struttura Secondaria - strutture locali stabilizzate da legami H che coinvolgono
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliRelazione sequenza-struttura e funzione
Biotecnologie applicate alla progettazione e sviluppo di molecole biologicamente attive A.A. 2010-2011 Modulo di Biologia Strutturale Relazione sequenza-struttura e funzione Marco Nardini Dipartimento
DettagliCorso di Visione Artificiale. Texture. Samuel Rota Bulò
Corso di Visione Artificiale Texture Samuel Rota Bulò Texture Le texture sono facili da riconoscere ma difficili da definire. Texture Il fatto di essere una texture dipende dal livello di scala a cui si
DettagliLe proteine sono polimeri lineari costituiti da unità base formate da oltre 40 amminoacidi. Possono assumere forme diverse a seconda della funzione
Le proteine sono polimeri lineari costituiti da unità base formate da oltre 40 amminoacidi Hanno elevato PM Possono assumere forme diverse a seconda della funzione svolgono molteplici funzioni Tra le proteine
Dettaglistrutture di Proteine
Laboratorio di Bioinformatica I Database di strutture di Proteine Dott. Sergio Marin Vargas (2014 / 2015) Dal gene alla proteina La funzione della proteina è nella sua struttura 3D. Struttura delle proteine
DettagliRappresentazione grafica di sistemi atomici e molecolari: editor e visualizzatori ESERCITAZIONE 5
Rappresentazione grafica di sistemi atomici e molecolari: editor e visualizzatori ESERCITAZIONE 5 Editor e visualizzatori Spesso è utile rappresentare graficamente la struttura atomica o molecolare del
DettagliLa struttura delle proteine
La struttura delle proteine Funzioni delle proteine Strutturali Contrattili Trasporto Riserva Ormonali Enzimatiche Protezione Struttura della proteina Struttura secondaria: ripiegamento locale della catena
DettagliCorso di Matematica per la Chimica
Dott.ssa Maria Carmela De Bonis a.a. 2013-14 Risoluzione di Equazioni Algebriche Le equazioni algebriche sono equazioni del tipo P(x) = 0 dove P è un polinomio di grado n cioé P(x) = a 1 x n + a 2 x n
DettagliProprietà comuni. Il gruppo α-carbossilico b è un acido più forte del gruppo carbossilico degli acidi alifatici
Gli aminoacidi Proprietà comuni Il gruppo α-carbossilico b è un acido più forte del gruppo carbossilico degli acidi alifatici paragonabili Il gruppo α-aminico è un acido più forte (o una base più debole
DettagliFASTA. Lezione del
FASTA Lezione del 10.03.2016 Omologia vs Similarità Quando si confrontano due sequenze o strutture si usano spesso indifferentemente i termini somiglianza o omologia per indicare che esiste un rapporto
DettagliFASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento
Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente
DettagliRaffinamento Cristallografico e Validazione A.A. 2010-2011. Marco Nardini Dipartimento di Scienze Biomolecolari e Biotecnologie Università di Milano
Raffinamento Cristallografico e Validazione A.A. 2010-2011 Marco Nardini Dipartimento di Scienze Biomolecolari e Biotecnologie Università di Milano Cristalli Raffinamento Data collection ρ (x,y,z) Modello
DettagliCorso di Calcolo Numerico
Corso di Calcolo Numerico Dott.ssa M.C. De Bonis Università degli Studi della Basilicata, Potenza Facoltà di Ingegneria Corso di Laurea in Ingegneria Meccanica Risoluzione di Equazioni Algebriche Le equazioni
DettagliEsempio: distanze tra i Cα. g: Distanza media da una gap i: percentuale di iden7tà a: accessibilità al solvente d : distanza
Altra possibilità Spesso abbiamo più di una proteina di stru4ura nota omologa alla nostra (templa7) Ciascun templato ha una diversa distanza evolu7va dalla nostra proteina target e quindi sarà più o meno
DettagliSimulazione dei dati
Simulazione dei dati Scopo della simulazione Fasi della simulazione Generazione di numeri casuali Esempi Simulazione con Montecarlo 0 Scopo della simulazione Le distribuzioni di riferimento usate per determinare
DettagliPrestazioni Errori medi
Prestazioni Errori medi Per molecole nello stato fondamentale, closed-shell, formate da atomi da H a Ar Geometrie di equilibrio In vicinanza del minimo la superficie di potenziale a livello Hartee-Fock
DettagliRiconoscimento dell antigene
Riconoscimento dell antigene Risposta immune adattativa La risposta immune innata è molto efficiente ma non sempre riesce ad impedire il diffondersi dell infezione È essenziale quindi che subentri la risposta
DettagliInformatica e Bioinformatica: Basi di Dati
Informatica e Bioinformatica: Date TBD Bioinformatica I costi di sequenziamento e di hardware descrescono vertiginosamente si hanno a disposizione sempre più dati e hardware sempre più potente e meno costoso...
DettagliAnalisi della varianza
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO
DettagliCorrettezza (prima parte)
Fondamenti di informatica Oggetti e Java (prima parte) Capitolo 16 ottobre 2015 1 Contenuti Introduzione alla correttezza dei programmi specifica di un programma correttezza di un programma verifica di
DettagliProspettive di sviluppo
5. DISCUSSIONE Una analisi dei risultati ottenuti con l utilizzo di SOMA e con il riferimento esterno della classificazione strutturale nota, evidenzia l insufficienza di una codifica basata sulle frequenze
DettagliAlgoritmi di Allineamento
Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento
DettagliDerivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)
Derivazione numerica Introduzione al calcolo numerico Il calcolo della derivata di una funzione in un punto implica un processo al limite che può solo essere approssimato da un calcolatore. Supponiamo
DettagliRiconoscimento automatico di oggetti (Pattern Recognition)
Riconoscimento automatico di oggetti (Pattern Recognition) Scopo: definire un sistema per riconoscere automaticamente un oggetto data la descrizione di un oggetto che può appartenere ad una tra N classi
DettagliLa struttura elettronica degli atomi
1 In unità atomiche: a 0 me 0,59A unità di lunghezza e H 7, ev a H=Hartree unità di energia L energia dell atomo di idrogeno nello stato fondamentale espresso in unità atomiche è: 4 0 me 1 e 1 E H 13,
DettagliSi osserva il comportamento dei protoni La proteina è in soluzione
Risonanza magnetica nucleare Si osserva il comportamento dei protoni La proteina è in soluzione Risonanza magnetica nucleare Si osserva il comportamento dei protoni La proteina è in soluzione Si assegnano
DettagliCenni di statistica statistica
Cenni di statistica La statistica è una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare fenomeno in condizioni di incertezza o non determinismo, ovvero di non completa
DettagliP2p la teoria dei sistemi complessi per modellare reti p2p
P2p la teoria dei sistemi complessi per modellare reti p2p 1 Peer to Peer Per P2P si intende: un sistema decentralizzato un sistema auto-organizzato un sistema nel quale i nodi mantengono indipendenza
Dettagli10. Previsione della struttura tridimensionale di una proteina
10. Previsione della struttura tridimensionale di una proteina Lo scopo di questa esercitazione è di comprendere la logica alla base della modellizzazione per omologia attraverso la previsione della struttura
DettagliBIOINFORMATICA PER LA BIOLOGIA STRUTTURALE
BIOINFORMATICA PER LA BIOLOGIA STRUTTURALE Predizione di struttura secondaria La predizione di struttura secondaria è trattata nel corso base "Informatica e Bioinformatica" per la laurea triennale di primo
DettagliCURRICOLO VERTICALE PER COMPETENZE DISCIPLINARI. Scuola Secondaria di Primo Grado Matematica -
CURRICOLO VERTICALE PER COMPETENZE DISCIPLINARI Scuola Secondaria di Primo Grado Matematica - Classe Prima COMPETENZA CHIAVE EUROPEA: COMPETENZA MATEMATICA Profilo dello studente al termine del Primo ciclo
DettagliMisure di diversità tra unità statistiche. Loredana Cerbara
Misure di diversità tra unità statistiche Loredana Cerbara LA DISTANZA IN STATISTICA In statistica la distanza ha un significato diverso da quello che si può intuire in altre discipline, dove, peraltro,
DettagliSTATISTICA AZIENDALE Modulo Controllo di Qualità
STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la
DettagliFunzioni implicite - Esercizi svolti
Funzioni implicite - Esercizi svolti Esercizio. È data la funzione di due variabili F (x, y) = y(e y + x) log x. Verificare che esiste un intorno I in R del punto di ascissa x 0 = sul quale è definita
DettagliEsercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini)
Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Collegatevi al sito www.ncbi.nlm.nih.gov/blast. Apparirà una pagina nella quale le versioni
DettagliBioinformatica. Marin Vargas, Sergio Paul
Bioinformatica Marin Vargas, Sergio Paul 2013 Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici. La bioinformatica
DettagliCOMPORTAMENTO ANFOTERO DEGLI AA
Proprietà acido-basiche degli aminoacidi FORMA NON IONICA Non esiste a nessun valore di ph FORMA ZWITTERIONICA È la forma prevalente a ph 7 COMPORTAMENTO ANFOTERO DEGLI AA CARICA NETTA +1 CARICA NETTA
DettagliProgetto e miglioramento del processo produttivo 383
Ottimizzazione del processo con esperimenti programmati I piani fattoriali sono molto utili nella selezione dei fattori o factor screening, cioè nella identificazione di quei fattori che maggiormente influiscono
DettagliIl Syllabus per il test d ingresso. PISA 10 dicembre 2008
Il Syllabus per il test d ingresso PISA 10 dicembre 2008 Sommario incontro del 10 dicembre Presentazione del Syllabus Lavoro individuale di commento Lavoro a gruppi di produzione quesiti È importante che
DettagliCorso di BIOINFORMATICA Applicazioni BIO-Mediche
Corso di BIOINFORMATICA Applicazioni BIO-Mediche - Introduzione al Molecular Docking (algoritmi di ricerca e Moderni software) Pietro BUFFA Responsabile Unità Operativa di Bioinformatica Dipartimento di
DettagliPredizione della struttura delle proteine
Predizione della struttura delle proteine Predire la struttura secondaria Le strutture secondarie sono determinate in primo luogo dalla struttura primaria che ha dei vincoli di disposizione nello spazio.
DettagliTeoria degli orbitali. Lo spazio intorno al nucleo in cui è possibile trovare con la massima probabilità gli elettroni viene chiamato orbitale.
Teoria degli orbitali Lo spazio intorno al nucleo in cui è possibile trovare con la massima probabilità gli elettroni viene chiamato orbitale. orbitale nucleo STPA-Chimica Organica 1 L orbitale 1s Gli
DettagliProgrammazione didattica annuale classi terze Disciplina Matematica
Primo quadrimestre L'alunno si muove con sicurezza nel calcolo algebrico, numerico e letterale NUMERI Utilizzare numeri relativi per descrivere reali Eseguire calcoli in ambito algebrico Eseguire confronti
DettagliFondamenti di Chimica Farmaceutica. La scoperta dei farmaci
Fondamenti di Chimica Farmaceutica La scoperta dei farmaci La scoperta di un farmaco è un processo che ha lo scopo di individuare un composto terapeuticamente utile per curare una malattia. Il punto di
DettagliPredizione di Struttura Secondaria di Proteine
Laboratorio di Bioinformatica I Predizione di Struttura Secondaria di Proteine Dott. Sergio Marin Vargas (2014 / 2015) Struttura delle proteine Struttura Secondaria Elementi non strutturati (Non hanno
DettagliPROGRAMMAZIONE DI MATEMATICA 2016/2017
PROGRAMMAZIONE DI MATEMATICA 2016/2017 PRIMA CLASSE ARITMETICA Il sistema di numerazione decimale Leggere e scrivere i numeri interi e decimali Riconoscere il valore posizionale delle cifre in un numero
DettagliCorso di Matematica per la Chimica
Dott.ssa Maria Carmela De Bonis a.a. 2013-14 Il best fitting In molte applicazioni accade di avere una certa quantità di dati (solitamente elevata) e di voler descrivere l andamento del fenomeno che ha
DettagliELABORAZIONE DELLE IMMAGINI:
Università degli Studi di Catania Facoltà di Scienze Matematiche,Fisiche e Naturali Corso di Laurea in Informatica, Secondo Livello ELABORAZIONE DELLE IMMAGINI: EDGE DETECTION Corso di Analisi Numerica
DettagliAnnamaria Mazzia. Corso di Metodi Numerici per l Ingegneria dispense e altro materiale su
Soluzione di un sistema non lineare con la Regula Falsi generalizzata per la determinazione degli angoli conico di taglio ed elicoidale di taglio di una cremagliera Annamaria Mazzia Dipartimento di Metodi
DettagliALLINEAMENTI MULTIPLI
ALLINEAMENTI MULTIPLI Identificazione di siti funzionalmente importanti Dimostrazione di omologia Filogenesi molecolare Ricerca di somiglianze deboli ma significative in banche dati Predizione di struttura
DettagliDECLINAZIONE COMPETENZE SCUOLA SECONDARIA DI PRIMO GRADO: MATEMATICA COMPETENZE CONOSCENZE ABILITA
DECLINAZIONE COMPETENZE SCUOLA SECONDARIA DI PRIMO GRADO: MATEMATICA COMPETENZE CONOSCENZE ABILITA Operare in situazioni reali e/o disciplinari con tecniche e procedure di calcolo I numeri naturali e il
DettagliEsercizio 1. CF 2 CS 2 CCl 4 ClF 3
Esercizio 1 Determinare in base al metodo del legame di valenza la forma delle seguenti molecole, tenendo conto delle repulsioni coulombiane tra le coppie elettroniche di valenza CF 2 CS 2 CCl 4 ClF 3
DettagliStabilire se il punto di coordinate (1,1) appartiene alla circonferenza centrata nell origine e di raggio 1.
Definizione di circonferenza e cerchio. Equazione della circonferenza centrata in O e di raggio R. Esercizi. La circonferenza e il cerchio Definizioni: dato un punto C nel piano cartesiano e dato un numero
DettagliRicevimento Studenti: Lunedì previa prenotazione. Cenci lab
Cenci lab Giovanni Cenci Dip.to Biologia e Biotecnologie C. Darwin Sezione Genetica Piano 2 -Citofono 3/4 0649912-655 (office) 0649912-843 (lab) giovanni.cenci@uniroma1.it Ricevimento Studenti: Lunedì
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliPIXEL. Il valore quantizzato misurato da ciascun sensore diventa un. PICTURE ELEMENT = PIXEL dell immagine. Interazione & Multimedia
La risoluzione PIXEL Il valore quantizzato misurato da ciascun sensore diventa un PICTURE ELEMENT = PIXEL dell immagine La risoluzione Definizione: si dice risoluzione il numero di pixel per unità di misura.
DettagliChimotripsina Una proteina globulare. Glicina Un amminoacido
Chimotripsina Una proteina globulare Glicina Un amminoacido - In teoria un numero enorme di differenti catene polipeptidiche potrebbe essere sintetizzato con i 20 amminoacidi standard. 20 4 = 160.000 differenti
DettagliLezione n. 1. Chimica fisica Micro-macro. & descrizioni multiscala
Chimica Fisica Biotecnologie sanitarie Lezione n. 1 Chimica fisica Micro-macro & descrizioni multiscala Gli strumenti della chimica fisica Esempio o 1: metodi spettroscopici interazione radiazione / materia
DettagliBIOINFORMATICA PER LA BIOLOGIA STRUTTURALE
BIOINFORMATICA PER LA BIOLOGIA STRUTTURALE Predizione di struttura secondaria La predizione di struttura secondaria è trattata nel corso base "Informatica e Bioinformatica" per la laurea triennale di primo
DettagliMacromolecole Biologiche Interazioni non covalenti
Interazioni non covalenti D H A δ - δ + δ - Le interazioni non covalenti Interazioni fra atomi che non sono legati da legami covalenti. Le interazioni non covalenti sono molto meno intense rispetto alle
DettagliFORZE INTERMOLECOLARI
FORZE INTERMOLECOLARI Le forze intermolecolari sono forze di attrazione che si stabiliscono tra le molecole che costituiscono una sostanza Determinano la tendenza delle molecole ad avvicinarsi. Per ogni
DettagliLuigi Santoro. Hyperphar Group S.p.A., MIlano
Come modellare il rischio Luigi Santoro Hyperphar Group S.p.A., MIlano Gli argomenti discussi Le definizioni del termine rischio L utilità di un modello predittivo di rischio Come costruire modelli predittivi
DettagliEsperimenti e Simulazioni Numeriche Ultrasonore per un Efficace Derivazione delle Curve POD di Assili Ferroviari
14 Congresso AIPnD 26-28 Ottobre 2011 Firenze Esperimenti e Simulazioni Numeriche Ultrasonore per un Efficace Derivazione delle Curve POD di Assili Ferroviari M. Carboni Introduzione 2 La fatica è la causa
DettagliModello computazionale per la predizione di siti di legame per fattori di trascrizione
Modello computazionale per la predizione di siti di legame per fattori di trascrizione Attività di tirocinio svolto presso il Telethon Institute of Genetics and Medicine Relatori Prof. Giuseppe Trautteur
DettagliSistemi RAID. Motivazioni Concetti di base Livelli RAID. Sommario
Sistemi RAID 1 Motivazioni Concetti di base Livelli RAID Sommario 2 1 Motivazione L evoluzione tecnologica ha permesso di avere dischi sempre più piccoli e meno costosi E facile equipaggiare un sistema
DettagliØ Gel Elettroforesi (GE) Ø Spettrometria di Massa (MS)
Tecniche di indagine nello studio delle PTMs Ø Gel Elettroforesi (GE) Ø Tecniche cromatografiche (LC, HPLC) Ø Spettrometria di Massa (MS) Possono essere utilizzate da sole o in combinazione, direttamente
DettagliALLINEAMENTO DI SEQUENZE
ALLINEAMENTO DI SEQUENZE Procedura per comparare due o piu sequenze, volta a stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che massimizzino la similarita
DettagliPROBABILITA. Distribuzione di probabilità
DISTRIBUZIONI di PROBABILITA Distribuzione di probabilità Si definisce distribuzione di probabilità il valore delle probabilità associate a tutti gli eventi possibili connessi ad un certo numero di prove
DettagliCalcolo del fattore di convergenza
Calcolo del fattore di convergenza Dato uno schema iterativo si ha: lim k x k+1 ξ x k ξ p = M p è l ordine di convergenza del metodo iterativo M è la costante asintotica dell errore o fattore di convergenza.
DettagliImmunologia e Immunologia Diagnostica MATURAZIONE DEI LINFOCITI
Immunologia e Immunologia Diagnostica MATURAZIONE DEI LINFOCITI Il percorso di maturazione dei linfociti Sviluppo della specicifità immunologica I linfociti B e T avviano le risposte immunitarie dopo il
DettagliAlgoritmo di Branch & Bound
Sapienza Università di Roma - Dipartimento di Ingegneria Informatica, Automatica e Gestionale Algoritmo di Branch & Bound Docente: Renato Bruni bruni@dis.uniroma.it Corso di: Ottimizzazione Combinatoria
DettagliStruttura secondaria
Struttura secondaria Struttura localmente ordinata Polimeri lineari ad unità monomeriche asimmetriche elica j = 0,1,2,..., N N = numero di residui z j = h z j + z 0 x j = r cos (j2p h z /P + d 0 ) y j
Dettagli