Allineamento multiplo

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Allineamento multiplo"

Transcript

1 Allineamento multiplo

2 Allineamenti multipli Vs. allineamenti a coppie A 1: 2: 3: 4: 5: 6: B 1: 2: 3: 4: 5: 6:

3 Significato biologico dell allineamento multiplo L allineamento multiplo riassume La storia evolutiva di una famiglia di proteine Quindi, si possono ricavare informazioni su: - La conservazione dei residui dipendente dalla funzione - La conservazione dei residui dipendente dalla struttura

4 Significato funzionale della conservazione Conservazione degli amino acidi catalitici in alcuni membri della famiglia della tripsina

5 Propensità catalitica dei gruppi funzionali delle proteine hydrophilic hydrophilic/hydrophobic hydrophobic

6 Significato strutturale dell allineamento multiplo 1 G C L W YC Sequenze divergenti del dominio costante delle immunoglobuline allineate manualmente sulla base dell informazione della struttura di uno dei membri della famiglia (PDB 1tlk). Si noti la presenza di inserzioni o delezioni soprattutto in regioni corrispondenti a loop. Due residui di cisteina che formano un ponte disolfuro nel core idrofobico della proteina sono conservati in tutti i componenti della famiglia.

7 Informazioni Informazioni derivate derivate da da un un allineamento allineamento multiplo multiplo Negli enzimi, le regioni maggiormente conservate corrispondono probabilmente al sito attivo La conservazione di residui idrofilici ha spesso un significato funzionale (catalisi). La conservazione di residui idrofobici ha spesso un significato strutturale Regioni ricche di inserzioni/delezioni corrispondono a loops. Glicine o proline conservate corrispondono spesso a turn Un pattern conservato di residui idrofobici alternati a residui idrofilici suggerisce un filamento beta superficiale. Un pattern conservato di residui idrofobici ogni 4 residui suggerisce l'esistenza di un alfa elica. Coppie di cisteine invarianti possono formare ponti disolfuro (in particolare nelle proteine secrete).

8 Difficoltà dell allineamento multiplo Funzione oggettiva di punteggio - Peso da assegnare alle varie sequenze Complessità del problema - Tempo di elaborazione

9 Complessità di calcolo dell allineamento multiplo Sulla superficie del cubo si hanno le matrici di confronto a coppie tra le sequenze A-B, B-C e A-C. L allineamento ottimale di tre sequenze (A-B-C) richiede il riempimento del cubo e la valutazione di tutte le possibili mosse all interno del cubo. La complessità di questo algoritmo è O(LN), dove L è la lunghezza e N il numero delle sequenze. Per tre sequenze di 300 amino acidi il numero di confronti è 2.7 x 107. Un algoritmo completo di programmazione dinamica è utilizzabile solo nel caso di tre sequenze.

10 Metodi per l allineamento multiplo Allineamento ottimale Programmazione dinamica (MSA) Allineamento euristico Progressivo globale (CLUSTALW,Pileup) locale (PIMA) Iterativo globale (PRRP) locale (DIALIGN)

11 Allineamento progressivo Allineamento di tre sequenze A, B, C per passi successivi Allineamento della coppia A-B Aggiunta della coppia C al precedente allineamento Allineamento multiplo DGEKFGPPQRSGQRSG.. DGERFGP-QRSGNRSG consenso + SeqB DHEKFGSSQRSGQRSG DGEKFGPPQRSGQRSG.. DGERFGP-QRSGNRSG.... DHEKFGSSQRSGQRSG SeqA SeqC SeqA SeqB SeqC

12 Allineamento progressivo L'ordine di aggiunta delle sequenze è molto importante Il primo passo di un allineamento consiste nella scelta dell'ordine di aggiunta delle sequenze. Per questo vengono fatti tutti i possibili confronti a coppie (N*(N-1)/2) e viene costruito un albero per rappresentare le somiglianze. L'albero stabilisce l'ordine di aggiunta delle sequenze

13 Clustal: Clustal: schema schema N(N-1)/2

14 Clustal: Clustal: allinamento allinamento progressivo progressivo

15 Clustal Higgins & Sharp 1988 ClustalW (improved) Thompson et al 1994

16 Punteggio pesato nell allineamento multiplo Seq1 Seq2 Seq3 Seq4 Seq1 G Seq2 G A A A A G G G A A A A G A A C C Seq1 G Seq3 A G G A Seq3 Seq4 Somma delle coppie (non pesata) Seq4 G Seq2 Punteggio pesato in base alla relazione filogenetica delle sequenze Viene usato il metodo della somma pesata delle coppie in ogni colonna per determinare il punteggio totale dell allineamento. Questo metodo assegna un peso alle sequenze in modo da aumentare il punteggio in confronti tra sequenze evolutivamente distanti e diminuirlo in confronti tra sequenze vicine.

17 CLUSTALW improvement Thompson et al 1994 Le sequenze filogeneticamente più distanti ricevono un peso (weigth) proporzionalmente più alto nell allineamento Le sequenze più distanti ricevono un peso (weigth) maggiore nel punteggio

18 CLUSTALW improvement Thompson et al 1994 La penalità da assegnare ai gap dipende dal tipo di residui (Pascarella & Argos) come osservato in sequenze a struttura nota La penalità dipende anche dalla posizione. Se ci sono gap nelle vicinanze la penalità aumenta

19 CLUSTALW e CLUSTALX CLUSTALX. Stesso algoritmo di CLUSTALW con interfaccia grafica

20 Allineamento iterativo STOP IF CONVERGED W Il primo allineamento multiplo viene usato per predire un nuovo albero, nuovi pesi e nuovi allineamenti fino a che non si ha un miglioramento nel punteggio dell allineamento. Implementato in PRRP, DIALIGN

21 Comparazione dei metodi di allineamento multiplo Thompson et al 1999 Set di riferimento BAliBASE Una bancadati di proteine allineate strutturalmente e suddivisa in set che rappresentano problemi tipici che si hanno in allineamenti multipli: - estensioni terminali - inserzioni - famiglia rispetto ad orfani

22 Colonne correttamente allineate Comparazione dei metodi di allineamento multiplo V3= >35% id. V2= 20-40% id. Large family V1= <20% id. Small family Sequenze di lunghezza simile Orfani allineati ad una famiglia Sequenze con estensioni terminali Conclusioni: 1) per sequenze di lunghezza comparabile i sistemi globali e iterativi funzionano meglio; 2) per allineare una sequenza orfana ad una famiglia conviene usare molti membri della famiglia 3) se le sequenze presentano diverse estensioni alle estremità N e C terminali conviene utilizzare sistemi di allineamento locale

23 Visualizzare ed editare allineamenti: GeneDoc

24 Rappresentazioni dell allineamento multiplo: conservazione

25 Rappresentazioni dell allineamento multiplo: sostituzioni

26 Decorazione di allineamenti con elementi strutturali: ESPRIPT Legame con in metallo Catalisi

27 Applicazioni dell allineamento multiplo Inferenze struturali Definizione di famiglie Inferenze funzionali Alberi filogenetici Primers per PCR Consensi, motivi Profili, modelli markoviani, logos

28 Rappresentazioni probabilistiche della conservazione dei residui in un A.M. Profili Modelli markoviani (profili HMM) Sequence logos

29 Sequence logos Rappresentazione grafica del grado di conservazione delle colonne dell allineamento. Nella forma più comune, la conservazione dell'allineamento è espressa in bits (log2). La misura deriva dalla teoria dell informazione di Shannon: Massima incertezza di osservare uno su M simboli con probabilità P: H = log2(m) = - log2(p) Quando i simboli non sono equiprobabili si utilizza la formula generale di Shannon M H Pi log 2 ( Pi ) i 1

30 Nucleotide and protein sequence logos Nel grafico è rappresentata in ordinata la conservazione come diminuzione di incertezza. Per i nucleotidi Per i gli aminoacidi log2(4) - H. log2(20) - H La massima conservazione in bits è quindi 2 per i nucleotidi e 4.32 per gli amino acidi.

31 Profili Gribskov et al 1987 ALLINEAMENTO MULTIPLO HBA_HUMAN HBB_HUMAN MYG_PHYCA GLB3_CHITP GLB5_PETMA LGB2_LUPLU GLB1_GLYDI...vga--hagey......v----nvdev......vea--dvag vkg------d......vys--tyets......fna--nipkh......iagadngagv... PROFILI: Rappresentano un allineamento multiplo assegnando a ciascuna posizione dell'allinamento un punteggio per l'occorrenza di uno tra i possibili simboli.

32 Costruzione di un profilo Gribskov et al 1987 ALLINEAMENTO MULTIPLO HBA_HUMAN HBB_HUMAN MYG_PHYCA GLB3_CHITP GLB5_PETMA LGB2_LUPLU GLB1_GLYDI...vga--hagey......v----nvdev......vea--dvag vkg------d......vys--tyets......fna--nipkh......iagadngagv... Le colonne dell'allinemento corrispondono alle righe della matrice PROFILO DELL'ALLINAMENTO MULTIPLO Cons V A A A D N V A E V A C D E F G H I K L M N P Q R S T V W Y Gap Len

33 Costruzione di un profilo Gribskov et al 1987 ALLINEAMENTO MULTIPLO HBA_HUMAN HBB_HUMAN MYG_PHYCA GLB3_CHITP GLB5_PETMA LGB2_LUPLU GLB1_GLYDI...vga--hagey......v----nvdev......vea--dvag vkg------d......vys--tyets......fna--nipkh......iagadngagv... Score associati alla presenza dei simboli nelle colonne dell'allineamento Penalità allungamento gap Penalità apertura gap Cons V A A A D N V A E V A C D E F G H I K L M N P Q R S T V W Y Gap Len

34 Calcolo dei punteggi nei profili ALLINEAMENTO MULTIPLO HBA_HUMAN HBB_HUMAN MYG_PHYCA GLB3_CHITP GLB5_PETMA LGB2_LUPLU GLB1_GLYDI...vga--hagey......v----nvdev......vea--dvag vkg------d......vys--tyets......fna--nipkh......iagadngagv... Punteggio di un aminoacido X per la prima colonna: s (V, X ) s ( F, X ) s ( I, X ) Dove s(y,x) è il punteggio della sostituzione dell aminoacido Y in X nelle matrici PAM o BLOSUM.

35 PSI-Blast Position-Specific Iterated Blast

36 Schema Schema di di funzionamento funzionamento di di PSIPSIBLAST BLAST La ricerca utilizza una singola sequenza sonda per la prima iterazione e, per le iterazioni successive una matrice di punteggio specifica per posizione (PSSM, Position Specific Scoring Matrix) costruita a partire da un allineamento multiplo. I passaggi utilizzati da PSI-BLAST sono i seguenti Ricerca BLAST con una singola sequenza sonda (1 iterazione); Le sequenze significativamente simili (secondo una soglia di E, modificabile) sono utilizzate per un allineamento multiplo.l allineamento multiplo è utilizzato per calcolare una PSSM La PSSM viene utilizzata per una seconda ricerca (2 iterazione); La 2 iterazione può trovare nuove sequenze significative che possono essere utilizzate per costruire una nuova PSSM. La ricerca può essere iterata fino a quando vengono trovate nuove sequenze

37 PSI-Blast Iterazione n 2 Risultato della ricerca e valori di significatività basati sulla matrice posizione specifica

38 Hidden Markov Models (HMM) transizioni Krog, Haussler Eddy, Durbin stato Gli Hidden Markov Models (HMM) sono una classe di modelli probabilistici che si applicano a serie temporali o sequenze lineari. Un modello è caratterizzato da una determinata architettura composta da stati e da transizioni di stato. Ciascuno stato ha una data probabilità di emettere simboli o di effettuare una transizione. Il modello in figura rappresenta sequenze composte da due lettere (a,b) generate da due stati, ciascuno con una diversa probabilità di emissione. Partendo dalla stato 1 il modello ha generato una sequenza (aba) attraverso una successione di stati. Ciò che viene osservata è la sequenza di simboli, mentre la successione degli stati rimane nascosta (hidden). La probabilità combinata P(x, HMM) della sequenza di simboli osservata è il prodotto di tutte le probabilità di emissioni e transizioni.

39 Profili HMM inserzione match delezione Gli HMM possono essere usati per modellare allineamenti multipli di sequenze di una data famiglia (profili HMM). L architettura del modello prevede tre tipi di stati (m=match, i=inserzione, d=delezione), più uno stato finale (e=end) ed uno stato iniziale (b=begin). L HMM rappresentato in figura modella l allineamento multiplo delle cinque sequenze (tre colonne) sopra visualizzato. La probabilità di emissione dei vari aminoacidi derivano dalle frequenze osservate nell allineamento. Modelli generati con allineamento multipli possono essere impiegati per: 1) allineare nuove sequenze al modello; 2) individuare in un database sequenze aderenti al modello; 3) individuare corrispondenze tra una sequenza e un database di modelli.

40 Profili HMM: architettura e valori parametri I0 BEGIN I1 tm1i1 m1 tm1m2 m2 m8 END seq1 seq2 seq3 seq4 seq5 seq6 Seq xxx--xxxxx x----xxxxx xxx--xxxxxxx------x xxx--xxxxx xxx--xxxxx xxxxxxxxxx tm1d2 D1 D2 Gli stati match corrispondono alle colonne in cui i simboli prevalgono sui gap. I parametri iniziali dipendono dal numero di simboli emessi e dal numero di transizioni (frecce che partono da uno stato). In questo modo, prima di leggere un allineamento le probabilità di emissione di ciascun amino acido dello stato m1 saranno em1(x) = 1/20, Le probabilità di transizione dallo stato m1 saranno tm1m2=1/3, tm1d2=1/3, tm1i1 =1/3. I valori dei parametri vengono quindi modificati in base all allineamento in ragione delle occorrenze dei caratteri in una colonna e le occorrenze delle transizioni.

41 Profili HMM: pseudocounts I1 I0 BEGIN HBA_HUMAN HBB_HUMAN MYG_PHYCA GLB3_CHITP GLB5_PETMA LGB2_LUPLU GLB1_GLYDI m1 m2 D1 D2 m8 vga--hagey v----nvdev vea--dvagvkg------d vys--tyets fna--nipkh iagadngagv END Quando una transizione o l emissione di un particolare simbolo non si osserva è necessario aggiungere finti conti ( pseudocounts ) per evitare valori di probabilità zero. Il sistema più semplice di pseudocounts è la regola di Laplace: aggiungere 1 a tutte le frequenze. Usando questo sistema nella prima colonna occorre aggiungere 17 conti per gli aminoacidi mancanti. Il numero totale sarà quindi (5+1)V+(1+1)F+(1+1)I+(0+17)x = 27. Le probabilità di emissione saranno e m1(v)= 6/27, em1(i)=2/27, em1(f)=2/27, em1(x)=1/27. Analogamente per le probabilità di transizione, in cui osserviamo 6 transizioni allo stato di match, 1 allo stato di delezione e zero allo stato di inserzione: t m1m2=7/10, tm1d2=2/10, tm1i1= 1/10. Questo sistema di pseudocount funziona solo quando il campione di sequenze è sufficientemente numeroso (>50); in altri casi vanno usati sistemi più sofisticati (misture di Dirichlet, misture basate sulle matrici di sostituzione, stime basate sull ancestore).

42 Profili HMM: weighting I parametri dell HMM vanno stimati assegnando un peso minore all informazione portata da sequenze simili ed un peso maggiore all informazione portata da sequenze più divergenti. Vi sono metodi di weighting basati su alberi filogenetici ed altri indipendenti da questi (Voroni, Maximum discrimination, Maximum Entropy). Tutti i sistemi di weighting soffrono di un problema comune. Se in un modello di una famiglia si inserisce una sequenza errata (non appartenente alla famiglia) questa avrà in proporzione molto peso sul modello finale. V In un intuitivo sistema di weighting si immagina di applicare un voltaggio alla radice dell albero e di pesare le sequenze in proporzione alla corrente che arriva a ciascun nodo.

43 Profilo HMM: Log odds scores emissioni(m) emissioni(i) transizioni

44 Questioni legate ai profili HMM Dato un allineamento, quali soni i valori dei parametri di un HMM che descrivono nel modo migliore possibile la conservazione (APPRENDIMENTO)? - costruzione di un HMM Qual è la sequenza ottimale di stati con cui un HMM genera una data sequenza (ALLINEAMENTO)? - allineamento di una sequenza all'hmm (Viterbi algorithm) Qual è la probabilità che una data sequenza sia stata generata da un dato HMM (VEROSIMIGLIANZA)? - appartenenza di una sequenza ad una famiglia descritta con HMM

45 Hmmer Sean Eddy Hmmer (pronunciato hammer ) è un pacchetto di programmi per creare ed usare modelli markoviani di allineamenti di DNA e proteine. I programmi principali sono: - Hmmbuild: creare un HMM a partire da un allineamento - Hmmalign: allineare sequenze ad un HMM - Hmmsearch: cercare un database di sequenze con un HMM - HMMpFAM: cercare un database di modelli con una sequenza

46 Protein family PFAM (acronimo di Protein Families) è un database di domini di proteine descritti con modelli markoviani. E diviso in due sezioni: pfam-a contiene allineamenti curati da esperti; pfam-b contiene sequenze che vengono automaticamente raggruppate.

47 Pfam

48 Pfam: family description

49 Ricerca di omologia in Pfam: anatomia delle proteine

50 Allineamento Allineamento tra tra HMMs HMMs Söding J. Protein homology detection by HMM-HMM comparison. Bioinformatics 21: (2005).

Allineamento multiplo

Allineamento multiplo Allineamento multiplo Allineamenti multipli Il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte proteine a funzione analoga. I siti funzionalmente o strutturalmente

Dettagli

Allineamento multiplo

Allineamento multiplo Allineamento multiplo Allineamenti multipli Vs. allineamenti a coppie A B 1: 2: 3: 4: 5: 6: 1: 2: 3: 4: 5: 6: Applicazioni dell allineamento multiplo Assemblaggio dei genomi Primers per PCR Consensi, motivi

Dettagli

Le sequenze consenso

Le sequenze consenso Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica

Dettagli

SAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing

SAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing SAGA: sequence alignment by genetic algorithm ALESSANDRO PIETRELLI Soft Computing Bologna, 25 Maggio 2007 Multi Allineamento di Sequenze (MSAs) Cosa sono? A cosa servono? Come vengono calcolati Multi Allineamento

Dettagli

Algoritmi di Allineamento

Algoritmi di Allineamento Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento

Dettagli

Allineamenti Multipli di Sequenze

Allineamenti Multipli di Sequenze Allineamenti Multipli di Sequenze 1 Allineamento multiplo di sequenze: obiettivi di oggi Definire un allineamento multiplo di sequenze; com è generato; comprendere i principali metodi. Introdurre i database

Dettagli

Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti Esercitazione 7 2.

Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti Esercitazione 7 2. Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti patti@di.unito.it Esercitazione 7 1 Info&Bio Bio@Lab Allineamento di sequenze Esercitazione 7 2 1 Es2: Allineamento

Dettagli

ALLINEAMENTI MULTIPLI

ALLINEAMENTI MULTIPLI ALLINEAMENTI MULTIPLI Identificazione di siti funzionalmente importanti Dimostrazione di omologia Filogenesi molecolare Ricerca di somiglianze deboli ma significative in banche dati Predizione di struttura

Dettagli

Allineamento multiplo di sequenze

Allineamento multiplo di sequenze Allineamento multiplo di sequenze Bioinformatica a.a. 2008/2009 Letterio Galletta Università di Pisa 22 Maggio 2009 Letterio Galletta (Università di Pisa) Allineamento multiplo di sequenze 22 Maggio 2009

Dettagli

Allineamenti multipli

Allineamenti multipli Allineamenti multipli Finora ci siamo occupati di allineamenti a coppie (pairwise), ma il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte proteine a funzione

Dettagli

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni

Dettagli

FASTA. Lezione del

FASTA. Lezione del FASTA Lezione del 10.03.2016 Omologia vs Similarità Quando si confrontano due sequenze o strutture si usano spesso indifferentemente i termini somiglianza o omologia per indicare che esiste un rapporto

Dettagli

Allineamenti multipli

Allineamenti multipli Allineamenti multipli Allineamenti multipli Finora ci siamo occupati di allineamenti a coppie (pairwise), ma il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte

Dettagli

Perché considerare la struttura 3D di una proteina

Perché considerare la struttura 3D di una proteina Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una

Dettagli

BLAST. W = word size T = threshold X = elongation S = HSP threshold

BLAST. W = word size T = threshold X = elongation S = HSP threshold BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query

Dettagli

Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini)

Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Collegatevi al sito www.ncbi.nlm.nih.gov/blast. Apparirà una pagina nella quale le versioni

Dettagli

q xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0;

q xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0; Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p1 p6 p i >0; 6! i=1 p i =1 Sequenza di dna/proteine x con probabilita q x Probabilita dell intera sequenza n " i!1 q xi Massima verosimiglianza

Dettagli

Computazione per l interazione naturale: Modelli dinamici

Computazione per l interazione naturale: Modelli dinamici Computazione per l interazione naturale: Modelli dinamici Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@dsi.unimi.it

Dettagli

ALLINEAMENTO DI SEQUENZE

ALLINEAMENTO DI SEQUENZE ALLINEAMENTO DI SEQUENZE Procedura per comparare due o piu sequenze, volta a stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che massimizzino la similarita

Dettagli

Allineamenti Multipli

Allineamenti Multipli Allineamenti Multipli Finora ci siamo occupati di allineamenti a coppie (pairwise), ma il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte proteine a funzione

Dettagli

Come si sceglie l algoritmo di allineamento? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione?

Come si sceglie l algoritmo di allineamento? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione? Come si sceglie l algoritmo di allineamento? Domande: le due proteine hanno domini simili? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione? hanno un antenato

Dettagli

Alberi filogenetici. File: alberi_filogenetici.odp. Riccardo Percudani 02/03/04

Alberi filogenetici. File: alberi_filogenetici.odp. Riccardo Percudani 02/03/04 Alberi filogenetici The tree of life Albero filogenetico costruito con le sequenze della subunità piccola dell RNA ribosomale. Tutte le forme viventi condividono un comune ancestore (LCA, last common ancestor

Dettagli

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente

Dettagli

Ricerca di omologia di sequenza

Ricerca di omologia di sequenza Ricerca di omologia di sequenza RICERCA DI OMOLOGIA DI SEQUENZA := Data una sequenza (query), una banca dati, un sistema per il confronto e una soglia statistica trovare le sequenze della banca più somiglianti

Dettagli

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche InfoBioLab I ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche Esercizio 1 - obiettivi: Ricerca di 2 proteine in ENTREZ Salva i flat file che descrivono le 2 proteine in formato testo Importa

Dettagli

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST Lezione 8 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere

Dettagli

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST Lezione 8 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere

Dettagli

Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni:

Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni: Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni: antonella.meloni@ifc.cnr.it Sequenza A= stringa formata da N simboli, dove i simboli apparterranno ad un certo alfabeto. A

Dettagli

Banche Dati proteiche

Banche Dati proteiche Banche Dati proteiche Un altro grande database è UniProt, The Universal Protein Resource (http://www.uniprot.org/) nel quale sono radunate le sequenze proteiche, e le annotazione delle stesse, ottenute

Dettagli

Bioinformatica ed applicazioni di bioinformatica strutturale!

Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica! Le banche dati! Programmi per estrarre ed analizzare i dati! I numeri! Cellule nell uomo! Geni nell uomo! Genoma umano Il dogma

Dettagli

Omologia di sequenze: allineamento e ricerca

Omologia di sequenze: allineamento e ricerca Omologia di sequenze: allineamento e ricerca Genomi (organismi) e geni hanno un evoluzione divergente Sequenze imparentate per evoluzione divergente sono omologhe Le sequenze sono confrontabili tramite

Dettagli

A W T V A S A V R T S I A Y T V A A A V R T S I A Y T V A A A V L T S I

A W T V A S A V R T S I A Y T V A A A V R T S I A Y T V A A A V L T S I COME CALCOLARE IL PUNTEIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi che, però, sono le due facce di una stessa medaglia al

Dettagli

Teoria dell informazione

Teoria dell informazione Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2008-09 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di

Dettagli

Corso di Intelligenza Artificiale A.A. 2016/2017

Corso di Intelligenza Artificiale A.A. 2016/2017 Università degli Studi di Cagliari Corsi di Laurea Magistrale in Ing. Elettronica Corso di Intelligenza rtificiale.. 26/27 Esercizi sui metodi di apprendimento automatico. Si consideri la funzione ooleana

Dettagli

Pairwise Sequence Alignment BIOINFORMATICA. Corso di Laurea in Ingegneria Informatica e Biomedica. Università Magna Graecia Catanzaro

Pairwise Sequence Alignment BIOINFORMATICA. Corso di Laurea in Ingegneria Informatica e Biomedica. Università Magna Graecia Catanzaro Pairwise Sequence Alignment BIOINFORMATICA Corso di Laurea in Ingegneria Informatica e Biomedica Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento Esatto di Coppie

Dettagli

Allineamenti a coppie

Allineamenti a coppie Laboratorio di Bioinformatica I Allineamenti a coppie Dott. Sergio Marin Vargas (2014 / 2015) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Il sito http://myhits.isb-sib.ch/cgi-bin/dotlet

Dettagli

La distribuzione dei veri e falsi positivi la ricerca della giusta soglia

La distribuzione dei veri e falsi positivi la ricerca della giusta soglia La distribuzione dei veri e falsi positivi la ricerca della giusta soglia BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et

Dettagli

1) Codici convoluzionali. 2) Circuito codificatore. 3) Diagramma a stati e a traliccio. 4) Distanza libera. 5) Algoritmo di Viterbi

1) Codici convoluzionali. 2) Circuito codificatore. 3) Diagramma a stati e a traliccio. 4) Distanza libera. 5) Algoritmo di Viterbi Argomenti della Lezione 1) Codici convoluzionali 2) Circuito codificatore 3) Diagramma a stati e a traliccio 4) Distanza libera 5) Algoritmo di Viterbi 1 Codici convoluzionali I codici convoluzionali sono

Dettagli

Problemi, istanze, soluzioni

Problemi, istanze, soluzioni lgoritmi e Strutture di Dati II 2 Problemi, istanze, soluzioni Un problema specifica una relazione matematica tra dati di ingresso e dati di uscita. Una istanza di un problema è formata dai dati di un

Dettagli

Lezione 6. Ricerche in banche dati (databases) attraverso l uso di BLAST

Lezione 6. Ricerche in banche dati (databases) attraverso l uso di BLAST Lezione 6 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere

Dettagli

Allineamento multiplo di sequenze

Allineamento multiplo di sequenze Allineamento multiplo di sequenze Nicola Vitacolonna vitacolo@dimi.uniud.it http://www.dimi.uniud.it/~vitacolo Università degli Studi di Udine 16 aprile 2002 Two homologous sequences whisper... a full

Dettagli

Metodi di Distanza. G.Allegrucci riproduzione vietata

Metodi di Distanza. G.Allegrucci riproduzione vietata Metodi di Distanza La misura più semplice della distanza tra due sequenze nucleotidiche è contare il numero di siti nucleotidici che differiscono tra le due sequenze Quando confrontiamo siti omologhi in

Dettagli

Relazione sequenza-struttura e funzione

Relazione sequenza-struttura e funzione Biotecnologie applicate alla progettazione e sviluppo di molecole biologicamente attive A.A. 2010-2011 Modulo di Biologia Strutturale Relazione sequenza-struttura e funzione Marco Nardini Dipartimento

Dettagli

Laboratorio di Algoritmi e Strutture Dati

Laboratorio di Algoritmi e Strutture Dati Laboratorio di Algoritmi e Strutture Dati Docente: Camillo Fiorentini 8 gennaio 8 Il problema è simile all esercizio 5.6 del libro di testo di algoritmi (Introduzione agli algoritmi e strutture dati, T.

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Filogenesi Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Introduzione alla

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: introduzione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Una definizione

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Hidden Markov Models Manuele Bicego orso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Processi

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche)

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche) Docente: Matteo Re UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2013-2014 semestre I 3 Allineamento veloce (euristiche) Banche dati primarie e secondarie Esistono due categorie

Dettagli

Analisi della struttura primaria delle proteine

Analisi della struttura primaria delle proteine Analisi della struttura primaria delle proteine Strumenti on-line La maggior parte degli strumenti per l analisi della struttura primaria si trovano on-line all indirizzo www.expasy.org Ottenere la sequenza

Dettagli

ALLINEAMENTI MULTIPLI

ALLINEAMENTI MULTIPLI ALLINEAMENTI MULTIPLI Allineamento progressivo (Clustal) Metodi iterativi (Multalin) Metodi basati su zone comuni di sequenza conservate (Profili) Metodi statistici e modelli probabilistici (HMM) Motivazione

Dettagli

Modello di sistema di comunicazione

Modello di sistema di comunicazione Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2006-07 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di

Dettagli

Bioinformatics more basic notions

Bioinformatics more basic notions Bioinformatics more basic notions Alcune slides provengono dal materiale rilasciato da: Dr Sergio Marin Vargas - Verona Prof. Riccardo Percudari - Parma Bioinformatics Bio-inspired Computer science Gli

Dettagli

La struttura terziaria delle proteine

La struttura terziaria delle proteine La struttura terziaria delle proteine 1 La struttura terziaria L arrangiamento spaziale degli aminoacidi di una singola catena polipeptidica a formare la sua struttura tridimensionale a domini viene chiamata

Dettagli

MODELLO SCHEDA INSEGNAMENTO. II II Luigi Cerulo

MODELLO SCHEDA INSEGNAMENTO. II II Luigi Cerulo Corso di L/LM/LMCU Denominazione insegnamento: MODELLO SCHEDA INSEGNAMENTO Numero di Crediti: 6 Anno: Semestre: Docente Titolare: Scienze e Tecnologie Genetiche Bioinformatica II II Luigi Cerulo Dottorandi/assegnisti

Dettagli

Allineamenti di sequenze: concetti e algoritmi

Allineamenti di sequenze: concetti e algoritmi Allineamenti di sequenze: concetti e algoritmi 1 globine: a- b- mioglobina Precoce esempio di allineamento di sequenza: globine (1961) H.C. Watson and J.C. Kendrew, Comparison Between the Amino-Acid Sequences

Dettagli

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.

Dettagli

sono le unità monomeriche che costituiscono le proteine hanno tutti una struttura comune

sono le unità monomeriche che costituiscono le proteine hanno tutti una struttura comune AMINO ACIDI sono le unità monomeriche che costituiscono le proteine sono 20 hanno tutti una struttura comune sono asimmetrici La carica di un amino acido dipende dal ph Classificazione amino acidi Glicina

Dettagli

Luigi Santoro. Hyperphar Group S.p.A., MIlano

Luigi Santoro. Hyperphar Group S.p.A., MIlano Come modellare il rischio Luigi Santoro Hyperphar Group S.p.A., MIlano Gli argomenti discussi Le definizioni del termine rischio L utilità di un modello predittivo di rischio Come costruire modelli predittivi

Dettagli

Allineamento e similarità di sequenze

Allineamento e similarità di sequenze Allineamento e similarità di sequenze Allineamento di Sequenze L allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; La similarità

Dettagli

Programmazione dinamica

Programmazione dinamica rogrammazione dinamica Fornisce l allineamento ottimale tra due sequenze semplici variazioni dell algoritmo producono allineamenti globali o locali l allineamento calcolato dipende dalla scelta di alcuni

Dettagli

Probabilità congiunta

Probabilità congiunta Una vera matrice di sostituzione F K M N P Q 4 5 5 4 3 3 5 6 5 4 3 5 4 4 3 6 4 3 4 5 3 F 8 5 5 4 5 5 4 5 3 4 3 3 6 3 5 K 5 3 3 6 4 3 3 3 M 6 N P 6 Q 4 6 V Y 3 3 3 3 V 4 4 6 8 6 6 6 3 5 3 4 4 6 5 5 6 7

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Hidden Markov Models Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Processi

Dettagli

Laboratorio di Programmazione II Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona

Laboratorio di Programmazione II Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Laboratorio di Programmazione II Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Algoritmo a ed Analisi del DNA : sequenze di basi di particolare interesse

Dettagli

Video Analysis (cenni) Annalisa Franco

Video Analysis (cenni) Annalisa Franco 1 Video Analysis (cenni) Annalisa Franco annalisa.franco@unibo.it http://bias.csr.unibo.it/vr/ 2 Visual motion Un video è una sequenza di frame catturati nel corso del tempo Il valori dell immagine sono

Dettagli

Esercizi per il corso di Algoritmi, anno accademico 2011/12

Esercizi per il corso di Algoritmi, anno accademico 2011/12 Esercizi per il corso di Algoritmi, anno accademico 2011/12 Esercizi sulla Tecnica Divide et Impera N.B. Tutti gli algoritmi vanno scritti in pseudocodice (non in Java, nè in C++, etc. ). Di tutti gli

Dettagli

Statistica multivariata 27/09/2016. D.Rodi, 2016

Statistica multivariata 27/09/2016. D.Rodi, 2016 Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche

Dettagli

TEORIA DELL INFORMAZIONE ED ENTROPIA FEDERICO MARINI

TEORIA DELL INFORMAZIONE ED ENTROPIA FEDERICO MARINI TEORIA DELL INFORMAZIONE ED ENTROPIA DI FEDERICO MARINI 1 OBIETTIVO DELLA TEORIA DELL INFORMAZIONE Dato un messaggio prodotto da una sorgente, l OBIETTIVO è capire come si deve rappresentare tale messaggio

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. Esercizio 1 Un chimico che lavora per una fabbrica di batterie, sta cercando una batteria

Dettagli

SISTEMI CASUALI DINAMICI (PROCESSI) ESEMPIO: I GUASTI (Ipotesi Markoviana) Frequenza dei guasti: N Guasti = N/T X X X X X X X

SISTEMI CASUALI DINAMICI (PROCESSI) ESEMPIO: I GUASTI (Ipotesi Markoviana) Frequenza dei guasti: N Guasti = N/T X X X X X X X CATENE DI MARKOV SISTEMI CASUALI DINAMICI (PROCESSI) ESEMPIO: I GUASTI (Ipotesi Markoviana) Frequenza dei guasti: N Guasti = N/T X X X X X X X X X 0 T 0 T! Δ 0, 1,, 0 Δ 1 Δ Δ 1Δ Δ Δ ESEMPIO: I GUASTI (Ipotesi

Dettagli

Luigi Piroddi

Luigi Piroddi Automazione industriale dispense del corso (a.a. 2008/2009) 8. Reti di Petri: rappresentazione algebrica Luigi Piroddi piroddi@elet.polimi.it Rappresentazione matriciale o algebrica E possibile analizzare

Dettagli

Generalità. Strumenti per l Elaborazione di Dati. Generalità. Generalità. I dati: I dati: I dati:

Generalità. Strumenti per l Elaborazione di Dati. Generalità. Generalità. I dati: I dati: I dati: Strumenti per l Elaborazione di Dati I dati: (lezione 10) Strumenti per l elaborazione dei dati (lezione 10) Esempi: Fogli Elettronici (lezione 10) Basi Dati (lezioni 11,12) Un dato rappresenta un informazione

Dettagli

Sistemi a Regole. Fabio Sartori 3 dicembre L algoritmo RETE Forward e Backward Chaining

Sistemi a Regole. Fabio Sartori 3 dicembre L algoritmo RETE Forward e Backward Chaining Sistemi a Regole Fabio Sartori sartori@disco.unimib.it 3 dicembre 2008 L algoritmo RETE Forward e Backward Chaining 1 Sistemi di Produzioni (1) Un sistema di produzioni consiste in un insieme non ordinato

Dettagli

Ricerche con BLAST (Laboratorio)

Ricerche con BLAST (Laboratorio) Laboratorio di Bioinformatica I Ricerche con BLAST (Laboratorio) Dott. Sergio Marin Vargas (2014 / 2015) NCBI BLAST BLAST: Basic Local Alignment Search Tool http://blast.ncbi.nlm.nih.gov/blast.cgi NCBI

Dettagli

Markov Chains and Markov Chain Monte Carlo (MCMC)

Markov Chains and Markov Chain Monte Carlo (MCMC) Markov Chains and Markov Chain Monte Carlo (MCMC) Alberto Garfagnini Università degli studi di Padova December 11, 2013 Catene di Markov Discrete dato un valore x t del sistema ad un istante di tempo fissato,

Dettagli

Modelli Probabilistici per la Computazione Affettiva: Learning/Inferenza parametri

Modelli Probabilistici per la Computazione Affettiva: Learning/Inferenza parametri Modelli Probabilistici per la Computazione Affettiva: Learning/Inferenza parametri Corso di Modelli di Computazione Affettiva Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano

Dettagli

VETTORI NELLO SPAZIO ORDINARIO ,

VETTORI NELLO SPAZIO ORDINARIO , VETTORI E GEOMETRIA ANALITICA 1 VETTORI NELLO SPAZIO ORDINARIO Vettori ordinari ed operazioni. Dipendenza ed indipendenza lineare, basi. Prodotto scalare, proiezioni, angoli. Prodotto vettoriale e prodotto

Dettagli

Introduzione alla programmazione

Introduzione alla programmazione Introduzione alla programmazione Risolvere un problema Per risolvere un problema si procede innanzitutto all individuazione Delle informazioni, dei dati noti Dei risultati desiderati Il secondo passo consiste

Dettagli

Lezione 7. Allineamento di sequenze biologiche

Lezione 7. Allineamento di sequenze biologiche Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra

Dettagli

Casi di prova. Il problema dell ordinamento. Casi di prova. Casi di prova. Casi di prova

Casi di prova. Il problema dell ordinamento. Casi di prova. Casi di prova. Casi di prova Casi di prova Casi di prova Quando si vuole testare un algoritmo si devono costruire vari casi di prova. Invece di eseguire il programma più volte si può costruire un file di dati contenente tutti i casi

Dettagli

Problema. Equazioni non lineari. Metodo grafico. Teorema. Cercare la soluzione di

Problema. Equazioni non lineari. Metodo grafico. Teorema. Cercare la soluzione di Problema Cercare la soluzione di Equazioni non lineari dove Se è soluzione dell equazione, cioè allora si dice RADICE o ZERO della funzione Metodo grafico Graficamente si tratta di individuare l intersezione

Dettagli

Le proteine sono polimeri lineari costituiti da unità base formate da oltre 40 amminoacidi. Possono assumere forme diverse a seconda della funzione

Le proteine sono polimeri lineari costituiti da unità base formate da oltre 40 amminoacidi. Possono assumere forme diverse a seconda della funzione Le proteine sono polimeri lineari costituiti da unità base formate da oltre 40 amminoacidi Hanno elevato PM Possono assumere forme diverse a seconda della funzione svolgono molteplici funzioni Tra le proteine

Dettagli

E il server più utilizzato, permette di tracciare tutte le operazioni che svolge e di impostare alcuni parametri importanti per il risultato finale.

E il server più utilizzato, permette di tracciare tutte le operazioni che svolge e di impostare alcuni parametri importanti per il risultato finale. Homology Modelling Homology modelling L omology modeling delle proteine è il tipo di predizione di struttura terziaria più semplice ed affidabile. Viene richiesta soltanto una (o più) sequenze di riferimento

Dettagli

Computazione per l interazione naturale: modelli a variabili latenti (clustering e riduzione di dimensionalità)

Computazione per l interazione naturale: modelli a variabili latenti (clustering e riduzione di dimensionalità) Computazione per l interazione naturale: modelli a variabili latenti (clustering e riduzione di dimensionalità) Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università

Dettagli

Intelligenza Artificiale

Intelligenza Artificiale Intelligenza Artificiale 17 Marzo 2005 Nome e Cognome: Matricola: ESERCIZIO N 1 Ricerca Cieca 5 punti 1.A) Elencare in modo ordinato i nodi (dell'albero sotto) che vengono scelti per l'espansione dalle

Dettagli

INFORMAZIONE E COMPLESSITA

INFORMAZIONE E COMPLESSITA INFORMAZIONE E COMPLESSITA Antonio Restivo Università degli Studi di Palermo Lezioni Lincee di Scienze Informatiche Palermo 26 Febbraio 2015 Concetti fondamentali delle Scienze Informatiche Le Scienze

Dettagli

COME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi

COME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi COME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi che, però, sono le due facce di una stessa medaglia al

Dettagli

Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 26/27 Introduzione Le regole associative si collocano tra i metodi di apprendimento non supervisionato e sono volte

Dettagli

. iii) Cosa si può dire di esatto (non approssimato) su P X 1

. iii) Cosa si può dire di esatto (non approssimato) su P X 1 Corsi di Probabilità, Statistica e Processi stocastici per Ing. dell Automazione, Informatica e Inf.Gest.Azienda 30/06/0 Esercizio. Dieci persone si iscrivono ad un torneo di tennis. Quattro di loro hanno

Dettagli

BLAST: Basic Local Alignment Search Tool

BLAST: Basic Local Alignment Search Tool BLAST: Basic Local Alignment Search Tool 1 Outline della lezione di oggi BLAST Uso pratico Algoritmo Strategie Trovare proteine lontanamente legate: PSI-BLAST 2 Problema con gli algoritmi dinamici Gli

Dettagli

UML Introduzione a UML Linguaggio di Modellazione Unificato. Corso di Ingegneria del Software Anno Accademico 2012/13

UML Introduzione a UML Linguaggio di Modellazione Unificato. Corso di Ingegneria del Software Anno Accademico 2012/13 UML Introduzione a UML Linguaggio di Modellazione Unificato Corso di Ingegneria del Software Anno Accademico 2012/13 1 Che cosa è UML? UML (Unified Modeling Language) è un linguaggio grafico per: specificare

Dettagli

Risoluzione di problemi ingegneristici con Excel

Risoluzione di problemi ingegneristici con Excel Risoluzione di problemi ingegneristici con Excel Problemi Ingegneristici Calcolare per via numerica le radici di un equazione Trovare l equazione che lega un set di dati ottenuti empiricamente (fitting

Dettagli

Metodi e modelli per le decisioni

Metodi e modelli per le decisioni Metodi e modelli per le decisioni Roberto Cordone A. A. 2015-16 10.8 Esercizi Nota : Devo molti di questi esercizi a temi d esame del prof. Alberto Colorni. Nota : Gli esercizi e le soluzioni non sono

Dettagli

I.4 Rappresentazione dell informazione

I.4 Rappresentazione dell informazione I.4 Rappresentazione dell informazione Università di Ferrara Dipartimento di Economia e Management Insegnamento di Informatica Ottobre 13, 2015 Argomenti Introduzione 1 Introduzione 2 3 L elaboratore Introduzione

Dettagli

ALLINEAMENTO DI SEQUENZE BIOLOGICHE TRAMITE MODELLI DI MARKOV NASCOSTI

ALLINEAMENTO DI SEQUENZE BIOLOGICHE TRAMITE MODELLI DI MARKOV NASCOSTI ALLINEAMENTO DI SEQUENZE BIOLOGICHE TRAMITE MODELLI DI MARKOV NASCOSTI 1. INTRODUZIONE La bioinformatica sta emergendo come una disciplina alla frontiera tra la biologia e l informatica: in questo ambiente,

Dettagli

Bioinformatica. Analisi del genoma

Bioinformatica. Analisi del genoma Bioinformatica Analisi del genoma GABRIELLA TRUCCO CREMA, 5 APRILE 2017 Cosa è il genoma? Insieme delle informazioni biologiche, depositate nella sequenza di DNA, necessarie alla costruzione e mantenimento

Dettagli

AUTOMA A STATI FINITI

AUTOMA A STATI FINITI Gli Automi Un Automa è un dispositivo, o un suo modello in forma di macchina sequenziale, creato per eseguire un particolare compito, che può trovarsi in diverse configurazioni più o meno complesse caratterizzate

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

Cosa è l Informatica?

Cosa è l Informatica? Cosa è l Informatica? Scienza degli elaboratori elettronici (Computer Science) Scienza dell informazione Scienza della rappresentazione, memorizzazione, elaborazione e trasmissione dell informazione Elaboratore

Dettagli

Cenni di apprendimento in Reti Bayesiane

Cenni di apprendimento in Reti Bayesiane Sistemi Intelligenti 216 Cenni di apprendimento in Reti Bayesiane Esistono diverse varianti di compiti di apprendimento La struttura della rete può essere nota o sconosciuta Esempi di apprendimento possono

Dettagli