q xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0;

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "q xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0;"

Transcript

1 Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p1 p6 p i >0; 6! i=1 p i =1 Sequenza di dna/proteine x con probabilita q x Probabilita dell intera sequenza n " i!1 q xi

2 Massima verosimiglianza S-ma di parametri da un training set Per esempio q i puo essere s-mato dalla frequenza dell aminoacido i in tude le sequenze di proteine note Dato un modello con parametri θ e un set di da- D, la s-ma per massima verosimiglianza e quella che massimizza P(D θ)

3 Supponiamo di avere due dadi D 1 e D 2, la probabilita di odenere i con D 1 e P(i D 1 ), probabilita condizionale di avere i dato il dado D 1. Se il dado e scelto a caso con una probabilita P(D j ), j=1,2 allora la probabilita di scegliere il dado j e odenere ii diventa P(i,D j )=P(D j )P(i D j )

4 Generalizzando P(X,Y) = P(X Y)P(Y) joint probability! Y! Y P(X) = P(X,Y ) = P(X Y )P(Y )

5 Il casino occasionalmente disonesto Due -pi di dadi, il 99% ones- e l 1% trucca- in modo che il 6 venga il 50% delle volte. Prendiamo un dado a caso, qual e la probabilita di odenere un 6? P(6) =P(D o )P(6 D o )+P(D t )P(6 D t ) = 0.01*0.5+1/6*(0.99) = 0.17

6 Prendiamo un dado a caso e -riamolo tre volte: odeniamo tre volte 6. Qual e la probabilita che il dado sia truccato? P(D t 3 sei) = P(3 sei D t )P(D t )/P(3 sei) = *0.01 P(3 sei) = (0.5) 3 *0.01+(1/6) 3 *0.99 P(D t 3 sei) / P(3 sei) = 0.27

7 Esempio piu biologico Assumiamo che le proteine extracellulari abbiano una diversa composizione e usiamo questa informazione per decidere se una certa proteina e extracellulare cioe calcolare p ext InnanzituDo procuriamoci due set di sequenze proteiche intracellulari e extracellulari e con-amo le frequenze degli aminoacidi in ciascun set q a int e q a est

8 P ext = 1- P int probabilita a priori S-miamo calcoliamo q a int e q a est P(x ext) = dai nostri dataset e! q ext xi e P(x int) = q xi i p(x) = P(x ext)+ p(x int) P(ext x) = p ext! i p ext q xi! i ext q xi ext + p int! i! i int q xi int

9 Analisi di sequenze E importante ed u-le capire se due sequenze sono evolu-vamente correlate per varie ragioni: Iden-ficazione delle regioni conservate Inferenza funzionale Modellizzazione tridimensionale

10 Ci servono evidenze che si siano evolute da un progenitore comune adraverso un processo di mutazione e selezione. Le mutazioni sono fondamentalmente sos-tuzioni e inserzioni o delezioni (gaps)

11

12 Il concedo di base e che due sequenze sono omologhe se sono piu simili di quello che mi aspedo per caso Devo calcolare la verosimiglianza rela-va che le due sequenze siano correlate rispedo a quella che non lo siano. Il primo passo e di misurare una distanza tra due sequenze.

13 Per misurare la distanza occorre medere in corrspondenza le due sequenze cioe odenere un ALLINEAMENTO. Possiamo usare come distanza il numero minimo di operazioni di edi-ng per passare da una sequenza all altra un punteggio che e la somma di un termine per ciscuna coppia allineata che indica la verosimiglianza che i due amino acidi possano essere sta- entrambi origina- dallo stesso amino acido ancestrale (o che possano sos-tuirsi l uno all altro durante l evoluzione)

14

15 Occorre un punteggio per ogni coppia di aminoacidi Date due sequenze x e y di lunghezza n ed m, x i e l i- esimo simbolo in x e y j il j- esimo in y

16 Caso 0: due sequenze della stessa lunghezza Modello random R P(x,y R) = Modello M P(x,y M) =! q q xi yj i! i! j p xi y i

17 Rapporto: P(x, y M ) P(x, y R) =! i! i q xi p xi y i! i Per odenere l addi-vita consideriamo: q yi =! i p xx y i q xi q yi S =! s(x i, y i ) i s(a, b) = log( p ab q a q b )

18 Matrici di punteggio (o sos-tuzione)

19

20 Matrici di sos-tuzione I punteggi che usiamo devono coprrispondere alla divergenza adesa fra le sequenze. P ab deve essere P(b a,t) = p ab (t)/q a

21 Matrici di Dayhoff S-mate da coppie di proteine ad 1 PAM scalata con la condizione che la somma di ogni riga e uguale a 1. PAM2 = PAM1 2 PAM250

22 Matrici BLOSUM Sderivate da blocchi di sequenze della stessa famiglia allineate con la condizione che vengano considerate equivalen- due sequenze quando la percentuale dei loro residui iden-ci supera un certo livello L% BLOSUM62, BLOSUM50

23 A R N D C Q E G H I L K M F P S T W Y V! A ! R ! N ! D ! C ! Q ! E ! G ! H ! I ! L ! K ! M ! F ! P ! S ! T ! W ! Y ! V !

24 Occorre penalizzare i gap Il costo di un gap di lunghezza g e s-mato in y(g) = - gd Oppure (score affine) y(g)=- d- (1- g)e d = gap- open penalty; e=gap- extension penalty Gap corte sono quasi altredanto frequen- di gap singole.

25

26 P(gap) = f (g)! j in gap f(g) e una funzione della lunghezza del gap L assunzione e che la lunghezza del gap non e correlata con gli aminoacidi che con-ene. Quando dividiamo per il modello random odeniamo: P(gap) = f (g) y(g) = log( f (g)) q xi

27 H E A G A W G H E E P A W H E A E

28 Programmazione dinamica (Needleman and Wunsch) F(i!1, j!1) F(i, j!1) s(x i, y j )! d F(i!1, j) F(i, j)! d " F(i!1, j!1)+ s(x i, y j) )& $ $ F(i, j) = max# F(i!1, j)! d ' $ % F(i, j!1)! d $ (

29 L G A x i! A L G A x i! G A x i - -! L G V y j! G V y j - -!! S L G V y j! " F(i!1, j!1)+ s(x i, y j) )& $ $ F(i, j) = max# F(i!1, j)! d ' $ % F(i, j!1)! d $ (

Algoritmi di Allineamento

Algoritmi di Allineamento Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento

Dettagli

ALLINEAMENTO DI SEQUENZE

ALLINEAMENTO DI SEQUENZE ALLINEAMENTO DI SEQUENZE Procedura per comparare due o piu sequenze, volta a stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che massimizzino la similarita

Dettagli

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni

Dettagli

FASTA. Lezione del

FASTA. Lezione del FASTA Lezione del 10.03.2016 Omologia vs Similarità Quando si confrontano due sequenze o strutture si usano spesso indifferentemente i termini somiglianza o omologia per indicare che esiste un rapporto

Dettagli

Bioinformatics more basic notions

Bioinformatics more basic notions Bioinformatics more basic notions Alcune slides provengono dal materiale rilasciato da: Dr Sergio Marin Vargas - Verona Prof. Riccardo Percudari - Parma Bioinformatics Bio-inspired Computer science Gli

Dettagli

Come si sceglie l algoritmo di allineamento? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione?

Come si sceglie l algoritmo di allineamento? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione? Come si sceglie l algoritmo di allineamento? Domande: le due proteine hanno domini simili? hanno pezzi di struttura simili? appartengono alla stessa famiglia? svolgono la stessa funzione? hanno un antenato

Dettagli

A W T V A S A V R T S I A Y T V A A A V R T S I A Y T V A A A V L T S I

A W T V A S A V R T S I A Y T V A A A V R T S I A Y T V A A A V L T S I COME CALCOLARE IL PUNTEIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi che, però, sono le due facce di una stessa medaglia al

Dettagli

BLAST. W = word size T = threshold X = elongation S = HSP threshold

BLAST. W = word size T = threshold X = elongation S = HSP threshold BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query

Dettagli

Le sequenze consenso

Le sequenze consenso Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica

Dettagli

Computazione per l interazione naturale: fondamenti probabilistici (2)

Computazione per l interazione naturale: fondamenti probabilistici (2) Computazione per l interazione naturale: fondamenti probabilistici (2) Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@dsi.unimi.it

Dettagli

Lezione 7 Metodo dei Minimi Quadra1

Lezione 7 Metodo dei Minimi Quadra1 Lezione 7 Metodo dei Minimi Quadra1 S1matori di Minimi Quadra1 q Supponiamo di misurare due variabili casuali X e Y: ad ogni valore di X misuro il valore di Y. Per esempio negli istan1 x 1, x 2,, x n misuro

Dettagli

SAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing

SAGA: sequence alignment by genetic algorithm. ALESSANDRO PIETRELLI Soft Computing SAGA: sequence alignment by genetic algorithm ALESSANDRO PIETRELLI Soft Computing Bologna, 25 Maggio 2007 Multi Allineamento di Sequenze (MSAs) Cosa sono? A cosa servono? Come vengono calcolati Multi Allineamento

Dettagli

Programmazione dinamica

Programmazione dinamica rogrammazione dinamica Fornisce l allineamento ottimale tra due sequenze semplici variazioni dell algoritmo producono allineamenti globali o locali l allineamento calcolato dipende dalla scelta di alcuni

Dettagli

Omologia di sequenze: allineamento e ricerca

Omologia di sequenze: allineamento e ricerca Omologia di sequenze: allineamento e ricerca Genomi (organismi) e geni hanno un evoluzione divergente Sequenze imparentate per evoluzione divergente sono omologhe Le sequenze sono confrontabili tramite

Dettagli

Probabilità esempi. Aiutiamoci con una rappresentazione grafica:

Probabilità esempi. Aiutiamoci con una rappresentazione grafica: Probabilità esempi Paolo e Francesca giocano a dadi. Paolo scommette che, lanciando due dadi, si otterrà come somma 8 oppure 9. Francesca scommette che si otterrà come somma un numero minore o uguale a

Dettagli

Ricerca di omologhi. La sequenza di cui vogliamo trovare gli omologhi viene de6a query.

Ricerca di omologhi. La sequenza di cui vogliamo trovare gli omologhi viene de6a query. Ricerca di omologhi La sequenza di cui vogliamo trovare gli omologhi viene de6a query. Dobbiamo cercare i suoi omologhi in una banca da= di sequenze (qualche decina di milioni) Allineamento con ciascuna

Dettagli

VARIABILI ALEATORIE Una moneta equilibrata viene lanciata più volte. Qual è la probabilità che al 6 lancio:

VARIABILI ALEATORIE Una moneta equilibrata viene lanciata più volte. Qual è la probabilità che al 6 lancio: VARIABILI ALEATORIE. Una moneta equilibrata viene lanciata più volte. Qual è la probabilità che al lancio: a) si abbia testa per la prima volta? b) Si sia avuto testa almeno una volta? c) Si sia avuta

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 05-6 P.Baldi Lista di esercizi, 8 gennaio 06. Esercizio Si sa che in una schedina

Dettagli

Allineamento e similarità di sequenze

Allineamento e similarità di sequenze Allineamento e similarità di sequenze Allineamento di Sequenze L allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; La similarità

Dettagli

Minimi quadrati e massima verosimiglianza

Minimi quadrati e massima verosimiglianza Minimi quadrati e massima verosimiglianza 1 Introduzione Nella scorsa lezione abbiamo assunto che la forma delle probilità sottostanti al problema fosse nota e abbiamo usato gli esempi per stimare i parametri

Dettagli

Lezione 6. Analisi di sequenze biologiche e ricerche in database

Lezione 6. Analisi di sequenze biologiche e ricerche in database Lezione 6 Analisi di sequenze biologiche e ricerche in database Schema della lezione Allinemento: definizioni Allineamento di due sequenze Ricerca di singola sequenza in banche dati (Alignment-based database

Dettagli

Esercizio 2 Si consideri l esperimento avente come risultati possibili i numeri 1, 2, 3, 4, 5 di probabilità rispettivamente 0.2, 0.4, 0.1, 0.1, 0.2.

Esercizio 2 Si consideri l esperimento avente come risultati possibili i numeri 1, 2, 3, 4, 5 di probabilità rispettivamente 0.2, 0.4, 0.1, 0.1, 0.2. Esercizio 2 Si consideri l esperimento avente come risultati possibili i numeri 1, 2, 3, 4, 5 di probabilità rispettivamente 0.2, 0.4, 0.1, 0.1, 0.2. a) Determinare l insieme di tutti i possibili sottoinsiemi

Dettagli

Lezione 7. Allineamento di sequenze biologiche

Lezione 7. Allineamento di sequenze biologiche Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra

Dettagli

Allineamenti a coppie

Allineamenti a coppie Laboratorio di Bioinformatica I Allineamenti a coppie Dott. Sergio Marin Vargas (2014 / 2015) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Il sito http://myhits.isb-sib.ch/cgi-bin/dotlet

Dettagli

Esempio di utilizzo del programma BLAST disponibile all NCBI Form di Nucleotide BLAST

Esempio di utilizzo del programma BLAST disponibile all NCBI   Form di Nucleotide BLAST Esempio di utilizzo del programma BLAST disponibile all NCBI www.ncbi.nlm.nih.gov/blast Form di Nucleotide BLAST Per un uso più avanzato, si possono impostare parametri particolari (es. cost to open gap,

Dettagli

Sottosequenza comune piu' lunga (programmazione dinamica)

Sottosequenza comune piu' lunga (programmazione dinamica) piu' (programmazione Laboratorio di Programmazione II Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario piu' piu' Il problema del turista a manhattan piu' Problema

Dettagli

Allineamenti Multipli di Sequenze

Allineamenti Multipli di Sequenze Allineamenti Multipli di Sequenze 1 Allineamento multiplo di sequenze: obiettivi di oggi Definire un allineamento multiplo di sequenze; com è generato; comprendere i principali metodi. Introdurre i database

Dettagli

Calcolo delle Probabilità

Calcolo delle Probabilità Calcolo delle Probabilità Il calcolo delle probabilità studia i modelli matematici delle cosiddette situazioni di incertezza. Molte situazioni concrete sono caratterizzate a priori da incertezza su quello

Dettagli

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche InfoBioLab I ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche Esercizio 1 - obiettivi: Ricerca di 2 proteine in ENTREZ Salva i flat file che descrivono le 2 proteine in formato testo Importa

Dettagli

Probabilità congiunta

Probabilità congiunta Una vera matrice di sostituzione F K M N P Q 4 5 5 4 3 3 5 6 5 4 3 5 4 4 3 6 4 3 4 5 3 F 8 5 5 4 5 5 4 5 3 4 3 3 6 3 5 K 5 3 3 6 4 3 3 3 M 6 N P 6 Q 4 6 V Y 3 3 3 3 V 4 4 6 8 6 6 6 3 5 3 4 4 6 5 5 6 7

Dettagli

Esercizi settimana 4. Esercizi applicati. Esercizio 1. Si considerino tre monete truccate, ognuna con probabilità 2 3

Esercizi settimana 4. Esercizi applicati. Esercizio 1. Si considerino tre monete truccate, ognuna con probabilità 2 3 1 Esercizi settimana Esercizi applicati Esercizio 1. Si considerino tre monete truccate, ognuna con probabilità 3 di ottenere testa. Se scegliete la prima moneta vincete 10 punti se esce testa e punti

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I 1 INTRODUZIONE

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I 1 INTRODUZIONE Docente: Matteo Re UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2013-2014 semestre I 1 INTRODUZIONE Motivazioni dell esistenza della biologia computazionale: Biologia Computazionale

Dettagli

Allineamenti di sequenze: concetti e algoritmi

Allineamenti di sequenze: concetti e algoritmi Allineamenti di sequenze: concetti e algoritmi 1 globine: a- b- mioglobina Precoce esempio di allineamento di sequenza: globine (1961) H.C. Watson and J.C. Kendrew, Comparison Between the Amino-Acid Sequences

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO. Giorgio Valentini. Bioinformatica. A.A semestre I 1 INTRODUZIONE

UNIVERSITÀ DEGLI STUDI DI MILANO. Giorgio Valentini. Bioinformatica. A.A semestre I 1 INTRODUZIONE Docenti: Matteo Re Giorgio Valentini UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2014-2015 semestre I 1 INTRODUZIONE Motivazioni dell esistenza della biologia computazionale:

Dettagli

Classificazione Bayesiana

Classificazione Bayesiana Classificazione Bayesiana Selezionare, dato un certo pattern x, la classe ci che ha, a posteriori, la massima probabilità rispetto al pattern: P(C=c i x)>p(c=c j x) j i Teorema di Bayes (TDB): P(A B) =

Dettagli

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente

Dettagli

Lezione 7. Allineamento di sequenze biologiche

Lezione 7. Allineamento di sequenze biologiche Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra

Dettagli

ASD Laboratorio 08. Alessio Guerrieri/Lorenzo Ghiro 07/03/2018. Alessio Guerrieri/Lorenzo Ghiro ASD Laboratorio 08 07/03/ / 14

ASD Laboratorio 08. Alessio Guerrieri/Lorenzo Ghiro 07/03/2018. Alessio Guerrieri/Lorenzo Ghiro ASD Laboratorio 08 07/03/ / 14 ASD Laboratorio 08 Alessio Guerrieri/Lorenzo Ghiro 07/03/2018 Alessio Guerrieri/Lorenzo Ghiro ASD Laboratorio 08 07/03/2018 1 / 14 CALENDARIO 07/03 Dinamica 2 21/03 Progetto Dinamica 16/05 Approssimazione

Dettagli

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.

Dettagli

COME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi

COME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi COME CALCOLARE IL PUNTEGGIO DI UN ALLINEAMENTO? Il problema del calcolo del punteggio di un allineamento può essere considerato in due modi diversi che, però, sono le due facce di una stessa medaglia al

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 00- P.Baldi Lista di esercizi. Corso di Laurea in Biotecnologie Esercizio Si sa che in una schedina del totocalcio i tre simboli, X, compaiono con

Dettagli

ASD Laboratorio 08. Cristian Consonni/Alessio Guerrieri 02/12/2016. Cristian Consonni/Alessio Guerrieri ASD Laboratorio 08 02/12/ / 14

ASD Laboratorio 08. Cristian Consonni/Alessio Guerrieri 02/12/2016. Cristian Consonni/Alessio Guerrieri ASD Laboratorio 08 02/12/ / 14 ASD Laboratorio 08 Cristian Consonni/Alessio Guerrieri 02/12/2016 Cristian Consonni/Alessio Guerrieri ASD Laboratorio 08 02/12/2016 1 / 14 CALENDARIO (UPDATE) 25/11 Dinamica 1 02/12 Dinamica 2 09/12 No

Dettagli

Test di preparazione all esame. Attenzione a non confonedere il coefficiente. n(n 1) (n m + 1) m(m 1) 2 1

Test di preparazione all esame. Attenzione a non confonedere il coefficiente. n(n 1) (n m + 1) m(m 1) 2 1 Test di preparazione all esame. Attenzione a non confonedere il coefficiente binomiale ( ) n m con la frazione n m. I coefficiente binomiale si può calcolare come ( ) n m = n(n 1) (n m + 1). m(m 1) 2 1

Dettagli

CP210 Introduzione alla Probabilità: Esame 2

CP210 Introduzione alla Probabilità: Esame 2 Dipartimento di Matematica, Roma Tre Pietro Caputo 2018-19, II semestre 9 luglio, 2019 CP210 Introduzione alla Probabilità: Esame 2 Cognome Nome Matricola Firma Nota: 1. L unica cosa che si può usare durante

Dettagli

Computazione per l interazione naturale: fondamenti probabilistici (2)

Computazione per l interazione naturale: fondamenti probabilistici (2) Computazione per l interazione naturale: fondamenti probabilistici (2) Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@di.unimi.it

Dettagli

FENOMENI CASUALI. fenomeni casuali

FENOMENI CASUALI. fenomeni casuali PROBABILITÀ 94 FENOMENI CASUALI La probabilità si occupa di fenomeni casuali fenomeni di cui, a priori, non si sa quale esito si verificherà. Esempio Lancio di una moneta Testa o Croce? 95 DEFINIZIONI

Dettagli

Esame di Probabilità e Statistica del 21 marzo 2007 (Corso di Laurea Triennale in Matematica, Università degli Studi di Padova).

Esame di Probabilità e Statistica del 21 marzo 2007 (Corso di Laurea Triennale in Matematica, Università degli Studi di Padova). Esame di Probabilità e Statistica del 1 marzo 007 (Corso di Laurea Triennale in Matematica, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. Es. 3 Es. 4 Somma Voto finale Attenzione:

Dettagli

Programmazione dinamica

Programmazione dinamica Programmazione dinamica Fornisce l allineamento ottimale tra due sequenze semplici variazioni dell algoritmo producono allineamenti globali o locali l allineamento calcolato dipende dalla scelta di alcuni

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Hidden Markov Models Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Processi

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 15-La probabilità vers. 1.0a (26 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2014-2015

Dettagli

Generazione di variabili aleatorie con distribuzione non uniforme. Daniela Picin

Generazione di variabili aleatorie con distribuzione non uniforme. Daniela Picin Generazione di variabili aleatorie con distribuzione non uniforme Daniela Picin A partire da una sequenza di numeri random u k ~ U(0,1) opportunamente generati, alcuni dei metodi per la generazione di

Dettagli

CP110 Probabilità: Esonero 1. Testo e soluzione

CP110 Probabilità: Esonero 1. Testo e soluzione Dipartimento di Matematica, Roma Tre Pietro Caputo 2009-2010, II semestre 1 aprile, 2010 CP110 Probabilità: Esonero 1 Testo e soluzione 1. (7 pt Una scatola contiene 15 palle numerate da 1 a 15. Le palle

Dettagli

CP110 Probabilità: Esame 2 luglio Testo e soluzione

CP110 Probabilità: Esame 2 luglio Testo e soluzione Dipartimento di Matematica, Roma Tre Pietro Caputo 212-13, II semestre 2 luglio, 213 CP11 Probabilità: Esame 2 luglio 213 Testo e soluzione 1. (6 pts Due mazzi di carte francesi vengono uniti e mischiati.

Dettagli

I ESERCITAZIONE GENETICA

I ESERCITAZIONE GENETICA 2-04-2008 _ Dott.Baratta I ESERCITAZIONE GENETICA 1) Definizione di Probabilità (eventi elementari) 2) Calcolo della Probabilità di eventi composti (Regola del prodotto e della somma) 3) Predizione dei

Dettagli

Esercizi settimana 5. Esercizi applicati. Esercizio 1. Si considerino tre monete truccate, ognuna con probabilità 2 3

Esercizi settimana 5. Esercizi applicati. Esercizio 1. Si considerino tre monete truccate, ognuna con probabilità 2 3 1 Esercizi settimana 5 Esercizi applicati Esercizio 1. Si considerino tre monete truccate, ognuna con probabilità 3 di ottenere testa. Se scegliete la prima moneta vincete 10 punti se esce testa e punti

Dettagli

Statistica. Esercizi: 7. Statistica Descrittiva Bivariata 3 Probabilità 1

Statistica. Esercizi: 7. Statistica Descrittiva Bivariata 3 Probabilità 1 Corsi di Laurea: a.a. 2018-19 Diritto per le Imprese e le istituzioni Scienze Internazionali dello Sviluppo e della Cooperazione Statistica Statistica Descrittiva Bivariata 3 Probabilità 1 Esercizi: 7

Dettagli

Il problema dello zaino

Il problema dello zaino Il problema dello zaino (knapsack problem) Damiano Macedonio mace@unive.it Copyright 2010 2012 Moreno Marzolla, Università di Bologna (http://www.moreno.marzolla.name/teaching/asd2011b/) This work is licensed

Dettagli

Allineamento multiplo

Allineamento multiplo Allineamento multiplo Allineamenti multipli Il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte proteine a funzione analoga. I siti funzionalmente o strutturalmente

Dettagli

Lezione 7. Allineamento di sequenze biologiche

Lezione 7. Allineamento di sequenze biologiche Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra

Dettagli

Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti Esercitazione 7 2.

Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti Esercitazione 7 2. Laboratorio di Informatica 2004/ 2005 Corso di laurea in biotecnologie - Novara Viviana Patti patti@di.unito.it Esercitazione 7 1 Info&Bio Bio@Lab Allineamento di sequenze Esercitazione 7 2 1 Es2: Allineamento

Dettagli

Esercizi di Probabilità

Esercizi di Probabilità Esercizi di Probabilità Grazia Corvaia, Patrizio Lattanzio, Alessandra Nardi February 0, 09 L urna colorata In un urna si trovano 0 palline, 5 viola e 5 arancioni. Calcolare la probabilità che, in due

Dettagli

Probabilità: l alfabeto Statistica: il minimo indispensabile. Dati: statistica descrittiva Inferenza statistica

Probabilità: l alfabeto Statistica: il minimo indispensabile. Dati: statistica descrittiva Inferenza statistica ... trasformazioni logaritmiche e semilogaritmiche leggi di crescita e decrescita funzioni composte, domini limiti elementari crescenza e decrescenza di funzioni convessità e concavità di funzioni massimi

Dettagli

Metodo della matrice a punti

Metodo della matrice a punti Metodo della matrice a punti proposto da Gibbs and McIntyre (1970) consente di evidenziare ripetizioni dirette o inverse nelle sequenze prevedere regioni complementari nell RNA che possano potenzialmente

Dettagli

Lezione 5 Corso di Statistica. Francesco Lagona

Lezione 5 Corso di Statistica. Francesco Lagona Lezione 5 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 23 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni

Dettagli

Foglio di Esercizi 10 con Risoluzione 18 dicembre 2017

Foglio di Esercizi 10 con Risoluzione 18 dicembre 2017 Matematica per Farmacia, a.a. 07/8 Foglio di Esercizi 0 con Risoluzione 8 dicembre 07 ATTENZIONE: in alcuni degli esercizi di Probabilità puó essere utile usare il Teorema di Bayes. Esercizio (Vedere il

Dettagli

Pairwise Sequence Alignment BIOINFORMATICA. Corso di Laurea in Ingegneria Informatica e Biomedica. Università Magna Graecia Catanzaro

Pairwise Sequence Alignment BIOINFORMATICA. Corso di Laurea in Ingegneria Informatica e Biomedica. Università Magna Graecia Catanzaro Pairwise Sequence Alignment BIOINFORMATICA Corso di Laurea in Ingegneria Informatica e Biomedica Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento Esatto di Coppie

Dettagli

Bayes, PDF, CDF. Renato Mainetti

Bayes, PDF, CDF. Renato Mainetti Bayes, PDF, CDF Renato Mainetti Importiamo i dati di un esperimento Censimento volatili isola di Nim: 100 volatili vivono su quest isola 30 piccioni marroni (classe 1) 20 piccioni bianchi (classe 2) 10

Dettagli

Computazione per l interazione naturale: fondamenti probabilistici

Computazione per l interazione naturale: fondamenti probabilistici Computazione per l interazione naturale: fondamenti probabilistici Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2017.html

Dettagli

Esercizi - Fascicolo III

Esercizi - Fascicolo III Esercizi - Fascicolo III Esercizio 1 In una procedura di controllo di produzione, n processori prodotti da un processo industriale vengono sottoposti a controllo. Si assuma che ogni pezzo, indipendentemente

Dettagli

Protein folding. Un gran numero di interazioni deboli + ΔH

Protein folding. Un gran numero di interazioni deboli + ΔH Protein folding -ΔS Un gran numero di interazioni deboli +ΔS + ΔH E r Protein structure modelling: A digression I polimeri (inclusi quelli di amino acidi) in generale non hanno una struttura unica. Le

Dettagli

CP210 Introduzione alla Probabilità: Esonero 2

CP210 Introduzione alla Probabilità: Esonero 2 Dipartimento di Matematica, Roma Tre Pietro Caputo 218-19, II semestre 4 giugno, 219 CP21 Introduzione alla Probabilità: Esonero 2 Cognome Nome Matricola Firma Nota: 1. L unica cosa che si può usare durante

Dettagli

PROGRAMMAZIONE DINAMICA. Prof. Reho Gabriella Olimpiadi di Informatica

PROGRAMMAZIONE DINAMICA. Prof. Reho Gabriella Olimpiadi di Informatica PROGRAMMAZIONE DINAMICA Quando si usa P.D.? La programmazione dinamica si usa nei casi in cui esista una definizione ricorsiva del problema, ma la trasformazione diretta di tale definizione in un algoritmo

Dettagli

Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni:

Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni: Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni: antonella.meloni@ifc.cnr.it Sequenza A= stringa formata da N simboli, dove i simboli apparterranno ad un certo alfabeto. A

Dettagli

Probabilità. Spazi di probabilità

Probabilità. Spazi di probabilità Probabilità Paolo Montanari Appunti di Matematica Probabilità 1 Spazi di probabilità Un esperimento si dice casuale quando esso può essere ripetuto quante volte si vuole, ed il risultato di ogni esecuzione

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Hidden Markov Models Manuele Bicego orso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Processi

Dettagli

Apprendimento Automatico

Apprendimento Automatico Apprendimento Automatico Metodi Bayesiani Fabio Aiolli 11 Dicembre 2017 Fabio Aiolli Apprendimento Automatico 11 Dicembre 2017 1 / 19 Metodi Bayesiani I metodi Bayesiani forniscono tecniche computazionali

Dettagli

METODI STATISTICI PER LA BIOLOGIA. Paolo Dai Pra e Francesco Caravenna

METODI STATISTICI PER LA BIOLOGIA. Paolo Dai Pra e Francesco Caravenna METODI STATISTICI PER LA BIOLOGIA. Paolo Dai Pra e Francesco Caravenna 18 marzo 2008 NOME 1. Parte A 1.1. Sono stati raccolti 7 dati relativi ad una variabile x. Si sa che 3 dati hanno valore 5; 2 dati

Dettagli

Comunicazioni Elettriche II

Comunicazioni Elettriche II Comunicazioni Elettriche II Laurea Magistrale in Ingegneria Elettronica Università di Roma La Sapienza A.A. 207-208 Informazioni sul corso Mercoledì 0.00-2.00 Aula 22 Giovedì 0.00-2.00 Aula 25 Venerdì

Dettagli

Calcolo delle Probabilità 16 Giugno 2016, C.d.L. STAD, UNIPA

Calcolo delle Probabilità 16 Giugno 2016, C.d.L. STAD, UNIPA Calcolo delle Probabilità 6 Giugno 206, C.d.L. STAD, UNIPA Prova intera esercizi, 2, 3, 4, 5, 6. Tempo 2 h 45 minuti. Esercizio risolto correttamente vale 5.5 punti. Seconda Prova in itinere esercizi 4,

Dettagli

ESERCIZI HLAFO ALFIE MIMUN

ESERCIZI HLAFO ALFIE MIMUN ESERCIZI HLAFO ALFIE MIMUN December, 27. Testo degli esercizi Risolvere i seguenti problemi: () Siano X, X 2, X 3 variabili aleatorie i.i.d. bernulliane di media.5 e siano Y, Y 2, Y 3, Y 4 variabili aleatorie

Dettagli

Università di Roma Tor Vergata Corso di Teoria dei Fenomeni Aleatori, AA 2012/13. Catene di Markov

Università di Roma Tor Vergata Corso di Teoria dei Fenomeni Aleatori, AA 2012/13. Catene di Markov Catene di Markov SISTEMI CASUALI DINAMICI (PROCESSI) - UN ESEMPIO: I GUASTI Frequenza dei guasti: N GUASTI 0 T N T 0 T! Catene di Markov SISTEMI CASUALI DINAMICI (PROCESSI) - UN ESEMPIO: I GUASTI Campionando

Dettagli

GRUPPI SANGUIGNI. Supponendo che la popolazione italiana sia H-W, calcola la probabilità di ogni singolo allele e di ogni genotipo

GRUPPI SANGUIGNI. Supponendo che la popolazione italiana sia H-W, calcola la probabilità di ogni singolo allele e di ogni genotipo GRUPPI SANGUIGNI La distribuzione dei gruppi sanguigni nella popolazione italiana è: gruppo A 36%, gruppo B 17%, gruppo AB 7%, gruppo 0 40%. Il gruppo sanguigno è determinato da un locus genetico con tre

Dettagli

Modelli Probabilistici per la Computazione Affettiva: Learning/Inferenza parametri

Modelli Probabilistici per la Computazione Affettiva: Learning/Inferenza parametri Modelli Probabilistici per la Computazione Affettiva: Learning/Inferenza parametri Corso di Modelli di Computazione Affettiva Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano

Dettagli

Calcolo delle Probabilità e Statistica Matematica Fisciano, 10/1/2012

Calcolo delle Probabilità e Statistica Matematica Fisciano, 10/1/2012 Fisciano, 10/1/2012 Esercizio 1 Un esperimento consiste nel generare a caso un vettore di interi (x 1, x 2, x 3, x 4 ), dove x i {1, 2, 3, 4, 5, 6} i. (i) Si individui lo spazio campionario, determinandone

Dettagli

Allineamento di sequenze proteiche

Allineamento di sequenze proteiche Allineamento di sequenze proteiche Sequenze proteiche - definizioni Una proteina è composta da diversi amino acidi uniti da legami peptidici. Si definisce: struttura primaria: la sequenza dei residui struttura

Dettagli

Informatica e Bioinformatica A. A

Informatica e Bioinformatica A. A Purtroppo non esiste un modo univoco per indicare un gene. Ad esempio abbiamo visto che il gene tcap a seconda del record è riportato come titin-cap protein o telethonin. Questo crea confusione e non facilita

Dettagli

ALLINEAMENTO DI SEQUENZE

ALLINEAMENTO DI SEQUENZE ALLINEAMENTO DI SEQUENZE Gli obiettivi degli algoritmi di allineamento di sequenze di acidi nucleici o proteine sono molteplici. Possiamo ricordare la ricerca di similarità nelle banche dati, la costruzione

Dettagli

Lezione 5 Corso di Statistica. Domenico Cucina

Lezione 5 Corso di Statistica. Domenico Cucina Lezione 5 Corso di Statistica Domenico Cucina Università Roma Tre D.Cucina (domenico.cucina@uniroma3.it) 1 / 24 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni condizionate

Dettagli

Probabilità Condizionale - 1

Probabilità Condizionale - 1 Probabilità Condizionale - 1 Come varia la probabilità al variare della conoscenza, ovvero delle informazioni in possesso di chi la calcola? ESEMPIO - Calcolare la probabilità che in una estrazione della

Dettagli

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST Lezione 8 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere

Dettagli

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST

Lezione 8. Ricerche in banche dati (databases) attraverso l uso di BLAST Lezione 8 Ricerche in banche dati (databases) attraverso l uso di BLAST BLAST: Basic Local Alignment Search Tool Basic Local Alignment Search Tool. Altschul et al. 1990,1994,1997 Sviluppato per rendere

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

Capitolo Parte IV

Capitolo Parte IV Capitolo 1 1.1 Parte IV Exercise 1.1. Siano A, B,C tre eventi in uno spazio di probabilità discreto (Ω, P). Si assuma che A,B,C siano indipendenti. Si mostri che (1) A B è indipendente da C. (2) A B è

Dettagli

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE Ψ PSICOMETRIA Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE STATISTICA INFERENZIALE CAMPIONE caratteristiche conosciute POPOLAZIONE caratteristiche sconosciute STATISTICA INFERENZIALE STIMA

Dettagli

Esame di Probabilità e Statistica del 3 aprile 2007 (Corso di Laurea Triennale in Matematica, Università degli Studi di Padova).

Esame di Probabilità e Statistica del 3 aprile 2007 (Corso di Laurea Triennale in Matematica, Università degli Studi di Padova). Esame di Probabilità e Statistica del 3 aprile 007 (Corso di Laurea Triennale in Matematica, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. Es. 3 Es. 4 Somma Voto finale Attenzione:

Dettagli

GRUPPI SANGUIGNI. Supponendo che la popolazione italiana sia H-W, calcola la probabilità di ogni singolo allele e di ogni genotipo

GRUPPI SANGUIGNI. Supponendo che la popolazione italiana sia H-W, calcola la probabilità di ogni singolo allele e di ogni genotipo GRUPPI SANGUIGNI La distribuzione dei gruppi sanguigni nella popolazione italiana è: gruppo A 36%, gruppo B 17%, gruppo AB 7%, gruppo 0 40%. Il gruppo sanguigno è determinato da un locus genetico con tre

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA

Dettagli

Teoria dell informazione

Teoria dell informazione Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2008-09 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di

Dettagli

Apprendimento Automatico

Apprendimento Automatico Apprendimento Automatico Metodi Bayesiani - Naive Bayes Fabio Aiolli 13 Dicembre 2017 Fabio Aiolli Apprendimento Automatico 13 Dicembre 2017 1 / 18 Classificatore Naive Bayes Una delle tecniche più semplici

Dettagli