Filogenesi molecolare

Размер: px
Начинать показ со страницы:

Download "Filogenesi molecolare"

Транскрипт

1 Filogenesi molecolare

2 Evoluzione dei geni Gene ancestrale Gene duplicazione genica Gene speciazione Gene 1 Gene 1 ortologhi paraloghi ortologhi Gene 2 Gene 2 Specie 1 Specie 2

3 Proteine o acidi nucleici? In filogenesi vengono utilizzati entrambi, ma è necessario fissare alcuni aspetti chiave che definiscono i diversi range di azione dei due: Sequenze proteiche - necessitano di matrici si sostituzione 20x20, molto complesse da trattare. - sono espressione di sole regioni codificanti. - aminoacidi identici possono essere espressione di più codoni Sequenze nucleotidiche - sono descrivibili con matrici 4x4. - possono essere estratte da sequenze genomiche non codificanti, quindi con una tendenza all avariazione più ampia - non hanno degenerazione né ridondanza. Per la filogenesi molecolare è preferibile utilizzare sequenze nucleotidiche

4 ssunzioni a priori Per calcolare una distanza evolutiva è necessario formulare un modello evolutivo: è quindi necessario considerare alcuni aspetti generali che possono essere considerati assunzioni a priori del modello: 1. tutti i siti evolvono in modo indipendente 2. tutti i siti mutano con la stessa probabilità 3. tutte le sostituzioni sono ugualmente probabili 4. la velocità di sostituzione è costante nel tempo 5. la composizione delle basi è costante Fare assunzioni a priori semplifica la trattazione matematica del modello (e quindi anche il numero di calcoli da effettuare) ma in generale si può affermare che: maggiore è il numero di assunzioni a priori - maggiore è la semplicità del modello - minore è l attendibilità dei risultati

5 lcuni modelli proposti ssunzioni J69 - Jukes & antor (1969) x x x x x KIM - Kimura (1980). x x x x Tamura (1992) x x x F81 - Felsenstein (1981) x x x x Hasegawa (1985) x x x GTR - Lanave (1984) x x Il modello GTR è il più complesso possibile, compatibilmente con una trattazione matematica adeguata. Tutti i modelli richiedono però che la composizione in basi sia stazionaria, altrimenti non possono essere applicati. isogna quindi verificarlo prima.

6 lcuni modelli proposti ssunzioni J69 - Jukes & antor (1969) x x x x x KIM - Kimura (1980). x x x x 3: tutte le sostituzioni sono ugualmente probabili Jukes & antor Kimura a 2 parametri

7 L orologio molecolare L evoluzione è un processo inevitabilmente divergente e il numero di mutazioni che si accumulano nel tempo è direttamente proporzionale al tempo intercorso dalla divergenza delle sequenze in analisi. (1965, Zuckerkandl e Pauling). Se questo è vero, data una distanza genetica calcolata osservando le divergenze, è possibile ottenere il tempo trascorso dal momento in cui due sequenze hanno cominciato a divergere. Inoltre, se la velocità di accumulo delle mutazioni è costante, è possibile la datazione degli organismi in base a un solo dato verificato di distanza temporale. K K es. istanza uomo topo: 80 milioni di anni V = => = istanza tra le alpha-globine: t 2V V = 0.56 x 10-8 sostituzioni/sito anno => anche se l orologio molecolare è vero, non è universale, perché siti diversi hanno diversi tassi di mutazione.

8 lberi filogenetici Sono grafi costituiti da NOI, che rappresentano le unità tassonomiche e da RMI che uniscono i nodi, rappresentando le distanze tra i due. Si definisce TOPOLOGI la struttura generale di un albero. Se ai rami non si dà valenza di distanza evolutiva, ho un LOGRMM, altrimenti ho un FILOGRMM. radice lberi ON RIE accettano come vera l ipotesi dell orologio molecolare e i nodi stanno in un preciso ordine temporale. nodo ramo F E E lberi SENZ RIE non prevedono significati evolutivi in termini temporali e descrivono semplicemente le relazioni tra le sequenze F ramo nodo

9 Topologie degli alberi filogenetici La topologia è la forma dell albero, e determinare la sua topologia è il primo passo dell analisi filogenetica. Il numero complessivo di alberi che si possono costruire con N sequenze (denominate OTU, cioè Operational Taxonomic Units) è dato da Rooted: (2N - 3)! Nr = N-3 (N - 3)! Unrooted: (2N - 5)! Nu = N-3 (N - 3)! es. 10 OTU, albero con root Nr = ((2*10)-3)! / 2 7 (7)! = circa 35 milioni di alberi possibili

10 Metodologie: Metodi per la creazione degli alberi I sistemi per costruire gli alberi possono essere distinti secondo due tipi di raggruppamenti, a seconde delle lgoritmi di clusterizzazione (FM, UPMG, NJ): si basano sull osservazione delle distanze genetiche calcolate su allineamenti multipli. lgoritmi di ottimizzazione (Minima evoluzione): ottimizzazione degli alberi in base a criteri obiettivi di qualità. o in base alla Origine dei dati: istanze genetiche pre-calcolate: tempi di calcolo minori. Sequenze omologhe multiallineate: tempi di calcolo molto maggiori.

11 istanze genetiche Per la distinzione filogenetica di due sequenze, è necessario conoscere quanto esse divergono. Serve quindi un parametro oggettivo e calcolabile, definito distanza genetica. - Per gli acidi nucleici conservati spesso si utilizza semplicemente il numero di sostituzioni percentuiali osservate dopo allineamento multiplo. n sostituzioni d = lunghezza - Per gli acidi nucleici meno conservati (> 25%) la d viene corretta con la formula di Jukes-antor d = 3 4 log ( 1- ) 4 3 d - Per le proteine, allineate con una matrice di sostituzione, spesso viene utilizzata la formula approssimata d = S obs S rand S max S rand S obs S max S rand score dell allineamento score massimo (media degli score degli allineamenti di tutte le proteine con loro stesse) score atteso per sequenze della stessa lunghezza e composizione

12 Tabelle di distanza La tabella di distanza più semplice deriva da allineamenti multipli in cui tutte le sequenze hanno la stessa lunghezza (es. un frammento di allineamento multiplo)

13 Le relazioni filogenetiche negli alberi I sistemi per costruire gli alberi devono capire come le sequenze stanno in relazione tra loro: il sistema da cui si estraggono le informazioni (le sequenze stesse o le distanze) serve a creare un sistema di equazioni in grado di capire quando le sequenze divergono (i nodi) e quanto estesa è la separazione (i rami). 22 a b 39 c 41 e si arriva a capire come, quanto e dove si biforcano, utilizzando criteri di varia natura, non necessariamente molecolari. Si parte da un albero teorico in cui si inseriscono le varie OTU, senza dare importanza ai vari rami

14 Schema di applicabilità dei vari metodi

15 lgoritmo di Fitch-Margoliash (FM) L algoritmo di Fitch-Margoliash serve a calcolare la lunghezza dei rami dato un albero a topologia nota. Funziona bene quando le distanze sono relativamente comparabili e assume che la lunghezza dei rami sia additiva. Per 3 sequenze procede così: 22 a b 39 c 41 lbero generico (1) a+b = 22 (2) a+c = 39 (3) b+c = 41 Sistema: 3 equazioni 3 incognite => sempre risolvibile lbero vero Esempio: (4) = (2) - (3) = a - b = = - 2 (4)+(1) = a+b-(a-b) = 2b = 20 => b = 10 da (1): a + 10 = 22 => a = 12 da (2): 12 + c = 39 => c = 29

16 lgoritmo di Fitch-Margoliash (FM) con N > 3 L algoritmo di Fitch-Margoliash con 5 sequenze esemplifica i passaggi per ogni caso in cui N (OTU) > 3: ata una matrice di distanze e un albero a topologia nota: erco le OTU più vicine. alcolo la loro distanza media dalle altre OTU. Uso questa per calcolare la lunghezza dei rami che uniscono le OTU vicine al loro nodo. Unisco le OTU vicine, utilizzando come distanze la media delle distanze che questi avevano rispetto alle altre OTU dell albero. reo una nuova matrice di distanze

17 lgoritmo di Fitch-Margoliash (FM) con N > 3 ata una matrice di distanze... e. un albero a topologia nota (1) d(,e) = d + e = 10 (2) d(,) = d + m = ( )/3 = 32.7 m = g+[c+(f+a)+(f+b)]/3 (3) d(e,) = e + m = ( )/3 = 34.7 (4) = (2) - (3) = d - e = -2 => d = e - 2 da (1) e (4): d + e = e e = 10 => 2e = 12 => e = 6 da (1): d - 6 = 10 => d = 4 b a f g 6 c E 4 OTU risolte b b a a f g e gc + gfa + gfb 3 La distanza media di o E da,,e f c E d c g

18 lgoritmo di Fitch-Margoliash (FM) con N > 3 Matrice di partenza con N = 5 OTU d(,) = 39 d(,e) = 41 d(,) = 41 d(,e) = 43 d(,) = 18 d(,e) = 20 d(,(e)) = 40 d(,(e)) = 42 d(,(e)) = 19 Matrice con N-1 = 4 OTU

19 lgoritmo di Fitch-Margoliash (FM) con N > 3 ata una matrice di distanze... e. un albero a topologia nota (1) d(,e) = c + g = 19 (2) d(,) = c + m = (39+41)/2 = 40 (3) d(e,) = g + m = (40+42)/2 = 41 (4) = (2) - (3) = c - g = -1 => c = g - 1 E m = [(f+a)+(f+b)]/2 da (3): c + g = g g = 19 => 2g = 20 => g = 10/2 = 5 (condivisi tra ed E) da (3): c + 10 = 19 => c = 9 b a f g 6 c 4 b a f OTU risolte Procedendo in questo modo, via via si risolvono le lunghezze di tutti i rami E

20 Neighbour - Joining E un metodo rapido per risolvere la topologia degli alberi e viene utilizzato quando si ipotizzano evoluzioni con diverse velocità. SI basa sul quadrato delle lunghezze dei rami, cercando di minimizzarlo. La procedura è la seguente: Si parte da un albero a stella Si estrae dall albero una coppia (es. ) Si calcolano tutti i rami con FM. Si sommano i rami. Ottengo uno score S

21 Neighbour Joining: S 0 L albero a stella iniziale ha uno score S 0, il punto di partenza per i confronti. Il calcolo della somma dei rami si effettua percorrendo i tracciati da una OTU ad un altra, senza ripetere i percorsi doppi e utilizzando una matrice di distanze. d+d+d+de b+d+de d+de de + (ab+ac+ad+ae) + (bc+bd+be) + (cd+ce) = (de) Ogni ramo è contato 4 volte = 314 / 4 = 78.5 La formula generale per risolvere S 0 è: S o = Σ d ij / (N-1) Score S 0

22 Neighbour Joining: S ab L albero in cui viene isolata la coppia avrà una topologia diversa, e la somma dei rami S ab sarà da calcolare con criteri diversi: isogna stare attenti a non ripassare per più volte sullo stesso percorso. Matematicamente questo si risolve dividendo in modo coerente gli score che si ottengono dalle coppie. La formula generale per risolvere S è: d + (ab) d+d+de + (afc+afd+afe) b+d+de + (bfc+bfd+bfe) d+de + (cd+ce) de = (de+) 22 = ( ) / 3 = ( ) / 3 = ( ) = = S ab = [(Σ d ia +d ib )/(2(N-2))] + (d ab /2) + [(Σ d ij )/(N-2)] i,j tutte le sequenze tranne a ed b

23 Questa viene definita vicina (neighbour) e viene unita (joined). Si ricrea una nuova matrice di distanze in cui la coppia figura come una singola OTU (le distanze saranno la media delle distanze dalle due), e si ripete la procedura daccapo. Ogni volta la lunghezza dei rami viene calcolata con l algoritmo FM. Neighbour Joining Vengono provate tutte le coppie, cercando quella che totalizza lo score S più basso.

24 Unweighted Pair Group Method with ritmetic mean Il metodo UPGM è il più semplice da calcolare. ssume l orologio molecolare e si basa sul fatto che tra due sequenze accoppiate ci sia uguale divergenza. oppia più simile: E, dato che la loro distanza è 10, ad ogni ramo viene assegnato 10/2 = 5 5 on E accoppiati, creo una nuova matrice in cui le distanze tengono conto della media delle distanze tra E e le altre OTU. osì facendo risulta che le più vicine sono ora a E con una d = 19., Quindi è a 19/2 = 9.5 da E e il ramo che congiunge il nodo da E sarà = E E ggiungendo via via le coppie più simili e assegnando loro la distanza media tra le due, posso ottenere la topologia completa dell albero.

25 Metodo della massima parsimonia Non si lavora più con le distanze ma con le sequenze: si cerca l albero che richiede il minor numero di sostituzioni che spieghino le differenze osservate tra le sequenze. Si lavora solo su alcuni siti INFORMTIVI, cioè che presentano almeno 2 residui uguali. In questo caso è la topologia rossa TGTGGTGTG TGTTGGTTGTTTG TTGGGTGTGTG TTGTTGTTTG G G 1 G G G G G T T 2 T T T T T T T G T T G 3 T G G G G T T

26 Massima verosimiglianza Per ciascun sito del multiallineamento si calcola la probabilità che esso sia generato da un preciso albero. Estendendo la ricerca di probabilità a tutti i possibili alberi, ottengo l albero a maggior probabilità di rappresentare il multiallineamento. E il metodo più corretto di valutare le significatività degli alberi, ma ha un grosso limite: L enorme mole di calcolo per ottenere il risultato È impossibile ottenere risultati per multi-allineamenti di più di sequenze Sono stati prodotti vari metodi di approssimazione, tra cui uno detto quartet puzzle (QP) in cui si fanno operazioni su gruppi di 4 sequenze, e i risultati vengono intersecati tra loro.

27 ootstrapping E un metodo relativamente semplice per determinare la significatività di un risultato derivante da una analisi complessa: Si tratta di un RIMPIONMENTO casuale di sequenze a cui vengono applicate le stesse procedure applicate alle sequenze vere. In questo modo ottengo due valori: - uno effettivo, quello delle sequenze in analisi - uno che rappresenta il valore che otterrei con un campione casuale. al loro confronto è possibile ottenere una stima della veridicità del risultato. In generale vale la regola che: Maggiore è il numero di operazione di bootstrapping, maggiore è l attendibilità dei valori. Maggiore è la percentuale di risultati di bootstrapping che si accordano col risultato vero, maggiore è la precisione della stima del valore vero.

28 Principali programmi per l analisi filogenetica PHYLIP ( è un pacchetto di programmi curati da Joseph Felsenstein che non hanno interfaccia grafica. Sono programmi rapidi, efficienti e versatili, ma un po scomodi da utilizzare a causa della diversità dei formati di file utilizzati e dell approccio di separazione delle varie fasi. PUP: ( come Phylip, ma con un numero maggiore di test statistici per la validazione degli alberi. Ma si paga. Markov: effettua il calcolo delle distanze genetiche utilizzando il modello GTR e effettua il test di stazionarietà della composizione del dataset. E on-line, ma per utilizzarlo bisogna registrarsi.

29 Principali programmi per l analisi filogenetica Mrayes: ( utilizza per il calcolo delle distanze un metodo introdotto recentemente di inferenza bayesiana, che sta dando ottimi risultati in termini di qualità degli alberi generati. PhyloWin: ( dotato di interfaccia grafica, è piuttosto semplice e consente analisi con i metodi presenti anche in Phylip e PUP. MEG: ( attualmente è il programma più completo e facile da usare. Ha un interfaccia grafica molto intuitiva, una serie di strumenti grafici per la comprensione dei risultati e comprende numerosi approcci per il calcolo delle distanze, per la costruzione degli alberi e per la valutazione dell attendibilità con numerosi test statistici. Inoltre il manuale di Mega è molto completo, quasi un libro sulla filogenesi molecolare.

Filogenesi molecolare

Filogenesi molecolare Filogenesi molecolare Geni ortologhi e geni paraloghi Geni ortologhi: geni simili riscontrabili in organismi correlati tra loro. Il fenomeno della speciazione porta alla divergenza dei geni e quindi delle

Подробнее

Corso di Bioinformatica. Docente: Dr. Antinisca DI MARCO

Corso di Bioinformatica. Docente: Dr. Antinisca DI MARCO Corso di Bioinformatica Docente: Dr. Antinisca DI MARCO Email: [email protected] Analisi Filogenetica Gene Ancestrale duplicazione genica La filogenesi è lo studio delle relazioni evolutive tra

Подробнее

Alberi filogenetici. File: alberi_filogenetici.odp. Riccardo Percudani 02/03/04

Alberi filogenetici. File: alberi_filogenetici.odp. Riccardo Percudani 02/03/04 Alberi filogenetici The tree of life Albero filogenetico costruito con le sequenze della subunità piccola dell RNA ribosomale. Tutte le forme viventi condividono un comune ancestore (LCA, last common ancestor

Подробнее

Metodi di Distanza. G.Allegrucci riproduzione vietata

Metodi di Distanza. G.Allegrucci riproduzione vietata Metodi di Distanza La misura più semplice della distanza tra due sequenze nucleotidiche è contare il numero di siti nucleotidici che differiscono tra le due sequenze Quando confrontiamo siti omologhi in

Подробнее

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Filogenesi Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Introduzione alla

Подробнее

Algoritmi di Allineamento

Algoritmi di Allineamento Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento

Подробнее

Allineamento multiplo

Allineamento multiplo Allineamento multiplo Allineamenti multipli Il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte proteine a funzione analoga. I siti funzionalmente o strutturalmente

Подробнее

BLAST. W = word size T = threshold X = elongation S = HSP threshold

BLAST. W = word size T = threshold X = elongation S = HSP threshold BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query

Подробнее

Genomica Evoluzione e cambiamenti dei genomi. Dott.ssa Inga Prokopenko

Genomica Evoluzione e cambiamenti dei genomi. Dott.ssa Inga Prokopenko Genomica Evoluzione e cambiamenti dei genomi Dott.ssa Inga Prokopenko Sistematica in biologia La varietà degli organismi viventi richiede organizzaione delle nostre osservazioni Tassonomia in biologia

Подробнее

Ortologhi e paraloghi

Ortologhi e paraloghi Ortologhi e paraloghi Similarità e distanza Sequenza originaria GHSVLIWETS Gene Gene uplicazione Eventi di sostituzione: vvenuti = 12 Osservabili = 3 Speciazione Gene 1 Gene 2 Geni Ortologhi uplicazione

Подробнее

Le sequenze consenso

Le sequenze consenso Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica

Подробнее

EVOLUZIONE MOLECOLARE. Silvia Fuselli

EVOLUZIONE MOLECOLARE. Silvia Fuselli EVOLUZIONE MOLECOLARE Silvia Fuselli [email protected] TESTI Organizzazione del corso Graur and Li, Fundamentals of molecular evolution, Sinauer 2000 Michael Lynch, The Origins of Genome Architecture,

Подробнее

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Подробнее

Genomics Session. Lezione 6. Filogenomica

Genomics Session. Lezione 6. Filogenomica Genomics Session Filogenomica Filogenetica Filogenesi: Ricostruzione della storia evolutiva Obiettivo: inferire la storia evolutiva fra entità biologiche mediante una serie di caratteri moderni osservati

Подробнее

TASSONOMIA O SISTEMATICA

TASSONOMIA O SISTEMATICA TASSONOMIA O SISTEMATICA È la branca della batteriologia responsabile della caratterizzazione degli organismi ed organizzazione in gruppi affini (TAXA). NOMENCLATURA CLASSIFICAZIONE IDENTIFICAZIONE taxon

Подробнее

Riconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego

Riconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione

Подробнее

Problemi, istanze, soluzioni

Problemi, istanze, soluzioni lgoritmi e Strutture di Dati II 2 Problemi, istanze, soluzioni Un problema specifica una relazione matematica tra dati di ingresso e dati di uscita. Una istanza di un problema è formata dai dati di un

Подробнее

FILOGENESI Scaricare da GenBank le sequenze del gene della citocromo ossidasi I (COI) delle seguenti specie in formato fasta

FILOGENESI Scaricare da GenBank le sequenze del gene della citocromo ossidasi I (COI) delle seguenti specie in formato fasta FILOGENESI Scaricare da GenBank le sequenze del gene della citocromo ossidasi I (COI) delle seguenti specie in formato fasta Xiphias gladius Xenopus laevis Crocodylus niloticus Serinus canaria Canis lupus

Подробнее

La codifica di sorgente

La codifica di sorgente Tecn_prog_sist_inform Gerboni Roberta è la rappresentazione efficiente dei dati generati da una sorgente discreta al fine poi di trasmetterli su di un opportuno canale privo di rumore. La codifica di canale

Подробнее

Relazione sequenza-struttura e funzione

Relazione sequenza-struttura e funzione Biotecnologie applicate alla progettazione e sviluppo di molecole biologicamente attive A.A. 2010-2011 Modulo di Biologia Strutturale Relazione sequenza-struttura e funzione Marco Nardini Dipartimento

Подробнее

Metodi per la Ricostruzione Filogenetica. Giuliana Allegrucci riproduzione vietata

Metodi per la Ricostruzione Filogenetica. Giuliana Allegrucci riproduzione vietata Metodi per la Ricostruzione Filogenetica Ricostruire una filogenesi significa trovare la migliore stima delle relazioni evolutive storiche fra entità tassonomiche usando i dati disponibili. I dati di base

Подробнее

Allineamenti multipli

Allineamenti multipli Allineamenti multipli Allineamenti multipli Finora ci siamo occupati di allineamenti a coppie (pairwise), ma il modo migliore per conoscere le caratteristiche di una determinata famiglia è allineare molte

Подробнее

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili

Подробнее

Test di autovalutazione n.1

Test di autovalutazione n.1 Test di autovalutazione n.1 22 febbraio 2015 Nome e cognome: Domanda N.: Points Risposta: 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 1 10 1 11 1 12 1 13 1 14 1 15 1 16 1 Somma 16 1 DOMANDA n. 1 Il procedimento

Подробнее

Tesi di Laurea Specialistica. Laureando: Silvio Zennaro. Accordo tra alberi filogenetici: dalla teoria allo sviluppo web 2.0

Tesi di Laurea Specialistica. Laureando: Silvio Zennaro. Accordo tra alberi filogenetici: dalla teoria allo sviluppo web 2.0 UNIVERSITÀ CA FOSCARI DI VENEZIA Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea Specialistica in Informatica Tesi di Laurea Specialistica Laureando: Silvio Zennaro Accordo tra alberi

Подробнее

Questo teorema era già noto ai babilonesi, ma fu il matematico greco Pitagora, intorno al 500 a.c., a darne una descrizione precisa.

Questo teorema era già noto ai babilonesi, ma fu il matematico greco Pitagora, intorno al 500 a.c., a darne una descrizione precisa. IL TEOREMA DI PITAGORA Questo teorema era già noto ai babilonesi, ma fu il matematico greco Pitagora, intorno al 500 a.c., a darne una descrizione precisa. ENUNCIATO: la somma dei quadrati costruiti sui

Подробнее

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Подробнее

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Analisi degli Errori di Misura. 08/04/2009 G.Sirri Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia

Подробнее

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Подробнее

Test di ipotesi. Test

Test di ipotesi. Test Test di ipotesi Test E una metodologia statistica che consente di prendere una decisione. Esempio: Un supermercato riceve dal proprio fornitore l assicurazione che non più del 5% delle mele di tipo A dell

Подробнее

scaricato da I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE

scaricato da  I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE Legame peptidico I peptidi risultano dall unione di due o più aminoacidi mediante un legame COVALENTE tra il gruppo amminico di un aminoacido ed il gruppo carbossilico di un altro. 1 Catene contenenti

Подробнее

ALBERI FILOGENETICI. Genetica delle popolazioni a.a. 11-12 prof. S. Presciuttini

ALBERI FILOGENETICI. Genetica delle popolazioni a.a. 11-12 prof. S. Presciuttini ALBERI FILOGENETICI Questo documento è pubblicato sotto licenza Creative Commons Attribuzione Non commerciale Condividi allo stesso modo http://creativecommons.org/licenses/by-nc-sa/2.5/deed.it Che cosa

Подробнее

Metodo dell albero ramificato

Metodo dell albero ramificato Metodo dell albero ramificato Capitolo 2 e 3 Il metodo dell albero ramificato Un alternativa al quadrato di Punnett ed i concetti di probabilita detti, è unire in un albero i risultati possibili e le eventuali

Подробнее

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi

GENOMA. Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine CONTENUTO FUNZIONE. Progetti genoma in centinaia di organismi GENOMA EVOLUZIONE CONTENUTO FUNZIONE STRUTTURA Analisi di sequenze -- Analisi di espressione -- Funzione delle proteine Progetti genoma in centinaia di organismi Importante la sintenia tra i genomi The

Подробнее

3.3 FORMULAZIONE DEL MODELLO E CONDIZIONI DI

3.3 FORMULAZIONE DEL MODELLO E CONDIZIONI DI 3.3 FORMULAZIONE DEL MODELLO E CONDIZIONI DI ESISTENZA DI UN PUNTO DI OTTIMO VINCOLATO Il problema di ottimizzazione vincolata introdotto nel paragrafo precedente può essere formulato nel modo seguente:

Подробнее

Errori di misura Teoria

Errori di misura Teoria Errori di misura Teoria a misura operazione di misura di una grandezza fisica, anche se eseguita con uno strumento precisissimo e con tecniche e procedimenti accurati, è sempre affetta da errori. Gli errori

Подробнее

Esercitazione 3 - Calcolo delle azioni interne

Esercitazione 3 - Calcolo delle azioni interne Università degli Studi di ergamo orso di Laurea in Ingegneria Tessile orso di Elementi di Meccanica Esercitazione - alcolo delle azioni interne Esercizio n. La struttura di figura.a è composta da due aste

Подробнее

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente

Подробнее

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI Fondamenti di Psicometria La statistica è facile!!! VERIFICA DELLE IPOTESI INFERENZA STATISTICA Teoria della verifica dell ipotesi : si verifica, in termini probabilistici, se una certa affermazione relativa

Подробнее

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni

Подробнее

Omologia di sequenze: allineamento e ricerca

Omologia di sequenze: allineamento e ricerca Omologia di sequenze: allineamento e ricerca Genomi (organismi) e geni hanno un evoluzione divergente Sequenze imparentate per evoluzione divergente sono omologhe Le sequenze sono confrontabili tramite

Подробнее

Lezione 4. Problemi trattabili e soluzioni sempre più efficienti. Gianluca Rossi

Lezione 4. Problemi trattabili e soluzioni sempre più efficienti. Gianluca Rossi Lezione 4 Problemi trattabili e soluzioni sempre più efficienti Gianluca Rossi Trattabile o intrattabile? Consideriamo ora il problema, ben noto a tutti gli studenti a partire dalla scuola media, di calcolare

Подробнее

Piano cartesiano e retta

Piano cartesiano e retta Piano cartesiano e retta Il punto, la retta e il piano sono concetti primitivi di cui non si da una definizione rigorosa, essi sono i tre enti geometrici fondamentali della geometria euclidea. Osservazione

Подробнее

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Подробнее

Operazioni tra matrici e n-uple

Operazioni tra matrici e n-uple CAPITOLO Operazioni tra matrici e n-uple Esercizio.. Date le matrici 0 4 e dati λ = 5, µ =, si calcoli AB, BA, A+B, B A, λa+µb. Esercizio.. Per ognuna delle seguenti coppie di matrici A, B e scalari λ,

Подробнее

Possibile applicazione

Possibile applicazione p. 1/4 Assegnamento Siano dati due insiemi A e B entrambi di cardinalità n. Ad ogni coppia (a i,b j ) A B è associato un valore d ij 0 che misura la "incompatibilità" tra a i e b j, anche interpretabile

Подробнее

FREQUENZE GENOTIPICHE E GENICHE

FREQUENZE GENOTIPICHE E GENICHE FREQUENZE GENOTIPICHE E GENICHE Questo documento è pubblicato sotto licenza Creative Commons Attribuzione Non commerciale Condividi allo stesso modo http://creativecommons.org/licenses/by-nc-sa/2.5/deed.it

Подробнее

Il concetto di calcolatore e di algoritmo

Il concetto di calcolatore e di algoritmo Il concetto di calcolatore e di algoritmo Elementi di Informatica e Programmazione Percorso di Preparazione agli Studi di Ingegneria Università degli Studi di Brescia Docente: Massimiliano Giacomin Informatica

Подробнее

IL LINKAGE Si calcolano cioè due probabilità: 1) la probabilità L0 che la progenie di quella famiglia sia ottenuta in assenza di concatenazione (

IL LINKAGE Si calcolano cioè due probabilità: 1) la probabilità L0 che la progenie di quella famiglia sia ottenuta in assenza di concatenazione ( Il Linkage La tipizzazione di famiglie ampie ed informative, dove segrega uno specifico fenotipo a base genetica, consente di stabilire se esiste una concatenazione tra un marcatore specifico ed il locus

Подробнее

Claudio Estatico Equazioni non-lineari

Claudio Estatico Equazioni non-lineari Claudio Estatico ([email protected]) Equazioni non-lineari 1 Equazioni non-lineari 1) Equazioni non-lineari e metodi iterativi. 2) Metodo di bisezione, metodo regula-falsi. 3) Metodo di Newton.

Подробнее

Corso di elettrotecnica Materiale didattico: i grafi

Corso di elettrotecnica Materiale didattico: i grafi Corso di elettrotecnica Materiale didattico: i grafi A. Laudani 12 ottobre 2005 I grafi costituiscono uno strumento matematico che permette di descrivere e schematizzare una grande varietà di problemi

Подробнее

Appunti di matematica per le Scienze Sociali Parte 1

Appunti di matematica per le Scienze Sociali Parte 1 Appunti di matematica per le Scienze Sociali Parte 1 1 Equazioni 1.1 Definizioni preliminari 1.1.1 Monomi Si definisce monomio ogni prodotto indicato di fattori qualsiasi, cioè uguali o diseguali, numerici

Подробнее

Corso di Intelligenza Artificiale A.A. 2016/2017

Corso di Intelligenza Artificiale A.A. 2016/2017 Università degli Studi di Cagliari Corsi di Laurea Magistrale in Ing. Elettronica Corso di Intelligenza rtificiale.. 26/27 Esercizi sui metodi di apprendimento automatico. Si consideri la funzione ooleana

Подробнее

Minimizzazione a più livelli di reti combinatorie Cristina Silvano

Minimizzazione a più livelli di reti combinatorie Cristina Silvano Minimizzazione a più livelli di reti combinatorie Cristina Silvano Università degli Studi di Milano Dipartimento di Scienze dell Informazione Milano (Italy) Sommario Modello booleano e modello algebrico

Подробнее

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato

Подробнее

a + 2b + c 3d = 0, a + c d = 0 c d

a + 2b + c 3d = 0, a + c d = 0 c d SPAZI VETTORIALI 1. Esercizi Esercizio 1. Stabilire quali dei seguenti sottoinsiemi sono sottospazi: V 1 = {(x, y, z) R 3 /x = y = z} V = {(x, y, z) R 3 /x = 4} V 3 = {(x, y, z) R 3 /z = x } V 4 = {(x,

Подробнее

Luigi Piroddi

Luigi Piroddi Automazione industriale dispense del corso (a.a. 2008/2009) 9. Reti di Petri: analisi dinamica e metodi di riduzione Luigi Piroddi [email protected] Metodi di analisi di Reti di Petri Ci sono 2 modi

Подробнее

LA LUNGHEZZA DEI GENI UMANI (Es4.1)

LA LUNGHEZZA DEI GENI UMANI (Es4.1) STATISTICA INFERENZIALE: le caratteristiche della popolazione complessiva sono indotte da quelle osservate su un campione estratto dalla popolazione stessa(esempio exit poll) PROBLEMA: dato un campione

Подробнее

Metodologia di implementazione del sistema per la spazializzazione dei dati meteo

Metodologia di implementazione del sistema per la spazializzazione dei dati meteo Metodologia di implementazione del sistema per la spazializzazione dei dati meteo Metodologia di implementazione del sistema per la spazializzazione dei dati meteo . Metodologia Le reti di monitoraggio

Подробнее

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Подробнее

Filogenesi e alberi filogenetici. Darwin, 1837

Filogenesi e alberi filogenetici. Darwin, 1837 Filogenesi e alberi filogenetici Darwin, 1837 Definizione di filogenesi La filogenesi è lo studio delle relazioni evolutive tra entità biologiche (non solo specie) che condividono antenati comuni La sua

Подробнее

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Подробнее

ESPONENZIALE ED EQUAZIONI DIFFERENZIALI

ESPONENZIALE ED EQUAZIONI DIFFERENZIALI ESPONENZIALE ED EQUAZIONI DIFFERENZIALI Prerequisiti: Obiettivi: Piano cartesiano funzione esponenziale e rappresentazione sul piano cartesiano concetto di limite definizione di derivata differenziale

Подробнее

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Подробнее

SISTEMI LINEARI. x y + 2t = 0 2x + y + z t = 0 x z t = 0 ; S 3 : ; S 5x 2y z = 1 4x 7y = 3

SISTEMI LINEARI. x y + 2t = 0 2x + y + z t = 0 x z t = 0 ; S 3 : ; S 5x 2y z = 1 4x 7y = 3 SISTEMI LINEARI. Esercizi Esercizio. Verificare se (,, ) è soluzione del sistema x y + z = x + y z = 3. Trovare poi tutte le soluzioni del sistema. Esercizio. Scrivere un sistema lineare di 3 equazioni

Подробнее

RETI DI CONDOTTE PROBLEMI DI VERIFICA

RETI DI CONDOTTE PROBLEMI DI VERIFICA RETI DI CONDOTTE PROBLEMI DI VERIFICA Nei problemi che seguono, con il termine (D) si intende indicare la seguente quantità: γ(d) = 8λ D 5 gπ2 Dove λ è la funzione di resistenza, grandezza che in generale

Подробнее

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Подробнее

Corso di Matematica per la Chimica

Corso di Matematica per la Chimica Corso di Matematica per la Chimica Dott.ssa Maria Carmela De Bonis Dipartimento di Matematica, Informatica e Economia Università della Basilicata a.a. 2014-15 Propagazione degli errori introdotti nei dati

Подробнее

Luigi Piroddi

Luigi Piroddi Automazione industriale dispense del corso 9. Reti di Petri: analisi dinamica e metodi di riduzione Luigi Piroddi [email protected] Metodi di analisi di Reti di Petri Ci sono 2 modi per analizzare

Подробнее

IL CALCOLO DELLE PROBABILITA

IL CALCOLO DELLE PROBABILITA IL CALCOLO DELLE PROBABILITA INTRODUZIONE Già 3000 anni fa gli Egizi praticavano un antenato del gioco dei dadi, che si svolgeva lanciando una pietra. Il gioco dei dadi era diffuso anche nell antica Roma,

Подробнее

Caratterizzazione dei consumi energetici (parte 3)

Caratterizzazione dei consumi energetici (parte 3) ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale

Подробнее

ANALISI DELLE SERIE STORICHE

ANALISI DELLE SERIE STORICHE ANALISI DELLE SERIE STORICHE De Iaco S. [email protected] UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di

Подробнее

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in Scienze e Tecnologie Alimentari Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa

Подробнее

Introduzione ai grafi. Introduzione ai grafi p. 1/2

Introduzione ai grafi. Introduzione ai grafi p. 1/2 Introduzione ai grafi Introduzione ai grafi p. 1/2 Grafi Un grafo G é costituito da una coppia di insiemi (V,A) dove V é detto insieme dei nodi e A é detto insieme di archi ed é un sottinsieme di tutte

Подробнее

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con

Подробнее