Programmazione dinamica

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Programmazione dinamica"

Transcript

1 Programmazione dinamica Fornisce l allineamento ottimale tra due sequenze semplici variazioni dell algoritmo producono allineamenti globali o locali l allineamento calcolato dipende dalla scelta di alcuni parametri Sfrutta la ricorsione.. ogni risultato parziale dipende dal risultato del calcolo precedente del punteggio di allineamento registrato in una tabella. Quest ultima è utilizzata alla fine per ricostruire il percorso ottimale.

2 Needleman & Wunsch (1970) Allineamento globale Punteggio (odds score) di un allineamento sequenza 1 M - N A L S D R T sequenza 2 M G S D R T T E T punteggio = -5

3 Pairwise Sequence Alignment Esempio HEAGAWGHEE PAWHEAE HEAGAWGHE-E P-A--W-HEAE HEAGAWGHE-E --P-AW-HEAE Qual è il migliore?

4 Esempio A E H P W A E G H W Gap penalty: -8 HEAGAWGHE-E --P-AW-HEAE (-8) + (-8) + (-1) (-8) (-8) + 6 = 9 Esercizio: Calcolate per.. HEAGAWGHE-E P-A--W-HEAE La risposta è (-2)+(-8)+5+(-8)+(-8)+15+(-8)+10+6+(-8)+6 = 0

5 Global Alignment Notazione x i i-esimo elemento della sequenza x y j j-esimo elemento della sequenza y x 1..i Prefisso di x da 1 a i F matrice di score ottimali F(i,j) rappresenta l allineamento ottimale x 1..i con y 1..j d penalità s scoring matrix

6 Global Alignment Costruiamo F Inizializzo: F(0,0) = 0, F(i,0) = id, F(0,j)=jd Riempio da alto-sinistra verso il basso-destra usando la relazione ricorsiva + = d j i F d j i F y x s j i F j i F j i 1), ( ) 1, ( ), ( 1) 1, ( max ), (

7 Global Alignment y j allineata ad un gap Muoviti avanti su entrambe F(i-1,j-1) s(x i,y j ) F(i,j-1) d x i allineata ad un gap F(i-1,j) d F(i,j) Mentre si costruisce la tabella, si può tenere traccia del percorso ovvero quale direzione si prende (frecce di direzione inversa)

8 H E A G A W G H E E P A W H E A E Esempio Il primo step è quello di riempire i valori della tabella considerando una matrice di sostituzione (BLOSUM50 in questo caso) di appaiamento degli AA nella griglia) Matrice dei punteggi secondo BLOSUM50 degli appaiamenti tra AA GAP D = -8 Il secondo step prevede il riempimento della tabella ricorsivamente H E A G A W G H E E P A -16 W -24 H -32 E -40 A -48 E -56

9 H E A G A W G H E E P A W H E A E Tavola completata Matrice dei punteggi secondo BLOSUM50 degli appaiamenti tra AA GAP D = -8 H E A G A W G H E E P A W H E A E

10 Traceback H E A G A W G H E E P A W H E A E Percorso a ritroso seguendo le frecce: Il percorso parte sempre dall ultima casella Per definizione fino allo 0 Spostamenti: Diagonale entrambi Su gap in alto Sx gap in basso HEAGAWGHE-E --P-AW-HEAE

11 Sommario Inizializzazione valori tabella (-jd e id) Uso della ricorsione per riempire le caselle intermedie della tabella (programmazione dinamica) Traceback dall ultima casella (i,j) Uso di O(nm) spazio e tempo O(n 2 ) algoritmo Possibile per piccole sequenze ma non per interi genomi

12 Local Alignment Smith-Waterman (1981) Altra soluzione di programmazione dinamica molto simile ad allineamento globale nella costruzione tabella In questo caso viene introdotto lo 0 nel calcolo del punteggio delle caselle. Non si hanno mai valori negativi F( i, j) = F( i max 1, j 1) + F( i 1, j) F( i, 0 j 1) s( x d d i, y j )

13 Esempio H E A G A W G H E E P A W H E A E

14 Traceback H E A G A W G H E E P A W H Inizia dal punteggio più alto trovato nella tabella e ripercorre a ritroso da quella casella fino al primo 0 AWGHE AW-HE E A E

15 SOLUZIONI ALTERNATIVE Possono capitare soluzioni alternative nel caso di punteggio uguale in certe posizioni della tabella

16 ALTRO TIPO DI ALLINEAMENTO Il Freeshift o glocal Si utilizza quando ci si aspetta che una sequenza sia completamente contenuta in un altra oppure abbia un overlap. Quello che si vuole è un tipo di allineamento globale in cui non vengano penalizzati gli overhang terminali

17 Sequenza contenuta dentro un altra sequenza e con delle zone di overhang D L G P S S K S T G K G S I M R I W D N G M D I T K S A G K G A I M R L E M OVERLAP ZONE OVERHANG ZONE

18 Il problema si traduce nel partire dal punteggio massimo della matrice sull ultima colonna o riga e ripercorrere a ritroso fino alla fine (o prima riga o prima colonna) L inizializzazione della matrice e con il punteggio 0 come nel caso dell allineamento locale Il riempimento della matrice avviene, invece, con la regola dell allineamento globale H E A G A W G H E E Da qui il nome di allineamento g-local P A W H E HEAGAWGHEE PAW-HEAE A E

19 La ricerca di similarità in banche dati Uno dei problemi più comunemente affrontati con metodi bioinformatici è quello di trovare omologie di sequenza interrogando una banca dati. L idea di base è che proteine omologhe derivano da un progenitore comune e, quindi, condividono ampie regioni simili. Comparando la similarità tra la nostra sequenza (query) e tutte quelle contenute in una banca dati possiamo stimare la percentuale di similarità e da questa inferire una eventuale omologia (attenzione ai termini!!).

20 La ricerca di similarità in banche dati Quando le sequenze sono molto simili è ovvio assumere che sono anche omologhe, ma, nella maggior parte dei casi questo non si verifica quando bisogna confrontarsi con bassi livelli di similarità. In molti casi, tuttavia veri omologhi funzionali hanno bassi livelli di similarità e non è affatto facile discriminare falsi omologhi da veri omologhi. In mancanza di elementi funzionali la discriminazione tra veri e falsi omologhi si fonda su considerazioni statistiche. In sintesi sulla base della percentuale di similarità si assegna un punteggio ad ogni singolo appaiamento di sequenze e si valuta la probabilità di avere lo stesso punteggio per caso. Tanto più bassi sono i valori di probabilità tanto più significativo risulta l allineamento. Ci sono due grossi problemi da risolvere: Lo sviluppo di algoritmi capaci di identificare sequenze simili alla sequenza query tra milioni di sequenze target e la scelta di metodi statistisci a cui affidare la decisione di quali siano le sequenze significative. I principali programmi di interrogazione di banche dati, come FASTA, BLAST e SSEARCH si caratterizzano essenzialmente per l approccio a questi problemi.

21 La ricerca di similarità: accuratezza TP = positivi veri (il metodo dice che è omologa e in effetti corrisponde al vero) FP = falsi positivi (il metodo dice che è omologa quando invece non lo è) TN = negativi veri (il metodo dice che non è omologa e in effetti corrisponde al vero) FN = falsi negativi (il metodo dice che non è omologa quando invece lo è) (TP+FN) = effettivi positivi nella banca dati (TP+FP) = positivi predetti dal metodo falsi e veri È omologa? Sì No Predetta come omologa? Sì No TP FN FP TN

22 La ricerca di similarità: accuratezza Sensibilità = TP / (TP + FN) è la percentuale di esempi predetti correttamente dal metodo sulla totalità di quelli che sono realmente presenti in banca dati. Selettività = TP / (TP + FP) è la percentuale di volte in cui la predizione positiva si rivela corretta. Specificità = TN / (TN + FP) è la percentuale di esempi predetti come negativi sul totale di quelli effettivamente negativi Esempio: Omologia reale tra proteine: (A, B, C), (D, E), (F, G, H) Predizione: A B, C B C C A, E D B E B F A, H G F H F, G Risultati: TP = 8 FP = 4 FN = 6 TN = molti Sens = 8 / (8+6) = 0.57 Sel = 8 / (8+4) = 0.66

23 La ricerca di similarità: accuratezza Sel. = TP / (TP + FP) Sens.= TP / (TP + FN) In genere ad ogni predizione è affiancata una stima di affidabilità. I valori di sensibilità e selettività si calcolano soltanto per quelle predizioni che superano un valore minimo di affidabilità (threshold, soglia). La scelta della soglia e fatta su basi statistiche ed e determinante. In generale i metodi cercano un compromesso per cui: Alta sensibilità bassa selettività e viceversa In base alla soglia scelta si possono ottenere valori di sensibilità e selettività molto diversi tra di loro. Per questo entrambi i valori vanno riferiti allo stesso valore di soglia per poter essere paragonati. Esempio: Omologia reale tra proteine: (A, B, C), (D, E), (F, G, H) A B, C 10 B C 5 C A, E 10 D B 5 E B 5 F A, H 15 G F 5 H F, G 15 Soglia >= 5: TP = 8 FP = 4 FN = 6 Sens = 0.57 Sel = 0.66 Soglia >= 10: TP = 6 FP = 2 FN = 8 Sens = 0.42 Sel = 0.75 Soglia >= 15: TP = 3 FP = 1 FN = 11 Sens = 0.21 Sel = 0.75

24 La ricerca di similarità: accuratezza Alternativa: ROC (receiver operator characteristic) Grafico che rappresenta l andamento della sensibilità in base alla selettività, basato su soglia mobile. Permette di visualizzare tutte le combinazioni contemporaneamente. Intuitivamente, il metodo A funziona meglio di quello B se ha una curva con valori sempre maggiori dell altro. In termini matematici si può calcolare l area sotto la curva (valore AUC = area under curve) per quantificare la performance dei metodi.

25 La ricerca di similarità: i metodi Pairwise alignment allineamenti a coppie 1. Analisi della matrice a punti (dot matrix) 2. Programmazione dinamica (dynamic programming) allineamenti locale e globale. algoritmi che trovano la soluzione ottima. 3. Metodo delle n-tuple (Fasta, Blast) le banche dati crescono a dismisura e gli algoritmi ottimi sono computazionalmente molto lunghi. Compromesso tra velocità e precisione per avvicinarsi alla soluzione ottima ideale. In questo caso si parla di euristica. I metodi delle n-ple sono difficili da quantificare in complessità di calcolo ma in generale l ordine passa da O(n 2 ) a O(n).

26 FASTA FASTA è un programma che cerca similarità locali utilizzando l algoritmo di Pearson e Lipman La sua strategia è quella di suddividere la sequenza query in tante sottosequenze lunghe 1 o 2 amminoacidi (parole). Il passo seguente è quello di suddivere tutte le sequenze della banca dati in sequenze di stessa lunghezza e di calcolare la posizione delle varie parole in tutte le sequenze. Per velocizzare i calcoli il programma ha già preparato una tabella con tutte le possibili combinazioni di due o tre amminoacidi ( 20 x 20 = 400 combinazioni) e calcola il numero e la posizione delle varie parole che compongono ogni singola sequenza. Per esempio data una query di sequenza: MAPESRTGSAATATSTD MA AP PE ES.. e una libreria di n sequenze avremo: 1) LCSPAPATREYFELFARIGIDKK 2) ETAHGSAATATWKLINCV n) parola 1 2 n MA - - AP 5 - PE - - ES - - SR - - RT - - TG - GS - 5 SA - 6 AA - 7 AT 7 8,10 TA - 2,9 AT - 10 TS - - ST - - ecc.

27 FASTA Subito dopo FASTA si preoccupa di calcolare il cosiddetto offset. Dopo aver determinato tutte le parole in comune tra la sequenza query e tutte le altre sequenze della banca dati, si preoccupa di determinarne le posizioni relative, per identificare quelle con amminoacidi comuni in un allineamento senza interruzioni. In pratica calcola la differenza tra le posizioni parole nella query e quelle corrispondenti in ciascuna delle sequenze della banca dati. parola query 1 2 n offset 1 offset 2 offset n (1-query) (2-query) (n-query) MA AP PE ES SR 5 RT TG 7 GS SA AA AT , , -1 TA 12-2, , -3 AT TS ST

28 FASTA Siccome nella tabella di offset, a valori uguali corrispondono amminoacidi allineati, si possono costruire allineamenti di proteine Query MAPESR TGSA ATATSTD Sequenza 2 ETAHGSA ATATWKLINCV Utilizzando opportune matrici di sostituzione, come BLOSUM 62 o PAM 240, si possono assegnare valori numerici ai vari allineamenti, scegliere le 10 regioni con i valori più alti e sommarle insieme ottenendo il valore chiamato init1. Tutti i valori di init1 vengono ordinati per valori decrescenti e i migliori vengono utilizzati per l analisi successiva E possibile introdurre gaps o inserzioni per allungare l estensione dell allineamento pagando delle penalizzazioni ( il punteggio init1 si abbassa ) Query PK---MAPESR TGSA ATATSTD--- N -V Sequenza 2 PKACVVMETAHGSA ATATWKLINCV I nuovi valori vengono ricalcolati con le stesse procedure e la somma dei nuovi dieci valori è chiamata initn. Ancora una volta i valori di initn vengono ordinati per valori decrescenti dal migliore al peggiore. I migliori valori, infine, vengono allineati alla sequenza query con un algoritmo di allineamento globale e i punteggi finali sono indicati opt.

29 FASTA a) Ricerca parole identiche tra le due seq. b) Ricerca diagonali (k-ple sulla stessa diagonale sono considerate parte dell allineamento senza gap se non distano troppo per un parametro fissato). Calcolo di init1 con le matrici solo i 10 più alti sono classificati ed il più alto utilizzato c) Allungamento con gap e calcolo di initn. Questa ricongiunzione viene effettuata se la penalità di ricongiungimento, proporzionale alla distanza tra le regioni di similarità, é inferiore al contributo dato al punteggio di similarità dalla regione di similarità che viene ricongiunta nell'allineamento. d) Nella quarta ed ultima fase, l'allineamento precedentemente ottenuto viene ulteriormente ottimizzato utilizzando la procedura di allineamento descritta da Chao et al. (1992) che utilizza un algoritmo per l'allineamento di due sequenze all'interno di una banda diagonale di dimensioni predeterminate. Il punteggio di similarità calcolato in questa ultima fase viene denominato punteggio opt.

30 Dopo aver calcolato i punteggi finali (opt) FASTA elabora i risultati per stimare la significatività statistica dei risultati operando come segue: Genera un numero statisticamente significativo di combinazioni di sequenze con la stessa lunghezza e la stessa composizione amminoacidica della sequenza query Per ciascuna di esse lancia un FASTA contro un subset della banca dati Calcola la media (mu µ), la deviazione standard (rho σ), assumendo che i valori si distribuiscano in modo normale (cioè con una distribuzione casuale di Poisson) Confronta i valori opt ottenuti con il valore medio della distribuzione ricavandone la probabilità di avere quel particolare valore di opt per caso

31 Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev. Standard si discosta (4 indica già che siamo fuori della distribuzione) Deviazione standard è l indice di dispersione della distribuzione σ = ( x µ) N 2

32 E-value E(S) Effettuate le prove di raccolta dei punteggi otterremo una distribuzione simile a quella normale ma che in realtà si chiama distribuzione dei valori estremi (Gumbel distribution o EVD) A Yev X Se si vuole sapere quanto significativo è il punteggio ottenuto dal mio allineamento reale in confronto alla distribuzione ottenuta secondo quanto detto prima, allora si ricorre all Evalue che indica: Il numero di differenti allineamenti con uno score (x) equivalente o migliore di quello ottenuto dal mio allineamento (chiamato S) che possono capitare per caso in una ricerca in database. Più basso è tale valore e più significativo è il mio allineamento K e λ dipendono dalla banca dati e dalla λs E( x S) E( S) = kmne sua grandezza (e FASTA li calcola) m e n sono le lunghezze delle due sequenze. S è il punteggio del mio allineamento

33 Bit-score Il bit-score consente di mettere in relazione diretta ricerche effettuate in banche dati di grandezze diverse dato che non dipende dai parametri λ e K come invece lo è il raw score. Sono così confrontabili due ricerche in banche dati diverse. Il bit-score si ricava dal punteggio grezzo S (raw score), si definisce come S e si normalizza come segue: Da cui deriva che l E-value è: S ln K S' = λ ln 2 E = mn2 S ' E dipende solo dai parametri di lunghezza delle sequenze. Esiste infine un altra misura che è il P-value molto simile all E-value

34

35

La ricerca di similarità in banche dati

La ricerca di similarità in banche dati La ricerca di similarità in banche dati Uno dei problemi più comunemente affrontati con metodi bioinformatici è quello di trovare omologie di sequenza interrogando una banca dati. L idea di base è che

Dettagli

La ricerca di similarità: i metodi

La ricerca di similarità: i metodi La ricerca di similarità: i metodi Pairwise alignment allineamenti a coppie 1. Analisi della matrice a punti (dot matrix) 2. Programmazione dinamica (dynamic programming) allineamenti locale e globale.

Dettagli

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni

Dettagli

BLAST. W = word size T = threshold X = elongation S = HSP threshold

BLAST. W = word size T = threshold X = elongation S = HSP threshold BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query

Dettagli

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.

Dettagli

FASTA. Lezione del

FASTA. Lezione del FASTA Lezione del 10.03.2016 Omologia vs Similarità Quando si confrontano due sequenze o strutture si usano spesso indifferentemente i termini somiglianza o omologia per indicare che esiste un rapporto

Dettagli

ALLINEAMENTO DI SEQUENZE

ALLINEAMENTO DI SEQUENZE ALLINEAMENTO DI SEQUENZE Procedura per comparare due o piu sequenze, volta a stabilire un insieme di relazioni biunivoche tra coppie di residui delle sequenze considerate che massimizzino la similarita

Dettagli

Algoritmi di Allineamento

Algoritmi di Allineamento Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento

Dettagli

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente

Dettagli

Ricerca di omologia di sequenza

Ricerca di omologia di sequenza Ricerca di omologia di sequenza RICERCA DI OMOLOGIA DI SEQUENZA := Data una sequenza (query), una banca dati, un sistema per il confronto e una soglia statistica trovare le sequenze della banca più somiglianti

Dettagli

Le sequenze consenso

Le sequenze consenso Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche)

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche) Docente: Matteo Re UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2013-2014 semestre I 3 Allineamento veloce (euristiche) Banche dati primarie e secondarie Esistono due categorie

Dettagli

Luigi Santoro. Hyperphar Group S.p.A., MIlano

Luigi Santoro. Hyperphar Group S.p.A., MIlano Come modellare il rischio Luigi Santoro Hyperphar Group S.p.A., MIlano Gli argomenti discussi Le definizioni del termine rischio L utilità di un modello predittivo di rischio Come costruire modelli predittivi

Dettagli

Allineamenti di sequenze: concetti e algoritmi

Allineamenti di sequenze: concetti e algoritmi Allineamenti di sequenze: concetti e algoritmi 1 globine: a- b- mioglobina Precoce esempio di allineamento di sequenza: globine (1961) H.C. Watson and J.C. Kendrew, Comparison Between the Amino-Acid Sequences

Dettagli

Quanti soggetti devono essere selezionati?

Quanti soggetti devono essere selezionati? Quanti soggetti devono essere selezionati? Determinare una appropriata numerosità campionaria già in fase di disegno dello studio molto importante è molto Studi basati su campioni troppo piccoli non hanno

Dettagli

Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici

Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici CAPITOLO 6 LE VARIABILITA CASUALI E LE DISTRIBUZIONI DI PROBABILITA VERO FALSO 1. V F La probabilità che X assuma un valore compreso tra 3 e 4 incluso può essere scritto come P(3

Dettagli

Omologia di sequenze: allineamento e ricerca

Omologia di sequenze: allineamento e ricerca Omologia di sequenze: allineamento e ricerca Genomi (organismi) e geni hanno un evoluzione divergente Sequenze imparentate per evoluzione divergente sono omologhe Le sequenze sono confrontabili tramite

Dettagli

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente: CAPITOLO TERZO VARIABILI CASUALI. Le variabili casuali e la loro distribuzione di probabilità In molte situazioni, dato uno spazio di probabilità S, si è interessati non tanto agli eventi elementari (o

Dettagli

q xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0;

q xi Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p i >0; Modelli probabilis-ci Lanciando un dado abbiamo sei parametri p1 p6 p i >0; 6! i=1 p i =1 Sequenza di dna/proteine x con probabilita q x Probabilita dell intera sequenza n " i!1 q xi Massima verosimiglianza

Dettagli

Allineamento e similarità di sequenze

Allineamento e similarità di sequenze Allineamento e similarità di sequenze Allineamento di Sequenze L allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; La similarità

Dettagli

Elementi di Algebra Lineare Matrici e Sistemi di Equazioni Lineari

Elementi di Algebra Lineare Matrici e Sistemi di Equazioni Lineari Elementi di Algebra Lineare Matrici e Sistemi di Equazioni Lineari Antonio Lanteri e Cristina Turrini UNIMI - 2016/2017 Antonio Lanteri e Cristina Turrini (UNIMI - 2016/2017 Elementi di Algebra Lineare

Dettagli

ISTOGRAMMI E DISTRIBUZIONI:

ISTOGRAMMI E DISTRIBUZIONI: ISTOGRAMMI E DISTRIBUZIONI: i 3 4 5 6 7 8 9 0 i 0. 8.5 3 0 9.5 7 9.8 8.6 8. bin (=.) 5-7. 7.-9.4 n k 3 n k 6 5 n=0 =. 9.4-.6 5 4.6-3.8 3 Numero di misure nell intervallo 0 0 4 6 8 0 4 6 8 30 ISTOGRAMMI

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17

Dettagli

Lezione 6. Analisi di sequenze biologiche e ricerche in database

Lezione 6. Analisi di sequenze biologiche e ricerche in database Lezione 6 Analisi di sequenze biologiche e ricerche in database Schema della lezione Allinemento: definizioni Allineamento di due sequenze Ricerca di singola sequenza in banche dati (Alignment-based database

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Corso di Visione Artificiale. Texture. Samuel Rota Bulò

Corso di Visione Artificiale. Texture. Samuel Rota Bulò Corso di Visione Artificiale Texture Samuel Rota Bulò Texture Le texture sono facili da riconoscere ma difficili da definire. Texture Il fatto di essere una texture dipende dal livello di scala a cui si

Dettagli

Note per la Lezione 6 Ugo Vaccaro

Note per la Lezione 6 Ugo Vaccaro Progettazione di Algoritmi Anno Accademico 2016 2017 Note per la Lezione 6 Ugo Vaccaro Ancora sulla tecnica Programmazione Dinamica Nella lezione scorsa abbiamo appreso che la tecnica Divide-et-Impera,

Dettagli

Allineamenti a coppie

Allineamenti a coppie Laboratorio di Bioinformatica I Allineamenti a coppie Dott. Sergio Marin Vargas (2014 / 2015) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Il sito http://myhits.isb-sib.ch/cgi-bin/dotlet

Dettagli

L'implementazione delle ROC Curve nei modelli GAMLSS come strumento di previsione per i Big Data

L'implementazione delle ROC Curve nei modelli GAMLSS come strumento di previsione per i Big Data L'implementazione delle ROC Curve nei modelli GAMLSS come strumento di previsione per i Big Data Paolo Mariani, Andrea Marletta Dipartimento di Economia, Metodi Quantitativi e Strategie di Impresa, Università

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

Programmazione dinamica

Programmazione dinamica Programmazione dinamica Violetta Lonati Università degli studi di Milano Dipartimento di Informatica Laboratorio di algoritmi e strutture dati Corso di laurea in Informatica Violetta Lonati Programmazione

Dettagli

Stima della qualità dei classificatori per l analisi dei dati biomolecolari

Stima della qualità dei classificatori per l analisi dei dati biomolecolari Stima della qualità dei classificatori per l analisi dei dati biomolecolari Giorgio Valentini e-mail: valentini@dsi.unimi.it Rischio atteso e rischio empirico L` apprendimento di una funzione non nota

Dettagli

Sismica a Rifrazione: fondamenti. Sismica rifrazione - Michele Pipan

Sismica a Rifrazione: fondamenti. Sismica rifrazione - Michele Pipan Sismica a Rifrazione: fondamenti 1 Sismica a Rifrazione: fondamenti Onde P ed S (2) Velocita delle Onde P: Velocita delle Onde S : Definiamo poi il rapporto di Poisson σ come 2 λ Sismica a Rifrazione:

Dettagli

Proprietà della varianza

Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,

Dettagli

Valutazione dei test diagnostici

Valutazione dei test diagnostici Valutazione dei test diagnostici Maria Miceli M. Miceli 2011 1 Diagnosi individuale (test di laboratorio) Esame collaterale nell ambito dell iter diagnostico condotto generalmente su animali sintomatici

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni:

Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni: Lezione 2 (10/03/2010): Allineamento di sequenze (parte 1) Antonella Meloni: antonella.meloni@ifc.cnr.it Sequenza A= stringa formata da N simboli, dove i simboli apparterranno ad un certo alfabeto. A

Dettagli

Una Libreria di Algebra Lineare per il Calcolo Scientifico

Una Libreria di Algebra Lineare per il Calcolo Scientifico Una Libreria di Algebra Lineare per il Calcolo Scientifico Introduzione Il Lavoro di Tesi Introduzione al Metodo Ridurre l Occupazione di Memoria Metodo di Memorizzazione degli Elementi Risultati Attesi

Dettagli

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche InfoBioLab I ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche Esercizio 1 - obiettivi: Ricerca di 2 proteine in ENTREZ Salva i flat file che descrivono le 2 proteine in formato testo Importa

Dettagli

PAROLE CHIAVE Accuratezza, Accuracy, Esattezza, PRECISIONE, Precision, Ripetibilità, Affidabilità, Reliability, Scarto quadratico medio (sqm), Errore

PAROLE CHIAVE Accuratezza, Accuracy, Esattezza, PRECISIONE, Precision, Ripetibilità, Affidabilità, Reliability, Scarto quadratico medio (sqm), Errore PAROLE CHIAVE Accuratezza, Accuracy, Esattezza, PRECISIONE, Precision, Ripetibilità, Affidabilità, Reliability, Scarto quadratico medio (sqm), Errore medio, Errore quadratico medio (eqm), Deviazione standard,

Dettagli

Albero di Riscorsione

Albero di Riscorsione Albero di Riscorsione Albero di ricorsione Un albero di ricorsione è un modo di visualizzare cosa accade in un algoritmo divide et impera L etichetta della radice rappresenta il costo non ricorsivo della

Dettagli

Carte di controllo CUSUM. Le carte a somme cumulate risultano utili quando occorre individuare scostamenti dal valore centrale di piccola entità.

Carte di controllo CUSUM. Le carte a somme cumulate risultano utili quando occorre individuare scostamenti dal valore centrale di piccola entità. Carte di controllo CUSUM Le carte a somme cumulate risultano utili quando occorre individuare scostamenti dal valore centrale di piccola entità. Le carte Shewart utilizzano le informazioni solo dell ultimo

Dettagli

PROBABILITA. Distribuzione di probabilità

PROBABILITA. Distribuzione di probabilità DISTRIBUZIONI di PROBABILITA Distribuzione di probabilità Si definisce distribuzione di probabilità il valore delle probabilità associate a tutti gli eventi possibili connessi ad un certo numero di prove

Dettagli

Lezione 7. Allineamento di sequenze biologiche

Lezione 7. Allineamento di sequenze biologiche Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra

Dettagli

Attività Precedenze Tempo (gg) A - 5 B - 10 C A 3 D B 2 E B 4 F C, D 6 G F, E 3

Attività Precedenze Tempo (gg) A - 5 B - 10 C A 3 D B 2 E B 4 F C, D 6 G F, E 3 Partiamo da un Esempio per il calcolo CPM Si parte da una tabella dove si riporta l elenco di tutte le attività da svolgere e vi si esplicitano le relazioni di precedenza tra di esse e i tempi per il loro

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Classificazione: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Introduzione

Dettagli

Bioinformatica ed applicazioni di bioinformatica strutturale!

Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica! Le banche dati! Programmi per estrarre ed analizzare i dati! I numeri! Cellule nell uomo! Geni nell uomo! Genoma umano Il dogma

Dettagli

Esercitazione di Calcolo Numerico 1 22 Aprile Determinare la fattorizzazione LU della matrice a 1 1 A = 3a 2 a 2a a a 2 A =

Esercitazione di Calcolo Numerico 1 22 Aprile Determinare la fattorizzazione LU della matrice a 1 1 A = 3a 2 a 2a a a 2 A = Esercitazione di Calcolo Numerico 22 Aprile 29. Determinare la fattorizzazione LU della matrice a A = 3a 2 a 2a a a 2 ed utilizzarla per calcolare il det(a). 2. Calcolare il determinante della matrice

Dettagli

PROCEDURE DI CALCOLO DELLA COMBINAZIONE DEGLI INERTI REALI

PROCEDURE DI CALCOLO DELLA COMBINAZIONE DEGLI INERTI REALI PROCEDURE DI CALCOLO DELLA COMBINAZIONE DEGLI INERTI REALI Non esistono già disponibili in natura materiali lapidei con distribuzione granulometrica eguale a quella ideale richiesta per un inerte da destinare

Dettagli

Corso di Bioinformatica

Corso di Bioinformatica Corso di Bioinformatica Cortona - Novembre 2002 Metodi Computazionali per l'analisi delle sequenze Dr. Sabino Liuni Istituto di Tecnologie Biomediche- CNR Sezione di Bioinformatica e Genomica - Bari Sabino@area.ba

Dettagli

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Indicatori [1/4] Gli indicatori: sintetizzano le caratteristiche di un fenomeno colgono aspetti e problemi del fenomeno che non hanno una immediata

Dettagli

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si

Dettagli

Argomenti Capitolo 1 Richiami

Argomenti Capitolo 1 Richiami Argomenti Capitolo 1 Richiami L insieme dei numeri reali R si rappresenta geometricamente con l insieme dei punti di una retta orientata su cui sia stato fissato un punto 0 e un segmento unitario. L insieme

Dettagli

Laboratorio di Algoritmi e Strutture Dati

Laboratorio di Algoritmi e Strutture Dati Laboratorio di Algoritmi e Strutture Dati Docente: Camillo Fiorentini 8 gennaio 8 Il problema è simile all esercizio 5.6 del libro di testo di algoritmi (Introduzione agli algoritmi e strutture dati, T.

Dettagli

Distanza di Edit. Speaker: Antinisca Di Marco Data:

Distanza di Edit. Speaker: Antinisca Di Marco Data: Distanza di Edit Speaker: Antinisca Di Marco Data: 14-04-2016 Confronto di sequenze Il confronto tra sequenze in biologia computazionale è la base per: misurare la similarità tra le sequenze allineamento

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

La distribuzione delle frequenze. T 10 (s)

La distribuzione delle frequenze. T 10 (s) 1 La distribuzione delle frequenze Si vuole misurare il periodo di oscillazione di un pendolo costituito da una sferetta metallica agganciata a un filo (fig. 1). A Figura 1 B Ricordiamo che il periodo

Dettagli

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia Variabili aleatorie discrete Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia 2015-16 1 / 45 Variabili aleatorie Una variabile aleatoria è simile a una variabile statistica Una variabile

Dettagli

Metodi per la risoluzione di sistemi lineari

Metodi per la risoluzione di sistemi lineari Metodi per la risoluzione di sistemi lineari Sistemi di equazioni lineari. Rango di matrici Come è noto (vedi [] sez.0.8), ad ogni matrice quadrata A è associato un numero reale det(a) detto determinante

Dettagli

Sistemi di numerazione

Sistemi di numerazione Sistemi di numerazione Introduzione Un sistema di numerazione è un sistema utilizzato per esprimere i numeri e possibilmente alcune operazioni che si possono effettuare su di essi. Storicamente i sistemi

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I 1 INTRODUZIONE

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I 1 INTRODUZIONE Docente: Matteo Re UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2013-2014 semestre I 1 INTRODUZIONE Motivazioni dell esistenza della biologia computazionale: Biologia Computazionale

Dettagli

Codifica binaria. Rappresentazioni medianti basi diverse

Codifica binaria. Rappresentazioni medianti basi diverse Codifica binaria Rappresentazione di numeri Notazione di tipo posizionale (come la notazione decimale). Ogni numero è rappresentato da una sequenza di simboli Il valore del numero dipende non solo dalla

Dettagli

La statistica e i test diagnostici

La statistica e i test diagnostici La statistica e i test diagnostici Laura Ventura Dipartimento di Scienze Statistiche Università degli Studi di Padova ventura@stat.unipd.it XXIII Settimana della Cultura Scientifica e Tecnologica Liceo

Dettagli

Universita degli Studi di Siena

Universita degli Studi di Siena Universita degli Studi di Siena Facolta di Ingegneria Dispense del corso di Sistemi di Supporto alle Decisioni I La Programmazione Dinamica Chiara Mocenni Corso di Laurea triennale in Ingegneria Gestionale

Dettagli

Vedi: Probabilità e cenni di statistica

Vedi:  Probabilità e cenni di statistica Vedi: http://www.df.unipi.it/~andreozz/labcia.html Probabilità e cenni di statistica Funzione di distribuzione discreta Istogrammi e normalizzazione Distribuzioni continue Nel caso continuo la probabilità

Dettagli

Operazioni tra matrici e n-uple

Operazioni tra matrici e n-uple CAPITOLO Operazioni tra matrici e n-uple Esercizio.. Date le matrici 0 4 e dati λ = 5, µ =, si calcoli AB, BA, A+B, B A, λa+µb. Esercizio.. Per ognuna delle seguenti coppie di matrici A, B e scalari λ,

Dettagli

Valutazione delle Prestazioni di un Classificatore. Performance Evaluation

Valutazione delle Prestazioni di un Classificatore. Performance Evaluation Valutazione delle Prestazioni di un Classificatore Performance Evaluation Valutazione delle Prestazioni Una volta appreso un classificatore è di fondamentale importanza valutarne le prestazioni La valutazione

Dettagli

Teorema del Limite Centrale

Teorema del Limite Centrale Teorema del Limite Centrale Problema. Determinare come la media campionaria x e la deviazione standard campionaria s misurano la media µ e la deviazione standard σ della popolazione. È data una popolazione

Dettagli

Arithmetic and Logic Unit e moltiplicatore

Arithmetic and Logic Unit e moltiplicatore Arithmetic and Logic Unit e moltiplicatore M. Favalli Engineering Department in Ferrara (ENDIF) ALU - multiplier Analisiesintesideicircuitidigitali 1 / 34 Sommario 1 Arithmetic and Logic Unit - ALU 2 Moltiplicatore

Dettagli

L errore percentuale di una misura è l errore relativo moltiplicato per 100 ed espresso in percentuale. Si indica con e p e risulta: e ( e 100)%

L errore percentuale di una misura è l errore relativo moltiplicato per 100 ed espresso in percentuale. Si indica con e p e risulta: e ( e 100)% UNITÀ L ELBORZIONE DEI DTI IN FISIC 1. Gli errori di misura.. Errori di sensibilità, errori casuali, errori sistematici. 3. La stima dell errore. 4. La media, la semidispersione e lo scarto quadratico

Dettagli

Variabili aleatorie. Variabili aleatorie e variabili statistiche

Variabili aleatorie. Variabili aleatorie e variabili statistiche Variabili aleatorie Variabili aleatorie e variabili statistiche Nelle prime lezioni, abbiamo visto il concetto di variabile statistica : Un oggetto o evento del mondo reale veniva associato a una certa

Dettagli

Risoluzione di problemi ingegneristici con Excel

Risoluzione di problemi ingegneristici con Excel Risoluzione di problemi ingegneristici con Excel Problemi Ingegneristici Calcolare per via numerica le radici di un equazione Trovare l equazione che lega un set di dati ottenuti empiricamente (fitting

Dettagli

Strumenti di indagine per la valutazione psicologica

Strumenti di indagine per la valutazione psicologica Strumenti di indagine per la valutazione psicologica 2.3 Validazione di un test clinico Davide Massidda davide.massidda@gmail.com Definire un cut-off Per ogni scala del questionario, sommando o mediando

Dettagli

Programmazione dinamica

Programmazione dinamica Programmazione dinamica Ilaria Castelli castelli@dii.unisi.it Università degli Studi di Siena Dipartimento di Ingegneria dell Informazione A.A. 29/21 I. Castelli Programmazione dinamica, A.A. 29/21 1/35

Dettagli

λ è detto intensità e rappresenta il numero di eventi che si

λ è detto intensità e rappresenta il numero di eventi che si ESERCITAZIONE N 1 STUDIO DI UN SISTEMA DI CODA M/M/1 1. Introduzione Per poter studiare un sistema di coda occorre necessariamente simulare gli arrivi, le partenze e i tempi di ingresso nel sistema e di

Dettagli

Anno 4 Matrice inversa

Anno 4 Matrice inversa Anno 4 Matrice inversa 1 Introduzione In questa lezione parleremo della matrice inversa di una matrice quadrata: definizione metodo per individuarla Al termine della lezione sarai in grado di: descrivere

Dettagli

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi

Dettagli

X ~ N (20, 16) Soluzione

X ~ N (20, 16) Soluzione ESERCIZIO 3.1 Il tempo di reazione ad un esperimento psicologico effettuato su un gruppo di individui si distribuisce normalmente con media µ = 20 secondi e scarto quadratico medio σ = 4 secondi: X ~ N

Dettagli

Algoritmi e Strutture Dati

Algoritmi e Strutture Dati Algoritmi Ricorsivi e Maria Rita Di Berardini, Emanuela Merelli 1 1 Dipartimento di Matematica e Informatica Università di Camerino A.A. 2006/07 I conigli di Fibonacci Ricerca Binaria L isola dei conigli

Dettagli

Errori di misura Teoria

Errori di misura Teoria Errori di misura Teoria a misura operazione di misura di una grandezza fisica, anche se eseguita con uno strumento precisissimo e con tecniche e procedimenti accurati, è sempre affetta da errori. Gli errori

Dettagli

Elementi di Psicometria

Elementi di Psicometria Elementi di Psicometria 7-Punti z e punti T vers. 1.0a (21 marzo 2011) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia)

Dettagli

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

SCHEDA N 8 DEL LABORATORIO DI FISICA

SCHEDA N 8 DEL LABORATORIO DI FISICA SCHEDA N 1 IL PENDOLO SEMPLICE SCHEDA N 8 DEL LABORATORIO DI FISICA Scopo dell'esperimento. Determinare il periodo di oscillazione di un pendolo semplice. Applicare le nozioni sugli errori di una grandezza

Dettagli

Lecture 18. Text: Motori Aeronautici Mar. 26, Mauro Valorani Università La Sapienza. Analisi dimensionale delle turbomacchine

Lecture 18. Text: Motori Aeronautici Mar. 26, Mauro Valorani Università La Sapienza. Analisi dimensionale delle turbomacchine Lecture 18 Analisi Text: Motori Aeronautici Mar. 26, 2015 Analisi Mauro Valorani Università La Sapienza 18.331 Agenda Analisi 1 Numero di giri e 18.332 Analisi L analisi e il confronto tra le turbomacchine

Dettagli

Esercitazione: La distribuzione NORMALE

Esercitazione: La distribuzione NORMALE Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle

Dettagli

curves (ordinary ROC)

curves (ordinary ROC) CURVE ROC Ordinary ROC Frequency ROC Expected Utility ROC (O-ROC) (F-ROC) (EU-ROC) O-ROC curves (ordinary ROC) 1 Le coordinate di ogni punto della curva sono il tasso di veri positivi pari alla sensibilità

Dettagli

tabelle grafici misure di

tabelle grafici misure di Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine

Dettagli

CAPITOLO V. DATABASE: Il modello relazionale

CAPITOLO V. DATABASE: Il modello relazionale CAPITOLO V DATABASE: Il modello relazionale Il modello relazionale offre una rappresentazione matematica dei dati basata sul concetto di relazione normalizzata. I principi del modello relazionale furono

Dettagli

Matematica per Analisi dei Dati,

Matematica per Analisi dei Dati, Matematica per Analisi dei Dati, 230209 1 Spazio vettoriale R n Sia n un intero positivo fissato Lo spazio vettoriale R n e l insieme delle n ple ordinate di numeri reali, che rappresenteremo sempre come

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

C.I. di Metodologia clinica

C.I. di Metodologia clinica C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni

Dettagli

Lezione 7. Allineamento di sequenze biologiche

Lezione 7. Allineamento di sequenze biologiche Lezione 7 Allineamento di sequenze biologiche Allineamento di sequenze Determinare la similarità e dedurre l omologia Allineare Definire il numero di passi necessari per trasformare una sequenza nell altra

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

Il ragionamento diagnostico

Il ragionamento diagnostico Il ragionamento diagnostico 1 l accertamento della condizione patologica viene eseguito All'inizio del decorso clinico, per una prima diagnosi In qualsiasi punto del decorso clinico, per conoscere lo stato

Dettagli

SISTEMI LINEARI MATRICI E SISTEMI 1

SISTEMI LINEARI MATRICI E SISTEMI 1 MATRICI E SISTEMI SISTEMI LINEARI Sistemi lineari e forma matriciale (definizioni e risoluzione). Teorema di Rouché-Capelli. Sistemi lineari parametrici. Esercizio Risolvere il sistema omogeneo la cui

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Modello computazionale per la predizione di siti di legame per fattori di trascrizione

Modello computazionale per la predizione di siti di legame per fattori di trascrizione Modello computazionale per la predizione di siti di legame per fattori di trascrizione Attività di tirocinio svolto presso il Telethon Institute of Genetics and Medicine Relatori Prof. Giuseppe Trautteur

Dettagli

ALLINEAMENTO DI SEQUENZE

ALLINEAMENTO DI SEQUENZE ALLINEAMENTO DI SEQUENZE Gli obiettivi degli algoritmi di allineamento di sequenze di acidi nucleici o proteine sono molteplici. Possiamo ricordare la ricerca di similarità nelle banche dati, la costruzione

Dettagli