Metodi Numerici per la Bioinformatica



Documenti analoghi
Un problema! La letteratura riporta che i pazienti affetti da cancro. = mesi

Il test parametrico si costruisce in tre passi:

Metodi statistici per l analisi dei dati

CONCETTI BASE DI STATISTICA

DEFINIZIONE PROCESSO LOGICO E OPERATIVO MEDIANTE IL QUALE, SULLA BASE

Capitolo. Il comportamento dei sistemi in regime transitorio. 5.8 Esercizi - Risposta al gradino dei sistemi del 2 ordine reazionati e non reazionati

Successioni. Grafico di una successione

LA VERIFICA DELLE IPOTESI SUI PARAMETRI

1 Limiti di successioni

V Tutorato 6 Novembre 2014

Serie numeriche: esercizi svolti

Esercitazioni di Statistica

SUCCESSIONI E SERIE NUMERICHE

5 ln n + ln. 4 ln n + ln. 6 ln n + ln

Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2014/15. Complementi di Probabilità e Statistica. Prova scritta del del

STATISTICA INFERENZIALE SCHEDA N. 2 INTERVALLI DI CONFIDENZA PER IL VALORE ATTESO E LA FREQUENZA

Anno 5 Successioni numeriche

52. Se in una città ci fosse un medico ogni 500 abitanti, quale sarebbe la percentuale di medici? A) 5 % B) 2 % C) 0,2 % D) 0,5% E) 0,02%

Statistica 1 A.A. 2015/2016

Formula per la determinazione della Successione generalizzata di Fibonacci.

Statistica (Prof. Capitanio) Alcuni esercizi tratti da prove scritte d esame

Errori di misura. è ragionevole assumere che una buona stima del valore vero sia la media

Le carte di controllo

Esercizi riguardanti limiti di successioni

Numerazione binaria Pagina 2 di 9 easy matematica di Adolfo Scimone

LA GESTIONE DELLA QUALITA : IL TOTAL QUALITY MANAGEMENT

Successioni. Capitolo Definizione

Foglio di esercizi N. 1 - Soluzioni

Sintassi dello studio di funzione

ANALISI MATEMATICA 1 Area dell Ingegneria dell Informazione. Appello del TEMA 1. f(x) = arcsin 1 2 log 2 x.

Corso di laurea in Matematica Corso di Analisi Matematica 1-2 Dott.ssa Sandra Lucente 1 Funzioni potenza ed esponenziale.

Rendita perpetua con rate crescenti in progressione aritmetica

LE MISURE DI VARIABILITÀ DI CARATTERI QUANTITATIVI

Campionamento stratificato. Esempio

SUCCESSIONI NUMERICHE

Test non parametrici. sono uguali a quelle teoriche. (probabilità attesa), si calcola la. , cioè che le frequenze empiriche

Analisi statistica dell Output

LA DERIVATA DI UNA FUNZIONE

Random walk classico. Simulazione di un random walk

SERIE NUMERICHE Con l introduzione delle serie vogliamo estendere l operazione algebrica di somma ad un numero infinito di addendi.

5. Le serie numeriche

ESERCIZI DI INFERENZA STATISTICA E STUDIO DELLE ASSOCIAZIONI

Limiti di successioni

Terzo appello del. primo modulo. di ANALISI

Matematica II: Calcolo delle Probabilità e Statistica Matematica

EQUAZIONI ALLE RICORRENZE

Percorsi di matematica per il ripasso e il recupero

Interesse e formule relative.

SUCCESSIONI NUMERICHE

Alcuni parametri statistici di base

Teorema del Limite Centrale

Soluzione La media aritmetica dei due numeri positivi a e b è data da M

1. Distribuzioni campionarie legate alla distribuzione normale. 3. Intervallo bilatero di confidenza bilatero per la frazione p di una popolazione

Esercitazioni del corso: ANALISI MULTIVARIATA

Strumenti della Teoria dei Giochi per l Informatica A.A. 2009/10. Lecture 11: Maggio Meccanismi per la Condivisione dei Costi

8. Quale pesa di più?

Successioni ricorsive di numeri

Campi vettoriali conservativi e solenoidali

IL CALCOLO COMBINATORIO

ESERCIZI SULLE SERIE

Capitolo IV L n-polo

ESERCIZI DI INFERENZA STATISTICA SVOLTI IN AULA DAL DOTT. CLAUDIO CONVERSANO

Una funzione è una relazione che ad ogni elemento del dominio associa uno e un solo elemento del codominio

SUCCESSIONI e LIMITI DI SUCCESSIONI. c Paola Gervasio - Analisi Matematica 1 - A.A. 15/16 Successioni cap3b.pdf 1

Selezione avversa e razionamento del credito

Statistica di base. Luca Mari, versione

CAPITOLO SETTIMO GLI INDICI DI FORMA 1. INTRODUZIONE

Le onde elettromagnetiche. Origine e natura, spettro delle onde e.m., la polarizzazione

Risposte. f v = φ dove φ(x,y) = e x2. f(x) = e x2 /2. +const. Soluzione. (i) Scriviamo v = (u,w). Se f(x) è la funzione richiesta, si deve avere

Teorema 13. Se una sere converge assolutamente, allora converge:

1 Successioni Limite di una successione Serie La serie armonica La serie geometrica... 6

Disposizioni semplici. Disposizioni semplici esercizi

I numeri complessi. Pagine tratte da Elementi della teoria delle funzioni olomorfe di una variabile complessa

Inferenza statistica. Statistica medica 1

II-9 Successioni e serie

Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti

Transcript:

Metodi Numerici per la Bioiformatica Approcci claici all aalii di dati A.A. 008/009 Fraceco Archetti

Itroduzioe Vi oo criteri differeti per caratterizzare i problemi di tetig di ipotei. il umero di campioi utilizzati. il fatto che i dati provegao o meo da ua ditribuzioe ota. I bae al primo criterio dobbiamo ditiguere tra problemi co, o più di campioi. I bae al ecodo coideriamo: tet parametrici -quado i dati eguoo ua ditribuzioe ota o auta tale di cui vao timati i parametri tet o parametrici - quado o i pooo fare ipotei a priori ulla ditribuzioe bioiformatica Fraceco Archetti

Tet che uao u olo campioe I tet che uao u olo campioe pooo riguardare media o variaza. Se il tetig riguarda la media pooo eere formulate le egueti ipotei: H : µ c 0 H : µ c 0 H a : µ c H a : µ < c Corripode a u two-tail tetig el quale o vi è cooceza a priori Corripode a u oe-tail tetig el quale ci i apetta che il valore c ia più alto ripetto alla media della popolazioe H : µ c 0 H a : µ > c Corripode a u oe-tail tetig el quale ci i apetta che il valore c ia più bao ripetto alla media della popolazioe bioiformatica 3 Fraceco Archetti

Tet che uao la media Eempio: Aumiamo che il livello di epreioe di u gee ia ditribuito ormalmete co u valor medio di.5 ella popolazioe cotrollo. Miurazioi i u teuto di u paziete hao dato i valori:.9.5.3..5.7.7..0 Queti dati oo coiteti co il valore pubblicato della media.5? Soluzioe: Il problema è -tail tet, imile a uo già tudiato(lezioe precedete), co ua differeza importate: la variaza della popolazioe o è ota e va timata dal campioe Ivece di Z uiamo quidi t : X µ ( X i i t Dove è la deviazioe tadard del campioe: X ) bioiformatica 4 Fraceco Archetti

La ditribuzioe t X µ la ditribuzioe della variabile t o è ormale ma egue u altra claica ditribuzioe detta t o t di Studet t Queta ditribuzioe ha media 0 e variaza che dipede dal umero di gradi di libertà (d.f) uguali al umero dei dati meo il umero dei parametri da timare. La forma della ditribuzioe t e imile alla ormale cui tede quado il umero delle miurazioi crece. Per valori bai di (umero di miurazioi idipedeti), le code oo più robute della ormale, quidi a parità di livello di igificace dobbiamo etrate più ella coda (diveta più difficile rifiutare H 0 ). Per eempio co 4 gradi di libertà per predere il 95% delle miurazioi dobbiamo coiderare ua deviazioe tadard di.78, metre per la ormale bata.96. bioiformatica 5 Fraceco Archetti

La ditribuzioe t cotiuazioe oluzioe eempio precedete: Il workflow è come quello già vito co la differeza che i calcola il valore di t:. Formulare le due ipotei: H 0 : µ.5 H a : µ.5 i queto cao i tratta di u two-tail tetig!. Scegliere il igificace level: 5% 3. Idividuare l appropriato tet e modello tatitico:come vito prima, il modello è la ditribuzioe t. 4. Calcolare l appropriato tet tatitico, il valore di t: t X µ.87.5. 0.5 9 5. Calcolare il p-value corripodete alla tatitica calcolata: p0.057 6. Paragoare il p_value co il igificace level celto: 0.057>0.05 7. Decidere e rifiutare o meo H 0 : o poiamo rifiutare H 0 8. Cocluioi: i dati embrao eere coiteti co la media pubblicata. bioiformatica 6 Fraceco Archetti

La ditribuzioe t:eempio Tetare l ipotei che la media delle altezze degli atleti di ua famoa quadra baket americaa è miore o uguale a 76. Soo tate raccolte le altezze di 5 giocatori, co i egueti riultati: Ipotei: X 77.5" 5. 6 H 0 : µ 76" H a : µ > 76" Ditribuzioe t-tudet Sigificace level 0,05 Degree of fredom: -5-4 La regioe di rifiuto è idividuata guardado la tabella della ditribuzioe t Metodi eumerici quidi per la t 0,05,76 bioiformatica 7 Fraceco Archetti

La ditribuzioe t:eempio Calcolo t: t X µ 77,5 76 5.6 5.03740,76,0374 No poiamo rifiutare l ipotei ulla e quidi poiamo accettare l ipotei che l altezza media dei giocatori di baket della quadra è <76 bioiformatica 8 Eempio file Excel Fraceco Archetti

Determiazioe della umeroità del campioe Eempio: Il livello di epreioe di u gee ella popolazioe cotrollo è 00 co deviazioe tadard uguale a 0. I u eperimeto u u teuto di u paziete ci attediamo u aumeto lieve del livello (circa il 0%). Quate miurazioi dobbiamo fare per capire il cambiameto il 95% delle volte?(i queto cao fiiamo il power del tet oia -β 0.95) Soluzioe: l ipotei ulla H 0 è: H 0 : µ 00 ed il igificace level celto è: % X µ poiamo uare la tatitica z : Z o appiamo il valore di (umero di miurazioi replicate), ma poiamo calcolare il valore critico di Z che dovrebbe corripodere alla oglia ripetto alla quale dobbiamo rifiutare l ipotei ulla. Dalla tabella della ditribuzioe ormale i ricava che il valore che corripode a α0.0 è z α.33. σ bioiformatica 9 Fraceco Archetti

Determiazioe della umeroità del campioe poiamo coì calcolare il valore miimo della media campioaria che riulterebbe igificativo a queto livello di cofideza : Otteedo il valore di oglia : σ 0 X t µ + zα 00 +.33 X t µ Z σ La formula o ci coete acora di calcolare poiché o coociamo X L altro dato che abbiamo è la poteza del t tet, 95% ; e la vera media è 0 (µ+0%0) otteiamo : Z β µ ' X t σ 0 X 0 teedo coto che vogliamo accettare H a quado è vera co ua probabilità di -β 0.95 e quidi rifiutare H 0 e che la deciioe ia corretta, il valore di Z corripodete a β 0.05 è -.645. Da queta ecoda ditribuzioe: t σ 0 X t µ ' + zβ 0.645 bioiformatica 0 Fraceco Archetti α

Determiazioe della umeroità del campioe o appiamo il valore di, tuttavia le due codizioi (α0.0 e β 0.95) devoo eere oddifatte cotemporaeamete dalla tea X t Uiamo le due equazioi precedeti ulla X t per otteere il umero di repliche ecearie () σ σ µ + z α µ ' z σ β µ µ ' ( zα + zβ ) ( zα + zβ ) σ ( µ µ ') La ditribuzioe a iitra rappreeta l epreioe del gee i codizioi ormali (µ00,σ0) La ditribuzioe a detra rappreeta l epreioe di u dato gee elle codizioi otto tudio (aumiamo che µ0 e σ0). Quello che tiamo facedo è capire quado u gee proviee dalla ditribuzioe di detra per il 95% delle volte bioiformatica Fraceco Archetti

Tet ulla variaza la ditribuzioe chi-quadro Eempio: Il livello di epreioe di u gee miurato molte volte da u valor medio 40 co ua.d. 3; ua divera tecologia co 30 miurazioi da ua.d. campioaria di. Poiamo cocludere che la uova offre miurazioi più uiformi? Soluzioe: H :σ 0 c H a :σ < c ( ) σ La quatità è ua v.c. che egue la ditribuzioe chi-quare. Come la t ha u umero di d.f. (ν) uguale al umero di miurazioi meo il umero di parametri e ha u valore atteo: µ E( χ ) ν ua variaza: χ ν Var( ) bioiformatica Fraceco Archetti

Tet ulla variaza la ditribuzioe chi-quadro Dati valore atteo e variaza, appiamo che la variabile chi-quared i comporta i u certo modo e poiamo uare queta per tetare le otre ipotei. Dato u determiato campioe, poiamo calcolare il valore della tatitica chi-quared u queto campioe: E ituitivo che: χ ( ) σ e il valore della deviazioe tadard del campioe () è vicio a quello della deviazioe tadard della popolazioe (σ), il valore di chi-quare arà vicio a -. Se il valore della deviazioe tadard del campioe è molto divero dal valore della deviazioe tadard della popolazioe, il valore di chi-quare arà molto differete da -. bioiformatica 3 Fraceco Archetti

Tet ulla variaza la ditribuzioe chi-quadro Nel cao dell eempio: χ ( ) σ (30 ) 3 9 4 9.88 Ci i apetta che il valore di chi-quadro ia vicio alla ua media di ν-9 e H 0 è vera, e divero da 9 e H a è vera. La probabilità (oe tail) che corripode a u chi-quared di.88 è 0.995 (P_value0,005). Se H 0 foe vera il valore miurato di chi-quared arà miore/uguale a.88 el 99.5% dei cai. Poiamo quidi rigettare l ipotei H 0 al livello igificate 5%. Potremmo alterativamete cofrotare il valore calcolato co i valori critici di ua ditribuzioe chi-quared co 9 d.f.(ν), che riultao al 95%, 7.70 e 4.55. bioiformatica 4 Fraceco Archetti

Tet ulla variaza la ditribuzioe chi-quadro Oe ample variace tetig i può riaumere ei 3 cai: H 0 :σ c H 0 :σ c H a :σ < c H a :σ > c Corripode a u oe-tail tetig el quale ci i apetta che i dati iao da ua parte pecifica del valore c H c H a :σ c 0 :σ Corripode a u two-tail tetig Il valore c è empre oto a priori e o deve eere calcolato dai dati. Il tet i può codurre eguedo trade: i. i calcola il p-value corripodete al valore calcolato di chi- e lo i cofrota co il igificace level α. Se è miore H 0 viee rifiutata. ii. i cofrota il valore calcolato chi- co i valori critici corripodete al igificace level. Se è etero H 0 viee rifiutata. bioiformatica 5 Fraceco Archetti

Itervallo di cofideza per la deviazioe tadard La ditribuzioe chi-quadro può eere uata per calcolare u itervallo di cofideza per la deviazioe tadard. Eempio: Il livello di epreioe di u gee pecifico è miurato per 6 volte. La variaza campioaria è 4. Quali oo i limiti di cofideza al 95% per la variaza della popolazioe? Soluzioe: Poiamo uare la defiizioe della variabile chi-quadro: Per etrarre σ : σ ( ) χ e uare quet ultima per ettare le codizioi riguardati la probabilità di compiere u errore di tipo,α: ( ) C χ α Poiamo etrarre la radice quadrata per otteere σ: ( ) σ χ α α ( ) α α bioiformatica 6 Fraceco Archetti C χ χ ( ) σ σ ( ) χ χ α α χ α

Tet ulla variaza la ditribuzioe chi-quadro: eempio Ua compagia farmaceutica ta coiderado l acquito di uove macchie per l imbottigliameto dei farmaci per icremetare l efficieza della produzioe. L azieda attualmete utilizza delle macchie che riempioo delle bottigliette che pooo coteere u volume di mediciali co ua deviazioe tadard pari a.6 ml. La uova macchia che tao oervado per l acquito, è tata tetata u 30 bottigliette, producedo ua deviazioe tadard pari a.5 ml. La macchia uova può produrre co ua variaza miore o uguale a,6 ml co u igificace level pari a 0.05? Abbiamo: deviazioe tadard del campioe (),5 deviazioe tadard della popolazioe (σ),6 Le ipotei oo: H 0 : σ (.6) Ha σ : < (.6) bioiformatica 7 Fraceco Archetti

Tet ulla variaza la ditribuzioe chi-quadro: eempio Scegliamo ua ditribuzioe chi-quadro eedo u tet ulla variaza Sigificace level 0.05 Numero gradi di libertà - 30-9 Guardado ella tabella del chi-quadro poiamo vedere che co 9 gradi di libertà abbiamo 7.708 7.708 χ ( ) σ (30 ).56.56 7.700 7.700 Il valore è ella regioe di rifiuto, quidi: dobbiamo rifiutare l ipotei ulla e accettare l ipotei di ricerca, quidi la uova macchia riucirà a produrre co variaza <.6 bioiformatica 8 Eempio file Excel Fraceco Archetti

Tet co due campioi La ditribuzioe F Ua applicazioe tipica è il cofroto tra i livelli di epreioe di diveri gei i pazieti e i cotrolli ai Cacer patiet Cotrol ubject Gee ID P P P C C P AC005 5. 6. 5.9 0.9 0.7 0.8 AB00678..6.9 -.3 0.6 0. AB0035 0.5 -.8.5.7 3.8 0. AB0057 0.5 -.8.5.7 3.8 0. AB00690 -. -3.9 -. -.9 -.3 0. AB00086 4. 3.6.5 -.3 0.6 0. AB000450 -.4.3 -.5. -3. 0. La domada che ci i può porre è: come capire e u gee è epreo i modo divero tra pazieti e cotrolli (cioè e i livelli di epreioe provegoo da ditribuzioi divere)? bioiformatica 9 Fraceco Archetti

La ditribuzioe F La quetioe i riduce al cofroto tra le medie di campioi. Bioga prima riucire a cofrotare le variaze dei campioi. Eempio: Il livello di epreioe di u gee è miurato i u determiato umero di idividui di cotrollo e di pazieti. I valori del gee ei cotrolli oo: 0,,,5,3,,; i valori miurati ei pazieti oo:,3,3,5,8,7,6,6,,5,0,. La variaza è divera tra cotrollo e paziete? Soluzioe: Formuliamo il problema come : H σ 0 : σ H a : σ σ Neu tet tatitico vito è appropriato per tudiare queto problema! bioiformatica 0 Fraceco Archetti

La ditribuzioe F Coideriamo campioi da ua ditribuzioe ormale co variaza σ co variaze campioarie e. il rapporto / arà divero da. Queto valore è comuque ua v.c. che egue ua ditribuzioe ota come F la cui forma (i figura) dipede dai gradi di libertà (umero di miurazioi meo parametri da timare) dei campioi. Poiché i campioi provegoo da popolazioi co la tea variaza, il valore atteo di / è. Ua deviazioe coiderevole da è idicazioe che le variaze oo divere. Queta ditribuzioe ha la proprietà itereate che la coda iitra della ditribuzioe F co gradi di libertà ν e ν, è reciproca alla coda detra di ua ditribuzioe co gradi di libertà revered F α ( ν, ν ) F α ( ν, ν ) bioiformatica Fraceco Archetti

La ditribuzioe F Nel otro eempio: ν -7-6 ν -3- per α 0.05, i u tet two tail, otteiamo : F 0.975(6,) 3.73 F 0.05(6,) 0.86 Quidi e il rapporto tra le variaze ( / ) è etero all itervallo [0.86, 3.73], H 0 può eere rifiutata co ua probabilità 5% di u errore del tipo. bioiformatica Fraceco Archetti

La ditribuzioe F H σ σ 0 : a b H a : σ a σ b Il rapporto delle variaze campioarie di due campioi tratti da due popolazioi ormali co la tea variaza, egue la ditribuzioe F: ν a 6, a.66, ν b, b 5.74 Prima abbiamo vito a e b. Se coideraimo il rapporto ( b / a ) queti valori critici u F: F 0.975(,6) 5.37 F 0,05(,6) /3.730.68 E chiaro che etrambi i rapporti coducoo alle tee deciioi I queto cao o i può rifiutare l ipotei H 0

La ditribuzioe F Ache il tet per il cofroto tra variaze i può articolare i 3 modi : H H 0 : σ σ 0 : σ σ H a H a : σ < σ : σ > σ Corripode a u oe-tail tetig el quale ci i apetta di avere ua variaza più piccola dell altra H σ 0 : σ H a : σ σ Corripode a u two-tail tetig bioiformatica 4 Fraceco Archetti

Eempio cofroto fra variaze: colo dataet The Colo Dataet i a collectio of expreio meauremet from colo biopy ample reported i [Alo et al., 999]. The dataet coit of 6 ample of colo epithelial cell collected from colo-cacer patiet. The "tumor biopie were extracted from tumour, ad the "ormal" biopie were collected from healthy part of the colo of the ame patiet. The fial aigmet of the tatu of biopy ample were made by pathological examiatio. Gee expreio level i thee 6 ample were meaured uig high deity oligoucleotide array. The dataet, 6 ample over 000 gee, i available http://microarray.priceto.edu/ocology/affydata/idex.html at: U. Alo, N. Barkai, D. Notterma, K. Gih, S. Ybarra, D. Mack, A. J. Levie. Broad patter of gee expreio revealed by cluterig aalyi of tumor ad ormal colo tiue probed by oligoucleotide array, Proc. Nat. Acad. Sci. USA 96, 6745 6750 (999). 5 Fraceco Archetti

Eempio cofroto fra variaze: Etraedo il livello di epreioe del gee: H55933 : Homo apie riboomal protei L4 (RPL4), tracript variat, mrna ia i campioi di teuto malato che i campioi di cotrollo, poiamo affermare che la variaza del gee i eame è divera tra teuto malato e cotrollo? H : σ σ 0 H a : σ σ bioiformatica 6 Fraceco Archetti

Eempio cofroto fra variaze: Miurazioi teuti malati : 0,59 -,0398 -,339 0,036 0,7545,56-0,830-0,685 0,049-0,534 0,366-0,930 0,609-0,353-0,389 0,8968,0564,9433 0,5663-0,653-0,036 Miurazioi teuti di cotrollo: 0,7003-0,508 -,4686-0,9736-0,5685-0,456-0,700-0,8486-0,0066 -,667 Calcolo gradi di libertà: ν --0 ν -0-9 Scegliamo la ditribuzioe F, two-tail tet! Calcoliamo quidi le variaze: M,097 C 0,475 Fiiamo α 0.05 bioiformatica 7 Fraceco Archetti

Eempio cofroto fra variaze: Tet two-tail, quidi per riucire ad idividuare le regioi di rifiuto del tet dobbiamo: Dividere α per quidi α0.05 Per il lato detro della ditribuzioe, guardare emplicemete il valore della tabella della ditribuzioe F teedo empre preete che il igificace level è empre metà dell origiale (α0.05). Quidi: F 0,975(0,9) 3.66 Per il lato iitro della ditribuzioe, bioga ricordari che: quidi F 0,05(0,9) 0.77 F α ( ν, ν ) F α ( ν, ν ) Quidi F (,30) cade ell'itervallo [0,7;3,66] quidi H 0 o può eere rifiutata e quidi o poiamo affermare che la variaza del gee i eame è divera tra teuto malato e cotrollo! bioiformatica 8 Eempio file Excel Fraceco Archetti

Cofroto fra medie: la procedura Prima di iiziare u tet di ipotei tra le medie di due campioi dobbiamo determiare alcue caratteritiche dei campioi: I campioi oo i relazioe fra loro? SI Se eite ua relazioe allora i campioi oo DIPENDENTI. I dati del primo campioe pooo eere accoppiati co quelli del ecodo. I queto cao iamo itereati alle differeze tra i valori accoppiati. Se le popolazioi oo ditribuite ecodo ua ormale ed eite ua relazioe, allora verrà codotto u tet u due medie dipedeti co la ditribuzioe t-studet NO Se NON eite ua relazioe tra le due variabili allora oo INDIPENDENTI. U altra domada: Le variaze oo ote? bioiformatica 9 Fraceco Archetti

Cofroto fra medie Siamo a queto puto i grado di impotare il cofroto tra le medie di campioi Eempio: Coideriamo u gee ( pecifico e be defiito ) miurato i u campioe di 6 pazieti e i uo di 6 cotrolli. Il valor medio è divero ei campioi? Soluzioe: I pai, come abbiamo già vito i precedeza, oo i egueti :.Defiire il problema: dato u igolo gee, queto è epreo i modo differeti ei pazieti e ei cotrolli?.defiire le ipotei: Ipotei ulla H 0 : tutte le miurazioi provegoo da ua uica ditribuzioe; Ipotei di ricerca H a : vi oo ditribuzioi divere che caratterizzao i campioi. Abbiamo ua ituazioe -tail, ache e i valori dei pazieti tedoo a eere uperiori, la trutturazioe i ipotei deve eere a priori ripetto ai dati, riflettere cioè le otre expectatio o comuque iformazioi tratte dalla letteratura H µ 0 : µ H a : µ µ 30 Fraceco Archetti

Cofroto fra medie 3. Scegliere il igificace level : cegliamo di lavorare co u igificace level 5% 4. Scegliere il modello tatitico appropriato e il tet tatitico: la ditribuzioe t è il modello tatitico appropriato. Ache utilizzado lo teo modello tatitico, la procedura di tet, può eere cotruita diveramete i diveri cai :. -tail v.-tail: oe tail deve eere uato quado c è ua cooceza a priori che il et di miurazioi ia più alto o bao ripetto all altro.se o c è cooceza i ua il tet two tail.. Paired v. upaired: u tet paired i ua quado eite ua relazioe aturale tra elemeti dei campioi, metre upaired quado le oervazioi oo i.i.d.. 3. Variaze uguali v. diuguali: il t-tet co variaze uguali è appropriato quado oo coociuti due campioi, o i preume che provegao da ditribuzioi co uguale variaza Nel otro problema o eitoo a priori expectatio che i patiet abbiao u livello uperiore ai cotrolli. Quidi è u tet two-tail. Ioltre o ci oo relazioi tra pazieti e cotrolli quidi u-paired. La celta tra variaze uguali/ divere può eere effettuata co il tet che abbiamo vito. bioiformatica 3 Fraceco Archetti

Variaze uguali e i campioi idipedeti oo tratti da ua popolazioe ormale, la differeza delle medie campioarie ( X X ) arà pure ditribuita ormalmete co valore atteo ( µ µ ). la variaza della differeza fra due variabili è uguale alla omma delle variaze delle σ σ due variabili. Poiamo crivere la variaza di come: + La formula del valore t diviee i queto cao: ( X X ) X µ t e le variaze delle popolazioi oo uguali i può utilizzare la variaza pooled p ( ) + ( ) + Quidi la formula del t tet per campioi idipedeti co la tea variaza è: t ( X X ) ( µ µ ) p + bioiformatica 3 Fraceco Archetti

Variaze uguali I gradi di libertà oo il umero delle miurazioi meo i parametri itermedi; i queto cao ν + - Torado al otro eempio: Gee ID P P P3 P4 P5 P6 C C C3 C4 C5 C6 AC00378 0.66 0.5. 0.83 0.9 0.50 0.4 0.57-0.7 0.50 0. 0.7 X 0.755 e X 0.373 0.059 e 0. 097 Dobbiamo decidere e le variaze oo uguali. Per queto copo uiamo: : σ 0 Uiamo come igificace level il 5% H σ H a : σ σ Calcoliamo F: F 0.059 0.097 0.60 bioiformatica 33 Fraceco Archetti

Variaze uguali La probabilità di otteere queto dato by chace è P-value0.70 (i excel uate la fuzioe Fdit) e quidi l ipotei H 0 ulle variaze o può eere rifiutata per il igificace level celto. Poiamo quidi aumere che i campioi abbiao la tea variaza e calcolare la variaza pooled : p ( ) + ( ) + per giugere fialmete al valore di t: t ( X X ) ( µ µ ) p + (6 ) 0.059 + (6 ) 0.097 0.078 6 + 6 (0.755 0.373) 0 0.078 + 6 6.359 calcolare il p-value o la probabilità di avere quel valore by chace (Tdit i excell) otteedo 0.04. Nel cao di u oe-tail, poiamo rigettare l ipotei ulla (ulle medie), e cocludere che il gee AC00378 è epreo differezialmete tra i pazieti e i cotrolli. al livello di cofideza 5%; el cao two-tail l evideza o è ufficiete per rigettare l ipotei ulla. bioiformatica 34 Fraceco Archetti

Variaze diuguali Se aumiamo che due et di miurazioi provegoo da popolazioi ormali idipedeti, ma o poiamo aumere che quete due popolazioi hao la tea variaza, (abbiamo effettuato u tet F che ci ha forito come riultato il rifiuto dell ipoteti ulla (varvar)) è eceario u t-tet modificato. Il t-value viee acora calcolato come : Il t-value viee acora calcolato come : dove e oo le ripettive variaze dei campioi. Il umero di gradi di libertà arà ora calcolato come: 35 Fraceco Archetti ( ) ( ) + X X t µ µ + + ν bioiformatica 35 Fraceco Archetti Solitamete queto valore o è itero e deve eere arrotodato

Paired t-tetig (campioi i relazioe) I alcue ituazioi le miurazioi oo accoppiate aturalmete, ad eempio: tet imultaei, i cui celle dalla tea cultura oo divie i gruppi ad oguo dei quali viee dato u trattameto divero. Before/after tet: i cui u parametro è miurato prima e dopo il trattameto co ua certa otaza. Matched tet: i oggetti oo uiti i coppie che hao le tee caratteritiche (età,peo,dieta, ) i tutti queti cai le variabili miurate oo dipedeti Per codurre u paired t-tet delle medie abbiamo biogo: La media delle differeze di tutte le coppie, oia: X d La deviazioe tadard della differeza: X d N è uguale al umero di coppie! ( X d X ) d d d X bioiformatica 36 Fraceco Archetti

Paired t-tetig i può coì codurre u t-tet t X d µ d d dove µ d è la differeza tra le medie delle due popolazioi I gradi di libertà di u paired t-tet oo - dove è il umero delle coppie. Se defiiamo L ipotei ulla arà: µ d µ µ H : µ µ : 0 0 H 0 µ µ H 0 : µ d 0 bioiformatica 37 Fraceco Archetti

Paired t-tetig:eempio Growth Hormoe of UCLA Populatio Da u idagie oo tate raccolte le egueti miurazioi dell altezza di 3 tudeti di u college : A queti tudeti è tato dato l ormoe della crecita Laxo. Dopo u mee oo tate raccolte uovamete le loro altezze otteedo la eguete tabella: Il farmaco Laxo ha ucceo ell icremeto della media dell altezza degli tudeti? bioiformatica 38 Fraceco Archetti

Paired t-tetig:eempio. Calcolo della media delle differeze :. Calcolo della deviazioe tadard delle differeze: 3. Ipotei: H 0 : µ d 0 H 0 : µ d 0 X 0.4375 4. Viee codotto u t-tet co igificace level uguale al 5% 5. Gradi di libertà umero di coppie- 3-3 6. Calcoliamo t t X d µ d 7. CONCLUSIONE:poiamo rifiutare l ipotei ulla e quidi poiamo dire che il farmaco Laxo ha ucceo ell icremeto della media dell altezza degli tudeti! d 0.4375 0 0.84 3 39 X d d.946 d ( X d X X d d ) 0.840 Eempio file Excel

Itervallo di cofideza per la differeza tra medie µ -µ Se l ipotei ulla H 0 : µ µ può eere rifiutata, ci poiamo chiedere quato iao differeti le medie. Si può ifatti ricavare la eguete formula del relativo itervallo di cofideza per la differeza µ - µ : C [( X X ) t0 µ µ ( X X ) + t0 ] α X X X X dove il umero di gradi di libertà è ν + - e lo tadard error è: X X + X X p bioiformatica 40 Fraceco Archetti