Metodi Numerici per la Bioiformatica Approcci claici all aalii di dati A.A. 008/009 Fraceco Archetti
Itroduzioe Vi oo criteri differeti per caratterizzare i problemi di tetig di ipotei. il umero di campioi utilizzati. il fatto che i dati provegao o meo da ua ditribuzioe ota. I bae al primo criterio dobbiamo ditiguere tra problemi co, o più di campioi. I bae al ecodo coideriamo: tet parametrici -quado i dati eguoo ua ditribuzioe ota o auta tale di cui vao timati i parametri tet o parametrici - quado o i pooo fare ipotei a priori ulla ditribuzioe bioiformatica Fraceco Archetti
Tet che uao u olo campioe I tet che uao u olo campioe pooo riguardare media o variaza. Se il tetig riguarda la media pooo eere formulate le egueti ipotei: H : µ c 0 H : µ c 0 H a : µ c H a : µ < c Corripode a u two-tail tetig el quale o vi è cooceza a priori Corripode a u oe-tail tetig el quale ci i apetta che il valore c ia più alto ripetto alla media della popolazioe H : µ c 0 H a : µ > c Corripode a u oe-tail tetig el quale ci i apetta che il valore c ia più bao ripetto alla media della popolazioe bioiformatica 3 Fraceco Archetti
Tet che uao la media Eempio: Aumiamo che il livello di epreioe di u gee ia ditribuito ormalmete co u valor medio di.5 ella popolazioe cotrollo. Miurazioi i u teuto di u paziete hao dato i valori:.9.5.3..5.7.7..0 Queti dati oo coiteti co il valore pubblicato della media.5? Soluzioe: Il problema è -tail tet, imile a uo già tudiato(lezioe precedete), co ua differeza importate: la variaza della popolazioe o è ota e va timata dal campioe Ivece di Z uiamo quidi t : X µ ( X i i t Dove è la deviazioe tadard del campioe: X ) bioiformatica 4 Fraceco Archetti
La ditribuzioe t X µ la ditribuzioe della variabile t o è ormale ma egue u altra claica ditribuzioe detta t o t di Studet t Queta ditribuzioe ha media 0 e variaza che dipede dal umero di gradi di libertà (d.f) uguali al umero dei dati meo il umero dei parametri da timare. La forma della ditribuzioe t e imile alla ormale cui tede quado il umero delle miurazioi crece. Per valori bai di (umero di miurazioi idipedeti), le code oo più robute della ormale, quidi a parità di livello di igificace dobbiamo etrate più ella coda (diveta più difficile rifiutare H 0 ). Per eempio co 4 gradi di libertà per predere il 95% delle miurazioi dobbiamo coiderare ua deviazioe tadard di.78, metre per la ormale bata.96. bioiformatica 5 Fraceco Archetti
La ditribuzioe t cotiuazioe oluzioe eempio precedete: Il workflow è come quello già vito co la differeza che i calcola il valore di t:. Formulare le due ipotei: H 0 : µ.5 H a : µ.5 i queto cao i tratta di u two-tail tetig!. Scegliere il igificace level: 5% 3. Idividuare l appropriato tet e modello tatitico:come vito prima, il modello è la ditribuzioe t. 4. Calcolare l appropriato tet tatitico, il valore di t: t X µ.87.5. 0.5 9 5. Calcolare il p-value corripodete alla tatitica calcolata: p0.057 6. Paragoare il p_value co il igificace level celto: 0.057>0.05 7. Decidere e rifiutare o meo H 0 : o poiamo rifiutare H 0 8. Cocluioi: i dati embrao eere coiteti co la media pubblicata. bioiformatica 6 Fraceco Archetti
La ditribuzioe t:eempio Tetare l ipotei che la media delle altezze degli atleti di ua famoa quadra baket americaa è miore o uguale a 76. Soo tate raccolte le altezze di 5 giocatori, co i egueti riultati: Ipotei: X 77.5" 5. 6 H 0 : µ 76" H a : µ > 76" Ditribuzioe t-tudet Sigificace level 0,05 Degree of fredom: -5-4 La regioe di rifiuto è idividuata guardado la tabella della ditribuzioe t Metodi eumerici quidi per la t 0,05,76 bioiformatica 7 Fraceco Archetti
La ditribuzioe t:eempio Calcolo t: t X µ 77,5 76 5.6 5.03740,76,0374 No poiamo rifiutare l ipotei ulla e quidi poiamo accettare l ipotei che l altezza media dei giocatori di baket della quadra è <76 bioiformatica 8 Eempio file Excel Fraceco Archetti
Determiazioe della umeroità del campioe Eempio: Il livello di epreioe di u gee ella popolazioe cotrollo è 00 co deviazioe tadard uguale a 0. I u eperimeto u u teuto di u paziete ci attediamo u aumeto lieve del livello (circa il 0%). Quate miurazioi dobbiamo fare per capire il cambiameto il 95% delle volte?(i queto cao fiiamo il power del tet oia -β 0.95) Soluzioe: l ipotei ulla H 0 è: H 0 : µ 00 ed il igificace level celto è: % X µ poiamo uare la tatitica z : Z o appiamo il valore di (umero di miurazioi replicate), ma poiamo calcolare il valore critico di Z che dovrebbe corripodere alla oglia ripetto alla quale dobbiamo rifiutare l ipotei ulla. Dalla tabella della ditribuzioe ormale i ricava che il valore che corripode a α0.0 è z α.33. σ bioiformatica 9 Fraceco Archetti
Determiazioe della umeroità del campioe poiamo coì calcolare il valore miimo della media campioaria che riulterebbe igificativo a queto livello di cofideza : Otteedo il valore di oglia : σ 0 X t µ + zα 00 +.33 X t µ Z σ La formula o ci coete acora di calcolare poiché o coociamo X L altro dato che abbiamo è la poteza del t tet, 95% ; e la vera media è 0 (µ+0%0) otteiamo : Z β µ ' X t σ 0 X 0 teedo coto che vogliamo accettare H a quado è vera co ua probabilità di -β 0.95 e quidi rifiutare H 0 e che la deciioe ia corretta, il valore di Z corripodete a β 0.05 è -.645. Da queta ecoda ditribuzioe: t σ 0 X t µ ' + zβ 0.645 bioiformatica 0 Fraceco Archetti α
Determiazioe della umeroità del campioe o appiamo il valore di, tuttavia le due codizioi (α0.0 e β 0.95) devoo eere oddifatte cotemporaeamete dalla tea X t Uiamo le due equazioi precedeti ulla X t per otteere il umero di repliche ecearie () σ σ µ + z α µ ' z σ β µ µ ' ( zα + zβ ) ( zα + zβ ) σ ( µ µ ') La ditribuzioe a iitra rappreeta l epreioe del gee i codizioi ormali (µ00,σ0) La ditribuzioe a detra rappreeta l epreioe di u dato gee elle codizioi otto tudio (aumiamo che µ0 e σ0). Quello che tiamo facedo è capire quado u gee proviee dalla ditribuzioe di detra per il 95% delle volte bioiformatica Fraceco Archetti
Tet ulla variaza la ditribuzioe chi-quadro Eempio: Il livello di epreioe di u gee miurato molte volte da u valor medio 40 co ua.d. 3; ua divera tecologia co 30 miurazioi da ua.d. campioaria di. Poiamo cocludere che la uova offre miurazioi più uiformi? Soluzioe: H :σ 0 c H a :σ < c ( ) σ La quatità è ua v.c. che egue la ditribuzioe chi-quare. Come la t ha u umero di d.f. (ν) uguale al umero di miurazioi meo il umero di parametri e ha u valore atteo: µ E( χ ) ν ua variaza: χ ν Var( ) bioiformatica Fraceco Archetti
Tet ulla variaza la ditribuzioe chi-quadro Dati valore atteo e variaza, appiamo che la variabile chi-quared i comporta i u certo modo e poiamo uare queta per tetare le otre ipotei. Dato u determiato campioe, poiamo calcolare il valore della tatitica chi-quared u queto campioe: E ituitivo che: χ ( ) σ e il valore della deviazioe tadard del campioe () è vicio a quello della deviazioe tadard della popolazioe (σ), il valore di chi-quare arà vicio a -. Se il valore della deviazioe tadard del campioe è molto divero dal valore della deviazioe tadard della popolazioe, il valore di chi-quare arà molto differete da -. bioiformatica 3 Fraceco Archetti
Tet ulla variaza la ditribuzioe chi-quadro Nel cao dell eempio: χ ( ) σ (30 ) 3 9 4 9.88 Ci i apetta che il valore di chi-quadro ia vicio alla ua media di ν-9 e H 0 è vera, e divero da 9 e H a è vera. La probabilità (oe tail) che corripode a u chi-quared di.88 è 0.995 (P_value0,005). Se H 0 foe vera il valore miurato di chi-quared arà miore/uguale a.88 el 99.5% dei cai. Poiamo quidi rigettare l ipotei H 0 al livello igificate 5%. Potremmo alterativamete cofrotare il valore calcolato co i valori critici di ua ditribuzioe chi-quared co 9 d.f.(ν), che riultao al 95%, 7.70 e 4.55. bioiformatica 4 Fraceco Archetti
Tet ulla variaza la ditribuzioe chi-quadro Oe ample variace tetig i può riaumere ei 3 cai: H 0 :σ c H 0 :σ c H a :σ < c H a :σ > c Corripode a u oe-tail tetig el quale ci i apetta che i dati iao da ua parte pecifica del valore c H c H a :σ c 0 :σ Corripode a u two-tail tetig Il valore c è empre oto a priori e o deve eere calcolato dai dati. Il tet i può codurre eguedo trade: i. i calcola il p-value corripodete al valore calcolato di chi- e lo i cofrota co il igificace level α. Se è miore H 0 viee rifiutata. ii. i cofrota il valore calcolato chi- co i valori critici corripodete al igificace level. Se è etero H 0 viee rifiutata. bioiformatica 5 Fraceco Archetti
Itervallo di cofideza per la deviazioe tadard La ditribuzioe chi-quadro può eere uata per calcolare u itervallo di cofideza per la deviazioe tadard. Eempio: Il livello di epreioe di u gee pecifico è miurato per 6 volte. La variaza campioaria è 4. Quali oo i limiti di cofideza al 95% per la variaza della popolazioe? Soluzioe: Poiamo uare la defiizioe della variabile chi-quadro: Per etrarre σ : σ ( ) χ e uare quet ultima per ettare le codizioi riguardati la probabilità di compiere u errore di tipo,α: ( ) C χ α Poiamo etrarre la radice quadrata per otteere σ: ( ) σ χ α α ( ) α α bioiformatica 6 Fraceco Archetti C χ χ ( ) σ σ ( ) χ χ α α χ α
Tet ulla variaza la ditribuzioe chi-quadro: eempio Ua compagia farmaceutica ta coiderado l acquito di uove macchie per l imbottigliameto dei farmaci per icremetare l efficieza della produzioe. L azieda attualmete utilizza delle macchie che riempioo delle bottigliette che pooo coteere u volume di mediciali co ua deviazioe tadard pari a.6 ml. La uova macchia che tao oervado per l acquito, è tata tetata u 30 bottigliette, producedo ua deviazioe tadard pari a.5 ml. La macchia uova può produrre co ua variaza miore o uguale a,6 ml co u igificace level pari a 0.05? Abbiamo: deviazioe tadard del campioe (),5 deviazioe tadard della popolazioe (σ),6 Le ipotei oo: H 0 : σ (.6) Ha σ : < (.6) bioiformatica 7 Fraceco Archetti
Tet ulla variaza la ditribuzioe chi-quadro: eempio Scegliamo ua ditribuzioe chi-quadro eedo u tet ulla variaza Sigificace level 0.05 Numero gradi di libertà - 30-9 Guardado ella tabella del chi-quadro poiamo vedere che co 9 gradi di libertà abbiamo 7.708 7.708 χ ( ) σ (30 ).56.56 7.700 7.700 Il valore è ella regioe di rifiuto, quidi: dobbiamo rifiutare l ipotei ulla e accettare l ipotei di ricerca, quidi la uova macchia riucirà a produrre co variaza <.6 bioiformatica 8 Eempio file Excel Fraceco Archetti
Tet co due campioi La ditribuzioe F Ua applicazioe tipica è il cofroto tra i livelli di epreioe di diveri gei i pazieti e i cotrolli ai Cacer patiet Cotrol ubject Gee ID P P P C C P AC005 5. 6. 5.9 0.9 0.7 0.8 AB00678..6.9 -.3 0.6 0. AB0035 0.5 -.8.5.7 3.8 0. AB0057 0.5 -.8.5.7 3.8 0. AB00690 -. -3.9 -. -.9 -.3 0. AB00086 4. 3.6.5 -.3 0.6 0. AB000450 -.4.3 -.5. -3. 0. La domada che ci i può porre è: come capire e u gee è epreo i modo divero tra pazieti e cotrolli (cioè e i livelli di epreioe provegoo da ditribuzioi divere)? bioiformatica 9 Fraceco Archetti
La ditribuzioe F La quetioe i riduce al cofroto tra le medie di campioi. Bioga prima riucire a cofrotare le variaze dei campioi. Eempio: Il livello di epreioe di u gee è miurato i u determiato umero di idividui di cotrollo e di pazieti. I valori del gee ei cotrolli oo: 0,,,5,3,,; i valori miurati ei pazieti oo:,3,3,5,8,7,6,6,,5,0,. La variaza è divera tra cotrollo e paziete? Soluzioe: Formuliamo il problema come : H σ 0 : σ H a : σ σ Neu tet tatitico vito è appropriato per tudiare queto problema! bioiformatica 0 Fraceco Archetti
La ditribuzioe F Coideriamo campioi da ua ditribuzioe ormale co variaza σ co variaze campioarie e. il rapporto / arà divero da. Queto valore è comuque ua v.c. che egue ua ditribuzioe ota come F la cui forma (i figura) dipede dai gradi di libertà (umero di miurazioi meo parametri da timare) dei campioi. Poiché i campioi provegoo da popolazioi co la tea variaza, il valore atteo di / è. Ua deviazioe coiderevole da è idicazioe che le variaze oo divere. Queta ditribuzioe ha la proprietà itereate che la coda iitra della ditribuzioe F co gradi di libertà ν e ν, è reciproca alla coda detra di ua ditribuzioe co gradi di libertà revered F α ( ν, ν ) F α ( ν, ν ) bioiformatica Fraceco Archetti
La ditribuzioe F Nel otro eempio: ν -7-6 ν -3- per α 0.05, i u tet two tail, otteiamo : F 0.975(6,) 3.73 F 0.05(6,) 0.86 Quidi e il rapporto tra le variaze ( / ) è etero all itervallo [0.86, 3.73], H 0 può eere rifiutata co ua probabilità 5% di u errore del tipo. bioiformatica Fraceco Archetti
La ditribuzioe F H σ σ 0 : a b H a : σ a σ b Il rapporto delle variaze campioarie di due campioi tratti da due popolazioi ormali co la tea variaza, egue la ditribuzioe F: ν a 6, a.66, ν b, b 5.74 Prima abbiamo vito a e b. Se coideraimo il rapporto ( b / a ) queti valori critici u F: F 0.975(,6) 5.37 F 0,05(,6) /3.730.68 E chiaro che etrambi i rapporti coducoo alle tee deciioi I queto cao o i può rifiutare l ipotei H 0
La ditribuzioe F Ache il tet per il cofroto tra variaze i può articolare i 3 modi : H H 0 : σ σ 0 : σ σ H a H a : σ < σ : σ > σ Corripode a u oe-tail tetig el quale ci i apetta di avere ua variaza più piccola dell altra H σ 0 : σ H a : σ σ Corripode a u two-tail tetig bioiformatica 4 Fraceco Archetti
Eempio cofroto fra variaze: colo dataet The Colo Dataet i a collectio of expreio meauremet from colo biopy ample reported i [Alo et al., 999]. The dataet coit of 6 ample of colo epithelial cell collected from colo-cacer patiet. The "tumor biopie were extracted from tumour, ad the "ormal" biopie were collected from healthy part of the colo of the ame patiet. The fial aigmet of the tatu of biopy ample were made by pathological examiatio. Gee expreio level i thee 6 ample were meaured uig high deity oligoucleotide array. The dataet, 6 ample over 000 gee, i available http://microarray.priceto.edu/ocology/affydata/idex.html at: U. Alo, N. Barkai, D. Notterma, K. Gih, S. Ybarra, D. Mack, A. J. Levie. Broad patter of gee expreio revealed by cluterig aalyi of tumor ad ormal colo tiue probed by oligoucleotide array, Proc. Nat. Acad. Sci. USA 96, 6745 6750 (999). 5 Fraceco Archetti
Eempio cofroto fra variaze: Etraedo il livello di epreioe del gee: H55933 : Homo apie riboomal protei L4 (RPL4), tracript variat, mrna ia i campioi di teuto malato che i campioi di cotrollo, poiamo affermare che la variaza del gee i eame è divera tra teuto malato e cotrollo? H : σ σ 0 H a : σ σ bioiformatica 6 Fraceco Archetti
Eempio cofroto fra variaze: Miurazioi teuti malati : 0,59 -,0398 -,339 0,036 0,7545,56-0,830-0,685 0,049-0,534 0,366-0,930 0,609-0,353-0,389 0,8968,0564,9433 0,5663-0,653-0,036 Miurazioi teuti di cotrollo: 0,7003-0,508 -,4686-0,9736-0,5685-0,456-0,700-0,8486-0,0066 -,667 Calcolo gradi di libertà: ν --0 ν -0-9 Scegliamo la ditribuzioe F, two-tail tet! Calcoliamo quidi le variaze: M,097 C 0,475 Fiiamo α 0.05 bioiformatica 7 Fraceco Archetti
Eempio cofroto fra variaze: Tet two-tail, quidi per riucire ad idividuare le regioi di rifiuto del tet dobbiamo: Dividere α per quidi α0.05 Per il lato detro della ditribuzioe, guardare emplicemete il valore della tabella della ditribuzioe F teedo empre preete che il igificace level è empre metà dell origiale (α0.05). Quidi: F 0,975(0,9) 3.66 Per il lato iitro della ditribuzioe, bioga ricordari che: quidi F 0,05(0,9) 0.77 F α ( ν, ν ) F α ( ν, ν ) Quidi F (,30) cade ell'itervallo [0,7;3,66] quidi H 0 o può eere rifiutata e quidi o poiamo affermare che la variaza del gee i eame è divera tra teuto malato e cotrollo! bioiformatica 8 Eempio file Excel Fraceco Archetti
Cofroto fra medie: la procedura Prima di iiziare u tet di ipotei tra le medie di due campioi dobbiamo determiare alcue caratteritiche dei campioi: I campioi oo i relazioe fra loro? SI Se eite ua relazioe allora i campioi oo DIPENDENTI. I dati del primo campioe pooo eere accoppiati co quelli del ecodo. I queto cao iamo itereati alle differeze tra i valori accoppiati. Se le popolazioi oo ditribuite ecodo ua ormale ed eite ua relazioe, allora verrà codotto u tet u due medie dipedeti co la ditribuzioe t-studet NO Se NON eite ua relazioe tra le due variabili allora oo INDIPENDENTI. U altra domada: Le variaze oo ote? bioiformatica 9 Fraceco Archetti
Cofroto fra medie Siamo a queto puto i grado di impotare il cofroto tra le medie di campioi Eempio: Coideriamo u gee ( pecifico e be defiito ) miurato i u campioe di 6 pazieti e i uo di 6 cotrolli. Il valor medio è divero ei campioi? Soluzioe: I pai, come abbiamo già vito i precedeza, oo i egueti :.Defiire il problema: dato u igolo gee, queto è epreo i modo differeti ei pazieti e ei cotrolli?.defiire le ipotei: Ipotei ulla H 0 : tutte le miurazioi provegoo da ua uica ditribuzioe; Ipotei di ricerca H a : vi oo ditribuzioi divere che caratterizzao i campioi. Abbiamo ua ituazioe -tail, ache e i valori dei pazieti tedoo a eere uperiori, la trutturazioe i ipotei deve eere a priori ripetto ai dati, riflettere cioè le otre expectatio o comuque iformazioi tratte dalla letteratura H µ 0 : µ H a : µ µ 30 Fraceco Archetti
Cofroto fra medie 3. Scegliere il igificace level : cegliamo di lavorare co u igificace level 5% 4. Scegliere il modello tatitico appropriato e il tet tatitico: la ditribuzioe t è il modello tatitico appropriato. Ache utilizzado lo teo modello tatitico, la procedura di tet, può eere cotruita diveramete i diveri cai :. -tail v.-tail: oe tail deve eere uato quado c è ua cooceza a priori che il et di miurazioi ia più alto o bao ripetto all altro.se o c è cooceza i ua il tet two tail.. Paired v. upaired: u tet paired i ua quado eite ua relazioe aturale tra elemeti dei campioi, metre upaired quado le oervazioi oo i.i.d.. 3. Variaze uguali v. diuguali: il t-tet co variaze uguali è appropriato quado oo coociuti due campioi, o i preume che provegao da ditribuzioi co uguale variaza Nel otro problema o eitoo a priori expectatio che i patiet abbiao u livello uperiore ai cotrolli. Quidi è u tet two-tail. Ioltre o ci oo relazioi tra pazieti e cotrolli quidi u-paired. La celta tra variaze uguali/ divere può eere effettuata co il tet che abbiamo vito. bioiformatica 3 Fraceco Archetti
Variaze uguali e i campioi idipedeti oo tratti da ua popolazioe ormale, la differeza delle medie campioarie ( X X ) arà pure ditribuita ormalmete co valore atteo ( µ µ ). la variaza della differeza fra due variabili è uguale alla omma delle variaze delle σ σ due variabili. Poiamo crivere la variaza di come: + La formula del valore t diviee i queto cao: ( X X ) X µ t e le variaze delle popolazioi oo uguali i può utilizzare la variaza pooled p ( ) + ( ) + Quidi la formula del t tet per campioi idipedeti co la tea variaza è: t ( X X ) ( µ µ ) p + bioiformatica 3 Fraceco Archetti
Variaze uguali I gradi di libertà oo il umero delle miurazioi meo i parametri itermedi; i queto cao ν + - Torado al otro eempio: Gee ID P P P3 P4 P5 P6 C C C3 C4 C5 C6 AC00378 0.66 0.5. 0.83 0.9 0.50 0.4 0.57-0.7 0.50 0. 0.7 X 0.755 e X 0.373 0.059 e 0. 097 Dobbiamo decidere e le variaze oo uguali. Per queto copo uiamo: : σ 0 Uiamo come igificace level il 5% H σ H a : σ σ Calcoliamo F: F 0.059 0.097 0.60 bioiformatica 33 Fraceco Archetti
Variaze uguali La probabilità di otteere queto dato by chace è P-value0.70 (i excel uate la fuzioe Fdit) e quidi l ipotei H 0 ulle variaze o può eere rifiutata per il igificace level celto. Poiamo quidi aumere che i campioi abbiao la tea variaza e calcolare la variaza pooled : p ( ) + ( ) + per giugere fialmete al valore di t: t ( X X ) ( µ µ ) p + (6 ) 0.059 + (6 ) 0.097 0.078 6 + 6 (0.755 0.373) 0 0.078 + 6 6.359 calcolare il p-value o la probabilità di avere quel valore by chace (Tdit i excell) otteedo 0.04. Nel cao di u oe-tail, poiamo rigettare l ipotei ulla (ulle medie), e cocludere che il gee AC00378 è epreo differezialmete tra i pazieti e i cotrolli. al livello di cofideza 5%; el cao two-tail l evideza o è ufficiete per rigettare l ipotei ulla. bioiformatica 34 Fraceco Archetti
Variaze diuguali Se aumiamo che due et di miurazioi provegoo da popolazioi ormali idipedeti, ma o poiamo aumere che quete due popolazioi hao la tea variaza, (abbiamo effettuato u tet F che ci ha forito come riultato il rifiuto dell ipoteti ulla (varvar)) è eceario u t-tet modificato. Il t-value viee acora calcolato come : Il t-value viee acora calcolato come : dove e oo le ripettive variaze dei campioi. Il umero di gradi di libertà arà ora calcolato come: 35 Fraceco Archetti ( ) ( ) + X X t µ µ + + ν bioiformatica 35 Fraceco Archetti Solitamete queto valore o è itero e deve eere arrotodato
Paired t-tetig (campioi i relazioe) I alcue ituazioi le miurazioi oo accoppiate aturalmete, ad eempio: tet imultaei, i cui celle dalla tea cultura oo divie i gruppi ad oguo dei quali viee dato u trattameto divero. Before/after tet: i cui u parametro è miurato prima e dopo il trattameto co ua certa otaza. Matched tet: i oggetti oo uiti i coppie che hao le tee caratteritiche (età,peo,dieta, ) i tutti queti cai le variabili miurate oo dipedeti Per codurre u paired t-tet delle medie abbiamo biogo: La media delle differeze di tutte le coppie, oia: X d La deviazioe tadard della differeza: X d N è uguale al umero di coppie! ( X d X ) d d d X bioiformatica 36 Fraceco Archetti
Paired t-tetig i può coì codurre u t-tet t X d µ d d dove µ d è la differeza tra le medie delle due popolazioi I gradi di libertà di u paired t-tet oo - dove è il umero delle coppie. Se defiiamo L ipotei ulla arà: µ d µ µ H : µ µ : 0 0 H 0 µ µ H 0 : µ d 0 bioiformatica 37 Fraceco Archetti
Paired t-tetig:eempio Growth Hormoe of UCLA Populatio Da u idagie oo tate raccolte le egueti miurazioi dell altezza di 3 tudeti di u college : A queti tudeti è tato dato l ormoe della crecita Laxo. Dopo u mee oo tate raccolte uovamete le loro altezze otteedo la eguete tabella: Il farmaco Laxo ha ucceo ell icremeto della media dell altezza degli tudeti? bioiformatica 38 Fraceco Archetti
Paired t-tetig:eempio. Calcolo della media delle differeze :. Calcolo della deviazioe tadard delle differeze: 3. Ipotei: H 0 : µ d 0 H 0 : µ d 0 X 0.4375 4. Viee codotto u t-tet co igificace level uguale al 5% 5. Gradi di libertà umero di coppie- 3-3 6. Calcoliamo t t X d µ d 7. CONCLUSIONE:poiamo rifiutare l ipotei ulla e quidi poiamo dire che il farmaco Laxo ha ucceo ell icremeto della media dell altezza degli tudeti! d 0.4375 0 0.84 3 39 X d d.946 d ( X d X X d d ) 0.840 Eempio file Excel
Itervallo di cofideza per la differeza tra medie µ -µ Se l ipotei ulla H 0 : µ µ può eere rifiutata, ci poiamo chiedere quato iao differeti le medie. Si può ifatti ricavare la eguete formula del relativo itervallo di cofideza per la differeza µ - µ : C [( X X ) t0 µ µ ( X X ) + t0 ] α X X X X dove il umero di gradi di libertà è ν + - e lo tadard error è: X X + X X p bioiformatica 40 Fraceco Archetti