P.le R. Morand, - 0 MILANO METODI ANALITICI STRUMENTALI: STUDIO DELLA CURVA DI TARATURA RELATORE: N. BOTTAZZINI (UNICHIM) Corso: SISTEMA DI GESTIONE PER LA QUALITA NEI LABORATORI DI ANALISI. Convalda de metod d prova. Tarature e rferltà delle msure Mlano, 9-0 marzo 0
Metod analtc strumental : studo della curva d taratura. Introduzone La taratura è scuramente una delle applcazon pù mportant dell anals d regressone n un laoratoro chmco. In pratca l processo d taratura d un metodo analtco strumentale passa attraverso la costruzone d un modello matematco d complesstà varale n funzone dello specfco prolema. La rcerca d un modello matematco ha lo scopo pratco d permettere d assocare ad una msura strumentale un nformazone chmca utlzzale. Questa nformazone normalmente è la concentrazone d uno o pù analt contenut n un campone d complesstà varale. Per la costruzone d un modello d taratura una quanttà msurata η, normalmente chamata segnale (es. resstenza elettrca, EMF, ph, assoranza ecc.), deve essere posta n relazone con la quanttà ξ, che descrve lo stato o la propretà d un sstema (composzone concentrazone, temperatura, tempo ecc.). In una tpca procedura d taratura qund, un certo numero d campon n, d cu è noto l valore della quanttà ξ, vengono analzzat al fne d msurarne la quanttà η. Se la quanttà ξ è stata msurata spermentalmente e la msura è accurata e precsa, oppure ξ è nota perché s rfersce alla propretà d un materale d rfermento, la quanttà η vene sosttuta da una funzone parametrca d ξ, coè f (ξ,,,.., p ) attraverso un opportuno trattamento de dat che permetta la stma del parametro. Una volta esplctata la relazone funzonale tra ξ e η è possle rcavare, seguendo una drezone opposta alla precedente, l valore ξ d un campone ncognto a cu corrsponde un segnale medo η asato su q msure replcate. L anals d regressone ha l compto d esplctare la relazone funzonale tra le quanttà suddette e rendere possle l espermento d taratura. Poché uno de metod statstc pù utlzzat per la costruzone d un modello d taratura è quello de mnm quadrat, n questa relazone verranno llustrat concett general del metodo, nel caso pù semplce del modello d una retta d taratura. Maggore enfas è stata dedcata ad alcun aspett specfc dell anals d regressone che comunemente vengono trascurat nella quotdantà del lavoro d un laoratoro chmco ma che potenzalmente possono ndurre anche un uon chmco ad ottenere rsultat qualtatvamente scadent. pag. /3
. Il metodo de mnm quadrat Nella maggor parte de cas modell che descrvono la relazone tra l segnale msurato (ad esempo un assoranza) ed una varale nota a pror (es. la concentrazone) sono lnear ed unvarat del tpo: 0. Rcordamo che n questo contesto con la defnzone d modello lneare s ntende ndcare una funzone matematca n cu una varale dpendente è descrtta da una comnazone lneare d pù varal ndpendent. Con unvarata s ntende nvece specfcare che la varale è funzone de valor assunt da un unca varale ndpendente. In una taratura nell potes n cu la effettva relazone funzonale tra le due varal ed è quella lneare, l segnale può essere rappresentato come somma d due contrut d cu uno è determnstco e rappresenta l modello vero e propro, l altro è casuale e rappresenta la varaltà spermentale assocato ad ogn msura d : α β e S deve qund applcare un qualche metodo d natura statstca per ottenere una stma 0 e de coeffcent del modello α e β. Nel caso n cu s applch l metodo de mnm quadrat, la stma vene fatta rendendo mnma la somma de quadrat de resdu : mn ( Σ e ) I resdu e per le osservazon (..n) rappresentano la dfferenza tra valor osservat e quell ŷ calcolat dal modello: e qund e ŷ e ŷ o eq.. 0 La stma a mnm quadrat d α e β s rcava come gà detto mnmzzando S coè la somma de quadrat de resdu: S Σ e Σ ( 0. ) Questo può essere fatto dfferenzando rspetto a due parametr 0 e la funzone precedente ed mponendo le funzon dervate rsultant ugual a zero: S o ( o ) 0 pag. /3
S ( o ) 0 Dalle equazon precedent s ottengono relaorando le seguent relazon: 0 n 0 Queste ultme sono comunemente chamate equazon normal. Rsolvendo l sstema delle due equazon precedent rspetto a, coè l coeffcente angolare della retta, s ottene la seguente soluzone: [( ) ( )] / n ( ) ( ) eq.. ( ) / n ( ) n cu le sommatore contenute nell equazone scorrono sull ndce da ad n coè l numero totale d osservazon. I due numerator sono ovvamente due forme dverse con le qual vene espressa la stessa quanttà, nfatt se: (... n ) / n / n ed (... n ) / n / n allora s ha che: )( ) n n ( ( )( ) / n La soluzone per 0, coè per l ntercetta ad 0, delle equazon normal per una retta è nvece la seguente: 0 eq..3 sosttuendo quest ultma nella eq.. s ottene l equazone d regressone nella seguente forma: dalla quale s può notare che se ponamo ŷ ( ) eq..4 ne segue che ˆ. Cò sgnfca che l punto (, ) appartene alla retta d regressone o, capovolgendo la prospettva precedente, ogn retta d regressone passa per l centro de dat spermental. L utlzzo del metodo de mnm quadrat n una anals d regressone è vncolato alle seguent assunzon d ase: pag. 3/3
. I resdu e sono varal casual con meda zero e varanza σ (normalmente sconoscuta).. I resdu e sono ndpendent, coè completamente decorrelat: cov (e, e j ) 0 per ogn j. 3. Tutt resdu e hanno eguale varanza σ. Questo sgnfca che la varanza de resdu è costante sull ntero ntervallo d concentrazon esplorato, rsultando qund ndpendente dal valore della concentrazone. Questa propretà è normalmente denomnata omoscedastctà. La fgura llustra le assunzon rguardant resdu e (α β σ ) X N Modello X ŷ αβ Fgura Il valore aspettato d sarà qund 0., e la varanza d sarà σ. Tuttava è mportante rcordare che ne cas real non sempre la varanza de resdu σ è sempre la stessa per ogn lvello d al quale s effettuano una o pù msure replcate del segnale. In quest cas s dentfca l prolema con l termne d eteroscedastctà: una stuazone mportante n chmca analtca è quella d uno scarto tpo relatvo costante. Esemp eteroscedastctà sono rportat n Fgura. Fgura pag. 4/3
3. Anals de resdu L anals de resdu è una fase estremamente mportante nella valdazone d un modello d taratura. Essa fornsce nformazon relatvamente alle possl devazon dalle assunzon mposte dal metodo de mnm quadrat, oltre a quella relatva alla adeguatezza del modello lneare stmato. 3. Metod grafc L anals de resdu può essere effettuata attraverso una valutazone vsva d alcun grafc tpc che accompagnano tutt softare d statstca professonal pù comun. Tra tutt quell possl s suggersce l utlzzo frequente de seguent: 8 Dstruzone de resdu t.q. 6 4 Epected Normal No d osservazon 0 8 6 4 0-8 -6-4 - 0 4 6 8 Fgura 3 a) anals della dstruzone de resdu attraverso grafc a arre. La semplce anals vsva permette la verfca dell assunzone fatta sulla normaltà della dstruzone delle msure della varale (ved Fgura 3). E ene rcordare che se l numero d osservazon è rdotto non è però possle rcavare un nformazone utle da questo tpo d grafc ) anals de resdu vsualzzat contro valor spermental o calcolat dal modello oppure contro valor della varale. In generale n questo tpo d grafc, s ottengono delle dstruzon avent delle forme sml a quelle mostrate n fgura 4. pag. 5/3
Fgura 4 Il prmo s ottene quando s è n presenza d una varaltà omogenea ed l modello scelto è corretto, l secondo s ottene quando la condzone d omoscedastctà non è rspettata. In quest cas potreero essere d auto cosddett mnm quadrat pesat o un opportuna trasformazone de dat orgnal. Il terzo suggersce che l modello non è generalmente valdo. Il quarto caso mostra charamente che l modello lneare non è adatto, poché la relazone tra dat è strettamente non lneare n tutto l ntervallo ndagato. In pratca quando vengono analzzat resdu attraverso le loro rappresentazon grafche s devono ndvduare: a) la forma del grafco ) un numero d resdu postv crca uguale al numero d resdu negatv c) una sequenza suffcentemente casuale d segn e de resdu stess d) l eventuale presenza d anomal, coè d resdu charamente pù amp rspetto a valor generalmente osservat. Spesso oltre ad una anals de resdu d regressone grezz s utlzzano cosddett resdu normalzzat defnt dalla seguente: ê ê N s dove s, lo scarto tpo de resdu d regressone con n- grad d lertà, è dato da : ( ˆ ) s n I resdu normalzzat possono essere utl alla verfca della condzone d omoscedastctà o n alcun cas, alla dentfcazone d anomal eventualmente present ne dat; tpcamente quando ê N > 3 l osservazone vene rconoscuta anomala. La capactà d evdenzare le osservazon anomale attraverso resdu normalzzat, dmnusce però andando dalle osservazon central, verso quelle pù esterne dell ntervallo d taratura. Un altro tpo d resdu che dovreero essere correntemente analzzat sono cosddett resdu razonalzzat defnt dalla relazone: pag. 6/3
ê ê S s h dove h sono valor d leaverage che, per una regressone lneare monovarata, sono calcolat n ase alla seguente relazone: h ( ) n ( ) S not che leaverage assumono valor compres tra /n ed per tutt valor ntern all ntervallo d taratura. I valor h assumono valor mnm per punt n prossmtà del centrode de dat coè l punto (, ), e raggungono valor prossm ad n corrspondenza degl estrem dell ntervallo d taratura studato. Per quanto detto rsulta charo che l utlzzo de resdu razonalzzat permette d evdenzare maggormente l eventuale occorrenza d anomal, anche n prossmtà delle regon pù esterne dell ntervallo d taratura. S può dmostrare che l valore massmo accessle per resdu razonalzzat è, nel caso d una regressone lneare semplce, par a: ê ma n. 3. Metod statstc S I metod statstc applcal all anals de resdu sono costtut essenzalmente da test tpc utlzzat per verfcare la normaltà d una certa dstruzone e da test utlzzat per l confronto d varanze. S deve tener conto però che la valdtà d tal test è fortemente nfluenzata dalla cosddetta numerostà camponara, coè dal numero d msure fatte e/o replcate. D conseguenza, poché nella pratca l numero d osservazon è sempre aastanza rdotto non s consgla l utlzzo d tal metod. Molto spesso la rappresentazone grafca de resdu contene nformazone suffcente per verfcare l rspetto delle condzon d applcaltà del metodo de mnm quadrat; n aggunta potremmo anche dre che n generale, l applcazone de test statstc nell amto dell anals d regressone ha un senso solo dopo che l modello sa stato confermato da un esame grafco de resdu. 4. Anals della varanza La seguente somma d quadrat: T j ( ) SS,j rappresenta la varazone de valor d rspetto al valore medo. Parte d questa varazone può essere attruta al modello d regressone e una parte al fatto che le osservazon non pag. 7/3
stanno perfettamente sulla retta d regressone. La quanttà SS T può essere qund spezzata n due somme d quadrat: a) la SS dovuta alla regressone (SS REG ) che rappresenta la parte d SS T spegata dal modello; ) la SS ntorno alla regressone o anche SS (SS R ) resduale che rappresenta cò che l modello non spega de dat orgnal. A sua volta la quanttà SS R può essere decomposta n altre due component: a) quella dovuta alla varaltà osservata all nterno d un gruppo d msure replcate normalmente ndcata con SS PE coè somma de quadrat dovuta alla pura varaltà casuale ; ) quella dovuta alla varaltà delle mede d gruppo rspetto alla retta d regressone. Questa vene normalmente ndcata con SS LOF coè somma de quadrat dovuta al dfetto d approssmazone. Supponendo qund che, per ogn lvello d concentrazone ( con,,k ) vengano effettuate n osservazon j ( con j,.,n ), la quanttà SS T può essere decomposta complessvamente n tre contrut: dove j ( j ) ( ŷ ) (ŷ ) è l valor medo d ogn gruppo d msure replcate j alla concentrazone e valore d stmato dal modello al lvello. ŷ è l Elevando al quadrato tutt termn della precedente uguaglanza e sommando rspetto a e j s ottene la seguente: dove ( j ) ( ) n ( ŷ ) n (ŷ ) eq. 4. j ( PE j ) j j j SS SS n ( ŷ SS n (ŷ LOF ) REG ) Ovvamente la forma dell eq. 4. s semplfcherà nel caso n cu n coè n assenza d msure replcate. Possamo qund rscrvere l eq. 4., n ase alle defnzon precedent nel seguente modo: che n assenza d msure replcate dventerà: SS T SS REG SS PE SS LOF SS T SS REG SS R Dove SS R è la somma de quadrat de resdu coè: pag. 8/3
SS R ( ŷ ) Un semplce schema rassuntvo relatvo alla scomposzone della varanza totale d ne var contrut è rportato n fgura 5. SS T SS REG SS R SS PE SS LOF Fgura 5 Ad ogn somma d quadrat è sempre assocato un numero che rappresenta cosddett grad d lertà ( degrees of freedom df) della somma stessa. Questo numero ndca quante part d nformazone ndpendent sono necessare per calcolare quella partcolare somma d quadrat. Per esempo la quanttà SS T è caratterzzata da Σn grad d lertà questo perché la somma d tutt gl j, che saranno n totale k.n, sarà uguale a zero per la defnzone stessa della meda. Il prmo termne a destra dell eq. 4. coè SS PE avrà nvece df PE Σ (n - ) Σ n k. SS REG avrà nvece un unco grado d lertà df REG essendo tale somma dpendente soltanto da ; s può nfatt dmostrare che: n (ŷ ) n ( ) I grad d lertà d SS R sono par a df R Σ n - essendo tale somma rcavata dalla dfferenza SS T -SS REG. Analogamente grad d lertà assocat alla quanttà SS LOF possono essere calcolat come dfferenza tra quell d SS R e SS PE, nfatt: df LOF df R - df PE Σ n - Σ n k k I programm d statstca pù evolut quando effettuano una anals d regressone fornscono, oltre a parametr stmat e loro ntervall d fduca assocat, anche una taella rassuntva pag. 9/3
contenente l anals delle vare sorgent d varanza, la cosddetta taella ANOVA. La taella vene costruta n ase alle quanttà descrtte precedentemente ed è utlzzata per effettuare test F per la sgnfcatvtà del modello d regressone e per la conferma della lneartà n presenza d msure replcate. I test F non sono effettuat drettamente sulle sommatore de quadrat ma su loro valor med, calcolat n ase a rspettv grad d lertà. I valor med sono ndcat con MS SS / df (Mean Squares) e vengono comnat per esegure test F nel modo seguente: F MS REG / MS R per la valdazone del modello d regressone F MS LOF / MS PE per la verfca dell potes d lneartà del modello Nel caso n cu l modello d regressone venga stmato sulla ase d un numero ndefntamente grande d osservazon, la quanttà MS R - talvolta ndcata anche con s, σ XY o s / - rappresenta la msura della varaltà che accompagna l rcalcolo d un qualunque valore osservato ad un dato usando l equazone del modello. L anals della varanza vene normalmente presentata n forma d taella n cu sono ndcate: la sorgente source, grad d lertà df, la somma de quadrat SS, l valore medo de quadrat MS, ed nfne l valore per esegure l test F. Un esempo d anals della varanza è rportato nella taella successva: Taella ANOVA Source SS df MS F Regresson SS REG 447.4 MS REG 447.4 09.7 Resdual SS R 06. 8 MS R 5.9 Lack of ft SS LOF 87.6 3 MS LOF 9. 4.3 Wthn-groups SS PE 8.5 5 MS PE. Total SS T 553.5 9 L esempo s rfersce ad un caso con n Σ n 0 (con,...,k) e con k 5. Nella taella s osserva noltre un valore F MS LOF / MS PE 4.3 che, se confrontato con l valore taulato F 0. 05 5 3, 3.9, ndca come l termne MS LOF sa sgnfcatvamente preponderante rspetto a MS PE ; d conseguenza l modello scelto non rsulta essere adeguato nel descrvere la vera relazone tra le varal e. pag. 0/3
L anals della varanza n presenza d msure replcate rappresenta un utle strumento per verfcare a pror l potes d lneartà del modello d taratura; v sono tuttava altr tp d test utlzzal a tal fne che prendono l nome d test a posteror ne qual, a dfferenza del caso precedente, l modello lneare vene confrontato con un modello alternatvo non lneare. I test a posteror sono asat sul confronto tra le varanze de resdu d un modello lneare con quell d un modello non lneare : l prmo d quest confronta valore d con s ln coè la varanza de resdu del modello lneare s nonlnl coè la varanza de resdu del modello non lneare d rfermento secondo l seguente rapporto: F s ln / s nonlnl Se l valore d F calcolato è superore a quello crtco taulato, l potes d lneartà del modello deve essere rfutata. S rcorda che grad d lertà anche nel caso d un modello non lneare sono dat da n-p dove p sono parametr stmat dal modello. l secondo, denomnato anche test d Mandel, è asato sul calcolo del seguente rapporto: dove: F DS / s nonlnl DS (n-) sln - (n-3) s nonlnl se l modello non lneare è quello d una curva d secondo grado. Infatt, l test d Mandel vene tpcamente applcato al confronto tra l modello d una retta e quello d una paraola : l valore d F crtco è quello taulato, ad un dato lvello d rscho accettato, per un numeratore con un grado d lertà, ed un denomnatore con n-3 grad d lertà. Se l valore d F calcolato è superore a quello crtco taulato, l potes d lneartà del modello deve essere rfutata. Il vantaggo de test a posteror consste nel fatto che non sono necessare msure replcate. 4.. Il coeffcente d determnazone R e quello d correlazone r Uno de parametr pù usat da chmc nell anals d regressone è l cosddetto R, che rappresenta la frazone d varanza spegata dal modello rspetto alla varanza complessva delle spermental. L espressone matematca d R è la seguente: R SS SS REG T SST SS SS T R SS SS R T pag. /3
Il valore d R può assumere valor compres tra 0 ed rspettvamente ne cas d assoluta nadeguatezza del modello e d assoluta perfezone del modello stesso. Un parametro che può essere dervato drettamente da R, è l coeffcente d correlazone r che rappresenta n generale l parametro statstco pù ausato tra quell che accompagnano l anals d regressone. Il coeffcente d correlazone assume valor compres tra e e può essere calcolato n ase alla seguente relazone: r (segno d ). (R ) / E ene a questo punto precsare che l anals d regressone e quella d correlazone sono concettualmente dstnte anche se matematcamente rsultano essere tra loro legate. L anals d regressone semplce, nfatt, c dce n che modo le varal sono legate lnearmente, mentre l anals d correlazone c ndca l grado o l ntenstà del legame lneare tra le varal. Tuttava l coeffcente d correlazone vene spesso nterpretato come una msura dretta della qualtà del modello d taratura ottenuto. L uso generalzzato che è stato fatto del coeffcente d correlazone r, è proalmente dovuto al suo facle calcolo ed all mmedatezza d nterpretazone. Tale mmedatezza è però solo apparente e ha portato, n alcun cas, ad nterpretazon grossolane. E pratca aastanza comune nfatt parlare d regressone eccellente quando r è compreso tra 0.99 ed mentre la regressone è defnta soddsfacente se r è compreso tra 0.95 e 0.99. Per valor nferor a 0.90 la regressone è valutata scuramente come scadente. Questo crtero nterpretatvo, o qualunque altro ad esso analogo, non è corretto per due motv fondamental: - la qualtà d una regressone s compone d due aspett: l accuratezza con cu l equazone d regressone descrve dat spermental, ndspensale quando la regressone vene usata a scopo predttvo, e la sgnfcatvtà de coeffcent d regressone, che è ndspensale per la spegazone e la dscussone de rsultat. Il coeffcente d correlazone però è nterpretale n termn d qualtà della correlazone puttosto che n termn d sgnfcatvtà de coeffcent d regressone. - la sgnfcatvtà del coeffcente d correlazone dpende dal numero de punt n goco e dall ntervallo d varazone dalla varale ndpendente, d conseguenza un coeffcente d correlazone non può essere uono o scadente n assoluto, ma la sua sgnfcatvtà dovrà essere gudcata attraverso l utlzzo d un opportuno test statstco. pag. /3
5. Intervall d fduca La stma de parametr d regressone 0 e, è accompagnata da un certo grado d ncertezza dovuta alla presenza della varaltà casuale; tale ndetermnazone genera un ntervallo d fduca per ogn parametro stmato del modello, la cu ampezza dpende dalla qualtà del modello stesso e dal grado d ndetermnazone accettato. 5.. Intervallo d fduca d Aamo vsto precedentemente che: ( ) ( ( ) ) questa può essere rscrtta anche nel seguente modo: ( ( ) ) {( )... ( n ) n } ( ) essendo che per l termne al numeratore vale la seguente: ( ) ( ) 0 E anche noto che la varanza d una funzone del tpo: può essere calcolata nel modo seguente: V(a) a a Y a Y... a nyn a V(Y ) a V(Y )... a n V(Y qund se termn Y sono tra loro a coppe non correlat, termn a sono delle costant ed nfne se V(Y ) s allora s ha che: V(a) ( a ) a... a n ) s s (a Nell espressone relatva al calcolo d termn n ) ( ) /( ( possono essere ) dentfcat con gl a potendo consderare sngol valor delle costant. Qund dopo rduzone s ottene: dove s è la varanza de resdu della regressone. s V () s eq. 5. ( ) pag. 3/3
E nteressante osservare che la varanza d può essere rdotta massmzzando la sommatora al denomnatore. Tale sommatora dpende dal dsegno spermentale utlzzato che avree come soluzone deale quella d due o pù punt raggruppat agl estrem dell ntervallo de valor d consderat. E charo però che, per realzzare questo tpo d stratega spermentale, lo spermentatore deve essere assolutamente certo che l vero modello che lega le due varal sa quello d una retta. Lo scarto tpo d corrsponderà alla radce quadrata della sua varanza: s s. Assumendo che le varazon delle osservazon rspetto alla retta d regressone appartengano tutte alla stessa dstruzone normale, allora l ntervallo d fduca relatvo alla stma d 0.05 sarà: ± t n s. Dove 0.05 n t è l valore relatvo al 95% d una dstruzone t con n- grad d lertà. Ovvamente l lvello d rscho accettato, può essere dverso ed assumere valor pù pccol del 5%; n questo caso l valore d t d rfermento crescerà anche a partà d grad d lertà. Normalmente alla stma de parametr d regressone è assocato anche l cosddetto t-test, coè s verfca che l valore stmato non sa sgnfcatvamente dverso da un valore d rfermento β. In pratca s verfca che l rapporto t ( - β ) / s sa un valore - preso come valore assoluto - mnore del valore taulato della t d Student con n- grad d lertà e relatvo al lvello d rscho accettato. 5.. Intervallo d fduca d 0 Analogamente a quanto vsto n precedenza è possle calcolare un ntervallo d fduca ed esegure un t-test anche per l ntercetta della retta d regressone coè 0. Infatt dall eq..3: 0 ed essendo e 0 non correlat s può applcare la formula per l calcolo della varanza d una generca funzone V(a) e, tenendo conto che è una costante s ha che: s s V ( 0 ) V() V() s eq. 5. n ( ) n ( ) Dall equazone del calcolo della varanza d 0 s rcavano analogamente al caso del parametro lo scarto tpo s o (V( 0 )) 0.5 e l ntervallo d fduca 0.05 0 t n s ±. Il t-test vene effettuato 0 ovvamente nello stesso modo descrtto per. pag. 4/3
5.3. Intervallo d fduca e d predzone d ŷ Aamo precedentemente mostrato che l equazone della retta d regressone poteva essere scrtta nella forma: ŷ ( ) eq..4 Applcando qund un procedmento analogo a quello utlzzato per parametr 0 e, possamo rcavare una funzone d varanza e qund uno scarto tpo de valor d calcolat dal modello n corrspondenza d ogn valore d : s s ( ) V (ŷ) V() ( ) V() ( ) s ( eq. 5.3 n ) n ( ) S può qund calcolare l ncertezza della stma d, con un rscho assocato del 5% con la relazone: 0.05 ŷ ± t n s. ŷ Un aspetto nteressante contenuto nell eq. 5.3 è che l ndetermnazone nella stma d ŷ rsulta mnma quando ŷ e vale s s / n. Al contraro, all aumentare della dstanza d da, aumenta l ncertezza sulla stma d ŷ. Le predzon mglor saranno effettual nella zona centrale dell ntervallo d varazone della varale, mentre peggoreranno n prossmtà degl estrem. Oltre questo punto la predzone sarà ancora meno attendle perché estranea all esperenza acqusta dal modello. E orma dffusa ne programm d statstca modern, la uona pratca d mostrare le cosddette ande d fduca della regressone - talvolta chamate anche regon d Workng-Hotellng - ad un certo lvello d rscho. Queste ande sono delle perol calcolate con una relazone del tpo 80 70 0.05 ŷ ± t n s e rsulteranno per ŷ 60 una stessa sere d dat (,) pù o meno ampe a secondo del lmte d fduca scelto (95%, 99%, ecc.). Un esempo è rportato n Fgura 6. Y 50 40 30 0 0 50 50 50 350 450 550 X Fgura 6 pag. 5/3
Il calcolo dell ntervallo d predzone d un nuovo valore 0 ad un corrspondente 0 sarà nvece calcolato n ase alla seguente relazone: 0.05 ( 0 ) 0 t n s n ( ) / ± eq. 5.4 Questo ntervallo ntorno al valore d calcolato, è aumentato rspetto al precedente per cu le ande cosddette d predzone sono pù ampe d quelle d fduca della regressone stessa. Nel caso n cu s effettuno q msure replcate d per un dato lvello 0 allora l equazone precedente s trasforma nella seguente: / 0.05 (0 ) 0 t n s q n ( ) ± eq. 5.5 5.4 Regressone nversa S parla d regressone nversa quando vene utlzzata la retta d regressone calcolata al fne d stmare un valore ˆ quando è noto, perché msurato, l valore. Quest ultmo può essere dervato da una msura sngola (q) oppure dal valore medo d pù msure replcate q dello stesso campone. La regressone nversa costtusce lo scopo prmaro d un anals d regressone nell amto della chmca analtca. Il calcolo d seguent espresson: ˆ può essere fatto con una delle ˆ ( ) oppure ˆ 0 Mentre l ntervallo d predzone ntorno al valore d seguent relazon: ˆ stmato può essere calcolato dalle ˆ / 0.05 ( ) s t n n ( ) ± eq. 5.6 per q > ˆ 0.05 ( ) s ± tn eq. 5.7 ( ) q n / pag. 6/3
sempre potzzando un rscho accettato per la predzone d ˆ par al 5%. E evdente da quanto detto che le ande d predzone saranno tanto pù strette quanto pù aumentano l numero d msure replcate e l numero totale d punt. E mportante sottolneare che le equazon 5.6 e 5.7, sono delle formule approssmate la cu valdtà è verfcata quando la funzone: g t / s ( ) assume un valore mnore a 0.05. Per avere valor d g nferor al valore precedentemente ndcato è evdente che e ( ) deano essere relatvamente grand mentre s suffcentemente pccolo. Prma d usare le equazon 5.6 e 5.7 per la determnazone dell ncertezza che accompagna la stma d una data concentrazone verfcare che l valore d g sa nferore al valore massmo accettale. ˆ, è consglato 6. La valdazone della procedura d taratura Prma d poter utlzzare un modello d taratura al fne d produrre un dato analtco, la procedura d taratura dovree essere valdata spermentalmente. La fase d valdazone ha l compto d defnre la capactà predttva del modello date certe modaltà operatve. Una modaltà d valdazone molto semplce consste nell effettuare la determnazone della concentrazone d materal d rfermento attraverso l applcazone del modello d taratura. Le concentrazon stmate est. possono essere confrontate con quelle note true attraverso la costruzone d un modello lneare del tpo: est 0 ( true ) I valor aspettat de coeffcent del modello saranno: 0 0 e. Applcando le equazon vste n precedenza s calcoleranno coeffcent del modello, l ncertezza assocata alla loro stma, e s verfcheranno le potes: H 0 : 0 0 contro H A : 0 0 e H 0 : contro H A : attraverso l esecuzone d un t-test come gà descrtto. Lo scopo d questa modaltà d valdazone è quello d verfcare l assenza d scostament sstematc nella capactà predttva del modello d taratura ottenuto. Tuttava è ene rcordare che oltre al rfuto delle potes precedent, n condzon deal, c s aspetta anche d trovare degl ntervall d fduca de parametr del modello d valdazone molto rstrett. pag. 7/3
7. I mnm quadrat n presenza d eteroscedastctà Per molte procedure analtche, la condzone d varanza unforme lungo tutto l ntervallo d valor d, sul quale è stata costruta la retta d taratura, non vene rspettata. In quest cas cade una delle condzon necessare per applcare l metodo de mnm quadrat per l calcolo della retta d taratura, almeno nella modaltà precedentemente descrtta. In generale la presenza d una condzone d eteroscedastctà comporta una perdta d accuratezza nel calcolo della retta d taratura. I motv che portano ad una varanza del segnale non unforme sono molteplc ed mputal normalmente a sorgent d rumore contenute nella strumentazone analtca; queste generano una varanza ntrnseca del segnale msurato che rsulta essere una qualche funzone del segnale stesso. Per queste ragon saree qund ndspensale verfcare sempre la condzone d omoscedastctà. Per effettuare tale verfca, l modo concettualmente pù semplce è quello d fare un numero d msure replcate suffcentemente grande almeno a tre lvell d corrspondent alle due zone prossme agl estrem dell ntervallo d taratura e a quella centrale. Se l numero d replche è suffcentemente grande sarà possle stmare la varanza del segnale con uona accuratezza e qund verfcarne l andamento rspetto al valore del segnale. L anals grafca de resdu può dare nformazon qualtatve drette sull eventuale presenza d eteroscedastctà. Nel caso d pù msure replcate ad almeno due lvell, concdent o molto prossm agl estrem dell ntervallo d taratura, la condzone d omoscedastctà può essere verfcata attraverso l applcazone d un F test sulle varanze de due sottogrupp d msure replcate: sma F ma s mn Per esegure questo test l numero d replche q de due sottogruppo deve essere uguale. E mportante sottolneare che le sorgent d eteroscedastctà del segnale saranno vsl solo se la varaltà casuale assocata alla preparazone d pù campon ugual è nferore a quella del segnale msurato. E ene noltre non dmentcare che una msura replcata non consste nell esegure pù volte la msura d una stessa soluzone d un analta ad una data concentrazone, ensì d effettuare una sola msura per pù soluzon dello stesso analta preparate alla stessa concentrazone. La rmozone dell eteroscedastctà può n alcun cas essere raggunta attraverso una qualche trasformazone della varale eteroscedastca. Tra le trasformazon pù comun rcordamo la trasformazone logartmca z log, la trasformazone z / oppure la trasformazone z /. pag. 8/3
Per evtare che le trasformazon modfchno la natura della relazone lneare tra la e la la stessa trasformazone deve essere applcata alla varale : log 0 log 0 0 Un effetto collaterale alla trasformazone delle varal è che n funzone del tpo d trasformazone matematca, quando s utlzza l modello d taratura per determnare un valore d 0 msurato un 0, gl ntervall d fduca tradott nella scala della varale orgnale possono non essere smmetrc oppure rchedere delle trasformazon successve per rcondurl alla varale orgnale. 8. I mnm quadrat pesat In chmca analtca l calcolo d una curva d taratura utlzzando l metodo de mnm quadrat ordnar è ampamente dffuso anche quando è noto che la varaltà assocata al segnale msurato è funzone dell ntenstà del segnale stesso. Esemp d tecnche analtche generalmente affette da eteroscedastctà sono: metod gas-cromatografc, metod l cu segnale msurato è un conteggo e metod fotometrc. Le ragon d una varaltà casuale non omogenea all nterno del domno spermentale d taratura possono essere molteplc, n alcun cas una varaltà non unforme è aspettata su ase teorca come nel caso de contegg, n altr cas la dmnuzone della precsone del segnale msurato è funzone d un aumento del rumore (d natura stocastca) dovuto a fotomoltplcator, a fluttuazon delle sorgent d luce, all elettronca dell apparecchatura, alla non omogenetà d una famma ed altr ancora. L aumento della varaltà casuale nel segnale che s genera alle concentrazon pù alte ha come conseguenza pratca che campon ncognt a pù assa concentrazone avranno uno scostamento da valor real nutlmente maggore, così come pù ampa sarà l ncertezza ad ess assocata. L aumentata ncertezza per le concentrazon pù asse comporterà anche un ncremento de lmt d rvelaltà e d quantfcazone: n altr termn n presenza d eteroscedastctà la curva d taratura rsulterà meno precsa. Per rsolvere questo prolema, è possle rpartre l domno spermentale delle concentrazon nzal n due o pù ntervall costruendo per ognuno d ess la corrspondente curva d taratura. Se all nterno d ogn nuovo domno spermentale la varaltà casuale assocata al segnale rsulta sostanzalmente omogenea (ved test F), è accettale l utlzzo de mnm quadrat ordnar per la costruzone pag. 9/3
d curve d taratura local. Nell potes che la varanza del segnale aument monotoncamente con l valore del segnale stesso, s avrà che la curva d taratura calcolata nel domno delle asse concentrazon sarà caratterzzata da una precsone maggore rspetto alla curva d taratura ottenuta nel domno delle alte concentrazon. Un metodo molto pù consstente per la costruzone d una curva d taratura n caso d dat caratterzzat da eteroscedastctà rconoscuta è quello de mnm quadrat pesat. Per quanto l metodo sa noto da molto tempo, l suo mpego n chmca analtca non è partcolarmente dffuso nonostante alcune lnee guda o manual ne sollectno un utlzzo pù sstematco. Tra le possl ragon della scarsa popolartà del metodo de mnm quadrat pesat nel calcolo della curva d taratura possamo ndcare la poca famlartà del chmco con concett d questo tpo d statstca e la scarstà d softare d mmedato utlzzo. UNICHIM, comunque, ha recentemente (6 maggo 003) presentato un softare convaldato che, tra l altro, rporta le modaltà per trattare tarature secondo mnm quadrat pesat. 8.. Calcolo del modello d regressone L applcazone del metodo de mnm quadrat pesat consste: (a) nella stma de pes da assocare ad ogn valore d con la relazone generalmente la varanza delle msure. ˆ dove / σ () nel calcolo del modello d regressone con l metodo de mnm quadrat pesat (WLS). ˆ σ è Il calcolo del modello d taratura attraverso l metodo WLS prevede d assocare un peso ad ogn osservazone n modo tale che, resdu pesat della regressone, sano caratterzzat da una varanza costante σ. Questo vene fatto sceglendo de pes come descrtto precedentemente al punto a), rducendo l mportanza d que dat caratterzzat da una mnore precsone. La funzone oettvo sarà analoga a quella de mnm quadrat a meno de pes : S Σ. e Σ. ( 0. ) Al fne d dmostrare la logca con la quale vengono scelt pes n ase alla ˆ / σ supponamo d moltplcare entram termn dell equazone relatva al modello d una retta per : / pag. 0/3
pag. /3 o ε / / / / per cu la varanza de resdu pesat dventa costante come s può dmostrare applcando la formula della varanza V(a. ) a. V(), ed assumendo che ˆ / σ : V( /. ε ). V(ε ) /σ. σ Le stme de parametr del modello d taratura secondo l metodo WLS s ottengono applcando le seguent formule: ( )( ) ( ) n n eq. 8. 0 eq.8. dove: n / eq.8.3 e: / e / I pes così trasformat (eq. 8.3) sono scalat n modo tale che n dove n è l numero d osservazon effettuate. La varanza pesata de resdu è data n questo caso dalla seguente relazone: ( ) ˆ n s eq. 8.4 Le ande d fduca ntorno alla retta d taratura sono calcolal con relazon analoghe a quelle determnate per mnm quadrat classc: ± 0.05 ) ( ) ( ˆ n o s t eq. 8.5 Il calcolo dell ntervallo d predzone d un nuovo valore 0 ad un corrspondente 0 sarà nvece calcolato n ase alla seguente relazone: / 0 0.05 0 ) ( ) ( ± o n s t eq. 8.6 Nel caso n cu 0 sa l valore medo ottenuto da q msure replcate ad un dato lvello 0 allora l equazone precedente s trasforma nella seguente:
pag. /3 / 0 0.05 0 ) ( ) ( ± o n s q t eq. 8.7 Utlzzando un modello d taratura pesato per la stma d una concentrazone ncognta ˆ corrspondente ad un valore msurato s dovranno utlzzare le seguent relazon: ) ( ˆ eq. 8.8 / 0.05 ) ( ) ( ˆ ± o n s q t eq. 8.9 dove l calcolo dell ntervallo d predzone della concentrazone ncognta è stato espresso nella sua forma pù generale comprendente anche l caso n qu sa un valore medo ottenuto da q msure replcate.
Blografa [] Agterdenos, J.; Maessen, F.J.M.J.; Balke, J. Calraton n quanttatve analss. Part I. General consderatons, Anal. Chm. Acta, 979, 08, 35 [] Agterdenos, J.; Maessen, F.J.M.J.; Balke, J. Calraton n quanttatve analss. Part II. Confdence regons for the sample content n the case of lnear calraton relatons, Anal. Chm. Acta, 98, 3, 7 [3] Danzer, K.; Curre, L.A. Gudelnes for calraton n analtcal chemstr Part : Fundamentals and sngle component calraton, Pure & Appl. Chem. 998, 70, 993 [4] Davdan, M.; Haaland, P.D. Regresson and calraton th nonconstant error varance Chemom. Intell. La. Sst. 990, 9, 3 [5] Draper, N.R.; Smth, H. Appled Regresson Analss, Wle, Ne York, nd Ed., 98 [6] Harter, H.L. The method of Least Squares and some alternatves, Parts I-IV, Intern. Statst. Rev. 974, 4, 47 (I); 35 (II); 975, 43, (III); 69 (IV) [7] Huau, A.; Vos, G. Decson and Detecton lmts for Lnear Calraton Curves Anal. Chem., 970, 4, 849 [8] Hunter, J.S. Calraton and the straght lne: Current statstcal practces, J. Assoc. Off. Anal. Chem., 98, 574 [9] MacTaggart, D.L.; Farell, S.O. Analtcal use of lnear regresson, Part I: Regresson procedures for calraton and quanttaton, J. Assoc. Off. Anal. Chem., 99, 75, 594 [0] Massart, D.L.; Vandegnste, B.G.M.; Demng, S.N.; Mchotte, Y.; Kaufman, L. Chemometrcs: a tetook, Elsever, Ne York, 988 [] Meloun, M.; Mltk, J.; Forna M. Chemometrcs for Analtcal Chemstr, Vol., Ells Horood, Ne York, 994 [] Mller, J.N. Basc Statstcal Methods for Analtcal Chemstr Part. Calraton and Regresson Methods. A Reve Analst, 99, 6, 9 pag. 3/3