Laboratoro B A.A. 013/014 Elaborazone Dat Lab B CdL Fsca
Elaborazone dat spermental Come rassumere un nseme d dat spermental? Una statstca è propro un numero calcolato a partre da dat stess. La Statstca descrttva fornsce mezz per rassumere le propretà d un campone d dat (molt numer) n modo che possano essere comuncat effcacemente (con poch numer). Metod numerc e grafc vengono utlzzat nella EDA (Exploratory Data Analyss) per semplfcare le cose meno nteressant e rvelare gl aspett nattes e/o anomal del campone d dat. Uno de prncp fondamental d una buona anals dat è: rportare sempre n grafco dat! Lab B CdL Fsca
Presentazone dat spermental - 1 Prma d nzare un espermento è opportuno, sulla base dell anals prelmnare, predsporre una tabella per la raccolta ordnata de dat. La tabella potrà contenere: l numero progressvo delle msure effettuate, valor ottenut nella msura, corrspondent error, valor med, la varanza, la devazone standard, etc. I dat spermental s possono presentare n vare forme (mono-, b-, tr- e mult-dmensonal), tuttava sono usualmente rappresentat a schermo o su carta (così da apparre bdmensonal, anche se n realtà potrebbero non esserlo). Lab B CdL Fsca
Presentazone dat spermental - La rappresentazone attraverso tabelle e stogramm fornsce utl nformazon per ndvduare e comprendere le relazon tra dat. Il modo pù semplce e mmedato per ndagare la possble relazone tra due grandezze è quello d costrure un grafco. Esempo: Dlatazone elastca d un corpo n funzone della forza applcata Dl = K m Lab B CdL Fsca
Presentazone dat spermental - 3 Perché occorre sempre rportare n grafco dat? Esempo: Anscombe, (1973). Graphs n statstcal analyss.amercan Statstcan 7, 17 Lab B CdL Fsca
Lab B CdL Fsca Elaborazone dat spermental Prncpo della massma verosmglanza Quando eseguamo una sere d msure relatve ad una data grandezza fsca, quanto ottenamo corrsponde al rsultato pù probable. Il prncpo della massma verosmglanza permette d concludere che l valore pù attendble d una sere d msure, caratterzzate da error casual dstrbut secondo la stessa legge normale e n assenza d error sstematc, è dato dalla loro meda artmetca. (lnk) Il metodo de mnm quadrat è una dretta conseguenza del prncpo della massma verosmglanza: s basa sull potes per cu l valore pù attendble d una grandezza corrsponde a quello per cu è mnma la somma de quadrat degl scart dvs per σ (nel caso n cu le msure provengano da n dstrbuzon teorche dfferent, ognuna caratterzzata da varanza σ, con = 1,..., n). el caso d msure provenent dalla medesma dstrbuzone teorca, l valore pù attendble corrsponde alla meda artmetca. el caso, nvece, d osservazon provenent da dstrbuzon teorche dfferent esso è la meda pesata delle osservazon, dove pes sono recproc delle varanze delle sngole msure.
Prncpo della massma verosmglanza Consderamo una varable casuale X che presenta una dstrbuzone gaussana d valor, coè che la probabltà d ottenere, eseguendo una msura, un valore compreso tra x e x + dx è data da: x 1 m P x dx e dx Questa probabltà è la verosmglanza d trovare (msurare) l valore x posto che la dstrbuzone presenta specfc, ma gnot, valor d m e s. Il metodo è basato sul postulato che valor gnot de parametrmessano quell che producono la probabltà massma d osservare gl dat msurat (x ). 1 P P x e 1 1 x m Occorre, qund, trovare parametr della dstrbuzone,mes, che rendono massma questa probabltà. Lab B CdL Fsca
Msure d coppe d varabl Supponamo d esegure msure (x,y ) d coppe d varabl X e Y e d rcercare una relazone del tpo y=y(x) tra esse. D solto X rappresenta la varable ndpendente e Y quella dpendente. Inoltre spesso (ma non sempre) σ x σ y. el caso lneare, y x = a + bx, con X prva d error, la stuazone può essere rappresentata come n grafco, per un nseme d dat del tpo x, y Assumendo che cascuna varable casuale y(x ) sa una gaussana con parametr m y x Meda determnata da y(x) Varanza stmata da dat Lab B CdL Fsca
Lab B CdL Fsca Crtero d massma verosmglanza per un nseme d dat gaussan Dato un nseme d dat gaussan x, y ± σ da confrontare con un modello y = y x voglamo determnare: l accuratezza del modello y = y x valor de parametr varabl che sono compatbl con dat Defnta la verosmglanza L come la probabltà che dat rproducano l modello e nell potes d msure ndpendent (le probabltà gaussane possono essere moltplcate) s ha: y yx y yx 1 1 L e e 1 1 1 L è massmo se mnmzzamo l argomento dell esponente: y y x 1 Questa funzone rappresenta la best-ft functon (bontà del ft).
Valore crtco d Defnto f=-m e fssato l lvello d confdenza p rchesto (es. 90%), se < crt l ft è consstente. Lab B CdL Fsca
Modellzzazone Dat Inseme d osservazon msure d laboratoro (coppe x var. ndpendente,y varable dpendente) Raffrontare dat con un modello che dpende da parametr varabl (modfcabl) Defnre una Funzone d Merto Modfcare parametr per ottenere la mglore funzone d merto IMPORTATE! Lab B CdL Fsca Procedura d best-ft Una procedura d best-ft deve fornre: () parametr, () l errore stmato su parametr, () una msura statstca della bontà del ft
I mnm quadrat come crtero d massma verosmglanza Ft d punt spermental (x,y ) =1,, con un modello che ha M parametr varabl mnmzzare rspetto ad a 1 a M -fttng ; y y x a a 1 1 M è l ncertezza (errore) sul dato e W è l cosddetto peso del dato mnmzzando deve essere Lab B CdL Fsca ; y x y x a a ; 1,..., M y y x a1 am 1 y y x y x ak 0 k 1,, M 1 ak W ; 1 1 y
I mnm quadrat nel caso d una retta Immagnamo d aver effettuato le msure d due grandezze che sano l una una funzone dell altra. Supponamo noltre d rtenere che la relazone che lega le due grandezze n questone sa lneare. L potes d lneartà può essere un dea da confermare, un prmo tentatvo d approssmare la legge che mette n relazone dat, o una ragonevole approssmazone della funzone su un ntervallo d valor della varable ndpendente suffcentemente pccolo perchè abba senso aspettars un andamento lneare. Può anche essere, n alcun cas, che no gà sappamo che la legge che regola l fenomeno che stamo nvestgando è lneare: n tal caso samo nteressat a determnare valor del coeffcente angolare e dell ntercetta con l asse delle y per assegnarl alle grandezze fsche a cu sono assocat. In generale, per un problema d questo tpo, saremo nteressat a determnare valor d a e b present nella relazone: Lab B CdL Fsca y a bx
Dat, Modello e Resdu La dfferenza tra valor osservat e quell predett dal modello s defnsce resduo: Dat = Modello + Resdu Resdu = dat - modello e y a bx Occorre mnmzzare n n 1 1 SSE e y a bx Lab B CdL Fsca
Data fttng con una retta - 1 Quale che sa l orgne de dat, non c aspettamo che ess s dspongano su una lnea retta ma, puttosto, che sano dstrbut n modo casuale: coeffcent a e b della retta che meglo s adatta a dat vanno determnat n modo da rendere mnma la dfferenza de quadrat degl scart. Occorre mnmzzare da cu, le condzon formamo le seguent quanttà: Lab B CdL Fsca ab, y a bx 1 a 1 0 0 b 1 y a bx x y a bx 1 x S S S S xx x y 1 1 1 x x y S xy 1 1 y
Data fttng con una retta - Le due equazon dventano as bs S as bs S x x xx xy y ponendo D SS xx S x le soluzon sono a b S S SS S S xx y x xy D S S xy x y D Lab B CdL Fsca
Data fttng con una retta - 3 Varanza d un parametro per la retta pertanto Lab B CdL Fsca p k p k 1 y a b S S xx a S S x b Sx S ; y D D xx x x y Il coeffcente d correlazone tra le ncertezze a e b è un numero compreso tra -1 ed 1 rab Sx SSxx Un valore postvo d r ab ndca che è probable che gl error su a e b abbano lo stesso segno D D
Lab B CdL Fsca Resdu La relazone Dat = Modello + Resdu s può anche scrvere (dat valor medo) (modello valor medo) y y yˆ y y yˆ La relazone vale anche per quadrat delle devazon: n n n y y yˆ y y yˆ Resdu 1 1 1 SST SSM SSE Partzonamento somma quadrat somma quadrat somma quadrat devazontotal devazon modello valor error somma de quadrat La relazone esprme quanta varanza totale è contenuta nel modello. SSE esprme la varanza "non spegata" dovuta agl error (S ). n n 1 ˆ Frazone varanza SSM yˆ 1 y spegata dal r n SST 1 modello y y SSE S y y n n 1 Resdu
Data fttng con una retta - 5 La probabltà che un valore nadeguato per possa verfcars è dato da: Q IncGammaFunc, x 1 t a1, 1! a 0 IncGammaFunc P x a e t dt a a se 1> Q > 0.1 bontà del ft credble se Q > 0.001 bontà del ft potzzable se gl error sono non normal o sono stat un po sottostmat se 0 < Q < 0.001 l modello e/o la procedura d stma sono nadeguat Lab B CdL Fsca
Eserctazone rportare su un foglo Excel dat sotto elencat (x, y, W ) utlzzando le formule d calcolo esposte n precedenza, determnare la regressone lneare su quest dat n partcolare determnare parametr e gl error assocat al ft rportare n grafco l rsultato e confrontarlo con l caso d pes untar (W =1 per tutt punt) Rammentare che W è l peso, da cu occorre calcolare l ncertezza Lab B CdL Fsca W 1 x y W 0,0 5,9 1,0 0,9 5,4 1,8 1,8 4,4 4,0,6 4,6 8,0 3,3 3,5 0,0 4,4 3,7 0,0 5,,8 70,0 6,1,8 70,0 6,5,4 100,0 7,4 1,5 500,0