Laboratoro B A.A. 014/015 Elaborazone Dat Lab B CdL Fca
Elaborazone dat permental Come raumere un neme d dat permental? Una tattca è propro un numero calcolato a partre da dat te. La Stattca decrttva fornce mezz per raumere le propretà d un campone d dat (molt numer) n modo che poano eere comuncat effcacemente (con poch numer). Metod numerc e grafc vengono utlzzat nella EDA (Exploratory Data Analy) per emplfcare le coe meno ntereant e rvelare gl apett natte e/o anomal del campone d dat. Uno de prncp fondamental d una buona anal dat è: rportare empre n grafco dat! Lab B CdL Fca
Preentazone dat permental - 1 Prma d nzare un epermento è opportuno, ulla bae dell anal prelmnare, predporre una tabella per la raccolta ordnata de dat. La tabella potrà contenere: l numero progrevo delle mure effettuate, valor ottenut nella mura, corrpondent error, valor med, la varanza, la devazone tandard, etc. I dat permental poono preentare n vare forme (mono-, b-, tr- e mult-dmenonal), tuttava ono uualmente rappreentat a chermo o u carta (coì da apparre bdmenonal, anche e n realtà potrebbero non eerlo). Lab B CdL Fca
Preentazone dat permental - La rappreentazone attravero tabelle e togramm fornce utl nformazon per ndvduare e comprendere le relazon tra dat. Il modo pù emplce e mmedato per ndagare la poble relazone tra due grandezze è quello d cotrure un grafco. Eempo: Dlatazone elatca d un corpo n funzone della forza applcata Dl = K m Lab B CdL Fca
Preentazone dat permental - 3 Perché occorre empre rportare n grafco dat? Eempo: Ancombe, (1973). Graph n tattcal analy.amercan Stattcan 7, 17 Lab B CdL Fca
Elaborazone dat permental Prncpo della mama veromglanza Quando eeguamo una ere d mure relatve ad una data grandezza fca, quanto ottenamo corrponde al rultato pù probable. Il prncpo della mama veromglanza permette d concludere che per una ere d mure caratterzzate da error caual dtrbut econdo la tea legge normale e n aenza d error tematc: l valore pù attendble della ere d mure è dato dalla loro meda artmetca. la forma della dtrbuzone è completamente caratterzzata dal valor medo x e dalla varanza della ere d mure. Vedamo come poono dervare quete affermazon. Lab B CdL Fca
Prncpo della mama veromglanza -1 Conderamo una varable cauale X che preenta una dtrbuzone gauana d valor, coè che la probabltà d ottenere, eeguendo una mura, un valore compreo tra x e x + Δx / è data da: Queta probabltà è la veromglanza d trovare (murare) l valore x poto che la dtrbuzone preenta pecfc, ma gnot, valor d m e. Lab B CdL Fca m x 1 f x, m, Dx e Dx Aumendo che tutte le oervazon ano ndpendent, la probabltà d rcontrare le n oervazon permental è data da:, m, 1 P f x Dx Dx l n 1 L dea del metodo è d trovare parametr della dtrbuzone,me, che rendono mama queta probabltà.
Prncpo della mama veromglanza - I fattor cotant Dx non determnano la oluzone, qund deve conderare la ola funzone d veromglanza: Tenuto conto della pote d dtrbuzone d probabltà gauana Lab B CdL Fca L x,, x f x,, xn, m, 1 n 1 1 n n 1 1 exp 1 L x m 1 f x, m, e Per trovare l mamo d L è pù utle nvetgare ln(l) n n n 1 ln L ln ln x m 1 m x
Prncpo della mama veromglanza -3 n n ln ln ln n 1 L x m 1 Il mamo d L trova mponendo L L n 1 0 x m L m L 1 L m e L 0 0 n n 1 x 4 m 1 0 dalla I equazone Se dat dponbl ono content con l pote che le oervazon appartengono ad una dtrbuzone normale, allora è uffcente tmare l valore d apettazone (valor medo) e la varanza per decrvere completamente la dtrbuzone delle mure. Lab B CdL Fca 1 n x n 1 m x 1 n 1 n n 1 n 1 dalla II equazone x m x x
Metodo de mnm quadrat Il metodo de mnm quadrat è una dretta coneguenza del prncpo della mama veromglanza: baa ull pote per cu l valore pù attendble d una grandezza corrponde a quello per cu è mnma la omma de quadrat degl cart dv per σ (nel cao n cu le mure provengano da n dtrbuzon teorche dfferent, ognuna caratterzzata da varanza σ, con = 1,..., n). el cao d mure provenent dalla medema dtrbuzone teorca, l valore pù attendble corrponde alla meda artmetca. el cao, nvece, d oervazon provenent da dtrbuzon teorche dfferent eo è la meda peata delle oervazon, dove pe ono recproc delle varanze delle ngole mure. Lab B CdL Fca
Mure d coppe d varabl Supponamo d eegure mure (x,y ) d coppe d varabl X e Y e d rcercare una relazone del tpo y=y(x) tra ee. D olto X rappreenta la varable ndpendente e Y quella dpendente. Inoltre peo (ma non empre) σ x σ y. el cao lneare, y x = a + bx, con X prva d error, la tuazone può eere rappreentata come n grafco, per un neme d dat del tpo x, y Aumendo che cacuna varable cauale y(x ) a una gauana con parametr m y x Meda determnata da y(x) Varanza tmata da dat Lab B CdL Fca
Lab B CdL Fca Crtero d mama veromglanza per un neme d dat gauan Dato un neme d dat gauan x, y ± σ da confrontare con un modello y = y x voglamo determnare: l accuratezza del modello y = y x valor de parametr varabl che ono compatbl con dat Defnta la veromglanza L come la probabltà che dat rproducano l modello e nell pote d mure ndpendent (le probabltà gauane poono eere moltplcate) ha: y yx y yx 1 1 L e e 1 1 1 L è mamo e mnmzzamo l argomento dell eponente: y y x 1 Queta funzone rappreenta la bet-ft functon (bontà del ft).
Valore crtco d Defnto f=-m e fato l lvello d confdenza p rcheto (e. 90%), e < crt l ft è contente. Lab B CdL Fca
Modellzzazone Dat Ineme d oervazon mure d laboratoro (coppe x var. ndpendente,y varable dpendente) Raffrontare dat con un modello che dpende da parametr varabl (modfcabl) Defnre una Funzone d Merto Modfcare parametr per ottenere la mglore funzone d merto IMPORTATE! Lab B CdL Fca Procedura d bet-ft Una procedura d bet-ft deve fornre: () parametr, () l errore tmato u parametr, () una mura tattca della bontà del ft
I mnm quadrat come crtero d mama veromglanza Ft d punt permental (x,y ) =1,, con un modello che ha M parametr varabl mnmzzare rpetto ad a 1 a M -fttng ; y y x a a 1 1 M è l ncertezza (errore) ul dato e W è l coddetto peo del dato mnmzzando deve eere Lab B CdL Fca ; y x y x a a ; 1,..., M y y x a1 am 1 y y x y x ak 0 k 1,, M 1 ak W ; 1 1 y
I mnm quadrat nel cao d una retta Immagnamo d aver effettuato le mure d due grandezze che ano l una una funzone dell altra. Supponamo noltre d rtenere che la relazone che lega le due grandezze n quetone a lneare. L pote d lneartà può eere un dea da confermare, un prmo tentatvo d appromare la legge che mette n relazone dat, o una ragonevole appromazone della funzone u un ntervallo d valor della varable ndpendente uffcentemente pccolo perchè abba eno apettar un andamento lneare. Può anche eere, n alcun ca, che no gà appamo che la legge che regola l fenomeno che tamo nvetgando è lneare: n tal cao amo ntereat a determnare valor del coeffcente angolare e dell ntercetta con l ae delle y per aegnarl alle grandezze fche a cu ono aocat. In generale, per un problema d queto tpo, aremo ntereat a determnare valor d a e b preent nella relazone: Lab B CdL Fca y a bx
Dat, Modello e Redu La dfferenza tra valor oervat e quell predett dal modello defnce reduo: Dat = Modello + Redu Redu = dat - modello e y a bx Occorre mnmzzare n n 1 1 SSE e y a bx Lab B CdL Fca
Data fttng con una retta - 1 Quale che a l orgne de dat, non c apettamo che e dpongano u una lnea retta ma, puttoto, che ano dtrbut n modo cauale: coeffcent a e b della retta che meglo adatta a dat vanno determnat n modo da rendere mnma la dfferenza de quadrat degl cart. Occorre mnmzzare da cu, le condzon formamo le eguent quanttà: Lab B CdL Fca ab, y a bx 1 a 1 0 0 b 1 y a bx x y a bx 1 x S S S S xx x y 1 1 1 x x y S xy 1 1 y
Data fttng con una retta - Le due equazon dventano as bs S as bs S x x xx xy y ponendo D SS xx S x le oluzon ono a b S S SS S S xx y x xy D S S xy x y D Lab B CdL Fca
Data fttng con una retta - 3 Varanza d un parametro per la retta pertanto Lab B CdL Fca p k p k 1 y a b S S xx a S S x b Sx S ; y D D xx x x y Il coeffcente d correlazone tra le ncertezze a e b è un numero compreo tra -1 ed 1 rab Sx SSxx Un valore potvo d r ab ndca che è probable che gl error u a e b abbano lo teo egno D D
Cao partcolare: retta y=bx Occorre mnmzzare con la condzone b y bx 1 oluzone b S S xy xx 0 b 1 x y bx calcolo varanza d b, eendo x y x b y y S S 1 xx xx 4 b x 1 b 1 y 1 Sxx Sxx Lab B CdL Fca 1 b Sxx
Lab B CdL Fca Redu La relazone Dat = Modello + Redu può anche crvere (dat valor medo) (modello valor medo) Redu y y yˆ y y yˆ La relazone vale anche per quadrat delle devazon: n n n y y yˆ y y yˆ 1 1 1 SST SSM SSE Partzonamento omma quadrat omma quadrat omma quadrat devazontotal devazon modello valor error omma de quadrat La relazone eprme quanta varanza totale è contenuta nel modello. SSE eprme la varanza "non pegata" dovuta agl error (S ). Frazone varanza n n 1 ˆ pegata dal modello SSM yˆ 1 y r Coeffcente d n SST 1 y y SSE S y y n n Redu determnazone 1 Mura la «bontà» del modello lneare, tanto pù promo ad 1 è l uo valore.
Data fttng con una retta - 5 La probabltà che un valore nadeguato per poa verfcar è dato da: Q IncGammaFunc, x 1 t a1, 1! a 0 IncGammaFunc P x a e t dt a a e 1> Q > 0.1 bontà del ft credble e Q > 0.001 bontà del ft potzzable e gl error ono non normal o ono tat un po ottotmat e 0 < Q < 0.001 l modello e/o la procedura d tma ono nadeguat Lab B CdL Fca
Eerctazone rportare u un foglo Excel dat otto elencat (x, y, W ) utlzzando le formule d calcolo epote n precedenza, determnare la regreone lneare u quet dat n partcolare determnare parametr e gl error aocat al ft rportare n grafco l rultato e confrontarlo con l cao d pe untar (W =1 per tutt punt) Rammentare che W è l peo, da cu occorre calcolare l ncertezza Lab B CdL Fca W 1 x y W 0,0 5,9 1,0 0,9 5,4 1,8 1,8 4,4 4,0,6 4,6 8,0 3,3 3,5 0,0 4,4 3,7 0,0 5,,8 70,0 6,1,8 70,0 6,5,4 100,0 7,4 1,5 500,0