Laboratorio 2B A.A. 2013/2014. Elaborazione Dati. Lab 2B CdL Fisica

Documenti analoghi
Laboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica

Laboratorio 2B A.A. 2014/2015. Elaborazione Dati. Lab 2B CdL Fisica

ANALISI STATISTICA DELLE INCERTEZZE CASUALI

Misure indipendenti della stessa grandezza, ciascuna con una diversa precisione.

REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari

Principio di massima verosimiglianza

Ad esempio, potremmo voler verificare la legge di caduta dei gravi che dice che un corpo cade con velocità uniformemente accellerata: v = v 0 + g t

Misure Ripetute ed Indipendenti

La likelihood. , x 3. , x 2. ,...x N

Analisi degli errori. Introduzione J. R. Taylor, Introduzione all analisi degli errori, Zanichelli, Bo 1986

Corso di. Dott.ssa Donatella Cocca

Propagazione delle incertezze

Capitolo 3. Cap. 3-1

Correlazione lineare

Regressione e correlazione

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

La t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student.

Teoria degli errori. La misura implica un giudizio sull uguaglianza tra la grandezza incognita e la grandezza campione. Misure indirette: velocita

03/03/2012. Campus di Arcavacata Università della Calabria

Campo di applicazione

Statistica Descrittiva

Precisione e Cifre Significative

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *

Relazioni tra variabili: Correlazione e regressione lineare

Propagazione degli errori

UNIVERSITÀ DEGLI STUDI DI TORINO CORSO DI LAUREA IN CHIMICA Dispense ad esclusivo uso introduttivo per il modulo di Fisica C

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Incertezza di sensibilità < fluttuazione intrinseca delle misure.

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

S O L U Z I O N I. 1. Effettua uno studio qualitativo della funzione. con particolare riferimento ai seguenti aspetti:

La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente

RAPPRESENTAZIONE DI MISURE. carta millimetrata

LA COMPATIBILITA tra due misure:

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari

una variabile casuale è continuase può assumere un qualunque valore in un intervallo

Metodologie informatiche per la chimica

Propagazione degli errori

Stima dei Parametri: Metodo di Massima Verosimiglianza

Sistemi Intelligenti Relazione tra ottimizzazione e statistica - IV Alberto Borghese

Stima dei Parametri: Metodo dei Minimi Quadrati

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:

Metodologie informatiche per la chimica

Elementi di statistica

Probabilità cumulata empirica

LA CALIBRAZIONE NELL ANALISI STRUMENTALE

STATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE

La soluzione delle equazioni differenziali con il metodo di Galerkin

Università di Cassino. Esercitazione di Statistica 1 del 4 dicembre Dott.ssa Simona Balzano

Propagazione degli errori statistici. Test del χ 2 per la bontà di adattamento. Metodo dei minimi quadrati.

LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità:

CARATTERISTICHE DEI SEGNALI RANDOM

Qualità dell adattamento di una funzione y=f(x) ad un insieme di misure (y in funzione di x)

Matematica II: Calcolo delle Probabilità e Statistica Matematica

ELEMENTI DI STATISTICA

Strada B. Classe Velocità valore frequenza Frequ. ass Frequ. % hi Freq. Cum

La resistività apparente viene ricavata dalla relazione:

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

PRIMA PROVA INTERMEDIA DI STATISTICA CLEA (COD. 5047/4038/371/377) 3 Novembre 2004 COMPITO A1

Laboratorio di Fisica per Scienze Naturali 1 - Elementi di Statistica e di teoria degli errori

Sistemi di Acquisizione Dati Prof. Alessandro Pesatori

Università di Cassino Corso di Statistica 1 Esercitazione del 28/01/2008 Dott. Alfonso Piscitelli. Esercizio 1

LE FREQUENZE CUMULATE

Stima dei Parametri. Capitolo 8

Regressione lineare con un singolo regressore

= = = = = 0.16 NOTA: X P(X) Evento Acquisto PC Intel Acquisto PC Celeron P(X)

Metodologie informatiche per la chimica

Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA

LEZIONE 2. Riassumere le informazioni: LE MEDIE MEDIA ARITMETICA MEDIANA, MODA, QUANTILI. La media aritmetica = = N

TIPI DI ANALISI DEI DATI ORGANIZZATI IN MATRICI CASI X VARIABILI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Sistemi Intelligenti Introduzione al calcolo delle probabilità - II

Ettore Limoli. Lezioni di Matematica Prof. Ettore Limoli. Sommario. Calcoli di regressione

PIANIFICAZIONE DEI TRASPORTI

PREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl

Variabili casuali. Variabili casuali

Oltre la regressione lineare

3 CAMPIONAMENTO DI BERNOULLI E DI POISSON

Università di Cassino Corso di Statistica 1 Esercitazione del 17/10/2006 Dott. Alfonso Piscitelli. Esercizio 1

Definizione di campione

Esame di Statistica tema B Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

Variabili statistiche - Sommario

LABORATORIO II. 1 La retta di regressione. NB create un nuovo foglio di lavoro

La regressione. La Regressione. La Regressione. min. min. Var X. X Variabile indipendente (data) Y Variabile dipendente

STATISTICA DESCRITTIVA CON EXCEL

Per calcolare le probabilità di Testa e Croce è possibile risolvere il seguente sistema di due equazioni in due incognite:

Analisi della Varianza

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA

C. Meneghini é una variabile aleatoria la cui funzione densitá di probabilitá é:

C.I. di Metodologia clinica

Modelli con varabili binarie (o qualitative)

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

IL MODELLO DI MACK. Materiale didattico a cura di Domenico Giorgio Attuario Danni di Gruppo Società Cattolica di Assicurazioni

Correlazione, Regressione, Test non parametrici

Transcript:

Laboratoro B A.A. 013/014 Elaborazone Dat Lab B CdL Fsca

Elaborazone dat spermental Come rassumere un nseme d dat spermental? Una statstca è propro un numero calcolato a partre da dat stess. La Statstca descrttva fornsce mezz per rassumere le propretà d un campone d dat (molt numer) n modo che possano essere comuncat effcacemente (con poch numer). Metod numerc e grafc vengono utlzzat nella EDA (Exploratory Data Analyss) per semplfcare le cose meno nteressant e rvelare gl aspett nattes e/o anomal del campone d dat. Uno de prncp fondamental d una buona anals dat è: rportare sempre n grafco dat! Lab B CdL Fsca

Presentazone dat spermental - 1 Prma d nzare un espermento è opportuno, sulla base dell anals prelmnare, predsporre una tabella per la raccolta ordnata de dat. La tabella potrà contenere: l numero progressvo delle msure effettuate, valor ottenut nella msura, corrspondent error, valor med, la varanza, la devazone standard, etc. I dat spermental s possono presentare n vare forme (mono-, b-, tr- e mult-dmensonal), tuttava sono usualmente rappresentat a schermo o su carta (così da apparre bdmensonal, anche se n realtà potrebbero non esserlo). Lab B CdL Fsca

Presentazone dat spermental - La rappresentazone attraverso tabelle e stogramm fornsce utl nformazon per ndvduare e comprendere le relazon tra dat. Il modo pù semplce e mmedato per ndagare la possble relazone tra due grandezze è quello d costrure un grafco. Esempo: Dlatazone elastca d un corpo n funzone della forza applcata Dl = K m Lab B CdL Fsca

Presentazone dat spermental - 3 Perché occorre sempre rportare n grafco dat? Esempo: Anscombe, (1973). Graphs n statstcal analyss.amercan Statstcan 7, 17 Lab B CdL Fsca

Lab B CdL Fsca Elaborazone dat spermental Prncpo della massma verosmglanza Quando eseguamo una sere d msure relatve ad una data grandezza fsca, quanto ottenamo corrsponde al rsultato pù probable. Il prncpo della massma verosmglanza permette d concludere che l valore pù attendble d una sere d msure, caratterzzate da error casual dstrbut secondo la stessa legge normale e n assenza d error sstematc, è dato dalla loro meda artmetca. (lnk) Il metodo de mnm quadrat è una dretta conseguenza del prncpo della massma verosmglanza: s basa sull potes per cu l valore pù attendble d una grandezza corrsponde a quello per cu è mnma la somma de quadrat degl scart dvs per σ (nel caso n cu le msure provengano da n dstrbuzon teorche dfferent, ognuna caratterzzata da varanza σ, con = 1,..., n). el caso d msure provenent dalla medesma dstrbuzone teorca, l valore pù attendble corrsponde alla meda artmetca. el caso, nvece, d osservazon provenent da dstrbuzon teorche dfferent esso è la meda pesata delle osservazon, dove pes sono recproc delle varanze delle sngole msure.

Prncpo della massma verosmglanza Consderamo una varable casuale X che presenta una dstrbuzone gaussana d valor, coè che la probabltà d ottenere, eseguendo una msura, un valore compreso tra x e x + dx è data da: x 1 m P x dx e dx Questa probabltà è la verosmglanza d trovare (msurare) l valore x posto che la dstrbuzone presenta specfc, ma gnot, valor d m e s. Il metodo è basato sul postulato che valor gnot de parametrmessano quell che producono la probabltà massma d osservare gl dat msurat (x ). 1 P P x e 1 1 x m Occorre, qund, trovare parametr della dstrbuzone,mes, che rendono massma questa probabltà. Lab B CdL Fsca

Msure d coppe d varabl Supponamo d esegure msure (x,y ) d coppe d varabl X e Y e d rcercare una relazone del tpo y=y(x) tra esse. D solto X rappresenta la varable ndpendente e Y quella dpendente. Inoltre spesso (ma non sempre) σ x σ y. el caso lneare, y x = a + bx, con X prva d error, la stuazone può essere rappresentata come n grafco, per un nseme d dat del tpo x, y Assumendo che cascuna varable casuale y(x ) sa una gaussana con parametr m y x Meda determnata da y(x) Varanza stmata da dat Lab B CdL Fsca

Lab B CdL Fsca Crtero d massma verosmglanza per un nseme d dat gaussan Dato un nseme d dat gaussan x, y ± σ da confrontare con un modello y = y x voglamo determnare: l accuratezza del modello y = y x valor de parametr varabl che sono compatbl con dat Defnta la verosmglanza L come la probabltà che dat rproducano l modello e nell potes d msure ndpendent (le probabltà gaussane possono essere moltplcate) s ha: y yx y yx 1 1 L e e 1 1 1 L è massmo se mnmzzamo l argomento dell esponente: y y x 1 Questa funzone rappresenta la best-ft functon (bontà del ft).

Valore crtco d Defnto f=-m e fssato l lvello d confdenza p rchesto (es. 90%), se < crt l ft è consstente. Lab B CdL Fsca

Modellzzazone Dat Inseme d osservazon msure d laboratoro (coppe x var. ndpendente,y varable dpendente) Raffrontare dat con un modello che dpende da parametr varabl (modfcabl) Defnre una Funzone d Merto Modfcare parametr per ottenere la mglore funzone d merto IMPORTATE! Lab B CdL Fsca Procedura d best-ft Una procedura d best-ft deve fornre: () parametr, () l errore stmato su parametr, () una msura statstca della bontà del ft

I mnm quadrat come crtero d massma verosmglanza Ft d punt spermental (x,y ) =1,, con un modello che ha M parametr varabl mnmzzare rspetto ad a 1 a M -fttng ; y y x a a 1 1 M è l ncertezza (errore) sul dato e W è l cosddetto peso del dato mnmzzando deve essere Lab B CdL Fsca ; y x y x a a ; 1,..., M y y x a1 am 1 y y x y x ak 0 k 1,, M 1 ak W ; 1 1 y

I mnm quadrat nel caso d una retta Immagnamo d aver effettuato le msure d due grandezze che sano l una una funzone dell altra. Supponamo noltre d rtenere che la relazone che lega le due grandezze n questone sa lneare. L potes d lneartà può essere un dea da confermare, un prmo tentatvo d approssmare la legge che mette n relazone dat, o una ragonevole approssmazone della funzone su un ntervallo d valor della varable ndpendente suffcentemente pccolo perchè abba senso aspettars un andamento lneare. Può anche essere, n alcun cas, che no gà sappamo che la legge che regola l fenomeno che stamo nvestgando è lneare: n tal caso samo nteressat a determnare valor del coeffcente angolare e dell ntercetta con l asse delle y per assegnarl alle grandezze fsche a cu sono assocat. In generale, per un problema d questo tpo, saremo nteressat a determnare valor d a e b present nella relazone: Lab B CdL Fsca y a bx

Dat, Modello e Resdu La dfferenza tra valor osservat e quell predett dal modello s defnsce resduo: Dat = Modello + Resdu Resdu = dat - modello e y a bx Occorre mnmzzare n n 1 1 SSE e y a bx Lab B CdL Fsca

Data fttng con una retta - 1 Quale che sa l orgne de dat, non c aspettamo che ess s dspongano su una lnea retta ma, puttosto, che sano dstrbut n modo casuale: coeffcent a e b della retta che meglo s adatta a dat vanno determnat n modo da rendere mnma la dfferenza de quadrat degl scart. Occorre mnmzzare da cu, le condzon formamo le seguent quanttà: Lab B CdL Fsca ab, y a bx 1 a 1 0 0 b 1 y a bx x y a bx 1 x S S S S xx x y 1 1 1 x x y S xy 1 1 y

Data fttng con una retta - Le due equazon dventano as bs S as bs S x x xx xy y ponendo D SS xx S x le soluzon sono a b S S SS S S xx y x xy D S S xy x y D Lab B CdL Fsca

Data fttng con una retta - 3 Varanza d un parametro per la retta pertanto Lab B CdL Fsca p k p k 1 y a b S S xx a S S x b Sx S ; y D D xx x x y Il coeffcente d correlazone tra le ncertezze a e b è un numero compreso tra -1 ed 1 rab Sx SSxx Un valore postvo d r ab ndca che è probable che gl error su a e b abbano lo stesso segno D D

Lab B CdL Fsca Resdu La relazone Dat = Modello + Resdu s può anche scrvere (dat valor medo) (modello valor medo) y y yˆ y y yˆ La relazone vale anche per quadrat delle devazon: n n n y y yˆ y y yˆ Resdu 1 1 1 SST SSM SSE Partzonamento somma quadrat somma quadrat somma quadrat devazontotal devazon modello valor error somma de quadrat La relazone esprme quanta varanza totale è contenuta nel modello. SSE esprme la varanza "non spegata" dovuta agl error (S ). n n 1 ˆ Frazone varanza SSM yˆ 1 y spegata dal r n SST 1 modello y y SSE S y y n n 1 Resdu

Data fttng con una retta - 5 La probabltà che un valore nadeguato per possa verfcars è dato da: Q IncGammaFunc, x 1 t a1, 1! a 0 IncGammaFunc P x a e t dt a a se 1> Q > 0.1 bontà del ft credble se Q > 0.001 bontà del ft potzzable se gl error sono non normal o sono stat un po sottostmat se 0 < Q < 0.001 l modello e/o la procedura d stma sono nadeguat Lab B CdL Fsca

Eserctazone rportare su un foglo Excel dat sotto elencat (x, y, W ) utlzzando le formule d calcolo esposte n precedenza, determnare la regressone lneare su quest dat n partcolare determnare parametr e gl error assocat al ft rportare n grafco l rsultato e confrontarlo con l caso d pes untar (W =1 per tutt punt) Rammentare che W è l peso, da cu occorre calcolare l ncertezza Lab B CdL Fsca W 1 x y W 0,0 5,9 1,0 0,9 5,4 1,8 1,8 4,4 4,0,6 4,6 8,0 3,3 3,5 0,0 4,4 3,7 0,0 5,,8 70,0 6,1,8 70,0 6,5,4 100,0 7,4 1,5 500,0