Appunti di statistica ed analisi dei dati

Documenti analoghi
Analisi degli Errori di Misura. 08/04/2009 G.Sirri

La fisica al Mazzotti 5.4

FISICA. Elaborazione dei dati sperimentali. Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica

GLI ERRORI DI MISURA

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

Osservazioni e Misura. Teoria degli errori

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali.

Come errore prendo la semidispersione o errore massimo, cioè il valore più grande meno quello più piccolo diviso 2.

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Errori e loro propagazione

Quanti valori posso trovare (in percentuale) che siano maggiori di 4?

Distribuzione normale

3) Vengono di nuovo ripetute le misure del punto 2 e i risultati sono s, s, s, s, s, s, s, 96.

Distribuzione Normale

Corso di Fisica generale

Elaborazione statistica di dati

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Distribuzione Gaussiana - Facciamo un riassunto -

Errori di misura Teoria

Capitolo 2. La misura

Elaborazione statistica di dati

ISTOGRAMMI E DISTRIBUZIONI:

Problemi pratici teorici-sperimentali

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

PAROLE CHIAVE Accuratezza, Accuracy, Esattezza, PRECISIONE, Precision, Ripetibilità, Affidabilità, Reliability, Scarto quadratico medio (sqm), Errore

Capitolo 2 Le misure delle grandezze fisiche

Capitolo 10. La media pesata Calcolo della media pesata

Dispersione. si cercano indici di dispersione che:

Analisi statistica delle incertezze casuali. Dott. Claudio Verona

La distribuzione delle frequenze. T 10 (s)

Significato probabilistico di σ: su 100 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo

1 La Media Aritmetica.

È possibile trovare la popolazione di origine conoscendone un campione? o meglio. partendo dalla conoscenza di n, x e d.s.?

Il Corso di Fisica per Scienze Biologiche

Pendolo - Scheda n.1. Obiettivo dell esperimento. Materiale a disposizione. Relazioni usate e approssimazioni fatte. Modalità di esecuzione

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

DISTRIBUZIONE NORMALE (1)

Relazione di fisica ESPERIMENTO N 1

Analisi Statistica dei Dati Sperimentali. M. Trimarchi e P. La Rocca

Elaborazione dei dati sperimentali. Problemi di Fisica

Sintesi degli argomenti di fisica trattati (parte uno)

Equivalenze. Prof. A. Spagnolo IMS P. Villari - Napoli

Distribuzione Gaussiana

tabelle grafici misure di

La statistica. Scienza che studia con metodi matematici fenomeni collettivi.

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

L errore percentuale di una misura è l errore relativo moltiplicato per 100 ed espresso in percentuale. Si indica con e p e risulta: e ( e 100)%

Questi appunti costituiscono soltanto una traccia sintetica del Corso di Laboratorio di Fisica, a prescindere dalle opportune spiegazioni e dai

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Fisica I per chimici: Elementi di statistica

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Indici di Dispersione

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Elementi di Psicometria (con laboratorio software 1)

LABORATORIO DI FISICA I

3 - Esercizi: strumenti di misura, propagazione degli errori, media, deviazione standard, intervalli

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

9 - Esercizi su Test di Ipotesi e Media Pesata

Le varianze parziali così trovate vengono confrontate fra di loro per mezzo di un test denominato test F

Risultati esperienza sul lancio di dadi Ho ottenuto ad esempio:

TEORIA DEGLI ERRORI DI MISURA, IL CALCOLO DELLE INCERTEZZE

Stima dei Parametri. Capitolo 8

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

7 - Distribuzione Poissoniana

SCHEDA DIDATTICA N 7

Distribuzione Normale. Dott. Claudio Verona

E S E R C I Z I T U T O R

ESERCITAZIONE 21 : VARIABILI ALEATORIE CONTINUE

La misura e le incertezze

MISURA DEL PERIODO DI OSCILLAZIONE E DELLA COSTANTE ELASTICA DELLA MOLLA DI UN OSCILLATORE ARMONICO SEMPLICE PRIMA PARTE

Richiami di Matematica

Laboratorio di Fisica I - A.A. 2017/2018. Relazione dell esperienza N. 3

Rappresentazione grafica di coppie di variabili (x i,y i ) correlate e non. E indicato il valore del coefficiente di correlazione lineare r

Il Corso di Fisica per Scienze Biologiche

Lezione n. 1 (a cura di Irene Tibidò)

Corso di Fisica generale

Metodologie informatiche per la chimica

g= 2 t Propagazione delle incertezze l g indirettamente Posso misurare g, indirettamente

Questionario di TEORIA DEGLI ERRORI, per la classe 3^ Geometri

UNIVERSITÀ DEL SALENTO

Distribuzioni di probabilità nel continuo

Cenni di statistica statistica

STATISTICHE DESCRITTIVE Parte II

L analisi dei dati. Primi elementi. EEE- Cosmic Box proff.: M.Cottino, P.Porta

Matematica Lezione 22

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Incertezze sperimentali ( errori ) Guida rapida

deve utilizzarsi la variabile t ν,α/2 , dove n è il numero di gradi di libertà pari al numero delle misure diminuito di 1 (ν=n-1).

La relazione è sostanzialmente la sintesi di questi punti

Parametri statistici

Errori sistematici e casuali

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

MISURA DELLA DISTANZA FOCALE DI UNA LENTE CONVERGENTE

Come risolvere i quesiti dell INVALSI - primo

Misura di grandezze fisiche Stima delle incertezze. Maria Luisa De Giorgi Dipartimento di Fisica UniSalento - Lecce

TEORIA DEGLI ERRORI. Misurare una grandezza = Associare a quella grandezza un numero ed una unità di misura

Grandezze e Misure.

Richiami di matematica

Transcript:

Appunti di statistica ed analisi dei dati Indice generale Appunti di statistica ed analisi dei dati...1 Analisi dei dati...1 Calcolo della miglior stima di una serie di misure...3 Come si calcola μ...3 Come si calcola σ...4 Propagazione degli errori...5 Analisi dei dati Una parte essenziale del pensiero scientifico è la prova di una ipotesi (vedi il metodo scientifico). Provare un ipotesi vuol dire predisporre un esperimento nel quale occorre fare delle misure per arrivare a confermare o confutare l ipotesi. In sostanza si cerca di misurare qualche costante di proporzionalità e confrontare il valore misurato con quello atteso. Dal momento che non è possibile dare una valore esatto di una grandezza, bisogna tener conto di due fatti: 1. devo fare le misure con la più alta precisione possibile (scegliere gli strumenti di misura adeguati, ripetere più volte la misura, ecc..) per eliminare e ridurre errori sistematici, grossolani e casuali. 2. Devo stabilire un criterio che mi permetta di confrontare i valori misurati con quelli attesi. Esempio: Voglio misurare l accelerazione di gravità sulla superficie della Terra g: A) cerco un esperimento nel quale si possa misurare g, ad esempio il periodo di oscillazione di un pendolo B) faccio le misure più volte e con i mezzi messi a disposizione della statistica trovo un valore di g misurato = 9,7±0,2 m/s 2 : l errore della misura è del 0,2/9,7 = 0,02 = 2% abbiamo eseguito le misure nel modo corretto (una percentuale superiore al 10%-20% ci porterebbe a dire che le misure non sono buone e occorrerebbe ripetere l esperimento con strumenti più precisi o fare più misure ) 1

C) lo confronto con il valore atteso di g atteso = 9,81 m/s 2 : (criterio semplificato) - trovo la distanza della mia misura da quella attesa: 9,7-9,81 = 0,11 - se la distanza trovata è minore dell errore della misura allora posso affermare di aver misurato un valore concorde con il valore di g atteso (0,11< 0,2) (criterio più sofisticato) - trovo sempre la distanza - divido la distanza per l errore della misura 0,11/0,2 = 0,55 - valuto la probabilità, con il numero di misure effettuate, di trovare il valore misurato alla distanza calcolata nell ipotesi che i due valori non siano compatibili; se questa probabilità è inferiore al 5% allora dico che è bassa la probabilità che siano incompatibili, quindi sono compatibili. Questo calcolo avviene utilizzando diverse distribuzioni di probabilità (argomento non trattato in questi appunti), ma a parte il calcolo, il ragionamento è lo stesso. Il 5% è la soglia di compatibilità stabilita a priori. Un altro modo di interpretare il criterio semplificato del punto C è il seguente: g misurato = 9,7±0,2 m/s 2 identifica un intervallo da 9,7-0,2 = 9,5 a 9,7 + 0,2= 9,9 Se il valore atteso cade in questo intervallo allora viene confermata l ipotesi, altrimenti i valori misurati non sono compatibili con i valori attesti. Più stretto è l intervallo, e maggiore sarà la precisione della nostra ipotesi 1. 9,7 Valore medio misurato 9,81 9,5 9,9 30,64 mm Intervallo 1 Quello che si continua a fare oggi, oltre a confermare una misura, è ridurre sempre più l intervallo aumentando le misure, riducendo gli errori, ecc 2

Calcolo della miglior stima di una serie di misure Durante un esperimento vengono fatte più misure. Perché? La risposta è semplice: per avere un errore più piccolo occorre ripetere più volte la misura. In realtà questo dipende da come viene calcolato l errore. Ogni volta che si compiono misure, si suppone che il valore più probabile sia il valore medio e che la maggior parte delle misure siano vicino a tale valore (distribuzione normale o di Gauss: è una rappresentazione della frequenza delle misure rispetto al valore medio, una campana, in figura ) μ è il valore medio e σ è l errore calcolato dalle misure. L intervallo tra μ- σ e μ+ σ rappresenta l intervallo nel quale, sono concentrate il 68,27% delle misure, tra μ-2 σ e μ+2 σ ci sono il 95,45% delle misure effettuate e così via. Ma come si calcolano μ e σ? Come si calcola μ Valore medio μ di una serie di misure si calcola con la classica media: μ= X =X medio = X 1+X 2 +...+X totali. = i=1 A volte viene usata la formula della media pesata: X i, con Xi le misure, il numero di misure 3

μ= X =X medio = X 1 P 1 + X 2 P 2 +...+X P i=1 X i P i P 1 +P 2 +...+P =, dove Pi sono i pesi. i=1 P i Esempio: voglio calcolare la media tra i voti dello scritto/orale che hanno un peso del 60% e i voti della relazione di laboratorio che hanno un peso pari al 40%: Voto 6 5 6 6 Peso 60% 60% 40% 40% μ= X =X medio = 6 60+5 60+6 40+6 40 = 1140 60+ 60+40+ 40 200 =5,7 I pesi sono arbitrari, potevo ad esempio scegliere 2 e 1 (il primo voto ha un peso doppio rispetto al secondo). Come si calcola σ σ (sigma) rappresenta l errore casuale delle misure. Il modo più semplice per stimare tale errore è quello di calcolare la semidispersione: σ=σ semidispersione = X max X min 2 massima e la misura minima trovata diviso 2., la differenza tra la misura In realtà, una stima migliore dell errore è data dalla deviazione standard o scarto quadratico medio (corretto): = (Xi μ) 2 i=1 σ=σ X 1, vale a dire che si calcola la differenza tra valore medio e misura, si eleva al quadrato, si sommano tutte e si divide per -1, poi si fa la radice. In questo caso, σ X rappresenta l errore medio di ogni singola misura. L intervallo tra μ-σ X e μ+σ X rappresenta l intervallo nel quale, sono concentrate il 68,27% delle misure o si può anche dire che ho il 68,27% di probabilità che rifacendo una nuova misura il valore sia compreso in tale intervallo e così via per gli altri intervalli. Se σ X è l errore medio di ogni singola misura, qual è allora l errore associato al valore medio che tenga conto di tutte le misure effettuate? E la deviazione standard della media: 4

σ X = σ X = i=1 ( X i μ) 2 ( 1) Se aumento le misure, l errore diminuisce. In definitiva, da una serie di misure, la miglior stima della grandezza misurata è data da : X migliore =μ±σ X Che in genere, per semplificare l analisi, si riduce a quello noto: X migliore =μ±σ semidispersione Esercizio: in un esperimento si ottengono i seguenti risultati: 86, 85, 84, 89, 86 Completa la tabella: μ σ semidispersione X migliore =μ±σ semidispersione σ X σ X X migliore =μ±σ X In quale caso, l errore è minore? Propagazione degli errori Altra questione è quella della propagazione degli errori perché spesso ci troviamo a dover calcolare, con una formula, una costante partendo da misure affette da errori. Vediamo in pratica. Esempio 1 (somma e sottrazione): Dobbiamo calcolare la somma di due lunghezze A=100±3 cm e B=50±2 cm. I valori di A e B sono stati misurati più volte ed è stata calcolata la media e l errore. Qual è la miglior stima della misura C = A+B? Di sicuro, 100+50 = 150 è il miglior valore di C. Ma il suo errore? 5

Vale una regola per le somme e sottrazioni: quando sommo/sottraggo due grandezze con errore, l errore associato alla somma/sottrazione è dato dalla somma degli errori Quindi σ C =3+2 = 5 Pertanto C = 150±5 cm Esempio 2 (prodotto e divisione): Dobbiamo calcolare l area di un quadrato di base B=100±3 cm e altezza H=50±2 cm. I valori di H e B sono stati misurati più volte ed è stata calcolata la media e l errore. Quando calcoliamo l area A=B*H, che errore dobbiamo associare ad A? A= 100*50 = 5000 cm 2 è la miglior stima dell area. Per l errore vale la regola per le moltiplicazioni e divisioni: quando moltiplico/divido due grandezze con errore, l errore relativo associato al prodotto/divisione è dato dalla somma degli errori relativi el nostro esempio: errore percentuale = 3/100 + 2/50 = 0,07 = 7% ed il 7% di 5000 vale 5000*0,07 = 350 Quindi la miglior stima del prodotto A = 5000 ± 350 = 5000 ± 400 cm 2 L ultimo passaggio è stato fatto approssimando 350. Le regole da ricordare: per la somma/sottrazione per la moltiplicazione/divisione somma degli errori somma degli errori relativi 6

Esercizio: A=200±2 B=150±10 C=300±5 Calcola A+C B-C A*C A/B A*B/C Valore medio Errore 7