Gli scarti... tipi facili

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Gli scarti... tipi facili"

Transcript

1 Gli scarti... tipi facili 1 f (x) = " # e $(x$x) "! dove si narra dell utilizzo di excel per il calcolo della ripetibilità e dell incertezza delle misure variabili con la concentrazione Michele Rapillo

2 008 Proprietà letteraria riservata. SINAL Sistema Nazionale per l Accreditamento di Laboratori Piazza Mincio, Roma Tel Fax Questa pubblicazione può essere liberamente riprodotta, citando la fonte. Ne è vietata la riproduzione a fini commerciali. Edizione luglio 008. Pag. di 5

3 a Teresa per aver dimostrato che la certezza esiste. Pag. 3 di 5

4 Ringrazio Nicola Bottazzini per i preziosi suggerimenti, per l utilissimo materiale messo a disposizione e per la revisione generale del presente documento; Fabrizio Francia e il gruppo Francia Latticini per aver consentito la pubblicazione di importanti e riservati dati aziendali; Luis Vizcarra, spalla impagabile, per essersi prestato al gioco ; Emma Angelini Bianco per il contributo da lettore che è passato dall incertezza alla certezza; Paolo Bianco per l attenta revisione del testo ed il supporto alla pubblicazione. Michele Rapillo Pag. 4 di 5

5 Presentazione Nel lungo e talvolta tortuoso itinerario della valutazione dell incertezza di misura non a tutti è dato di procedere speditamente. Certamente ci riesce Michele Rapillo che può avvalersi di una lunga e diversificata esperienza operativa per fare da Guida a tutti coloro che in Laboratorio, alle prese con un determinato test analitico, debbono necessariamente produrre un risultato completo. Come in un escursione lungo un aspro sentiero di montagna, in due si procede meglio e Rapillo ha appunto scelto di procedere assieme ad un compagno di escursione, simpatico ma, come spesso capita nella vita, alquanto arrugginito per quanto riguarda i ricordi universitari relativi ad errori, scarti, gaussiane eccetera, che vengono opportunamente sintetizzati.. L ing. Rapillo, forte anche della sua attuale posizione di autorevole membro del Comitato di Accreditamento del SINAL che assai spesso si trova alle prese con Laboratori di Prova che della determinazione dell incertezza di misura farebbero volentieri a meno, con pazienza e perizia incoraggia e spinge sulla buona strada non solo il suo interlocutore, ma anche tutti coloro che vorranno intraprendere la lettura di questa Guida che si rivela preziosissima bussola per entrare in confidenza con una componente essenziale della misura di laboratorio. Pertanto a tutti coloro che operano in Laboratori di Prova ed in particolare a quelli che sono impegnati nelle operazioni relative all accreditamento, consigliamo fortemente la lettura di queste pagine: una lettura che sarà di grande giovamento per il loro lavoro e che per di più li farà spesso sorridere. Antonio Paoletti Presidente SINAL Pag. 5 di 5

6 Introduzione Che cosa ci può essere di facile nel concetto di scarto tipo, varianza, chi-quadro? La domanda sorgerà spontanea nella mente di alcuni fra coloro che, nei loro laboratori, si sono trovati qualche volta a contatto con problematiche di validazione di metodi di prova e quindi con la determinazione di ripetibilità ed incertezza delle misure. Per quelli che hanno frequentato corsi specifici sull incertezza di misura, lo scarto tipo non risulterà così misterioso ed a maggior ragione non lo sarà per gli appassionati lettori delle numerose pubblicazioni sull argomento: dalla GUM (o UNI ENV 13005) con le sue appendici (centinaia di pagine) in emissione, alla guida EURACHEM (anzi adesso 3 guide), alla guida EUROLAB, e alla documentazione varia che si può trovare in rete. D altronde chi solo saltuariamente ha occasione d incontrare questa problematica ne fa spesso la conoscenza in modo disorganico e confuso, tra approccio top-down e bottom-up, olistico ed Horwitz, tra scarto tipo giustappunto e scarto tipo della media, oscuri contributi ottenuti con valutazioni di tipo A e B, e finisce per considerarla piena, non già di risvolti interessanti, ma piuttosto di noia e fastidio, come accade per gli argomenti ostici che si è costretti ad imparare più o meno a memoria perché non sembrano avere un essenza da cogliere. Tra l altro le guide sparano questi riferimenti al lettore come se questi avesse appena terminato con profitto un corso avanzato di statistica, gettandolo nel panico alla ricerca di vecchi testi di scuola, tabelle di dati, solo citate e mai riportate nei documenti (come se il lettore fosse seduto su una pila di testi di statistica). Inoltre, anche se Bertolt Brecht afferma che: Di tutte le cose sicure la più certa è il dubbio, un approfondita riflessione sul concetto di incertezza può generare inquietudine. Questo testo molto ricorda per la sua tipicità i dialoghi di Platone, che si contrapponevano agli scritti retorici circolanti all epoca ad Atene, ed ha il grande pregio di presentare in forma colloquiale ma rigorosa il calcolo dell incertezza e della ripetibilità delle misure. Analogamente a Sisifo, discepolo di Socrate, Luis viene guidato, dopo un esaustivo elenco di documenti relativi all incertezza di misura, attraverso le definizioni di scarto tipo, varianza, distribuzione di probabilità, normal probability plot, ecc., che costituiscono le basi teoriche del calcolo. Entrano a questo punto in scena i dati sperimentali sui quali viene effettuato il calcolo con l indicazione delle relative funzioni del software utilizzato (niente tabelle!). Rispetto ai testi a disposizione degli operatori del settore, questo documento fornisce una guida rapida che suggerisce però diversi livelli di approfondimento privilegiando comunque l approccio relativo a come si fanno le cose rispetto all approccio cosa bisogna fare. Poiché, come recita un proverbio cinese L'uomo che ha troppe parole, spesso non ha alcuna certezza, termino questa breve presentazione esprimendo la convinzione che questo documento contribuirà a sfatare alcuni miti: che l incertezza di misura sia impossibile da comprendere, che si traduca in una inquietante serie di equazioni da imparare a memoria, che le persone che si occupano di queste tematiche siano umanamente aride e fredde e prive del senso dell umorismo. Mi auguro pertanto che questa promessa di sradicamento di convinzioni diffuse risulti stimolante per tutte le persone che per ragioni di lavoro o per mera curiosità vengano a trovarsi a contatto con le problematiche di ripetibilità ed incertezza delle misure. Paolo Bianco Direttore SINAL Pag. 6 di 5

7 INDICE IL FATTO...8 IL LAVORO...10 LUIS E I DUBBI SULLA DISTRIBUZIONE DEI DATI SPERIMENTALI...18 LUIS E LA DISTRIBUZIONE NORMALE...0 LUIS E I DATI ANOMALI...3 LUIS E LO SCARTO TIPO...4 LUIS E LA VERIFICA DELLA MEDIA...5 LUIS E LA VERIFICA DELLO SCARTO TIPO...6 LUIS E IL CALCOLO DELLO SCARTO TIPO VARIABILE CON LA CONCENTRAZIONE...7 L INCERTEZZA DI LUIS...36 LUIS E L APPROCCIO METROLOGICO...38 LUIS E HORWITZ...41 LUIS E IL CRITERIO OLISTICO...4 L INCERTEZZA DI LUIS VARIABILE CON LA CONCENTRAZIONE...4 LA DECISIONE FINALE DI LUIS...51 Pag. 7 di 5

8 Il Fatto Il mio amico Luis, un microbiologo sudamericano che dirige il laboratorio di una importante azienda lattiero casearia 1, dovendo affrontare il calcolo della ripetibilità e dell incertezza di misura mi ha chiesto di indicargli qualche riferimento bibliografico che lo aiutasse ad affrontare tali temi in modo rigoroso, ma al tempo stesso pratico. Gli ho consigliato di consultare il sito del SINAL che considero il punto di riferimento nazionale più completo sulla tematica. Luis ha seguito il mio consiglio e si è ritrovato davanti un elenco molto ampio; dopo una rapida analisi ha focalizzato l attenzione su quei documenti che già nel titolo avevano il termine chimica o microbiologia e contemporaneamente anche incertezza o ripetibilità, e quelli che, indipendentemente dalla disciplina (chimica, meccanica, ecc.) trattassero il tema dell incertezza, ottenendo il sottoinsieme riportato di seguito ed evidenziato in giallo. Sigla Titolo Rev. DT-000 Guida per la valutazione e la espressione dell'incertezza nelle misurazioni 1 DT-0004 Linee guida per la taratura di strumenti nel settore della compatibilità 0 elettromagnetica e dei campi elettromagnetici ambientali DT-000/1 Esempi applicativi di valutazione dell'incertezza nelle misurazioni elettriche 1 DT-000/ Esempi applicativi di valutazione dell'incertezza nelle misurazioni 0 meccaniche DT-000/3 Avvertenze per la valutazione dell'incertezza nel campo dell'analisi chimica 0 DT-000/4 Esempi applicativi di valutazione dell'incertezza nelle misurazioni chimiche 0 DT-000/5 Esempio applicativo per misurazioni su materiali strutturali 1 DT-000/6 3 Guida al calcolo della ripetibilità di un metodo di prova ed alla sua verifica 0 nel tempo EA-4/0 Expression of the uncertainty of measurement in calibration 00 EA-4/09 Accreditation for sensory testing laboratories 01 EA-4/10 Accreditation for Laboratories Performing Microbiological Testing 0 EA-4/15 Accreditation for Bodies Performing non-destructive Testing 00 EA-4/16 EA guidelines on the expression of uncertainty in quantitative testing 00 EA-4/18 Guidance on the Application of EN and ISO/IEC Guide 5 to 1 Ed Electromagnetic Compatability (EMC) Testing (Già EAL-G7) QUAM:000.1 EURACHEM-CITAC Guide CG4 - Quantifying Uncertainty in Analytical Ed Measurement (*) SIT Doc-519 Introduzione ai criteri di valutazione della incertezza di misura nelle tarature 5 Presentazione SINAL e requisiti della UNI CEI EN ISO/IEC 1705 (P. Bianco) ISO/IEC 1705: requisiti tecnici - Incertezza di misura: approccio GUM ISO/IEC 1705: requisiti tecnici - Incertezza di misura: altri approcci ISO/IEC 1705: requisiti tecnici - Incertezza di misura: decisioni Incertezza di misura e prove valutative (S. Pepa e M. Scognamiglio) Sito dedicato alla guida EURACHEM-CITAC. E' disponibile la guida in linea, con numerosi esempi di chimica analitica. 1 Francia Latticini S.p.A. Sistema Nazionale di Accreditamento dei Laboratori di Prova 3 Documento emesso durante la revisione del presente lavoro Pag. 8 di 5

9 MATERIALE DEI CORSI DI AGGIORNAMENTO 006 Incertezza di misura in chimica e qualità dei dati. P. Anichini Materiale dei corsi sull'incertezza di misura nelle prove chimiche tenuti con la collaborazione di UNICHIM: Introduzione al corso. C. Divo Esempio microbiologico. N. Bottazzini Verifiche della qualità dei risultati. C. Divo Interventi al Convegno L'ACCREDITAMENTO DEI LABORATORI PER LA SICUREZZA ALIMENTARE, 5-6 ottobre 005, organizzato da ISS ORL, SINAL, SIT Criteri generali per la valutazione dell'incertezza di misura. F. Pennecchi, M. Mosca Incertezza di misura: dalla GUM alla linea guida EURACHEM-CITAC. A. Menditto, M. Plassa Esempi pratici per la valutazione dell'incertezza di misura in ambito chimico. P. Anichini, G. Bonacchi Esempi pratici per la valutazione dell'incertezza di misura in ambito microbiologico. A. Maiello, A. Viti Valutazione dell'incertezza di misura: esperienza di un laboratorio accreditato per gli OGM. S. De Martin A questo punto Luis, che tra l altro esegue direttamente, e supervisiona, circa 1000 determinazioni giornaliere, ha iniziato una prima ricognizione su tutti questi documenti, e dopo circa una settimana, completamente demoralizzato, e in forte crisi di identità, mi ha chiamato e mi ha detto testualmente: i pochi concetti che credevo di avere chiari sull incertezza e sulla statistica si sono trasformati in una informe massa di dubbi e di perplessità, che posso fare? Gli ho consigliato di seguire un corso sul tema dell incertezza allo scopo di rinfrescare i concetti base di statistica e di acquisire un approccio sistematico per poter poi meglio utilizzare anche i documenti proposti dal SINAL. Un mese ed un corso dopo Luis mi ha richiamato, confessandomi che il corso era stato molto utile, gli aveva fornito molte informazioni, gli aveva sciolto molti dubbi, ma principalmente gli aveva dato una certezza, la certezza che l incertezza era una cosa da iniziati, tanto che alla fine del corso uno dei partecipanti, un chimico, aveva detto: ma alla fine, come si calcolano la ripetibilità e l incertezza? io questo solo volevo sapere e ancora non lo so! Era chiaro, anche questa volta, come nella maggior parte dei corsi era stato insegnato al più, cosa bisogna fare piuttosto che come si fanno le cose. Ormai ero incastrato, dovevo dare una mano a Luis. Il mio dubbio fu se partire dai concetti base di statistica descrittiva e di inferenza statistica, oppure dalle necessità pratiche di Luis; la mia certezza era la consapevolezza di dovergli fornire sia le informazioni teoriche indispensabili a capire il perché che gli elementi pratici per sapere come, miscelandoli e definendone le priorità in relazione alle necessità. Decisi di partire dalle necessità pratiche del mio amico. Pag. 9 di 5

10 Il lavoro M 4 Qual è il tuo problema? L 5 Devo validare un metodo interno. In realtà non si tratta di un metodo ideato dal laboratorio: con tutto quello che ho da fare ci mancherebbe che mi mettessi a sviluppare dei metodi di prova! Il metodo, che prevede l utilizzo di un apparecchiatura complessa, il FOSSOMATIC MINOR, è stato elaborato da una multinazionale del settore, la FOSS Analytical A/S e non riporta dati di validazione. Il parametro da determinare è il numero di cellule somatiche/ml nel latte vaccino. I limiti operativi del metodo prevedono la determinazione delle cellule somatiche nel campo di misura cellule/ml. Ai fini della validazione devo determinare, tra l altro, la ripetibilità e l incertezza. M Mi puoi spiegare meglio come è fatta e come funziona questa apparecchiatura? L Il Fossomatic Minor, evidenzia il DNA cellulare con un colorante (Propidium iodide), lo fotografa e quindi elabora l immagine elettronicamente restituendo il valore di cellule somatiche attraverso il collegamento ad un PC. M Quali sono le specifiche tecniche del Fossomatic Minor? In particolare cosa riporta la FOSS in relazione ai parametri che devi determinare? L La FOSS nelle sue specifiche tecniche riporta la ripetibilità espressa in termini di coefficiente di variazione CV a tre livelli e una valutazione dell accuratezza come rapporto con un metodo di conta diretta al microscopio, come puoi ben vedere. Repeatability**: CV < 7 % at cells/ml (** coefficient of variance) CV < 5 % at cells/ml CV < 4 % at cells/ml Accuracy: < 10 % relative mean diff. from Direct Microscopic Somatic Cell Count (DMSCC) Carry-over: < 1.5% M Bene, ecco il nostro primo problemino: esprimere il CV secondo parametri che conosciamo meglio e che possiamo determinare: la formula del CV è la seguente CV = s x "100 dove s è lo scarto tipo di ripetibilità e x la media dei risultati di un numero elevato di prove (>30) eseguite con il metodo in esame. 4 M = Michele 5 L = Luis! Pag. 10 di 5

11 L Mi ricordi cosa è lo scarto tipo? M Lo scarto tipo è la radice quadrata positiva della varianza, - ho risposto in modo per me chiaro, preciso e inequivocabile -. L Cosa è la varianza? M La varianza è una misura della dispersione dei risultati, ed è data dalla somma dei quadrati delle differenze rispetto alla loro media divisa per il numero dei risultati meno uno, che in termini matematici (quando si riferisce ad un campione di dati) si esprime come riportato di seguito. varianza(x 1, x,...x n ) = 1 n # n "1 (x i " x) 1 Mentre se ci riferiamo all intera popolazione di dati, il termine n-1 viene sostituito da n. L Quelle che! mi hai dato sono definizioni, io voglio sapere che cosa è in pratica lo scarto tipo, inoltre nei miei ricordi, non ritrovo lo scarto tipo, che se ho ben capito è probabilmente un altro modo di chiamare la deviazione standard. Tale termine non si trova neanche nelle funzioni statistiche di excel, allora me lo spieghi? M Per quanto riguarda la seconda parte della tua domanda ti dico subito che sono sinonimi, anche se, volendo, si possono trovare giustificazioni semantiche e interpretazioni interessanti del diverso nome dato a due parametri identici. In ogni caso nel nostro lavoro, è bene chiarirlo subito, parleremo sempre di scarto tipo. E veniamo alla prima parte della domanda, e cioè cosa è, o meglio cosa rappresenta in pratica, lo scarto tipo. In primo luogo ti devo ricordare che molti fenomeni naturali da quelli biologici a quelli fisici si distribuiscono generalmente secondo una curva detta curva di Gauss, e da tale curva partiremo. L Ferma la musica! Anche al corso che ho frequentato hanno iniziato da qui, ma poi sai come è finita. M Abbi fede e ascolta quello che ti dico! Intanto, prima di parlare di Gauss devo darti un altra definizione, quella di ripetibilità. La norma UNI-CEI-ENV del 000, dà la seguente definizione: Ripetibilità (dei risultati di misurazione) Grado di concordanza tra i risultati di successive misurazioni dello stesso misurando effettuate nelle stesse condizioni di misura. Nota 1 queste condizioni sono denominate condizioni di ripetibilità Nota Le condizioni di ripetibilità comprendono: lo stesso procedimento di misurazione, lo stesso osservatore, 6 UNI-CEI-ENV Guida all espressione dell incertezza di misura Pag. 11 di 5

12 lo stesso strumento di misura utilizzato nelle stesse condizioni lo stesso luogo ripetizione entro un breve periodo di tempo Nota 3 La ripetibilità può essere espressa quantitativamente in termini delle caratteristiche di dispersione dei risultati Il Manuale Unichim 179/1 7 distingue invece tra ripetibilità stretta e ripetibilità intermedia e riporta: Condizioni di ripetibilità stretta: Condizioni nelle quali i risultati mutuamente indipendenti vengono ottenuti con lo stesso metodo su uno stesso materiale, nello stesso laboratorio, dallo stesso operatore, utilizzando la stessa strumentazione, in un intervallo di tempo breve (senza ritaratura). Nota - Queste condizioni rappresentano la costanza di tutti i fattori riguardanti la realizzazione delle prove. La variazione di una o più di tali condizioni, tenendo però fisso il laboratorio, il materiale da esaminare e il metodo, porta a considerare una ripetibilità intermedia 8. Se intervengono diversi laboratori con lo stesso metodo nell esame dello stesso campione si determinano le condizioni per valutare la riproducibilità. Tornando alla distribuzione normale, lo stesso manuale 179/1 dell UNICHIM, riporta che nella maggior parte dei casi i risultati di analisi chimico fisiche condotte in condizioni di ripetibilità stretta si distribuiscono secondo la classica curva a campana o di Gauss. Nel nostro caso, la variabile in gioco, il conteggio delle cellule somatiche, è una tipica variabile discreta che per sua natura non si distribuisce secondo la curva di Gauss, ma secondo quella di Poisson. Tuttavia ai conteggi elevati, come quelli relativi alle cellule somatiche, la distribuzione di Gauss ed i suoi parametri rappresentano un ottima approssimazione di quella di Poisson. L Mi ricordi le caratteristiche e le proprietà delle gaussiana? M Si supponga di eseguire, in condizioni di ripetibilità stretta, un gran numero di misurazioni di un certo misurando, e di riportare in un grafico (istogramma) le frequenze relative 9 dei valori ottenuti (x i ) con le prime 0, 40, misure. All'aumentare del numero di misure, i valori tendono ad accentrarsi attorno alla loro media e l'istogramma assume una forma a campana sempre più regolare, che può essere approssimata con una funzione reale nota come funzione di Gauss o funzione normale. 7 Manuale Unichim 179/1 Linee guida per la validazione di metodi analitici nei laboratori chimici - valutazione della precisione (ripetibilità stretta) di un metodo analitico eseguito in un unico laboratorio da un solo operatore su di un unico strumento in un breve intervallo di tempo. 8 La definizione e i diversi casi sono riportati nella ISO Le frequenze relative sono date dal rapporto tra le frequenze assolute ed il numero delle osservazioni. Pag. 1 di 5

13 La funzione di Gauss Distribuzione di Gauss dove: f(x) è la densità di probabilità o frequenza con cui il valore x può essere riscontrato σ è lo scarto tipo della totalità delle misure; µ è la media della totalità delle misure; e base dei logaritmi naturali ( e = ). π = µ La variabilità aumenta all aumentare di σ µ = µ 1 = µ Al variare dello scarto tipo la curva modifica la sua forma σ = σ 1 = σ Al variare della media aritmetica (a parità di scarto tipo) la curva trasla sull asse delle x tale area la prob Le caratteristiche della distribuzione normale 1. è simmetrica rispetto al valore medio. il valore di x = µ oltre che alla media aritmetica coincide con la moda e la mediana 3. è asintotica all'asse delle x da entrambi i lati 4. è crescente per x<µ e decrescente per x>µ 5. possiede due punti di flesso per x = µ±σ 6. l area sotto la curva è = 1 (rappresentando tale area la probabilità che si ottenga un qualsiasi valore di x) L OK, mi hai ricordato una serie di cose che ho studiato durante il mio corso di studi, ma avendole abbandonate da tempo, quasi non ricordavo più. In effetti avevo proprio bisogno di questi richiami. Però.. ora che ci penso, il fatto che l area sotto la curva di Gauss sia uguale ad 1 mi serve a poco, in quanto le mie necessità sono in genere altre; ad esempio, se io voglio conoscere la probabilità che un dato valore sia compreso in un intervallo definito, delimitato ad esempio da due valori x 1 e x, come devo fare? Pag. 13 di 5

14 M Ovviamente tale probabilità è data dall area della curva compresa tra x 1 ed x e quindi basta semplicemente calcolare tale area, calcolando l integrale della funzione di Gauss tra questi due valori. Il vero problema è che questa funzione non è facilmente integrabile. L E i computer a che servono? M In effetti puoi usare le funzioni di excel, e ti dirò dopo come, ma intanto è utile che tu acquisisca le ultime informazioni sulla curva di Gauss ed in particolare su come si opera per il calcolo del suo integrale. riferimento 10 INTERVALLI DI PROBABILITÀ riferimento 11! Per ovviare alle difficoltà di calcolo dell integrale della funzione di Gauss, si può trasformare una generica funzione gaussiana f(x) con media µ e varianza σ, in una funzione gaussiana standard con media 0 e varianza 1. Ponendo: Z = x " µ si ottiene f (z) = 1 # " e#1 (z) il simbolo Z viene generalmente in molti laboratori sostituito da k p Per la funzione standardizzata sono state predisposte delle! tabelle in funzione di Z. Le tabelle se pur ancora largamente usate stanno sempre più cedendo il campo ai PC 10 Sito SINAL Paolo Bianco ISO/IEC 1705: requisiti tecnici 11 Pag. 14 di 5

15 L Fermo! Finora abbiamo parlato di popolazioni, quindi di un numero infinito di dati, ma io ho a che fare invece sempre con un numero limitato di dati, come la mettiamo? Come ci può aiutare Gauss? M Questo stesso problema se lo è posto circa un secolo fa un tuo collega (nel senso che, come te in passato, anche lui lavorava in una fabbrica di birra) di nome W.S. Gosset, più noto sotto lo pseudonimo di Student. Proviamo a definire meglio il rapporto che lega i piccoli campioni e le popolazioni: supponiamo di conoscere il valore medio µ di una popolazione, se operiamo con un certo numero m di piccoli campioni (costituito ognuno da n elementi o unità statistiche), rappresentativi della popolazione, ci possiamo aspettare che la media di ogni campione abbia una certa distribuzione centrata intorno a µ e ci possiamo anche aspettare che la dispersione di tale distribuzione intorno alla media della popolazione dipenda dalla dimensione del campione (più grande il campione, migliore la stima di µ). In termini matematici si può dimostrare che lo scarto tipo delle medie che chiameremo s è uguale a s = " n con n uguale al numero di elementi del campione. Questo riflette il fatto che la media tende ad essere meno variabile, ed in effetti se ci riferiamo alle medie invece che alle osservazioni singole l espressione! Z = x " µ diventa Z = x " µ # # / n.! Le formule precedenti presuppongono che σ sia nota, cosa che per quanto riguarda i metodi di prova, non sempre è vera, come giustamente hai puntualizzato. Per ovviare a tale problema,! Student propose di sostituire alla Z t = x " µ s/ n! della relazione precedente,! Z = x " µ # / n, il parametro dove x e s rappresentano rispettivamente la media e lo scarto tipo del campione in esame, che sostituiti nella funzione di Gauss, restituiscono le stesse informazioni, ma su un campione limitato della popolazione. La distribuzione di Student è ancora simmetrica rispetto a µ ed è funzione dei gradi di libertà. E si può affermare che la distribuzione di Student ha fianchi più larghi, code più alte e varianza maggiore: in altri termini, facendo un paragone con le curve femminili è, come si dice a Roma, un po più tracagnotta della distribuzione normale. ν=1 4 All aumentare dei gradi di libertà la distribuzione di Student approssima la gaussiana. L Fermati, non ti lascio proseguire se non mi dici cosa sono i gradi di libertà. Pag. 15 di 5

16 M In generale si può dire che i gradi di libertà sono dati dal numero delle variabili meno il numero di vincoli. L Mi sembra di parlare con un secondino, gradi di libertà, vincoli; tra poco mi parlerai di sbarre e sole a scacchi, fammi un esempio. M Ti faccio un esempio tratto dal Perry s 1 : quattro numeri in una tabella che deve avere la somma delle righe e delle colonne uguali a zero ha solo 1 grado di libertà (4 numeri e tre vincoli, in quanto il quarto è ridondante). Nelle situazioni più semplici (quasi sempre nel nostro caso) i gradi di libertà, generalmente indicati con ν, sono dati dal numero delle osservazioni meno uno. L Perfetto! Ora sì. M Tornando al discorso relativo ai piccoli campioni, invece di calcolare la media di ogni gruppo, possiamo calcolare lo scarto tipo di ognuno di essi: ci dobbiamo aspettare che tali stime di σ abbiano una qualche distribuzione caratteristica. In particolare viene definita una distribuzione di (s /σ )*ν con ν = gradi di libertà = n-1. Tale distribuzione è chiamata distribuzione chi-quadro (χ ) la cui forma dipende dalla numerosità del campione. Nel grafico sono mostrate le varie distribuzioni al variare di v. ν = L E a che serve? M Serve a verificare la bontà dell accordo tra dati sperimentali e dati teorici Il χ può servire per valutare se la varianza σ di una popolazione, dalla quale sia stato estratto un campione con varianza s, sia uguale o diversa da un valore predeterminato σ 0 di una popolazione. L Ma quante distribuzioni ci sono? M Calmati, ancora una e abbiamo finito! Sempre proseguendo con lo stesso tema dei campioni con distribuzione normale, come rappresentativi di una popolazione, dobbiamo fare un ultima considerazione. Invece di considerare la distribuzione delle singole varianze s dei campioni, possiamo considerare un altro tipo di distribuzione, che ancora coinvolge la stima della varianza della popolazione σ. Riferendoci ai nostri m campioni, possiamo calcolare di ognuno la s i e quindi calcolare il rapporto tra quelli consecutivi (s 1/ s, s 3/ s 4, s 5/ s 6 ecc. 1 Perry s Chemical Engineers Handbook McGraw Hill 1997 Pag. 16 di 5

17 Ancora ci dobbiamo aspettare che questi rapporti abbiano una certa distribuzione di frequenza. Anche questa distribuzione dipende dalle dimensioni del campione. È da notare che i campioni possono non essere della stessa numerosità, in questo caso la forma della distribuzione dipende dalla numerosità dei campioni n 1, n,... Tale distribuzione è definita come distribuzione di Fischer F(ν 1, ν ). (n1, n) = (0, ) (0, 4) (0, 8) (0, 16) Distribuzione F Più precisamente, se due variabili sono indipendenti e distribuite come χ, allora il rapporto fra le due variabili, ciascuna divisa per il proprio numero di gradi di libertà, è distribuito secondo una distribuzione simile a quella in figura. Questa distribuzione è utile per determinare se due serie di dati, provenienti da una distribuzione normale, hanno la stessa dispersione (stessa varianza). Ovviamente anche per questa distribuzione esistono sia delle tabelle che delle funzioni di excel. M In sintesi, se non l hai ancora capito, testone, queste distribuzioni servono a determinare quale differenza ci si può aspettare tra varie quantità dovuta ad effetti casuali, o in altri termini per determinare se gruppi di dati differiscono da altri gruppi o da valori/valore ipotizzati. Ad esempio, se fissata una certa probabilità, la varianza del campione in esame può essere assunta come una stima dello varianza della popolazione (o se vuoi leggi scarti tipo invece di varianze). Ti riporto il riepilogo delle distribuzioni di cui abbiamo parlato Distribuzione Simbolo Parametri Variabile Singole osservazioni di una Gauss z popolazione* Z = x " µ # z Medie Z = x " µ # / n! Student t Medie con σ incognita* t = x " µ s/ n Chi -quadro χ Varianze*! χ = ν s /σ Fisher F Rapporto delle varianze di due campioni indipendenti* F(ν 1, ν ) = s 1 /s * provenienti da una distribuzione normale! Riferimento 1 M Ti ricordo che alla base di tutti questi discorsi ci sono due ipotesi: la prima è che stiamo operando in condizioni di ripetibilità stretta (in altri termini le variazioni sono dovute unicamente al caso), la seconda è che la distribuzione dei dati è normale. Pag. 17 di 5

18 interpolatrice si avvicinerà ad una retta. Se i dati non si posizionano approssimativamente su una retta dobbiamo dedurre che la distribuzione non è normale. Esempio: campioni da una distribuzione normale normal probability plot 13 Per quanto riguarda il test di Kolmogorov-Smirnov si verifica se la differenza massima tra le frequenze cumulate attese e sperimentali è inferiore ad un valore critico, per poter concludere che la distribuzione è normale. L Chiaro e semplice, ottimo, mi piace, anche se spero che mi dirai cosa sono i quantili e le frequenze cumulate! Ma se i dati, normali o no, presentano dei dati anomali, come me ne accorgo, come mi devo comportare? M Intanto chiariamo che un dato anomalo, o outlier, è un dato che giace fuori dal modello di distribuzione, un punto che non è ben interpolato dal modello stimato, ed è indice di qualche sorta di problema quale un risultato estremo, un errore di misura, un errore di trascrizione, ecc.. Il Normal Probability plot ci può ancora aiutare nell individuare i dati anomali, in quanto se la distribuzione non è ben interpolata con una retta, ma si notano alcuni punti non allineati, molto probabilmente quei punti rappresentano dei dati anomali; sempre da tale diagramma è possibile capire se vi sono dati anomali anche se tutti i dati sono ben allineati: è questo il caso di dati molto lontani dalla maggior parte di dati accentrati in prossimità della media. Per quanto riguarda il cosa fare dei dati anomali, in genere si tende ad eliminarli o a correggerli in relazione alle cause che li hanno determinati, ma non sono rari i casi in cui si accettano tal quali: in ogni caso ogni scelta deve essere ben argomentata e giustificata. Vi sono sistemi specifici per l individuazione dei dati anomali: uno si basa sull uso di particolari quantili, i quartili, con tale metodo sono individuati come outliers i dati minori del primo quartile meno 1,5 volte il range interquartile o i dati maggiori del terzo quartile più 1,5 volte il range interquartile. Comunque il test più semplice ed al tempo stesso tra i più efficaci per l individuazione dei dati anomali (o outlier) è il test di Huber. Come al solito su molti testi puoi trovare altri criteri sia della verifica di normalità (es. test di Shapiro Wilk) che della presenza di dati anomali (es. test di Dixon, test di Grubbs etc.) 7 M Per tua comodità e per facilitarti il lavoro ti mostrerò dopo come verificare la normalità dei dati e come individuare i dati anomali con i criteri che ti ho appena descritto, utilizzando diversi semplici comandi di Excel. 13 Guido Masarotto - Facoltà di scienze statistiche Università di Padova lezioni di inferenza statistica a.a Pag. 19 di 5

19 Luis e la distribuzione normale L Ti ringrazio in anticipo per quanto mi metterai a disposizione, ma ora basta con le chiacchiere, anche se molto interessanti, e fammi capire con qualche esempio pratico. M Ti propongo di utilizzare per gli esempi dei dati reali, così contemporaneamente potremo raggiungere il primo dei nostri obiettivi, che è il calcolo dello scarto tipo che ti interessa. L OK, Partiamo dai dati. M In primo luogo i dati da analizzare devono essere ottenuti in condizione di ripetibilità stretta. Quindi facciamo così: prendiamo un latte da analizzare ed invece di una sola determinazione chiediamo a Valentina di effettuare dieci repliche una dopo l altra, senza modificare nessuna delle condizioni operative. V 14 E ti pareva, loro fanno gli scienziati e Valentina produce i dati, o meglio Valentina li ha già prodotti. Mentre voi elaboravate le vostre teorie io ho effettuato 10 analisi in condizione di ripetibilità stretta su un latte con circa cellule/ml: eccoli, tutti per voi, espressi in migliaia di cellule/ml: L Sei un tesoro, adesso questi dati me li lavoro io. Innanzi tutto voglio verificare se sono distribuiti normalmente, usando il normal probability plot. A proposito, ma se non mi dici cosa sono i quantili non sono in grado di disegnarlo, e quindi datti una mossa! M Ti riporto la definizione più semplice che ho letto: L'idea alla base di un quantile-p (dove p è compreso tra 0 e 1) è di cercare un numero che sia più grande del 100 x p% dei dati osservati e più piccolo del restante 100 x (1 - p)%. Ad esempio, un quantile 0,1 deve essere un valore che lascia a sinistra il 10% delle osservazioni ed a destra il restante 90%. I quantili con p uguale a 0,5-0,50 e 0,75 vengono chiamati rispettivamente il primo, il secondo e il terzo quartile. Dividono la popolazione in quattro parti uguali. Si osservi che il quartile coincide con la mediana. I quantili con p = 0,01; ; 0,99 si chiamano percentili. 15 Capirai meglio i quantili mentre costruiamo il normal probability plot: Dato un insieme di n valori sperimentali, 1. si ordinano i dati in senso crescente. si numerano i dati ordinati da 1 a n 3. si calcola lo scarto tipo e la media dei valori sperimentali, 4. si calcola per ogni valore sperimentale x i il corrispondente valore standardizzato della distribuzione normale Z i Z i = x i " µ # 14 V = Valentina 15 Masarotto Facoltà di scienze statistiche Università di Padova lezioni statistica descrittiva a.a ! Pag. 0 di 5

20 5. si calcola il rango di ogni dato ordinato in senso crescente (rango: brutta traduzione italiana dell'inglese rank, che significa posizione in graduatoria/classifica/ordine crescente) 6. si calcolano le frequenze cumulate relative per ogni rango da 1 a n (la Frequenza Cumulata Relativa è uguale a (Rango (i) - 0,5)/n ) 7. si calcolano i valori della Z teorica relativa (quantili) ad ognuna delle frequenze cumulate relative, 8. si riportano in un diagramma cartesiano i valori delle Z i (quantili) teoriche sull asse delle x 9. si riportano i corrispondenti valori delle Z i sperimentali sull asse delle y 10. si costruisce la retta che interpola i dati 11. si valuta la bontà della correlazione lineare. Ovviamente tutto ciò può essere fatto con excel in particolare per ricavare i quantili e per costruire la retta interpolatrice in quanto excel restituisce oltre all equazione della retta anche il coefficiente di correlazione r che è l indice della bontà della correlazione (più r si avvicina a 1, migliore è la correlazione lineare). L Scusa: perché hai usato per il calcolo della frequenza cumulata (Rango (i) - 0,5)/n invece di Rango (i) /n? M Perché se avessimo usato Rango (i) /n, la frequenza cumulata massima sarebbe stata uguale ad 1 e quindi la relativa Z sarebbe stata uguale a (riferimento) 13. L Perfetto guarda cosa è venuto fuori dalle tue elucubrazioni, considera che ho seguito passo-passo ogni tua parola. A B C D E F dati ordinati quantili sperimentali z (kp) rango frequenze cumulate relative quantili teorici ,78 1 0,05-1, ,77 0,15-1, ,39 3 0,5-0, ,39 3 0,5-0, ,14 5 0,45-0, ,11 6 0,55 0, ,11 6 0,55 0, ,4 8 0,75 0, ,13 9 0,85 1, , ,95 1,64 Media 134,1 Scarto tipo 7,91 quantili sperimentali quantili teorici y = 0,9768x + 0,0536 R = 0,948 FORMULE EXCEL UTILIZZATE Z = ((Bi-media(Bi))/(dev.st(Bi)) Freq. Cum. Rel = [Di-0,5]/(totale dati) Quant. Teor = INV.NORM.ST(Ei) Rango = Rango ( ) Scarto tipo = dev.st( ) In prima istanza i dati mi sembrano abbastanza ben interpolati da una retta, per cui deduco, per ora, che la distribuzione è normale. Tu che pensi? M Ho verificato l ipotesi di normalità dei dati con un software ad hoc, il software dell UNICHIM 16 che utilizza il test di Shapiro-Wilk, ebbene, il test conferma la distribuzione normale. Ti ricordo comunque che il test di Shapiro Wilk può essere utilizzato per un campione fino a 40 dati. 16 Software applicativo per l elaborazione dei risultati analitici Milano 006 Pag. 1 di 5

21 La stessa cosa ci dovremmo aspettare dal test di Kolmogorov Smirnov (che può essere utilizzato per campioni che hanno anche più di 40 dati). Per quanto riguarda tale test si opera come di seguito: si calcolano le frequenze cumulate sperimentali dei dati da analizzare (ipotizzando una distribuzione normale), si determinano quindi le frequenze cumulate relative teoriche per la distribuzione in questione e quindi se ne fa la differenza (punto per punto); se il valore della differenza massima è inferiore ad un valore critico tabulato, si conclude che la distribuzione è normale. Eccoti i risultati serviti caldi caldi. A B C D E F frequenza frequenza indice dati cumulata cumulata IzI rango ordinati sperimentale teorica IΔI (FCR) (FCT) ,78 0, ,1 0, ,77 0,0 0, 0, ,39 0, ,3 0, ,39 0, ,3 0, ,14 0, ,5 0, ,11 0, ,6 0, ,11 0, ,6 0, ,4 0, ,8 0, ,13 0, ,9 0, ,88 0, ,030 FORMULE EXCEL UTILIZZATE Z= [(Bi-media(Bi) ) /dev.st(bi) FCR= Distrib.Norm(Bi;media;dev.st;VERO) FCT= rango/(n. dati) Δ= ass(fct-fcr) Scarto tipo = Dev.st. Media 134,10 Varianza 6,54 Scarto tipo 7,91 Differenza Critica 95% 0,409 Massima differenza Max Δ 0,05 Essendo la differenza massima = 0, < della differenza critica d c = 0,409 (ricavata dalla tabella) si deduce che la distribuzione è normale 1, 1 0,8 0,6 0,4 0, frequenza teorica frequenza sperimentale L Ho la sensazione che tu manipoli i dati a tuo piacimento secondo le tue necessità: mi dai l idea degli analisti politici, che riescono sempre ad ottenere le proiezioni di voto utili ai loro mandanti. Perché questa volta nel calcolo delle frequenze cumulate teoriche non hai sottratto il valore 0,5 come hai fatto in precedenza? M Mi lusinghi, paragonandomi con gli esperti statistici dei nostri litigiosi esponenti politici, ma non ho fatto alcuna manipolazione. Non ho sottratto lo 0,5 in quanto in questo caso non era necessario. L Da dove hai tirato fuori il valore critico? M non è stato semplice, ma a seguito di una lunga ricerca su Internet, mi sono imbattuto in un sito che riportava la tabella seguente. Pag. di 5

22 Tabella valori critici di Kolmogorov Smirnov p=95% n d c n d c n d c n d c n d c 1 0, , , , ,149 0,84 0,81 4 0,05 6 0, , , , , , , ,64 4 0, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,4 50 0, , , , , , , , , ,34 5 0, , , , , , , , , ,7 54 0, , , , ,4 55 0, , , , ,1 56 0, , , , , , , , , , , , , , , , , , , , , , ,134 Fonte 17 0,450 0,400 0,350 0,300 0,50 0,00 0,150 0,100 0,050 0, y = 1,649x -0,487 Serie1 Potenza (Serie1) R = 1 Per i dati da 10 a 100 ho anche calcolato per te la relazione che lega il numero di dati al valore critico; l'equazione è d n = 1,649*n (-0,487) che per n > 100 diventa: d n =1,358*n (-0,5) Luis e i dati anomali L Va bene, mi hai convinto. Adesso dobbiamo vedere se ci sono dei dati anomali. Da una prima occhiata al normal probability plot credo che potrebbero essere anomali il primo e l ultimo dato in quanto piuttosto lontani dagli altri dati, ma dimmi come è possibile in modo più rigoroso individuare gli outliers? M Per individuare eventuali dati anomali possiamo utilizzare il test di Huber, che passo subito a descriverti: Si ordinano i dati dati ordinati 10, 18, 131, 131, 133, 135,135, 136, 143, 149 Si calcola la mediana dei dati mediana = 134 Si calcola la differenza tra ogni dato e la mediana (D i ) D i = 14, 6, 3, 3, 1, 1, 1,, 9, 15 Si calcola la mediana delle differenze (D m ) D m = 3 Si calcola il prodotto D m x 4,5 D m x 4,5 = 3x4,5 = 13,5 I valori per cui D i > D m x 4,5 sono anomali Valori anomali 10, 149 Il procedimento può essere velocizzato ed automatizzato utilizzando semplici formule excel, come riportato di seguito. I dati ordinati sono ottenuti selezionando la colonna dei dati e quindi cliccando su DATI e successivamente scegliendo l opzione ORDINA, le mediane sono calcolate con la formula MEDIANA(.) i residui sono calcolati con la formula = Ass (B(i)-D(i)), i dati anomali sono evidenziati con la formula = SE(Ci-Di>0;Ci;"") 17 Pag. 3 di 5

23 A B C D E 1 dati dati ordinati residui Test Dm x 4,5 dati anomali , , , , , , , , , , mediana 13 Di Dm Inoltre ho fatto una verifica con il software 16 che ho utilizzato prima e ho avuto la conferma di questi dati anomali. L Adesso, mi è tutto chiaro e devo riconoscere che finora hai mantenuto la parola, in quanto non hai mai fatto ricorso alle tabelle ma solo alle funzioni di excel, e quando sei stato costretto ad utilizzare la tabella di Kolmogorov-Smirnov, sei riuscito a trasformarla in una funzione. Luis e lo scarto tipo Se ho ben capito quindi, a questo punto possiamo calcolare lo scarto tipo di ripetibilità con i dati di partenza! M E no, i dati di partenza non vanno bene, in quanto, avendo individuato alcuni dati anomali, dobbiamo decidere se tenerli o se eliminarli. Io, considerato che i dati sono molto vicini al limite di accettabilità li terrei, anzi, ti propongo di calcolare lo scarto tipo, sia con tutti i dati senza quindi eliminare gli outliers, e quindi di calcolare lo scarto tipo eliminandoli. Il calcolo dello scarto tipo utilizzando tutti i dati è banale, basta utilizzare la formula di excel =dev.st(143;131;10;135;149;18;133;131;135;136) che dà come risultato s r =7,91 L Allora nell altro caso basta utilizzare la stessa formula, dopo aver eliminato gli outliers! M In genere si, ma è sempre opportuno verificare, se in assenza di tali dati la distribuzione è ancora normale. Nel nostro caso lo è, come si può facilmente arguire dalla tabella precedente, dove, essendo outliers i due dati estremi, i valori di D i e D m non cambiano. Eliminando i due dati, si ottiene una s r =4,50. Considerato che se i dati eliminati fossero stati appena diversi es. 11 al posto di 10 e 147 al posto di 149, gli stessi dati non sarebbero risultati anomali. Alla luce di tali considerazioni, io accetterei i dati anomali nel calcolo dello scarto tipo, anche in virtù del fatto che i dati considerati sono delle misure affette da una incertezza ancorché incognita. Una conferma della accettabilità dei dati anomali è data dal fatto che la funzione della distribuzione cumulata assume per il dato 10 il valore di 0,037 e per il dato 149 il valore 0,97; in altri termini i due dati sono rispettivamente in zone della curva di Gauss > dell 1% e < 99%, ambiti nei quali gli outliers possono essere accettati. Pag. 4 di 5

24 Luis e la verifica della media L A questo punto mi chiedo: ma la media calcolata attraverso il nostro campione di 10 prove ripetute in condizione di ripetibilità stretta, è una stima credibile della media di una popolazione con le stesse caratteristiche? M La risposta la dobbiamo cercare o dandoci un riferimento opportuno, che al momento non può che essere la specifica tecnica della FOSS, oppure ricorrendo a qualche considerazione statistica. M Avendo appurato che i dati in nostro possesso hanno distribuzione normale, assumendo come σ lo scarto tipo ricavato per interpolazione dai dati della specifica tecnica della FOSS, chiamiamo la nostra media calcolata x, il problema che ci poniamo è con quanta precisione x può stimare µ, o in altri termini quale è il range dei valori che include, con una specificata probabilità, il valore vero µ. Dalla relazione + Z si ottiene con facili trasformazioni = x " µ! µ = x + Zσ µ = x + Z! x ovvero µ = x ± Z " n, ponendo " x = " n Quindi, scegliendo un determinato livello di probabilità o di confidenza che determina il valore di Z, si ottiene :! x " Z # n < µ < x + Z # n Nel nostro caso avendo ottenuto da 10 misure il valore medio x = 134,1 e lo scarto tipo di ripetibilità s = 7,91, utilizzando per σ il valore 8,57 (valore ricavato per interpolazione dai dati della FOSS), quale è l intervallo nel quale ci dobbiamo aspettare di trovare la media vera µ della popolazione con una! probabilità del 95%? In altri termini, essendo la distribuzione simmetrica rispetto a µ, qual è l intervallo di confidenza tale per cui il solo il,5% dei valori è minore del limite inferiore di tale intervallo e il,5% dei valori è maggiore del limite massimo di tale intervallo? La soluzione del problema è banale, in quanto dalla formula di excel = INV.NORM.ST(0,975) si ottiene 1,96 (analogamente INV.NORM.ST(0,05), dà come risultato - 1,96) che sostituiti nella precedente dà 1,96! 8,57 1,96! 8,57 134,1 " < µ < 134, ,8 < µ < 139,4 In realtà è anche possibile calcolare direttamente l intervallo di confidenza; in questo caso la sintassi è: =CONFIDENZA(alfa;dev_standard;dimens), con alfa = nel nostro caso = 0,05 si ottiene il valore di 5,31, che aggiunto e sottratto a 134,1, restituisce gli stessi risultati calcolati precedentemente (18,8 e 139,4).! Pag. 5 di 5

25 L Il tuo esempio non mi convince del tutto, in quanto nel suo sviluppo non hai mai menzionato il birraio (Student), pur operando su un campione di solo dieci dati e non su una popolazione infinita. M Non l ho chiamato in causa in quanto non serviva, dato che abbiamo assunto come scarto tipo il valore 8,57 derivandolo dai dati della FOSS, e assumendolo come proveniente da una popolazione infinita, cosa che ci ha consentito di utilizzare la funzione di Gauss e le formule ad essa relative. Se supponiamo, invece sempre nello stesso esempio, di non conoscere σ in quanto non utilizziamo i dati della FOSS, allora dobbiamo far ricorso allo scarto tipo di ripetibilità s calcolato dal laboratorio dai risultati delle 10 ripetizioni e alla distribuzione di Student. In questo caso il limite di confidenza sarà espresso da x " t sn < µ < x + t s n La soluzione del problema è praticamente uguale alla precedente, con l unica differenza di dover calcolare la t e di utilizzare la formula di excel =INV.T(0,05; 9) =,6 (la formula si riferisce ad una distribuzione di Student a due code) che sostituito nella precedente dà:!,6! 7,91,6! 7,91 134,1 " < µ < 134, ,4 < µ < 139,8 Da cui, come vedi, risulta un intervallo leggermente maggiore. In excel 003 non è disponibile la formula per il calcolo diretto dell intervallo di confidenza. Luis e la verifica dello scarto tipo L Scusa, ma se invece voglio sapere se lo scarto tipo da me calcolato è una stima credibile dello scarto tipo vero (nel caso questo sia riportato ad esempio in un metodo di prova), cosa faccio? M È questo il caso in cui ricorriamo alla distribuzione del χ. Supponiamo nel nostro caso di accettare come vero σ il valore di 8,57 della Foss. Dalla relazione χ (p,ν) = ν s /σ = (n-1)* s /σ, si ricava l intervallo in cui deve essere compreso lo scarto tipo s ( n! 1) # s ' % / ; $ = n! 1 " " & (1!% / ); $ = n! 1 & ovvero $ / ; # = n! 1 s % (1! $ / ); # = n! 1 " " n! 1 n! 1 In questa relazione sono noti tutti i termini tranne χ, che possiamo calcolare da tabelle ad hoc, o utilizzando le formule di excel. Noi utilizziamo, ovviamente, excel. Scegliendo un livello di probabilità p = 95% e ricorrendo alla solita convenzione di indicare p = 1-α, p 1 =α/ e p =1-α/, si calcolano i due valori di χ, per p 1 e p con le formule INV.CHI(0,05;9) e INV.CHI(0,975;9), che danno rispettivamente per il χ i valori,70 e 19,0. Con semplici trasformazioni si ottiene che deve risultare s/σ > [χ ( α/; 9) /ν] 1/ e s/σ < [χ (1- α/; 9)/ν] 1/. E sostituendo i valori numerici si ha che: % & Pag. 6 di 5

26 s & 7,91# % 8,57 " ( n ( 1) ' = 9 ' $! = 7, 67 ) Pertanto, essendo tale valore < 19,0 ( $ ) e >,70 ( $ ), il valore dello scarto tipo 1!# / ; " = n! 1 # / ; " =n! 1 calcolato è compatibile con quello della FOSS. L Vedo che hai mantenuto la tua parola, adesso però andiamo a prendere un bel caffé. Luis e il calcolo dello scarto tipo variabile con la concentrazione M Buono quel caffé! Prima di andare avanti, facciamo il punto della situazione. Ti faccio notare che finora abbiamo determinato lo scarto tipo di ripetibilità solo per un tenore di cellule uguale a cellule/ml e che la Foss dà tre valori diversi a , a e a cellule/ml. In altri termini lo scarto tipo di ripetibilità è funzione della concentrazione di cellule. L Va bene, ma questo significa che dovremmo calcolare lo scarto tipo a tutti i livelli e quindi almeno da cell/ml a cell/ml. M È esattamente quello che dobbiamo fare per poter determinare una relazione che leghi lo scarto tipo del laboratorio alla concentrazione di cellule somatiche. Chiediamo a Valentina di effettuare 10 determinazioni su campioni di latte che coprano il campo da a cellule/ml. L Glielo chiedo subito. Ma noi ci rivediamo tra una settimana, perché devo anche lavorare, tu intanto leggiti questo sonetto e medita sulla statistica: Pag. 7 di 5

27 LA STATISTICA Sai ched'è la statistica? È na' cosa che serve pe fà un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che spósa. Ma pè me la statistica curiosa è dove c'entra la percentuale, pè via che, lì, la media è sempre eguale puro co' la persona bisognosa. Me spiego: da li conti che se fanno seconno le statistiche d'adesso risurta che te tocca un pollo all'anno: e, se nun entra nelle spese tue, t'entra ne la statistica lo stesso perch'è c'è un antro che ne magna due Trilussa Pag. 8 di 5

28 M Ciao Luis, Valentina è riuscita a fare le analisi come avevamo concordato? L Sì ecco i dati già in ordine crescente serie Valori M Molto bene. Ognuna di queste 11 serie dovrebbe essere sottoposta allo stesso procedimento che abbiamo usato prima e cioè: verificare che siano normali, individuare i valori anomali decidere cosa fare dei valori anomali calcolare la media di ogni serie calcolare lo scarto tipo di ogni serie e quindi calcolare la relazione che lega gli scarti tipo ai vari livelli. Supponiamo per un istante di avere fatto tutto questo e chiamiamo s r il generico scarto tipo e le medie corrispondenti. Possono verificarsi due casi: x r a) s r non varia sensibilmente al variare di x r b) s r varia al variare di x r Nel caso a) è sufficiente calcolare la media quadratica pesata s r degli scarti tipo nel seguente modo s r = ( n 1! 1) s r1 + ( n! 1) sr ( n! 1) + ( n 1 + ( n3! 1) sr3 +...( n! 1) +...( n! 1) n n! 1) s rn Nel caso b) si ricerca la relazione funzionale che lega s r a x r Il criterio che determina la validità del caso a) o del caso b) si basa sul seguente test di Fisher s s r(max) r(min) $ F p= 1#" ;! max,! min Pag. 9 di 5

29 dove s r(max) e s r(min) sono rispettivamente la varianza massima e minima ed F p;νmax,νmin è la variabile di Fisher, il cui valore è riportato in tabelle (ma vedremo anche in excel) in funzione di α e di ν max = ν min = n i -1 essendo n il numero delle prove valide eseguite ad ogni livello. Il test può ancora essere utilizzato se il numero n i non è lo stesso per tutte le prove ma varia rispetto al valore medio di poco es Un altro test utilizzabile (meno restrittivo, ma più complesso) è il test di Bartlett 7 A questo punto, se siamo nel primo caso, il problema non si pone, se siamo nel secondo caso, excel ci consente di calcolare la relazione che lega lo scarto tipo alla media. L Bene, quindi applicando la tua teoria adesso io determino, utilizzando il normal probability plot, se i dati di Valentina sono tutti distribuiti normalmente e se vi sono dati anomali, mentre tu fai quattro chiacchiere con Fabrizio che prima ti ha cercato. M Ciao Luis, come siamo messi? L Ho riportato tutti i dati sul normal probability plot, ho tracciato con excel le 11 rette di correlazione ed ho determinato, sempre con excel il coefficiente di correlazione r di ogni retta. I risultati sono stati i seguenti: serie r 0,94 0,89 0,96 0,95 0,93 0,96 0,73 0,77 0,95 0,95 0,89 Ho quindi deciso di ritenere non accettabili i dati con un coefficiente di correlazione minore di 0,89 e quindi ho scartato le serie 7 e 8. Per quanto riguarda infine i dati anomali, da una prima occhiata al probability plot, l unica serie che mi dato l impressione di avere dati anomali è stata la 11, ed a questa ho applicato il test di Huber, che ha evidenziato come dati anomali il 1479 e il 1487; prima di eliminarli però ho calcolato la media e lo scarto tipo di ogni serie, e poiché l eliminazione di entrambi i dati mi avrebbe evidenziato anche il 1454 come dato anomalo, e mi avrebbe restituito uno scarto tipo di 8,86, cosa ovviamente improbabile se paragonata alle altre s, ho deciso di eliminare solo 1487, cosa che mi ha portato alla seguente situazione. serie media 190,6 313, 753,1 134, 670, , 1045,8 1440, s r 6, 9,9 18,99 5,39 16,96 1,33 13,01 17,03 0,4 Valori Pag. 30 di 5

30 A questo punto dobbiamo applicare il test di Fisher, per poter affermare con sicurezza quello che a prima vista sembra evidente, cioè se lo scarto tipo varia sensibilmente al variare della media. Come si fa? M Dobbiamo ricorrere alla relazione s s r(max) r(min) $ F p= 1#" ;! max,! min Nel nostro caso essendo s r (max) = (0,4) = 417 e s r (min) = (5,39) sr = 9,1 si ha che sr per il calcolo di F ricorriamo ancora una volta ad excel operando come segue: (max) (min) = 14,35 fissata una probabilità del 5%, poiché il numero di dati relativi a s r (max) è 9 e il numero di dati relativi a r (min) s è 10, si ha che ν (max) = 8 e ν (min) = 9. Dalla funzione excel INV.F(0,05;8;9) si ottiene F = 3,3. sr(max) Essendo = 14,35 > 3,3 si deduce che le varianze, come ci aspettavamo, sono sr(min) significativamente diverse al variare della media del campione da cui derivano. Questa situazione ci impone di ricercare la funzione che meglio interpola le s in funzione delle medie, ricorrendo ancora una volta ad excel. Dal comando inserisci grafico si sceglie la dispersione xy e si inseriscono come x i valori delle medie e come y i valori degli scarti tipo, quindi si clicca sul comando inserisci linea di tendenza. Excel consente di disegnare diverse linee di tendenza restituendone anche l equazione e il coefficiente di correlazione r, noi abbiamo considerato le seguenti: Tipo di regressione Equazione r Regressione lineare che passa per lo 0 s = 0,0187x 0,3873 Regressione lineare con intercetta s = 0,016x + 6,1768 0,8134 Regressione esponenziale s = 6,6689e 0,001x 0,7314 Regressione di potenza s = 0,934x 0,603 0,9435 Regressione logaritmica s = 6,7758Ln(x) - 8,569 0,9376 La relazione da scegliere è ovviamente quella che presenta il valore di r più prossimo ad 1 e quindi la regressione di potenza. L Va bene, tu sai quanto ti stimo, ma a questo punto sarei molto più tranquillo se potessimo effettuare una verifica indipendente dei nostri calcoli. M Conoscendoti, ho portato con me uno strumento molto interessante, che può aiutarci allo scopo, il prezioso software dell UNICHIM 16 L E che aspettiamo ad usarlo? M Guarda, che finora l ho già usato diverse volte. Lo usiamo anche adesso. Pag. 31 di 5

31 Il procedimento è semplice: inseriamo i dati, premiamo il tasto calcoli e premiamo il tasto test di normalità ed ecco il risultato dove sono evidenziati in rosso i dati anomali La settima e l ottava serie non hanno una distribuzione normale, per cui le dobbiamo eliminare e rifare il calcolo. Dal nuovo calcolo non emergono serie non normali, ma è evidenziato un dato anomalo che eliminiamo e, rifacendo il calcolo otteniamo: Pag. 3 di 5

32 M A questo punto dobbiamo decidere cosa fare dell ulteriore dato anomalo. Se lo eliminiamo otteniamo uno scarto tipo pari a 1,9, che è molto più basso di quello per una media di 1000 cellule. Inoltre se eliminiamo anche questo dato anomalo ci troveremo in una condizione estremamente favorevole, nel senso che, eliminandolo, ci dobbiamo aspettare un CV% molto basso che quindi potrebbe non rispecchiare la variabilità vera delle risposte analitiche. D altro canto tu mi insegni che la conta delle cellule somatiche può dipendere anche dalle altre caratteristiche del latte (grasso, proteine, indice crioscopico, ecc.). Fatte queste considerazioni ti propongo di non eliminare il valore A questo punto continuiamo con il nostro calcolo, sfruttando le ulteriori caratteristiche del software UNICHIM 16 ed effettuando quindi un confronto tra le varianze, che risultano non omogenee tra di loro. In particolare, leggi cosa riporta il manuale che accompagna il software: La disomogeneità delle varianze che si evidenzia è una conseguenza diretta della situazione per cui la variabilità delle misure aumenta col crescere della concentrazione, il cui livello è espresso dalla media: si deve allora studiare una possibile relazione funzionale fra scarto tipo e media delle diverse serie (colonne) di dati, che consenta di calcolare lo scarto tipo, e quindi la ripetibilità, anche per concentrazioni diverse da quelle dei campioni sottoposti alle misure replicate. Viene allora effettuata un'ulteriore elaborazione, che sul foglio DATI mostra oltre ai dati ordinati e alle statistiche base già rilevate in precedenza i risultati del calcolo delle regressioni fra scarto tipo e media secondo tre diversi modelli: - regressione lineare che passa per lo 0 ( y = bx ) - regressione lineare con intercetta ( y = a + b x ) - regressione doppio-logaritmica ( logy = c + d logx ) La riga inferiore di ciascuna sezione contiene gli scarti tipo calcolati in base all'equazione di regressione in funzione dei valori delle relative medie (riga 14). Secondo il criterio suggerito, è da preferire quel modello (equazione) per cui la somma dei quadrati delle differenze fra lo Pag. 33 di 5

33 scarto tipo calcolato e misurato (riga 15) risulta minimo. Questa SQ (somma dei quadrati) minima viene evidenziata sul foglio. I risultati di tale elaborazione sono i seguenti: M La relazione è quindi: y = 0,603x - 0,535 dove, avendo posto y = log(s) e x = log(x), si ha che lo scarto tipo di ripetibilità è espresso dalla relazione Che con i dati ottenuti c = -0,533 - diventa S = 10 (c+d * log(x)) d = 0,603 - x = tenore di cellule (0,603logx -0,535) s = 10 ricordando alcune elementari proprietà dei logaritmi e delle potenze, con semplici manipolazioni si ottiene s = 0,934x 0,603 che è esattamente uguale a quella da noi calcolata per altra via utilizzando la correlazione di potenza in excel. Ad un analisi più attenta, si rileva che le altre equazioni presentano una certa differenza, ma la cosa è praticamente irrilevante in quanto, la retta di correlazione passante per l origine ha un r = 0,39 e quindi indica una mancanza di correlazione, mentre quella con intercetta ha un r = 0,81, indice di una correlazione quasi accettabile, differisce da quella dell UNICHIM in quanto dà risultati in alcuni casi migliori in altri peggiori, come si può vedere dalla tabella seguente. Pag. 34 di 5

34 media 190,60 313,0 753,10 134,0 670,90 456,00 554,0 1045, ,00 scarto tipo vero 6, 9,9 18,99 5,39 16,9 1,33 13,01 17,03 0,4 Scarto tipo calcolato UNICHIM: 6,79 8,57 14,94 5,98 13,75 10,64 1,06 19,18 4,8 Scarto tipo calcolato con excel 8,39 9,81 14,91 7,73 13,96 11,47 1,61 18,31,8 differenza % UNICHIM 9,17% -13,6% -1,3% 10,84% -18,75% -13,73% -7,3% 1,63% 1,5% differenza % EXCEL 3,48% 14,49% -0,18% 9,4% 1,53% 7,80% 4,54% -4,54% -8,03% Ti basta questa verifica? L Si, molto bene, poi mi dici come posso fare per acquisire il software dell UNICHIM 16. M Questo te lo dico subito: basta che tu telefoni all UNICHIM allo 0/ o ti colleghi al sito Ma continuando con i nostri calcoli; a questo punto, per completare la prima parte del nostro lavoro dobbiamo calcolare il limite di ripetibilità e il CV% che al 95% di probabilità è espresso come: r! = t1 " 0,95; n" 1 Sr Dove t al 95% con n-1 = ν = 8 gradi di libertà (n = numero di dati della serie con minor numero di dati) può essere calcolato da excel con la formula =INV.T(0,05;9) e quindi sostituendo il valore trovato nella precedente si ha r =,306! Sr Dove S r si ricava dalla formula precedentemente determinata A questo punto possiamo determinare il CV. Con semplici passaggi si ha che S r = 0,934x 0,603 CV= s/x = 0,934 * x (-1) x 0,603 = 0,934 * x (-0,3977) E con questo la prima parte del nostro lavoro si può considerare completata in quanto abbiamo calcolato tutti i parametri che ci interessavano. L E no! Come sai bene uno dei criteri per il controllo della qualità di un risultato di prova è l effettuazione di una prova in doppio, e con quello che abbiamo detto, la situazione è abbastanza complicata, come possiamo fare? M Per le prove in doppio, nel nostro caso e con un livello di confidenza del 95%, vale la relazione N. Bottazzini e L. Cavalli Guida al calcolo della ripetibilità di un metodo di prova ed alla sua verifica nel tempo Seminario SINAL, settembre 007 Pag. 35 di 5

35 x # x " t! S oppure l equivalente x 1 " x! r0,95; 8 1 0,95;8 r x 0! x 1 # x " r0,95;8 ", ,603 Per semplificare i calcoli possiamo riportare in un diagramma le funzioni precedentemente trovate per s r, r, e CV% in funzione di x r= 0,9568x 0,603 sr= 0,934x 0, CV% = 9,34x -0, scarto tipo sr limite di ripetibilità r CV% Con questo sistema, la prova è accettabile se il valore assoluto della differenza dei risultati delle due prove è al di sotto della curva della r. L Adesso passiamo ad affrontare l incertezza di misura! L incertezza di Luis M Intanto ti informo che oltre ai documenti di riferimento consigliati dal SINAL di cui tu ben conosci, forse, almeno i titoli, utilizzeremo per il nostro scopo anche i seguenti: UNI CEI ENV Manuale UNICHIM 179/1 ARPA Agenzia Regionale Prevenzione e Ambiente dell Emilia-Romagna Fogli di calcolo UNICHIM Guida all espressione dell incertezza di misura Linee guida per la valutazione dei metodi analitici nei laboratori chimici Linee guida per la validazione dei metodi analitici e per il calcolo dell incertezza di misura Software per il calcolo, il trattamento statistico e la valutazione dei dati ottenuti nelle prove di laboratorio (ed. 006) L Alla faccia, ed io mi dovrei studiare tutta questa roba? E il laboratorio chi lo porta avanti? E le analisi sui prodotti chi le fa? E a Fabrizio cosa gli racconto quando mi chiede se i prodotti sono stati deliberati? M Non fare la lagna, anche perché li abbiamo già utilizzati! Cerchiamo di capire, prima di lamentarci, e veniamo ai fatti. Pag. 36 di 5

36 Intanto partiamo dalle definizioni di incertezza e dei principali termini collegati, riportati nella UNI CEI ENV Incertezza di misura Incertezza tipo Incertezza tipo composta Incertezza estesa Parametro, associato al risultato di una misurazione, che caratterizza la dispersione dei valori ragionevolmente attribuibili al misurando. Nota 1 il parametro può essere, per esempio, uno scarto tipo (o un suo multiplo dato), o la semiampiezza di un intervallo avente un livello di fiducia stabilito. Nota L incertezza di misura, in genere, comprende più componenti. Talune di queste possono essere valutate dalla distribuzione statistica dei risultati di serie di misurazioni e possono dunque essere caratterizzate mediante scarti tipo sperimentali. Le altre componenti, anch esse caratterizzabili mediante scarti tipo, sono valutate da distribuzioni di probabilità ipotizzate sulla base dell esperienza o di informazioni d altro tipo. Nota 3 S intende che il risultato della misurazione è la migliore stima del valore del misurando, e che tutte le componenti dell incertezza, comprese quelle derivanti da effetti sistematici, quali quelle associate a correzioni e campioni di riferimento, contribuiscono alla dispersione. Incertezza del risultato di una misurazione espressa come scarto tipo. Incertezza tipo del risultato di una misurazione allorquando il risultato è ottenuto mediante i valori di un certo numero di altre grandezze; essa è uguale alla radice quadrata positiva di una somma di termini, che sono le varianze e le covarianze di quelle grandezze, pesate secondo la variazione del risultato della misurazione al variare di esse. Grandezza che definisce, intorno al risultato di una misurazione, un intervallo che ci si aspetta comprendere una frazione rilevante della distribuzione dei valori ragionevolmente attribuibili al misurando. Nota 1 La frazione può essere interpretata come la probabilità di copertura o livello di fiducia dell intervallo. Nota Per poter associare uno specifico livello di fiducia all intervallo definito dall incertezza estesa è necessario fare ipotesi, esplicite o implicite, sulla distribuzione di probabilità caratterizzata dal risultato della misurazione e dalla sua incertezza tipo composta. Il livello di fiducia che può essere attribuito a questo intervallo può essere conosciuto solo nei limiti entro i quali quelle ipotesi siano giustificate. L Maestro, il senso lor m è duro, come dice il Poeta. Leggendo queste definizioni, ho la certezza che sia aumentata la mia incertezza sul significato dell incertezza di misura, perché non provi ad essere più chiaro? M Lascia in pace Virgilio, Dante, il terzo canto dell Inferno e i giochi di parole; e cerca di essere più serio! Pag. 37 di 5

37 Provo a darti qualche ulteriore chiarimento ricavato dalla UNI CEI ENV L incertezza di misura può essere intesa come la stima dell'intervallo dei valori entro cui cade il valore del misurando, dove per misurando si intende una particolare grandezza sottoposta a misurazione. Questa definizione deriva dal fatto che ogni misura è caratterizzata da una certa variabilità. Tra i possibili fattori che possono determinare la variabilità e quindi l incertezza di una misura, sono individuati lo Scarto Aleatorio che nelle misurazioni ripetute varia in modo non prevedibile e lo Scarto Sistematico che, nelle misure ripetute, resta costante o varia in modo prevedibile. L insieme combinato di queste due componenti dà luogo all incertezza tipo composta. Per capire il rapporto che intercorre tra incertezza composta ed incertezza estesa, basta che tu ti rifaccia a quanto abbiamo detto a proposito della distribuzione di Gauss: ricorderai che in una distribuzione normale il 68% dei dati si trova nell intervallo centrato sul valore medio µ e avente come semi intervallo lo scarto tipo s della distribuzione stessa, e il 95% dei dati nell intervallo centrato sul valore medio µ e avente come semi intervallo circa due volte lo scarto tipo. Il primo intervallo rappresenta l incertezza composta, mentre il secondo l incertezza estesa, per cui si ha che, con una probabilità del 95%: Incertezza estesa = * incertezza composta L OK, ma ora fammi vedere i fatti pratici, i numeri, le formule, in altri termini i criteri di calcolo dell incertezza. M Prima di parlare del calcolo dell incertezza è bene puntualizzare che l incertezza di misura associata al risultato deve essere espressa con le stesse unità del risultato ed essere indicata come semi intervallo di fiducia del risultato della misurazione, ossia come incertezza estesa. L incertezza può essere calcolata con diversi approcci o criteri (metrologico, olistico e Horwitz). Luis e l approccio metrologico L approccio metrologico è considerato il più rigoroso. Relativamente a questo criterio, la guida SINAL DT dice (riporto testualmente in corsivo): in generale, il misurando Y dipende da un certo numero di grandezze d ingresso X 1, X,..., X i,..., X n, secondo una funzione del tipo: Y= f (X 1, X,..., X i,..., X n ) (1) usualmente chiamata modello della misurazione. Tipiche grandezze di ingresso sono quelle che derivano dal processo di misurazione, quelle riportate nei certificati di taratura dei campioni e degli strumenti impiegati, nonché le grandezze di influenza, che sono sostanzialmente, ma non esclusivamente, le variabili ambientali come la temperatura, la pressione, l umidità, ecc. La stima y del misurando Y viene ottenuta dalla (1) sostituendo ai valori delle grandezze X i le corrispondenti stime di ingresso x i : y = f (x 1, x,..., x i,..., x n ) () Come i valori delle grandezze d ingresso X i, anche le dispersioni sono stimate attraverso opportune valutazioni, in base alle informazioni disponibili. 19 SINAL DT-000 Guida per la valutazione e la espressione dell'incertezza nelle misurazioni Pag. 38 di 5

38 Le incertezze di ingresso possono essere determinate attraverso due categorie di valutazione, contraddistinte con le lettere A e B. Si sottolinea che tutte le incertezze hanno la stessa natura per cui la distinzione in base alle categorie di valutazione (A e B) riguarda unicamente il modo con il quale le incertezze vengono stimate.. In primo luogo devi considerare che ai nostri fini l incertezza, sia di categoria A che di categoria B deve essere espressa in termini di scarto tipo. I criteri suggeriti dalla stessa guida SINAL 19 per il calcolo delle componenti A e B dell incertezza in termini di scarto tipo, sono i seguenti: Incertezze di categoria A Le incertezze di categoria A sono quelle che possono essere valutate direttamente dal laboratorio attraverso la ripetizione di un processo di misurazione, in condizioni controllate. Si tratta, ai fini pratici, di applicare i concetti di cui abbiamo parlato in precedenza a proposito del calcolo dello scarto tipo. Il valore dello scarto tipo così calcolato costituisce il parametro statistico che viene tradizionalmente indicato come scarto tipo della serie di misurazioni. L incertezza associata ad una serie di misure si determina con la formula seguente: Incertezze di categoria B u( x i) = s i n i Le valutazioni di incertezza effettuate in modo diverso da quello basato su serie di osservazioni ripetute, si definiscono di categoria! B. Per la loro determinazione possiamo ancora utilizzare la norma UNI CEI ENV 13005:000 6 e la guida SINAL 19 La situazione di minima informazione è rappresentata da un intervallo, individuato da due valori x imax e x imin, al di fuori del quale si esclude possa trovarsi il valore della grandezza, mentre all interno tutti i valori hanno la stessa probabilità. In questo caso si assume una distribuzione uniforme di probabilità, detta anche rettangolare, di ampiezza pari ad x imax - x imin, che porta al seguenti risultato: Esempio purezza di un sale Se il valore centrale è più probabile di quello agli estremi si assume una distribuzione di probabilità detta triangolare di ampiezza pari ad x imax - x imin Pag. 39 di 5

39 Esempio vetreria di classe A L La cosa comincia ad interessarmi, continua. M Una volta determinate le singole componenti delle incertezze, dobbiamo calcolare l incertezza composta, che, come riportato dalla UNI CEI ENV è data dalla seguente formula n & ' y u ( y) = ( $ i= 1 % ' xi #! " u ( x i ) Dove y è la funzione che esprime la stima del misurando dipendente da una serie di parametri x 1, x,.., x n. (vedi equazione SINAL DT 000 riportata in precedenza) L Radici quadrate, derivate parziali, sommatorie, stima del misurando.. ci risiamo con le complicazioni. M Calmati, che la situazione è molto più semplice di quanto sembra! Si dà il caso che per i nostri scopi l equazione da te definita complicata si semplifica notevolmente per i casi da noi generalmente trattati. È ancora il SINAL 19 che ci facilita il compito con una utilissima tabella di riepilogo che ti riporto. Pag. 40 di 5

40 - Formule per la valutazione dell incertezza tipo composta (SINAL DT000 Tabella 3) Nota: h e n sono costanti note con incertezza largamente inferiore a quella degli altri componenti. E qua ci fermiamo. Svilupperemo l esempio pratico solo se sarà necessario, nel corso del nostro lavoro. Se vuoi, comunque informazioni più dettagliate e complete sul criterio metrologico le puoi trovare nelle guide SINAL 0 e nel documento del suo direttore 1 relativo alla norma UNI CEI EN ISO_IEC 1705 oltre che nella norma UNI CEI ENV Luis e Horwitz L approccio di Horwitz, si basa sull elaborazione statistica di una grossa mole di dati ricavati da confronti interlaboratori. Tale criterio è utile, in fase di primo approccio, nella valutazione dell incertezza. Il criterio di Horwitz si riassume in una formula 0 DT 000, DT 000/3, DT 000/4 1 Paolo Bianco ISO/IEC 1705: requisiti tecnici - Incertezza di misura: approccio GUM Requisiti generali per la competenza dei laboratori di prova e di taratura Pag. 41 di 5

41 Che può assumere anche la forma Dove: σ R RSD R C σ R = 0,0 * c 0,8495 RSD R = [ 1" 0,5! log c] scarto tipo di riproducibilità scarto tipo relativo di riproducibilità concentrazione dell analita espresso in unità (m/m) Tale approccio, applicabile fondamentalmente all analisi degli alimenti ed alle acque, certamente non è applicabile al nostro caso, non fosse altro che per il fatto che le nostre misure sono espresse in cellule/ml e non come massa/massa. Luis e il criterio olistico Per quanto riguarda l approccio olistico o top down, il metodo si basa sull utilizzo dei risultati di una stessa prova, eseguita in laboratori diversi ed è in genere quello più usato nel campo chimico e microbiologico. Alcuni esempio pratici di tale approccio li puoi trovare chiaramente sviluppati nei documenti di validazione del software dell UNICHIM 16 che prendono in considerazione i seguenti casi: Uso di una norma che reca i valori di scarto tipo di ripetibilità, σ r e di riproducibilità, σ R Uso di un metodo interno simile ad una norma che reca i valori di σ r e di σ R Uso dei parametri di precisione ricavati da prove interlaboratorio Uso di materiali di riferimento certificati (CRM) che riportano in modo completo i parametri di precisione. Anche di tale metodo svilupperemo l esempio pratico, solo se sarà necessario, nel corso del nostro lavoro. In altri termini ti dico, per tranquillizzarti, che non svilupperemo tutti i metodi di calcolo dell incertezza, ma focalizzeremo l attenzione solo su quello che risulterà il più adatto oltre che più pratico per il nostro scopo, tralasciando tutti gli altri. L Grazie per le informazioni, ma soprattutto grazie. per lo sconto. L incertezza di Luis variabile con la concentrazione M E torniamo al nostro caso specifico. Nella determinazione delle cellule somatiche nel latte vaccino, con il metodo in oggetto, l entità delle componenti dell incertezza varia con la concentrazione dell analita (ricordati dello scarto tipo!). In questi casi, come riportato dalla Guida EURACHEM 3, è importante prendere in considerazione le variazioni dell incertezza tipo composta con la concentrazione dell analita. 3 Rapporti ISTISAN 03/30 - Quantificazione dell incertezza nelle misure analitiche Seconda edizione (000) della Guida EURACHEM / CITAC CG 4 Pag. 4 di 5

42 Gli approcci possibili, riporta la guida, includono: restringere il campo di applicazione della procedura specificata o la stima dell incertezza ad un piccolo intervallo di concentrazioni di analita; fornire una stima dell incertezza in termini di Scarto Tipo Relativo (STR); stabilire esplicitamente la relazione tra l incertezza e la concentrazione e quindi, in base ad essa, determinare di nuovo l incertezza di un dato risultato. Noi optiamo per la terza soluzione, in quanto quella che più compiutamente interpreta le necessità del Laboratorio e dei suoi clienti. L E ti pareva, altrimenti sarebbe stato troppo facile. M La Guida EURACHEM 3 al paragrafo E.4. riporta: Per tener conto sia della proporzionalità dell incertezza sia della possibilità di un valore essenzialmente costante con il livello, si usa la seguente espressione generale: dove u(x) s 0 s 1 u ( x) = s! s 0 + ( x 1) è l incertezza tipo composta del risultato x (cioè l incertezza espressa come uno scarto tipo) rappresenta un contributo costante all incertezza globale è una costante di proporzionalità. L equazione si basa sul metodo normale della combinazione dei due contributi all incertezza globale, assumendo che un contributo (s 0 ) sia costante ed uno (xs 1 ) proporzionale al risultato. La Figura E.4.1 illustra la forma di questa funzione. E Dipendenza intermedia Pag. 43 di 5

43 In casi intermedi, ed in particolare quando la situazione corrisponde alla zona B nella Figura E.4.1, possono essere adottati due approcci. a) Applicare una dipendenza variabile L approccio più generale è determinare, registrare e usare sia s 0 sia s 1. Le stime dell incertezza, quando necessario, possono essere effettuate sulla base del risultato riportato. Questo è l approccio raccomandato qualora fattibile. NOTA: Si veda la nota del paragrafo E.4.. (NOTA: L approccio precedente si dimostra pratico solo quando è possibile calcolare un numero grande di valori..) b) Applicare un approssimazione fissa Per analisi generiche e nei casi in cui la dipendenza non è molto forte (ossia, vi è scarsa evidenza di proporzionalità) oppure l intervallo dei risultati previsti non è molto grande qualora in entrambi i casi le incertezze non differiscano di più del 15% circa da una stima dell incertezza media, spesso sarà ragionevole calcolare e stabilire un valore fisso dell incertezza per un uso generale, basandosi su un valore medio dei risultati attesi. Quindi o si usa un valore medio o tipico di x per calcolare un unica stima dell incertezza e la si usa in alternativa a stime calcolate singolarmente o si è ottenuto un unico valore dello scarto tipo, in base a studi su materiali che ricoprono l intero intervallo dei livelli di analita ammessi (entro il campo di applicazione per la stima dell incertezza) e c è scarsa evidenza che giustifichi un ipotesi di proporzionalità. Questo caso dovrebbe essere generalmente trattato come un caso di dipendenza nulla e lo scarto tipo in oggetto riportato come s 0. E.4.5. Determinare s 0 ed s 1 E Nei casi particolari nei quali un termine è dominante, sarà normalmente sufficiente usare l incertezza espressa come scarto tipo o scarto tipo relativo rispettivamente come valore di s 0 o di s 1. Quando la dipendenza è meno ovvia, potrebbe tuttavia essere necessario determinare s 0 ed s 1 indirettamente da una serie di stime dell incertezza a differenti livelli di analita. E Dato un calcolo d incertezza composta da varie componenti, alcune delle quali dipendono dal livello di analita mentre altre no, sarà generalmente possibile indagare sulla dipendenza dell incertezza globale dal livello di analita mediante una simulazione con il procedimento seguente: 1. calcolare (o ottenere sperimentalmente) le incertezze u(x i ) per almeno dieci livelli x i di analita, che coprono l intero intervallo ammesso. riportare in grafico u(x i ) in funzione di x i 3. mediante regressione lineare, ottenere stime di m e di c per la curva u(x) = mx + c 4. calcolare s 0 e s 1 da s 0 = c, s 1 = m 5. registrare s 0 e s 1 Da quanto riportato sopra è chiaro che la prima cosa da fare è il calcolo dell incertezza almeno a dieci livelli, cosa che potremmo fare col metodo olistico o con il sistema cosiddetto metrologico, ma che comunque ci richiede un lungo lavoro, a meno di non essere in possesso dei dati Pag. 44 di 5

44 necessari, quali ad esempio risultati di circuiti interlaboratorio, serie di dati con materiali certificati, et similia, cosa di cui dubito molto. L E ti pareva che lui avesse qualche fiducia in quello che facciamo! Aspetta a sputare sentenze con il tuo latinorum, e ascolta quello che ho da dire! M Ho capito, se ricordo bene tu hai partecipato a qualche circuito interlaboratorio per la prova relativa alla ricerca delle cellule somatiche, o ricordo male? L Ricordi male perché intanto è Valentina che vi partecipa, e non solo qualche volta, ma costantemente con cinque campioni a livelli diversi 4 volte l anno, per cui penso che potremmo disporre di molti dati. M Non dire quattro se non ce l hai nel sacco e raccogli i dati di cui disponi. L Ecco i dati, ma come possiamo da questi dati calcolare la relativa incertezza? M Nell applicazione di questo criterio, qualcuno dice che i laboratori devono utilizzare lo stesso metodo di prova, altri considerano ancora accettabile il criterio anche se il laboratorio utilizza un metodo di prova diverso purché: i laboratori partecipanti siano in numero elevato (>40) siano laboratori stimati per competenza tecnica; i risultati del circuito e i risultati del laboratorio siano tra loro paragonabili, e che siano compatibili gli scarti tipo di ripetibilità. Prima di utilizzare questo criterio verifichiamo se i risultati del nostro laboratorio sono coerenti con i risultati dei laboratori partecipanti al ring test, attraverso la relativa correlazione. Dalla correlazione, come puoi ben vedere, si evince un ottima concordanza tra i dati, che assieme al fatto che i laboratori partecipanti sono stati in genere > 50 e tutti di chiara competenza, conferma l applicabilità del metodo di calcolo dell incertezza. re tta di corre laz ione laboratorio/laboratori y = 0,931x + 15, R = 0,9938 valori del laboratorio valori di riferim ento Pag. 45 di 5

45 Il documento UNICHM 4, ai fini del calcolo dell incertezza mediante l uso di parametri di precisione derivanti da circuiti interlaboratorio riporta quanto segue: La formula da utilizzare è U = k! + s m con L r /! = ". L! R! r Le condizioni che permettono questo impiego sono le seguenti: a) il laboratorio ha partecipato alle prove con risultati non anomali; b) il laboratorio può dimostrare di aver ottenuto da n (intorno a 10) ripetizioni, eseguite con il metodo considerato nella prova interlaboratorio, risultati accettabili il cui scarto tipo è compatibile con quello di ripetibilità ricavato dalla prova interlaboratorio. Seguendo tale indirizzo, in primo luogo dobbiamo valutare per ogni risultato del circuito la compatibilità dello scarto tipo s ottenuto dal laboratorio con lo scarto tipo di ripetibilità del circuito e quindi calcolare l incertezza. Per valutare se lo scarto tipo ottenuto dal laboratorio sia compatibile con quello del circuito ricorriamo alla distribuzione del χ. Considerando i dati del primo circuito abbiamo per σ R il valore di 9,59, per σ r il valore di 5,644, mentre il valore dello scarto tipo s del laboratorio deve essere calcolato con la formula che abbiamo determinato precedentemente e che riporto S r = 0,934x 0,603 sostituendo in tale formula x con 158 (tenore di cellule del circuito), si ha che S r = 6,19. Per la verifica di compatibilità tra gli scarti tipo, utilizziamo la formula ormai nota % $ / ; # = n! 1 s % (1! $ / ); # = n! 1 " " n! 1 & n! 1 ricorrendo ad excel, con un livello di probabilità p = 95% e sapendo che per ogni livello sono state fatte dal laboratorio 10 prove per il calcolo della ripetibilità, si calcolano i due valori di χ con le formule INV.CHI(0,05;9) e INV.CHI(0,975;9) che danno rispettivamente per il χ i valori,70 e 19,0. s Sostituendo i valori calcolati nelle formule precedenti si ricava che,30! = 1,!, 11 " 0 Successivamente, per il calcolo dell incertezza applichiamo la formula U k =! + s m con! =! " L r / L R! r e sostituendo i valori del circuito otteniamo il risultato cercato dell incertezza composta che per una prova in doppio risulta 17,8 e per una prova singola 19,8. L È molto chiaro quello che dici, ma il lavoro diventa piuttosto lungo e noioso. M Hai perfettamente ragione, ma noi possiamo automatizzare il tutto con un semplicissimo foglio excel, dove possiamo riportare tutti i nostri dati e inserire le formule già utilizzate. Ecco il foglio: 4 Software applicativo per l elaborazione dei risultati analitici Convalida con il calcolo manuale (UNICHIM) Pag. 46 di 5

46 mar-06 mag-06 lug-06 set-06 nov- 06 mar-07 mag-07 lug-07 media circuito σ r σ R s r lab s compatibilità scarto tipo incertezza 1 prova incertezza prove χ (0,975;9)! 158 5,644 9,59 6,19 1,0 OK 19,84 17,81, ,938 34,85 14,99 0,88 OK 67,71 64, ,596 58,537 19,94 0,66 OK 113,48 109,9 χ (0,975;9)/ ,986 7,906 13,7 1,31 OK 57,38 54,01 0, ,093 15,19 8,64 0,73 OK 8,54 5, ,6 11,46 5,14 0,84 OK,46 1,6 χ (0,05;9) ,97 39,13 16,11 1,0 OK 78,37 74,99 19, ,81 19,45 9,8 1,00 OK 38,91 36, ,16 36,7 14,8 0,89 OK 71,8 68,9 χ (0,05;9)/9 1138,43 6,57 0,33 0,8 OK 13,70 10,31, ,78 35,6 15,79 0,79 OK 69,34 65, ,34 16,3 8,8 0,79 OK 31,47 9,1 35 3,9 6,48,50 0,58 OK 1,3 11, ,54 16,6 8,34 0,63 OK 9,85 7, ,5 36, 15,9 1,1 OK 73,58 70, ,97 15,64 9,31 1,08 OK 31,67 8, ,864 9,081 4,95 1,04 OK 18,5 16, ,411 18,657 9,65 0,71 OK 35,7 3,5 15,3 6,80 13,07 7,46 1,0 OK 7,11 4,98 119,1 6,891 15,453 5, 0,57 OK 9,57 8,63 46,5 10,487 7,301 11,8 1,7 OK 55,68 53,11 64,9 7,91 13,386 8,45 1,14 OK 7,41 4,67 706,7 15,431 35,009 15,6 0,98 OK 69,87 66,45 31,1 3,378 4,784,33 0,47 OK 8, 7,53 14,1 6,33 11,944 5,81 0,84 OK 3,36 1,87 354,6 8,73 0,73 10,07 1,33 OK 41,78 39, ,64 10,44 5,50 0,95 OK 0,73 19, 658 1,88 33,93 14,6 1,9 OK 69,5 66, ,95 0,09 11,80 1,74 OK 43,0 39, ,98 13,88 7,45 1,14 OK 8,5 6, ,34 31,17 1,46 1,0 OK 6,44 59,90 L Come al solito vorrei avere una conferma di questo lavoro, per essere più sicuro. M Grazie per l ormai nota fiducia nelle cose che ti dico; comunque ti ricordo che abbiamo sempre a disposizione il solito ottimo software dell UNICHIM 16, che tra le altre cose consente di calcolare l incertezza in vari modi tra cui utilizzando i risultati di circuiti interlaboratori. E veniamo a noi, come puoi vedere dalla maschera seguente, per poter applicare il foglio di calcolo dell UNICHIM è necessario conoscere 4 parametri fondamentali. Pag. 47 di 5

47 Una volta inseriti i dati, si clicca sul tasto E compare la richiesta numerosità della media. Imputando il numero di dati per i quali si vuole calcolare l incertezza solitamente 1 o, per le prove in doppio, si ottiene l incertezza richiesta. Al termine di queste semplici operazioni la maschera si presenta così: L Bene questo software, mi piace sempre di più, nonostante sia servito anche a confermare i tuoi calcoli. M OK sono d accordo sulla bontà del software di cui non hai sperimentato che una piccola parte. Pag. 48 di 5

48 mar-06 mag-06 lug-06 set-06 nov- 06 mar-07 mag-07 lug-07 incertezza estesa calcolata con il software UNICHIM Media laboratorio Media riferimento s r S R s r lab Prove singole prove in doppio ,644 9,59 6,19 19,843 17, ,938 34,85 14,99 67,709 64, ,596 58,537 19,94 113, , ,986 7,906 13,7 57,383 54, ,093 15,19 8,64 8,540 5, ,6 11,46 5,14,464 1, ,97 39,13 16,11 78,37 74, ,81 19,45 9,8 38,911 36, ,16 36,7 14,8 71,83 68, ,43 6,57 0,33 13,698 10, ,78 35,6 15,79 69,340 65, ,34 16,3 8,8 31,473 9, ,9 6,48,50 1,31 11,711 75, ,54 16,6 8,34 9,853 7,46 754, ,5 36, 15,9 73,58 70, ,97 15,64 9,31 31,67 8, ,864 9,081 4,95 18,55 16, ,411 18,657 9,65 35,66 3, ,3 6,80 13,07 7,46 7,114 4, ,1 6,891 15,453 5, 9,568 8, ,5 10,487 7,301 11,8 55,681 53, ,9 7,91 13,386 8,45 7,41 4, ,7 15,431 35,009 15,6 69,868 66, ,1 3,378 4,784,33 8,18 7, ,1 6,33 11,944 5,81 3,358 1, ,6 8,73 0,73 10,07 41,779 39, ,64 10,44 5,50 0,734 19, ,88 33,93 14,6 69,54 66, ,95 0,09 11,80 43,01 39, ,98 13,88 7,45 8,47 6, ,34 31,17 1,46 6,438 59,899 L A questo punto, se permetti, continuo io. Considerato quanto riportato al punto E precedente della Guida Eurachem 3, avendo determinato l incertezza a vari livelli, bisogna: riportare in grafico u(x i ) in funzione di x i mediante regressione lineare, ottenere stime di m e di c per la curva u(x) = mx + c calcolare s 0 e s 1 da s 0 = c, s 1 = m Andiamo per ordine e costruiamo una matrice nelle cui prime tre colonne riportiamo i dati noti quali la media di riferimento, l incertezza per la singola prova, l incertezza per le prove in doppio e nelle colonne 4, 5 e 6 i quadrati di questi parametri. Facciamo un interpolazione lineare mediante excel dei quadrati delle incertezze composte delle prove singole in funzione del quadrato delle medie relative e determiniamo l equazione della retta. Se il coefficiente di Pag. 49 di 5

49 correlazione r è prossimo ad 1, utilizzeremo l equazione della retta per il calcolo dello scarto tipo, altrimenti, dovremo percorrere una delle altre strade consigliate dalla Guida Eurachem 3. Successivamente faremo lo stesso percorso per le prove in doppio. Tenendo presente che abbiamo calcolato l incertezza estesa, mentre noi abbiamo bisogno dell incertezza composta, dovremo dividere i valori ottenuti precedentemente per. Ed ecco i risultati: Media Laboratorio incertezza estesa prova singola incertezza estesa prove in doppio media quadrato incertezza composta prova singola quadrato incertezza composta prove in doppio , , PROVE SINGOLE y = 0,007x + 39,507 R = 0, I coefficienti della curva u(x) = mx + c sono: m= 0,007e c = 39,507 da cui s 0 = 6,8 e s 1 = 0,05 E la formula per il calcolo dell incertezza composta u ( x) s! x = diventa: 0 + ( s1 ) u ( x) = 39, ,007! x PROVE IN DOPPIO y = 0,005x + 15,896 R = 0, I coefficienti della curva u(x) = mx + c sono: m= 0,005 e c = 15,896 da cui s 0 = 3,99 e s 1 = 0,05 E la formula per il calcolo dell incertezza composta u ( x) = s! x diventa: 0 + ( s1 ) u ( x) = 15, ,005! x Pag. 50 di 5

50 Dai risultati precedenti possiamo quindi concludere che l incertezza estesa con un grado di copertura del 95% è data per le prove singole da e per le prove in doppio da U ( x) =! 39, ,007! x U ( x) =! 15, ,005! x M Ottimo risultato, vedo che sei diventato un asso con excel! La decisione finale di Luis L Ti devo dire un ultima cosa: avendo letto da qualche parte che l unica cosa certa di una misura è la sua incertezza, ho maturato una certezza: parteciperò al prossimo corso sull incertezza tenuta da un ente riconosciuto per competenza e professionalità! Pag. 51 di 5

51 Michele Rapillo ingegnere chimico, ricercatore tecnologo ENEA, opera da oltre 0 anni nell ambito della qualità e dell accreditamento dei laboratori di prova. Già membro di comitati di certificazione di prestigiosi organismi di certificazione italiani (IIP, ICIM, CERSA, AGROQUALITÀ) e del comitato di accreditamento di FIDEA, attualmente è membro dei comitati di accreditamento di SINCERT (dal 1999) e di SINAL (dal 001). Il calcolo dell incertezza è guardato da molti con sospetto, un sospetto che questo volumetto intende fugare proponendo un approccio al problema che coniuga un linguaggio chiaro ed accessibile a tutti con il rigore della trattazione. Lo svolgimento dell argomento che utilizza formule di fogli di calcolo o software dedicati consente al lettore di comprendere le nozioni fondamentali ed anche l applicazione pratica. Pag. 5 di 5

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede

Dettagli

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo. DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.

Dettagli

risulta (x) = 1 se x < 0.

risulta (x) = 1 se x < 0. Questo file si pone come obiettivo quello di mostrarvi come lo studio di una funzione reale di una variabile reale, nella cui espressione compare un qualche valore assoluto, possa essere svolto senza necessariamente

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

Indici di dispersione

Indici di dispersione Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo

Dettagli

PLIDA Progetto Lingua Italiana Dante Alighieri Certificazione di competenza in lingua italiana

PLIDA Progetto Lingua Italiana Dante Alighieri Certificazione di competenza in lingua italiana PLIDA Progetto Lingua Italiana Dante Alighieri Certificazione di competenza in lingua italiana giugno 2011 PARLARE Livello MATERIALE PER L INTERVISTATORE 2 PLIDA Progetto Lingua Italiana Dante Alighieri

Dettagli

OSSERVAZIONI TEORICHE Lezione n. 4

OSSERVAZIONI TEORICHE Lezione n. 4 OSSERVAZIONI TEORICHE Lezione n. 4 Finalità: Sistematizzare concetti e definizioni. Verificare l apprendimento. Metodo: Lettura delle OSSERVAZIONI e risoluzione della scheda di verifica delle conoscenze

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Slide Cerbara parte1 5. Le distribuzioni teoriche

Slide Cerbara parte1 5. Le distribuzioni teoriche Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle

Dettagli

Capitolo 2. Operazione di limite

Capitolo 2. Operazione di limite Capitolo 2 Operazione di ite In questo capitolo vogliamo occuparci dell operazione di ite, strumento indispensabile per scoprire molte proprietà delle funzioni. D ora in avanti riguarderemo i domini A

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL

Dettagli

Un gioco con tre dadi

Un gioco con tre dadi Un gioco con tre dadi Livello scolare: biennio Abilità interessate Costruire lo spazio degli eventi in casi semplici e determinarne la cardinalità. Valutare la probabilità in diversi contesti problematici.

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI Indice 1 Le frazioni algebriche 1.1 Il minimo comune multiplo e il Massimo Comun Divisore fra polinomi........ 1. Le frazioni algebriche....................................

Dettagli

liste di liste di controllo per il manager liste di controllo per il manager liste di controllo per i

liste di liste di controllo per il manager liste di controllo per il manager liste di controllo per i liste di controllo per il manager r il manager liste di controllo per il manager di contr liste di liste di controllo per il manager i controllo trollo per il man liste di il man liste di controllo per

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

Rapporto dal Questionari Insegnanti

Rapporto dal Questionari Insegnanti Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la

Dettagli

Indice. 1 Il monitoraggio del progetto formativo --------------------------------------------------------------- 3. 2 di 6

Indice. 1 Il monitoraggio del progetto formativo --------------------------------------------------------------- 3. 2 di 6 LEZIONE MONITORARE UN PROGETTO FORMATIVO. UNA TABELLA PROF. NICOLA PAPARELLA Indice 1 Il monitoraggio del progetto formativo --------------------------------------------------------------- 3 2 di 6 1 Il

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.

Dettagli

15. Antico gioco russo

15. Antico gioco russo 15. Antico gioco russo In un antico gioco russo, attraverso i risultati casuali ottenuti dall allacciamento di cordicelle, i giovani cercavano una previsione sul tipo di legame che si sarebbe instaurata

Dettagli

LEZIONE 7. Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x 3 3 + x2. 2, x3 +2x +3.

LEZIONE 7. Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x 3 3 + x2. 2, x3 +2x +3. 7 LEZIONE 7 Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x 3 3 + x2 2 6x, x3 +2x 2 6x, 3x + x2 2, x3 +2x +3. Le derivate sono rispettivamente,

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Lezione 1. Concetti Fondamentali

Lezione 1. Concetti Fondamentali Lezione 1 Concetti Fondamentali 1 Sonetto di Trilussa Sai ched è la statistica? E E na cosa che serve pe fa un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa.

Dettagli

Il database management system Access

Il database management system Access Il database management system Access Corso di autoistruzione http://www.manualipc.it/manuali/ corso/manuali.php? idcap=00&idman=17&size=12&sid= INTRODUZIONE Il concetto di base di dati, database o archivio

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

1. Scopo dell esperienza.

1. Scopo dell esperienza. 1. Scopo dell esperienza. Lo scopo di questa esperienza è ricavare la misura di tre resistenze il 4 cui ordine di grandezza varia tra i 10 e 10 Ohm utilizzando il metodo olt- Amperometrico. Tale misura

Dettagli

UNA LEZIONE SUI NUMERI PRIMI: NASCE LA RITABELLA

UNA LEZIONE SUI NUMERI PRIMI: NASCE LA RITABELLA UNA LEZIONE SUI NUMERI PRIMI: NASCE LA RITABELLA Tutti gli anni, affrontando l argomento della divisibilità, trovavo utile far lavorare gli alunni sul Crivello di Eratostene. Presentavo ai ragazzi una

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

Matematica generale CTF

Matematica generale CTF Successioni numeriche 19 agosto 2015 Definizione di successione Monotonìa e limitatezza Forme indeterminate Successioni infinitesime Comportamento asintotico Criterio del rapporto per le successioni Definizione

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico Capitolo 4 4.1 Il foglio elettronico Le più importanti operazioni richieste dall analisi matematica dei dati sperimentali possono essere agevolmente portate a termine da un comune foglio elettronico. Prenderemo

Dettagli

Come capire se la tua nuova iniziativa online avrà successo

Come capire se la tua nuova iniziativa online avrà successo Come capire se la tua nuova iniziativa online avrà successo Ovvero: la regola dei 3mila Quando lanci un nuovo business (sia online che offline), uno dei fattori critici è capire se vi sia mercato per quello

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Modulo didattico sulla misura di grandezze fisiche: la lunghezza

Modulo didattico sulla misura di grandezze fisiche: la lunghezza Modulo didattico sulla misura di grandezze fisiche: la lunghezza Lezione 1: Cosa significa confrontare due lunghezze? Attività n 1 DOMANDA N 1 : Nel vostro gruppo qual è la matita più lunga? DOMANDA N

Dettagli

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Matematica e Statistica

Matematica e Statistica Matematica e Statistica Prova d esame (0/07/03) Università di Verona - Laurea in Biotecnologie - A.A. 0/3 Matematica e Statistica Prova di MATEMATICA (0/07/03) Università di Verona - Laurea in Biotecnologie

Dettagli

Email Marketing Vincente

Email Marketing Vincente Email Marketing Vincente (le parti in nero sono disponibili nella versione completa del documento): Benvenuto in Email Marketing Vincente! L email marketing è uno strumento efficace per rendere più semplice

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Anno 4 Grafico di funzione

Anno 4 Grafico di funzione Anno 4 Grafico di funzione Introduzione In questa lezione impareremo a disegnare il grafico di una funzione reale. Per fare ciò è necessario studiare alcune caratteristiche salienti della funzione che

Dettagli

Analisi della performance temporale della rete

Analisi della performance temporale della rete Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

INDICE PREFAZIONE VII

INDICE PREFAZIONE VII INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione

Dettagli

Il principio di induzione e i numeri naturali.

Il principio di induzione e i numeri naturali. Il principio di induzione e i numeri naturali. Il principio di induzione è un potente strumento di dimostrazione, al quale si ricorre ogni volta che si debba dimostrare una proprietà in un numero infinito

Dettagli

TNT IV. Il Diavolo è meno brutto di come ce lo dipingono!!! (Guarda il video)

TNT IV. Il Diavolo è meno brutto di come ce lo dipingono!!! (Guarda il video) TNT IV Il Diavolo è meno brutto di come ce lo dipingono!!! (Guarda il video) Al fine di aiutare la comprensione delle principali tecniche di Joe, soprattutto quelle spiegate nelle appendici del libro che

Dettagli

Trascrizione completa della lezione Lezione 002

Trascrizione completa della lezione Lezione 002 Trascrizione completa della lezione Lezione 002 Adam: Salve, il mio nome e Adam Kirin: E io sono Kirin. Adam: e noi siano contenti che vi siete sintonizzati su ChineseLearnOnline.com dove noi speriamo

Dettagli

Excel. A cura di Luigi Labonia. e-mail: luigi.lab@libero.it

Excel. A cura di Luigi Labonia. e-mail: luigi.lab@libero.it Excel A cura di Luigi Labonia e-mail: luigi.lab@libero.it Introduzione Un foglio elettronico è un applicazione comunemente usata per bilanci, previsioni ed altri compiti tipici del campo amministrativo

Dettagli

Vademecum studio funzione

Vademecum studio funzione Vademecum studio funzione Campo di Esistenza di una funzione o dominio: Studiare una funzione significa determinare gli elementi caratteristici che ci permettono di disegnarne il grafico, a partire dalla

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

IL MODELLO CICLICO BATTLEPLAN

IL MODELLO CICLICO BATTLEPLAN www.previsioniborsa.net 3 Lezione METODO CICLICO IL MODELLO CICLICO BATTLEPLAN Questo modello ciclico teorico (vedi figura sotto) ci serve per pianificare la nostra operativita e prevedere quando il mercato

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

La carriera universitaria e l inserimento nel mondo del lavoro dei laureati in Ingegneria dei Materiali

La carriera universitaria e l inserimento nel mondo del lavoro dei laureati in Ingegneria dei Materiali La carriera universitaria e l inserimento nel mondo del lavoro dei laureati in Ingegneria dei Materiali Studenti che hanno conseguito la laurea specialistica nell anno solare 2009 Questa indagine statistica

Dettagli

Le funzioni continue. A. Pisani Liceo Classico Dante Alighieri A.S. 2002-03. A. Pisani, appunti di Matematica 1

Le funzioni continue. A. Pisani Liceo Classico Dante Alighieri A.S. 2002-03. A. Pisani, appunti di Matematica 1 Le funzioni continue A. Pisani Liceo Classico Dante Alighieri A.S. -3 A. Pisani, appunti di Matematica 1 Nota bene Questi appunti sono da intendere come guida allo studio e come riassunto di quanto illustrato

Dettagli

La variabile casuale Binomiale

La variabile casuale Binomiale La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola

Dettagli

Analisi e diagramma di Pareto

Analisi e diagramma di Pareto Analisi e diagramma di Pareto L'analisi di Pareto è una metodologia statistica utilizzata per individuare i problemi più rilevanti nella situazione in esame e quindi le priorità di intervento. L'obiettivo

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

VALORE DELLE MERCI SEQUESTRATE

VALORE DELLE MERCI SEQUESTRATE La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune

Dettagli

Polli e conigli. problemi Piano cartesiano. Numeri e algoritmi Sistemi e loro. geometrica. Relazioni e funzioni Linguaggio naturale e

Polli e conigli. problemi Piano cartesiano. Numeri e algoritmi Sistemi e loro. geometrica. Relazioni e funzioni Linguaggio naturale e Polli e conigli Livello scolare: primo biennio Abilità Interessate Calcolo di base - sistemi Risolvere per via grafica e algebrica problemi che si formalizzano con equazioni. Analizzare semplici testi

Dettagli

La categoria «ES» presenta (di solito) gli stessi comandi

La categoria «ES» presenta (di solito) gli stessi comandi Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:

Dettagli

PROGRAMMA SVOLTO NELLA SESSIONE N.

PROGRAMMA SVOLTO NELLA SESSIONE N. Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE

Dettagli

ESERCIZI DI STATISTICA DESCRITTIVA

ESERCIZI DI STATISTICA DESCRITTIVA ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,

Dettagli

I libri di testo. Carlo Tarsitani

I libri di testo. Carlo Tarsitani I libri di testo Carlo Tarsitani Premessa Per accedere ai contenuti del sapere scientifico, ai vari livelli di istruzione, si usa comunemente anche un libro di testo. A partire dalla scuola primaria, tutti

Dettagli

II.f. Altre attività sull euro

II.f. Altre attività sull euro Altre attività sull euro II.f È consigliabile costruire modelli in carta o cartoncino di monete e banconote, e farli usare ai bambini in varie attività di classe fin dal primo o al più dal secondo anno.

Dettagli

( x) ( x) 0. Equazioni irrazionali

( x) ( x) 0. Equazioni irrazionali Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza

Dettagli

LA STATISTICA NEI TEST INVALSI

LA STATISTICA NEI TEST INVALSI LA STATISTICA NEI TEST INVALSI 1 Prova Nazionale 2011 Osserva il grafico seguente che rappresenta la distribuzione percentuale di famiglie per numero di componenti, in base al censimento 2001. Qual è la

Dettagli

Memory Fitness TECNICHE DI MEMORIA

Memory Fitness TECNICHE DI MEMORIA Memory Fitness TECNICHE DI MEMORIA IMPARIAMO DAGLI ERRORI Impariamo dagli errori (1/5) Impariamo dagli errori (2/5) Il più delle volte siamo portati a pensare o ci hanno fatto credere di avere poca memoria,

Dettagli

NUOVA PROCEDURA COPIA ED INCOLLA PER L INSERIMENTO DELLE CLASSIFICHE NEL SISTEMA INFORMATICO KSPORT.

NUOVA PROCEDURA COPIA ED INCOLLA PER L INSERIMENTO DELLE CLASSIFICHE NEL SISTEMA INFORMATICO KSPORT. NUOVA PROCEDURA COPIA ED INCOLLA PER L INSERIMENTO DELLE CLASSIFICHE NEL SISTEMA INFORMATICO KSPORT. Con l utilizzo delle procedure di iscrizione on line la società organizzatrice ha a disposizione tutti

Dettagli

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114

Dettagli

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che:

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che: Teoria dei Giochi, Trento, 2004/05 c Fioravante Patrone 1 Teoria dei Giochi Corso di laurea specialistica: Decisioni economiche, impresa e responsabilità sociale, A.A. 2004/05 Soluzioni degli esercizi

Dettagli

In questa lezione abbiamo ricevuto in studio il Dott. Augusto Bellon, Dirigente Scolastico presso il Consolato Generale d Italia a São Paulo.

In questa lezione abbiamo ricevuto in studio il Dott. Augusto Bellon, Dirigente Scolastico presso il Consolato Generale d Italia a São Paulo. In questa lezione abbiamo ricevuto in studio il Dott. Augusto Bellon, Dirigente Scolastico presso il Consolato Generale d Italia a São Paulo. Vi consiglio di seguire l intervista senza le didascalie 1

Dettagli

[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1

[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1 [ Analisi della concentrazione] di Luca Vanzulli Pag. 1 di 1 LA CONCENTRAZIONE NELL ANALISI DELLE VENDITE L analisi periodica delle vendite rappresenta un preziosissimo indicatore per il monitoraggio del

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

IL METODO PER IMPOSTARE E RISOLVERE I PROBLEMI DI FISICA (NB non ha nulla a che vedere con il metodo scientifico)

IL METODO PER IMPOSTARE E RISOLVERE I PROBLEMI DI FISICA (NB non ha nulla a che vedere con il metodo scientifico) IL METODO PER IMPOSTARE E RISOLVERE I PROBLEMI DI FISICA (NB non ha nulla a che vedere con il metodo scientifico) [nota: Nel testo sono riportate tra virgolette alcune domande che insegnanti e studenti

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli