Principi per la predisposizione di un piano di campionamento

Documenti analoghi
Il campionamento statistico. prof. C.Guida

Quantificare la variabilità dei processi ecologici

L indagine statistica

Indice Aspetti generali sul campionamento da popolazioni finite Campionamento probabilistico Disegno campionario semplice

Gestione delle NC microbiologiche

della provincia di Padova Sintesi anno 2015 A cura del Servizio Studi - Padova, marzo 2016

Statistica Inferenziale

Esercitazioni di statistica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

Sfide di Matematica. Corso PON Competenze per lo sviluppo Liceo A. Galizia Nocera Inferiore. Ing. Ivano Coccorullo Prof.ssa Daniela Garreffa

Inferenza statistica

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

ANALISI MULTIVARIATA

ANALISI E GESTIONE DEI COSTI

EPIDEMIOLOGIA DEL TUMORE DEL MELANOMA CUTANEO IN VENETO

Analisi della varianza

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

LO STUDIO VIADANA 2. Studio di genotossicità su un campione (~600) della coorte esaminata costituita da 4130 bambini (studio Viadana 1)

Uno studio multicentrico dello stato nutrizionale della popolazione infantile nel Veneto. Antonio Stano SIAN Azienda ULSS 3 Bassano del Grappa (VI) 1

il costo in contabilità generale

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione

WATER SAFETY PLAN: SALUTE, INNOVAZIONE E SOSTENIBILITÀ NELLA GESTIONE DELL ACQUA POTABILE. Contesto sanitario. 15/01/2016 Montanelli Maurizio

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Corso di Psicometria Progredito

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

7 Disegni sperimentali ad un solo fattore. Giulio Vidotto Raffaele Cioffi

QUALITY. Analisi delle acque. via Volturno, Palermo - Tel Fax info@amapspa.it.

Quotazioni immobiliari: l analisi dei dati nelle schede di rilevazione

POP 03 PROCEDURA DI CAMPIONAMENTO DI ACQUE SUPERFICIALI, REFLUE E POTABILI

Verona, 16/04/2010 Controllo in accettazione secondo la norma UNI ISO UNI 2859

STATISTICA INFERENZIALE

Oggetto dell Esercitazione

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Infrastruttura telematica: visione d insieme Mauro Nanni

TECNOLOGIA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA PRIMARIA

Corso di Marketing e Marketing Internazionale a.a

2. Variabilità mediante il confronto di valori caratteristici della

TEST GENETICI PAZIENTI e FAMIGLIARI

Lezione 12 Argomenti

La mobilità degli elementi chimici

Esercitazione n. 5 di Metodologia della Ricerca Psicologica

LA RILEVAZIONE DEI PREZZI AL CONSUMO

La fisica e la misura

Metodi di Distanza. G.Allegrucci riproduzione vietata

Corso di REVISIONE AZIENDALE

R - Esercitazione 5. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. Lunedì 2 Dicembre Università Roma Tre

Costi di conformità alle normative. sul costo totale del latte

Il Metodo Scientifico

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

ha conseguito il diploma di laurea in Medicina Veterinaria presso l Università degli studi di Sassari

Protocollo dei saperi imprescindibili Ordine di scuola: professionale

Aspetti sanitari. Chioschi dell acqua: tecnologie e regole 8 ottobre Enrico Veschetti

I laureati scuole di provenienza, durata degli studi, votazioni ed età

Curva di Taratura.xls

STATISTICA IX lezione

RIDUZIONE DELLE DISTANZE

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Modena, 28 maggio 2009 Michele Fusillo

Concetto di potenza statistica

Modalità di presentazione e tipologia dei dati da inserire nelle banche dati per il monitoraggio della terapia genica e cellulare somatica

CAPITOLO II. Il Vantaggio Assoluto

Esercizio C2.1 - Acquisizione dati: specifiche dei blocchi

MATEMATICA e COMPLEMENTI di MATEMATICA

PG-SGSL 03 Definizione degli obiettivi e dei programmi

I CIRCOLO DIDATTICO MERCATO SAN SEVERINO PERCORSO DI FORMAZIONE E RICERCA IN RETE

ALIMENTARISTA Livello 1 (12 ore)

Macroeconomia a. a Luca Deidda Economia aperta nel breve periodo e Aree valutarie

FONDAMENTI DI ECONOMIA AZIENDALE E IMPIANTISTICA INDUSTRIALE

SICUREZZA ALIMENTARE: MANUALE DI CORRETTA PRASSI OPERATIVA. Area Sicurezza Alimentare e Produttiva

Sicuramente

REGOLAMENTO PER LA GESTIONE DELLA MANUTENZIONE DELLE STRADE COMUNALI

La vendita e la gestione della rete di vendita CAP 9

LE RISORSE E LE COMPETENZE COME BASE DELLA STRATEGIA

Un applicazione della modellistica ARCH-GARCH

MONITOR CALCIO. Un prodotto di ricerca dell ecosistema informativo CHANGE

Stima dei costi di produzione delle olive da olio (Indagine ISMEA )

Concetto di rischio Pericolo

Collaudo statico di un ADC

RAPIDE. La povertà viene calcolata sulla base. Nel 2002 la spesa media mensile. La povertà in Italia nel 2002 POVERTÀ NEL TEMPO E SUL TERRITORIO

VALUTAZIONE DELLA TRAIETTORIA OTTIMA NELLA CANOA DISCESA UTILIZZANDO IL SOFTWARE DartTrainer

TEST DI AUTOVALUTAZIONE TEST SU DUE CAMPIONI

ELENCO BANDI IN CORSO E BANDI ESPLETATI NELL ULTIMO TRIENNIO

MISURA DELLA DISTANZA FOCALE DI UNA LENTE CONVERGENTE

Premessa e obiettivi. dell individuo nella loro pienezza e totalità. ORGANIZZAZIONE STRATEGICA. Risorse Umane POTENZIALE

L evoluzione del Terziario.

p k q n k = p n (k) = n 12 = 1 = ,1208. q = 1 2 e si ha: p 12 (8) =

CONSIDERAZIONI SUL SISTEMA DI GESTIONE DELL UTENSILERIA PER LE AZIENDE MANIFATTURIERE METALMECCANICHE

VBA è un linguaggio di scripting derivato da Visual Basic, da cui prende il nome. Come ogni linguaggio ha le sue regole.

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Parte della gestione finanziaria che ha l'obiettivo di ottimizzare il flusso di disponibilità liquide di un'azienda. Ha lo scopo di non mantenere mai

LE ANALISI DI BILANCIO PER INDICI

PREVENZIONE DEI RISCHI DA ALCOL E DROGHE NEI GIOVANI LAVORATORI

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

CNESPS PASSI PER L ITALIA

LA VALIDITÀ DEGLI STUDI E IL CONTROLLO DEL CONFONDIMENTO

BRC Version 7 LA NUOVA VERSIONE DEL GLOBAL STANDARD FOR FOOD SAFETY

INDAGINE EPIDEMIOLOGICA PER MALATTIA DI AUJESZKY DEL SUINO SIEROPOSITIVITA * CORRELAZIONE EPIDEMIOLOGICA SINTOMI CLINICI

Francesca Pierri Dipartimento di Economia Finanza e Statistica Università degli Studi di Perugia

LA POVERTA IN ITALIA NEL 2009 (ISTAT)

Transcript:

Principi per la predisposizione di un piano di campionamento Genova 9 Aprile 2015 Cristiana Maurella SC Epidemiologia e Osservatorio Epidemiologico

PERCHE SI CAMPIONA? Genericamente: per valutare alcune caratteristiche di una popolazione / lotto In sanità pubblica: per cercare un RISCHIO

Epidemiologia e Statistica STRUMENTI PER LA RICERCA DEL RISCHIO Test Diagnostico e Analisi Buone pratiche di campionamento

perchè un campione anzichè l intera popolazione? Survey È l operazione di osservazione del fenomeno di interesse sulle unità statistiche (in epidemiologia veterinaria: capi animali, alimenti) può essere effettuata su: tutte le unità di popolazione (indagine totale o censimento) un loro sottoinsieme, detto campione (indagine parziale o campionaria)

perchè un campione anzichè l intera popolazione? raramente è possibile esaminare ogni singolo elemento della popolazione: le risorse $, temporali, umane, di laboratorio sono limitate; l intera popolazione non è fisicamente raggiungibile o è in parte ignota; l osservazione comporta la distruzione degli elementi; il nr. di elementi della pop. è molto elevato o infinito, tanto che lo studio di ciascuno è fattibile solo teoricamente; non è interessante sapere tutto della popolazione. l esame di un numero ridotto di osservazioni, opportunamente selezionate, consente di superare questi problemi

perchè un campione anzichè l intera popolazione? Svantaggi dell indagine campionaria: perdita di parte dell informazione: non si otterrà il valore vero di popolazione ma solo una sua approssimazione, per quanto precisa (errore inevitabile); ricorso a tecniche statistiche relativamente complesse (procedure di stima e verifica di ipotesi). Vantaggi: risparmio di tempo e risorse; accuratezza (= validità) delle misurazioni: è possibile fissare a priori l ammontare dell errore di stima tollerabile.

obiettivi del campionamento statistico 1/2 Obiettivo generale è la conoscenza di una popolazione tramite l esame di una sua parte e la generalizzazione, con un certo grado di certezza, delle conclusioni ottenute dal campione all intera popolazione questo processo di generalizzazione è definito INFERENZA POPOLAZIONE: N estrazione di un campione campione: n studio del campione inferenza

obiettivi del campionamento statistico 2/2 in epidemiologia descrittiva: osservare le caratteristiche della popolazione bersaglio; in epidemiologia analitica: verificare l esistenza di eventuali relazioni causali tra fattori di rischio e l insorgenza di patologie; si utilizza l inferenza per effettuare una stima: si parte dall elaborazione sui dati del campione per verificare se una caratteristica e/o relazione in esso osservata valga anche per il resto della popolazione, con una certa probabilità ruolo strategico del campione: base informativa per decisioni che riguardano l intera popolazione

logica della stima campionaria, puntuale e intervallare 1/2 Stima puntuale: il parametro sconosciuto della popolazione viene rappresentato con il valore preciso calcolato sul campione Es.: dato un campione di 100 uova stimo che il peso medio delle uova M del produttore x sia 50 gr (= peso medio delle 100 uova campione). intervallare: intorno alla s. puntuale viene costruito un intervallo di valori che, con una certa probabilità definibile a priori, conterrà l ignoto parametro di pop. Es.: dato un campione di 100 uova stimo che, con prob. 95%,, il peso medio delle uova M del produttore x sia compreso tra 45 e 55 gr, ovvero 50±5 gr.

logica della stima campionaria, puntuale e intervallare 2/2 Perché le stime sono solo probabili e non certe? Campione = unica base informativa: si lavora solo sul campione estratto, dal quale si ottiene un solo risultato di stima ma il campione osservato è uno dei tanti che si possono estrarre da una popolazione, calcolando per ciascuno di essi un valore di stima al variare del campione, il valore della stima cambia: variabilità campionaria

caratteri del campione 1/1 Affinché l informazione campionaria ottenuta sia accurata (= valida) quasi quanto quella che si sarebbe ricavata esaminando l intera pop., il campione estratto deve essere Casuale: i componenti della pop. devono avere = probabilità di essere scelti Rappresentativo: deve contenere, possibilmente rispettandone le proporzioni, le più importanti caratteristiche della pop. di provenienza solo così le differenze tra campione e pop. sono accidentali e non sistematiche

errore di campionamento e fattori che vi contribuiscono 1/2 Errore di campionamento: differenza tra i risultati ottenuti dal campione e la vera caratteristica della pop. che vogliamo stimare Non può essere determinato con esattezza ma solo contenuto entro margini più o meno ristretti, e stimato

errore di campionamento e fattori che vi contribuiscono 2/2 da cosa dipendono tali proprietà? Validità (=assenza di errore sistematico) Precisione (=assenza di errore casuale) disegno di campionamento: un campione non rappresentativo influisce negativamente sulla validità = stime lontane dal vero parametro di pop. La stima è affetta da errore sistematico o distorsione (non eliminabile ripetendo la misurazione, nè stimabile). numerosità campionaria n: un campione troppo piccolo o una elevata variabilità nella pop. influiranno negativamente sulla precisione della stima. La stima è affetta da errore casuale (dovuto alla fluttuazione accidentale dei dati, stimabile).

errore di campionamento e fattori che vi contribuiscono 4/5 le componenti dell errore di campionamento: grafico di Rothman errore casuale sistematico n

,...

A: alta validità, bassa precisione errore di campionamento e fattori che vi contribuiscono Validità e precisione delle stime campionarie B B: bassa validità, bassa precisione (situazione peggiore!) D A C: bassa validità, alta precisione C D: alta validità, alta precisione (situazione ottimale)

determinazione della numerosità campionaria 1/2 Problema: quanto deve essere grande il campione? è una delle parti più delicate nella pianificazione di una indagine campionaria; ovviamente (se estratto correttamente), più grande è il campione, più precisi saranno i risultati. Ma indagini su campioni numerosi costano un occhio della testa, oltre a richiedere molto tempo n = compromesso tra esigenze diverse

determinazione della numerosità campionaria 2/2 Fattori da considerare per det. n in uno studio epidemiologico: precisione (errore assoluto = ampiezza IC, es. ± 3% intorno alla stima puntuale); livello di confidenza desiderato (es. 90, 95, 99%); prevalenza attesa: rispecchia la variabilità nella pop. (se incognita ipotizzare, per sicurezza, la situazione peggiore e usare un valore di prevalenza del 50%, che massimizza la variabilità e quindi n); una correzione utilizzabile nel caso di una pop. bersaglio di modeste dimensioni (se n è almeno pari al 5% di N, è necessario un campione più piccolo per ottenere la stessa precisione). n aumenta se aumentano precisione e sicurezza, e se P=50%; n diminuisce se la pop. bersaglio è piccola.

determinazione della numerosità campionaria 1/2 Es. di determinazione di n per la stima della prevalenza nella pop. Definisco a priori: precisione desiderata = ±3% grado di sicurezza = 95% prevalenza attesa P: essendo incognita utilizziamo un valore del 10% la pop. bersaglio è molto grande (50.000 unità) il campione necessario è pari a n = 385 kg FORMULA DA UTILIZZARE: 2 2 * P att (1 Patt ) n = 2 d dove: 2 è il fattore moltiplicativo dell ES per un livello di confidenza del 95%; d = precisione desiderata

determinazione della numerosità campionaria 2/2 Det. di n per la valutazione della presenza di una malattia Definisco a priori: liv. di confidenza (95, 99%) numero min. di soggetti ammalati che ci si attende nella pop. nel caso la malattia sia effettivamente presente (esprimibile in termini di prevalenza) FORMULA DA UTILIZZARE n = 1 (1 1 a) D * N ( D 2 1) dove: a: liv. di confidenza (*) D: numero di animali ammalati nella pop. N: dimensione della pop. (*) prob. di osservare almeno un animale ammalato nel campione quando la malattia colpisce almeno D/N soggetti nella pop.

ESEMPIO Supponiamo di avere 20 campioni e che me aspetto 5 positivi. Se estraggo un campione a caso, la probabilità che sia positivo = 5/20 = 0.25 = p E la probabilità che sia negativo = 15/20= 0.75 = 1-p Ammettiamo che il primo sia negativo e ne prendo un altro. la probabilità che sia negativo = 14/19 = 0.737 La probabilità di 2 soggetti negativi = 0.75 x 0.737 = 0.55 Se ne prendo un terzo, la probabilità che sia negativo = 13/18 = 0.722 e la probabilità che i 3 siano negativi = 0.75 x 0.737 x 0.722 = 0.399 Se consideriamo la successione di estrarre 8 campioni negativi, la probabilità = 15/20 x 14/19 x 13/18 x 12/17 x 11/16 x 10/15 x 9/14 x 8/13= 0.051 = 5 % e la p di avere almeno un campione positivo = 95 %

Numerosità campionaria per dire con un dato livello di confidenza che la popolazione è esente da positivi (o non conformi) se tutti i campioni risultano positivi n = 1 ( 1 k ) 1 d d N ( 1 ) 2 n =numerosità campionaria che vogliamo k =livello di confidenza = 0,95 d =numero di soggetti che si suppone positivi = 5 N =consistenza della popolazione = 20 1 = 1 1 0. 95 5 n ( ) 20 ( 5 1 ) 2 n = 8

10 Numero/grandezza del campione 20 1 4 3 5,8 5 100 kg 5 Aflatossine BG in pistacchi 3 1 Pasta di salsiccia (di origine diversa) in cui sospetto la presenza di salmonella del 25% ad un livello di confidenza pari al 95%. Faccio 6 prelievi 3 Sono tutti negativi. Posso essere tranquillo??

d d N n k = 2 1 1 1 86. 0 2 1 5 20 6 1 1 5 = = k Se faccio 6 prelievi? Non è un campionamento corretto!!

Con 7 prelievi, k = 0.91 < 0.95 E se proprio questo fosse positivo? n = 1 ( 1 k ) 1 d N ( d 1 ) 2 = 8

Campionamento microbiologico Il campionamento deve tenere conto della peculiarità dell analita: A. Biovariabilità della popolazione microbica B. Distribuzione eterogenea dell analita C. Incostanza del comportamento biologico (Germi stressati) D. La matrice alimentare è un substrato di esseri viventi che entrano in competizione tra loro o. E. I germi saprofiti ostacolano lo sviluppo dei germi patogeni F. In un prodotto pastorizzato/sterilizzato un microrganismo patogeno si moltiplica con maggior facilità

Scopo principale di un programma di campionamento non è quello di SCARTARE ma di PREVENIRE Alimento (Partita - lotto) Campione E Trasporto Laboratorio E E E E Preparazione E Analisi Risultato

Prima di accingersi al campionamento E bene domandarsi: quali informazioni potrà fornire l analisi sulla situazione igienico-sanitaria del prodotto o del processo di fabbricazione? come potrà/dovrà essere interpretato il risultato delle determinazioni richieste? come sarà espresso il risultato in base alla richiesta: qualitativo o quantitativo? come potrà/dovrà essere valutato un risultato positivo,negativo o numerico?

Campionamento - Precondizioni Conoscenza del processo analitico generale e sua applicazione per la risoluzione dello specifico problema Conoscenza della distribuzione della concentrazione dell analita all interno della derrata Conoscenza del grado di omogeneità del materiale oggetto di studio Conoscenza dell errore potenziale di campionamento Conoscenza delle strutture coinvolte nella procedura Esistenza di procedure operative standard (POS) in cui siano dettagliatamente descritte le fasi del campionamento Disponibilità delle POS per gli operatori addetti al campionamento

Fattori determinanti lo sviluppo di un piano di campionamento Tipo di derrata Limiti soglia di accettabilità Grandezza del campione prelevato Preparazione del campione Disponibilità di metodi di analisi quantitativi Valutazione dei tempi di risposta Scelta dei punti di campionamento (campo, navi, ecc.) Valutazione dell accettabilità del rischio del produttore Valutazione dell accettabilità del rischio del consumatore

PIANO DI CAMPIONAMENTO PER ATTRIBUTI in cui: vengono studiate, per un certo carattere, un numero stabilito di unità campionarie prelevate a random i risultati analitici ottenuti, qualitativi (assenza /presenza) o quantitativi, sono utilizzati per classificare le unità in 2 classi (Accettabile / Non accettabile) o in 3 classi (Accettabile / Marginalmente accettabile / Non accettabile)

Un Piano di campionamento a due classi è applicabile sia a ricerche di tipo qualitativo che di tipo quantitativo Un Piano di campionamento a tre classi solo a ricerche di tipo quantitativo

Il Piano di campionamento ICSMF a due classi Definisce: n = numero di unità campionarie che costituiscono il campione, da analizzare in modo indipendente m = il valore limite che serve a classificare i risultati come accettabili o inaccettabili ( es. ass/pres in 25g o, per i risultati quantitativi, xxxufc/g) c = numero massimo di unità campionarie con risultato superiore ad m tollerate, perché il giudizio complessivo sulla partita sia ancora favorevole

Un piano di questo tipo ci può dare informazioni, a seconda del valore di n e c, della probabilità di valutare come ACCETTABILE una partita non accettabile (Rischio del consumatore) o al contrario di valutare come INACCETTABILE una partita accettabile (Rischio del produttore) Il Rischio per il produttore ed il Rischio per il consumatore variano - in termini di probabilità - al variare della prevalenza di unità difettose realmente presenti nella partita.

Aumentando il valore di n riduciamo il rischio per il consumatore; stesso effetto si ottiene riducendo il valore di c o diminuendo il valore di m (Piani più stringenti) l opposto avviene diminuendo il valore di n e/o aumentando c ed m (Piani meno stringenti) La scelta della combinazione più opportuna è un compromesso che tiene conto della tipologia di alimento e della severità del pericolo per la salute umana

Il Piano di campionamento a tre classi Definisce: n = numero di unità campionarie che costituiscono il campione, da analizzare in modo indipendente m = un limite microbiologico che permette di classificare i risultati come accettabili ( uguali o inferiori) o marginalmente accettabili M = un limite microbiologico al di sopra del quale i risultati sono inaccettabili c = numero massimo tollerabile di unità campionarie con risultato superiore ad m, ma inferiore ad M, perché il giudizio complessivo sulla partita sia ancora favorevole

GRAZIE PER L ATTENZIONE