PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo 2006 Campionamento Maria Miceli
Cos è il campionamento? Procedura attraverso la quale alcuni membri della popolazione sono selezionati come rappresentatitivi dell intera popolazione
INDAGINE ESAUSTIVA INDAGINE CAMPIONARIA POPOLAZIONE analisi dei dati POPOLAZIONE CAMPIONE analisi dei dati Es.Censimento della popolazione Maria Miceli - SIS - ASL RMD
CICLO DELL ANALISI STATISTICA CAMPIONE POPOLAZIONE Raccolta e elaborazione dei dati STATISTICA DESCRITTIVA ST TATISTIC CA INFE ERENZIALE Maria Miceli - SIS - ASL RMD
Quando ricorrere al campionamento comporta t la distruzione i popolazione numerosa territorio vasto osservare ripetutamente nel tempo problema di costi
Quando NON ricorrere al campionamento malattie rare analisi molto dettagliata per area o categoria
Vantaggi del campionamento costi minimi i i maggiore tempestività maggiore accuratezza possibilità di ottenere un informazione più dettagliata
Ma... Precisione Costi
Svantaggi del campionamento Errore sistematico (bias) Errore campionario / casuale
Errore sistematico 1. L errore che deriva dal fatto che si sceglie un campione sbagliato, ovvero, non rappresentativo 2 L i t ti i d 2. L errore sistematico si deve prevenire in fase di disegno dello studio
Errore campionario 1. L errore campionario diventa più piccolo man mano che la dimensione i del campione aumenta; grandi campioni sono più affidabili di piccoli campioni i (numerosità) 2. L errore campionario dipende dalla variabilità delle osservazioni; se c è una grande variabilità, la possibilità di variazioni tra le medie campionarie aumenta e quindi l errore campionario potrebbe essere grande
Errore campionario 1. Non si può evitare 2. Si può misurare
Errore di campionamento VARIAZIONE CASUALE deriva da un elemento naturale ineliminabile: il CASO Questo è un BUON CAMPIONE, perché l errore dovuto alla variazione casuale può essere STIMATO L errore di campionamento si verifica per SELEZIONE VIZIATA fatta su un settore non rappresentativo della popolazione. Il campione si dice DISTORTO Questo è un CATTIVO CAMPIONE,,perché l errore non può essere STIMATO
Tipi di campioni Campioni non-probabilistici = le unità non sono scelte a caso, ma con scelta RAGIONATA NON è possibile il calcolo della precisione delle stime
Tipi di campioni Campioni probabilistici (o casuali o statistici) il CASO identifica le unità che entreranno a far parte del campione Non si ha mai la certezza se il campione sia rappresentativo Casualità permette di applicare la teoria del calcolo delle probabilità e della statistica e quindi di valutare l attendibilità delle stime ottenute
Parliamo soltanto dei campionamenti probabilistici o casuali
Metodi di campionamento 1 casuale semplice A struttura 2 semplice sistematico 3 4 5 stratificato tifi t a più stadi acl cluster A struttura complessa
1 Campionamento casuale semplice Ogni unità ha la stessa probabilità di essere inclusa nel campione Procedura Numerare tutte le unità Estrarre le unità casualmente (ad esempio con la tavola dei numeri casuali)
Esempio: campionamento casuale semplice 1 Albert D. 2 Richard D. 3 Belle H. 4 Raymond L. 5 Stéphane B. 6 Albert T. 7 Jean William V. 8 André D. 9 Denis C. 10 Anthony Q. 11 James B. 12 Denis G. 13 Amanda L. 14 Jennifer L. 15 Philippe K. 16 Eve F. 17 Priscilla O. 18 Thomas G. 19 Brian F. 20 Hellène H. 21 Isabelle R. 22 Jean T. 23 Samanta D. 24 Berthe L. 25 Monique Q. 26 Régine D. 27 Lucille L. 28 Jérémy W. 29 Gilles D. 30 Renaud S. 31 Pierre K. 32 Mike R. 33 Marie M. 34 Gaétan Z. 35 Fidèle D. 36 Maria P. 37 Anne-Marie G. 38 Michel K. 39 Gaston C. 40 Alain M. 41 Olivier P. 42 Geneviève M. 43 Berthe D. 44 Jean Pierre P. 45 Jacques B. 46 François P. 47 Dominique M. 48 Antoine C.
1 Campionamento casuale semplice Vantaggi Semplice Facile misurare l errore di campionamento Svantaggi Necessità di avere la lista completa delle unità Non sempre raggiunge la migliore rappresentatività
2 Campionamento sistematico Le unità sono estratte in modo che la distanza tra le unità della popolazione sia costante Procedura Calcolare l intervallo di campionamento (k = N/n) Estrarre un numero casuale ( k) per iniziare Estrarre un unità ogni k unità a partire dalla prima estratta
Esempio: campionamento sistematico
2 Campionamento sistematico Vantaggi Facile da utilizzare Può migliorare la precisione Utile quando le unità della popolazione sono ordinate: secondo un criterio puramente casuale (ordine alfabetico) secondo i valori di un fenomeno correlato con quello oggetto di studio Svantaggi gg Pericoloso se la lista ha dei cicli
3 Campionamento stratificato Procedura Dividere id la popolazione in sottogruppi omogenei (strati) rispetto al carattere investigato Estrarre un campione da ogni strato Combinare i risultati di tutti gli strati
3 Campionamento stratificato P/N P 1 / N 1 P i / N i P k / N k C 1 C i C k C 1 C i n 1 n i n k C n
3 Campionamento stratificato P / N =1000 <45 46-84 85+ 200 300 500 C 1 C i C k C 1 C i 20 30 50 C 100
3 Campionamento stratificato PROBLEMI scegliere il criterio per operare la stratificazione determinare il numero di strati d t i l d d l i d determinare la grandezza del campione da estrarre in ciascun strato
3 C. stratificato: attenzione Studio su fecondità in una piccola città (5000 donne) Stratifico secondo: età 3 strati stato civile 3 strati istruzione 3 strati reddito 4 strati religione 3 strati
3 C. stratificato: attenzione Studio su fecondità in una piccola città (5000 donne) Stratifico secondo: età 3 strati stato civile 3 strati istruzione 3 strati reddito 4 strati religione 3 strati Strati ti totali t = 3x3x3x4x3= 3 3 3 324 strati ti 10 unità per strato= 3240 unità. TROPPE!
3 C. stratificato: attenzione Studio su fecondità in una piccola città (5000 donne) Stratifico secondo: età 3 strati stato civile 3 strati istruzione 3 strati età 3 strati reddito 4 strati reddito 4 strati religione 3 strati religione 3 strati Strati totali = 3x4x3= 36 strati 10 unità per strato= 326 unità
3 Campionamento stratificato Vantaggi Migliora la precisione se il fattore di stratificazione è correlato con la variabile di interesse Sono rappresentati tutti i sottogruppi Svantaggi Difficile misurare l errore campionario Perdita di precisione se sono estratte poche Perdita di precisione se sono estratte poche unità per strato
4 Campionamento a più stadi Procedura si selezionano le unità primarie con un appropriato metodo di selezione si estraggono le unità al secondo ordine dalle unità primarie estratte
Esempio: Campionamento a più stadi Determinare la suscettibilità all epatite A tra gli studenti delle scuole di un paese 1. Estrarre un campione di regioni dal paese 2. Estrarre un campione di città da ciascuna regione scelta 3. Estrarre un campione di scuole da ciascuna città 4. Estrarre un campione di bambini dalle scuole selezionate
4 Campionamento a più stadi Vantaggi Non è necessaria la lista completa della popolazione Molto utile per grandi popolazioni Svantaggi Necessarie diverse liste di campionamento Difficile misurare l errore di campionamento
Campionamento a cluster 5 (o grappolo) Campione casuale di gruppi di unità ( cluster = famiglia, classe, quartiere) Nei cluster selezionati sono incluse tutte le unità o una proporzione Il i t ll i t d i l t Il campionamento all interno dei cluster può essere casuale semplice o sistematico
Esempio: campionamento a cluster sezione 1 sezione 2 sezione 3 sezione 5 sezione 4
5 Campionamento a cluster Vantaggi Semplice perché non è richiesta la lista completa delle unità della popolazione Costi minori Vantaggi Impreciso se i cluster sono omogenei Difficile misurare l errore di campionamento
Come scegliere un metodo di campionamento Popolazione che deve essere studiata dimensione/distribuzione geografica eterogeneità della variabile Livello di precisione richiesta Risorse disponibili Importanza di avere una stima precisa dell errore errore campionario
Errore di campionamento Nessun campione è l immagine perfetta della popolazione La dimensione dell errore può essere calcolata in un campione probabilistico Espresso dall errore standard Della media, della proporzione, p delle differenza, ecc. Funzione di Numerosità campionaria Quantità di variabilità nel misurare il fattore di interesse err.std dev.std n
Distorsioni Le stime che si ottengono da un campione possono essere affette anche da errori causati dalla struttura stessa del campione, diversa da quella della popolazione. DISTORSIONI possono essere dovute a: 1) sfortunati 2) piano di campionamento fatto male 3) molto rifiuti e quindi sostituzioni Che fare? PONDERAZIONE consiste nell apporre a tutte le unità del campione un opportuno coefficiente (PESO)