Il Campionamento Statistico

Documenti analoghi
Statistica descrittiva e statistica inferenziale

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

POPOLAZIONE CAMPIONE

Il campionamento e l inferenza. Il campionamento e l inferenza

Teoria e tecniche dei test

zio L'INDAGINE CAMPIONARIA Metodi, disegni e tecniche di campionamento

Campionamento La statistica media campionaria e la sua distribuzione

PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo Maria Miceli

CON O SENZA REIMMISSIONE

L indagine campionaria Lezione 5

standardizzazione dei punteggi di un test

Andrea Manganaro. Tecniche di campionamento a confronto per i sistemi di audit regionali

Il confronto fra medie

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson

LE DISTRIBUZIONI CAMPIONARIE

4. Campionamento statistico

Il Campionamento. La popolazione di riferimento

L indagine campionaria Lezione 3

Distribuzioni campionarie. Antonello Maruotti

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Il campionamento statistico. prof. C.Guida

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Indice Aspetti generali sul campionamento da popolazioni finite Campionamento probabilistico Disegno campionario semplice

UNIVERSITÀ DEGLI STUDI DI PERUGIA

LA REVISIONE LEGALE DEI CONTI Metodologie

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

Statistica. Campione

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Errori (o bias) negli studi epidemiologici

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Il campionamento. Storia del campionamento nelle scienze sociali

Schema lezione 5 Intervalli di confidenza

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Lezione 4 a - Misure di dispersione o di variabilità

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Alfredo Rizzi. Già professore ordinario di teoria dell inferenza statistica

9. ELEMENTI DI TECNICA DEI CAMPIONI

Statistica Inferenziale

Lezione n. 1 _Complementi di matematica

Statistica di base per l analisi socio-economica

C.I. di Metodologia clinica

LA LUNGHEZZA DEI GENI UMANI (Es4.1)

Distribuzioni campionarie

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Distribuzione Normale

STATISTICA INFERENZIALE

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Campione: parte della popolazione che si seleziona per l analisi.

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

Intervallo di confidenza

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Esercizi di Probabilità e Statistica

Intervalli di confidenza

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

Campionamento e numerosità campionaria

Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova

NOZIONI DI CALCOLO DELLE PROBABILITÀ

PSR Misure strutturali. Modalità e criteri per estrazione campione controlli in loco

a cura di Mario Bolzan(*)

Esercitazioni di Statistica: ES.1.1

Transcript:

Il Campionamento Statistico

Campionamento sistematico (1/2) Introdotto per ovviare ai costi elevati del campionamento casuale e semplice; richiede la selezione casuale soltanto per la prima unità; il campione è formato prendendo una unità ogni k presenti nella lista, a partire dalla prima estratta, con k pari al reciproco della frazione di campionamento. Esempio: Si supponga di dover estrarre un campione di 100 studenti ti da una lista di 1500 studenti. Il reciproco della frazione di campionamento, N/n, è uguale a 1500/100=15. Per formare il campione è sufficiente selezionare un numero casuale compreso tra 1 e 15 (estremi( inclusi) che individua la prima unità estratta e quindi procedere selezionando le altre unità con una progressione aritmetica di ragione 15 fino all'esaurimento della lista. Se, ad esempio, il primo numero estratto fosse 6, il campione risulterebbe formato dalle unità della lista contrassegnate dai numeri d'ordine: 6, 6+15, 6+30, 6+45 cioè 6, 21, 36, 51

Campionamento sistematico (2/2) Nel campionamento sistematico, come in quello casuale semplice, ogni unità della popolazione ha la stessa probabilità di entrare a far parte del campione. La media della popolazione può quindi essere stimata per p mezzo della media aritmetica semplice delle unità del campione. Ci si può ricondurre ad una selezione del tutto equivalente a quella casuale semplice, se si fa precedere la stessa da un'operazione che disponga le unità della lista in ordine casuale. La selezione sistematica non dàd buoni risultati quando la lista presenta una ciclicità di dimensione pari a quella dell'intervallo di selezione o ad un suo multiplo.

Campionamento stratificato (1/4) A volte, prima di intraprendere un'indagine, sono disponibili per r tutte le unità della popolazione alcune informazioni che possono essere utilizzate per migliorare il disegno di campionamento. Se, ad esempio, dobbiamo fare un campione di comuni, sono normalmente noti, prima dell'estrazione,, i dati relativi alla loro localizzazione geografica, alla dimensione demografica,, all'attività economica prevalente, etc La stratificazione è una metodologia che consente di utilizzare questo tipo di informazioni per migliorare il disegno di campionamento. Consiste e nella classificazione della popolazione in subpopolazioni, dette strati, sulla base delle informazioni ausiliarie e nella selezione di campioni indipendenti da ciascuno strato. La stima dei parametri caratteristici della popolazione (es. media) viene ricavata elaborando le stime separatamente per ogni sottopopolazione o strato.

Campionamento stratificato (2/4) I maggiori vantaggi della stratificazione discendono dal fatto che c la dimensione dei campioni negli strati anziché essere determinata dalla casualità dell'estrazione - come avverrebbe nel campionamento casuale semplice - è sotto il controllo di chi effettua il campione. Spesso i campioni sono formati applicando in tutti gli strati la stessa frazione di campionamento (ad esempio, per ogni strato si estrae il 2% delle unità). Essi risultano in tal caso di dimensione proporzionale a quella dello strato di provenienza e la stratificazione stessa viene v detta proporzionale.

Campionamento stratificato (3/4) Se la numerosità degli strati è molto diversa da strato a strato, un disegno di tipo proporzionale determinerà una numerosità di campione molto differenziata da strato a strato. Se il carattere (quantitativo) analizzato ha varianza approssimativamente uguale in ogni strato, le stime ricavate per ogni strato hanno un diverso grado di precisione. In questa situazione, sarà opportuno cercare di conferire a questi risultati (stime) lo stesso grado di precisione nei diversi strati. ti. Ciò sarà realizzabile selezionando campioni di strato che abbiano approssimativamente la stessa dimensione; in altre parole, utilizzando frazioni di campionamento c diverse da strato a strato (stratificazione non proporzionale).

Campionamento stratificato (4/4) L'adozione di un campionamento stratificato è soggetta a due condizioni: deve essere nota la proporzione di popolazione negli strati che si vogliono formare; ogni unità della popolazione deve essere attribuibile senza equivoci ad uno o ed uno soltanto dei possibili strati. In genere non risulta conveniente formare un elevato numero di strati. s L'aumento del numero degli strati, per una data dimensione complessiva del campione, implica una riduzione della dimensione campionaria interna ad ogni strato e, conseguentemente, un aumento della variabilità degli stimatori.

Campionamento a grappoli (1/2) In gran parte delle popolazioni oggetto di indagine, le unità sono raggruppate in sottopopolazioni di varia natura. Ad esempio, la popolazione residente in Italia è composta dagli individui residenti nelle varie province (regioni, i, comuni, ecc.). Gli studenti di un ateneo possono essere classificati in base al corso di laurea, anno di corso ecc. Questi raggruppamenti possono essere utilizzati come unità di selezione del campione e, in tal caso, sono denominati grappoli. L elenco dei grappoli costituisce la lista dalla quale viene estratto il campione. Una volta deciso il numero dei grappoli da includere nel campione, se sono incluse tutte t le unità che appartengono ai grappoli estratti, si parla di campionamento a grappoli; se vengono incluse solo alcune unità estratte casualmete (ccs)) dai grappoli selezionati, si parla di campionamento a due stadi.

Campionamento a grappoli (2/2) Il grappolo è diverso dallo strato. Gli strati devono essere omogenei rispetto al carattere di indagine (o rispetto a caratteri associati ati a quello di indagine) e ogni strato viene ad essere rappresentato nel campione (infatti, nel campionamento stratificato, viene estratto un ccs da ogni strato). Al contrario, solo alcuni dei grappoli sono estratti e quindi questi devono essere in grado di rappresentare anche quelli non selezionati. La situazione ideale sarebbe quella in cui tutti i grappoli fossero più eterogenei possibile al loro interno e quindi più simili fra loro.

Campionamento a più stadi I grappoli però non sono formati da chi estrae il campione, ma sono s aggregazioni preesistenti nella popolazione, caratterizzate in verità da un certo grado di omogeneità interna. L omogeneitl omogeneità che, nel campionamento stratificato, è sinonimo di precisione, nel campionamento a grappoli tende a produrre, invece, una perdita di precisione poiché solo alcuni dei grappoli vengono estratti. La giustificazione del metodo sta essenzialmente negli aspetti economici e ad esso collegati. Talvolta può essere impossibile formare una lista delle le unità di studio mentre è disponibile una lista di aggregati di unità (grappoli). Inoltre, per una stabilita dimensione campionaria, il campionamento a grappoli comporta generalmente eralmente costi inferiori al ccs soprattutto per la minore dispersione delle unità campionarie che facilità l operazione di raccolta materiale dei dati. Un campione di individui residenti in Italia potrebbe essere estratto selezionando inizialmente alcune regioni, da alcune di queste alcune province,, successivamente alcuni comuni e, infine, alcuni individui dalle anagrafi comunali i (si tratta di un campionamento a più stadi).

Campionamento non probabilistico (1/3) Campioni a scelta ragionata: Tali campioni sono formati senza alcun a ricorso a meccanismi di casualizzazione.. La scelta delle unità da includere nel campione è affidata al ricercatore (o al rilevatore) ed è operata il più delle volte con obiettivi di rappresentatività di certi aspetti strutturali della popolazione. Campioni per quote: formati dopo una classificazione delle unità della popolazione, in gruppi. Il rilevatore deve selezionare unità appartenenti a ciascun gruppo fino al raggiungimento di prestabilite quote, cioè dimensioni, in modo da riprodurre nel campione (relativamente ai gruppi formati) la struttura della popolazione. polazione. Nella scelta delle unità il rilevatore può essere assoggettato ad un certo numero di vincoli, quali ad esempio l'obbligo di compiere prestabiliti itinerari per il contatto, c il divieto di inserire nel campione più unità (individui) facenti parte di uno stesso nucleo abitativo, ecc., in modo da ridurre per quanto possibile il suo grado di arbitrarietà.

Campionamento non probabilistico (2/3) Campione per unità tipo: formato da unità che a giudizio di un esperto, cui è demandata la loro selezione, possiedono caratteristiche ritenute più frequenti nella popolazione; Campione formato da aree barometro: circoscrizioni territoriali nelle quali si riscontrano comportamenti analoghi a quelli dell'intera popolazione.

Campionamento non probabilistico (3/3) Campioni selezionati fortuitamente o a caso: Il termine a caso non deve essere confuso con casualmente; questi campioni infatti non sono formati nén con l'ausilio di tecniche di casualizzazione,, nén seguendo procedimenti che implicano la preferenza da parte del rilevatore per certe unità anziché per altre. Appartengono a questa categoria i campioni formati da: 1. volontari (i pazienti di un centro medico, i rispondenti ad un questionario q inserito in un giornale, ecc.); 2. unità che transitano da passaggi obbligati come frontiere, ingressi di edifici, le casse di un supermercato, ecc.; 3. le parti più accessibili di popolazioni generalmente formate da oggetti (reperti erti di scavi archeologici, pesci catturati con reti, etc.)