CON O SENZA REIMMISSIONE

Documenti analoghi
Il campionamento statistico. prof. C.Guida

28/10/2010 CAMPIONE STATISTICO. L'errore di campionamento

Metodi e tecniche di valutazione dei progetti Tecniche di campionamento

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Verifica delle ipotesi

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

Introduzione all'inferenza Lezione 4

Statistica descrittiva e statistica inferenziale

PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo Maria Miceli

Teoria e tecniche dei test

Campionamento La statistica media campionaria e la sua distribuzione

Modelli descrittivi, statistica e simulazione

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

RILEVAZIONI CAMPIONARIE E TECNICHE DI CAMPIONAMENTO. Prof.ssa Maria Carella

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato

POPOLAZIONE CAMPIONE

05. Errore campionario e numerosità campionaria

LEZIONI DI STATISTICA MEDICA

Campione: Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

La distribuzione t. Federico Plazzi. 7 Novembre 2015

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

La progettazione di un indagine statistica

Distribuzioni campionarie. Antonello Maruotti

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Campionamento 29/4/2005

Le indagini campionarie

Principali procedimenti di campionamento casuali 1

Metodologia Statistica

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2007/2008 Esercizi 30 novembre 2007

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

Metodi Statistici per il Marketing. #06 Elementi di statistica inferenziale e di teoria dei campioni

Metodi statistici per le ricerche di mercato

Campionamento e distribuzioni campionarie

Andrea Manganaro. Tecniche di campionamento a confronto per i sistemi di audit regionali

APPUNTI DI STATISTICA INFERENZIALE. Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

Statistica Inferenziale

Lezione 1 Corso di Statistica. Domenico Cucina

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Lezione 2

STATISTICA A K (60 ore)

Ingegneria Logistica e della Produzione - Teledidattico. Prova del

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

Metodi statistici per le ricerche di mercato

Il Campionamento. La popolazione di riferimento

Statistica Inferenziale

Elementi di Psicometria con Laboratorio di SPSS 1

DISTRIBUZIONI DI CAMPIONAMENTO

Il Campionamento Statistico

Campionamento. Aa

STATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 Compito A

LA COSTRUZIONE DELLA BASE EMPIRICA B RELATIVAMENTE ALL UNITÀ DI ANALISI LA DEFINIZIONE OPERATIVA DELL OGGETTO

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Campionamento 21/1/2005

Campionamento e stima di parametri

Il confronto fra medie

Capitolo 1 La rilevazione dei fenomeni statistici

Schema lezione 5 Intervalli di confidenza

STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA

Distribuzione Normale. Dott. Claudio Verona

standardizzazione dei punteggi di un test

Alcuni concetti. Unità

ESERCITAZIONE N. 5 corso di statistica

STATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 compito B

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica

Metodi statistici per le ricerche di mercato

Metodi Statistici per il Marketing. #05 Elementi di statistica inferenziale e di teoria dei campioni

Statistica Sociale e Criminale (12 CFU) A.A. 2015/2016

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Statistica Applicata all edilizia: Stime e stimatori

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Distribuzione Normale. Dott. Claudio Verona

Distribuzione Gaussiana - Facciamo un riassunto -

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni

Contenuto del capitolo

ESERCIZIO 1. Soluzione. X =numero di passeggeri giornaliero

STATISTICA A K (63 ore) Marco Riani

Variabili aleatorie. Variabili aleatorie

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2017/2018. Giovanni Lafratta

QUANDO RACCOGLIERE DATI SU BASE CAMPIONARIA??

I SONDAGGI DI OPINIONE. La necessità di una teoria dei campioni

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Intervallo di confidenza.

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Elementi di Psicometria con Laboratorio di SPSS 1

PROBABILITÀ E STATISTICA - 23 Giugno 2017 Scrivere le risposte negli appositi spazi. Motivare dettagliatamente le risposte su fogli allegati

4. Si supponga che il tempo impiegato da una lettera spedita dall Italia per arrivare a destinazione segua una distribuzione normale con media

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Teorema del Limite Centrale

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Parametri statistici

Metodi statistici per le ricerche di mercato

Transcript:

CAMPIONAMENTO Per una buona inferenza o induzione statistica, bisogna affrontare il problema del campionamento, ovvero del come raccogliere un campione della popolazione affinché la si possa studiare induttivamente. Per fare questo, intanto il Campione deve essere RAPPRESENTATIVO. La rappresentatività è garantita da una campionamento casuale o aleatorio, in cui cioè ogni elemento della popolazione ha la medesima probabilità di entrare a far parte del campione. Per esempio, avendo una popolazione (finita) di 500 elementi, ognuno di essi avrà una probabilità di essere estratto pari a 1/500, e nessuno di essi ne avrà una differente. Casuale pertanto non significa preso a caso ma equiprobabile. Solo così si può applicare la Teoria della probabilità per inferire correttamente i dati. IL CAMPIONE ALEATORIO Un campione è detto aleatorio quando gli elementi disponibili della popolazione hanno la stessa probabilità di farne parte. Perché ci si riferisce ad elementi disponibili e non semplicemente agli elementi della popolazione? Per rispondere, bisogna tener conto che il campionamento può essere CON O SENZA REIMMISSIONE. Per estrarre un campione casuale si procede così: Si numerano gli elementi (per rendere appunto equiprobabile - come lo sono i numeri - l estrazione) * Si estraggono a caso i numeri associati agli elementi. Ora non resta che scegliere se effettuare reimmissioni o meno. Quando la popolazione è teoricamente infinita e il campione è piccolo, CON O SENZA è ininfluente. Quando la popolazione è finita, la differenza fra i due metodi c è. Per esempio, con una popolazione di 500 elementi, ogni elemento che viene estratto con reimmissione ha P=1/500 e si dice che i relativi risultati delle estrazioni sono indipendenti. Ciascuna delle unità potrà essere estratta più volte. (SI DICE ESTRAZIONE BERNOULIANA e il numero dei campioni ottenuti è pari a D N,n =N n ) Con una estrazione senza reimmissione, invece, ad ogni estrazione la probabilità cambia, nel senso che aumenta man mano per gli elementi rimasti (il numero dei campioni è in questo caso pari a N N! = Attenzione: ogni elemento disponibile, comunque, n n!( N n)! presenta, ad ogni stadio di campionamento, l equiprobabilità di essere estratto! Nell esempio precedente, avremmo: I estrazione: 1/500 II estrazione: 1/499 III estrazione: 1/488... Ecc.

I risultati di queste estrazioni NON sono indipendenti giacché ciascuna dipende dalla precedente. AFFIDABILITA ED EFFICENZA Lo studio di un campione non è fine a se stesso, ma serve per risalire alle caratteristiche della popolazione alla quale si riferisce, per esempio attraverso stime dei parametri riassunti nella seguente tabella: Popolazione (PARAMETRI) Campione (STATISTICHE o STIME) Indicatore Media μ x Deviazione σ s Varianza σ 2 s 2 Ampiezza N n SONO TUTTE COSTANTI SONO TUTTE VARIABILI ALEATORIE. che formano una Distribuzione Campionaria Guardiamo per esempio la media. Da un lato, abbiamo la media μ della popolazione, dall altro la media stimata x proveniente da campioni aleatori. La differenza tra queste due medie (supposte non uguali) prende il nome di errore di campionamento, che è una misura di affidabilità del campionamento. Per quanto riguarda l efficenza, essa è legata al costo: un campionamento è più efficiente di un altro se, a parità di affidabilità, è meno costoso.

TIPI DI CAMPIONAMENTO CAMPIONAMENTO CASUALE SEMPLICE A UNO O PIU STADI Ha il proprio principio nella casualità delle estrazioni. Per l estrazione casuale si adottano i numeri casuali. Ogni numero casuale è composto da 5 cifre estratte casualmente dall insieme delle 10 cifre (0,1,2...9). Queste 5 cifre hanno le seguenti proprietà: Sono indipendenti, ovvero ottenute mediante estrazioni con reimmissione; Ogni cifra ha la stessa probabilità di essere una delle 10 possibili; Ogni gruppo di cifre ha la stessa probabilità di essere 00, 01,...98,99 se coppia, 000, 001,...098,099 se terna, ecc. Il campionamento ad 1 stadio si adotta quando le unità del campione sono facilmente individuabili e l insieme di partenza è limitato. Per esempio: da un insieme di 215 professori, se ne devono scegliere 20 per una Commissione. I numeri aleatori (215) che si attribuiscono sono in questo caso terne: 001, 002,...215. Quindi si può usare una Tavola di numeri casuali scegliendo, nel nostro caso, gruppi da tre e partendo la lettura dall incrocio casuale di una riga e di una colonna. Dei numeri estratti, dobbiamo prendere solo quelli tra 1 e 215 e ciascuno una volta sola, perché l estrazione è logicamente senza reimmissione (si tratta di persone). Ma se la popolazione di partenza è costituita da molti elementi, questo metodo non è più idoneo. Nell esempio di un industriale che volesse controllare il grado batterico dei formaggi che produce (e che non può ovviamente farlo per tutta la produzione), come campionerà? Supponendo che l industria lavori 200 giorni all anno per otto ore al giorno e che produca migliaia di pezzi di formaggio, sarà necessario un campionamento multiplo, che suddivida la popolazione in sottogruppi via via sempre meno complessi. Per esempio: 1 stadio: scelta (casuale) di alcuni giorni tra i duecento; poniamo 50; 2 stadio: scelta (casuale) di 1 delle 8 ore lavorative, numerando le ore da 0 a 7; 3 stadio: all interno di quell ora, scelta delle porzioni di formaggio da esaminare.

CAMPIONAMENTO STRATIFICATO La stratificazione è la suddivisione dell insieme di partenza in gruppi (strati); ciascuno strato riunisce tutti gli elementi della popolazione che hanno un carattere in comune (fattore di stratificazione). Per esempio, il carattere professione come fattore di stratificazione potrebbe essere suddiviso in 6 strati: professionisti, impiegati privati, impiegati pubblici, artigiani, commercianti, disoccupati. Una volta stratificata la popolazione, bisogna estrarre unità campionarie (dette campi di indagine) da ogni strato. Il numero degli elementi per ogni campione deve essere proporzionale alla dimensione dello strato rispetto alla popolazione (criterio di proporzionalità); per esempio, se lo strato 1 riunisce il 5% della popolazione, bisogna estrarre da questo strato un numero di elementi pari al 5% del campione.

Esempio: Si fa un indagine su studenti così ripartiti per corsi: 1 anno 420 30% 2 anno 280 20% 3 anno 210 15% 4 anno 210 15% 5 anno 182 13% fuori corso 98 7% totale 1400 100% Si decide per un campione di 200 elementi. In questi 200 studenti, ce ne dovranno essere: il 30% del 1 anno = 60 il 20% del 2 anno = 40 il 15% del 3 anno = 30 il 15% del 4 anno = 30 il 13% del 5 anno = 26 il 7% dei fuori corso = 14 I vantaggi della stratificazione sono evidenti per popolazioni eterogenee, nel senso che si assicura la partecipazione omogenea di ogni strato al campione finale. Quindi, possiamo dire che la stratificazione riduce gli errori dovuti allo sbilanciamento del campione (sbilanciamento = partecipazione insufficiente o preponderante dei suoi elementi).

CAMPIONAMENTO A GRAPPOLI Questo campionamento si utilizza di solito per popolazioni molto vaste. In questo campionamento, gli elementi non vengono estratti uno alla volta ma per sottogruppi (grappoli) legati da criteri comuni: negozi di una certa zona, dati raccolti in uno stesso periodo, ecc). DIFFERENZA TRA STRATIFICATO E GRAPPOLO Gli strati sono differenti tra loro, e ciascuno contiene elementi simili (lo strato degli impiegati - tutti impiegati - è diverso dallo strato dei commercianti - tutti commercianti -). I grappoli, invece, sono simili tra loro (tanto che ciascuno dovrebbe tendere a rappresentare da solo l intera popolazione) e ciascuno contiene elementi con caratteristiche diverse: una famiglia è un grappolo di individui (diversi tra loro), un condominio è un grappolo di famiglie (diverse tra loro). Procedura: si sceglie a caso un certo numero di grappoli i cui elementi entrano nel campione (campionamento a 1 stadio); da ogni unità primaria (grappolo) si estraggono unità secondarie che entrano nel campione (campionamento a 2 stadi); si può continuare... Esempio: Si vuole stimare quanti litri di spumante si vende in Italia in un anno. Si possono raggruppare i punti di vendita per province; poi si possono estrarre alcune province (poniamo 8) e si limita lo studio nei punti vendita di queste soltanto (primo campionamento). Per ognuna delle province, si possono estrarre tot punti vendita (poniamo 5- secondo campionamento). In totale, si avranno così 8*5=40 elementi che costituiscono il campione. In genere, il campionamento a grappoli produce informazioni meno affidabili di quello casuale semplice. Nel nostro esempio, se l unità primaria provincia fosse unica e fosse l Emilia, si otterrebbero dati sovradimensionati per la vendita dello spumante perché questa provincia è ad alto tenore economico rispetto alla media nazionale. Tuttavia, i costi di questo campionamento sono ridotti: le unità del grappolo sono in genere molto vicine (i punti vendita della provincia o le province stesse) e ciò riduce costi di spostamento e durata del sondaggio.

CAMPIONAMENTO SISTEMATICO Consiste nell ordinare e numerare gli elementi dell insieme di partenza, e poi estrarne gli elementi per il campione seguendo intervalli regolari. Esempio: da un gruppo di 10.000 elementi, si desidera un campione di 500. Si calcola il rapporto 10000/500 = 20, si numerano i singoli elementi, e se ne preleva uno ogni 20 fino a ottenere il campione desiderato di 500. E importante che il punto di inizio dei prelievi sia scelto a caso (non necessariamente dal primo elemento) giacché così si garantirà l equiprobabilità delle estrazioni. Questo campionamento diventa poco affidabile quando nella popolazione esistono fluttuazioni periodiche. Per esempio, nella stima degli introiti medi di un supermercato non si dovrà scegliere il ciclo di 1 settimana giacché nel campione potrebbero capitare gli incassi di tutti i Sabato o dei lunedi, così come nei periodi pasquali o natalizi.