CON O SENZA REIMMISSIONE
|
|
|
- Veronica Randazzo
- 9 anni fa
- Visualizzazioni
Transcript
1 CAMPIONAMENTO Per una buona inferenza o induzione statistica, bisogna affrontare il problema del campionamento, ovvero del come raccogliere un campione della popolazione affinché la si possa studiare induttivamente. Per fare questo, intanto il Campione deve essere RAPPRESENTATIVO. La rappresentatività è garantita da una campionamento casuale o aleatorio, in cui cioè ogni elemento della popolazione ha la medesima probabilità di entrare a far parte del campione. Per esempio, avendo una popolazione (finita) di 500 elementi, ognuno di essi avrà una probabilità di essere estratto pari a 1/500, e nessuno di essi ne avrà una differente. Casuale pertanto non significa preso a caso ma equiprobabile. Solo così si può applicare la Teoria della probabilità per inferire correttamente i dati. IL CAMPIONE ALEATORIO Un campione è detto aleatorio quando gli elementi disponibili della popolazione hanno la stessa probabilità di farne parte. Perché ci si riferisce ad elementi disponibili e non semplicemente agli elementi della popolazione? Per rispondere, bisogna tener conto che il campionamento può essere CON O SENZA REIMMISSIONE. Per estrarre un campione casuale si procede così: Si numerano gli elementi (per rendere appunto equiprobabile - come lo sono i numeri - l estrazione) * Si estraggono a caso i numeri associati agli elementi. Ora non resta che scegliere se effettuare reimmissioni o meno. Quando la popolazione è teoricamente infinita e il campione è piccolo, CON O SENZA è ininfluente. Quando la popolazione è finita, la differenza fra i due metodi c è. Per esempio, con una popolazione di 500 elementi, ogni elemento che viene estratto con reimmissione ha P=1/500 e si dice che i relativi risultati delle estrazioni sono indipendenti. Ciascuna delle unità potrà essere estratta più volte. (SI DICE ESTRAZIONE BERNOULIANA e il numero dei campioni ottenuti è pari a D N,n =N n ) Con una estrazione senza reimmissione, invece, ad ogni estrazione la probabilità cambia, nel senso che aumenta man mano per gli elementi rimasti (il numero dei campioni è in questo caso pari a N N! = Attenzione: ogni elemento disponibile, comunque, n n!( N n)! presenta, ad ogni stadio di campionamento, l equiprobabilità di essere estratto! Nell esempio precedente, avremmo: I estrazione: 1/500 II estrazione: 1/499 III estrazione: 1/ Ecc.
2 I risultati di queste estrazioni NON sono indipendenti giacché ciascuna dipende dalla precedente. AFFIDABILITA ED EFFICENZA Lo studio di un campione non è fine a se stesso, ma serve per risalire alle caratteristiche della popolazione alla quale si riferisce, per esempio attraverso stime dei parametri riassunti nella seguente tabella: Popolazione (PARAMETRI) Campione (STATISTICHE o STIME) Indicatore Media μ x Deviazione σ s Varianza σ 2 s 2 Ampiezza N n SONO TUTTE COSTANTI SONO TUTTE VARIABILI ALEATORIE. che formano una Distribuzione Campionaria Guardiamo per esempio la media. Da un lato, abbiamo la media μ della popolazione, dall altro la media stimata x proveniente da campioni aleatori. La differenza tra queste due medie (supposte non uguali) prende il nome di errore di campionamento, che è una misura di affidabilità del campionamento. Per quanto riguarda l efficenza, essa è legata al costo: un campionamento è più efficiente di un altro se, a parità di affidabilità, è meno costoso.
3 TIPI DI CAMPIONAMENTO CAMPIONAMENTO CASUALE SEMPLICE A UNO O PIU STADI Ha il proprio principio nella casualità delle estrazioni. Per l estrazione casuale si adottano i numeri casuali. Ogni numero casuale è composto da 5 cifre estratte casualmente dall insieme delle 10 cifre (0,1,2...9). Queste 5 cifre hanno le seguenti proprietà: Sono indipendenti, ovvero ottenute mediante estrazioni con reimmissione; Ogni cifra ha la stessa probabilità di essere una delle 10 possibili; Ogni gruppo di cifre ha la stessa probabilità di essere 00, 01,...98,99 se coppia, 000, 001,...098,099 se terna, ecc. Il campionamento ad 1 stadio si adotta quando le unità del campione sono facilmente individuabili e l insieme di partenza è limitato. Per esempio: da un insieme di 215 professori, se ne devono scegliere 20 per una Commissione. I numeri aleatori (215) che si attribuiscono sono in questo caso terne: 001, 002, Quindi si può usare una Tavola di numeri casuali scegliendo, nel nostro caso, gruppi da tre e partendo la lettura dall incrocio casuale di una riga e di una colonna. Dei numeri estratti, dobbiamo prendere solo quelli tra 1 e 215 e ciascuno una volta sola, perché l estrazione è logicamente senza reimmissione (si tratta di persone). Ma se la popolazione di partenza è costituita da molti elementi, questo metodo non è più idoneo. Nell esempio di un industriale che volesse controllare il grado batterico dei formaggi che produce (e che non può ovviamente farlo per tutta la produzione), come campionerà? Supponendo che l industria lavori 200 giorni all anno per otto ore al giorno e che produca migliaia di pezzi di formaggio, sarà necessario un campionamento multiplo, che suddivida la popolazione in sottogruppi via via sempre meno complessi. Per esempio: 1 stadio: scelta (casuale) di alcuni giorni tra i duecento; poniamo 50; 2 stadio: scelta (casuale) di 1 delle 8 ore lavorative, numerando le ore da 0 a 7; 3 stadio: all interno di quell ora, scelta delle porzioni di formaggio da esaminare.
4 CAMPIONAMENTO STRATIFICATO La stratificazione è la suddivisione dell insieme di partenza in gruppi (strati); ciascuno strato riunisce tutti gli elementi della popolazione che hanno un carattere in comune (fattore di stratificazione). Per esempio, il carattere professione come fattore di stratificazione potrebbe essere suddiviso in 6 strati: professionisti, impiegati privati, impiegati pubblici, artigiani, commercianti, disoccupati. Una volta stratificata la popolazione, bisogna estrarre unità campionarie (dette campi di indagine) da ogni strato. Il numero degli elementi per ogni campione deve essere proporzionale alla dimensione dello strato rispetto alla popolazione (criterio di proporzionalità); per esempio, se lo strato 1 riunisce il 5% della popolazione, bisogna estrarre da questo strato un numero di elementi pari al 5% del campione.
5 Esempio: Si fa un indagine su studenti così ripartiti per corsi: 1 anno % 2 anno % 3 anno % 4 anno % 5 anno % fuori corso 98 7% totale % Si decide per un campione di 200 elementi. In questi 200 studenti, ce ne dovranno essere: il 30% del 1 anno = 60 il 20% del 2 anno = 40 il 15% del 3 anno = 30 il 15% del 4 anno = 30 il 13% del 5 anno = 26 il 7% dei fuori corso = 14 I vantaggi della stratificazione sono evidenti per popolazioni eterogenee, nel senso che si assicura la partecipazione omogenea di ogni strato al campione finale. Quindi, possiamo dire che la stratificazione riduce gli errori dovuti allo sbilanciamento del campione (sbilanciamento = partecipazione insufficiente o preponderante dei suoi elementi).
6 CAMPIONAMENTO A GRAPPOLI Questo campionamento si utilizza di solito per popolazioni molto vaste. In questo campionamento, gli elementi non vengono estratti uno alla volta ma per sottogruppi (grappoli) legati da criteri comuni: negozi di una certa zona, dati raccolti in uno stesso periodo, ecc). DIFFERENZA TRA STRATIFICATO E GRAPPOLO Gli strati sono differenti tra loro, e ciascuno contiene elementi simili (lo strato degli impiegati - tutti impiegati - è diverso dallo strato dei commercianti - tutti commercianti -). I grappoli, invece, sono simili tra loro (tanto che ciascuno dovrebbe tendere a rappresentare da solo l intera popolazione) e ciascuno contiene elementi con caratteristiche diverse: una famiglia è un grappolo di individui (diversi tra loro), un condominio è un grappolo di famiglie (diverse tra loro). Procedura: si sceglie a caso un certo numero di grappoli i cui elementi entrano nel campione (campionamento a 1 stadio); da ogni unità primaria (grappolo) si estraggono unità secondarie che entrano nel campione (campionamento a 2 stadi); si può continuare... Esempio: Si vuole stimare quanti litri di spumante si vende in Italia in un anno. Si possono raggruppare i punti di vendita per province; poi si possono estrarre alcune province (poniamo 8) e si limita lo studio nei punti vendita di queste soltanto (primo campionamento). Per ognuna delle province, si possono estrarre tot punti vendita (poniamo 5- secondo campionamento). In totale, si avranno così 8*5=40 elementi che costituiscono il campione. In genere, il campionamento a grappoli produce informazioni meno affidabili di quello casuale semplice. Nel nostro esempio, se l unità primaria provincia fosse unica e fosse l Emilia, si otterrebbero dati sovradimensionati per la vendita dello spumante perché questa provincia è ad alto tenore economico rispetto alla media nazionale. Tuttavia, i costi di questo campionamento sono ridotti: le unità del grappolo sono in genere molto vicine (i punti vendita della provincia o le province stesse) e ciò riduce costi di spostamento e durata del sondaggio.
7 CAMPIONAMENTO SISTEMATICO Consiste nell ordinare e numerare gli elementi dell insieme di partenza, e poi estrarne gli elementi per il campione seguendo intervalli regolari. Esempio: da un gruppo di elementi, si desidera un campione di 500. Si calcola il rapporto 10000/500 = 20, si numerano i singoli elementi, e se ne preleva uno ogni 20 fino a ottenere il campione desiderato di 500. E importante che il punto di inizio dei prelievi sia scelto a caso (non necessariamente dal primo elemento) giacché così si garantirà l equiprobabilità delle estrazioni. Questo campionamento diventa poco affidabile quando nella popolazione esistono fluttuazioni periodiche. Per esempio, nella stima degli introiti medi di un supermercato non si dovrà scegliere il ciclo di 1 settimana giacché nel campione potrebbero capitare gli incassi di tutti i Sabato o dei lunedi, così come nei periodi pasquali o natalizi.
Il campionamento statistico. prof. C.Guida
Il campionamento statistico prof. C.Guida Per determinare le caratteristiche fondamentali di una popolazione statistica non è sempre necessario analizzare tutta la popolazione, ma risulta sufficiente esaminare
Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1
Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:
Verifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine
10/1 Indagine statistica Indagine Totale Indagine Campionaria Fasi dell indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento individuazione
Statistica descrittiva e statistica inferenziale
Statistica descrittiva e statistica inferenziale 1 ALCUNI CONCETTI POPOLAZIONE E CAMPIONE Popolazione: insieme finito o infinito di unità statistiche classificate secondo uno o più caratteri Campione:
PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo Maria Miceli
PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo 2006 Campionamento Maria Miceli Cos è il campionamento? Procedura attraverso la quale alcuni membri della popolazione sono selezionati come rappresentatitivi
Teoria e tecniche dei test
Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario
Campionamento La statistica media campionaria e la sua distribuzione
Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:
Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.
Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z, riferito
RILEVAZIONI CAMPIONARIE E TECNICHE DI CAMPIONAMENTO. Prof.ssa Maria Carella
RILEVAZIONI CAMPIONARIE E TECNICHE DI CAMPIONAMENTO Prof.ssa Maria Carella [email protected] FASE 1 PROGRAMMAZIONE Fase in cui si predispone il piano di rilevazione Si procede alla: 1. DEFINIZIONE
POPOLAZIONE CAMPIONE
CAMPIONAMENTO 1 POPOLAZIONE Insieme finito o infinito di unità legate da almeno una caratteristica comune, che consenta di stabilire un criterio di appartenenza alla popolazione stessa. Esempio Bambini
05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
LEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di
La progettazione di un indagine statistica
Dip. di Scienze Umane e Sociali [email protected] Outline 1 L indagine campionaria 2 3 Outline 1 L indagine campionaria 2 3 L indagine campionaria [1/2] Principalmente influenzata da: tempi costi
Distribuzioni campionarie. Antonello Maruotti
Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di oggetti (unità di analisi) di ricerca N = ampiezza della popolazione PARAMETRI = caratteristiche della popolazione [media, proporzione
Metodologia Statistica
Metodologia Statistica La metodologia statistica viene suddivisa tradizionalmente in due branche, strettamente collegate Statistica descrittiva indicatori statistici per riassumere realtà complesse Statistica
RICHIAMI DI CALCOLO DELLE PROBABILITÀ
UNIVERSITA DEL SALENTO INGEGNERIA CIVILE RICHIAMI DI CALCOLO DELLE PROBABILITÀ ing. Marianovella LEONE INTRODUZIONE Per misurare la sicurezza di una struttura, ovvero la sua affidabilità, esistono due
Andrea Manganaro. Tecniche di campionamento a confronto per i sistemi di audit regionali
Andrea Manganaro Tecniche di campionamento a confronto per i sistemi di audit regionali Definizione del problema Le regioni finanziano ogni anno diverse attività tramite due fondi europei: il Fondo Europeo
APPUNTI DI STATISTICA INFERENZIALE. Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO
APPUNTI DI STATISTICA INFERENZIALE Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO PREREQUISITI VARIABILE ALEATORIA (QUANTITATIVA): è una funzione che associa un numero reale ad ogni
PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07
PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 006/07 Esercizio 1 Prova scritta del 16/1/006 In un ufficio postale lavorano due impiegati che svolgono lo stesso compito in maniera indipendente, sbrigando
Statistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
Il Campionamento. La popolazione di riferimento
Il Campionamento La popolazione di riferimento La popolazione (o universo) di una ricerca è quell insieme dei casi che teoricamente costituiscono l oggetto di indagine e che hanno in comune almeno una
DISTRIBUZIONI DI CAMPIONAMENTO
DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,
Il Campionamento Statistico
Il Campionamento Statistico Campionamento sistematico (1/2) Introdotto per ovviare ai costi elevati del campionamento casuale e semplice; richiede la selezione casuale soltanto
Il confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
Schema lezione 5 Intervalli di confidenza
Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari
STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA
STATISTICA APPLICATA Prof.ssa Julia Mortera INTRODUZIONE al CAMPIONAMENTO e all INFERENZA STATISTICA Inferenza Statistica Nell inferenza statistica si usano le statistiche campionarie per fare previsioni
standardizzazione dei punteggi di un test
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe
Statistica Corso Base (Serale) Dott.ssa Cristina Mollica
Statistica Corso Base Serale Dott.ssa Cristina Mollica [email protected] Campionamento Esercizio 1. Da una ricerca si è osservato che il peso del prodotto A varia tra i e i 530 grammi. 1 Ipotizzando
Distribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)
Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,
07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni
LA VERIFICA DELLE IPOTESI Popolazioni, campioni, parametri ed indicatori 1 2 3 Popolazioni e campioni Viene definita popolazione o universo l insieme completo di tutti gli elementi che hanno in comune
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Approssimazione normale della Poisson (TLC) In un determinato tratto di strada il numero di incidenti
Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
PROBABILITÀ E STATISTICA - 23 Giugno 2017 Scrivere le risposte negli appositi spazi. Motivare dettagliatamente le risposte su fogli allegati
PROBABILITÀ E STATISTICA - 23 Giugno 2017 Scrivere le risposte negli appositi spazi. Motivare dettagliatamente le risposte su fogli allegati 1. - Un urna contiene 2 palline bianche e 28 nere; da essa vengono
4. Si supponga che il tempo impiegato da una lettera spedita dall Italia per arrivare a destinazione segua una distribuzione normale con media
Esercizi sulle distribuzioni, il teorema limite centrale e la stima puntuale Corso di Probabilità e Inferenza Statistica, anno 007-008, Prof. Mortera 1. Sia X la durata in mesi di una valvola per radio.
Teorema del Limite Centrale
Teorema del Limite Centrale Problema. Determinare come la media campionaria x e la deviazione standard campionaria s misurano la media µ e la deviazione standard σ della popolazione. È data una popolazione
