Campionamento e distribuzione campionaria della media



Documenti analoghi
Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Lezione 2

Campione: Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Università del Piemonte Orientale Corso di laurea in medicina e chirurgia a.a Corso di Statistica Medica Inferenza sulle medie 1

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Distribuzioni campionarie. Antonello Maruotti

Verifica delle ipotesi

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza

Distribuzione normale

Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza

Statistica Inferenziale

Campionamento La statistica media campionaria e la sua distribuzione

Distribuzione Normale

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità

Tipi di variabili. Indici di tendenza centrale e di dispersione

Metodi statistici per le ricerche di mercato

LEZIONI DI STATISTICA MEDICA

Distribuzione Normale

Il campionamento statistico. prof. C.Guida

Intervallo di confidenza.

LA LUNGHEZZA DEI GENI UMANI (Es4.1)

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Campionamento 21/1/2005

Distribuzioni campionarie

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Teorema del Limite Centrale

Utilizzando la terminologia generica di prima, la variabile standardizzata X si calcola quindi

Distribuzione Normale

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

Esercitazioni di statistica

Concetti principale della lezione precedente

Esercitazioni di Statistica

Laboratorio di Probabilità e Statistica

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof.

Esercitazione 8 maggio 2014

LE DISTRIBUZIONI CAMPIONARIE

STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Teorema del Limite Centrale

standardizzazione dei punteggi di un test

Parametri statistici

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

MISURE DI SINTESI 54

STIMA DELLA VARIANZA CAMPIONARIA

Inferenza statistica. Statistica medica 1

SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Campionamento 17/1/2006

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

DISTRIBUZIONI DI CAMPIONAMENTO

Dato che i risultati ottenuti tramite campioni casuali ed esperimenti comparativi sono legati al caso, non possiamo essere certi che le nostre

LEZIONI DI STATISTICA MEDICA

Metodi statistici per le ricerche di mercato

APPUNTI DI STATISTICA INFERENZIALE. Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

Metodi Statistici per il Marketing. #05 Elementi di statistica inferenziale e di teoria dei campioni

Cap. 7 Distribuzioni campionarie

Il campionamento e l inferenza. Il campionamento e l inferenza

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica.

Campionamento e distribuzioni campionarie

SCHEDA DIDATTICA N 7

Cenni di statistica statistica

Esercizi sulle distribuzioni di probabilità.

Teoria e tecniche dei test

Pag. 1 di 9. Fabio Ostanello Dip. Scienze Mediche Veterinarie, Università di Bologna 13/09/ Tecniche di campionamento

tabelle grafici misure di

L indagine campionaria Lezione 3

Esercitazione: La distribuzione NORMALE

Cognome e nome. Distribuzione Gaussiana; Media = 122,4 mmhg; Deviazione standard= 14,28 mmhg

La distribuzione normale

BIN = 15 um l [um] Minimum um. Data_31misure_ l [um] Maximum Points 102, , um 1.3 um

28/10/2010 CAMPIONE STATISTICO. L'errore di campionamento

Confronto tra due popolazioni Lezione 6

Laboratorio di Chimica Fisica. Analisi Statistica

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Statistica inferenziale

Metodi statistici per le ricerche di mercato

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA Paolo Brunori

Matematica con elementi di Informatica

Modelli descrittivi, statistica e simulazione

Si estrae casualmente usando uno schema di campionamento con ripetizione un campione di n=2 misurazioni.

Introduzione all'inferenza Lezione 4

05. Errore campionario e numerosità campionaria

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Test di ipotesi

Teorema del limite centrale TCL

Transcript:

Università del Piemonte Orientale Corso di Laurea in Biotecnologia Corso di Statistica Medica Campionamento e distribuzione campionaria della media 1 Argomenti della lezione - Perché estrarre un campione - Definizione di popolazione e campione - Relazione tra popolazione e campione e proprietà delle statistiche campionarie - Teorema del limite centrale - Applicazioni del teorema del limite centrale

Le statistiche campionarie fanno parte della vita di tutti i giorni: - Il docente interroga un campione di allievi per verificare la comprensione della classe - Il cuoco assaggia un campione di pasta per valutare la cottura - Il farmacologo valuta la risposta ad un farmaco su un campione di pazienti - La ditta di sondaggi prevede l esito delle elezioni interrogando un campione della popolazione - ecc ecc 3 I risultati campionari non interessano di per se ma solo perchè consentono di trarre conclusioni generali valide per tutta la popolazione da cui il campione è stato estratto Questo processo si chiama inferenza statistica

Campionamento ed inferenza sono due processi simmetrici 5 Il percorso dell inferenza statistica si svolge secondo le seguenti fasi: 1 estrazione di un campione della popolazione, calcolo delle statistiche campionarie, cioè dei valori corrispondenti ai dati contenuti nel campione, 3 stima dei parametri nella popolazione in base ai risultati forniti dal campione

Argomenti della lezione - Perché estrarre un campione - Definizione di popolazione e campione - Relazione tra popolazione e campione e proprietà delle statistiche campionarie - Teorema del limite centrale - Applicazioni del teorema del limite centrale 7 Popolazione: insieme di tutti i valori realizzati o possibili di una data variabile insieme che raccoglie tutte le osservazioni possibili, relativamente ad una data variabile o ad un dato fenomeno può essere finita (comunque molto grande) o infinita trattiamo come popolazioni anche insiemi che non sono enumerabili e che si realizzeranno anche nel futuro: es quando ci riferiamo ai malati di una certa malattia vogliamo formulare una previsione valida anche per i casi che non sono ancora stati diagnosticati

9 Campione: raccolta finita di elementi estratti da una popolazione scopo dell estrazione è quello di ottenere informazioni sulla popolazione pertanto il campione deve essere rappresentativo della popolazione da cui viene estratto ( non viziato ) per corrispondere a queste esigenze il campione viene individuato con un campionamento casuale 1

11 Secondo quali modalità possiamo estrarre un campione? (rif capitolo ) - Campionamento casuale semplice - Campionamento stratificato - Campionamento a grappolo (a cluster) 1

In un campionamento casuale semplice tutti gli individui nella popolazione hanno uguale probabilità di essere inclusi nel campione - individui nella popolazione = "unità di campionamento" - popolazione oggetto dello studio = "popolazione bersaglio" - popolazione effettivamente campionabile (al netto dell'effetto di fattori di selezione) = base di campionamento - distorsioni di selezione= errori che rendono non uniforme la probabilità di essere inclusi nel campione (es un campionamento condotto con l'uso dell'elenco telefonico esclude le famiglie senza telefono, pertanto la popolazione bersaglio e la base di campionamento potrebbero non corrispondere, causando una distorsione di selezione) 13 Nella pratica del campionamento debbo disporre di una base di campionamento La base di campionamento corrisponde all elenco dei soggetti da cui materialmente estraggo il campione La base di campionamento deve corrispondere ad un elenco (lista) di individui identificabili Se la base di campionamento e la popolazione bersaglio discordano, si verifica una distorsione di selezione 1

Assunzioni per la validità del campionamento I metodi della statistica campionaria assumono che: - non vi siano errori sistematici (bias) di selezione - la base di campionamento corrisponda alla popolazione bersaglio (approfondimento individuale, pp 3-3 del testo) 15 Il campionamento viene di solito condotto predefinendo la dimensione del campione Si calcola quindi la frazione di campionamento, cioè la probabilità che un dato individuo sia estratto ed inserito nel campione Data una popolazione con N individui ed un campione di c individui (dove N è molto grande rispetto a c) la probabilità per l i-esimo individuo è c/n Frazione di campionamentoψ = dimensione del campione dimensione della popolazione 1

Nel campionamento casuale semplice la stessa frazione di campionamento viene applicata a tutta la popolazione Se la frazione di campionamento è piccola (c << N), Ψ si mantiene praticamente costante anche se i soggetti campionati escono dalla popolazione Altrimenti Ψ varia nel corso del campionamento ed occorre tenerne conto applicando una correzione (Correzione per la popolazione finita) 17 Se Ψ > 5 ES (della media campionaria) = ES = σ * c N N c 1 1

Altri schemi di campionamento (studio individuale, pp 3-3 del testo) - Campionamento sistematico; - Campionamento stratificato; - Campionamento a cluster ( grappolo); - Campionamento non probabilistico 19 Metodi sconsigliati - Il campionamento sistematico ("a passo fisso", es una osservazione ogni 1) -> potrebbe nascondere distorsioni di selezione - - Campionamento non probabilistico (Metodi non formalizzati, a casaccio, es alcuni dei pazienti in ambulatorio, senza criterio preciso) -> non è un campionamento

Campionamento stratificato N nella popolazione N nel campione Frazione di campionamento Strato 1 Maschi N1 C1 ψ 1 Strato Femmine N C ψ Obiettivi : 1voglio che tutti gli strati siano rappresentati nel campione con numerosità sufficiente voglio controllare la proporzione dei soggetti nei diversi strati, non lasciandola esposta alla variabilità casuale 1 Esempio: in uno studio epidemiologico su tumore polmonare voglio maschi e femmine siano rappresentati con la stessa numerosità La frequenza relativa nella popolazione dei casi di tumore polmonare è di 1 uomini : 1 donna Con un campione casuale semplice mi aspetto di trovare solo il 1% di donne Procedo quindi ad un campionamento stratificato

Base di campionamento: i casi di tumore polmonare incidenti (cioè di nuova diagnosi) nella popolazione di Torino negli anni 1993-9 Debbo includere nel campione 1 uomini e 1 donne N nella N Frazione di campionamento popolazione campione Strato 1 Maschi 3355 1 1 / 3355 =,9 Strato Femmine 7 1 1 / 7 =,111 3 Il campionamento a grappolo (anche detto a cluster) Esempio: voglio verificare l efficacia di due diversi trattamenti per la disassuefazione dal fumo Entrambi i trattamenti devono essere proposto dal medico di base Procedo in due fasi: 1 campione dei medici (1 medici tra tutti i medici di base di Novara) campione degli assistiti dei medici campionati nella fase 1 ( assistiti per ciascun medico) Totale del campione : 1 medici x assistiti = assistiti

5

7

Schema di campionamento a grappolo campione 9 Argomenti della lezione - Perché estrarre un campione - Definizione di popolazione e campione - Relazione tra popolazione e campione e proprietà delle statistiche campionarie - Teorema del limite centrale - Applicazioni del teorema del limite centrale 3

Un campione casuale corrisponde alla popolazione? Definiamo statistica campionaria la statistica calcolata per le osservazioni che compongono il campione In generale, le statistiche campionarie sono definite in modo tale da essere degli stimatori non distorti della statistica calcolata per la popolazione 31 Il campione casuale corrisponde alla popolazione? Esaminiamo il caso della media campionaria (la media calcolata per le osservazioni che compongono il campione) Un campione casuale ha le seguenti proprietà: - Il valore atteso della media calcolata sul campione (media campionaria) è la media della popolazione, in altre parole la media campionaria è una stima non distorta della media della popolazione 3

n=9 campioni da Norm (;1) 33 E per quanto riguarda la varianza campionaria? Il valore atteso della varianza campionaria (calcolata con n-1) è la varianza della popolazione, in altre parole la varianza campionaria (calcolata con n-1) è una stima non distorta della varianza della popolazione 3

La stima fornita dal singolo campione è comunque affetta da incertezza, a causa dell'errore casuale del campionamento In generale quindi possiamo dire che la precisione della stima fornita da un campione (stima campionaria) sarà maggiore con: - inferiore variabilità nella popolazione; - maggiore dimensione del campione 35 Vediamo alcuni esempi relativi alle proprietà dei campioni n = 9 3

Con campioni più grandi la distribuzione delle medie campionarie ha variabilità inferiore n = 37 Argomenti della lezione - Perché estrarre un campione - Definizione di popolazione e campione - Relazione tra popolazione e campione e proprietà delle statistiche campionarie - Teorema del limite centrale - Applicazioni del teorema del limite centrale 3

La distribuzione di probabilità dei valori delle medie campionarie Immaginiamo di ripetere un campionamento per molte volte Per ciascuno dei campioni calcoliamo la media (la media campionaria ) Calcoliamo media e deviazione standard delle medie campionarie Esaminiamo alcuni esempi di risultati con strumenti grafici: 39

1 La forma della distribuzione di frequenza delle medie campionarie è gaussiana - - - Questo vale anche quando la popolazione da cui è stato estratto il campione ha una distribuzione non gaussiana

3 Variabilità della distribuzione delle medie campionarie - La deviazione standard della distribuzione delle medie campionarie è indicata come Errore Standard della Media (abbreviato in Errore Standard o ES)

ES dipende dalla variabilità nella popolazione e dalla dimensione campionaria E S = σ n 5 variabilità nella E S = σ n popolazione dimensione del campione

La distribuzione delle medie campionarie è una distribuzione Gaussiana con media µ e deviazione standard σ / n Applicando le proprietà della distribuzione Gaussiana posso calcolare la probabilità di estrarre un campione di dimensione n con media campionaria >= X dati media µ e deviazione standard σ della popolazione 7 La formula è analoga a quella studiata nella precedente lezione sulla distribuzione gaussiana dove: x: media campionaria µ: media nella popolazione σ / n: errore standard x µ Z = σ n Z: deviata normale standardizzata Il valore di probabilità corrispondente al valore Z si legge dalla tabella della distribuzione normale standard

Esempio: Studio della pressione sistolica in un gruppo di 15 pazienti I pazienti appartengono ad una popolazione con media della pressione sistolica 15 mmhg La deviazione standard della misura della pressione della popolazione è pari a 5,9 mmhg; n = 15 Media campionaria 1 mmhg 9 Il calcolo del test Z = ( X - µ)/ (σ/ n) Z = (1-15) / (5,9/ 15) = = 1,9 Conclusione =? 5

51 Distribuzione normale standardizzata Area sottesa alla curva tra Z e Z,,1,,3,,5,,7,,9,,5,91,9,3,5,,7,71,1,1,1,17,5,5,,33,3,3,351,5,5,,7,13,19,95,517,19,3973,3935,397,3591,3,39,37,37,377,393,3317,359,3559,35197,37,,35,39,337,333,3997,33,37,3191,3151,317,5,35,353,3153,9,9,911,77,3,9,77,,75,793,73,35,19,575,53,513,5,51,7,19,35,357,37,95,3,33,5,177,17,,11,97,11,37,5,197,199,1915,193,173,9,1,111,1779,1719,1731,171,153,1,135,119 1,,15,155,153,15151,1917,1,157,131,17,137 1,1,1357,1335,1313,19,171,157,13,11,119,117 1,,1157,1131,1113,1935,179,155,133,1,17,953 1,3,9,951,93,917,91,51,9,53,379, 1,,7,797,77,73,793,7353,715,77,9,11 1,5,1,55,,31,17,57,593,51,575,559 1,,5,537,5,5155,55,97,,7,,551 1,7,57,33,7,1,93,,39,33,375,373 1,,3593,3515,33,33,3,31,31,37,35,93 1,9,7,7,73,,19,559,5,,35,33,,75,,19,11,,1,197,193,17,131 5

,1,17,173,17,159,11,157,1539,15,13,1,,139,1355,131,17,155,1,1191,11,113,111,3,17,1,117,99,9,939,91,9,,,,,79,77,755,73,71,95,7,57,39,5,1,,57,57,55,539,53,5,9,,,,53,,7,15,,391,379,3,357,7,37,33,3,317,37,9,9,,7,,,5,,,33,,19,1,5,199,193,9,17,11,175,19,1,159,15,19,1,139 3,,135,131,1,1,11,11,111,17,1,1 3,1,97,9,9,7,,,79,7,7,71 3,,9,,,,,5,5,5,5,5 3,3,,7,5,3,,,39,3,3,35 3,,3,3,31,3,9,,7,,5, 3,5,3,,,1,,19,19,1,17,17 3,,1,15,15,1,1,13,13,1,1,11 3,7,11,1,1,1,9,9,,,, 3,,7,7,7,,,,,5,5,5 3,9,5,5,,,,,,,3,3 53 Conclusione / riepilogo Il valore atteso della media campionaria è la media della popolazione Il valore atteso della varianza campionaria calcolata con il denominatore (n-1) è la varianza della popolazione La variabilità della distribuzione delle medie campionarie è inferiore alla variabilità nella popolazione Campioni più grandi avranno distribuzione con variabilità inferiore La deviazione standard delle medie campionarie viene indicata anche come Errore Standard La forma della distribuzione di frequenza delle medie campionarie è normale Questo accade anche se la distribuzione nella popolazione non è normale, purchè il campione sia abbastanza numeroso 5

La dimostrazione di questi teoremi va oltre i limiti del corso In appendice trovate un esempio ed alcuni grafici corrispondenti ai risultati di campionamenti ripetuti a partire da una distribuzione uniforme, per confermare come anche in questo caso la distribuzione delle medie campionarie segue le regole precedenti 55 Possiamo applicare queste regole per risolvere due problemi importanti e ricorrenti - Qual'è il valore della media campionaria che delimita una certa proporzione (α) della distribuzione di probabilità della media campionaria? - Calcolo dell'intervallo di confidenza - Calcolo della dimensione minima di un campione 5

Qual'è il valore della media campionaria che delimita una certa proporzione (α) della distribuzione campionaria della media? Risolvo per x l'equazione Z α x µ = ES x = µ + ES Z α Z α è il valore della distribuzione normale standard corrispondente al valore di probabilità α e viene letto dalle tavole della distribuzione normale standard partendo da - Ad esempio, il valore Z, 1 (corrispondente alla probabilità,1 con riferimento alla sola coda inferiore) è - 1, 57 Esempio: Qual'è il valore medio di altezza che delimita il 95% della distribuzione di probabilità delle medie campionarie (in una sola coda della distribuzione) di campioni di 5 soggetti estratti da una popolazione con µ=17 cm e σ=15, cm? ES=15, / 5 = 3, Z, 95 = 1, x = 17 + 3, 1, = 17 +,9 = 17,9 5

Pertanto, un campione di 5 soggetti con media campionaria > 17,9 cm potrà essere estratto dalla popolazione data solo con probabilità inferiore a 5% Distribuzione di probabilità delle medie campionarie n=5 popolazione Norm( 17; 15,) 59 Esempio: Quali sono i valori delle medie campionarie di altezza che, in modo simmetrico rispetto alla media della popolazione, delimitano il 95% della distribuzione campionaria delle medie, data una popolazione con µ=17 cm e σ=15, cm e campioni di 5 soggetti? Corrisponde a chiedere quali sono i valori di altezza che delimitano il,5% ed il 97,5% della distribuzione campionaria delle medie

Individuiamo sulle tavole i valori Z di interesse: p(inf) =,5 -,95/ =,5 Z, 5 = -1,9 p(sup)=,5 +,95/ =,975 Z, 975 = +1,9 1 ES=15, / 5 = 3, Z, 5 = -1,9 Z, 975 = +1,9 limite inferiore x = µ + Z 5 * ES = 17 1,9*3 = 17 5, = 1, 1 limite superiore x = µ + Z 975 * ES = 17 + 1,9* 3 = 17 + 5, = 175, - Pertanto avremo il 95% di probabilità che un campione casuale di 5 soggetti, estratto da una popolazione con µ=17 cm e σ=15, cm abbia media campionaria compresa tra 1,1 e 175,

Distribuzione di probabilità delle medie campionarie n=5 popolazione Norm( 17; 15,) 3 Quale deve essere la dimensione minima di un campione? Prima di estrarre un campione voglio sapere quale deve essere la sua numerosità Voglio cioè sapere quanto deve essere grande un campione per estrarre con probabilità nota campioni compresi entro un dato intervallo intorno alla media della popolazione Fissiamo ad esempio la probabilità al 9%

La soluzione del problema corrisponde a trovare i valori di n che soddisfano la seguente equazione p[(µ- )<= x <=(µ+ )] =,9 Attraverso alcuni passaggi algebrici l'equazione diventa: n p σ <= Z <= n σ =,9 5 I passaggi algebrici (per chi fosse interessato) p[(- )<= x -µ<=(+ )] =,9 p[(- )<= x -µ<=(+ )] =,9 p p σ p ( ) ( x µ ) <= <= =, 9 ES ES ES ( ) ( x µ ) <= <= =, 9 n n ( ) σ σ <= n Z <= σ n σ n =,9

La soluzione dell'equazione corrisponde alla soluzione delle due equazioni: ( ) n Z α = σ e Z α n = σ Se l'intervallo intorno alla media è simmetrico basta risolverne una n = Zα n = Zα σ σ Attenzione: per risolvere l'equazione debbo conoscere σ ma non µ 7 I valori noti nell'equazione: Z α è il valore Z corrispondente all'errore di primo tipo che siamo disposti ad accettare, distribuito in modo simmetrico nelle due code della distribuzione gaussiana (In questa lezione non abbiamo ancora parlato degli errori statistici di primo e di secondo tipo) σ = deviazione standard, deve essere nota o ipotizzata = corrisponde alla precisione desiderata della stima campionaria

Ad esempio, intendo condurre uno studio campionario per stimare l'altezza di una popolazione Quanto deve essere grande il mio campione perchè con probabilità del 95% il suo valore sia compreso intorno alla media della popolazione +- 5 cm? La deviazione standard è 5 cm n = Zα σ I valori noti nell'equazione: Z α = Z,5 = 1, 9 ; σ = 5 ; = 5 1,9 5 n = =9, 5 9 Applicazione: Metodo consigliato per l estrazione di piccoli campioni da gruppi non troppo numerosi: tavola dei numeri casuali Procedura per il campionamento con tavola dei numeri casuali: 1 Le osservazioni che compongono la popolazione (anche detta base di campionamento) vengono numerate in ordine progressivo da 1 a N; Viene scelto un punto di partenza sulla tavola dei numeri casuali (es a occhi chiusi si segna un punto); 3 Viene letto ( estratto ), a partire dal punto così individuato, un numero di M cifre, dove M è pari al numero di cifre del numero totale di osservazioni nella popolazione (es se la popolazione è di 3 persone useremo numeri di 3 cifre, se di 5 persone useremo numeri di cifre); 7

Viene inclusa nel campione l osservazione con numero progressivo pari al numero estratto; se il numero estratto è superiore a N si estrae un altro numero 5 Si ripete la procedura leggendo i numeri successivi dalla tavola, fino a che non è stato estratto il numero richiesto di osservazioni Le tavole dei numeri casuali possono essere prodotte con appositi programmi di calcolo 71 Tavola dei numeri casuali (esemplificativa) 3339 7 3375 153 9 7971 9577 5 1391 3 755 311 771 57 719 31 17 7533 33 33 9577 955 55 1395 75 3379 95 3355 19 739 155 93 915 53 1 9991 1935 15 991 99759 9793 35 155 159 571 713 75 33 935 717 133 71 71 933 37 977 79 911 5573 5 79 937 59 337 7 1735 919 9593 9 71 5 37 593 39 913 31 75 93 13 5 579 91 35 513 73 3 11 3 5335 59 597 97 7359 55535 55 955 3 797 999 1 7 9 59 1 7973 99 77311 577 597 75 7 73 99 519 1 5593 7937 151 139 9 511 191 177 11 11 51 575 931 11 371 759 195 597 175 991 55 9 3933 593 19 5 59 35 7511 1933 191 39 113 93 353 595 5 5 957 71 99 357 77 91 559 715 51 5 173 717 995 39 53377 3173 9 313 355 1793 317 9179 79 77 7 1 1 113 7937 19 75 33 9 917 35 11111 3311 13775 5533 95 13 73 51 91 377 193 537 19 37 97 795 7 359 3359 97 1957 371 5173 13 15 7735 33 351 71 3175 55 75 715 735 77737 933 7535 3135 93 177 573 7 3 91 115 9 55 39 51199 13 975 393 71 13 57 1991 9 333 9117 111 39 3 959 197 517 15 35 73 193 139 195 1 11 3 9537 357 173 151 55 37 51 951 97 1 3133 193 539 55 35 357 1553 31 139 51 5 7953 1773 97731 3 35 11 1 599 1 9 79 1 7331 39 717 7 171 755 915 399 35 955 19 599 59 5 139 93 9519 7557 33 11 39 935 579 395 99 75 55 5 1 99 551 15 5713 193 593 7

Esempio: estrazione di un campione di 1 soggetti da una base di 15 La base è elencata nella tabella allegata Dovrò scegliere numeri di 3 cifre Decido che procederò progressivamente per colonna, dall alto in basso In modo casuale individuo il punto sottolineato come punto di partenza I successivi valori inferiori a 15 sono annotati in grassetto I valori, 11,, 5, corrispondono ai soggetti da campionare Tali soggetti sono evidenziati nella tabella successiva con indicati i valori di emoglobina 73 Tavola dei numeri casuali 3339 7 3375 153 9 7971 9577 5 1391 3 755 311 771 57 719 31 17 7533 33 33 9577 955 55 1395 75 3379 95 3355 19 739 155 93 915 53 1 9991 1935 15 991 99759 9793 35 155 159 571 713 75 33 935 717 133 71 71 933 37 977 79 911 5573 5 79 937 59 337 7 1735 919 9593 9 71 15 37 593 39 913 31 75 93 13 5 579 91 35 513 73 3 11 3 5335 59 597 97 7359 55535 55 955 3 797 999 1 7 9 59 1 7973 99 77311 577 597 75 7 73 99 519 1 5593 7937 151 139 9 511 191 177 11 11 51 575 931 11 371 759 195 597 175 991 55 9 3933 593 19 5 59 35 7511 1933 191 39 113 93 353 595 5 5 957 71 99 357 77 91 559 715 51 5 173 717 995 39 53377 3173 9 313 355 1793 317 9179 79 77 7 1 1 113 7937 19 75 33 9 917 35 11111 3311 13775 5533 95 13 73 51 91 377 193 537 19 37 97 795 7 359 3359 97 1957 371 5173 13 15 7735 33 351 71 3175 55 75 715 735 77737 933 7535 3135 93 177 573 7 3 91 115 9 55 39 51199 13 975 393 71 13 57 1991 9 333 9117 111 39 3 959 197 517 15 35 73 193 139 195 1 11 3 9537 357 173 151 55 37 51 951 97 1 3133 193 539 55 35 357 1553 31 139 51 5 7953 1773 97731 3 35 11 1 599 1 9 79 1 7331 39 717 7 171 755 915 399 35 955 19 599 59 5 139 93 9519 7557 33 11 39 935 579 395 99 75 55 5 1 99 551 15 5713 193 593 7

Numero Hb progressivo 1 19 133 3 133 13 5 13 13 7 13 13 9 137 1 137 11 137 1 137 13 13 1 13 15 13 1 13 17 139 1 139 19 139 139 1 139 1 3 1 11 5 11 11 7 11 11 9 11 3 11 31 11 3 11 33 11 3 1 35 1 3 1 37 1 3 1 39 1 1 1 1 1 3 1 1 5 1 1 7 13 13 9 13 5 13 51 13 5 13 53 13 5 13 55 13 5 13 57 1 5 1 59 1 1 Numero Hb progressivo 1 1 1 3 1 1 5 15 15 7 15 15 9 15 7 15 71 15 7 15 73 1 7 1 75 1 7 1 77 17 7 17 79 17 17 1 17 17 3 17 1 5 1 1 7 1 1 9 19 9 19 91 19 9 19 93 19 9 19 95 19 9 19 97 19 9 19 99 19 1 15 11 15 1 15 13 15 1 15 15 15 1 15 17 15 1 15 19 151 11 151 111 151 11 151 113 151 11 151 115 151 11 151 117 151 11 151 119 151 75

Esercizi dal testo pag 11 n 1 pag 11 n pag 11 n 3 pag 1 n pag 1 n 5 pag 1 n pag 1 n pag 1 n 13 77 Altri esercizi ESERCIZIO 1 La tabella allegata include i valori di 1 misure di emoglobina espresse in decigrammi/1 ml, ordinati in modo crescente Estrarre un campione casuale di 1 osservazioni utilizzando la tavola dei numeri casuali Calcolare Media e deviazione standard 1 1 15 1 1 1 1 1 19 19 19 19 13 131 131 131 131 131 131 13 13 13 13 13 13 13 13 133 133 133 133 133 133 133 133 13 13 13 13 13 13 13 13 13 13 13 13 13 135 135 135 135 135 135 135 135 135 135 135 135 135 135 135 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 137 137 137 137 137 137 137 137 137 1 137 137 137 137 137 137 137 137 137 137 137 137 137 137 137 137 137 137 137 137 1 137 137 137 137 137 137 13 13 13 13 13 13 13 13 13 13 13 13 13 13 1 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 139 139 139 139 1 139 139 139 139 139 139 139 139 139 139 139 139 139 139 139 139 139 139 139 139 1 139 139 139 139 139 139 139 139 139 139 139 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3 1 1 1 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 3 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 3 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 5 15 15 15 15 15 15 15 15 15 15 15 15 15 15 1 1 1 1 1 1 5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 5 1 1 1 1 1 1 1 1 1 1 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 19 19 19 19 19 19 19 19 7 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 7 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 7 19 19 19 19 19 19 19 15 15 15 15 15 15 15 15 15 15 15 15 15 7 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 7 15 15 15 15 15 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 151 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 9 153 153 153 153 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 9 15 15 15 15 15 15 15 15 155 155 155 155 155 155 155 155 155 155 155 155 9 155 155 155 155 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 9 15 15 15 15 157 157 157 157 157 157 157 157 157 157 157 15 15 15 15 15 9 159 159 159 159 159 159 159 159 159 159 159 1 1 11 11 11 11 1 15 1 7

Tavola dei numeri casuali 3339 7 3375 153 9 7971 9577 5 1391 3 755 311 771 57 719 31 17 7533 33 33 9577 955 55 1395 75 3379 95 3355 19 739 155 93 915 53 1 9991 1935 15 991 99759 9793 35 155 159 571 713 75 33 935 717 133 71 71 933 37 977 79 911 5573 5 79 937 59 337 7 1735 919 9593 9 71 5 37 593 39 913 31 75 93 13 5 579 91 35 513 73 3 11 3 5335 59 597 97 7359 55535 55 955 3 797 999 1 7 9 59 1 7973 99 77311 577 597 75 7 73 99 519 1 5593 7937 151 139 9 511 191 177 11 11 51 575 931 11 371 759 195 597 175 991 55 9 3933 593 19 5 59 35 7511 1933 191 39 113 93 353 595 5 5 957 71 99 357 77 91 559 715 51 5 173 717 995 39 53377 3173 9 313 355 1793 317 9179 79 77 7 1 1 113 7937 19 75 33 9 917 35 11111 3311 13775 5533 95 13 73 51 91 377 193 537 19 37 97 795 7 359 3359 97 1957 371 5173 13 15 7735 33 351 71 3175 55 75 715 735 77737 933 7535 3135 93 177 573 7 3 91 115 9 55 39 51199 13 975 393 71 13 57 1991 9 333 9117 111 39 3 959 197 517 15 35 73 193 139 195 1 11 3 9537 357 173 151 55 37 51 951 97 1 3133 193 539 55 35 357 1553 31 139 51 5 7953 1773 97731 3 35 11 1 599 1 9 79 1 7331 39 717 7 171 755 915 399 35 955 19 599 59 5 139 93 9519 7557 33 11 39 935 579 395 99 75 55 5 1 99 551 15 5713 193 593 79 Esercizio Immaginiamo di voler estrarre un campione casuale stratificato per sesso dalla popolazione in tabella, includendo uomini e 1 donne Completare la tabella ed indicare la frazione di campionamento complessiva per gli uomini e per le donne Indicate la probabilità di essere inclusi nel campione, separatamente per uomini e donne Strato N nella popolazione N campione Frazione di campionamento Maschi 3355 Femmine 7

1 Appendice L istogramma presenta la distribuzione di frequenza di 1 osservazioni distribuite in modo uniforme La variabile considerata assume i soli valori interi tra e 9 L esempio è analogo a quello presentato nel testo di PArmitage e GBerry Statistical Methods in Medical Researchs (editaliana McGraw-Hill) Alcune statistiche descrittive della Variabile I N 1 Mean 5 Std Deviation 795 Variance 55 Skewness Kurtosis -13 FREQUENCY 1 3 5 7 9 1 popol azi one 1 1 1 1 1 3 3 3 3 3 5 5 5 5 5 7 7 7 7 7 9 9 9 9 9 1

Sono stati estratti campioni, tutti di numerosità 5 osservazioni da tale popolazione Le statistiche e gli istogrammi si riferiscono alla distribuzione di questi campioni La variabile considerata è la media campionaria della variabile I, indicata per convenienza come md Variable: md Osserviamo che: N -> numero di campioni (ciascuno costituisce un osservazione) Mean 5 -> media campionaria Errore standard 13 Skewness 1331 Kurtosis -1179 -> il valore si questi indici (non presentati a lezione) corrisponde a quanto atteso per una distribuzione normale 3 Mean 5 La coincidenza di queste statistiche indica che la distribuzione è simmetrica Median Mode

5 PERCENT 1 3 5 7 medi a campi onar i a 1 1 1 1 1 3 3 3 3 3 5 5 5 5 5 7 7 7 7 7 9 9 9 9 9 1 CUMULATI VE PERCENT 1 3 5 7 9 1 medi a campi onar i a 1 1 1 1 1 3 3 3 3 3 5 5 5 5 5 7 7 7 7 7 9 9 9 9 9 1

Ripeto il campionamento con n=9 I risultati principali sono: Mean 55 Errore standard 9135 Variance 93973 Skewness -11 Kurtosis -135 Si noti che l errore standard è inferiore rispetto al precedente esempio 7