2. CAMPIONAMENTO CASUALE SEMPLICE 2.1 INTRODUZIONE

Documenti analoghi
Lezione 4. La Variabilità. Lezione 4 1

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

Matematica elementare art.1 di Raimondo Valeri

Caso studio 10. Dipendenza in media. Esempio

Classi di reddito % famiglie Fino a Oltre Totale 100

MEDIA DI Y (ALTEZZA):

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

FUNZIONI LOGICHE FORME CANONICHE SP E PS

Lezione 3. Gruppi risolubili.

Esercizi su Rappresentazioni di Dati e Statistica

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

Capitolo 2 Errori di misura: definizioni e trattamento

Funzioni di più variabili Massimi e Minimi una funzione definita in un insieme E. Un punto ( x0, y0)

Variabili casuali ( ) 1 2 n

CORSO DI STATISTICA I (Prof.ssa S. Terzi) 1 STUDIO DELLE DISTRIBUZIONI SEMPLICI. Esercitazione n 3

Aritmetica 2016/2017 Esercizi svolti in classe Quarta lezione

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti

INDICI DI VARIABILITA

Def. Si dice variabile aleatoria discreta X una variabile che può assumere valori X1, X

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

frazione 1 n dell ammontare complessivo del carattere A x

Il disegno campionario per l indagine sul turismo delle isole Eolie. O. Giambalvo A.M. Milito

Dott.ssa Marta Di Nicola

dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo K, possiamo affermare che:

Indipendenza in distribuzione

Propagazione di errori

ESERCIZI SU DISTRIBUZIONI CAMPIONARIE

COMPLEMENTI DI STATISTICA. L. Greco, S. Naddeo

CORSO DI LAUREA IN ECONOMIA AZIENDALE Metodi Statistici per le decisioni d impresa (Note didattiche) Bruno Chiandotto

corrispondenza della generica i-esima modalità. Indicando con #(.) la cardinalità di un insieme, per esse si ha, rispettivamente:

Sommario. Facoltà di Economia. Obiettivo. Quando studiarla? Lezione n 7. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

TRATTAMENTO STATISTICO DEI DATI ANALITICI

III Esercitazione: Sintesi delle distribuzioni semplici secondo un carattere qualitativo ordinale.

x... Gli indici sintetici La media aritmetica Gli indici sintetici Indici assoluti Indici relativi Indici normalizzati Forma

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER ATTRIBUTI

STATISTICA DESCRITTIVA

CAPITOLO XI STIMA DEI PARAMETRI DI UNA VARIABILE ALEATORIA.

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

Voti Diploma Classico Scientifico Tecn. E Comm Altro

Le misure di variabilità

Modulo di Fisica Tecnica. Differenze finite per problemi di conduzione in regime instazionario

Design of experiments (DOE) e Analisi statistica

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Elementi di Statistica descrittiva Parte III

Numeri complessi Pag. 1 Adolfo Scimone 1998

In questo capitolo vedremo solamente un caso di rendita, che useremo poi per generalizzare le rendite e dedurre tutti gli altri casi.

DI IDROLOGIA TECNICA PARTE II

Indici di Posizione. Gli indici si posizione sono misure sintetiche ( valori caratteristici ) che descrivono la tendenza centrale di un fenomeno

3 Variabilità. variabilità. Senza deviazione dalla norma il progresso non è possibile. (Frank Zappa) Statistica - 9CFU

), mentre l unico intero che divide 0 è 0. Enunciamo alcune proprietà di ovvia dimostrazione.

Analisi di dati vettoriali. Direzioni e orientazioni

Capitolo 4 Le Misure di Centralità

Elementi di Statistica descrittiva Parte II

IL MODELLO DI REGRESSIONE LINEARE MULTIPLA

Riassunto di teoria elementare degli errori

Interpolazione. Definizione: per interpolazione si intende la ricerca di una funzione matematica che approssima l andamento di un insieme di punti.

Attualizzazione. Attualizzazione

SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1

ALCUNI ELEMENTI DI TEORIA DELLA STIMA

UNI CEI ENV (GUIDA ALL ESPRESSIONE DELL INCERTEZZA DI MISURA)

Google, ovvero: come diagonalizzare Internet

Associazione tra due variabili quantitative

Lezione 1. I numeri complessi

Campionamento casuale da popolazione finita (caso senza reinserimento )

CAPITOLO III SISTEMI DI EQUAZIONI LINEARI

Incertezza di misura

Verifica e scelta del modello probabilistico

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

STATISTICA DESCRITTIVA

2 si da eguale peso alle misure senza tener conto dell incertezza, che in generale possono essere diverse.

Premessa. Abbiamo più volte enfatizzato come questo processo di sintesi comporta un prezzo da pagare in termini di perdita di informazioni.

CORSO DI LAUREA IN ECONOMIA AZIENDALE Metodi Statistici per le decisioni d impresa (Note didattiche) Bruno Chiandotto

Appunti di. Elaborazione dei dati sperimentali

ELABORAZIONE DEI DATI

FORMULARIO DI RIFERIMENTO PER IL CALCOLO DELLE INCERTEZZE DI MISURA. F.Silvestrin, V.Talamini

Consentono di descrivere la variabilità all interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche

La distribuzione statistica doppia (o bivariata)

ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.

MISURE E GRANDEZZE FISICHE

Geometria delle aree

Statistica degli estremi

DISTRIBUZIONE DI STUDENT

= Pr{Y > X}. un campione casuale semplice (c.c.s.) di dimensione n x da X e Y1, Y2

La volatilità storica, le misure di rischio asimmetrico e la tracking error volatility

Organizzazione del corso. Elementi di Informatica. Orario lezioni ed esami. Crediti. Dispense e lucidi. Ricevimento studenti

NOTA METODOLOGICA PER L ANALISI DELLE CAUSE DI MORTE

Capitolo 13 Il modello di regressione lineare

Corso TFA - A048 Matematica applicata. Didattica della matematica applicata all economia e alla finanza

Leasing: aspetti finanziari e valutazione dei costi

Algoritmi e Strutture Dati. Alberi Binari di Ricerca

ALCUNI ELEMENTI DI STATISTICA DESCRITTIVA

Esercizi di Statistica per gli studenti di Scienze Politiche, Università di Firenze

RENDITE. Le singole rate possono essere corrisposte all inizio o alla fine di ciascun periodo e precisamente si ha:

STATISTICA Lezioni ed esercizi

Calcolo dei fattori di vista

VARIABILI CASUALI O ALEATORIE

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

Transcript:

. CAMPIOAMETO CASUALE SEMPLICE. ITRODUZIOE Sebbee o sa molto dffuso ella pratca delle dag, l campoameto casuale semplce rappreseta l aturale puto d parteza per lo studo d tutt gl altr dseg campoar. S cosder ua popolazoe d utà dalla quale s debba estrarre u campoe d utà dstte. Il campoameto casuale semplce è la tecca che attrbusce la stessa probabltà d selezoe ad og seme d utà dstte della popolazoe. Cosegue dalla precedete defzoe che ache og sgola utà della popolazoe ha la stessa probabltà d etrare a far parte del campoe. edremo seguto che altr dseg d campoameto possedoo questa ultma propretà, per la quale vegoo dett equprobablstc (terme corrspodete alla sgla epsem usata ella letteratura d lgua glese da equal probablty selecto method), ma essuo d ess l'equprobabltà d estrazoe può essere estesa ad ua qualuque -pla campoara come avvee el campoameto casuale semplce. U dsego equprobablstco dà luogo, va teorca, ad u campoe così detto autopoderate. All'atto pratco è estremamete dffcle, se o mpossble, realzzare campo autopoderat a causa d ua sere d ostacol, parte dovut alla qualtà del frame, parte alle operazo d raccolta de dat (problema della macata rsposta, dell errore d rlevazoe, ecc.). ella selezoe d u campoe casuale è possble sceglere se og utà possa etrare pù d ua volta el campoe. Se questa possbltà o è ammessa l campoameto è detto seza rpetzoe, altrmet co rpetzoe. ella pratca, l'estrazoe co rpetzoe vee adottata raramete. E' tutvo che, fssata la dmesoe del campoe, l'osservazoe rpetuta d ua o pù utà rappreseta ua perdta d formazoe. E' tuttava ache evdete che la dstzoe tra estrazoe co e seza rpetzoe perde gradualmete d mportaza all'aumetare della dmesoe della popolazoe d rlevazoe..

. PIAO DI CAMPIOAMETO E PROBABILITÀ DI ICLUSIOE Per la defzoe data el precedete paragrafo, l seme de possbl campo d dmesoe prestablta par ad che possoo essere selezoat da ua popolazoe d utà ha cardaltà par a:. Pertato la probabltà d cascu possble campoe è par a : p () s Ioltre, rcordado che la probabltà d clusoe semplce può essere rcavata dal E e la probabltà d valore atteso delle varabl d apparteeza al campoe: ( ) clusoe coguta dal valore atteso del loro prodotto: E ( t t ). t, è mmedato verfcare che tal probabltà d clusoe soo costat per og utà della popolazoe e rspettvamete par a: e π ( ) ( ) π. La dmostrazoe d quest rsultat è rportata appedce al captolo.3 SELEZIOE DEL CAMPIOE Per llustrare l procedmeto d formazoe del campoe e quello d stma d ua costate caratterstca della popolazoe utlzzamo u semplce esempo [Kalto, 983]. Suppoamo d dsporre d ua lsta d 87 studet uverstar cascuo cotrassegato da u umero d matrcola compreso tra 000 e 950. E realstco che l cotrassego pù elevato, 950, sa maggore del umero degl scrtt, 87, quato alcu studet orgaramete ella lsta possoo essere usct per var.

motv dal corso d stud. Suppoamo acora che per svolgere l'dage s debba estrarre u campoe casuale semplce d 50 studet. U modo per procedere all'estrazoe cosste el fare rcorso al così detto modello dell'ura. Cascu umero che detfca lo studete è serto u cotetore sferco perfettamete calbrato. I cotetor vegoo po post detro u'ura che coseta d rmescolarl modo che essuo abba possbltà d assumere ua poszoe preferezale o dvduable detro la stessa e, fe, tra quest vegoo estratt a caso (co ua pesca mauale o meccaca). Se alcu cotetor, tra quell selezoat, cotegoo umer corrspodet a studet o pù scrtt al corso d stud, s procede ad estrazo supplemetar fo a raggugere la dmesoe programmata del campoe, ell'esempo: 50 studet. Questo metodo è molto semplce ma dveta mpratcable quado la lsta supera certe dmeso. U metodo alteratvo fa uso delle tavole de umer casual. Queste tavole soo costtute da sem d umer rcavat medate algortm matematc, modo che el lugo adare og cfra, og coppa d cfre, og tera, ecc. abba la stessa frequeza d og altra. U estratto della tavola de umer casual prodotta da M. G. Kedall e Babgto Smth [954] è rportato ella Tab.. Poché og studete è detfcato da u umero d quattro cfre, dobbamo selezoare casualmete umer d quattro cfre dalla tavola. Per far questo è suffcete dvduare casualmete u puto d parteza dal quale procedere ordatamete per rga o per coloa. Per semplctà possamo partre dall'agolo alto a sstra, coè dall'zo aturale della ostra tavola e leggere umer vertcale, seguedo le coloe. I prm due umer (7766, 748) o portao ad alcua selezoe. Il prmo studete selezoato corrspode al umero 0588, a codzoe ovvamete che rsult scrtto al corso d stud. Ache l umero successvo, 0579, corrspode ad u'estrazoe, dopo d che seguoo be udc umer (esaurta la prma coloa s passa alla secoda) che devoo essere scartat quato superor a 950. L'elevata quattà d umer scartat derva aturalmete dal fatto che pù dell'80% de umer d quattro cfre soo superor a 950. Per redere l procedmeto d selezoe pù spedto covee assocare alla lsta degl studet o solo umer compres tra e 950 ma ache quell (d quattro cfre) che s ottegoo sommado a quest opportu valor costat maggor d 950..3

Tab. - Tavola de umer casual -4 5-8 9-3-6 7-0 -4 5-8 9-3 33-36 37-40 77 66 88 40 86 6 96 70 78 75 9 77 94 37 66 53 4 74 8 53 7 6 6 59 3 33 0 5 95 9 37 03 8 46 6 37 86 3 05 88 0 0 45 80 38 70 94 0 08 37 74 87 49 04 4 05 79 76 95 69 00 48 70 60 4 53 06 57 06 6 60 3 06 74 5 79 98 70 98 97 94 55 99 44 04 75 89 69 50 64 03 96 68 7 89 6 55 09 79 5 56 65 88 08 6 96 95 33 7 60 45 8 3 50 46 7 79 9 6 49 99 08 80 0 56 35 4 4 7 58 0 39 33 53 85 6 8 8 70 06 7 0 34 50 30 6 83 58 39 98 84 0 7 85 7 35 9 54 44 53 59 34 44 49 93 6 75 9 87 34 93 85 6 8 79 65 94 0 93 69 3 43 93 93 77 39 7 40 66 3 90 86 65 88 4 9 36 86 el ostro caso s possoo sommare le costat 000, 4000, 6000 e 8000 per otteere le sere: 000 00 400 600 800 950 3950 5950 7950 9950 cascua delle qual comprede umer utl alla selezoe degl studet. Ad esempo, rpartedo dall'zo della tavola, trovamo l umero 7766 precedetemete scartato dal quale, togledo la costate 6000, otteamo 766, coè u umero compreso ella lsta d orge, che dà luogo all'estrazoe del corrspodete studete. Procededo questo modo umer che s scartao s rducoo a crca l,5% d quell compost da quattro cfre. Così procededo, può captare d cotrare pù volte lo stesso umero. el qual caso, se l'estrazoe è seza rpetzoe, lo s scarta come se fosse fuor della lsta. Il metodo delle tavole casual è stato alla base dell'estrazoe probablstca fo all'avveto degl elaborator elettroc. Al goro d'ogg quas tutt lguagg formatc che s usao campo scetfco cotegoo route per la geerazoe d umer casual. Tal route permettoo d otteere temp brevssm sere d umer casual che ammettoo o meo rpetzo ed è a queste che lo statstco s.4

rvolge per selezoare campo. Poché ache le lste delle popolazo d selezoe soo frequetemete regstrate su support formatc, l'operazoe d selezoe è spesso assstta completamete dall'elaboratore. Occorre pertato cooscere a fodo le mplcazo probablstche de meccasm d selezoe automatca per potere valutare la qualtà e l'adeguatezza alle stuazo elle qual s vogloo applcare..4 STIMA Avedo selezoato 50 studet, suppoamo ora d aver rlevato su cascuo d ess alcue varabl per stmare ua o pù costat caratterstche della loro popolazoe d proveeza, ad esempo, l umero medo d ore che uo studete passa davat alla televsoe e la proporzoe d quell che hao superato l'esame d maturtà co l massmo de vot. Idchamo l carattere (varable) quattatvo umero d ore passate davat alla televsoe co la lettera Y. I seguto useremo la stessa lettera per deotare u geerco carattere quattatvo. Seguedo ua covezoe dffusa ella teora del campoameto da popolazo fte, useremo lettere mauscole corsve per dcare valor assocat alle utà della popolazoe e muscole corsve per le utà del campoe e per le stme. Pertato, co Y, Y,..,Y,..Y, deotamo l umero d ore d televsoe per le utà della popolazoe e co y, y,..., y l corrspodete valore per le utà estratte. La meda della popolazoe è data da: Y Y La meda delle osservazo del campoe (o meda campoara) da: y y s, (.) cu la somma è estesa a tutte le utà della popolazoe selezoate el campoe..5

La meda campoara è l tradzoale stmatore della meda della popolazoe. E mmedato verfcare che la meda campoara corrspode ad uo stmatore d HT della meda della popolazoe. ee spotaeo domadarc se y è ua buoa stma d Y. Essedo l valore d Y goto, o è possble dare ua rsposta a questa domada. I altr term, o è possble valutare ua sgola stma, coè u partcolare valore otteuto da u partcolare campoe. E' però possble valutare l procedmeto che ha portato alla formazoe d ua partcolare stma. Il terme stma o dovrebbe essere cofuso co l terme stmatore (ella pratca due term soo spesso usat co lo stesso sgfcato). Ifatt, metre l prmo sta ad dcare u partcolare valore umerco, l secodo detfca l procedmeto utlzzato per rcavarlo. Lo stmatore possamo detfcarlo co l'operazoe d meda delle utà campoare, la stma co l rsultato che otteamo seguto all'applcazoe d questa operazoe su determate osservazo campoare. Le propretà dello stmatore (meda) s rcavao teorcamete potzzado d poter estrarre da ua popolazoe tutt possbl campo dstt d ua determata dmesoe. Calcolata la meda su cascuo d quest, s rcava la sua dstrbuzoe, che è detta: dstrbuzoe campoara delle mede. S è gà verfcato el precedete captolo che lo stmatore HT del totale Y è uo stmatore corretto. E mmedato estedere la verfca alla meda della popolazoe Y, sa term geeral, coè potzzado geerche probabltà d clusoe π, sa cosderado la probabltà d clusoe costate / che og utà della popolazoe ha el campoameto casuale semplce. Ifatt, poché la meda della popolazoe è data dal rapporto tra l totale e la dmesoe della popolazoe stessa: Y Y, ache lo stmatore d HT della meda sarà uguale a quello del totale rapportato alla dmesoe : Y y π t (.) π.6

E facle verfcare che lo stmatore (.) è corretto e che sosttuedo a π la probabltà d clusoe costate / s ottee la meda campoara rporta (.) che, ovvamete, può essere scrtta ella forma: y ccs Y t. (.3) Il suffsso ccs, agguto al smbolo della meda campoara, sta per: campoameto casuale semplce. I seguto utlzzeremo aalogh dc per detfcare lo stmatore d HT el cotesto d altr pa d campoameto. oostate la correttezza, la maggor parte, se o la totaltà, delle mede campoare dfferrà pù o meo da quella della popolazoe. I altre parole le mede campoare avrao ua varabltà pù o meo elevata toro al valore cetrale rappresetato, come s è detto, dalla meda della popolazoe. E' tutvo che se questa varabltà è elevata è del par elevata la probabltà che la meda d u campoe casuale rsult ache molto dversa da quella della popolazoe. Al cotraro, se la varabltà è pccola la dstrbuzoe campoara è o solo cetrata ma ache addesata sulla meda della popolazoe e, d cosegueza, è alta la probabltà d selezoare casualmete campo co meda prossma a quella della popolazoe. Il grado d addesameto della dstrbuzoe campoara toro alla propra meda è ua propretà che s esprme co l terme precsoe e s msura co u dce deomato errore stadard. L'errore stadard è la radce quadrata della varaza della dstrbuzoe campoara delle mede. Questa varaza o deve essere cofusa co quella elemetare (coè degl elemet o utà) della popolazoe, d cu è ua fuzoe. La varaza dello stmatore y ccs è fatt data da data da: ( y ) σ (.4) ccs ella quale : σ ( Y Y ).7

rappreseta la varaza elemetare della popolazoe. Tale varaza ella teora campoara vee comuemete defta modo leggermete dverso, ossa: ( Y Y ) dalla quale s rcava ua versoe alteratva della (.4): S (.5) S S ccs (.6) ( y ) ( f ) ella quale f / è la frazoe d campoameto. E' mmedato verfcare che sussste la seguete relazoe, che cosete d verfcare l'uguaglaza term umerc tra la (.4) e la (.6): S σ. L espressoe (.6) può essere faclmete rcavata dall espressoe dello stmatore (.3). Ifatt ache per l calcolo della varaza resta valdo quato s è osservato per l calcolo del valore atteso. La varaza dello stmatore è rferta esclusvamete alle varabl casual t ed partcolare alla loro somma, cosderado tutt gl altr term come costat. Pertato: dove ( t t ) ( yccs ) Yt Y ( t ) + (, ( C t t C, è la covaraza tra le possbl coppe d valor t t (co <). )), (.7) Teuto coto che le t soo varabl beroullae co probabltà d successo par a /, è facle rcavare che: e ( t ).8

C ( t t ), ; ( ) da cu segue che: ( yccs ) Y ( t ) + YY C( t, t ) Y < < Y Y ( ) Raccogledo opportuamete a fattor comue, s pervee alla seguete espressoe: ( y ) ccs f f Y < che co ulteror semplc passagg porta a: ( y ) ccs ( ) Y Y Y Y f ( Y Y ) S f. Coè l rsultato atcpato ella (.6). L'errore stadard della meda, ES( y ccs ), è dato dalla radce quadrata della (.6). Per coveeza d otazoe, la varabltà della stma vee ormalmete espressa term d varaza. Qud dremo che al crescere della varaza dmusce la precsoe della stma e, vceversa, al dmure della varaza aumeta la sua precsoe. La (.6) mostra che la varaza della meda campoara dpede da tre fattor. Il prmo, ( f), detto fattore d correzoe per popolazoe fta, (cpf), esprme l cotrbuto ella rduzoe della varaza dovuto sa alla dmesoe fta della popolazoe che alla selezoe seza rpetzoe. Per, fatt l terme è..9

more d, ma perde rapdamete d mportaza, tededo ad, all'aumetare della dmesoe della popolazoe. Il terme è uguale a se l'estrazoe è co rpetzoe o se la popolazoe o è fta. Il secodo,, è la dmesoe del campoe e l terzo, S, è la varaza elemetare (per l carattere Y) ella popolazoe. Poché quest'ultma è u dato sul quale o s ha alcua flueza e ( - f) è geeralmete trascurable, l terme dal quale prcpalmete dpede la varaza della stma è la dmesoe campoara. Torado all'esempo degl studet, dovrebbe essere charo, per le cosderazo svolte, che se l tempo dedcato alla televsoe è approssmatvamete uguale per tutt, la meda d og campoe osservable sarà vca a quella della popolazoe. Se, al cotraro, le abtud televsve dfferscoo otevolmete da uo studete all'altro, c sarà u certo rscho d osservare ua meda campoara che dffersce molto da quella della popolazoe. La varaza della stma c dà ua msura d questo rscho. Tuttava, poché tale varaza dpede da quella o ota, S, ella popolazoe, sarà ecessaro rcavare ua sua stma dal campoe. La stma cu s fa rcorso è: s v y f (.8) ( ccs ) ( ) ella quale, ( y yccs ) ( ) s s è uo stmatore corretto d S. La verfca della correttezza è lascata come eserczo allo studete. Dalla (.8) s rcava oltre la stma dell'errore stadard della meda: es ( y ) ( f ) s ccs (.9) Avedo stmato l'errore stadard della meda è possble, sotto certe codzo, costrure u tervallo d cofdeza cetrato su d essa, coè dvduare due valor, gl estrem dell'tervallo, che hao ua prestablta probabltà d coteere al loro.0

tero la vera meda della popolazoe. Per esempo l'tervallo d cofdeza al 95% per Y è dato da: y ±, 96 se( y ccs ) dove l valore,96 è tratto dalla tavola della dstrbuzoe ormale stadardzzata (l 95% della dstrbuzoe è compreso ell'tervallo cu estrem soo: -,96 e,96). Applcado la precedete espressoe al campoe d 50 studet, ell'potes che: y,9 e s,008, abbamo: ccs 50,008,9 ±,96,9 ± 0,6 87 50 Possamo allora affermare che, assumedo sussstao le codzo d ormaltà ecessare per applcare la teora degl tervall d stma, abbamo ua probabltà del 95% che l'tervallo cu estrem soo,076 e,3084 compreda la vera meda della popolazoe.. Dal campoe d 50 studet c eravamo prefss d stmare ache la proporzoe d quell che avevao superato la maturtà co l massmo de vot. La proporzoe d utà che ella popolazoe detegoo u partcolare attrbuto è frequetemete uo de parametr d maggore teresse elle dag. I rsultat teorc per le proporzo dervao drettamete da quell appea llustrat per le mede, cosderado la proporzo come ua meda calcolata su u carattere che possa assumere solo due valor:, ad dcare l possesso d u certo attrbuto; 0, ad dcare la macaza. Pertato, la proporzoe P d utà che hao u certo attrbuto ella popolazoe è equvalete alla meda Y del carattere stesso e la corrspodete proporzoe campoara p alla meda campoara y o, dato che l campoe è casuale semplce, y ccs. La formula della varaza S dato che Y può assumere solo valore 0 o, può essere scrtta ua forma alteratva rspetto alla (.5) e lo stesso vale per la sua stma campoara. I partcolare, S PQ/( ), co Q (P) e s pq/( ), co q ( p)..

Pertato le espresso della varaza dello stmatore e della sua stma campoara, sarao le seguet: ( p) ( f ) ( ) PQ (.0) e pq v (.) ( p) ( f ) ( ) A ttolo d esempo, suppoamo che el campoe 5 studet su 50 avessero superato la maturtà co pe vot. La proporzoe stmata è par a 5/50 0,06 (6%). La varaza stmata della proporzoe è: v 50 0,06 0,94 87 49 ( p ) 0, 00096 e qud l suo errore stadard è: ( p) 0,00096 0, 04 se..5 DETERMIAZIOE DELLA DIMESIOE CAMPIOARIA Abbamo vsto el paragrafo precedete che la frazoe d campoameto svolge u ruolo trascurable sulla precsoe delle stme. Il ruolo prepoderate è svolto dalla dmesoe assoluta del campoe. Possamo allora chederc quale dmesoe debba avere l campoe affché la precsoe delle stme sa par o o ferore ad u prefssato valore. A questa domada è possble rspodere ma a codzoe d dsporre d formazo o troppo vaghe sulla varaza elemetare della popolazoe relatvamete al carattere o a caratter d maggore teresse ell dage..

Per semplctà, putamo l attezoe sulla stma della meda Y della popolazoe. I geere è possble stablre a pror l orde d gradezza desderable del suo errore stadard; spesso s assume per l errore stadard u valore ferore a quello che o vorremmo fosse superato ell dage. Deotamo tale errore stadard co 0. Il suo quadrato è dato da: S S 0, ' ella quale /(/). Se è possble attrbure u valore ragoevole a S, (rcavadolo da dat cesuar, da dag precedet, da regstrazo d carattere ammstratvo o da dag plota ad hoc) la dmesoe è data da: S ' 0 e l valore d s ottee mmedatamete dalla relazoe: ' ' + A ttolo d esempo, suppoamo d voler stmare la proporzoe d studet mmatrcolat all Ateeo Foreto che hao otteuto la maturtà co l massmo de vot. La dmesoe della popolazoe s aggra sulle 9000 utà; c domadamo quale deve essere la dmesoe d u campoe casuale semplce che c coseta d otteere uo stmatore della proporzoe co u errore stadard par a 0,0. Quado s vuole stmare ua proporzoe o è frequete poter avazare a pror delle ragoevol potes sul suo orde d gradezza. ell esempo, è ragoevole pesare che tale proporzoe sa puttosto bassa, probablmete compresa tra 0,05 e 0,08. La varaza elemetare, che possamo approssmare co PQ date le dmeso della popolazoe, o è molto varable questo tervallo.3

d valor d P. Se P è 0,05, S 0,0475; se P è 0,08, S 0,0736. Per cautela possamo stablre d predere l maggore tra valor potzzat per S. Pertato: PQ 0,0736 ' 0 ( 0,0) 736 e qud, poché la dmesoe della popolazoe è d crca 9000 utà, 736 680, 736 + 9000 co ua varazoe d leve ettà rspetto ad a coferma della scarsa rlevaza del fattore d correzoe, cpf, gà popolazo d mede dmeso. S ot che co P 0,05 la dmesoe campoara sarebbe stata d crca 45 utà, coè crca l 66% della precedete. A questo proposto s deve osservare che la scelta cautelatva mplca u cosstete aumeto della dmesoe campoara. E acora che quado la proporzoe che s deve stmare o è molto pccola, come ell esempo, o, l che è equvalete, molto grade, covee cautelars adottado per P l valore 0,5 che massmzza la varaza PQ..6 CAMPIOAMETO CASUALE SEMPLICE CO RIPETIZIOE Pur rvestedo scarsa utltà ella pratca delle dag, l campoameto casuale semplce co rpetzoe merta qualche ceo elle sue lee prcpal soprattutto per mettere evdeza le prcpal dffereze rspetto al campoameto seza rpetzoe. el campoameto casuale semplce co rpetzoe fatt: (a) è possble selezoare campo d dmesoe ache superore a quella della popolazoe; (b) per popolazo d dmesoe la cardaltà dell seme de possbl campo d dmesoe è maggore d quella precedetemete vsta per l estrazoe seza rpetzoe (cfr..).4

el determare la cardaltà dell seme S de possbl campo s cosderao geeralmete le possbl sequeze ordate d -ple d utà, data la ecessara sequezaltà del processo d estrazoe. Le utà o possoo fatt essere prese blocco, ma ecessaramete ua per volta e reserte ella popolazoe. Le possbl -ple soo complessvamete: probabltà d selezoe par a.. D cosegueza, cascua ha o è possble parlare d probabltà d clusoe, salvo modfcare la defzoe, dato che u utà clusa el campoe alla prma estrazoe, può essere d uovo estratta el campoe ua successva estrazoe. S può e s deve vece parlare d frequeza attesa d clusoe per esprmere l umero atteso d rcorreze d cascua utà u campoe d dmesoe prestablta. Se cosderamo ua popolazoe d dmesoe e potzzamo d selezoare u campoe d utà: ) la probabltà d selezoe d ua geerca utà og fase del processo (estrazoe) resta par a /; ) la frequeza attesa d clusoe è par a /. La frequeza attesa d clusoe, /, è solo formalmete uguale alla probabltà d clusoe el campoameto casuale semplce seza rpetzoe. La dffereza sostazale è rappresetata dal fatto che la frequeza attesa d clusoe può essere maggore d, valore che ua probabltà o può ovvamete superare. E possble, come s è gà otato, modfcare la defzoe d probabltà d clusoe per adattarla al campoameto co rpetzoe. U modo, co rfermeto a quella del prmo orde, è defrla come: probabltà che ua geerca utà etr almeo ua volta el campoe durate l processo d estrazoe. I questa defzoe, ed dcadola co dall altra, la sua espressoe è data da: π π, per dstguerla Dato che ( ) è la probabltà che u utà o sa selezoata durate l processo d formazoe del campoe..5

Ioltre, la probabltà che, u campoe d dmesoe, u utà vega selezoata esattamete r volte è data da: r r r Ife, ella versoe modfcata che abbamo appea vsto, è acora possble determare la probabltà d clusoe coguta, coè la probabltà che le utà e sao etrambe estratte, almeo ua volta, durate l processo d formazoe del campoe: π +.7 IDICATORE DI RICORREZA EL CAMPIOE Per llustrare, ache se modo molto stetco, l procedmeto d stma della meda (o del totale) el campoameto casuale semplce co rpetzoe, è utle trodurre ua varable aleatora, aaloga alla varable dcatore gà trodotta el campoameto casuale semplce seza rpetzoe, che, questo caso, dobbamo defre come dcatore d rcorreza d ua geerca utà el campoe. Tale varable che deotamo co a, può assumere tutt valor ter compres tra 0 e, ad dcare che l utà o è stata estratta (a 0), è stata estratta ua sola volta (a ), due volte (a ) e così va. La varable a è evdetemete ua varable casuale bomale co probabltà d successo e l suo valore atteso corrspode alla frequeza attesa d clusoe. Lo stmatore della meda Y, che dchamo co y ccsr, può essere scrtto come segue: y ccsr Y a.6

Ed è mmedato verfcare la correttezza dato che ( ) a E. La sua varaza s rcava faclmete cosderado che: ( ) a e ( ), a a C Come abbamo gà vsto el paragrafo.4: ( ) ( ) ( )., + > > ccsr Y Y Y a a C Y Y a Y y Da cu: ( ) > S Y Y Y Y Y Y y ccsr σ Ife uo stmatore corretto della varaza dello stmatore y è dato dall espressoe: ( ) s y v ccsr E vale la pea d otare che questo caso ( ) ( ) y y s s ccsr è uo stmatore corretto d e o d. σ S.7

.8 EFFETTO DEL DISEGO La stratega d campoameto data dal pao d campoameto casuale semplce (seza rpetzoe) e dallo stmatore d HT è spesso cosderata u terme d cofroto co altre stratege alteratve, a partà d dmesoe campoara. Il cofroto è spesso effettuato medate u dce deomato effetto del dsego (desg effect) che deotamo co. Il Deff T è u rapporto tra la varaza Deff ( ) d uo stmatore T relatvo ad ua stratega che voglamo valutare e la varaza del corrspodete stmatore ella stratega costtuta dal campoameto casuale semplce e dallo stmatore d HT. A ttolo d esempo, possamo valutare medate l Deff ( y ccsr ) la stratega, appea vsta, costtuta dal campoameto casuale semplce co rpetzoe e dallo stmatore delle meda y ccsr. Deff ( y ) ccsr S ( yccsr) ( y ) ccs S Il rsultato evdeza che, a partà d dmesoe campoara, l campoameto casuale semplce seza rpetzoe è pù effcete d quello co rpetzoe, per u fattore che tede a dvetare trascurable all aumetare della dmesoe della popolazoe o, comuque, al rdurs della frazoe d campoameto. Prma d cocludere, u osservazoe che rguarda la smbologa adottata. L elevazoe al quadrato che compare el smbolo Deff sta ad dcare che l dce mette rapporto tra loro due varaze. E possble valutare ua stratega campoara ache term d errore stadard dello stmatore. I questo caso l dce vee scrtto seza l elevazoe a poteza. Ioltre, l zale mauscola deota che l dce è calcolato su varaze o error stadard real, ma sappamo che pratca potremo utlzzarlo solo su stme d varaze o d error stadard; questo caso l dce sarà scrtto co la lettera muscola, seguedo la cosueta covezoe trodotta per l carattere d studo Y..8

A. - APPEDICE AL CAPITOLO DETERMIAZIOE DELLE PROBABILITÀ DI ICLUSIOE DEL PRIMO E DEL SECODO ORDIE Per defzoe, la probabltà d clusoe del prmo orde è: Ma poché p() s π p( s) s è costate, data la dmesoe campoara, per determare π è ecessar semplcemete cotare quat soo campo, s, che cludoo la - esma utà e rapportare questo umero al totale de campo selezoabl. Il umero d campo che cotegoo la -esma utà s rcava faclmete cosderado che oltre alla -esma l campoe può coteere ua qualsas combazoe d utà scelte dalle preset ella popolazoe dverse dall utà. Il loro umero è: ( )! ( )(! )! E dvdedo per l totale de possbl campo semplfcazo: π p() s. s s ottee, co baal Possamo ragoare modo del tutto aalogo per rcavare π : ( ) ( ) π p() s. s,.9