4. Campionamento statistico
|
|
|
- Raimondo Daniele Orsini
- 9 anni fa
- Visualizzazioni
Transcript
1 Cap. 4 Campionamento 4. Campionamento statistico 4. Introduzione L'indagine è lo strumento statistico mediante il quale si acquisiscono informazioni su uno o più fenomeni attinenti ad una popolazione. L'informazione può essere acquisita osservando tutte le unità componenti la popolazione o soltanto parte di esse. Nel primo caso l'indagine è detta completa, nel secondo, parziale o campionaria. L'indagine completa è teoricamente semplice ma all'atto pratico presenta molti lati negativi. Se la popolazione ce si desidera studiare è molto numerosa, le risorse economice e personali necessarie al suo corretto svolgimento possono essere superiori a quelle disponibili. Ance i tempi di esecuzione possono spesso superare limiti accettabili o comunque limitarne notevolmente la cadenza. Inoltre, le indagini complete non possono essere svolte: ) su popolazioni non finite (come ad esempio può essere concettualmente considerata ogni popolazione ce origini da un processo produttivo di tipo industriale, o in agricoltura, ecc.); 2) su popolazioni per le quali l'osservazione del fenomeno di studio comporti la distruzione dell'unità ce si osserva (come ad esempio la durata di accensione di una lampada o la resistenza alla rottura di una barra metallica, ecc.). Per contro l'indagine campionaria offre, all'atto pratico, una serie di vantaggi. In primo luogo, non vi sono limitazioni legate alla dimensione della popolazione o alla natura delle unità componenti. In secondo luogo, la possibilità di limitare la rilevazione ad un insieme di unità di dimensione ben inferiore a quella della popolazione consente di: (i) contenere i costi dell'indagine entro limiti accettabili; (ii) svolgere l'indagine in tempi relativamente brevi; (iii) raccogliere, per ogni unità inclusa nell'indagine, un maggior numero di informazioni; (iv) raccogliere le informazioni con maggior accuratezza grazie all'utilizzazione di personale qualificato e/o di tecnice specialistice. Sul piano teorico, tuttavia, l'indagine campionaria presenta due notevoli problemi: il primo, legato al modo in cui deve essere scelto il campione; il secondo, relativo ai procedimenti da adottare per estendere l'evidenza campionaria alla popolazione. Lo studio di questi problemi, ce come si vedrà sono strettamente collegati, costituisce l'oggetto della teoria del campionamento statistico.
2 2 Cap. 4 Campionamento Nella fase in cui si definiscono gli obiettivi della ricerca viene ance definita la popolazione oggetto di studio o popolazione obiettivo. In generale per popolazione si intende un insieme finito o infinito di unità ce non interessano prese singolarmente ma per il contributo ce danno alle proprietà statistice dell'insieme di appartenenza. Definire la popolazione obiettivo significa individuare con esattezza la natura dei suoi elementi componenti, cioè delle unità oggetto di studio, e la sua estensione spaziale e temporale. Si definisce campione un qualsiasi sottoinsieme di n unità (n N) della popolazione. L'indagine completa, della quale non tratteremo in queste note, può comunque essere vista come un caso particolare di quella campionaria nel caso in cui n = N. Vi sono numerosi metodi per selezionare un campione e diverse possibilità di classificarli. Una distinzione di importanza fondamentale è quella tra campioni probabilistici e non probabilistici. Si parla di campione o di campionamento probabilistico quando ad ogni unità della popolazione è associata una probabilità nota di essere selezionata. Da questa definizione derivano le seguenti proprietà dei campioni probabilistici: ) è possibile definire l'insieme di tutti i campioni distinti estraibili dalla popolazione; 2) a ciascun membro (campione) di tale insieme è assegnabile a priori una probabilità di selezione; 3) stabilito un procedimento di stima vi è una corrispondenza univoca tra campione estratto e valore della stima ce da esso si ricava. Tutti i campioni probabilistici vengono formati ricorrendo ad un meccanismo di selezione casualizzata o casuale. Sono non probabilistici i campioni ce non anno i requisiti suddetti. Definita la popolazione obiettivo, e necessario verificare la disponibilità di una base di campionamento (in inglese frame) ce le corrisponda perfettamente. In altri termini occorre disporre di una lista completa delle sue unità. Per lista si intende un insieme ordinato di contrassegni delle unità della popolazione, registrati su un supporto ce ne consenta la consultazione. La lista identifica la popolazione di selezione. Purtroppo sono frequenti i casi in cui non esiste perfetta coincidenza tra popolazione di selezione e popolazione obiettivo. Infatti, soprattutto in campo sociale ed economico, gran parte delle liste oggi disponibili presentano difetti tra i quali il più grave è quello della incompletezza, dovuta per lo più alla lentezza con la quale esse vengono aggiornate. I difetti sono tanto maggiori quanto più frequente è il fenomeno della nati-mortalità e quanto maggiore è la mobilità delle unità componenti la popolazione obiettivo. Oltre a popolazione obiettivo e popolazione di selezione è necessario parlare ance di popolazione di indagine. Selezionato il campione, accadrà
3 Cap. 4 Campionamento 3 normalmente di non potere osservare tutte le unità per impossibilità di contattarle o per un loro rifiuto di partecipazione all'indagine. Il fenomeno della mancata osservazione di un'unità ce fa parte della popolazione di selezione prende il nome di non risposta o mancata risposta. In presenza di questo fenomeno il campione fornisce evidenze soltanto sull'insieme di coloro ce sarebbe stato possibile osservare se l'indagine fosse stata completa. Questo insieme costituisce la popolazione di indagine (survey population). Quindi, riassumendo: la popolazione obiettivo, cui è direttamente interessato ci svolge l'indagine, differisce da quella di selezione a causa dell'incompletezza della lista. La popolazione di selezione differisce a sua volta da quella di indagine a causa della non risposta. La selezione del campione e la stima dei parametri della popolazione rappresentano senz'altro i due momenti di maggiore interesse teorico dell'indagine campionaria. Le fasi relative alla selezione del campione e alla stima dei parametri della popolazione costituiscono il così detto piano o disegno di campionamento (sampling design) In dettaglio il piano di campionamento comprende le operazioni relative a: ) l'identificazione delle unità campionarie e/o di aggregati di unità per una eventuale selezione a più stadi o per la costruzione di strati; 2) la scelta della metodologia per l'estrazione delle unità e per la stima dei parametri di interesse. Scopo principale dell'indagine campionaria è la stima di una o più costanti caratteristice (o parametri) della popolazione. La stima è il procedimento statistico mediante il quale un valore ricavato come funzione delle osservazioni campionarie viene assunto a rappresentare il valore incognito della corrispondente funzione (parametro caratteristico) nella popolazione. I parametri di maggior interesse sono rappresentati da medie, totali e differenze o rapporti tra queste grandezze, per i caratteri (o variabili) quantitativi e da proporzioni, o percentuali, per i caratteri qualitativi. Da un indagine su un campione di imprese statunitensi (Kinnear e Taylor, 996), è frequente l utilizzo di dati campionari per la stima di misure di posizione (oltre il 50% delle imprese) e degli indici di variabilità (oltre il 40% delle imprese); sono spesso effettuati ance test delle ipotesi e stime di intervallo (Fig. 4.). Nella pratica la maggior parte delle indagini è utilizzata sia a scopi descrittivi sia a scopi esplicativi. I dati raccolti mediante le tecnice campionarie ce descriviamo in questo capitolo sono dati osservazionali (non sperimentali).
4 4 Cap. 4 Campionamento Fig. 4. Principali scopi delle indagini campionarioe (a) stima di misure di posizione (b) stima misure di variabilità 60% 50% 50% 40% 30% 20% 0% 40% 30% 20% 0% 0% Frequente Talvolta Mai 0% Frequente Talvolta Mai (c) calcolo stime di intervallo (d) conduzione di test delle ipotesi 60% 60% 50% 50% 40% 40% 30% 30% 20% 20% 0% 0% 0% Frequente Talvolta Mai 0% Frequente Talvolta Mai Fonte: Kinnear e Taylor (996) 4.2 Campionamento casuale semplice (ccs) Il campionamento casuale semplice rappresenta il naturale punto di partenza per lo studio di tutti gli altri disegni campionari. Si consideri una popolazione di N unità dalla quale si debba estrarre un campione di n unità. Il campionamento casuale semplice è la tecnica ce attribuisce la stessa probabilità di selezione ad ogni insieme di n unità distinte della popolazione. Nella selezione di un campione casuale è possibile scegliere se ogni unità possa entrare più di una volta nel campione. Se questa possibilità non è ammessa il campionamento è detto senza ripetizione, altrimenti con ripetizione. Nella pratica l'estrazione con ripetizione viene adottata raramente. E' evidente ce la distinzione tra estrazione con e senza ripetizione perde gradualmente di importanza all'aumentare della popolazione di rilevazione. Per illustrare il procedimento di formazione del campione e quello di stima di una costante caratteristica della popolazione utiliziamo un semplice esempio. Supponiamo di disporre di una lista di 793 studenti universitari ciascuno contrassegnato da un numero di matricola compreso tra 000 e
5 Cap. 4 Campionamento Naturalmente 950 è maggiore 793 in quanto alcuni studenti originariamente nella lista sono usciti per vari motivi dal corso di studi. Supponiamo ancora ce per svolgere l'indagine si debba estrarre un campione casuale semplice di 300 studenti. Un modo per procedere all'estrazione consiste nel fare ricorso al così detto modello dell'urna. Ciascun numero ce identifica lo studente è inserito in un contenitore sferico perfettamente calibrato. I contenitori vengono poi posti dentro un'urna ce consenta di rimescolarli in modo ce nessuno abbia possibilità di assumere una posizione preferenziale o individuabile dentro la stessa e, infine, n tra questi vengono estratti a caso (con una pesca manuale o meccanica). Se alcuni contengono numeri corrispondenti a studenti non più iscritti al corso di studi, si procede ad estrazioni supplementari fino a raggiungere la dimensione programmata del campione, nell'esempio, n=300 studenti. Questo metodo è molto semplice ma diventa impraticabile quando la lista supera certe dimensioni e inoltre dipende dalla bontà del rimescolamento dei contenitori nell'urna. Avendo numerato da a N le unità della popolazione, la selezione casuale avviene generando casualmente un numero intero compreso fra e N mediante apposite routine di programmi informatici, ce generano quelli ce vengono denominati numeri casuali o pseudocasuali. Al giorno d'oggi, infatti, quasi tutti i linguaggi informatici ce si usano in campo scientifico contengono routine di calcolo di numeri casuali. Tali programmi permettono di ottenere in tempi brevissimi serie di numeri casuali ce ammettono o meno ripetizioni. Poicé ance le liste delle popolazioni di selezione sono frequentemente registrate su supporti informatici, l'operazione di selezione è assistita completamente dall'elaboratore. Avendo selezionato n= 300 studenti, supponiamo ora di voler stimare una o più costanti caratteristice della loro popolazione di provenienza. Ad esempio, il numero medio di ore ce uno studente passa davanti alla televisione e la proporzione di quelli ce anno superato l'esame di maturità con il massimo dei voti. Indiciamo il carattere (variabile) quantitativo numero di ore passate davanti alla televisione con la lettera Y. In seguito useremo la stessa lettera per denotare un generico carattere quantitativo. Seguendo una convenzione diffusa nella teoria del campionamento, useremo lettere maiuscole per indicare stimatori dei parametri della popolazione e minuscole per le unità del campione e per le stime. Denotiamo con µ il numero medio di ore ce uno studente della popolazione passa davanti alla televisione (parametro incognito della popolazione) e con y, y 2,.., y n i valori osservati per le n unità estratte.
6 6 Cap. 4 Campionamento La media delle osservazioni del campione (o media campionaria) è: n y = y j n j= Essa è la tradizionale stima della media della popolazione. Ciò significa ce y è assunto come stima di µ. Viene spontaneo domandarci se y è una buona stima di µ. Purtroppo, essendo il valore di µ ignoto non è possibile dare una risposta a questa domanda. In altri termini non è possibile valutare una singola stima, cioè un particolare valore ottenuto da un particolare campione. E' però possibile valutare il procedimento ce a portato alla formazione di una particolare stima. Il termine stima non dovrebbe essere confuso con il termine stimatore (nella pratica i due termini sono spesso usati con lo stesso significato). Infatti, mentre il primo sta ad indicare un particolare valore numerico, il secondo identifica il procedimento utilizzato per ricavarlo. Lo stimatore può essere identificato con l'operazione di media delle unità campionarie, la stima con il risultato ce otteniamo in seguito all'applicazione di questa operazione su determinate osservazioni (valori) campionarie. Le proprietà dello stimatore (media) si ricavano teoricamente ipotizzando di poter estrarre da una popolazione tutti i possibili campioni distinti di una determinata dimensione. Calcolata la media su ciascuno di questi, si ricava la sua distribuzione, ce è detta: distribuzione campionaria delle medie. Si può verificare ce, se il campionamento è casuale semplice (con o senza ripetizione), la media di questa distribuzione è uguale a µ. Si dice allora ce nel campionamento casuale semplice la media campionaria è uno stimatore corretto o non distorto della media della popolazione. Un altro modo di esprimere questa proprietà è dire ce la distribuzione campionaria delle medie è centrata sulla media della popolazione e, ancora, ce il valore atteso della media campionaria è uguale alla media della popolazione. Se la distribuzione non è centrata, lo stimatore si dice distorto e distorsione è il termine ce identifica la differenza tra la media della popolazione e quella della distribuzione Nonostante la correttezza, la maggior parte, se non la totalità, delle medie campionarie differirà in più o in meno da quella della popolazione. In altre parole le medie campionarie avranno una variabilità più o meno elevata intorno al valore centrale rappresentato, come si è detto, dalla media µ della popolazione. E' intuitivo ce se questa variabilità è elevata è del pari elevata la probabilità ce la media di un campione casuale risulti ance molto diversa da quella della popolazione. Al contrario, se la variabilità è piccola la distribuzione campionaria è non solo centrata ma ance addensata sulla media della popolazione e, di conseguenza, è alta la probabilità di
7 Cap. 4 Campionamento 7 selezionare casualmente campioni con media prossima a quella della popolazione. Il grado di addensamento della distribuzione campionaria intorno alla propria media è una proprietà ce si esprime con il termine precisione e si misura con un indice denominato errore standard. L'errore standard è la radice quadrata della varianza della distribuzione campionaria delle medie. Questa varianza non deve essere confusa con quella elementare (cioè degli elementi) della popolazione, di cui è una funzione. Infatti, indicata con Y lo stimatore della media da un campione casuale semplice con ripetizione, la sua varianza (ccs con ripetizione o con N elevato) è data da: 2 Var(Y ) = σ / n dove σ 2 è la varianza di Y nella popolazione (varianza elementare). Stimatore corretto della varianza incognita σ 2 è: 2 j y ) n 2 S = ( y n j= Quindi l errore standard della media è la radice quadrata di Var (Y ) ed è uguale a σ / n. Tornando all'esempio degli studenti, dovrebbe essere ciaro, per le considerazioni svolte, ce se il tempo dedicato alla televisione è approssimativamente uguale per tutti, la media di ogni campione osservabile sarà vicina a quella della popolazione. Se, al contrario, le abitudini televisive differiscono notevolmente da uno studente all'altro, ci sarà un certo riscio di osservare una media campionaria ce differisce molto da quella della popolazione. La varianza dello stimatore ci dà una misura di questo riscio. Si può dunque affermare ce, al crescere della varianza (o dell errore standard) diminuisce la precisione della stima e, viceversa, al diminuire della varianza (dell errore standard) aumenta la sua precisione. Le formule precedenti mostrano ce la varianza della media campionaria dipende da due fattori. Il primo, /n è funzione dalla dimensione del campione e il secondo, σ 2, è la varianza elementare (per il carattere Y) nella popolazione. Poicé quest'ultima è un dato sul quale non si a alcuna influenza, il termine dal quale principalmente dipende la varianza della stima, nel ccs, è la dimensione campionaria n. Avendo stimato l'errore standard della media è possibile, sotto certe condizioni, costruire un intervallo di confidenza centrato su di essa, cioè individuare due valori, gli estremi dell'intervallo, ce anno una prestabilita probabilità di contenere al loro interno la vera media della popolazione. Per esempio l'intervallo di confidenza al 95% per µ è dato da: Y ±, 96 S / n
8 8 Cap. 4 Campionamento dove il valore,96 è tratto dalla tavola della distribuzione normale standardizzata (il 95% della distribuzione normale standardizzata è compreso nell'intervallo i cui estremi sono:,96 e,96). I valori assunti dagli estremi dell intervallo sono funzione della media e della varianza campionaria e quindi dipendono dal campione selezionato; si parla pertanto di intervallo casuale. L intervallo casuale è tale ce, in un elevato numero di ripetizioni dell'esperimento di selezione del campione, tutte effettuate in condizioni identice a quelle del campione realmente osservato, contiene il parametro incognito µ 95 volte su 00. Dal campione di 300 studenti ci eravamo prefissi di stimare ance la proporzione di quelli ce avevano superato la maturità con il massimo dei voti. La proporzione di unità ce nella popolazione detengono un particolare attributo è in generale uno dei parametri di maggiore interesse nelle indagini. I risultati teorici per le proporzioni derivano direttamente da quelli appena illustrati per le medie, considerando le proporzioni come delle speciali medie calcolate su caratteri ce possono assumere solo due valori:, ad indicare il possesso di un certo attributo; 0, ad indicarne la mancanza. Pertanto la proporzione p di unità ce anno un certo attributo nella popolazione è equivalente alla media µ e la corrispondente proporzione campionaria pˆ alla media campionaria (lo stimatore) Y. La varianza di pˆ, stimatore di p, è: p( p ) V( pˆ ) = n ce viene stimata mediante la formula seguente: pˆ ( pˆ ) stima di V( pˆ ) = n Si noti ce p(-p) è la varianza elementare della popolazione (quella ce abbiamo definito prima con σ 2 ). 4.3 Determinazione della dimensione campionaria nel ccs Tra le prime domande ce lo statistico, cui è domandato di selezionare un campione, sente rivolgersi vi è quasi sempre la seguente: "Quale frazione di campionamento della popolazione può garantirmi stime con precisione pari a...?" oppure "Un campione dell'x% della popolazione può darmi una precisione adeguata?" o altre dello stesso tenore. Tutte queste domande non anno molto significato, per lo meno se vengono poste in questi termini. Abbiamo visto nel paragrafo precedente il ruolo svolto dalla dimensione assoluta del campione n. La domanda corretta è
9 Cap. 4 Campionamento 9 dunque impostata come segue: "Quale dimensione deve avere il campione affincé la precisione delle stime sia pari a...?" A questa domanda è possibile rispondere ma a condizione di disporre di informazioni non troppo vage sulla varianza elementare della popolazione relativamente al carattere o ai caratteri di maggiore interesse nell'indagine. Per semplicità, puntiamo l'attenzione sulla stima della media µ della popolazione. In genere è possibile stabilire a priori l'ordine di grandezza desiderabile del suo errore standard; spesso si assume per l'errore standard un valore inferiore a quello ce non vorremmo fosse superato nell'indagine. A titolo di esempio, supponiamo di voler stimare la proporzione di studenti dell'ateneo Fiorentino ce anno ottenuto la maturità con il massimo dei voti. Ci domandiamo quale deve essere la dimensione di un campione casuale semplice ce ci consenta di ottenere uno stimatore della proporzione con un errore standard pari a 0,0. Quando si vuole stimare una proporzione non è infrequente poter avanzare a priori delle ragionevoli ipotesi sul suo ordine di grandezza. Nell'esempio, è ragionevole pensare ce tale proporzione p sia piuttosto bassa, probabilmente compresa tra 0,05 e 0,08. La varianza elementare non è molto variabile in questo intervallo di valori di p. Se p è 0,05, σ 2 = 0,0475; se p è 0,08, σ 2 = 0,0736. In ogni caso, per cautela possiamo stabilire di prendere il maggiore tra i valori ipotizzati per σ 2. Pertanto, poicé l errore standard di uno stimatore è la radice quadrata della sua varianza e si ciede ce tale errore standard deve essere al massimo pari a 0,0, si a: p( p ) 0, 0736 Var( pˆ ) = = 0, 000 n n da cui si ricava: 0, 0736 n = 736 0, 000 E necessario pertanto estrarre un campione di almeno 736 unità. 4.4 Campionamento sistematico Prima dell'avvento degli elaboratori e della loro rapida diffusione, l'estrazione di un campione casuale di grandi dimensioni poteva risultare estremamente laboriosa implicando, per ogni unità da estrarre, il ricorso all estrazione di numeri casuali. Un metodo ideato per ridurre il lavoro sulle tavole e tutt'oggi ancora utilizzato per la sua semplicità e la sua efficacia è rappresentato dal così detto campionamento sistematico ce riciede la selezione casuale soltanto per la selezione della prima unità. Il campione è
10 0 Cap. 4 Campionamento infatti formato prendendo una unità ogni k presenti nella lista, a partire dalla prima estratta, con k pari al reciproco della frazione di campionamento. Si supponga di dover estrarre un campione di 00 studenti da una lista di 500 studenti. Il reciproco della frazione di campionamento, N/n, è uguale a 500/00=5. Per formare il campione è sufficiente selezionare un numero casuale compreso tra e 5 (estremi inclusi) ce individua la prima unità estratta e quindi procedere selezionando le altre unità con una progressione aritmetica di ragione 5 fino all'esaurimento della lista. Se, ad esempio, il primo numero estratto fosse 6, il campione risulterebbe formato dalle unità della lista contrassegnate dai numeri d'ordine: cioè, Nel campionamento sistematico, come in quello casuale semplice, ogni unità della popolazione a la stessa probabilità di entrare a far parte del campione. La media della popolazione può quindi essere stimata per mezzo della media aritmetica semplice delle unità del campione, come accade per il campione casuale semplice. Ci si può ricondurre ad una selezione del tutto equivalente a quella casuale semplice se si fa precedere la stessa da un'operazione ce disponga le unità della lista in ordine casuale. Se questa operazione è parte integrante del processo di selezione allora il campionamento sistematico può essere assimilato in tutto e per tutto a quello casuale semplice. L'ordine alfabetico, ad esempio, è spesso assimilabile a quello casuale. La selezione sistematica non dà buoni risultati quando la lista presenta una ciclicità di dimensione pari a quella dell'intervallo di selezione o ad un suo multiplo. Fortunatamente, nella pratica è raro incontrate cicli uguali o pari ad un multiplo dell'intervallo di selezione e, in ogni caso, tali situazioni dovrebbero essere facilmente riconoscibili. 4.5 Campionamento stratificato Frequentemente, prima di intraprendere un'indagine, sono disponibili per tutte le unità della popolazione alcune informazioni ce possono essere utilizzate per migliorare il disegno di campionamento. Se, ad esempio, dobbiamo fare un campione di comuni, sono normalmente noti, prima dell'estrazione, i dati relativi alla loro localizzazione geografica, alla dimensione demografica, all'attività economica prevalente, ecc.. La stratificazione è una metodologia ce consente di utilizzare questo tipo di informazioni (dette informazioni supplementari o ausiliarie) per migliorare
11 Cap. 4 Campionamento il disegno di campionamento. Essa consiste nella classificazione della popolazione in subpopolazioni, dette strati, sulla base delle informazioni ausiliarie e nella selezione di campioni indipendenti da ciascuno strato (si noti bene: gli strati sono gruppi in cui vengono classificate le unità della popolazione). La stima dei parametri caratteristici della popolazione (es. media) viene ricavata elaborando le stime separatamente per ogni sottopopolazione o strato. I maggiori vantaggi della stratificazione discendono dal fatto ce la dimensione dei campioni negli strati anzicé essere determinata dalla casualità dell'estrazione - come avverrebbe nel campionamento casuale semplice - è sotto il controllo di ci effettua il campione. Spesso i campioni sono formati applicando in tutti gli strati la stessa frazione di campionamento (ad esempio, per ogni strato si estrae il 2% delle unità). Essi risultano in tal caso di dimensione proporzionale a quella dello strato di provenienza e la stratificazione stessa viene detta proporzionale. Se la numerosità degli strati (ovviamente nella popolazione) è molto diversa da strato a strato, un disegno di tipo proporzionale determinerà numerosità di campione molto differenziata da strato a strato. Si veda a tale proposito l esemplificazione in Tab Se il carattere (quantitativo) analizzato a varianza approssimativamente uguale a σ 2 in ogni strato, le stime ricavate per ogni strato anno un diverso grado di precisione. Ad esempio, la media campionaria per lo strato a varianza pari a σ 2 /200, mentre quella dello strato 2 a varianza pari a σ 2 /20. In questa situazione, sarà opportuno cercare di conferire a questi risultati (stime) lo stesso grado di precisione nei diversi strati. Ciò sarà realizzabile selezionando campioni di strato ce abbiano approssimativamente la stessa dimensione; in altre parole, utilizzando frazioni di campionamento diverse da strato a strato (stratificazione non proporzionale). Tab. 4.2 Numerosità della popolazione e del campione Strato Strato 2 Popolazione Stratificaizone proporzionale 200 (2%) 20 (2%) Stratificazione non proporzionale 200 (2%) 200 (20%) Per semplicità supporremo ce negli strati le unità siano selezionate con un campionamento casuale semplice. Le notazioni già introdotte per il campione casuale semplice necessitano solo di piccole modifice per tener conto della divisione della popolazione in strati. Denotiamo con N la dimensione dell'-esimo strato e con H il numero di strati formati, pertanto:
12 2 Cap. 4 Campionamento N = H N = Analogamente denotiamo con n la dimensione del campione nel generico strato. µ e Y sono rispettivamente la vera media e la media campionaria (stimatore) nello strato ; σ 2 e s 2 le varianze elementari (per la variabile Y) nello strato e nel campione da esso estratto. La frazione di campionamento nello strato è indicata con f = n /N. Infine è utile introdurre il simbolo: W = N /N ce rappresenta la proporzione della popolazione nello strato ; ovviamente: H = W Poicé si è assunto un campionamento casuale semplice negli strati, i risultati visti nella precedente sezione possono essere estesi a ciascuno strato preso separatamente. Pertanto lo stimatore della media campionaria Y è corretto per la rispettiva media µ e la varianza corrispondente è σ 2 /n. I problemi nuovi riguardano soltanto: (i) come combinare tra loro gli stimatori di strato Y, per ottenere uno stimatore Y della media generale µ, dove naturalmente, µ = H = µ = W e, (ii) come stimare la varianza di Y. Il primo problema si risolve semplicemente ricorrendo allo stimatore avente struttura analoga a quella del parametro da stimare ce è dato da: Y = H = Y W E' immediato verificare ce Y è stimatore corretto di µ. Inoltre poicé i campioni sono selezionati indipendentemente da uno strato all'altro, si a: Var(Y ) = Var H = Y W = H = Var(Y La stima della varianza si ottiene sostituendo a σ 2 la stima campionaria (valore stimato) s 2 e quindi: Stima di Var(Y ) = Si può osservare come la varianza dello stimatore sia funzione di quella H = )W s n 2 2 = W H = 2 σ n 2 W 2
13 Cap. 4 Campionamento 3 elementare, interna ai vari strati. La possibilità di ridurre la varianza dello stimatore è quindi legata a quella di ottenere strati ce risultano, rispetto alla variabile di indagine, più omogenei della popolazione presa nel suo complesso. Questo obiettivo a una probabilità di essere realizzato tanto maggiore quanto maggiore risulta l'associazione tra caratteri di stratificazione e carattere di indagine. Nella pratica i caratteri di indagine sono numerosi ed è estremamente improbabile ce negli strati le unità risultino omogenee per ciascuno di essi. L'adozione di un campionamento stratificato è soggetta a due condizioni: () deve essere nota la proporzione, W, di popolazione negli strati ce si vogliono formare; (2) ogni unità della popolazione deve essere attribuibile senza equivoci ad uno ed uno soltanto dei possibili strati. In genere non risulta conveniente formare un elevato numero di strati, sebbene sia intuitivo ce il grado di omogeneità interna a ciascuno strato aumenta con la diminuzione di unità ce contiene. L'aumento del numero degli strati per una data dimensione complessiva del campione, implica una riduzione della dimensione campionaria interna ad ogni strato e, conseguentemente, un aumento della variabilità degli stimatori. 4.6 Campionamento a grappoli In gran parte delle popolazioni oggetto di indagine, le unità sono raggruppate in sottopopolazioni di varia natura. Ad esempio, la popolazione residente in Italia è composta dagli individui residenti nelle varie province (regioni, comuni, ecc.). Gli studenti di un ateneo possono essere classificati in base al corso di laurea, anno di corso ecc. Questi raggruppamenti possono essere utilizzati come unità di selezione del campione e, in tal caso, sono denominati grappoli. L elenco dei grappoli costituisce la lista dalla quale viene estratto il campione. Una volta deciso il numero dei grappoli da includere nel campione, se sono incluse tutte le unità ce appartengono ai grappoli estratti, si parla di campionamento a grappoli; se vengono incluse solo alcune unità estratte casualmete (ccs) dai grappoli selezionati, si parla di campionamento a due stadi. Il grappolo è concettualmente diverso dallo strato. Gli strati devono essere omogenei rispetto al carattere di indagine (o rispetto a caratteri associati a quello di indagine) e ogni strato viene ad essere rappresentato nel campione (infatti, nel campionamento stratificato, viene estratto un ccs da ogni strato). Al contrario, solo alcuni dei grappoli sono estratti e quindi questi devono essere in grado di rappresentare ance quelli non selezionati. La situazione ideale sarebbe quella in cui tutti i grappoli fossero più eterogenei possibile
14 4 Cap. 4 Campionamento al loro interno e quindi più simili fra loro. Purtroppo, come si può intuire da quanto detto, i grappoli non sono formati da ci estrae il campione, ma sono aggregazioni preesistenti nella popolazione, caratterizzate in verità da un certo grado di omogeneità interna. L omogeneità ce, nel campionamento stratificato, è sinonimo di precisione, nel campionamento a grappoli tende a produrre, invece, una perdita di precisione poicé solo alcuni dei grappoli vengono estratti. La giustificazione del metodo sta essenzialmente negli aspetti economici ad esso collegati. Talvolta può essere impossibile formare una lista delle unità di studio mentre è disponibile una lista di aggregati di unità (grappoli). Inoltre, per una stabilita dimensione campionaria, il campionamento a grappoli comporta generalmente costi inferiori al ccs soprattutto per la minore dispersione delle unità campionarie ce facilità l operazione di raccolta materiale dei dati. Un campione di individui residenti in Italia potrebbe essere estratto selezionando inzialmente alcune regioni, da alcune di queste alcune province, successivamente alcuni comuni e, infine, alcuni individui dalle anagrafi comunali (si tratta di un campionamento a più stadi). 4.7 Campionamento non probabilistico A titolo informativo si elencano e si descrivono brevemente le forme più comuni di campione non probabilistico ce possono essere raggruppate in due categorie: campioni ragionati e campioni fortuiti o a caso. a) Campioni a scelta ragionata. Tali campioni sono formati senza alcun ricorso a meccanismi di casualizzazione. La scelta delle unità da includere nel campione è affidata al ricercatore (o al rilevatore) ed è operata il più delle volte con obiettivi di rappresentatività di certi aspetti strutturali della popolazione. Di particolare interesse, data la loro diffusione nelle indagini di mercato, sono i campioni per quote, formati previa classificazione delle unità della popolazione, in gruppi. Il rilevatore deve selezionare unità appartenenti a ciascun gruppo fino al raggiungimento di prestabilite quote, cioè dimensioni, in modo da riprodurre nel campione (relativamente ai gruppi formati) la struttura della popolazione. Nella scelta delle unità il rilevatore può essere assoggettato ad un certo numero di vincoli, quali ad esempio l'obbligo di compiere prestabiliti itinerari per il contatto, il divieto di inserire nel campione più unità (individui) facenti parte di uno stesso nucleo abitativo, ecc., in modo da ridurre per quanto possibile il suo grado di arbitrarietà. Un altro tipo diffuso di campione ragionato è quello formato da unità tipo, unità cioè ce a giudizio di un esperto, cui è demandata la loro selezione, possiedono caratteristice ritenute più frequenti nella popolazione. Molto
15 Cap. 4 Campionamento 5 simile al campione di unità tipo è quello formato da aree barometro, circoscrizioni territoriali nelle quali si riscontrano comportamenti analogi a quelli dell'intera popolazione. Come esempio di area barometro si può pensare ad una sezione elettorale nella quale sia stata osservata più volte una distribuzione delle preferenze prossima a quella nazionale. L'esame dei risultati di tale sezione autorizzerebbe previsioni sul risultato completo di una consultazione elettorale. Si osservi ce una simile sezione sarebbe ance un'unità tipo. In effetti la differenza tra queste tipologie di campioni ragionati è spesso assai sfumata fino a venire del tutto meno in determinate applicazioni. b) Campioni selezionati fortuitamente o a caso. Il termine a caso non deve essere confuso con casualmente; questi campioni infatti non sono formati né con l'ausilio di tecnice di casualizzazione, né seguendo procedimenti ce implicano la preferenza da parte del rilevatore per certe unità anzicé per altre. Appartengono a questa categoria i campioni formati da: volontari (i pazienti di un centro medico, i rispondenti ad un questionario inserito in un giornale, ecc.); unità ce transitano da passaggi obbligati come frontiere, ingressi di edifici, le casse di un supermercato, ecc.; le parti più accessibili di popolazioni generalmente formate da oggetti (si pensi all'estrazione manuale di un campione di riso da un sacco), reperti di scavi arceologici, ed ancora molti tipi di campioni di animali, ad esempio: pesci catturati con reti, cavie estratte manualmente da una gabbia, ecc. 4.8 Conclusioni Da una indagine su un campione di imprese statunitensi (Kinnear e Taylor, 996), risulta frequente il ricorso al campionamento probabilistico di tipo casuale semplice e stratificato (Fig. 4.2). Meno importante è quello sistematico ma ciò è probabilmente dovuto all impiego frequente dell intervista telefonica e della tecnica del random digit dialing. Essa ce consiste nella selezione del rispondente mediante la selezione casuale di un numero di telefono. Una tecnica campionaria molto particolare è quella areale. Essa consiste nella suddivisione in sotto-aree geografice di un determinato territorio in cui si trovano collocate le unità della popolazione di interesse; nella selezione casuale di una di queste sotto-aree; nell intervista delle unità (o di un campione di unità) residenti nelle aree selezionate. Il campionamento areale è una tecnica assimilabile a quella a grappoli.
16 6 Cap. 4 Campionamento Fig. 4.2 Utilizzo del campionamento probabilistico 0,7 0,6 Frequente Talvolta Mai 0,5 0,4 0,3 0,2 0, 0 C. causale semplice C. stratificato C. sistematico C. areale Fonte: Kinnear e Taylor (996) Fig. 4.3 Uso della tecnica random digit dialing (RDD) 45% 40% 35% 30% 25% 20% 5% 0% 5% 0% Frequente Talvolta Mai Fonte: Kinnear e Taylor (996)
17 Bibliografia 7 Bibliografia Anderson D.R., D.J. Sweeny, T.A. Williams (997), An introduction to management science : quantitative approaces to decision making, West publising company. Antoldi F. (2000), L efficacia degli strumenti e delle tecnice di management. Una ricerca empirica sul loro impiego nelle imprese italiane, Economia & Management, n., pp Bollen K.A: (989) Structural equations wit latent variables, Wiley Series in probability and matematical statistics. Cortese (994), I censimenti generali, in A.A., La produzione delle statistice ufficiali, Istat, Roma. Golini A., P.Castaldi (992), Mutamenti demografici e mercato. Alcune strategie aziendali ed i risultati di una indagine, C.N.R., Istituto di Ricerce sulla Popolazione, Roma. Istat (989), Manuale di tecnice di indagine. 6. Il sistema di controllo della qualità dei dati, Note e Relazioni, n., Istat, Roma. Kaplan R.S., D.P. Norton (996), Translating Strategy into Action. Te Balanced Scorecard, Harvard Business Scool, Boston, USA. Kinnear T.C., J.R. Taylor (996), Marketing Researc: an Applied Approac, McGraw-ill. Lambin J.J. (998), Marketing strategico, McGraw-Hill. Marbac G. (996), Le ricerce di mercato, UTET (IV edizione), Torino. Marozza F. (996), Il Sistema Statistico Nazionale, in A.A., La produzione delle statistice ufficiali, Istat, Roma.
Il Campionamento Statistico
Il Campionamento Statistico Campionamento sistematico (1/2) Introdotto per ovviare ai costi elevati del campionamento casuale e semplice; richiede la selezione casuale soltanto
05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
Statistica descrittiva e statistica inferenziale
Statistica descrittiva e statistica inferenziale 1 ALCUNI CONCETTI POPOLAZIONE E CAMPIONE Popolazione: insieme finito o infinito di unità statistiche classificate secondo uno o più caratteri Campione:
Campionamento La statistica media campionaria e la sua distribuzione
Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di oggetti (unità di analisi) di ricerca N = ampiezza della popolazione PARAMETRI = caratteristiche della popolazione [media, proporzione
Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1
Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:
Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine
10/1 Indagine statistica Indagine Totale Indagine Campionaria Fasi dell indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento individuazione
STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
LEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di
Distribuzioni campionarie. Antonello Maruotti
Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento
La progettazione di un indagine statistica
Dip. di Scienze Umane e Sociali [email protected] Outline 1 L indagine campionaria 2 3 Outline 1 L indagine campionaria 2 3 L indagine campionaria [1/2] Principalmente influenzata da: tempi costi
L indagine campionaria Lezione 5
Anno accademico 2007/08 L indagine campionaria Lezione 5 Docente: prof. Maurizio Pisati Campionamento Il campionamento è l insieme delle operazioni finalizzate a generare il campione iniziale di una data
Verifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson
Levine, Krehbiel, Berenson Statistica Capitolo 7 Distribuzioni campionarie Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari" Unità Integrata Organizzativa Agraria,
Il campionamento statistico. prof. C.Guida
Il campionamento statistico prof. C.Guida Per determinare le caratteristiche fondamentali di una popolazione statistica non è sempre necessario analizzare tutta la popolazione, ma risulta sufficiente esaminare
Metodologia Statistica
Metodologia Statistica La metodologia statistica viene suddivisa tradizionalmente in due branche, strettamente collegate Statistica descrittiva indicatori statistici per riassumere realtà complesse Statistica
Tipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
Teoria e tecniche dei test
Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario
LE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
Esercitazioni di statistica
Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II [email protected] 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina
Il campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una
Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
RILEVAZIONI CAMPIONARIE E TECNICHE DI CAMPIONAMENTO. Prof.ssa Maria Carella
RILEVAZIONI CAMPIONARIE E TECNICHE DI CAMPIONAMENTO Prof.ssa Maria Carella [email protected] FASE 1 PROGRAMMAZIONE Fase in cui si predispone il piano di rilevazione Si procede alla: 1. DEFINIZIONE
PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo Maria Miceli
PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo 2006 Campionamento Maria Miceli Cos è il campionamento? Procedura attraverso la quale alcuni membri della popolazione sono selezionati come rappresentatitivi
zio L'INDAGINE CAMPIONARIA Metodi, disegni e tecniche di campionamento
zio L'INDAGINE CAMPIONARIA Metodi, disegni e tecniche di campionamento B f F~ :_ ~ () ì E(.'.6.. CJ?.. E S T Luigi Fabbris L'indagine camp1onar1a Metodi, disegni e tecniche di campionamento La Nuova Italia
Il Campionamento. La popolazione di riferimento
Il Campionamento La popolazione di riferimento La popolazione (o universo) di una ricerca è quell insieme dei casi che teoricamente costituiscono l oggetto di indagine e che hanno in comune almeno una
Statistica Elementare
Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui
Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"
Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa
CON O SENZA REIMMISSIONE
CAMPIONAMENTO Per una buona inferenza o induzione statistica, bisogna affrontare il problema del campionamento, ovvero del come raccogliere un campione della popolazione affinché la si possa studiare induttivamente.
STIMA DELLA VARIANZA CAMPIONARIA
STIMA DELLA VARIANZA CAMPIONARIA Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X i è x n = (x 1 +.. + x n )/n. Una stima puntuale della varianza σ 2 delle
POPOLAZIONE CAMPIONE
CAMPIONAMENTO 1 POPOLAZIONE Insieme finito o infinito di unità legate da almeno una caratteristica comune, che consenta di stabilire un criterio di appartenenza alla popolazione stessa. Esempio Bambini
Statistica. Campione
1 STATISTICA DESCRITTIVA Temi considerati 1) 2) Distribuzioni statistiche 3) Rappresentazioni grafiche 4) Misure di tendenza centrale 5) Medie ferme o basali 6) Medie lasche o di posizione 7) Dispersione
Matematica per psicologi
Matematica per psicologi Docente: prof. Gabriella Caristi, E-mail: [email protected] http://www.dsm.univ.trieste.it/~caristi Tel.: 040 558 2605 Testo: Statistical methods for the social sciences, A. Agresti-B.
TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo
TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L
7. STATISTICA DESCRITTIVA
7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole
Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
La distribuzione normale
La v.a. normale standardizzata La distribuzione normale standardizzata La distribuzione normale è difficilmente trattabile dal punto di vista calcolatorio, a causa dei suoi due parametri, µ e σ 2. Il ricorso
b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):
ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva
LA LUNGHEZZA DEI GENI UMANI (Es4.1)
STATISTICA INFERENZIALE: le caratteristiche della popolazione complessiva sono indotte da quelle osservate su un campione estratto dalla popolazione stessa(esempio exit poll) PROBLEMA: dato un campione
BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
Il confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
Contenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta
Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017 Giovanni Lafratta ii Indice 1 Spazi, Disegni e Strategie Campionarie 1 2 Campionamento casuale
STATISTICA: esercizi svolti sulla MEDIA ARITMETICA
STATISTICA: esercizi svolti sulla MEDIA ARITMETICA 1 1 MEDIA ARITMETICA 2 1 MEDIA ARITMETICA 1. La seguente tabella riporta il numero di persone divise per sesso che si sono presentate durante l anno 1997
L indagine campionaria Lezione 3
Anno accademico 2007/08 L indagine campionaria Lezione 3 Docente: prof. Maurizio Pisati Variabile casuale Una variabile casuale è una quantità discreta o continua il cui valore è determinato dal risultato
Cap. 7 Distribuzioni campionarie
Cap. 7 Distribuzioni campionarie 1 Popolazione e Campione Una popolazione è l insieme di tutte le unità oggetto di studio Tutti i potenziali votanti nelle prossime elezioni Tutti i pezzi prodotti oggi
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe
