Strategia di campionamento e valutazione degli errori campionari 1

Documenti analoghi
La strategia di campionamento 1

Nota informativa e strategia di campionamento

Nota metodologica. Gli obiettivi conoscitivi dell indagine

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e valutazione degli errori campionari 1

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Nota metodologica. Cenni sull indagine Viaggi e vacanze

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati. Introduzione

Nota metodologica. L indagine rientra tra quelle comprese nel Programma statistico (

Strategia di campionamento e livello di precisione dei risultati

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

STRATEGIA DI CAMPIONAMENTO E VALUTAZIONE DEGLI ERRORI CAMPIONARI 1

Strategia di campionamento e livello di precisione dei risultati

Nota metodologica. 1. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

Strategia di campionamento e livello di precisione dei risultati

Nota metodologica. Gli obiettivi conoscitivi dell indagine

Nota metodologica Premessa

Percorsi di studio e di lavoro dei diplomati dell'anno 2007 (Indagine 2011)

Aspetti metodologici dell indagine

Strategia di campionamento e livello di precisione dei risultati

L indagine Multiscopo I cittadini e il tempo libero

File di microdati per la ricerca. Aspetti della vita quotidiana Aspetti metodologici dell indagine

Sicurezza delle donne (2006)

Nota metodologica. Premessa

ISTITUTO NAZIONALE DI STATISTICA

File Standard. Indagine Multiscopo sulle Famiglie Famiglia e soggetti sociali Anno Manuale utente e tracciato record

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati 1. Premessa. Obiettivi dell indagine e domini di stima

Aspetti della vita quotidiana

FRUIZIONE DELLE BIBLIOTECHE, LETTURA DI LIBRI E GENERI DI LIBRI LETTI, PRELETTURA DEI BAMBINI DI 3-5 ANNI. ANNO

Nota metodologica. Premessa

Nota metodologica. Premessa

Multiscopo ISTAT - Uso del tempo ( )

Nota metodologica. Parte seconda: Fattori di rischio e prevenzione propone indicatori su 2.1 Il tabagismo 2.2 Sovrappeso e obesità

FILE DATI. Indagine Multiscopo sulle Famiglie Aspetti della Vita quotidiana Anno Manuale utente e Tracciato record

Nota metodologica. Premessa

Sistema statistico nazionale Istituto nazionale di statistica. Riponderazione. Note metodologiche. A cura di: Stefano Falorsi.

Aspetti della vita quotidiana (2016)

Nota metodologica. Parte I: Il framework concettuale, i criteri di selezione del collettivo, le definizioni e gli indicatori utilizzati

Esercizi S A 2.0 S B. =0.2; Metodo B: S B ii)

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

ESERCIZIO n.10. H 6cm d 2cm. d d d

LA PARTECIPAZIONE DEGLI ADULTI ALLE ATTIVITÀ FORMATIVE

ESERCIZIO n.10. H 6cm d 2cm. d d d

Multiscopo ISTAT - Aspetti della vita quotidiana (2015)

Statistiche flash. La soddisfazione dei toscani per le condizioni di vita nel 2016

L USO E L ABUSO DI ALCOL IN ITALIA

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati

Nota metodologica. Cenni sull indagine. Principali definizioni

Persone che hanno subito incidenti in. Regioni

Emilia Romagna 3,3% 5,3% 3,9% 3,2% 7,5% 4,62%

ESERCIZIO n.9. B 7cm H 3cm. b 3cm d 1cm. c 2cm. d d d

Esercizi svolti di geometria delle aree Alibrandi U., Fuschi P., Pisano A., Sofi A. ESERCIZIO n.6

Metodi Statistici per il Marketing. #06 Elementi di statistica inferenziale e di teoria dei campioni

Persone che hanno subito incidenti in. Regioni

Nota metodologica. Premessa. Principali definizioni

Esercizi svolti di geometria delle aree Alibrandi U., Fuschi P., Pisano A., Sofi A. ESERCIZIO n.8

Tavola 1 - Persone senza dimora per alcune caratteristiche - Anno 2011 (valori assoluti e composizione percentuale)

Esperimentazioni di Fisica 1. Prova d esame del 22 gennaio 2019 SOLUZIONI

Interventi di Upgrading di Impianti di Depurazione Esistenti

CRITERI DI SELEZIONE DEI PUNTI DI MISURA.

Anno Arrivi Presenze Arrivi Presenze Arrivi Presenze

Affitti Quota Latte - Periodo 2014/2015

Indici territoriali di ricorso civile per Cassazione

NOME: COGNOME: MATRICOLA:

Consumi e povertà in Emilia-Romagna. Anno 2014

Progetto interdipartimentale Informazione statistica territoriale e settoriale per le politiche strutturali

1. Allegato statistico: dettaglio dei dati per Regioni e Province Autonome

Gennaio-Febbraio 2018

Anno TOT CAPACITA' RICETTIVA FLUSSI TURISTICI 05/02/2019 TOTALE ITALIANI

Nota metodologica. Nord-est Centro Mezzogiorno Associazione riconosciuta

I TEST D IPOTESI. Dott.ssa Marta Di Nicola. Statistica inferenziale per variabili quantitative. Un problema pratico. Glicemia (mg/100cc)

ALLEGATO AL RAPPORTO SUL CONSUMO DI INFORMAZIONE APPENDICE METODOLOGICA

I primati di Bologna nel mercato del lavoro nel 2007

STIMA DEGLI OCCUPATI RESIDENTI E

ε = ε = x TFA A048. Matematica applicata Incontro del 16 aprile 2014, ore 17-19

geografica Maschio Femmina Maschio Femmina

Gennaio-Novembre 2018

Il mercato del lavoro nel 2009: la posizione di Bologna rispetto alle altre grandi città. Maggio 2010

PRIMA SCRITTA DEL MODULO DI

Presidenza del Consiglio dei Ministri

La progettazione di un indagine statistica

Indagine MET. Nota metodologica

Il mercato del lavoro nel 2010: la posizione di Bologna rispetto alle altre grandi città. Maggio 2011

Prodotto interno lordo per ripartizione geografica, in Italia e in Sardegna: variazioni percentuali 2005 su 2004

Famiglia e Società 4

BREVE RICERCA SULLA METODOLOGIA UTILIZZATA DAGLI ISTITUTI DI RICERCA "IARD" E "TONIOLO" PER LO STUDIO DELLA CONDIZIONE GIOVANILE IN ITALIA

I primati di Bologna nel mercato del lavoro nel 2006

Allegato statistico Il dettaglio dei dati per Regioni e Province Autonome

Dossier I dati regionali. Dossier Casa I dati regionali. A cura della Direzione Affari Economici e Centro Studi

Analisi congiunta sul mercato italiano degli immobili a destinazione commerciale, terziaria e produttiva

Transcript:

Strategia i campionamento e valutazione egli errori campionari 1 1. Introuzione La popolazione i interesse ell inagine è costituita alle famiglie resienti in Italia e agli iniviui i 14 anni e più ce le compongono. Sono esclusi gli iniviui ce sono membri permanenti elle convivenze. Per famiglia si intene la famiglia i fatto, ovvero un insieme i persone coabitanti e legate a vincoli i matrimonio, parentela, affinità, aozione, tutela o affettivi. L inagine viene svolta meiante intervista telefonica e utilizza come lista i selezione l arcivio egli abbonati Telecom al telefono; le unità i campionamento sono, pertanto, i numeri telefonici appartenenti a etto arcivio. L inagine è i tipo trasversale a caenza quinquennale e a la finalità i fornire stime i parametri i iversa natura (totali, meie, rapporti, frequenze assolute e relative) con iversi riferimenti territoriali: - l intero territorio nazionale; - le cinque ripartizioni geografice (Nor-Est, Nor-Ovest, Centro, Su e Isole); - le regioni geografice; - sei aree basate sulla tipologia socio-emografica ei comuni, così efinite: A, area metropolitana suivisa in : A 1, comuni centro ell area metropolitana: Torino, Milano, Venezia, Genova, Bologna, Firenze, Roma, Napoli, Bari, Palermo, Catania e Cagliari; A 2, comuni ce gravitano intorno al centro ell area metropolitana; B, area non metropolitana suivisa in : B 1, comuni con oltre 50.000 abitanti; B 2, comuni con 10.001-50.000 abitanti B 3, comuni con 2.001-10.000 abitanti; B 4, comuni aventi fino a 2.000 abitanti 2. Caratteristice ella lista i selezione La base i campionamento aottata, ovvero la lista i selezione elle unità campionarie, è l arcivio informatizzato ufficiale elle famiglie abbonate alla Telecom. Tale scelta è motivata al fatto ce le informazioni ell arcivio in oggetto sono contenute in un file ce viene costantemente aggiornato sulle variazioni egli intestatari e egli inirizzi telefonici; esso è, inoltre, i agevole utilizzo per la selezione elle unità campionarie in quanto si presta facilmente alla scelta i iversi criteri i orinamento. Le informazioni relative a ciascun inirizzo, utilizzabili per la stratificazione elle unità ella popolazione i riferimento, sono essenzialmente i tipo territoriale; esse sono la provincia, il comune, la sezione i censimento, la via, il numero civico, l ampiezza el comune i appartenenza, in termini emografici e in termini i numero i inirizzi. I principali problemi ce erivano all utilizzo ella lista telefonica come base i campionamento per le inagini sulle famiglie, sono legati alla non perfetta coincienza tra la popolazione oggetto inagine e l insieme elle unità contenute nella lista; inicano con L e U rispettivamente la lista e la popolazione interesse, le possibili situazioni in cui gli insiemi L e U ifferiscono sono in generale le seguenti: i) sovracopertura, quano alcuni elementi ell insieme L non appartengono all insieme U; 1 Di Clauia De Vitiis e Stefano Falorsi

ii) sottocopertura, nel caso in cui alcuni elementi i U non sono contenuti in L; iii) uplicazione i alcune unità, se alcuni elementi i U sono presenti più volte in L; iv) grappoli i unità, quano alcuni elementi ell insieme L contengono grappoli i elementi ell insieme U. La lista telefonica utilizzata per l inagine presenta in varia misura tutte le situazioni elencate; tuttavia, i fenomeni ce appaiono più rilevanti sono quelli ella sovracopertura e ella sottocopertura. Rientrano, infatti, nel caso ella sovracopertura tutti i numeri telefonici ce corrisponono a secone case o a attività professionali oppure a pubblici esercizi, ecc.; mentre rientrano nel caso ella sottocopertura tutte le famiglie non abbonate al telefono o intestatarie i numeri riservati. Rientrano, poi, nel caso iii) le famiglie intestatarie i più i un numero riferito all abitazione principale e nel caso iv) i numeri telefonici a cui corrisponono più famiglie. L effetto i ciascuna elle situazioni appena elencate è quella i moificare in moo non controllato le probabilità i inclusione elle unità ella popolazione rispetto alle probabilità i inclusione teorice assegnate alle stesse unità al isegno i campionamento aottato. Ciò può essere causa i istorsioni nelle stime prootte all inagine. In particolare la sottocopertura etermina una istorsione elle stime prootte tanto maggiore quanto più le unità i U ce appartengono a L sono ifferenti alle unità i U non presenti in L relativamente alle variabili interesse ell inagine. E possibile in parte attenuare tale effetto istorsivo ricorreno a opportune proceure i stima, note in letteratura come stimatori i ponerazione vincolata, ce tengono conto i totali noti (sulla base i fonti esterne all inagine) sulla popolazione relativi a variabili ausiliarie correlate a quelle interesse. Un ulteriore effetto ovuto alla sovracopertura, è il fatto ce la numerosità effettiva el campione sia minore i quella efinita nella fase i progettazione el isegno e ciò comporta un aumento ella variabilità elle stime. Si tratta allora i eciere se accettare una imensione campionaria inferiore a quella prevista o, alternativamente, ricorrere a un sovra-imensionamento el campione o a una lista i unità sostitutive. Nelle inagini i tipo telefonico si ricorre in genere alla sostituzione in quanto è necessario garantire ce venga raggiunto il numero prefissato i interviste utili. 3. Descrizione el isegno i campionamento Il isegno i campionamento è a ue stai con stratificazione elle unità i primo staio. Le unità i primo staio sono gli inirizzi telefonici ell arcivio i selezione, e quini le famiglie a essi corrisponenti. Le unità i secono staio sono gli iniviui: per ciascuna famiglia selezionata al primo staio si seleziona un iniviuo campione tra i componenti ella famiglia aventi età pari o superiore a 14 anni. Gli inirizzi telefonici sono stati stratificati per regione geografica e per tipologia i comune. La tipologia i comune non è, ovviamente, una variabile presente sull Arcivio Telefonico Informatizzato elle Famiglie, in quanto viene efinita all ISTAT sulla base elle caratteristice socio-emografice ei comuni italiani rilevate al Censimento ella Popolazione. La stratificazione meiante tale variabile a comportato, quini, la necessità i integrare l arcivio con tali informazioni. Il isegno campionario ora escritto presenta caratteristice molto ifferenti rispetto ai isegni ce vengono correntemente utilizzati per le inagini sulle famiglie conotte meiante intervista iretta. In primo luogo, l inagine in esame prevee la selezione iretta egli inirizzi campione senza estrarre al primo staio un campione i comuni; ciò come è noto etermina un aumento ell efficienza elle stime prootte e tale guaagno è tanto più elevato quanto più è alto il coefficiente i correlazione intra-classe, ovvero il grao i omogeneità elle variabili i interesse all interno ei comuni. Inoltre, l inagine prevee la selezione i un solo iniviuo campione a

ciascuna famiglia; ance questa scelta conuce a stime tanto più efficienti quanto più è alto il coefficiente i correlazione intra-classe elle famiglie. La eterminazione el numero totale i unità campionarie e la sua allocazione tra gli strati è in genere, per un inagine a obiettivi plurimi come quella in esame, un operazione complessa. E poco realistico, infatti, pensare i poter efinire un campione ce assicuri prefissati livelli i precisione a tutte le stime interesse, consierano ance il fatto ce le stime vengono prootte con iversi riferimenti territoriali. L allocazione ottimale elle unità el campione con riferimento a un ato tipo i ominio può risultare contrastante con l allocazione ottimale con riferimento a un altro tipo i ominio. In particolare, per quanto riguara le stime riferite all intero territorio nazionale l allocazione ottimale risulta vicina a quella proporzionale tra le iverse regioni; per quanto riguara, invece, le stime riferite alle regioni, l allocazione ottimale risulta prossima a quella ce assegna a tutte le regioni un campione i uguale numerosità. E necessario quini i un proceimento complesso articolato in più fasi. Dapprima, meiano tra esigenze operative e i costo e esigenze relative all attenibilità elle principali stime i interesse, si è efinita la numerosità n complessiva el campione. Successivamente, sulla base i valutazioni ell errore i campionamento atteso elle principali stime a livello regionale e nazionale, è stata eterminata l allocazione el campione tra le regioni; si è ottenuta in tal moo un allocazione i compromesso tra l allocazione uguale e quella proporzionale. Infine, le numerosità campionarie regionali sono state ripartite tra le iverse tipologie i comune in moo proporzionale alla popolazione resiente. Nel prospetto 1 sono riportate le numerosità campionarie per regione. Prospetto 1. Distribuzione regionale el campione Regioni Inirizzi campione Piemonte 3.796 Valle Aosta 1.328 Lombaria 4.622 Bolzano 1.393 Trento 1.518 Veneto 2.854 Friuli V. G. 2.013 Liguria 2.216 Emilia Romagna 2.800 Toscana 3.024 Umbria 1.526 Marce 1.995 Lazio 3.138 Abruzzo 2.068 Molise 1.368 Campania 3.036 Puglia 2.610 Basilicata 1.407 Calabria 2.197 Sicilia 2.986 Saregna 2.105 ITALIA 50.001 4. Selezione el campione L estrazione egli inirizzi campione a ciascuno strato è stata effettuata con probabilità uguali e senza reimmissione meiante tecnica i selezione sistematica.

La selezione el campione i inirizzi è avvenuta nel seguente moo: - per ciascuna regione, con riferimento a una ata tipologia comunale, sono stati orinati gli inirizzi ell Arcivio Telefonico elle Famiglie per ampiezza emografica el comune, straa, numero civico e piano; - efinito il passo i estrazione regionale, sono stati selezionati 6 punti i partenza casuali, uno per ciascuna tipologia comunale. Si è proceuto, poi, alla selezione egli inirizzi campione sulla base el passo i estrazione regionale a partire al punto i partenza casuale; - ogni inirizzo selezionato all Arcivio è entrato a far parte ell elenco base, e per ognuno i essi si sono selezionati i tre inirizzi successivi, ce sono entrati a far parte ell elenco sostitutivo; in tal moo le unità sostitutive sono le più vicine possibile al punto i vista territoriale alle rispettive unità el campione base e quini, presumibilmente, sono ance simili al punto i vista elle caratteristice socio-economice. La selezione casuale el componente a intervistare è stata effettuata nel seguente moo: a) è stato ciesto alla persona risponente al telefono l elenco ei componenti ella famiglia, e per ciascuno i essi il sesso, l età e la relazione con il capo famiglia; b) è stata formata la grauatoria per età ei componenti, assegnano un numero progressivo ai componenti risultati intervistabili (età maggiore i 14 anni); c) è stato estratto un numero casuale compreso tra 1 e il numero totale ei componenti intervistabili; ) è stato intervistato il componente il cui numero in grauatoria coincie con il numero casuale estratto. Si fa presente ce ai fini ell iniviuazione el componente a intervistare l ISTAT a fornito alla itta ce effettua la rilevazione un file costituito a 50.000 recor in cui ciascun recor è così formato: coice i regione, tipologia i comune, numero progressivo a 1 al numero i inirizzi campione nel ominio; 9 campi successivi così formati: il primo campo contiene un numero casuale pari a 1 o a 2; il secono campo contiene un numero casuale pari a 1, 2 o 3 e così via fino all ultimo campo ce contiene un numero casuale pari a 1, 2, 3..., 10. Per la selezione ell iniviuo a intervistare verrà utilizzato il primo campo per le famiglie i ue componenti, il secono per le famiglie i tre componenti e così via. Ciascun numero casuale è estratto inipenentemente agli altri e pertanto, nell ambito i ciascun campo k (k=1,,9), ogni numero i (i=1,, k+1) compare lo stesso numero i volte nei 50.000 recor. In tal moo, ciascun componente elle famiglie i ampiezza k+1(k=1,,9) a la stessa probabilità i essere selezionato. 5. Proceimento per il calcolo elle stime Le stime prootte all inagine sono stime el numero i eventi elittuosi subiti agli iniviui e el numero i eventi elittuosi subiti alle famiglie, noncé le caratteristice strutturali egli iniviui e elle famiglie ce anno subito tali fatti elittuosi. Le stime sono ottenute meiante uno stimatore i ponerazione vincolata, ce è il metoo i stima stanar per la maggior parte elle inagini ISTAT sulle imprese e sulle famiglie. Il principio su cui è basato ogni metoo i stima campionaria è ce le unità appartenenti al campione rappresentino ance le unità ella popolazione ce non sono incluse nel campione. Questo principio viene realizzato attribueno a ogni unità campionaria un peso ce inica il numero i unità ella popolazione rappresentate all unità meesima. Se, a esempio, a un unità campionaria viene attribuito un peso pari a 100, vuol ire ce questa unità rappresenta se stessa e altre 99 unità ella popolazione ce non sono state incluse nel campione. Al fine i renere più ciara la successiva esposizione, introuciamo la seguente simbologia:, inice i livello territoriale i riferimento elle stime;, inice i strato; j, inice i famiglia; q inice i iniviuo all interno ella famiglia j; y, generica variabile oggetto i inagine; Y jp valore

i y osservato sull iniviuo p ella famiglia j ello strato ; Qj, numero i iniviui i 14 anni e oltre appartenenti alla famiglia j ello strato ; M, numero i famiglie resienti nello strato ; m, campione i famiglie nello strato ; p, numero i iniviui campione nello strato (al momento ce si intervista un unico iniviuo in ciascuna famiglia campione si a p= m); H, numero i strati nel ominio. Ipotizziamo i voler stimare, con riferimento a un generico ominio (a esempio una regione geografica) il totale ella variabile y oggetto i inagine (a esempio il numero totale i scippi subiti agli iniviui i 14 anni e oltre), espresso alla seguente relazione: H M Q j Y Y jq (1) 1 j1q 1 Una stima el totale (1) è ata alla seguente espressione: H 1 m H Y Y Y W, (2) 1j1 j. in cui Yj e W j rappresentano rispettivamente il valore assunto alla variabile y e il peso finale a attribuire all iniviuo campione ella famiglia j ello strato. Dalla preceente relazione si esume, quini, ce per ottenere la stima el totale (1) occorre moltiplicare il peso finale associato a ciascuna unità campionaria per il valore ella variabile y assunto a tale unità e effettuare, a livello el ominio i interesse, la somma ei prootti così ottenuti. Il peso a attribuire alle unità campionarie è ottenuto per mezzo i una proceura complessa ce a le seguenti finalità: correggere l effetto istorsivo ovuto agli errori i lista e al fenomeno ella mancata risposta totale; tenere conto ella conoscenza i alcuni totali noti sulla popolazione oggetto i stuio, nel senso ce le stime campionarie i tali totali evono coinciere con i rispettivi valori noti; nell inagine in oggetto i totali noti, ce si riferiscono alla popolazione i 14 anni e oltre, sono: a) la istribuzione regionale ella popolazione per sesso e classi i età ; b) la istribuzione ella popolazione nelle aree A 1, A 2, B 1, B 2, B 3, B 4 efinite nel primo paragrafo; c) la istribuzione elle famiglie per ampiezza 2. La proceura per la costruzione ei pesi finali a attribuire alle unità campionarie, è articolata nelle seguenti fasi : 1) viene apprima calcolato il peso base (o peso iretto), ottenuto come reciproco ella probabilità i inclusione i ogni unità campionaria; 2) si calcola quini il fattore correttivo ce consente i soisfare la conizione i uguaglianza tra i totali noti ella popolazione e le corrisponenti stime campionarie; 3) il peso finale è ato al prootto el peso base per i fattori correttivi sopra inicati. Il fattore correttivo el punto 3) è ottenuto meiante la risoluzione i un problema i minimo vincolato, in cui la funzione a minimizzare è la istanza tra i pesi base e i pesi finali, e i vincoli sono efiniti alla conizione ce le stime campionarie ei totali i popolazione sopra efiniti coinciano con i valori noti egli stessi. j. 2 Le istribuzioni i cui ai punti b) e c) non sono ottenute a arcivi i popolazione bensì utilizzano i ati ell inagine annuale multiscopo aspetti ella vita quotiiana.

6. Valutazione el livello i precisione elle stime Le principali statistice i interesse per valutare la variabilità campionaria elle stime prootte all inagine sono l errore i campionamento assoluto e l errore i campionamento relativo. Inicano con la varianza ella stima Y, riferita al ominio, la stima ell errore V ar( Y i campionamento assoluto i ) Y si può ottenere meiante la seguente espressione: Y) Var( Y) (3) ( La stima ell errore i campionamento relativo i Y, è invece efinita all espressione: Var( Y) ( Y) (4) Y La stima ella varianza,, viene calcolata come somma ella stima ella varianza ei singoli strati appartenenti al ominio ; in simboli: ove V ar( Y) H V ar( Y ) Var Y = Yj YjWj 1 H m 1 m m 1 j1 (Y m j m Y ) e 1 Y Y j. m j1 Gli errori campionari elle espressioni (3) e (4), consentono i valutare il grao i precisione elle stime; inoltre, l errore assoluto permette i costruire l intervallo i confienza, ce, con una certa probabilità, contiene il parametro interesse. Con riferimento alla generica stima tale intervallo assume la seguente forma: Pr Y k (Y) Y Y k (Y) P 1 (6) Nella (6) il valore i k ipene al valore fissato per la probabilità P; a esempio, per P=0,95 si a k=2. 2 Ŷ (5) 7. Presentazione sintetica egli errori campionari A ogni stima Y corrispone un errore campionario relativo ( Y) ; ciò significa ce per consentire un uso corretto elle stime sarebbe necessario pubblicare per ogni stima il corrisponente errore i campionamento relativo. Questo tuttavia non è possibile sia per limiti i tempo e i costi i elaborazione, sia percé le tavole i pubblicazione risulterebbero appesantite e i non facile consultazione per l utente finale. Inoltre, non sarebbero comunque isponibili gli errori elle stime non pubblicate, ce l utente può ricavare in moo autonomo. Per tali motivi si ricorre, in genere, a una presentazione sintetica egli errori relativi basata sul metoo ei moelli regressivi fonata sulla eterminazione i una funzione matematica ce mette in relazione ciascuna stima con il proprio errore i campionamento. L approccio utilizzato per la costruzione i questi moelli è iverso a secona ce si tratti i variabili qualitative o quantitative. Infatti, per quanto riguara le stime i frequenze assolute (o relative) riferite alle moalità i

variabili qualitative, è possibile utilizzare moelli ce anno un fonamento teorico e secono cui gli errori relativi elle stime i frequenze assolute sono funzione ecrescente ei valori elle stime stesse. Per quanto riguara, invece, le stime i totali i variabili quantitative, si tratta i un problema i notevole complessità, per il fatto ce non è stata elaborata un aeguata base teorica per l interpolazione egli errori campionari elle stime in questione. L approccio qui seguito per risolvere il problema in oggetto è i tipo empirico nel senso ce si aattano iversi moelli regressivi ce legano gli errori assoluti o relativi alle corrisponenti stime; tra i moelli stimati si sceglie quello ce conuce a un R 2 maggiore. 7.1. Presentazione sintetica egli errori campionari per stime i frequenze Il moello utilizzato per le stime i frequenze assolute, con riferimento al generico ominio, è el tipo seguente: log 2 ( Y) a b log( Y ) (7) ove i parametri a e b vengono stimati utilizzano il metoo ei minimi quarati. Il prospetto 2 riporta i valori ei coefficienti a e b e ell inice i eterminazione R 2 elle funzioni utilizzate per l interpolazione egli errori campionari elle stime i frequenze riferite alle famiglie e agli iniviui, per area territoriale. Le informazioni contenute nel prospetto 2 permettono i calcolare l errore relativo i una qualsiasi stima i frequenza assoluta (e relativa). Allo scopo i facilitare il calcolo egli errori campionari, nel prospetto 3 sono riportati i valori interpolati egli errori campionari relativi percentuali i alcuni valori tipici assunti alle stime i frequenze assolute per area territoriale. Il prospetto 3 è costituito a ue colonne, la prima riporta K valori crescenti elle stime k (k=1,,k) e la secona riporta i rispettivi errori relativi interpolati ( Y ). Le informazioni contenute in tale prospetto permettono, quini, i calcolare l errore relativo i un generica stima i frequenza assoluta meiante ue proceimenti ce risultano i facile applicazione, ance se conucono a risultati meno precisi i quelli ottenibili meiante l espressione (7). Il primo metoo consiste nel cercare nella prima colonna el prospetto il livello i stima ce più si avvicina alla stima i interesse Y ; l errore relativo corrisponente ( Y) si trova sulla stessa riga ella secona colonna. Nel secono metoo, l errore campionario ella stima, si ricava meiante la seguente espressione: ove: k k 1 Ŷ e k k 1 ( Ŷ ) ( Ŷ ) k 1 k 1 ( Ŷ ) ( Ŷ ) ( Ŷ Ŷ ) (8) k k 1 Ŷ Ŷ Y k Ŷ k Ŷ sono i valori elle stime entro i quali è compresa la stima Ŷ e k 1 ( Ŷ ) e ( Ŷ ) i corrisponenti errori relativi letti sul prospetto. 7.2. Presentazione sintetica egli errori campionari per stime i totali Il moello utilizzato per le stime i totali i variabili quantitative, con riferimento al generico ominio, è el tipo seguente:

log 2 ( Y) a b log( Y ) (9) ove i parametri a e b vengono stimati utilizzano il metoo ei minimi quarati, aattano il Ŷ, Ŷ. In moello (9) a una nuvola i punti costituita a un consistente numero i coppie consierazione el fatto ce il moello (9) è i tipo empirico, l insieme elle stime Ŷ utilizzate per interpolare il moello è stato eterminato in moo a incluere la maggiorparte elle stime pubblicate. Il prospetto 4 riporta i valori ei coefficienti a, b e ell inice i eterminazione R2 elle funzioni utilizzate per l interpolazione egli errori campionari elle stime i totali per area territoriale per famiglie e iniviui. Nel prospetto 5 sono riportati i valori elle stime Ŷ ottenuti in corrisponenza i valori tipici prefissati, inicati come ( Ŷ ), ell errore relativo percentuale ottenuti in base al moello (9); tutte le stime con valori superiori a a Ŷ, mentre le stime ce assumono valori inferiori a superiori a. I valori prefissati i presentano valori ell errore relativo inferiori Ŷ sono: 5, 10, 15, 20, 25, 30, 35 e 40%. presentano valori ell errore relativo