Strategia di campionamento e livello di precisione dei risultati

Documenti analoghi
Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

La strategia di campionamento 1

Nota metodologica. 1. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

Strategia di campionamento e livello di precisione dei risultati

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

L indagine Multiscopo I cittadini e il tempo libero

File di microdati per la ricerca. Aspetti della vita quotidiana Aspetti metodologici dell indagine

Nota informativa e strategia di campionamento

Strategia di campionamento e livello di precisione dei risultati

Nota metodologica. L indagine rientra tra quelle comprese nel Programma statistico (

Nota metodologica Premessa

File Standard. Indagine Multiscopo sulle Famiglie Famiglia e soggetti sociali Anno Manuale utente e tracciato record

Aspetti della vita quotidiana

Nota metodologica. Premessa

Nota metodologica. Premessa

FILE DATI. Indagine Multiscopo sulle Famiglie Aspetti della Vita quotidiana Anno Manuale utente e Tracciato record

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati 1. Premessa. Obiettivi dell indagine e domini di stima

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati

FRUIZIONE DELLE BIBLIOTECHE, LETTURA DI LIBRI E GENERI DI LIBRI LETTI, PRELETTURA DEI BAMBINI DI 3-5 ANNI. ANNO

Multiscopo ISTAT - Aspetti della vita quotidiana (2015)

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

Multiscopo ISTAT - Uso del tempo ( )

Percorsi di studio e di lavoro dei diplomati dell'anno 2007 (Indagine 2011)

Nota metodologica. Gli obiettivi conoscitivi dell indagine

Strategia di campionamento e valutazione degli errori campionari 1

Nota metodologica. Premessa

Nota metodologica. Premessa

L USO E L ABUSO DI ALCOL IN ITALIA

Nota metodologica. Parte seconda: Fattori di rischio e prevenzione propone indicatori su 2.1 Il tabagismo 2.2 Sovrappeso e obesità

Nota metodologica. Cenni sull indagine Viaggi e vacanze

Sicurezza delle donne (2006)

ESERCIZIO n.10. H 6cm d 2cm. d d d

Nota metodologica. Cenni sull indagine. Principali definizioni

STRATEGIA DI CAMPIONAMENTO E VALUTAZIONE DEGLI ERRORI CAMPIONARI 1

ESERCIZIO n.10. H 6cm d 2cm. d d d

LA PARTECIPAZIONE DEGLI ADULTI ALLE ATTIVITÀ FORMATIVE

Sistema statistico nazionale Istituto nazionale di statistica. Riponderazione. Note metodologiche. A cura di: Stefano Falorsi.

Nota metodologica. Premessa. Principali definizioni

Persone che hanno subito incidenti in. Regioni

Statistiche flash. La soddisfazione dei toscani per le condizioni di vita nel 2016

Esercizi svolti di geometria delle aree Alibrandi U., Fuschi P., Pisano A., Sofi A. ESERCIZIO n.6

Nota metodologica. Parte I: Il framework concettuale, i criteri di selezione del collettivo, le definizioni e gli indicatori utilizzati

ISTITUTO NAZIONALE DI STATISTICA

Nota metodologica. Gli obiettivi conoscitivi dell indagine

Indagine sulle forze di lavoro nel Comune di Firenze. Nota metodologica

Prodotto interno lordo per ripartizione geografica, in Italia e in Sardegna: variazioni percentuali 2005 su 2004

Progetto interdipartimentale Informazione statistica territoriale e settoriale per le politiche strutturali


Esercizi svolti di geometria delle aree Alibrandi U., Fuschi P., Pisano A., Sofi A. ESERCIZIO n.8

Consumi e povertà in Emilia-Romagna. Anno 2014

Esercizi S A 2.0 S B. =0.2; Metodo B: S B ii)

Gennaio-Febbraio 2018

Anno TOT CAPACITA' RICETTIVA FLUSSI TURISTICI 05/02/2019 TOTALE ITALIANI

Interventi di Upgrading di Impianti di Depurazione Esistenti

Esperimentazioni di Fisica 1. Prova d esame del 22 gennaio 2019 SOLUZIONI

Tavola 1 - Persone senza dimora per alcune caratteristiche - Anno 2011 (valori assoluti e composizione percentuale)

I primati di Bologna nel mercato del lavoro nel 2007

Gennaio-Novembre 2018

ESERCITAZIONE N 9 VALUTAZIONE DEL LIVELLO DI SERVIZIO DI UNA INTERSEZIONE A T SEMAFORIZZATA CON PRECEDENTE FASATURA DEL CICLO SEMAFORICO

I primati di Bologna nel mercato del lavoro nel 2006

12. Teoria qualitativa

Intersezione semaforizzata

Indici territoriali di ricorso civile per Cassazione

05. Errore campionario e numerosità campionaria

I primati di Bologna nel mercato del lavoro nel Maggio 2009

Valeria Ardito Servizio Statistica Regione Emilia-Romagna. Povertà e diseguaglianze sociali in Emilia-Romagna

8. Muri di sostegno e NTC 2008

Nota metodologica. Nord-est Centro Mezzogiorno Associazione riconosciuta

3. TARATURA DEL SISTEMA CVS Considerazioni generali

TIPI DI SPETTACOLO Rappresentazioni Biglietti venduti Presenze Spesa al botteghino (a) Spesa del pubblico (b) Volume di affari

Bologna, Quartiere fieristico, Maggio 2014: manifestazione dedicata alla sanità e all assistenza.

1. Allegato statistico: dettaglio dei dati per Regioni e Province Autonome

NOTA METODOLOGICA 1. La popolazione di studio

Affitti Quota Latte - Periodo 2014/2015

Indagine MET. Nota metodologica

Emilia Romagna 3,3% 5,3% 3,9% 3,2% 7,5% 4,62%

Approfondimento 1 - Rsu per comparto e per ripartizione geografica

Analisi del contenzioso tributario per valore della controversia

OCCUPATI E DISOCCUPATI

Consumi e povertà in Emilia-Romagna. Anno 2017

Nota di commento ai dati sulla soddisfazione dei cittadini. per le condizioni di vita Anno 2016

I TEST D IPOTESI. Dott.ssa Marta Di Nicola. Statistica inferenziale per variabili quantitative. Un problema pratico. Glicemia (mg/100cc)

File ad uso pubblico micro.stat

autosnodato auto-treno con rimorchio totale incidenti trattore stradale o motrice auto-articolato

Si considera un corpo solido a forma di parallelepipedo, di spessore d [m] e facce maggiori con superficie S [m 2 ], tale che sia T 1

2. Analisi di un sistema caotico

Presidenza del Consiglio dei Ministri

I Comuni italiani 2012

Allegato statistico Il dettaglio dei dati per Regioni e Province Autonome

I primati di Bologna nel mercato del lavoro nel 2005

Anno Regione Euro AL BE BG BM EL GA IB IG ND Totale 2017 PIEMONTE EURO

OCCUPATI E DISOCCUPATI

I principali risultati

Il mercato del lavoro nel 2010: la posizione di Bologna rispetto alle altre grandi città. Maggio 2011

Transcript:

Strategia i campionamento e livello i precisione ei risultati Introuzione L inagine campionaria Aspetti ella vita quotiiana fa parte i un sistema integrato i inagini sociali (Inagini multiscopo sulle famiglie). A partire al 993 l inagine viene svolta ogni anno e le informazioni raccolte consentono i conoscere le abituini ei cittaini e i problemi ce essi affrontano ogni giorno. Aree tematice su vari aspetti sociali si susseguono nei questionari: scuola, lavoro, vita familiare e i relazione, tempo libero (lettura, pratica sportiva, partecipazione a spettacoli fuori casa, ecc), fruizione i vecci e nuovi meia, partecipazione politica e sociale, salute, stili i vita e accesso ai servizi. Per quanto riguara la lettura i libri, l inagine rileva ogni anno informazioni sulla lettura i libri nel tempo libero, sul numero i libri letti e sulla otazione elle bibliotece omestice. Per lettori si intenono le persone i 6 anni e più ce anno letto almeno un libro per motivi non strettamente scolastici o professionali nei 2 mesi preceenti l intervista. Nel 200 l inagine è stata svolta a febbraio su un campione i 9 mila 720 famiglie (per un totale i 48mila 336 iniviui) istribuite in 834 comuni italiani i iversa ampiezza emografica. Le interviste sono state effettuate a rilevatori comunali presso l abitazione ella famiglia campione, estratta casualmente alle liste anagrafice el comune.. Obiettivi conoscitivi La popolazione i interesse ell inagine multiscopo Aspetti ella vita quotiiana, ossia l insieme elle unità statistice intorno alle quali si intene investigare, è costituita alle famiglie resienti in Italia e ai membri ce le compongono; sono pertanto esclusi i membri permanenti elle convivenze. La famiglia è intesa come famiglia i fatto, ossia un insieme i persone coabitanti e legate a vincoli i matrimonio, parentela, affinità, aozione, tutela o affettivi. Il perioo i riferimento è prevalentemente costituito ai oici mesi ce preceono l intervista, ance se per alcuni quesiti il riferimento è al momento ell intervista. I omini i stuio, ossia gli ambiti rispetto ai quali sono riferiti i parametri i popolazione oggetto i stima, sono: l intero territorio nazionale; le cinque ripartizioni geografice (Italia nor-occientale, Italia nor-orientale, Italia centrale, Italia meriionale, Italia insulare); le regioni geografice (a eccezione el Trentino-Alto Aige le cui stime sono prootte separatamente per le province i Bolzano e Trento); la tipologia comunale ottenuta suivieno i comuni italiani in sei classi formate in base a caratteristice socio-economice e emografice: A) comuni appartenenti all area metropolitana suivisi in: A, comuni centro ell area metropolitana: Torino, Milano, Venezia, Genova, Bologna, Firenze, Roma, Napoli, Bari, Palermo, Catania, Cagliari; A 2, comuni ce gravitano intorno ai comuni centro ell area metropolitana; B) comuni non appartenenti all area metropolitana suivisi in: B comuni aventi fino a 2.000 abitanti;

B 2 B 3 B 4 comuni con 2.00-0.000 abitanti; comuni con 0.00-50.000 abitanti; comuni con oltre 50.000 abitanti. 2. Strategia i campionamento 2. Descrizione generale el isegno i campionamento Il isegno i campionamento è i tipo complesso e si avvale i ue ifferenti scemi i campionamento. Nell ambito i ognuno ei omini efiniti all incrocio ella regione geografica con le sei aree A, A 2, B, B 2, B 3 e B 4, i comuni sono suivisi in ue sottoinsiemi sulla base ella popolazione resiente: l insieme ei comuni Auto rappresentativi (ce iniceremo ora in avanti come comuni Ar) costituito ai comuni i maggiore imensione emografica; l insieme ei comuni Non auto rappresentativi (o Nar) costituito ai rimanenti comuni. Nell ambito ell insieme ei comuni Ar, ciascun comune viene consierato come uno strato a se stante e viene aottato un isegno noto con il nome i campionamento a grappoli. Le unità primarie i campionamento sono rappresentate alle famiglie anagrafice, estratte in moo sistematico all anagrafe el comune stesso; per ogni famiglia anagrafica inclusa nel campione vengono rilevate le caratteristice oggetto i inagine i tutti i componenti i fatto appartenenti alla famiglia meesima. Nell ambito ei comuni Nar viene aottato un isegno a ue stai con stratificazione elle unità primarie. Le Unità primarie (Up) sono i comuni, le Unità seconarie sono le famiglie anagrafice; per ogni famiglia anagrafica inclusa nel campione vengono rilevate le caratteristice oggetto i inagine i tutti i componenti i fatto appartenenti alla famiglia meesima. I comuni vengono selezionati con probabilità proporzionali alla loro imensione emografica e senza reimmissione, mentre le famiglie vengono estratte con probabilità uguali e senza reimmissione. 2.2 Definizione ella imensione campionaria Per un inagine a obiettivi plurimi, come quella in esame, è poco realistico pensare i poter isegnare una strategia campionaria ce assicuri prefissati livelli i precisione i tutte le stime prootte. La questione è complicata al fatto ce l inagine a la finalità i eterminare stime per livelli territoriali ifferenti, il ce comporta l aozione i soluzioni i tipo ottimale iverse e contrastanti. A esempio, se l unico ambito territoriale i pubblicazione elle stime fosse quello nazionale, una soluzione approssimativamente ottimale sarebbe quella i eterminare la numerosità nazionale e ripartirla tra le regioni in moo proporzionale alla loro imensione emografica; viceversa, aveno la finalità i prourre stime con uguale attenibilità a livello regionale, una soluzione approssimativamente ottimale sarebbe quella i selezionare un campione uguale in tutte le regioni. Quest ultima soluzione, però, è poco efficiente per le stime a livello nazionale. Per affrontare questo problema, conformemente a quanto fatto in altri paesi, si è fatto ricorso a una strategia ce perviene alla efinizione ella numerosità campionaria attraverso approssimazioni successive. In base alle consierazioni preceenti si è eciso i aottare un ottica mista basata sia su criteri i costo e organizzativi, sia su una valutazione egli errori campionari elle principali stime a livello nazionale e con riferimento a ciascuno ei omini territoriali i interesse. I criteri seguiti possono essere sintetizzati nei seguenti punti: la imensione el campione teorico in termini i famiglie, prefissata a livello nazionale essenzialmente in base a criteri i costo e operativi, è pari a circa 24.000 famiglie; 2

il numero i comuni campione interessati non eve essere superiore a 900 in moo a consentire un buon lavoro i controllo e supervisione. L allocazione el campione i famiglie e i comuni tra le varie regioni è stata quini calcolata aottano un criterio i compromesso tale a garantire sia l affiabilità elle stime a livello nazionale ce quella elle stime a livello i ciascuno ei omini territoriali escritti nel paragrafo. 2.3 Stratificazione e selezione elle unità campionarie L obiettivo ella stratificazione è quello i formare gruppi (o strati) i unità caratterizzate, relativamente alle variabili oggetto inagine, a massima omogeneità interna agli strati e massima eterogeneità fra gli strati. Il raggiungimento i tale obiettivo si trauce in termini statistici in un guaagno nella precisione elle stime, ossia in una riuzione ell errore campionario a parità i numerosità campionaria. Nell inagine in esame, i comuni vengono stratificati in base alla loro imensione emografica e nel rispetto elle seguenti conizioni: autoponerazione el campione a livello regionale; selezione i un comune campione nell ambito i ciascuno strato efinito sui comuni ell insieme Nar; scelta i un numero minimo i famiglie a intervistare in ciascun comune campione; tale numero è stato posto pari a 23; formazione i strati aventi ampiezza approssimativamente costante in termini i popolazione resiente. Il proceimento i stratificazione, attuato all interno i ogni ominio territoriale iniviuato alle aree A, A 2, B, B 2, B 3 e B 4 i ciascuna regione geografica, si articola nelle seguenti fasi: orinamento ei comuni el ominio in orine ecrescente secono la loro imensione emografica in termini i popolazione resiente; eterminazione i una soglia i popolazione per la efinizione ei comuni Ar, meiante la relazione: r λ = m r δ f r in cui per la generica regione geografica r si è inicato con: m r il numero minimo i famiglie a intervistare in ciascun comune campione; r δ il numero meio i componenti per famiglia; r f la frazione i campionamento; suivisione i tutti i comuni nei ue sottoinsiemi Ar e Nar: i comuni i imensione superiore o uguale a r λ sono efiniti come comuni Ar e i rimanenti come Nar; suivisione ei comuni ell insieme Nar in strati aventi imensione, in termini i popolazione resiente, approssimativamente costante e all incirca pari alla soglia r λ. Effettuata la stratificazione, i comuni Ar sono inclusi con certezza nel campione; per quanto riguara, invece, i comuni Nar, nell ambito i ogni strato viene estratto un comune campione con probabilità proporzionale alla imensione emografica, meiante la proceura i selezione sistematica proposta a Maow. La selezione elle famiglie a intervistare in ogni comune campione viene effettuata alla lista anagrafica i ciascun comune senza reimmissione e con probabilità uguali. In particolare, la tecnica i selezione è i tipo sistematico e, nell ambito i ogni comune viene attuata attraverso le seguenti fasi: vengono messi in sequenza i fogli elle famiglie ell anagrafe el comune; r Maow, W.G. On te teory of systematic sampling II, Annals of Matematical Statistics, 20, (949): 333-354. 3

si calcola il passo i campionamento ei, come rapporto tra il numero elle famiglie resienti nel comune i ello strato e il corrisponente numero i famiglie campione, ei=mi/mi ; si selezionano le mi famiglie ce nella sequenza costruita al punto ) occupano le seguenti posizioni :, +ei, +2ei,..., +(mi-)ei. Nel prospetto viene riportata la istribuzione regionale ell universo e el campione ei comuni, elle famiglie e egli iniviui. PROSPETTO. DISTRIBUZIONE REGIONALE DEI COMUNI, DELLE FAMIGLIE E DEGLI INDIVIDUI NELL UNIVERSO E NEL CAMPIONE Anno 200 REGIONI Comuni Famiglie Iniviui Campione Universo Campione Universo (a) Campione Universo (a) Piemonte / Valle 'Aosta - Vallée 'Aoste 84.280.907 2.030 4.29 4.53 Lombaria 80.546.694 4.073 4.088 9.758 Trentino-Alto Aige 48 339.54 42 2.754.07 Veneto 54 58.29.963 2.797 4.866 Friuli-Venezia Giulia 32 29 749 540.735.220 Liguria 26 235 882 754.896.602 Emilia-Romagna 47 34.088.887 2.496 4.345 Toscana 49 287.066.557 2.543 3.705 Umbria 22 92 587 36.479 895 Marce 37 246 82 626 2.067.568 Lazio 34 378.7 2.387 2.754 5.637 Abruzzo 34 305 749 534.928.332 Molise 24 36 582 27.442 39 Campania 55 55.424 2.069 3.976 5.806 Puglia 50 258.0.527 2.875 4.069 Basilicata 25 3 577 233.486 587 Calabria 42 409 948 767 2.483 2.000 Sicilia 52 390.296.95 3.34 5.02 Saregna 39 377 795 658 2.004.664 Italia 834 8.0 9.720 24.465 48.336 59.939 (a) Stima Inagine multiscopo "Aspetti ella vita quotiiana", ati in migliaia. 2.4 Proceimento per il calcolo elle stime Le stime prootte all inagine sono essenzialmente stime i frequenze assolute e relative, riferite alle famiglie e agli iniviui. Le stime sono ottenute meiante uno stimatore i ponerazione vincolata, ce è il metoo i stima aottato per la maggior parte elle inagini Istat sulle imprese e sulle famiglie. Il principio su cui è basato ogni metoo i stima campionaria è ce le unità appartenenti al campione rappresentino ance le unità ella popolazione ce non sono incluse nel campione. Questo principio viene realizzato attribueno a ogni unità campionaria un peso ce inica il numero i unità ella popolazione rappresentata all unità meesima. Se, per esempio, a un unità campionaria viene attribuito un peso pari a 30, allora questa unità rappresenta se stessa e altre 29 unità ella popolazione ce non sono state incluse nel campione. Al fine i renere più ciara la successiva esposizione, introuciamo la seguente simbologia:, inice i livello territoriale i riferimento elle stime; i, inice i comune; j, inice i famiglia; p, inice i componente ella famiglia;, inice i strato i comuni; y, generica variabile oggetto i inagine; Yijp, valore i y osservato sul componente p ella famiglia j el comune i ello strato ; P ij P ij, numero i componenti ella famiglia j el comune i ello strato ; Y ij = Y ijp p= 4, totale ella variabile y osservato sulla famiglia j el comune i ello strato ; Mi, numero i famiglie resienti nel comune i ello strato ; mi, campione i famiglie nel comune i ello strato ; N, totale i

comuni nello strato ; n, numero i comuni campione nello strato (nell inagine in oggetto si a n = ); H, numero totale i strati nel generico ominio territoriale. Ipotizziamo i voler stimare, con riferimento a un generico ominio, il totale ella generica variabile y oggetto i inagine, espresso alla seguente relazione H N Mi Y =. () Y ij i= j= La stima el totale () è ata a H Ŷ =, esseno Ŷ = WijYij, (2) Ŷ n mi i= j= in cui Wij è il peso finale a attribuire a tutti i componenti ella famiglia j el comune i ello strato. Dalla preceente relazione si esume, quini, ce per ottenere la stima el totale () occorre moltiplicare il valore ella variabile y assunto a ciascuna unità campionaria per il peso i tale unità 2 e effettuare, a livello el ominio i interesse, la somma ei prootti così ottenuti. Il peso a attribuire alle unità campionarie è ottenuto per mezzo i una proceura complessa ce: corregge l effetto istorsivo ella mancata risposta totale ovuta all impossibilità i intervistare alcune elle famiglie selezionate per irreperibilità o per rifiuto all intervista; tiene conto ella conoscenza i totali noti i importanti variabili ausiliarie (isponibili a fonti esterne all inagine), nel senso ce le stime campionarie ei totali noti elle variabili ausiliarie evono coinciere con i valori noti egli stessi. Nell inagine in oggetto vengono efiniti per ciascuna regione geografica 8 totali noti, ce si riferiscono alla istribuzione ella popolazione regionale per sesso e sei classi i età 3 e ella popolazione regionale nelle sei aree A, A 2, B, B 2, B 3 e B 4. Inicano, quini, con k X (k=,,8) il totale noto ella k-esima variabile ausiliaria per la generica regione geografica e con k X ij il valore assunto alla k-esima variabile ausiliaria per la famiglia risponente ij, la conizione sopra escritta è espressa alla seguente uguaglianza k H n mi = kxˆ = Wijk Xij i= j= X (k=,., 8) in cui H inica il numero complessivo i strati efiniti nella regione. Se, a esempio, 6 X inica il numero i masci i età maggiore o uguale a sessantacinque anni, la variabile ausiliaria 6 X ij rappresenta il numero i masci i età maggiore o uguale a sessantacinque anni ella famiglia ij. La proceura ce consente i costruire i pesi finali a attribuire alle unità campionarie risponenti, è articolata nelle seguenti fasi: ) si calcolano i pesi iretti come reciproco ella probabilità i inclusione elle unità; 2) si calcolano i fattori correttivi per mancata risposta totale, come l inverso el tasso i risposta el comune cui ciascuna unità appartiene; 3) si ottengono i pesi base, o pesi corretti per mancata risposta totale, moltiplicano i pesi iretti per i corrisponenti fattori correttivi per mancata risposta totale; 4) si costruiscono i fattori correttivi ce consentono i soisfare, a livello regionale, la conizione i uguaglianza tra i totali noti elle variabili ausiliarie e le corrisponenti stime campionarie; 5) si calcolano, infine, i pesi finali meiante il prootto ei pesi base per i fattori correttivi ottenuti al passo 4. 2 Al fine i ottenere stime coerenti per iniviui e famiglie i pesi finali sono efiniti in moo tale ce a ciascuna famiglia ij e a tutti i componenti ella stessa sia assegnato un meesimo peso finale Wij. 3 Le classi i età consierate sono: 0-5 anni, 6-3 anni, 4-24 anni, 25-44 anni, 45-64 anni, 65 anni e più. 5

I fattori correttivi el passo 4 sono ottenuti alla risoluzione i un problema i minimo vincolato, in cui la funzione a minimizzare è una funzione i istanza (opportunamente prescelta) tra i pesi base e i pesi finali e i vincoli sono efiniti alla conizione i uguaglianza tra stime campionarie ei totali noti i popolazione e valori noti egli stessi. La funzione i istanza prescelta è la funzione logaritmica troncata; l aozione i tale funzione garantisce ce i pesi finali siano positivi e contenuti in un preeterminato intervallo i valori possibili, eliminano in tal moo i pesi positivi estremi (troppo grani o troppo piccoli). Tutti i metoi i stima ce scaturiscono alla risoluzione i un problema i minimo vincolato el tipo sopra escritto rientrano in una classe generale i stimatori nota come stimatori i ponerazione vincolata. 4 Un importante stimatore appartenente a tale classe, ce si ottiene utilizzano la funzione i istanza eucliea, è lo stimatore i regressione generalizzata. Come verrà ciarito meglio nel paragrafo 3, tale stimatore riveste un ruolo centrale percé è possibile imostrare ce tutti gli stimatori i ponerazione vincolata convergono asintoticamente, all aumentare ella numerosità campionaria, allo stimatore i regressione generalizzata. 3. Valutazione el livello i precisione elle stime 3. Metoologia i calcolo egli errori campionari Le principali statistice i interesse per valutare la variabilità campionaria elle stime prootte a un inagine sono l errore i campionamento assoluto e l errore i campionamento relativo. Inicano con Vˆ ar(ŷ ) la stima ella varianza ella generica stima Ŷ, la stima ell errore i campionamento assoluto i Ŷ si può ottenere meiante la seguente espressione: σ ˆ(Ŷ ) Vˆ ar(ŷ ) ; (3) = la stima ell errore i campionamento relativo i Ŷ è invece efinita all espressione: σˆ(ŷ ) ε ˆ(Ŷ ) =. (4) Ŷ Come è stato escritto nel paragrafo 2.4, le stime prootte all inagine sono state ottenute meiante uno stimatore i ponerazione vincolata efinito in base a una funzione i istanza i tipo logaritmico troncato. Poicé, lo stimatore aottato non è funzione lineare ei ati campionari, per la stima ella varianza Vˆ ar(ŷ ) si è utilizzato il metoo proposto a Wooruff; in base a tale metoo, ce ricorre all espressione linearizzata in serie i Taylor, è possibile ricavare la varianza i ogni stimatore non lineare (funzione regolare i totali) calcolano la varianza ell espressione linearizzata ottenuta. In particolare, per la efinizione ell espressione linearizzata ello stimatore ci si è riferiti allo stimatore i regressione generalizzata, sfruttano la convergenza asintotica i tutti gli stimatori i ponerazione vincolata a tale stimatore, poicé nel caso i stimatori i ponerazione vincolata ce utilizzano funzioni istanza ifferenti alla istanza eucliea (ce conuce allo stimatore i regressione generalizzata) non è possibile erivare l espressione linearizzata ello stimatore. L espressione linearizzata ello stimatore (2) è ata, quini, a: H Ŷ Ẑ = Ẑ, esseno Ẑ = ZijWij (5) n mi i= j= ove Z ij è la variabile linearizzata espressa come Z = β, esseno ( X,..., X,... ) ij= ij k ij K Xij ij Y ij X il vettore contenente i valori elle K (K=8) variabili ausiliarie, X ' ij 4 Nella letteratura in lingua anglosassone sull argomento tali stimatori sono noti come calibration estimators. 6

osservati per la generica famiglia ij e βˆ, il vettore ei coefficienti i regressione el moello lineare ce lega la variabile i interesse y alle K variabili ausiliarie x. In base alla (5), si a, quini, ce la stima ella varianza ella stima Ŷ è ottenuta meiante la seguente relazione Vˆ ar H ( Ŷ ) Vˆ ar( Ẑ ) = Vˆ ar( Ẑ ). (6) Dalla (6) risulta ce la stima ella varianza ella stima Ŷ viene calcolata come somma ella stima elle varianze ei singoli strati, Ar e Nar, appartenenti al ominio. La formula i calcolo ella varianza, ar( ) Vˆ Ẑ, ella stima Ẑ è ifferente a secona ce lo strato sia Ar oppure Nar. Possiamo, quini scomporre come segue Vˆ ar HAR H NAR ( Ŷ ) Vˆ ar( Ẑ ) = ˆ ar( Ẑ ) + Vˆ ar( Ẑ ) V, (7) in cui H AR e H NAR inicano rispettivamente il numero i strati Ar e Nar appartenenti al ominio. Negli strati Ar (in cui ciascun comune fa strato a sé e N = n =, l inice i i comune iviene superfluo e viene omesso) la varianza è stimata meiante la seguente espressione: H AR HAR 2 ( ) ( M m ) Ẑ = M ( m ) m ( ) 2 Zj Z V ˆ ar, (8) m j= ove si è posto M = Mi, mi m m =, Z j = Zij e Z = Zj. m j= Negli strati Nar, in cui viene estratto un solo comune campione a ogni strato, per stimare la varianza i campionamento si ricorre alla tecnica i collassamento egli strati. Questa tecnica consiste nel formare G gruppi contenenti ciascuno L g ( L g 2) strati; la varianza viene stimata meiante la formula seguente: H NAR Vˆ ar G ( Ẑ ) Vˆ ar( Ẑ ) G L L g g Ẑ g = g = Ẑg (9) L g g g L = = g ove le quantità sono espresse come: 2 Ẑ g m L i g mi = ZijWij e g = j= j= Ẑ Z W. ij ij Utilizzano le espressioni (8) e (9) è possibile, infine, calcolare la varianza i campionamento, Vˆ ar( Ŷ ), in base alla (7) e calcolare, quini, in base alla (3) e alla (4) rispettivamente l errore i campionamento assoluto e l errore i campionamento relativo. Gli errori campionari espressi alla (3) e alla (4) consentono i valutare il grao i precisione elle stime; inoltre, l errore assoluto permette i costruire un intervallo i confienza, ce, con livello i fiucia P contiene il parametro oggetto i stima, l intervallo viene espresso come: { Ŷ k σˆ(ŷ ) Y Ŷ + k σˆ(ŷ )} (0) p p Nella (0) il valore i k P ipene al valore fissato per la probabilità P; a esempio, per P=0.95 si a k=.96. 7

3.2 Fonamenti statistici ella proceura per il calcolo egli errori campionari Per il calcolo egli errori i campionamento elle inagini conotte all Istat sulle famiglie e sulle imprese viene correntemente utilizzata una proceura informatica sviluppata nell ambito ell Istituto. Nel paragrafo 3. è stata escritta la metoologia, implementata alla proceura, per il calcolo egli errori i campionamento elle stime prootte all inagine mentre, nel presente paragrafo, vengono iscussi i fonamenti statistici e i limiti ella metoologia meesima. Negli strati Ar, nei quali si aotta un isegno i campionamento a grappoli e in cui le unità primarie (le famiglie) vengono selezionate senza reimmissione e probabilità uguali, la proceura consente i ottenere stime ella varianza campionaria ce risultano corrette. Negli strati Nar, per i quali si aotta un isegno i campionamento a ue stai con selezione elle unità primarie (comuni) senza reimmissione e probabilità variabili, la proceura consente i ottenere stime corrette ella varianza campionaria qualora: in ciascuno strato sono selezionate ue o più unità primarie; le unità primarie sono scelte meiante estrazioni inipenenti. La prima conizione non viene soisfatta in quanto, nell inagine in oggetto, a ciascuno strato viene selezionato un solo comune campione e per stimare la varianza i campionamento si ricorre alla tecnica i collassamento egli strati. Questa tecnica, ce consiste nel formare superstrati contenenti ciascuno un numero i strati maggiore i uno, conuce in generale a una sovrastima ella varianza i campionamento effettiva. La secona ipotesi implica ce la selezione elle unità primarie venga effettuata con reimmissione. Ance questa assunzione non è soisfatta per i comuni Nar e ciò comporta una sovrastima ella varianza. Si osservi, tuttavia, ce tale sovrastima ipene alla frazione i campionamento i ciascuno strato Nar: è i entità trascurabile negli strati nei quali la frazione i campionamento è piccola, mentre viceversa può risultare i entità più cospicua per quegli strati in cui la frazione i campionamento è maggiore. 3.3 Presentazione sintetica egli errori campionari A ogni stima Ŷ corrispone un errore i campionamento relativo ε ˆ(Ŷ ) ; ciò significa ce per consentire una lettura corretta elle tabelle pubblicate sarebbe necessario presentare per ogni stima pubblicata il corrisponente errore i campionamento relativo. Ciò, tuttavia, non è possibile sia per limiti i tempo e i costi i elaborazione, sia percé le tavole ella pubblicazione risulterebbero appesantite e i non facile consultazione per l utente finale. Inoltre, non sarebbero comunque isponibili gli errori elle stime non pubblicate, ce l utente può ricavare in moo autonomo. Per le ragioni sopra esposte, si ricorre frequentemente a una presentazione sintetica egli errori relativi, basata sul metoo ei moelli regressivi. Questo metoo si basa sulla eterminazione i una funzione matematica ce mette in relazione ciascuna stima con il proprio errore relativo. Nella presente inagine, il moello utilizzato per le stime i frequenze assolute e relative, è el tipo seguente: 2 ( ˆ (Ŷ )) = a + b log(ŷ ) log ε () 8 ove i parametri a e b vengono stimati utilizzano il metoo ei minimi quarati. Nel prospetto 2 sono riportati i valori ei coefficienti a e b e ell inice i eterminazione R 2 el moello utilizzato per l interpolazione egli errori campionari i stime i frequenze assolute e relative, per totale Italia, ripartizione geografica, tipologia comunale e regione. Sulla base elle informazioni contenute in tale prospetto, è possibile calcolare la stima ell'errore i campionamento relativo i una eterminata stima i frequenza assoluta Ŷ meiante la formula: ( a b log(ŷ )) ε ˆ(Ŷ ) = exp + (2) ce si ricava facilmente alla ().

Se, per esempio, la stima Ŷ si riferisce agli iniviui ell Italia Nor occientale, l errore relativo corrisponente si ottiene introuceno nella (2) i valori ei parametri a e b riportati nella secona riga el prospetto 2 alla voce Persone (a = 8,886722, b = -,252). I prospetti 3 e 4, presentati in aggiunta, consentono i renere più agevole il calcolo egli errori campionari. Essi riguarano, rispettivamente, le famiglie e gli iniviui e anno la seguente struttura: a) in fiancata sono elencati i valori crescenti i stima (20.000, 30.000,, 25.000.000); b) le colonne successive contengono gli errori i campionamento relativo, per ciascun ominio territoriale i interesse, calcolati meiante la formula (2), corrisponenti alle stime i frequenze assolute ella prima colonna. Le informazioni contenute in tali prospetti permettono i calcolare l'errore relativo i una generica stima i frequenza assoluta (o relativa) meiante ue proceimenti ce risultano i facile applicazione, ance se conucono a risultati meno precisi i quelli ottenibili meiante l'espressione (2). Il primo metoo consiste nell iniviuare, nella prima colonna el prospetto, il livello i stima ce più si avvicina alla stima i interesse e nel consierare come errore relativo il valore ce si trova sulla stessa riga, nella colonna corrisponente al omino territoriale i riferimento. Con il secono metoo, l errore campionario ella stima espressione: Ŷ si ricava meiante la seguente k k εˆ(ŷ ) εˆ(ŷ ) k ε ˆ(Ŷ ) = εˆ(ŷ ) (Ŷ Ŷ ) (3) k k Ŷ Ŷ k k k ove Ŷ e Ŷ sono i valori elle stime, riportati nella prima colonna, entro i quali è compresa la k stima i interesse Ŷ, e ˆ(Ŷ k ε ) e ε ˆ(Ŷ ) i corrisponenti errori relativi. 9

PROSPETTO 2. VALORI DEI COEFFICIENTI A, B E DELL INDICE DI DETERMINAZIONE R 2 (%) DELLE FUNZIONI UTILIZZATE PER LE INTERPOLAZIONI DEGLI ERRORI CAMPIONARI DELLE STIME RIFERITE ALLE FAMIGLIE E ALLE PERSONE PER TOTALE ITALIA, RIPARTIZIONE GEOGRAFICA, TIPO DI COMUNE E REGIONE. Anno 200 ZONE TERRITORIALI Famiglie Persone a b R 2 (%) a b R 2 (%) ITALIA 9,79046754 -,8468267 94,98 8,370753437 -,073000042 96,2 RIPARTIZIONI GEOGRAFICHE Nor 9,9964993 -,92335627 93,54 8,6263730 -,0869259 94,57 Nor-ovest 9,554363336 -,6200688 92,52 8,92902629 -,0275997 92,5 Nor-est 8,55372038 -,2667789 96,96 8,520059446 -,06957328 95,55 Centro 9,7848867 -,67896279 97,4 0,079423 -,22085535 95,66 Mezzogiorno 9,02825684 -,6779526 95,7 8,298469 -,079284084 94,55 Su 8,672553852 -,384395 94,28 8,28546588 -,0866267 92,53 Isole 9,08568 -,8774798 96,6 8,2904207 -,09687498 95,38 TIPI DI COMUNE A 9,365573856 -,77007242 97,66 9,96957732 -,276250 96,57 A2 9,367943 -,59342043 87,30 7,850649447 -,09443433 88,0 B 6,935255674 -,008687922 86,20 6,990953397 -,0706845 9,39 B2 8,566485926 -,099253 93,02 7,96389679 -,047688348 92,99 B3 8,770725 -,34453926 96,99 8,356248078 -,089044735 95,44 B4 9,079477828 -,7825493 97,6 9,57492063 -,207966527 96,57 REGIONI Piemonte 8,6054237 -,40483665 97,30 9,485307758 -,204206324 94,24 Valle 'Aosta - Vallée 'Aoste 5,647678766 -,4574956 96,5 5,962600255 -,773794 94,69 Lombaria 9,70948335 -,60420667 92,46 8,822902433 -,0794377 9,75 Trentino-Alto Aige 7,389897 -,78052995 97,00 8,2654882 -,2920967 80,02 Bolzano - Bozen 7,39703603 -,202455939 95,77 7,75679244 -,24845007 9,9 Trento 7,450835283 -,9083677 96,44 7,9866553 -,274430209 83,43 Veneto 8,746842324 -,33683364 95,97 8,690069404 -,6305036 94,28 Friuli-Venezia Giulia 8,3855723 -,205558679 96,87 7,8267229 -,4372254 94,98 Liguria 8,352002356 -,8230477 96,79 8,28282537 -,6538374 95,75 Emilia-Romagna 8,8495285 -,46923 97,46 8,666657874 -,844374 95,69 Toscana 8,678568354 -,4826682 95,73 9,500360677 -,206884 94,93 Umbria 7,929068442 -,89325906 96,78 8,2980858 -,20578238 93,87 Marce 8,33298994 -,89084024 95,28 8,335302032 -,783027 94,65 Lazio 9,0294400 -,48326605 97,2 9,844528982 -,20956852 94,86 Abruzzo 7,724805004 -,24628896 94,6 8,29282962 -,75330854 9,56 Molise 6,6696656 -,845692 95,52 6,849549458 -,79837867 94,20 Campania 8,50268053 -,0999888 9,52 7,8298474 -,03422747 89,47 Puglia 9,056735208 -,20005566 95,97 8,73957398 -,4676856 94,26 Basilicata 7,743976642 -,279793 93,24 7,38060685 -,526828 92,09 Calabria 8,0369273 -,4709583 95,39 7,78454505 -,095447989 93,5 Sicilia 9,485858094 -,27899056 95,83 8,294425363 -,090239888 94,79 Saregna 8,45840768 -,94900066 96,8 8,245806054 -,56492 95,62 (a) Italia nor-occientale: Piemonte, Valle Aosta, Lombaria, Liguria; Italia nor-orientale: Bolzano, Trento, Veneto, Friuli-Venezia Giulia, Emilia-Romagna; Italia centrale: Toscana, Umbria, Marce, Lazio; Italia meriionale: Abruzzo, Molise, Campania, Puglia, Basilicata, Calabria; Italia insulare: Sicilia, Saregna. (b) Comuni tipo A: Area urbana centro; Tipo A2: Area urbana periferia; Tipo B: comuni fino a 2.000 abitanti; Tipo B2: a 2.00 a 0.000 abitanti; Tipo B3: a 0.00 a 50.000 abitanti; Tipo B4: oltre 50.000 abitanti. 0

PROSPETTO 3. VALORI INTERPOLATI DEGLI ERRORI CAMPIONARI RELATIVI PERCENTUALI DELLE STIME RIFERITE ALLE FAMIGLIE PER TOTALE ITALIA, RIPARTIZIONE GEOGRAFICA, TIPO DI COMUNE E REGIONE. Anno 200 STIME Italia Nor Norovest Nor-est Centro Mezzogiorno Su Isole A A2 B B2 B3 B4 20.000 38,0 38,9 37,7 27,9 30,2 29,0 27,2 26,2 3,8 34,7 2,7 29,6 28,3 27,4 30.000 29,9 30,5 29,7 22,2 23,8 22,9 2,6 20,6 25, 27,5 7,7 23,6 22,5 2,6 40.000 25,2 25,7 25,2 8,9 20,2 9,4 8,4 7,4 2,2 23,2 5,3 20, 9, 8,2 50.000 22, 22,5 22, 6,7 7,7 7,0 6,2 5,2 8,6 20,4 3,7 7,8 6,8 6,0 60.000 9,8 20,2 9,9 5, 5,9 5,3 4,6 3,7 6,7 8,4 2,5 6, 5,2 4,3 70.000 8, 8,4 8,2 3,8 4,5 4,0 3,3 2,5 5,2 6,8,5 4,7 3,9 3, 80.000 6,7 7,0 6,8 2,8 3,4 3,0 2,4,5 4, 5,6 0,8 3,7 2,9 2, 90.000 5,6 5,9 5,7 2,0 2,5 2,,6 0,7 3, 4,5 0,2 2,8 2,,3 00.000 4,6 4,9 4,8,3,8,4 0,9 0, 2,3 3,7 9,6 2,,4 0,6 200.000 9,7 9,9 9,9 7,7 7,9 7,6 7,3 6,7 8,2 9, 6,8 8,2 7,7 7, 300.000 7,6 7,7 7,8 6, 6,2 6,0 5,8 5,2 6,5 7,2 5,5 6,6 6, 5,6 400.000 6,4 6,5 6,6 5,2 5,3 5, 4,9 4,4 5,5 6, 4,8 5,6 5,2 4,7 500.000 5,6 5,7 5,8 4,6 4,6 4,5 4,4 3,9 4,8 5,4 4,3 4,9 4,6 4, 750.000 4,4 4,5 4,6 3,7 3,6 3,5 3,5 3,0 3,8 4,3 3,5 4,0 3,6 3,2.000.000 3,7 3,8 3,9 3, 3, 3,0 2,9 2,6 3,2 3,6 3,0 3,4 3, 2,7 2.000.000 2,5 2,5 2,6 2, 2, 2,0 2,0,7 2, 2,4 2, 2,3 2,,8 3.000.000 2,0 2,0 2,0,7,6,6,6,3,7,9 -,8,7,4 4.000.000,6,7,7,4,4,3,3 -,4 - -,6,4,2 5.000.000,4,4,5,3,2,2,2 - - - -,4,2, 7.500.000,,,2 - - 0,9 0,9 - - - -,,0-0.000.000,0,0 - - - - - - - - - - - - 5.000.000 0,8 0,8 - - - - - - - - - - - - 20.000.000 0,6 - - - - - - - - - - - - - 25.000.000 0,6 - - - - - - - - - - - - - STIME Piemonte Valle 'Aosta - Lombaria Vallée 'Aoste Trentino- Alto Aige Bolzano Trento Veneto Friuli- Venezia Giulia Liguria Emilia- Romagna Toscana Umbria 20.000 26, 5,8 4,0,8 0,5,4 28,9 6,9 8,7 28, 26,0 4,6 30.000 20,7 4,6 32,4 9,3 8,2 8,9 23,0 3,2 4,7 22,3 20,6,5 40.000 7,6 3,9 27,4 7,8 6,9 7,5 9,5, 2,4 8,9 7,5 9,7 50.000 5,5 3,4 24, 6,9 6,0 6,6 7,2 9,7 0,9 6,6 5,4 8,5 60.000 3,9 3, 2,7 6,2 5,4 5,9 5,5 8,7 9,7 5,0 3,8 7,6 70.000 2,8-9,8 5,6 4,9 5,4 4,2 7,9 8,9 3,7 2,7 6,9 80.000,8-8,3 5,2 4,6 5,0 3,2 7,3 8,2 2,7,7 6,4 90.000, - 7, 4,9 4,2 4,7 2,3 6,8 7,7,9,0 6,0 00.000 0,4-6, 4,6 4,0 4,4,6 6,4 7,2,2 0,3 5,6 200.000 7,0-0,8 3,0 2,6 2,9 7,8 4,2 4,8 7,5 6,9 3,7 300.000 5,6-8,5 2,4 - - 6,2 3,3 3,8 6,0 5,5 2,9 400.000 4,7-7,2 2,0 - - 5,3 2,8 3,2 5, 4,7 2,5 500.000 4,2-6,3 - - - 4,7 2,4 2,8 4,4 4, - 750.000 3,3-5,0 - - - 3,7,9 2,2 3,5 3,2 -.000.000 2,8-4,2 - - - 3, -,8 3,0 2,8-2.000.000,9-2,8 - - - 2, - - 2,0,8 - STIME Marce Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Saregna 20.000 7,9 30,9 8,2 8, 28,8 24,3,9 8,9 27,6 8,5 30.000 4,0 24,5 4,5 6,4 23,0 9, 9,3 5,0 2,6 4,5 40.000,8 20,7 2,3 5,4 9,6 6,0 7,8 2,7 8, 2,2 50.000 0,4 8,2 0,8 4,7 7,3 4,0 6,8,2 5,8 0,7 60.000 9,3 6,4 9,8 4,2 5,7 2,6 6, 0, 4, 9,6 70.000 8,5 5,0 9,0 3,9 4,4,5 5,6 9,2 2,9 8,8 80.000 7,8 3,9 8,3 3,6 3,3 0,6 5, 8,5,9 8, 90.000 7,3 3,0 7,8 3,3 2,5 9,9 4,8 8,0,0 7,5 00.000 6,9 2,3 7,3 3,,8 9,3 4,5 7,5 0,4 7, 200.000 4,5 8,2 5,0 2, 8,0 6, 3,0 5, 6,8 4,7 300.000 3,6 6,5 4,0-6,4 4,8 2,3 4,0 5,3 3,7 400.000 3,0 5,5 3,4-5,5 4,0-3,4 4,5 3, 500.000 2,6 4,9 3,0-4,8 3,5-3,0 3,9 2,7 750.000 2, 3,9 2,4-3,9 2,8-2,4 3,0 2,.000.000-3,3 - - 3,3 2,3 - - 2,5-2.000.000-2,2 - - 2,2 - - -,7 -

PROSPETTO 4. VALORI INTERPOLATI DEGLI ERRORI CAMPIONARI RELATIVI PERCENTUALI DELLE STIME RIFERITE ALLE PERSONE PER TOTALE ITALIA, RIPARTIZIONE GEOGRAFICA, TIPO DI COMUNE E REGIONE. Anno 200 STIME Italia Nor Norovest Nor-est Centro Mezzogiorno Su Isole A A2 B B2 B3 B4 20.000 32,4 34,5 36,9 29,5 29, 29,5 29,0 27,6 35,2 32,5 2,4 29,9 29,7 30,3 30.000 26,0 27,7 29,5 23,6 23,4 23,6 23,3 22, 27,5 26,5 7,4 24,2 23,8 23,7 40.000 22,3 23,7 25,2 20, 20,0 20, 9,9 8,9 23, 22,9 5, 20,8 20,4 9,9 50.000 9,8 2,0 22,3 7,8 7,7 7,8 7,6 6,7 20, 20,4 3,4 8,5 8,0 7,4 60.000 8,0 9,0 20,2 6, 6, 6, 6,0 5, 8,0 8,6 2,3 6,8 6,3 5,6 70.000 6,5 7,5 8,5 4,7 4,8 4,8 4,7 3,9 6,4 7,2,3 5,5 5,0 4,2 80.000 5,4 6,2 7,2 3,7 3,8 3,7 3,7 2,9 5, 6, 0,6 4,5 4,0 3, 90.000 4,4 5,2 6, 2,8 2,9 2,8 2,8 2, 4, 5, 0,0 3,6 3, 2,2 00.000 3,7 4,4 5,2 2, 2,2 2, 2,,4 3,2 4,3 9,4 2,9 2,4,5 200.000 9,4 9,9 0,4 8,2 8,4 8,3 8,3 7,8 8,7 0, 6,6 9,0 8,5 7,5 300.000 7,6 7,9 8,3 6,6 6,7 6,6 6,7 6,3 6,8 8,2 5,4 7,2 6,8 5,9 400.000 6,5 6,8 7, 5,6 5,8 5,6 5,7 5,3 5,7 7, 4,7 6,2 5,8 5,0 500.000 5,8 6,0 6,3 5,0 5, 5,0 5,0 4,7 5,0 6,3 4,2 5,5 5, 4,3 750.000 4,6 4,8 5,0 4,0 4, 4,0 4,0 3,8 3,9 5, 3,4 4,5 4, 3,4.000.000 4,0 4, 4,3 3,4 3,5 3,4 3,5 3,2 3,3 4,4 2,9 3,9 3,5 2,9 2.000.000 2,7 2,8 2,9 2,3 2,4 2,3 2,4 2,2 2, 3, 2, 2,7 2,4,9 3.000.000 2,2 2,3 2,3,8,9,8,9,8,7 2,5,7 2,2,9,5 4.000.000,9,9 2,0,6,7,6,6,5,4 2,2,4,9,7,2 5.000.000,7,7,8,4,5,4,4,3,2 2,0 -,7,5, 7.500.000,3,4,4,,2,,2,,0,6 -,3,2 0,8 0.000.000,2,2,2 0,9,0 0,9,0-0,8 - -,2,0 0,7 5.000.000 0,9 0,9,0 0,8 0,8 0,8 0,8 - - - - 0,9 0,8 0,6 20.000.000 0,8 0,8 0,8-0,7 0,6 - - - - - - - - 25.000.000 0,7 0,7 - - 0,6 0,6 - - - - - - - - STIME Piemonte Valle 'Aosta - Lombaria Vallée 'Aoste Trentino- Alto Aige Bolzano Trento Veneto Friuli- Venezia Giulia Liguria Emilia- Romagna Toscana Umbria 20.000 29,5 5,8 39,3 0,4 0,0 9,9 30,6 7,4 9,6 30,0 29,3 5,6 30.000 23, 4,6 3,6 8,0 7,8 7,6 24,4 3,8 5,5 23,9 23,0 2,2 40.000 9,4 3,9 27,0 6,7 6,5 6,3 20,8,7 3, 20,4 9,3 0,2 50.000 7,0 3,4 24,0 5,8 5,6 5,5 8,4 0,3,5 8,0 6,9 9,0 60.000 5,2 3,0 2,7 5, 5,0 4,9 6,6 9,3 0,3 6,2 5, 8,0 70.000 3,9 2,8 20,0 4,6 4,6 4,4 5,2 8,5 9,4 4,9 3,8 7,3 80.000 2,8 2,6 8,6 4,3 4,2 4, 4, 7,9 8,7 3,8 2,7 6,7 90.000,9 2,4 7,5 3,9 3,9 3,8 3,2 7,4 8,2 2,9,8 6,3 00.000,2 2,2 6,5 3,7 3,7 3,5 2,5 6,9 7,7 2,2, 5,9 200.000 7,4,5,3 2,4 2,4 2,3 8,5 4,7 5, 8,3 7,3 3,9 300.000 5,8-9,,8,8,8 6,8 3,7 4,0 6,6 5,7 3,0 400.000 4,9-7,8,5,5,5 5,8 3, 3,4 5,6 4,8 2,6 500.000 4,2-6,9 -,3,3 5, 2,8 3,0 5,0 4,2 2,2 750.000 3,3-5,6 - -,0 4, 2,2 2,4 4,0 3,3,8.000.000 2,8-4,8 - - - 3,5,9 2,0 3,4 2,8,5 2.000.000,8-3,3 - - - 2,3,2,3 2,3,8-3.000.000,4-2,6 - - -,9 - -,8,4-4.000.000,2-2,3 - - -,6 - -,6,2-5.000.000, - 2,0 - - -,4 - -,4 - - 2

PROSPETTO 4 SEGUE. VALORI INTERPOLATI DEGLI ERRORI CAMPIONARI RELATIVI PERCENTUALI DELLE STIME RIFERITE ALLE PERSONE PER TOTALE ITALIA, RIPARTIZIONE GEOGRAFICA, TIPO DI COMUNE E REGIONE. Anno 200 STIME Marce Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Saregna 20.000 8,9 35,7 8,8 8,9 30,3 27, 2,9 20,9 28,6 20,6 30.000 4,9 28,0 4,8 7,0 24,6 2,5 0,2 6,7 22,9 6,3 40.000 2,6 23,5 2,5 5,9 2,2 8,2 8,7 4,3 9,6 3,8 50.000,0 20,6 0,9 5,2 8,9 6,0 7,6 2,7 7,4 2,2 60.000 9,9 8,5 9,8 4,7 7,2 4,4 6,9,5 5,7 0,9 70.000 9,0 6,8 9,0 4,3 5,9 3,2 6,3 0,5 4,5 0,0 80.000 8,3 5,5 8,3 3,9 4,8 2,2 5,8 9,8 3,4 9,3 90.000 7,8 4,5 7,8 3,7 4,0,4 5,4 9,2 2,6 8,7 00.000 7,3 3,6 7,3 3,4 3,2 0,8 5, 8,7,9 8,2 200.000 4,9 9,0 4,8 2,3 9,3 7,2 3,4 5,9 8,2 5,5 300.000 3,8 7,0 3,8,8 7,5 5,7 2,7 4,7 6,5 4,3 400.000 3,2 5,9 3,2-6,5 4,9 2,3 4, 5,6 3,7 500.000 2,8 5,2 2,8-5,8 4,3 2,0 3,6 4,9 3,2 750.000 2,2 4,0 2,2-4,7 3,4,6 2,9 4,0 2,6.000.000,9 3,4,9-4,0 2,9-2,5 3,4 2,2 2.000.000,3 2,2,3-2,8,9 -,7 2,3,5 3.000.000 -,8 - - 2,3,5 - -,9-4.000.000 -,5 - - 2,0,3 - -,6-5.000.000 -,3 - -,8, - -,4-3.4 Esempi i calcolo egli errori campionari 3.4. Esempi relativi alle stime elle famiglie Esempio Nel 200, nel Lazio le famiglie ce possieono oltre 400 libri sono 268.000. Si cerca il livello i stima ce più si avvicina a 268.000 nella colonna corrisponente alla regione Lazio el prospetto 3. L errore relativo percentuale ella stima consierata è pari a 6,5%. L errore assoluto sarà: σ(268.000) = 0,065 x 268.000= 7.420 L intervallo i confienza avrà come estremi : 268.000 - (,96 x 7.420) = 233.857 268.000 + (,96 x 7.420) = 302.43 Esempio 2 Consierano la stima preceente si possono ottenere valori più precisi ell errore i campionamento operano meiante interpolazione lineare ei ue livelli i stima consecutivi tra i quali è compreso il valore ella stessa. Tali livelli sono 200.000 e 300.000 ai quali corrisponono i valori percentuali 8,2% e 6,5%. L errore relativo corrisponente a 268.000 è pari a: 3

σ(268.000) = 8,2 { [ (8,2 6,5) / ( 300.000 200.000) ] x ( 268.000 200.000) } = 7,0% Il corrisponente errore assoluto è 0,070 x 268.000 = 8.760 e l intervallo i confienza avrà come estremi: 268.000 - (,96 x 8.760) = 23.230 268.000 + (,96 x 8.760) = 304.770 Esempio 3 Il calcolo ell errore può essere effettuato, irettamente, tramite la funzione interpolante: ε ˆ (Ŷ) = exp + ( a b log(ŷ) ) i cui parametri, riportati nel prospetto 2 alla riga Lazio, sono i seguenti: a = 9,02944 b = -,48326. Per Ŷ = 268.000 si a: ( 9,02944 -,48326 log(268.000) ) 0,070. ˆ ε ( Yˆ) = exp = L errore relativo percentuale è quini pari al 7,0% e il calcolo ell errore assoluto e ell intervallo i confienza è el tutto analogo a quello egli esempi e 2. 3.4.2 Esempi relativi alle stime elle persone Esempio Nel 200, in Italia le persone tra i 20 e 24 anni ce anno letto almeno un libro negli ultimi 2 mesi preceenti l intervista sono.67.000. Si cerca il livello i stima ce più si avvicina a.67.000 nella prima colonna el prospetto 4 per il totale Italia. L errore relativo percentuale ella stima consierata è pari a 2,7 %. L errore assoluto sarà: σ(.67.000) = 0,027 x.67.000= 43.659 L intervallo i confienza avrà come estremi :.67.000 - (,96 x 43.659) =.53.428.67.000 + (,96 x 43.659) =.702.572 Esempio 2 Consierano la stima preceente si possono ottenere valori più precisi ell errore i campionamento operano meiante interpolazione lineare ei ue livelli i stima consecutivi tra i quali è compreso il valore ella stessa. Tali livelli sono.000.000 e 2.000.000 ai quali corrisponono i valori percentuali 4,0% e 2,7%. L errore relativo corrisponente a.67.000 è pari a : 4

σ(.67.000) = 4,0 { [ (4,0 2,7) / ( 2.000.000.000.000) ] x (.67.000.000.000) } = 3,2% Il corrisponente errore assoluto è 0,032 x.67.000 = 5.744 e l intervallo i confienza avrà come estremi:.67.000 - (,96 x 5.744) =.55.582.67.000 +(,96 x 5.744) =.78.48 Esempio 3 Il calcolo ell errore può essere effettuato, irettamente, tramite la funzione interpolante: ε ˆ (Ŷ) = exp + ( a b log(ŷ) ) i cui parametri, riportati nel prospetto 2 alla riga Italia, sono i seguenti: a = 8,370753 b = -,073000. Per Ŷ =.67.000 si a: ( 8,370753 -,073000 log(.67.000) ) 0,03. ˆ ε ( Yˆ) = exp = L errore relativo percentuale è quini pari al 3,% e il calcolo ell errore assoluto e ell intervallo i confienza è el tutto analogo a quello egli esempi e 2. 5