Strategia di campionamento e livello di precisione dei risultati

Documenti analoghi
Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

Strategia di campionamento e livello di precisione dei risultati

La strategia di campionamento 1

Strategia di campionamento e livello di precisione dei risultati

Nota metodologica. 1. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

L indagine Multiscopo I cittadini e il tempo libero

Nota informativa e strategia di campionamento

File di microdati per la ricerca. Aspetti della vita quotidiana Aspetti metodologici dell indagine

Strategia di campionamento e livello di precisione dei risultati

Nota metodologica Premessa

File Standard. Indagine Multiscopo sulle Famiglie Famiglia e soggetti sociali Anno Manuale utente e tracciato record

Nota metodologica. Premessa

Aspetti della vita quotidiana

Nota metodologica. L indagine rientra tra quelle comprese nel Programma statistico (

Nota metodologica. Premessa

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati 1. Premessa. Obiettivi dell indagine e domini di stima

FILE DATI. Indagine Multiscopo sulle Famiglie Aspetti della Vita quotidiana Anno Manuale utente e Tracciato record

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati

Aspetti della vita quotidiana (2016)

Multiscopo ISTAT - Uso del tempo ( )

Nota metodologica. Strategia di campionamento e livello di precisione dei risultati dell indagine Multiscopo Aspetti della vita quotidiana

FRUIZIONE DELLE BIBLIOTECHE, LETTURA DI LIBRI E GENERI DI LIBRI LETTI, PRELETTURA DEI BAMBINI DI 3-5 ANNI. ANNO

Percorsi di studio e di lavoro dei diplomati dell'anno 2007 (Indagine 2011)

Multiscopo ISTAT - Aspetti della vita quotidiana (2015)

Strategia di campionamento e valutazione degli errori campionari 1

Nota metodologica. Gli obiettivi conoscitivi dell indagine

Nota metodologica. Premessa

Nota metodologica. Premessa

Nota metodologica. Parte seconda: Fattori di rischio e prevenzione propone indicatori su 2.1 Il tabagismo 2.2 Sovrappeso e obesità

L USO E L ABUSO DI ALCOL IN ITALIA

Nota metodologica. Cenni sull indagine Viaggi e vacanze

ESERCIZIO n.10. H 6cm d 2cm. d d d

Sicurezza delle donne (2006)

STRATEGIA DI CAMPIONAMENTO E VALUTAZIONE DEGLI ERRORI CAMPIONARI 1

ESERCIZIO n.10. H 6cm d 2cm. d d d

Nota metodologica. Cenni sull indagine. Principali definizioni

Sistema statistico nazionale Istituto nazionale di statistica. Riponderazione. Note metodologiche. A cura di: Stefano Falorsi.

LA PARTECIPAZIONE DEGLI ADULTI ALLE ATTIVITÀ FORMATIVE

Persone che hanno subito incidenti in. Regioni

Nota metodologica. Premessa. Principali definizioni

Statistiche flash. La soddisfazione dei toscani per le condizioni di vita nel 2016

ISTITUTO NAZIONALE DI STATISTICA

Indagine sulle forze di lavoro nel Comune di Firenze. Nota metodologica

Esercizi svolti di geometria delle aree Alibrandi U., Fuschi P., Pisano A., Sofi A. ESERCIZIO n.6

Nota metodologica. Parte I: Il framework concettuale, i criteri di selezione del collettivo, le definizioni e gli indicatori utilizzati

ESERCIZIO n.9. B 7cm H 3cm. b 3cm d 1cm. c 2cm. d d d

Nota metodologica. Gli obiettivi conoscitivi dell indagine


Prodotto interno lordo per ripartizione geografica, in Italia e in Sardegna: variazioni percentuali 2005 su 2004

Esercizi svolti di geometria delle aree Alibrandi U., Fuschi P., Pisano A., Sofi A. ESERCIZIO n.8

Gennaio-Febbraio 2018

Anno TOT CAPACITA' RICETTIVA FLUSSI TURISTICI 05/02/2019 TOTALE ITALIANI

Interventi di Upgrading di Impianti di Depurazione Esistenti

Progetto interdipartimentale Informazione statistica territoriale e settoriale per le politiche strutturali

Esercizi S A 2.0 S B. =0.2; Metodo B: S B ii)

Esperimentazioni di Fisica 1. Prova d esame del 22 gennaio 2019 SOLUZIONI

Gennaio-Novembre 2018

Metodi Statistici per il Marketing. #06 Elementi di statistica inferenziale e di teoria dei campioni

12. Teoria qualitativa

Tavola 1 - Persone senza dimora per alcune caratteristiche - Anno 2011 (valori assoluti e composizione percentuale)

PRIMA SCRITTA DEL MODULO DI

Indici territoriali di ricorso civile per Cassazione

3. TARATURA DEL SISTEMA CVS Considerazioni generali

STIMA DEGLI OCCUPATI RESIDENTI E

Valeria Ardito Servizio Statistica Regione Emilia-Romagna. Povertà e diseguaglianze sociali in Emilia-Romagna

I primati di Bologna nel mercato del lavoro nel 2007

Consumi e povertà in Emilia-Romagna. Anno 2014

1 di 27 29/12/2018, 00:01

Affitti Quota Latte - Periodo 2014/2015

1. Allegato statistico: dettaglio dei dati per Regioni e Province Autonome

Nota metodologica. Nord-est Centro Mezzogiorno Associazione riconosciuta

Atto n.974 "L'impatto sul mercato del lavoro della quarta rivoluzione industriale" Competenze digitali e E-commerce

Analisi del contenzioso tributario per valore della controversia

8. Muri di sostegno e NTC 2008

NOTA METODOLOGICA 1. La popolazione di studio

autosnodato auto-treno con rimorchio totale incidenti trattore stradale o motrice auto-articolato

ESERCITAZIONE N 9 VALUTAZIONE DEL LIVELLO DI SERVIZIO DI UNA INTERSEZIONE A T SEMAFORIZZATA CON PRECEDENTE FASATURA DEL CICLO SEMAFORICO

Emilia Romagna 3,3% 5,3% 3,9% 3,2% 7,5% 4,62%

Presidenza del Consiglio dei Ministri

Allegato statistico Il dettaglio dei dati per Regioni e Province Autonome

I primati di Bologna nel mercato del lavoro nel 2006

Anno Regione Euro AL BE BG BM EL GA IB IG ND Totale 2017 PIEMONTE EURO

Indagine MET. Nota metodologica

Struttura Ex asl impegni prestazioni costo prestazioni Ticket Regione H , ,76 Basilicata H

Istituzione delle direzioni generali regionali dell organizzazione giudiziaria

Si considera un corpo solido a forma di parallelepipedo, di spessore d [m] e facce maggiori con superficie S [m 2 ], tale che sia T 1

I primati di Bologna nel mercato del lavoro nel Maggio 2009

Intersezione semaforizzata

Approfondimento 1 - Rsu per comparto e per ripartizione geografica

OCCUPATI E DISOCCUPATI

I principali risultati

2. Analisi di un sistema caotico

Transcript:

Strategia i campionamento e livello i precisione ei risultati. Obiettivi conoscitivi La popolazione i interesse ell inagine multiscopo Aspetti ella vita quotiiana, ossia l insieme elle unità statistice intorno alle quali si intene investigare, è costituita alle famiglie resienti in Italia e ai membri ce le compongono; sono pertanto esclusi i membri permanenti elle convivenze. La famiglia è intesa come famiglia i fatto, ossia un insieme i persone coabitanti e legate a vincoli i matrimonio, parentela, affinità, aozione, tutela o affettivi. Il perioo i riferimento è prevalentemente costituito ai oici mesi ce preceono l intervista, ance se per alcuni quesiti il riferimento è al momento ell intervista. I omini i stuio, ossia gli ambiti rispetto ai quali sono riferiti i parametri i popolazione oggetto i stima, sono: l intero territorio nazionale; le cinque ripartizioni geografice (Italia nor-occientale, Italia nor-orientale, Italia centrale, Italia meriionale, Italia insulare); le regioni geografice (a eccezione el Trentino-Alto Aige le cui stime sono prootte separatamente per le province i Bolzano e Trento); la tipologia comunale ottenuta suivieno i comuni italiani in sei classi formate in base a caratteristice socio-economice e emografice: A) comuni appartenenti all area metropolitana suivisi in: A, comuni centro ell area metropolitana: Torino, Milano, Venezia, Genova, Bologna, Firenze, Roma, Napoli, Bari, Palermo, Catania, Cagliari; A 2, comuni ce gravitano intorno ai comuni centro ell area metropolitana; B) comuni non appartenenti all area metropolitana suivisi in: B comuni aventi fino a 2.000 abitanti; B2 comuni con 2.00-0.000 abitanti; B3 comuni con 0.00-50.000 abitanti; comuni con oltre 50.000 abitanti. B4 2. Strategia i campionamento 2. Descrizione generale el isegno i campionamento Il isegno i campionamento è i tipo complesso e si avvale i ue ifferenti scemi i campionamento. Nell ambito i ognuno ei omini efiniti all incrocio ella regione geografica con le sei aree A, A 2, B, B 2, B3 e B 4, i comuni sono suivisi in ue sottoinsiemi sulla base ella popolazione resiente: l insieme ei comuni Auto rappresentativi (ce iniceremo ora in avanti come comuni Ar) costituito ai comuni i maggiore imensione emografica; l insieme ei comuni Non auto rappresentativi (o Nar) costituito ai rimanenti comuni. Nell ambito ell insieme ei comuni Ar, ciascun comune viene consierato come uno strato a se stante e viene aottato un isegno noto con il nome i campionamento a grappoli. Le unità primarie i campionamento sono rappresentate alle famiglie anagrafice, estratte in moo sistematico all anagrafe el comune stesso; per

ogni famiglia anagrafica inclusa nel campione vengono rilevate le caratteristice oggetto i inagine i tutti i componenti i fatto appartenenti alla famiglia meesima. Nell ambito ei comuni Nar viene aottato un isegno a ue stai con stratificazione elle unità primarie. Le Unità primarie (Up) sono i comuni, le Unità seconarie sono le famiglie anagrafice; per ogni famiglia anagrafica inclusa nel campione vengono rilevate le caratteristice oggetto i inagine i tutti i componenti i fatto appartenenti alla famiglia meesima. I comuni vengono selezionati con probabilità proporzionali alla loro imensione emografica e senza reimmissione, mentre le famiglie vengono estratte con probabilità uguali e senza reimmissione. 2.2 Definizione ella imensione campionaria Per un inagine a obiettivi plurimi, come quella in esame, è poco realistico pensare i poter isegnare una strategia campionaria ce assicuri prefissati livelli i precisione i tutte le stime prootte. La questione è complicata al fatto ce l inagine a la finalità i eterminare stime per livelli territoriali ifferenti, il ce comporta l aozione i soluzioni i tipo ottimale iverse e contrastanti. A esempio, se l unico ambito territoriale i pubblicazione elle stime fosse quello nazionale, una soluzione approssimativamente ottimale sarebbe quella i eterminare la numerosità nazionale e ripartirla tra le regioni in moo proporzionale alla loro imensione emografica; viceversa, aveno la finalità i prourre stime con uguale attenibilità a livello regionale, una soluzione approssimativamente ottimale sarebbe quella i selezionare un campione uguale in tutte le regioni. Quest ultima soluzione, però, è poco efficiente per le stime a livello nazionale. Per affrontare questo problema, conformemente a quanto fatto in altri paesi, si è fatto ricorso a una strategia ce perviene alla efinizione ella numerosità campionaria attraverso approssimazioni successive. In base alle consierazioni preceenti si è eciso i aottare un ottica mista basata sia su criteri i costo e organizzativi, sia su una valutazione egli errori campionari elle principali stime a livello nazionale e con riferimento a ciascuno ei omini territoriali i interesse. I criteri seguiti possono essere sintetizzati nei seguenti punti: la imensione el campione teorico in termini i famiglie, prefissata a livello nazionale essenzialmente in base a criteri i costo e operativi, è pari a circa 24.000 famiglie; il numero i comuni campione interessati non eve essere superiore a 900 in moo a consentire un buon lavoro i controllo e supervisione. L allocazione el campione i famiglie e i comuni tra le varie regioni è stata quini calcolata aottano un criterio i compromesso tale a garantire sia l affiabilità elle stime a livello nazionale ce quella elle stime a livello i ciascuno ei omini territoriali escritti nel paragrafo. 2.3 Stratificazione e selezione elle unità campionarie L obiettivo ella stratificazione è quello i formare gruppi (o strati) i unità caratterizzate, relativamente alle variabili oggetto inagine, a massima omogeneità interna agli strati e massima eterogeneità fra gli strati. Il raggiungimento i tale obiettivo si trauce in termini statistici in un guaagno nella precisione elle stime, ossia in una riuzione ell errore campionario a parità i numerosità campionaria. Nell inagine in esame, i comuni vengono stratificati in base alla loro imensione emografica e nel rispetto elle seguenti conizioni: autoponerazione el campione a livello regionale; selezione i un comune campione nell ambito i ciascuno strato efinito sui comuni ell insieme Nar; scelta i un numero minimo i famiglie a intervistare in ciascun comune campione; tale numero è stato posto pari a 23; formazione i strati aventi ampiezza approssimativamente costante in termini i popolazione resiente. Il proceimento i stratificazione, attuato all interno i ogni ominio territoriale iniviuato alle aree A, A 2, B, B 2, B 3 e B 4 i ciascuna regione geografica, si articola nelle seguenti fasi: orinamento ei comuni el ominio in orine ecrescente secono la loro imensione emografica in 2

termini i popolazione resiente; eterminazione i una soglia i popolazione per la efinizione ei comuni Ar, meiante la relazione: r λ = r m r r f δ in cui per la generica regione geografica r si è inicato con: m r il numero minimo i famiglie a intervistare in ciascun comune campione; r δ il numero meio i componenti per famiglia; r f la frazione i campionamento; suivisione i tutti i comuni nei ue sottoinsiemi Ar e Nar: i comuni i imensione superiore o uguale a r λ sono efiniti come comuni Ar e i rimanenti come Nar; suivisione ei comuni ell insieme Nar in strati aventi imensione, in termini i popolazione resiente, approssimativamente costante e all incirca pari alla soglia r λ. Effettuata la stratificazione, i comuni Ar sono inclusi con certezza nel campione; per quanto riguara, invece, i comuni Nar, nell ambito i ogni strato viene estratto un comune campione con probabilità proporzionale alla imensione emografica, meiante la proceura i selezione sistematica proposta a Maow. La selezione elle famiglie a intervistare in ogni comune campione viene effettuata alla lista anagrafica i ciascun comune senza reimmissione e con probabilità uguali. In particolare, la tecnica i selezione è i tipo sistematico e, nell ambito i ogni comune viene attuata attraverso le seguenti fasi: vengono messi in sequenza i fogli elle famiglie ell anagrafe el comune; si calcola il passo i campionamento ei, come rapporto tra il numero elle famiglie resienti nel comune i ello strato e il corrisponente numero i famiglie campione, ei=mi/mi ; si selezionano le mi famiglie ce nella sequenza costruita al punto ) occupano le seguenti posizioni :, +ei, +2ei,..., +(mi-)ei. Nel prospetto viene riportata la istribuzione regionale ell universo e el campione ei comuni, elle famiglie e egli iniviui. Maow, W.G. On te teory of systematic sampling II, Annals of Matematical Statistics, 20, (949): 333-354. 3

Prospetto Distribuzione regionale ei comuni, elle famiglie e egli iniviui nell universo e nel campione Anno 200 REGIONI Comuni Famiglie Iniviui Campione Universo Campione Universo (a) Campione Universo (a) Piemonte 62.206.424.98 3.326 4.404 Valle 'Aosta - Vallée 'Aoste 22 74 483 58.032 27 Lombaria 80.546.694 4.29 4.53 9.758 Trentino-Alto Aige 48 339.54 42 2.652.07 Bolzano - Bozen 23 6 584 202.366 498 Trento 25 223 570 29.286 59 Veneto 54 58.29.976 2.739 4.866 Friuli-Venezia Giulia 32 29 749 555.642.220 Liguria 26 235 882 754.80.602 Emilia-Romagna 47 34.088.890 2.466 4.345 Toscana 49 287.066.569 2.678 3.705 Umbria 22 92 587 36.428 895 Marce 37 246 82 626.942.568 Lazio 34 378.7 2.40 2.378 5.637 Abruzzo 34 305 749 539.832.332 Molise 24 36 582 27.420 39 Campania 55 55.424 2.072 3.70 5.806 Puglia 50 258.0.530 3.25 4.069 Basilicata 25 3 577 236.555 587 Calabria 42 409 948 768 2.330 2.000 Sicilia 52 390.296.969 3.373 5.02 Saregna 39 377 795 669 2.02.664 Italia 834 8.0 9.720 24.632 47.603 59.939 (a) Stima Inagine multiscopo "Aspetti ella vita quotiiana", ati in migliaia. 2.4 Proceimento per il calcolo elle stime Le stime prootte all inagine sono essenzialmente stime i frequenze assolute e relative, riferite alle famiglie e agli iniviui. Le stime sono ottenute meiante uno stimatore i ponerazione vincolata, ce è il metoo i stima aottato per la maggior parte elle inagini Istat sulle imprese e sulle famiglie. Il principio su cui è basato ogni metoo i stima campionaria è ce le unità appartenenti al campione rappresentino ance le unità ella popolazione ce non sono incluse nel campione. Questo principio viene realizzato attribueno a ogni unità campionaria un peso ce inica il numero i unità ella popolazione rappresentata all unità meesima. Se, per esempio, a un unità campionaria viene attribuito un peso pari a 30, allora questa unità rappresenta se stessa e altre 29 unità ella popolazione ce non sono state incluse nel campione. Al fine i renere più ciara la successiva esposizione, introuciamo la seguente simbologia:, inice i livello territoriale i riferimento elle stime; i, inice i comune; j, inice i famiglia; p, inice i componente ella famiglia;, inice i strato i comuni; y, generica variabile oggetto i inagine; Yijp, valore i y osservato sul componente p ella famiglia j el comune i ello strato ; famiglia j el comune i ello strato ; P ij, numero i componenti ella Y ij = Y ijp, totale ella variabile y osservato sulla famiglia j el p= comune i ello strato ; Mi, numero i famiglie resienti nel comune i ello strato ; mi, campione i famiglie nel comune i ello strato ; N, totale i comuni nello strato ; n, numero i comuni campione nello strato (nell inagine in oggetto si a n = ); H, numero totale i strati nel generico ominio territoriale. Ipotizziamo i voler stimare, con riferimento a un generico ominio, il totale ella generica variabile y oggetto i inagine, espresso alla seguente relazione P ij 4

H N Mi Y =. () Y ij i= j= La stima el totale () è ata a H Ŷ =, esseno Ŷ = W Y, (2) Ŷ n mi i= j= ij ij in cui Wij è il peso finale a attribuire a tutti i componenti ella famiglia j el comune i ello strato. Dalla preceente relazione si esume, quini, ce per ottenere la stima el totale () occorre moltiplicare il valore ella variabile y assunto a ciascuna unità campionaria per il peso i tale unità 2 e effettuare, a livello el ominio i interesse, la somma ei prootti così ottenuti. Il peso a attribuire alle unità campionarie è ottenuto per mezzo i una proceura complessa ce: corregge l effetto istorsivo ella mancata risposta totale ovuta all impossibilità i intervistare alcune elle famiglie selezionate per irreperibilità o per rifiuto all intervista; tiene conto ella conoscenza i totali noti i importanti variabili ausiliarie (isponibili a fonti esterne all inagine), nel senso ce le stime campionarie ei totali noti elle variabili ausiliarie evono coinciere con i valori noti egli stessi. Nell inagine in oggetto vengono efiniti per ciascuna regione geografica 8 totali noti, ce si riferiscono alla istribuzione ella popolazione regionale per sesso e sei classi i età 3 e ella popolazione regionale nelle sei aree A, A 2, B, B 2, B 3 e B 4. Inicano, quini, con k X (k=,,8) il totale noto ella k-esima variabile ausiliaria per la generica regione geografica e con k X ij il valore assunto alla k-esima variabile ausiliaria per la famiglia risponente ij, la conizione sopra escritta è espressa alla seguente uguaglianza k H n m i X = Xˆ = W X (k=,., 8) k i= j= ijk in cui H inica il numero complessivo i strati efiniti nella regione. Se, a esempio, 6 X inica il numero i masci i età maggiore o uguale a sessantacinque anni, la variabile ausiliaria 6 X ij rappresenta il numero i masci i età maggiore o uguale a sessantacinque anni ella famiglia ij. La proceura ce consente i costruire i pesi finali a attribuire alle unità campionarie risponenti, è articolata nelle seguenti fasi : ) si calcolano i pesi iretti come reciproco ella probabilità i inclusione elle unità; 2) si calcolano i fattori correttivi per mancata risposta totale, come l inverso el tasso i risposta el comune cui ciascuna unità appartiene; 3) si ottengono i pesi base, o pesi corretti per mancata risposta totale, moltiplicano i pesi iretti per i corrisponenti fattori correttivi per mancata risposta totale; 4) si costruiscono i fattori correttivi ce consentono i soisfare, a livello regionale, la conizione i uguaglianza tra i totali noti elle variabili ausiliarie e le corrisponenti stime campionarie; 5) si calcolano, infine, i pesi finali meiante il prootto ei pesi base per i fattori correttivi ottenuti al passo 4. I fattori correttivi el passo 4 sono ottenuti alla risoluzione i un problema i minimo vincolato, in cui la funzione a minimizzare è una funzione i istanza (opportunamente prescelta) tra i pesi base e i pesi finali e i vincoli sono efiniti alla conizione i uguaglianza tra stime campionarie ei totali noti i popolazione e valori noti egli stessi. La funzione i istanza prescelta è la funzione logaritmica troncata; l aozione i tale ij 2 Al fine i ottenere stime coerenti per iniviui e famiglie i pesi finali sono efiniti in moo tale ce a ciascuna famiglia ij e a tutti i componenti ella stessa sia assegnato un meesimo peso finale W ij. 3 Le classi i età consierate sono: 0-5 anni, 6-3 anni, 4-24 anni, 25-44 anni, 45-64 anni, 65 anni e più. 5

funzione garantisce ce i pesi finali siano positivi e contenuti in un preeterminato intervallo i valori possibili, eliminano in tal moo i pesi positivi estremi (troppo grani o troppo piccoli). Tutti i metoi i stima ce scaturiscono alla risoluzione i un problema i minimo vincolato el tipo sopra escritto rientrano in una classe generale i stimatori nota come stimatori i ponerazione vincolata. 4 Un importante stimatore appartenente a tale classe, ce si ottiene utilizzano la funzione i istanza eucliea, è lo stimatore i regressione generalizzata. Come verrà ciarito meglio nel paragrafo 3, tale stimatore riveste un ruolo centrale percé è possibile imostrare ce tutti gli stimatori i ponerazione vincolata convergono asintoticamente, all aumentare ella numerosità campionaria, allo stimatore i regressione generalizzata. 3. Valutazione el livello i precisione elle stime 3. Metoologia i calcolo egli errori campionari Le principali statistice i interesse per valutare la variabilità campionaria elle stime prootte a un inagine sono l errore i campionamento assoluto e l errore i campionamento relativo. Inicano con Vˆ ar(yˆ ) la stima ella varianza ella generica stima Yˆ, la stima ell errore i campionamento assoluto i Yˆ si può ottenere meiante la seguente espressione: σ ˆ(Yˆ ) Var(Y ˆ ˆ ) ; (3) = la stima ell errore i campionamento relativo i Yˆ è invece efinita all espressione: σˆ(ŷ ) εˆ(ŷ ) =. (4) Ŷ Come è stato escritto nel paragrafo 2.4, le stime prootte all inagine sono state ottenute meiante uno stimatore i ponerazione vincolata efinito in base a una funzione i istanza i tipo logaritmico troncato. Poicé, lo stimatore aottato non è funzione lineare ei ati campionari, per la stima ella varianza Vˆ ar(yˆ ) si è utilizzato il metoo proposto a Wooruff; in base a tale metoo, ce ricorre all espressione linearizzata in serie i Taylor, è possibile ricavare la varianza i ogni stimatore non lineare (funzione regolare i totali) calcolano la varianza ell espressione linearizzata ottenuta. In particolare, per la efinizione ell espressione linearizzata ello stimatore ci si è riferiti allo stimatore i regressione generalizzata, sfruttano la convergenza asintotica i tutti gli stimatori i ponerazione vincolata a tale stimatore, poicé nel caso i stimatori i ponerazione vincolata ce utilizzano funzioni istanza ifferenti alla istanza eucliea (ce conuce allo stimatore i regressione generalizzata) non è possibile erivare l espressione linearizzata ello stimatore. L espressione linearizzata ello stimatore (2) è ata, quini, a: H m i Ŷ Ẑ = Ẑ, esseno Ẑ = Z W (5) = i= j= Z = X ' ij Y ij ij β X ij= Xij,..., k Xij,... K Xij il vettore contenente i valori elle K (K=8) variabili ausiliarie, osservati per la generica famiglia ij e β ˆ, il vettore ei coefficienti i regressione el moello lineare ce lega la variabile i interesse y alle K variabili ove Z ij è la variabile linearizzata espressa come, esseno ( ) n ij ij 4 Nella letteratura in lingua anglosassone sull argomento tali stimatori sono noti come calibration estimators. 6

ausiliarie x. In base alla (5), si a, quini, ce la stima ella varianza ella stima seguente relazione Vˆ ar H ( Ŷ ) Vˆ ar( Ẑ ) = Vˆ ar( Ẑ ) Dalla (6) risulta ce la stima ella varianza ella stima Ŷ è ottenuta meiante la. (6) viene calcolata come somma ella stima elle varianze ei singoli strati, Ar e Nar, appartenenti al ominio. La formula i calcolo ella varianza, ella stima Ẑ Ŷ ( ) Vˆ ar, è ifferente a secona ce lo strato sia Ar oppure Nar. Possiamo, quini scomporre come segue Vˆ ar HAR H NAR ( Ŷ ) Vˆ ar( Ẑ ) = ˆ ar( Ẑ ) + Vˆ ar( Ẑ ) V, (7) in cui H AR e H NAR inicano rispettivamente il numero i strati Ar e Nar appartenenti al ominio. Negli strati Ar (in cui ciascun comune fa strato a sé e N = n =, l inice i i comune iviene superfluo e viene omesso) la varianza è stimata meiante la seguente espressione: Ẑ HAR HAR 2 ( ) ( M m ) Ẑ = M ( m ) m ( V ˆ ar Zj Z ), (8) m j= 2 m ove si è posto M = M i, m = mi, Z j = Zij e Z = Zj. m j= Negli strati Nar, in cui viene estratto un solo comune campione a ogni strato, per stimare la varianza i campionamento si ricorre alla tecnica i collassamento egli strati. Questa tecnica consiste nel formare G gruppi contenenti ciascuno L g ( L g 2) strati; la varianza viene stimata meiante la formula seguente: HNAR Vˆ ar ove le quantità sono espresse come: G ( Ẑ ) Vˆ ar( Ẑ ) G L L g g Ẑ g = g = Ẑg (9) L g g g L = = g 2 Ẑ g mi = Z W e Ẑ = Z W. j= ij ij g L g mi j= Ŷ, in base alla (7) e calcolare, quini, in base alla (3) e alla (4) rispettivamente l errore i campionamento assoluto e l errore i campionamento relativo. Gli errori campionari espressi alla (3) e alla (4) consentono i valutare il grao i precisione elle stime; inoltre, l errore assoluto permette i costruire un intervallo i confienza, ce, con livello i fiucia P contiene il parametro oggetto i stima, l intervallo viene espresso come: Utilizzano le espressioni (8) e (9) è possibile, infine, calcolare la varianza i campionamento, Vˆ ar( ) { Ŷ k σˆ(ŷ ) Y Ŷ + k σˆ(ŷ )} p p ij (0) Nella (0) il valore i k P ipene al valore fissato per la probabilità P; a esempio, per P=0.95 si a k=.96. ij 7

3.2 Fonamenti statistici ella proceura per il calcolo egli errori campionari Per il calcolo egli errori i campionamento elle inagini conotte all Istat sulle famiglie e sulle imprese viene correntemente utilizzata una proceura informatica sviluppata nell ambito ell Istituto. Nel paragrafo 3. è stata escritta la metoologia, implementata alla proceura, per il calcolo egli errori i campionamento elle stime prootte all inagine mentre, nel presente paragrafo, vengono iscussi i fonamenti statistici e i limiti ella metoologia meesima. Negli strati Ar, nei quali si aotta un isegno i campionamento a grappoli e in cui le unità primarie (le famiglie) vengono selezionate senza reimmissione e probabilità uguali, la proceura consente i ottenere stime ella varianza campionaria ce risultano corrette. Negli strati Nar, per i quali si aotta un isegno i campionamento a ue stai con selezione elle unità primarie (comuni) senza reimmissione e probabilità variabili, la proceura consente i ottenere stime corrette ella varianza campionaria qualora: in ciascuno strato sono selezionate ue o più unità primarie; le unità primarie sono scelte meiante estrazioni inipenenti. La prima conizione non viene soisfatta in quanto, nell inagine in oggetto, a ciascuno strato viene selezionato un solo comune campione e per stimare la varianza i campionamento si ricorre alla tecnica i collassamento egli strati. Questa tecnica, ce consiste nel formare superstrati contenenti ciascuno un numero i strati maggiore i uno, conuce in generale a una sovrastima ella varianza i campionamento effettiva. La secona ipotesi implica ce la selezione elle unità primarie venga effettuata con reimmissione. Ance questa assunzione non è soisfatta per i comuni Nar e ciò comporta una sovrastima ella varianza. Si osservi, tuttavia, ce tale sovrastima ipene alla frazione i campionamento i ciascuno strato Nar: è i entità trascurabile negli strati nei quali la frazione i campionamento è piccola, mentre viceversa può risultare i entità più cospicua per quegli strati in cui la frazione i campionamento è maggiore. 3.3 Presentazione sintetica egli errori campionari A ogni stima Ŷ corrispone un errore i campionamento relativo εˆ (Ŷ ) ; ciò significa ce per consentire una lettura corretta elle tabelle pubblicate sarebbe necessario presentare per ogni stima pubblicata il corrisponente errore i campionamento relativo. Ciò, tuttavia, non è possibile sia per limiti i tempo e i costi i elaborazione, sia percé le tavole ella pubblicazione risulterebbero appesantite e i non facile consultazione per l utente finale. Inoltre, non sarebbero comunque isponibili gli errori elle stime non pubblicate, ce l utente può ricavare in moo autonomo. Per le ragioni sopra esposte, si ricorre frequentemente a una presentazione sintetica egli errori relativi, basata sul metoo ei moelli regressivi. Questo metoo si basa sulla eterminazione i una funzione matematica ce mette in relazione ciascuna stima con il proprio errore relativo. Nella presente inagine, il moello utilizzato per le stime i frequenze assolute e relative, è el tipo seguente: 2 ( ˆ (Ŷ )) = a + b log(ŷ ) log ε () ove i parametri a e b vengono stimati utilizzano il metoo ei minimi quarati. Nel prospetto 2 sono riportati i valori ei coefficienti a e b e ell inice i eterminazione R 2 el moello utilizzato per l interpolazione egli errori campionari i stime i frequenze assolute e relative, per totale Italia, ripartizione geografica, tipologia comunale e regione. Sulla base elle informazioni contenute in tale prospetto, è possibile calcolare la stima ell'errore i campionamento relativo i una eterminata stima i frequenza assoluta meiante la formula: ( a b log(ŷ )) Ŷ ε ˆ(Ŷ ) = exp + (2) 8

ce si ricava facilmente alla (). Se, per esempio, la stima Ŷ si riferisce agli iniviui ell Italia Nor occientale, l errore relativo corrisponente si ottiene introuceno nella (2) i valori ei parametri a e b riportati nella secona riga el prospetto 2 alla voce Persone (a = 8,886722, b = -,252). I prospetti 3 e 4, presentati in aggiunta, consentono i renere più agevole il calcolo egli errori campionari. Essi riguarano, rispettivamente, le famiglie e gli iniviui e anno la seguente struttura: a) in fiancata sono elencati i valori crescenti i stima (20.000, 30.000,, 25.000.000); b) le colonne successive contengono gli errori i campionamento relativo, per ciascun ominio territoriale i interesse, calcolati meiante la formula (2), corrisponenti alle stime i frequenze assolute ella prima colonna. Le informazioni contenute in tali prospetti permettono i calcolare l'errore relativo i una generica stima i frequenza assoluta (o relativa) meiante ue proceimenti ce risultano i facile applicazione, ance se conucono a risultati meno precisi i quelli ottenibili meiante l'espressione (2). Il primo metoo consiste nell iniviuare, nella prima colonna el prospetto, il livello i stima ce più si avvicina alla stima i interesse e nel consierare come errore relativo il valore ce si trova sulla stessa riga, nella colonna corrisponente al omino territoriale i riferimento. Con il secono metoo, l errore campionario ella stima si ricava meiante la seguente espressione: k Ŷ k k Ŷ k εˆ(ŷ ) εˆ(ŷ ) k ε ˆ(Ŷ ) = εˆ(ŷ ) (Ŷ Ŷ ) (3) k k Ŷ Ŷ ove e Ŷ sono i valori elle stime, riportati nella prima colonna, entro i quali è compresa la stima i interesse Ŷ, e ε ˆ(Ŷ ) e εˆ(ŷ ) i corrisponenti errori relativi. k k k 9

Prospetto 2 Valori ei coefficienti a, b e ell inice i eterminazione R 2 (%) elle funzioni utilizzate per le interpolazioni egli errori campionari elle stime riferite alle famiglie e alle persone per totale Italia, ripartizione geografica, tipo i comune e regione Anno 200 ZONE TERRITORIALI Famiglie Persone a b R 2 (%) a b R 2 (%) ITALIA 9,79046754 -,8468267 94,98 8,370753437 -,073000042 96,2 RIPARTIZIONI GEOGRAFICHE Nor 9,9964993 -,92335627 93,54 8,6263730 -,0869259 94,57 Nor-ovest 9,554363336 -,6200688 92,52 8,92902629 -,0275997 92,5 Nor-est 8,55372038 -,2667789 96,96 8,520059446 -,06957328 95,55 Centro 9,7848867 -,67896279 97,4 0,079423 -,22085535 95,66 Mezzogiorno 9,02825684 -,6779526 95,7 8,298469 -,079284084 94,55 Su 8,672553852 -,384395 94,28 8,28546588 -,0866267 92,53 Isole 9,08568 -,8774798 96,6 8,2904207 -,09687498 95,38 TIPI DI COMUNE A 9,365573856 -,77007242 97,66 9,96957732 -,276250 96,57 A2 9,367943 -,59342043 87,30 7,850649447 -,09443433 88,0 B 6,935255674 -,008687922 86,20 6,990953397 -,0706845 9,39 B2 8,566485926 -,099253 93,02 7,96389679 -,047688348 92,99 B3 8,770725 -,34453926 96,99 8,356248078 -,089044735 95,44 B4 9,079477828 -,7825493 97,6 9,57492063 -,207966527 96,57 REGIONI Piemonte 8,6054237 -,40483665 97,30 9,485307758 -,204206324 94,24 Valle 'Aosta - Vallée 'Aoste 5,647678766 -,4574956 96,5 5,962600255 -,773794 94,69 Lombaria 9,70948335 -,60420667 92,46 8,822902433 -,0794377 9,75 Trentino-Alto Aige 7,389897 -,78052995 97,00 8,2654882 -,2920967 80,02 Bolzano - Bozen 7,39703603 -,202455939 95,77 7,75679244 -,24845007 9,9 Trento 7,450835283 -,9083677 96,44 7,9866553 -,274430209 83,43 Veneto 8,746842324 -,33683364 95,97 8,690069404 -,6305036 94,28 Friuli-Venezia Giulia 8,3855723 -,205558679 96,87 7,8267229 -,4372254 94,98 Liguria 8,352002356 -,8230477 96,79 8,28282537 -,6538374 95,75 Emilia-Romagna 8,8495285 -,46923 97,46 8,666657874 -,844374 95,69 Toscana 8,678568354 -,4826682 95,73 9,500360677 -,206884 94,93 Umbria 7,929068442 -,89325906 96,78 8,2980858 -,20578238 93,87 Marce 8,33298994 -,89084024 95,28 8,335302032 -,783027 94,65 Lazio 9,0294400 -,48326605 97,2 9,844528982 -,20956852 94,86 Abruzzo 7,724805004 -,24628896 94,6 8,29282962 -,75330854 9,56 Molise 6,6696656 -,845692 95,52 6,849549458 -,79837867 94,20 Campania 8,50268053 -,0999888 9,52 7,8298474 -,03422747 89,47 Puglia 9,056735208 -,20005566 95,97 8,73957398 -,4676856 94,26 Basilicata 7,743976642 -,279793 93,24 7,38060685 -,526828 92,09 Calabria 8,0369273 -,4709583 95,39 7,78454505 -,095447989 93,5 Sicilia 9,485858094 -,27899056 95,83 8,294425363 -,090239888 94,79 Saregna 8,45840768 -,94900066 96,8 8,245806054 -,56492 95,62 (a) Italia nor-occientale: Piemonte, Valle Aosta, Lombaria, Liguria; Italia nor-orientale: Bolzano, Trento, Veneto, Friuli-Venezia Giulia, Emilia- Romagna; Italia centrale: Toscana, Umbria, Marce, Lazio; Italia meriionale: Abruzzo, Molise, Campania, Puglia, Basilicata, Calabria; Italia insulare: Sicilia, Saregna. (b) Comuni tipo A: Area urbana centro; Tipo A2: Area urbana periferia; Tipo B: comuni fino a 2.000 abitanti; Tipo B2: a 2.00 a 0.000 abitanti; Tipo B3: a 0.00 a 50.000 abitanti; Tipo B4: oltre 50.000 abitanti. 0

Prospetto 3 Valori interpolati egli errori campionari relativi percentuali elle stime riferite alle famiglie per totale Italia, ripartizione geografica, tipo i comune e regione Anno 200 STIME Italia Nor Norovest Nor-est Centro Mezzogiorno Su Isole A A2 B B2 B3 B4 20.000 38,0 38,9 37,7 27,9 30,2 29,0 27,2 26,2 3,8 34,7 2,7 29,6 28,3 27,4 30.000 29,9 30,5 29,7 22,2 23,8 22,9 2,6 20,6 25, 27,5 7,7 23,6 22,5 2,6 40.000 25,2 25,7 25,2 8,9 20,2 9,4 8,4 7,4 2,2 23,2 5,3 20, 9, 8,2 50.000 22, 22,5 22, 6,7 7,7 7,0 6,2 5,2 8,6 20,4 3,7 7,8 6,8 6,0 60.000 9,8 20,2 9,9 5, 5,9 5,3 4,6 3,7 6,7 8,4 2,5 6, 5,2 4,3 70.000 8, 8,4 8,2 3,8 4,5 4,0 3,3 2,5 5,2 6,8,5 4,7 3,9 3, 80.000 6,7 7,0 6,8 2,8 3,4 3,0 2,4,5 4, 5,6 0,8 3,7 2,9 2, 90.000 5,6 5,9 5,7 2,0 2,5 2,,6 0,7 3, 4,5 0,2 2,8 2,,3 00.000 4,6 4,9 4,8,3,8,4 0,9 0, 2,3 3,7 9,6 2,,4 0,6 200.000 9,7 9,9 9,9 7,7 7,9 7,6 7,3 6,7 8,2 9, 6,8 8,2 7,7 7, 300.000 7,6 7,7 7,8 6, 6,2 6,0 5,8 5,2 6,5 7,2 5,5 6,6 6, 5,6 400.000 6,4 6,5 6,6 5,2 5,3 5, 4,9 4,4 5,5 6, 4,8 5,6 5,2 4,7 500.000 5,6 5,7 5,8 4,6 4,6 4,5 4,4 3,9 4,8 5,4 4,3 4,9 4,6 4, 750.000 4,4 4,5 4,6 3,7 3,6 3,5 3,5 3,0 3,8 4,3 3,5 4,0 3,6 3,2.000.000 3,7 3,8 3,9 3, 3, 3,0 2,9 2,6 3,2 3,6 3,0 3,4 3, 2,7 2.000.000 2,5 2,5 2,6 2, 2, 2,0 2,0,7 2, 2,4 2, 2,3 2,,8 3.000.000 2,0 2,0 2,0,7,6,6,6,3,7,9 -,8,7,4 4.000.000,6,7,7,4,4,3,3 -,4 - -,6,4,2 5.000.000,4,4,5,3,2,2,2 - - - -,4,2, 7.500.000,,,2 - - 0,9 0,9 - - - -,,0-0.000.000,0,0 - - - - - - - - - - - - 5.000.000 0,8 0,8 - - - - - - - - - - - - 20.000.000 0,6 - - - - - - - - - - - - - 25.000.000 0,6 - - - - - - - - - - - - - STIME Piemonte Valle 'Aosta - Lombaria Vallée 'Aoste Trentino- Alto Aige Bolzano Trento Veneto Friuli- Venezia Giulia Liguria Emilia- Romagna Toscana Umbria 20.000 26, 5,8 4,0,8 0,5,4 28,9 6,9 8,7 28, 26,0 4,6 30.000 20,7 4,6 32,4 9,3 8,2 8,9 23,0 3,2 4,7 22,3 20,6,5 40.000 7,6 3,9 27,4 7,8 6,9 7,5 9,5, 2,4 8,9 7,5 9,7 50.000 5,5 3,4 24, 6,9 6,0 6,6 7,2 9,7 0,9 6,6 5,4 8,5 60.000 3,9 3, 2,7 6,2 5,4 5,9 5,5 8,7 9,7 5,0 3,8 7,6 70.000 2,8-9,8 5,6 4,9 5,4 4,2 7,9 8,9 3,7 2,7 6,9 80.000,8-8,3 5,2 4,6 5,0 3,2 7,3 8,2 2,7,7 6,4 90.000, - 7, 4,9 4,2 4,7 2,3 6,8 7,7,9,0 6,0 00.000 0,4-6, 4,6 4,0 4,4,6 6,4 7,2,2 0,3 5,6 200.000 7,0-0,8 3,0 2,6 2,9 7,8 4,2 4,8 7,5 6,9 3,7 300.000 5,6-8,5 2,4 - - 6,2 3,3 3,8 6,0 5,5 2,9 400.000 4,7-7,2 2,0 - - 5,3 2,8 3,2 5, 4,7 2,5 500.000 4,2-6,3 - - - 4,7 2,4 2,8 4,4 4, - 750.000 3,3-5,0 - - - 3,7,9 2,2 3,5 3,2 -.000.000 2,8-4,2 - - - 3, -,8 3,0 2,8-2.000.000,9-2,8 - - - 2, - - 2,0,8 - STIME Marce Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Saregna 20.000 7,9 30,9 8,2 8, 28,8 24,3,9 8,9 27,6 8,5 30.000 4,0 24,5 4,5 6,4 23,0 9, 9,3 5,0 2,6 4,5 40.000,8 20,7 2,3 5,4 9,6 6,0 7,8 2,7 8, 2,2 50.000 0,4 8,2 0,8 4,7 7,3 4,0 6,8,2 5,8 0,7 60.000 9,3 6,4 9,8 4,2 5,7 2,6 6, 0, 4, 9,6 70.000 8,5 5,0 9,0 3,9 4,4,5 5,6 9,2 2,9 8,8 80.000 7,8 3,9 8,3 3,6 3,3 0,6 5, 8,5,9 8, 90.000 7,3 3,0 7,8 3,3 2,5 9,9 4,8 8,0,0 7,5 00.000 6,9 2,3 7,3 3,,8 9,3 4,5 7,5 0,4 7, 200.000 4,5 8,2 5,0 2, 8,0 6, 3,0 5, 6,8 4,7 300.000 3,6 6,5 4,0-6,4 4,8 2,3 4,0 5,3 3,7 400.000 3,0 5,5 3,4-5,5 4,0-3,4 4,5 3, 500.000 2,6 4,9 3,0-4,8 3,5-3,0 3,9 2,7 750.000 2, 3,9 2,4-3,9 2,8-2,4 3,0 2,.000.000-3,3 - - 3,3 2,3 - - 2,5-2.000.000-2,2 - - 2,2 - - -,7 -

Prospetto 4 Valori interpolati egli errori campionari relativi percentuali elle stime riferite alle persone per totale Italia, ripartizione geografica, tipo i comune e regione Anno 200 STIME Italia Nor Norovest Nor-est Centro Mezzogiorno Su Isole A A2 B B2 B3 B4 20.000 32,4 34,5 36,9 29,5 29, 29,5 29,0 27,6 35,2 32,5 2,4 29,9 29,7 30,3 30.000 26,0 27,7 29,5 23,6 23,4 23,6 23,3 22, 27,5 26,5 7,4 24,2 23,8 23,7 40.000 22,3 23,7 25,2 20, 20,0 20, 9,9 8,9 23, 22,9 5, 20,8 20,4 9,9 50.000 9,8 2,0 22,3 7,8 7,7 7,8 7,6 6,7 20, 20,4 3,4 8,5 8,0 7,4 60.000 8,0 9,0 20,2 6, 6, 6, 6,0 5, 8,0 8,6 2,3 6,8 6,3 5,6 70.000 6,5 7,5 8,5 4,7 4,8 4,8 4,7 3,9 6,4 7,2,3 5,5 5,0 4,2 80.000 5,4 6,2 7,2 3,7 3,8 3,7 3,7 2,9 5, 6, 0,6 4,5 4,0 3, 90.000 4,4 5,2 6, 2,8 2,9 2,8 2,8 2, 4, 5, 0,0 3,6 3, 2,2 00.000 3,7 4,4 5,2 2, 2,2 2, 2,,4 3,2 4,3 9,4 2,9 2,4,5 200.000 9,4 9,9 0,4 8,2 8,4 8,3 8,3 7,8 8,7 0, 6,6 9,0 8,5 7,5 300.000 7,6 7,9 8,3 6,6 6,7 6,6 6,7 6,3 6,8 8,2 5,4 7,2 6,8 5,9 400.000 6,5 6,8 7, 5,6 5,8 5,6 5,7 5,3 5,7 7, 4,7 6,2 5,8 5,0 500.000 5,8 6,0 6,3 5,0 5, 5,0 5,0 4,7 5,0 6,3 4,2 5,5 5, 4,3 750.000 4,6 4,8 5,0 4,0 4, 4,0 4,0 3,8 3,9 5, 3,4 4,5 4, 3,4.000.000 4,0 4, 4,3 3,4 3,5 3,4 3,5 3,2 3,3 4,4 2,9 3,9 3,5 2,9 2.000.000 2,7 2,8 2,9 2,3 2,4 2,3 2,4 2,2 2, 3, 2, 2,7 2,4,9 3.000.000 2,2 2,3 2,3,8,9,8,9,8,7 2,5,7 2,2,9,5 4.000.000,9,9 2,0,6,7,6,6,5,4 2,2,4,9,7,2 5.000.000,7,7,8,4,5,4,4,3,2 2,0 -,7,5, 7.500.000,3,4,4,,2,,2,,0,6 -,3,2 0,8 0.000.000,2,2,2 0,9,0 0,9,0-0,8 - -,2,0 0,7 5.000.000 0,9 0,9,0 0,8 0,8 0,8 0,8 - - - - 0,9 0,8 0,6 20.000.000 0,8 0,8 0,8-0,7 0,6 - - - - - - - - 25.000.000 0,7 0,7 - - 0,6 0,6 - - - - - - - - STIME Piemonte Valle 'Aosta - Lombaria Vallée 'Aoste Trentino- Alto Aige Bolzano Trento Veneto Friuli- Venezia Giulia Liguria Emilia- Romagna Toscana Umbria 20.000 29,5 5,8 39,3 0,4 0,0 9,9 30,6 7,4 9,6 30,0 29,3 5,6 30.000 23, 4,6 3,6 8,0 7,8 7,6 24,4 3,8 5,5 23,9 23,0 2,2 40.000 9,4 3,9 27,0 6,7 6,5 6,3 20,8,7 3, 20,4 9,3 0,2 50.000 7,0 3,4 24,0 5,8 5,6 5,5 8,4 0,3,5 8,0 6,9 9,0 60.000 5,2 3,0 2,7 5, 5,0 4,9 6,6 9,3 0,3 6,2 5, 8,0 70.000 3,9 2,8 20,0 4,6 4,6 4,4 5,2 8,5 9,4 4,9 3,8 7,3 80.000 2,8 2,6 8,6 4,3 4,2 4, 4, 7,9 8,7 3,8 2,7 6,7 90.000,9 2,4 7,5 3,9 3,9 3,8 3,2 7,4 8,2 2,9,8 6,3 00.000,2 2,2 6,5 3,7 3,7 3,5 2,5 6,9 7,7 2,2, 5,9 200.000 7,4,5,3 2,4 2,4 2,3 8,5 4,7 5, 8,3 7,3 3,9 300.000 5,8-9,,8,8,8 6,8 3,7 4,0 6,6 5,7 3,0 400.000 4,9-7,8,5,5,5 5,8 3, 3,4 5,6 4,8 2,6 500.000 4,2-6,9 -,3,3 5, 2,8 3,0 5,0 4,2 2,2 750.000 3,3-5,6 - -,0 4, 2,2 2,4 4,0 3,3,8.000.000 2,8-4,8 - - - 3,5,9 2,0 3,4 2,8,5 2.000.000,8-3,3 - - - 2,3,2,3 2,3,8-3.000.000,4-2,6 - - -,9 - -,8,4-4.000.000,2-2,3 - - -,6 - -,6,2-5.000.000, - 2,0 - - -,4 - -,4 - - 2

Prospetto 4 segue Valori interpolati egli errori campionari relativi percentuali elle stime riferite alle persone per totale Italia, ripartizione geografica, tipo i comune e regione Anno 200 STIME Marce Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Saregna 20.000 8,9 35,7 8,8 8,9 30,3 27, 2,9 20,9 28,6 20,6 30.000 4,9 28,0 4,8 7,0 24,6 2,5 0,2 6,7 22,9 6,3 40.000 2,6 23,5 2,5 5,9 2,2 8,2 8,7 4,3 9,6 3,8 50.000,0 20,6 0,9 5,2 8,9 6,0 7,6 2,7 7,4 2,2 60.000 9,9 8,5 9,8 4,7 7,2 4,4 6,9,5 5,7 0,9 70.000 9,0 6,8 9,0 4,3 5,9 3,2 6,3 0,5 4,5 0,0 80.000 8,3 5,5 8,3 3,9 4,8 2,2 5,8 9,8 3,4 9,3 90.000 7,8 4,5 7,8 3,7 4,0,4 5,4 9,2 2,6 8,7 00.000 7,3 3,6 7,3 3,4 3,2 0,8 5, 8,7,9 8,2 200.000 4,9 9,0 4,8 2,3 9,3 7,2 3,4 5,9 8,2 5,5 300.000 3,8 7,0 3,8,8 7,5 5,7 2,7 4,7 6,5 4,3 400.000 3,2 5,9 3,2-6,5 4,9 2,3 4, 5,6 3,7 500.000 2,8 5,2 2,8-5,8 4,3 2,0 3,6 4,9 3,2 750.000 2,2 4,0 2,2-4,7 3,4,6 2,9 4,0 2,6.000.000,9 3,4,9-4,0 2,9-2,5 3,4 2,2 2.000.000,3 2,2,3-2,8,9 -,7 2,3,5 3.000.000 -,8 - - 2,3,5 - -,9-4.000.000 -,5 - - 2,0,3 - -,6-5.000.000 -,3 - -,8, - -,4-3.4 Esempi i calcolo egli errori campionari 3.4. Esempi relativi alle stime elle famiglie Esempio Nel 200, il numero elle famiglie in Basilicata ce possieono il personal computer è 20.000. Si cerca il livello i stima ce più si avvicina a 20.000 nella colonna corrisponente alla regione Basilicata el prospetto 3. L errore relativo percentuale ella stima consierata, per la Basilicata, è pari al 4,5%. L errore assoluto sarà: L intervallo i confienza avrà come estremi : Esempio 2 σ(20.000) = 0,045 x 20.000= 5.400 20.000 - (,96 x 5.400) = 09.46 20.000 + (,96 x 5.400) = 30.584 Consierano la stima preceente si possono ottenere valori più precisi ell errore i campionamento operano meiante interpolazione lineare ei ue livelli i stima consecutivi tra i quali è compreso il valore ella stessa. Tali livelli sono 00.000 e 200.000 ai quali corrisponono i valori 3,0% e 4,5%. L errore relativo corrisponente a 20.000 è pari a : σ(20.000) = 4,5- { [ (4,5-3,0) / (200.000 00.000) ] x (20.000-00.000) } = 4,2% Il corrisponente errore assoluto è 0,042 x 20.000= 5.040 e l intervallo i confienza avrà come estremi: 20.000 - (,96 x 5.040) = 4.960 20.000 + (,96 x 5.040) = 25.040 3

Esempio 3 Il calcolo ell errore può essere effettuato irettamente tramite la funzione interpolante: ε ˆ (Ŷ) = exp + ( a b log(ŷ) ) i cui parametri, riportati nel prospetto 2 alla riga Basilicata, sono i seguenti: a = 7,743976 b = -,279 Per Ŷ = 20.000 si a: ( 7,743976-,279 log(20.000) ) 0,040. ˆ ε ( Yˆ) = exp = L errore relativo percentuale è quini pari al 4,0% e il calcolo ell errore assoluto e ell intervallo i confienza è el tutto analogo a quello egli esempi e 2. 3.4.2 Esempi relativi alle stime elle persone Esempio Nel 200, le persone in Italia nella classe i età compresa tra i 20 e 24 anni ce usano Internet sono 2.50.000. Si cerca il livello i stima ce più si avvicina a 2.50.000 nella prima colonna el prospetto 4 per il totale Italia. L errore relativo percentuale ella stima consierata è pari a 2,2 %. L errore assoluto sarà: L intervallo i confienza avrà come estremi : Esempio 2 σ(2.50.000) = 0,022 x 2.50.000 = 55.022 2.50.000 - (,96 x 55.022) = 2.393.57 2.50.000 + (,96 x 55.022) = 2.608.843 Consierano la stima preceente si possono ottenere valori più precisi ell errore i campionamento operano meiante interpolazione lineare ei ue livelli i stima consecutivi tra i quali è compreso il valore ella stessa. Tali livelli sono 2.000.000 e 3.000.000 ai quali corrisponono i valori percentuali 2,7 e 2,2. L errore relativo corrisponente a 2.50.000 è pari a : σ(2.50.000) = 2,7 { [ (2,7 2,2) / ( 2.000.000 3.000.000) ] x ( 2.50.000 2.000.000) } =,9% 4

Il corrisponente errore assoluto è 0,09 x 208.000 = 47.59 e l intervallo i confienza avrà come estremi: Esempio 3 2.50.000 - (,96 x 47.59) = 2.407.863 2.50.000 +(,96 x 47.59) = 2.594.37 Il calcolo ell errore può essere effettuato, irettamente, tramite la funzione interpolante: ε ˆ (Ŷ) = exp + ( a b log(ŷ) ) i cui parametri, riportati nel prospetto 2 alla riga Italia, sono i seguenti: a =8,370753 b = -,073000. Per Ŷ = 2.50.000 si a: ( 8,370753-,073000 log(2.50.000) ) 0, 024 ˆ ε ( Yˆ) = exp = L errore relativo percentuale è quini pari al 2,4% e il calcolo ell errore assoluto e ell intervallo i confienza è el tutto analogo a quello egli esempi e 2. 5