Metodi e fonti: note metodologiche. Indagine sulle imprese industriali e dei servizi

Documenti analoghi
Corso di Teoria dei Campioni Facoltà di Economia Corso di Laurea SIGI

3 CAMPIONAMENTO DI BERNOULLI E DI POISSON

Definizione di campione

APPENDICE B. La dinamica delle distribuzioni dimensionali delle maggiori imprese mondiali

Modello del Gruppo d Acquisto

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari

UNIVERSITÀ DEGLI STUDI DI BERGAMO. Facoltà di Ingegneria. Corso di Sistemi di Controllo di Gestione SCG-E04

INDAGINE ESAUSTIVA O CAMPIONARIA?

IL MODELLO DI MACK. Materiale didattico a cura di Domenico Giorgio Attuario Danni di Gruppo Società Cattolica di Assicurazioni

Scheda metodologica. MeDeC Centro Demoscopico Metropolitano Provincia di Bologna

1) Le medie e le varianze calcolate su n osservazioni relative alle variabili quantitative X ed Y sono tali che. σ x

Il campionamento casuale semplice

ESERCIZIO N. 1. b) rendimenti reali dell azienda Gesis e del portafoglio di mercato:

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

Potenzialità degli impianti

SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete

Oltre la regressione lineare

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Statistiche sui permessi di costruire. Nota metodologica

PIANIFICAZIONE DEI TRASPORTI

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1

ANALISI STATISTICA DELLE INCERTEZZE CASUALI

x 0 x 50 x 20 x 100 CASO 1 CASO 2 CASO 3 CASO 4 X n X n X n X n

Analisi degli errori. Introduzione J. R. Taylor, Introduzione all analisi degli errori, Zanichelli, Bo 1986

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

Sistema statistico nazionale Istituto nazionale di statistica. Stime ed Errori. Note metodologiche

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:

Elementi di statistica

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

y. E' semplicemente la media calcolata mettendo

PROBLEMA DI SCELTA FRA DUE REGIMI DI

Corso di. Dott.ssa Donatella Cocca

03/03/2012. Campus di Arcavacata Università della Calabria

Indicatori di dimensione e di concentrazione

Analisi di mercurio in matrici solide mediante spettrometria di assorbimento atomico a vapori freddi

ELEMENTI DI STATISTICA

LA VARIABILITA. IV lezione di Statistica Medica

Lezione 2 a - Statistica descrittiva per variabili quantitative

Correlazione lineare

Introduzione al Machine Learning

Integrazione numerica dell equazione del moto per un sistema lineare viscoso a un grado di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

Università degli Studi di Urbino Facoltà di Economia

Il patrimonio informativo aziendale come supporto alle attività di marketing

Esercitazioni del corso di Relazioni tra variabili. Giancarlo Manzi Facoltà di Sociologia Università degli Studi di Milano-Bicocca

Laboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica

Tutorato di Complementi di Analisi Matematica e Statistica 23 e 30 marzo 2017

AVVISO PUBBLICO Costituzione di short list: Servizio di pulizie presso l Istituto di Ricerca Biogem s.c.ar.l. Via Camporeale, Ariano Irpino (AV)

Capitolo 3. Cap. 3-1

PREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl

DIPARTIMENTO TEMATICO RADIAZIONI Struttura Semplice Radiazioni ionizzanti

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *

SOLUZIONI I PLICO DI ESERCIZI DI RAGIONERIA

Lezione 2 le misure di sintesi: le medie

MATERIALE PER IL CORSO DI INDAGINI E STATISTICHE PER IL TURISMO NON DIFFONDERE DA PERCORSI DI RICERCA SOCIALE (a cura di L.

Intorduzione alla teoria delle Catene di Markov

Corso di Teoria dei Campioni Facoltà di Economia Corso di Laurea SIGI

Norma UNI CEI ENV 13005: Guida all'espressione dell'incertezza di misura

Richiami di modelli di utilità aleatoria

materiale didattico I incontro

Regressione lineare con un singolo regressore

I metodi misti. Valutazione d impresa a.a Lezioni 18 e 19 aprile 2011

Imposte sulle vendite

Scelta dell Ubicazione. di un Impianto Industriale. Corso di Progettazione Impianti Industriali Prof. Sergio Cavalieri

Corso di Tecniche elettromagnetiche per la localizzazione e il controllo ambientale. Test scritto del 08 / 09 / 2005

Campo di applicazione

Propagazione delle incertezze

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA

LA STATISTICA: OBIETTIVI; RACCOLTA DATI; LE FREQUENZE (EXCEL) ASSOLUTE E RELATIVE

Metodi e Modelli per l Ottimizzazione Combinatoria Progetto: Metodo di soluzione basato su generazione di colonne

Giovanni Buti STIMA DELL INCERTEZZA DI MISURA GB INTERTEK LABTEST

C.I. di Metodologia clinica

Concetti principale della lezione precedente

La contabilità analitica nelle aziende agrarie

CONFORMITA DEL PROGETTO

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari

Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA

Tecniche di Composizione Personalizzata

UNIVERSITÀ DEGLI STUDI DI TORINO CORSO DI LAUREA IN CHIMICA Dispense ad esclusivo uso introduttivo per il modulo di Fisica C

Scenari di frenata per il comparto elettrico: il nodo della valorizzazione del prodotto

McGraw-Hill. Tutti i diritti riservati. Caso 11

CAPITOLO 3 Incertezza di misura Pagina 26

LE FREQUENZE CUMULATE

Gazzetta ufficiale dell'unione europea. (Atti per i quali la pubblicazione è una condizione di applicabilità)

UNIVERSITA DEGLI STUDI DI CASSINO FACOLTA DI INGEGNERIA

i n d a g i n e s u l l e p i c c o l e e m e d i e i m p r e s e con aggiornamento imprese, occupazione e credito

Statistica descrittiva

{ 1, 2,..., n} Elementi di teoria dei giochi. Giovanni Di Bartolomeo Università degli Studi di Teramo

Modelli di utilità aleatoria

STATISTICA A K (63 ore) Marco Riani

Predimensionamento reti chiuse

DESTINAZIONE ORIGINE A B C A B C Esercizio intersezioni a raso - pag. 1

Sorgenti Numeriche - Soluzioni

Economia del Lavoro. Argomenti del corso

Transcript:

Statstche Metod e font: note metodologche Per nformazon: statstche@bancadtala.t www.bancadtala.t/statstche/ndex.html 3 luglo 207 Indagne sulle mprese ndustral e de servz Aspett general La Banca d Itala conduce ndagn camponare sulle mprese dal 972. Fno al 998 l ndagne ha rguardato le sole mprese della trasformazone ndustrale con 50 addett e oltre. Dal 999 l campo d osservazone s è amplato, estendendos al complesso delle mprese manfatturere e a settor energetco-estrattvo e, dal 200, anche alle mprese con 20-49 addett. Dal 2002 la popolazone d rfermento è stata allargata alle mprese de servz prvat non fnanzar2 con 20 addett e oltre. Dal 2006 la rlevazone s è estesa anche al settore delle costruzon con 20 addett e oltre. L ndagne sul 203 ha esteso l campone delle costruzon alle mprese con 0-9 addett, al fne d rendere l ndagne maggormente rappresentatva degl andament economc delle mprese d mnore dmensone, partcolarmente mportant nel settore, caratterzzato da dmensone meda d mpresa (n termn d addett) molto nferore a quella de settor dell ndustra e de servz prvat non fnanzar. In seguto alla revsone metodologca del 987, lo schema d estrazone adotta un dsegno probablstco stratfcato non proporzonale, che è rmasto nella sostanza mmutato, sebbene la numerostà complessva sa aumentata nel tempo. L ndagne utlzza lo stmatore d Horvtz-Thompson, con opportune rponderazon per l trattamento degl outler. Nel corso degl ultm ann, soprattutto per le varabl con pù elevata presenza d dat anomal, le stme sono state rese robuste medante tecnche d wnsorzzazone. Fno al 2003 erano utlzzat per la classfcazone dmensonale gl addett a fne anno; dal 2004, sa per omogenetà con le rlevazon esterne sa per evtare effett stagonal sul numero d occupat, le mprese sono classfcate n base al numero d addett med annu. Nel seguto sono descrtt nel dettaglo var aspett metodologc che caratterzzano l ndagne3. L'anno è quello d rfermento dell ndagne, che vene condotta ne prm mes dell anno successvo. 2 Sono esclus dall ndagne: le attvtà d ntermedazone fnanzara (su cu la Banca d Itala dspone d una grande mole d dat, raccolt per le fnaltà sttuzonal d vglanza e poltca monetara) e asscuratva; la Pubblca ammnstrazone e settor scolastco e santaro e gl altr servz pubblc, socal e personal. 3 Per ulteror dettagl sulle ndagn precedent s rnva alla prma pubblcazone perodca rguardante l ndagne (Banca d'itala Indagne sulle mprese ndustral e de servz. Anno d rfermento 2003 n Supplement al Bollettno Statstco Indagn camponare n. 55, 20 ottobre 2005).

La composzone dell unverso e del campone L unverso d rfermento (tav. I) è costtuto dalle mprese con sede ammnstratva n Itala, con almeno 20 addett, appartenent a settor d attvtà economca dell ndustra n senso stretto e de servz prvat non fnanzar; con almeno 0 addett per quello delle costruzon. Dall ndagne sul 200 s utlzza la classfcazone delle attvtà economche Ateco 2007 (tav. ) 4. Negl ann pù recent l campone è composto da crca 5.000 mprese (crca 3.000 mprese dell ndustra n senso stretto, crca.000 mprese de servz prvat non fnanzar, crca 600 delle costruzon). Le tavole I e I2 dell Appendce statstca rportano la numerostà della popolazone e la percentuale d mprese sondate dall ndagne. La frazone sondata è pù elevata per le mprese con almeno 50 addett e per quelle con sede nel Sud e nelle Isole. Defnzone de settor d attvtà economca Tav. Sezone Ateco 2007 Dvsone Ateco 2007 Settore d attvtà economca Aggregazon d settor utlzzate nelle tavole 0-2 Almentar, bevande e tabacco Altre manfatturere 3-5 Tessl, abbglamento, pell e calzature Tessl, abbglamento, pell e calzature 9-22 Chmca, gomma e plastca Chmca, gomma e plastca C 23 Mneral non metallfer Altre manfatturere Industra n senso stretto 24-30; 33 6-8; 3-32 Metalmeccanca Altra ndustra manfatturera (legno, fabbrcazone pasta carta, Metalmeccanca Altre manfatturere altre ndustre manfatturere) B 05-09 Estrazon d mneral da cave e mnere Energetche ed estrattve D 35 Forntura d energa elettrca Energetche ed estrattve E 36-39 Forntura d acqua Energetche ed estrattve Costruzon F 4-43 Costruzon Costruzon Servz prvat non fnanzar G 45-47 Commerco all ngrosso e al dettaglo, rparazon I 55-56 Attvtà de servz d alloggo e d rstorazone H 49-53 Trasport, magazznaggo J 58-63 Servz d nformazone e comuncazone L, M, N (a) 68-75; 77-82 Altr servz a mprese e famgle Commerco, albergh e rstorazone Trasport, magazznaggo e comuncazon Altr servz a mprese e famgle (a) Comprende: L = attvtà mmoblar; M = attvtà professonal, scentfche e tecnche; N = noleggo, agenze d vaggo, servz d supporto alle mprese. 4 S veda Istat (2009), Metod e Norme, n. 40. 2

Il dsegno camponaro Lo schema d camponamento dell ndagne è d tpo stratfcato. Gl strat sono costtut dalle combnazon d settore d attvtà economca (sulla base della classfcazone rportata alla tav. ), classe dmensonale (n termn d addett) 5 e sede ammnstratva dell mpresa 6. Per la determnazone della numerostà camponara s opera n due fas: nella prma s ndvdua la numerostà a lvello d classe dmensonale, utlzzando l metodo noto come optmum allocaton to strata 7, che consente d mnmzzare la varanza delle mede e delle varazon camponare delle prncpal varabl rlevate (occupazone, fatturato e nvestment). Nella seconda fase la numerostà d cascuna classe dmensonale è rpartta tra le regon e settor d attvtà economca n proporzone al numero d mprese della popolazone d nteresse appartenent allo strato 8. Le mprese da rlevare sono selezonate sulla base degl archv Cerved, Centrale de blanc e altre lste reperte autonomamente dalle Flal, allo scopo d rdurre al mnmo l rscho d copertura ncompleta della popolazone. Le mprese rlevate nell edzone precedente sono sempre rcontattate, se fanno ancora parte della popolazone d nteresse 9, mentre quelle non pù dsposte a collaborare sono sosttute con altre omogenee per tpo d attvtà economca e classe dmensonale. La fase d rlevazone, l questonaro e comportament d rsposta La rlevazone vene svolta annualmente tra febbrao e maggo, con rfermento all'attvtà economca d fne anno precedente; le ntervste sono condotte dalle Flal della Banca. Dall edzone relatva al 200, l carcamento de dat è nteramente realzzato tramte un applcazone accessble va web. L ndagne raccogle ogn anno nformazon su aspett anagrafc e struttural, occupazone, nvestment, fatturato, rsultato d eserczo, capactà produttva, ndebtamento 0. Le sezon monografche sono dedcate a specfc tem d nteresse. Per contenere l onere d rsposta, quest monografc possono essere occasonalmente post solo a un sottonseme causale del campone 2. 5 Le class d addett, rferte fno al 2003 al numero d addett a fne anno e dal 2004 al numero medo d addett nell anno, sono: 20 49 (a partre dal 203, per l campone delle mprese d costruzon è stata aggunta la classe 0 9 addett), 50 99, 00 99, 200 499, 500 999,.000 4.999 addett, 5.000 addett e oltre. Le untà con 5.000 addett e oltre formano uno strato autorappresentatvo. 6 Pemonte e Valle d Aosta sono consderate un unca regone. 7 Cfr., ad esempo, Cochran W. G., Samplng Technques, New York, John Wley & Sons, 977. 8 La numerostà camponara regonale vene po rpartta tra le Flal, che curano drettamente la rlevazone. In alcune aree del Paese s procede, se necessaro, a un sovracamponamento per le autonome esgenze d studo delle realtà economche local. 9 Tpche cause d uscta dalla popolazone d nteresse sono la varazone d attvtà economca e la dmnuzone del numero d addett al d sotto della sogla d nclusone: cfr. par. 4. 0 Per le mprese delle costruzon s rleva, n luogo d nvestment e fatturato, l valore della produzone (sa quella totale sa quella realzzata n opere pubblche). Per maggor dettagl cfr. questonar al lnk: https://www.bancadtala.t/statstche/bas-dat/brd/mprese-ndustral-eservz/questonaro-ndagne-mprese/ndex.html. 2 Per la rpartzone de quest ne questonar destnat a un gruppo d mprese A o a un gruppo d mprese B, s vedano questonar. 3

I contenut e la struttura de questonar vengono defnt nel perodo mmedatamente precedente alla rlevazone. Le nuove domande vengono sottoposte a test attraverso una rlevazone plota affdata alle Flal, al fne d verfcare la comprensbltà del testo e la dsponbltà delle nformazon presso le mprese. Per occupazone, nvestment e fatturato, le nformazon vengono rcheste con rfermento a tre perod: l anno appena concluso (dato d preconsuntvo), l anno precedente (dato d consuntvo) e quello successvo (dato d prevsone). La tavola Tav. I3 rporta tass d rsposta all ndagne. Il controllo d qualtà de dat e l mputazone de dat mancant I dat raccolt sono sottopost a un processo d controllo d qualtà. In partcolare s verfca la compatbltà de valor con quell ammess dalla domanda, la coerenza ntertemporale de dat panel e quella d alcun specfc mport e la presenza d valor anomal. La valdazone de dat avvene n modo gerarchco: ogn lvello d controllo s applca a dat rtenut vald al lvello precedente. Un prmo controllo del questonaro vene effettuato dal personale della Banca d Itala che cura la rlevazone, che, sulla base della competenza tecnca e della conoscenza dell economa locale, effettua una verfca qualtatva de dat raccolt 3. La procedura nformatca d carcamento mpedsce l acquszone d dat estern all ntervallo d defnzone della varable o ncompatbl con vncol d coerenza ntern al questonaro. I dat accettat dalla procedura d mmssone possono rsultare però anomal rspetto a sogle statstcamente plausbl su base storca o provenent da nformazon esterne: n questo caso ess vengono evdenzat e sottopost all'attenzone de rlevator, qual sono tenut a verfcarl e, se del caso, a rcontattare l mpresa per avere charment. L'eventuale conferma vene regstrata n un apposto campo. Solo a quel punto l dato scrutnato vene consderato valdo a fn dell ndagne. Nella successva fase de controll vengono usate tecnche d edtng fondate su assunzon d tpo statstco che consentono d dentfcare le osservazon anomale rspetto alle dstrbuzon cross-secton (su scala naturale o logartmca). Un ulterore procedura d controllo, detta d selectve edtng, è n grado d fornre una lsta d prortà per le verfche da effettuare a fronte d osservazon anomale valutate sulla base dell'mportanza d ognuna per la stma fnale. I valor della sngola varable vengono confrontat con quello prevsto da un semplce modello d regressone; a partre da tale statstca vene costruto, sulla base d un'approssmazone d Taylor, un punteggo (score) per cascuna mpresa, che dpende dall'effetto che l sngolo valore avrebbe sulla stma fnale condzonatamente al modello. Pù lo score è elevato (coè maggore è l mpatto del valore osservato sulla stma fnale secondo l modello) pù urgente è la verfca del valore d quella varable per quell'mpresa 4. Il procedmento vene ntegrato per un nseme d pù varabl, complando una graduatora rspetto a una funzone che sntetzza gl score rfert alle sngole varabl. Questa tecnca consente d elevare la qualtà delle stme rducendo al contempo l respondent burden nella fase fnale delle elaborazon, poché 3 In questa fase rlevator, utlzzando una scheda che rporta dat delle prncpal varabl fornt dalle mprese che hanno partecpato all ndagne precedente, effettuano anche una prma verfca d coerenza. 4 Cfr. Battpagla P., Selectve edtng to ncrease effcency n survey data processng. An applcaton to the Bank of Italy s Busness Survey on Industral Frms, n: Irvng Fsher Commttee Bulletn 3, December 2002, pp. 49 54. 4

lmta l resame e l'eventuale rcontatto solo a quelle mprese che hanno un mpatto gudcato sgnfcatvo sulle stme fnal. Le mprese nteressate da event straordnar qual ad esempo fuson o scorpor sono ncluse nel campone solo se n grado d fornre nformazon omogenee per l trenno rlevato nella stessa ndagne (nformazone a consuntvo, preconsuntvo e prevsone). A tal fne, dat possono essere rcostrut consderando l evento straordnaro come gà avvenuto all nzo dell anno d consuntvo, oppure come se l evento non s fosse affatto verfcato. Se una tale rcostruzone non è possble, l mpresa vene esclusa dalle elaborazon. Sebbene tale pratca possa costture una fonte d dstorsone delle stme de lvell (qual gl nvestment total), essa confersce maggore stabltà alle stme delle varazon e de valor med per addetto, che sono l prncpale obettvo dell ndagne. Le mprese che partecpano all ndagne possono talvolta ncontrare dffcoltà nel rspondere ad alcun quest. Se la mancata rsposta rguarda le varabl prncpal, come ad esempo la spesa programmata per nvestment, l fatturato o l occupazone prevst, s procede all'mputazone de dat mancant. L'mputazone s avvale n generale d stmator per rapporto, utlzzando come denomnatore l numero d addett med dell mpresa nell anno d rfermento che consente d coglere l effetto d scala 5. In alcun cas nella rcostruzone c s avvale anche de dat storc dell mpresa, sotto forma d effett ndvdual. In questo modo s stma un lvello per addetto ottenuto come combnazone tra una meda generale d tpo cross-secton e una meda calcolata solo su valor storc dell'mpresa. I lvell a temp t e t+ sono rcostrut n sequenza, calcolando varazon mede n opportune celle contenent mprese omogenee 6. I dat elementar mputat sono dentfcat da appost flag 7. La percentuale d dat mputat è comunque molto contenuta per le varabl fondamental a lvello d consuntvo e preconsuntvo. Le domande relatve alle prevson, n partcolare quelle nerent agl nvestment, tendono ad avere un tasso d mancata rsposta relatvamente pù elevato. Può rsultare elevato, n funzone della dffcoltà de quest, anche l tasso d mancata rsposta delle sezon monografche. La ponderazone L ndagne adotta una procedura d ponderazone stratfcata che s compone d due fas. In una prma fase s usano come strat le combnazon d settore d attvtà economca e classe dmensonale. A ogn mpresa s attrbusce un peso nzale, dato dal rapporto tra numero d mprese contenute nella cella d strato e numero d mprese del campone. Sa h 5 Per l anals delle condzon sotto cu lo stmatore per rapporto è preferble rspetto alla meda. Cfr., ad esempo, Ccchtell F. et al., Il camponamento statstco, Bologna, Il Mulno, 994. 6 Nella fase d mputazone s utlzzano ulteror accorgment. Ad esempo se una cella nella quale andrebbe calcolata una meda contene un numero esguo d mprese, essa vene unta a celle contgue secondo la classe dmensonale, o l area geografca. Nelle celle vengono noltre calcolate mede robuste, che lmtano l nfluenza degl outler nel processo d rcostruzone. In alcun cas s adottano soluzon partcolar che sfruttano dat rlevat nello stesso questonaro, ad esempo n presenza d vncol artmetc tra le varabl o d legam meno strett, ma tal da consentre un affdable rcostruzone del dato mancante. Ad esempo, se un mpresa non dchara l numero d assunzon effettuate nell anno, esso è calcolato aggungendo l numero d cessazon alla dfferenza tra l occupazone a fne e nzo anno; analogamente s procede se manca l numero d cessazon. 7 Cfr. https://www.bancadtala.t/statstche/bas-dat/brd/mprese-ndustral-e-servz/ndex.html: Descrzone delle varabl dell Indagne sulle mprese ndustral e de servz. 5

la generca cella d strato e al suo nterno N h l numero d mprese della popolazone d nteresse e n h quello del campone 8. Il peso della prma fase per ogn mpresa dello strato h è pertanto: () w (0) h Nh nh Per costruzone, la somma de pes d ogn cella resttusce pertanto la numerostà della popolazone d nteresse n essa contenuta. In una seconda fase s effettua una stratfcazone a posteror, utlzzando la tecnca del rakng 9, per tenere conto anche dell area geografca k n cu è localzzata la sede ammnstratva dell mpresa. Il peso nzale è modfcato con un fattore d aggustamento f k, consentendo d ottenere pes fnal: () ( 0 ) (2) w hk w h f k la cu somma concde, nelle celle d post-strato, con l numero d mprese della popolazone d nteresse v contenute. Il sstema d pes fnale non tene dunque conto d tutte le nterazon tra settore, classe dmensonale e area geografca, sa perché alcune combnazon possono presentare poche untà camponare, sa perché un sstema d pes sffatto potrebbe condurre a stme eccessvamente varabl per alcun domn d studo. La stratfcazone a posteror s lmta percò a rcostrure le combnazon tra: a) Nord Ovest, Nord Est, Centro, Sud e Isole; b) mprese con 20-49 addett e con 50 addett e oltre (per le mprese d costruzon dal 203 s consdera anche la classe 0-9 addett); c) mprese manfatturere, energetche ed estrattve, delle costruzon e de servz (queste ultme dstnte per sezone; cfr. par. 2). In ogn ndagne, pes vengono rcalcolat sulla base della dstrbuzone della popolazone d nteresse alla data pù recente dsponble 20. Le stme camponare Per una generca varable, la stma dell aggregato () è effettuata con uno stmatore corretto del totale d tpo Horvtz-Thompson 2, dato da: (3) = = (, ) =, dove è l numero totale d strat e è lo stmatore meda camponara per lo strato h-esmo. 8 Il smbolo n h ndca la numerostà camponara effettva. In questo modo s effettua mplctamente una correzone de pes per tenere conto delle mancate rsposte total (unt non response). 9 La tecnca denomnata teratve proportonal fttng (o rakng) consente d allneare n modo smultaneo pes camponar alla dstrbuzone d alcune caratterstche note da font esterne. Cfr., per esempo, Verma V., Advanced samplng methods: manual for statstcal traners, Tokyo, Statstcal Insttute for Asa and the Pacfc, 2000, pp. 6.3 6.2. 20 La popolazone d mprese utlzzata è stata ottenuta da Istat, Archvo statstco delle mprese attve, 203. Gl aggornament sono normalmente rlascat dall Istat con rfermento all'unverso d crca due ann prma. Le stme sono rvste perodcamente per tenere conto de cambament nella popolazone d rfermento dell ndagne. 2 Cfr., ad esempo, Ccchtell F. et al., Il camponamento statstco, Bologna, Il Mulno, 994. 6

La stma de tass d varazone, ad esempo del fatturato o degl nvestment, vene effettuata usando come stmatore l rapporto tra le sommatore de lvell per le sngole mprese, ponderate con coeffcent d rporto all'unverso, con una formula del tpo: (4), =, dove e rappresentano rspettvamente lo stmatore dell aggregato al tempo t e t-. I lvell dell'aggregato che entrano a numeratore e denomnatore della formula vengono rlevat presso l'mpresa nell anno d rfermento, anche quando essa aveva partecpato all'edzone precedente dell'ndagne 22. Per la stma delle varazon e del lvello degl nvestment per addetto dall ndagne sul 999 vengono mpegate tecnche d stma robusta 23. La dstrbuzone emprca d questa varable rsulta nfatt rcca d outler, anche n conseguenza della natura del fenomeno oggetto d studo: la msurazone de lvell, l cu rapporto dà orgne al tasso d varazone, è resa problematca dalla compresenza d fattor qual l carattere tpcamente plurennale della spesa, fattor d ncertezza, error d classfcazone e altr error d msura. Utlzzando la tecnca nota come wnsorzzazone del secondo tpo le varazon e lvell delle varabl per addetto, localzzate al d sopra o al d sotto d sogle (cut-off) determnate sulla base della dstrbuzone emprca sono rcondotte alla sogla stessa, n wns proporzone alla frazone sondata. Il valore wnsorzzato, y, è determnato dalla formula seguente: (5) y f * y f * y ( f wns ( y f )* )* J K se se y y J K altrment dove f è la frazone sondata e J e K le sogle (cut-off) rspettvamente nferore e superore della dstrbuzone d 24. La tecnca è stata adottata anche per l fatturato a partre dall ndagne sul 2005 e dal 2006 per le mprese delle costruzon, lmtatamente alla produzone totale e a quella n opere pubblche. In alcun cas l ndagne rleva drettamente de tass d varazone de fenomen economc (è questo l caso, ad esempo, della capactà produttva tecnca) oppure delle 22 La stma della dnamca de fenomen basata su dat d una sngola ndagne s è dmostrata assa pù stable rspetto a quella rcavable dal confronto de valor rlevat n ndagn contgue, che n alcun cas scontano sa modfche struttural delle mprese d cu è dffcle tenere conto, sa problem d classfcazone e d msura. All nterno dello stesso questonaro, quest aspett sono tenut maggormente sotto controllo, rendendo pù accurata la stma delle varazon. Tale metodologa non consente tuttava d tenere conto penamente dell ngresso o dell uscta d mprese dalla popolazone d nteresse. 23 Sulle tecnche d stma robusta n generale cfr., ad esempo: Andrews D. F. et al., Robust estmates of locaton, Prnceton, Prnceton Unversty Press, 972 o anche: Hoagln D. C. et al. (eds.) Understandng robust and exploratory data, New York, John Wley & Sons, 983. Un rfermento teorco classco è Huber P. J., Robust statstcs, New York, John Wley & Sons, 98. 24 In letteratura, la modfca de valor basata sulla (5) vene chamata Type 2 Wnsorzaton ; quella che non tene conto della frazone sondata vene chamata Type Wnsorzaton : n quest'ultmo caso, valor che s trovano oltre la sogla vengono post par al cut off. Per una descrzone dettaglata della procedura d wnsorzzazone utlzzata per la stma delle varazon degl nvestment cfr. Battpagla P., Robust Estmates of Investments from the Bank of Italy s Busness Survey, Statstcs Research Report, London, London School of Economcs, 2000. 7

percentual (ad esempo delle ore d straordnaro). In questo caso, la stma per l'ntera popolazone vene calcolata come meda de tass d varazone ndvdual, ponderata con l prodotto del coeffcente d rporto all'unverso per l relatvo mporto del fenomeno (o, se non dsponble, per una sua proxy). I deflator per lvell d nvestmento e fatturato sono calcolat come mede robuste settoral de deflator ndvdual rlevat drettamente presso le mprese, usando come fattore d ponderazone l prodotto tra coeffcente d rporto all unverso e l mporto del fatturato 25. Gl error standard Il calcolo analtco della varanza d stmator non lnear rcavat da un dsegno d camponamento stratfcato non proporzonale, con pes aggustat per tenere conto d varabl d post-stratfcazone, rsulta puttosto complesso 26 e gustfca l rcorso a tecnche d rcamponamento 27. In partcolare s utlzza l metodo ackknfe, che rsulta partcolarmente adatto a tener conto della struttura mposta a dat dalla natura del dsegno camponaro, garantendo al contempo adeguate propretà asntotche 28. Se Tn è l valore dello stmatore rferto a un campone d numerostà n e T n, è l valore dello stesso stmatore calcolato sul campone n cu s è elmnata l untà -esma (leaveone-out method), s calcolano dapprma gl pseudovalor T ~ n, defnt come: ~ (6) T nt ( n ) T n n, n n, Lo stmatore ackknfe della varanza d Tn è 29 : (7) ^ n n ~ ~ JACK ( T ) n,, ( ) Tn Tn n n n v Per l ndustra n senso stretto e servz, gl error standard pù elevat s rscontrano per la stma della varazone degl nvestment, a causa della loro ntrnseca varabltà (tav. I4). Pù rdott rsultano gl error standard relatv alle varazon d fatturato e occupazone. Nelle anals per domno, ad esempo per classe dmensonale dell mpresa o per area geografca, la precsone s rduce rspetto alle stme per l totale del campone, crcostanza d cu è necessaro tenere conto nell anals de rsultat. Gl error standard relatv alle prevson delle prncpal varabl rlevate nell ndagne sono calcolat utlzzando la tecnca dell mputazone multpla, che consente d tenere 2 25 Per le mprese delle costruzon s ottengono valor complessv della produzone n costruzon a prezz costant usando l deflatore Istat pù recente per le costruzon, mentre per l valore della produzone d opere pubblche s utlzza l deflatore Istat pù aggornato per la voce altre costruzon, che esclude le abtazon. 26 Cfr., ad esempo, l captolo 7 d Särndal C. E., Swensson B., Wretman J., Model Asssted Survey Samplng, New York, Sprnger Verlag, 992. 27 Un testo d rfermento classco è Wolter K. M., Introducton to varance estmaton, New York, Sprnger Verlag, 985. 28 L adeguatezza del metodo è anche supportata dal confronto d propretà teorche ed emprche con altr metod d replcazone. Cfr., ad esempo, Shao J., Tu D., The Jackknfe and Bootstrap, New York, Sprnger, 995, che contene un approfondta anals comparatva de due metod d stma della varanza. 29 S veda Tukey J. W. (958). Bas and confdence n not qute large samples. Annals of Mathematcal Statstcs, 29, 64. 8

conto che una quota non trascurable de dat è stata mputata a causa delle mancate rsposte parzal (come descrtto nel paragrafo 5). La tecnca consste nella replcazone ndpendente d un certo numero d dataset contenent le osservazon complete (nel caso specfco sono stat estratt 25 campon d bootstrap dal campone orgnaro). Dopo aver rallneato pes d dsegno alle varabl d post-stratfcazone, è stato replcato l processo d mputazone della varable d prevsone. Se s ndca con tˆ lo stmatore d nteresse e con m l numero campon replcat, la varanza d tˆ s stma con la seguente espressone 30 : m m * t tˆ 2 m (8) * (ˆ m) vˆ (ˆ) t vˆ p( s) (ˆ t ), dove tˆ m tˆ* m m m m * Il termne v ˆ (ˆ t ) ndca la varanza stmata sul -esmo campone replcato per lo p( s) stmatore tˆ, usando l nformazone del pano d camponamento p(s). La prma sommatora rappresenta la varanza meda rspetto alle replcazon (wthn mputaton varance), mentre la seconda (detta between mputaton varance) s nterpreta come la varabltà generata dal processo d mputazone. La tavola I5 presenta rsultat, da qual rsulta la maggore varabltà de dat d prevsone rspetto a quell d consuntvo. La tavola I6 presenta gl error standard per prncpal fenomen rlevat per le mprese delle costruzon, sa a consuntvo sa a prevsone: anche n questo caso s rscontra la maggore ncertezza d quest ultm. Il sstema BIRD per l elaborazone a dstanza de dat dell ndagne Da marzo 2008 la Banca d Itala ha reso dsponble un sstema per l'elaborazone a dstanza de dat raccolt nelle ndagn sulle mprese condotte dalla Banca, denomnato BIRD (acronmo d Bank of Italy Remote access to mcro Data) 3. Il sstema offre la possbltà d svolgere elaborazon su dat raccolt con le ndagn sulle mprese dell ndustra n senso stretto e de servz dal 984, nel peno rspetto della rservatezza de dat ndvdual. L utente svolge le sue anals statstche ed econometrche senza avere accesso dretto a sngol mcro dat, sottomettendo la propra elaborazone va emal e rcevendo per la stessa va gl output. Sa l nput sa l output sono sottopost a controll automatc e manual sul contenuto e sulla logca delle elaborazon. L'utlzzo del sstema è subordnato all'accettazone, da parte della Banca d'itala, della rchesta d rlasco d un'utenza. 30 Cfr., ad esempo, l captolo4 d Lehtonen H., Pahknen E., Practcal Methods for Desgn and Analyss of Complex Surveys, New York, Wley, 2004. 3 Per maggor dettagl s vst la pagna web https://www.bancadtala.t/statstche/bas-dat/brd/mprese-ndustral-eservz/ndex.html 9