COMIC Guida all uso (Ver. 1.0 anno 2017)

Documenti analoghi
Indici compositi per il BES

Progetto per l analisi e la sintesi degli indicatori di intensità delle rapine ai danni delle dipendenze bancarie. Matteo Mazziotta e Adriano Pareto

Il processo di costruzione degli indicatori compositi di Bes 2015 Alessandra Tinto

RANKER: strumento software per il calcolo e la valutazione comparata di indici sintetici

MANUALE HOT POTATOES VERSIONE 6.3. A cura di Domenico Paparazzo.

Il programma è distribuito tramite il file compresso TRASFO.zip contenente i file di programma strutturati in 4 cartelle:

L indice di vulnerabilità sociale e materiale

APPUNTI DI CALCOLO NUMERICO

C.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018.

Reti Logiche Appello del 9 gennaio 2007 Seconde prove

LA RETTA DI REGRESSIONE LINEARE E SISTEMI SOVRADETERMINATI

Il nuovo indicatore di gravità dell evento rapina. Matteo Mazziotta e Adriano Pareto Istat

L aggiornamento del campione di prodotti e di unità di rilevazione

CONTROLLO DI QUALITÀ. 1. Generalità. 2. Campioni di controllo qualità

Sezione Prima Tipologie di rapporti statistici

Approssimazione secondo il criterio dei minimi quadrati (caso. discreto) sistema sovradeterminato m > n

L aggiornamento del campione di prodotti e di unità di rilevazione

Istat, Roma 14 marzo 2016

METODOLOGIE DI SINTESI SPERIMENTALI PER I DOMINI DEL BES

Analisi dei dati per la comunicazione

A dati discreti n casi accertati di una malattia n figli per una famiglia. A dati continui Statura di un gruppo di persone Voti riportati a un esame

3. IL METODO DI TUNNELING

Lezione 4. Laboratorio progettuale (Tecnica delle Costruzioni)

Analisi Multivariata Prova intermedia del 20 aprile 2011

Strutture di ponderazione

SCHEDA DI LABORATORIO MATERIALI

3 L analisi sismica 3.1. EFFETTO DEL SISMA SULLE STRUTTURE

UNITÀ 1 LA MISURA DELLE GRANDEZZE FISICHE 1. Che cos è la Fisica. La fisica è una scienza sperimentale che studia i fenomeni naturali.

Insegnamento di Idrologia. Esercitazione n. 3

CAPITOLO 20 IL MODELLO MICROSCOPICO DELLA MATERIA ( ) ( ) ( ) " ( 1,50 "10 #3 m 3 ) ( ) ( ) = 1,0!10 5 Pa 3! 0,20 m 3 = 3,0 "10 2 K.

ANALISI DI SERIE TEMPORALI CAOTICHE

Il Tableau M M O M M M M M M M M O M M M M. valore dell obiettivo (soluzione corrente) coeff. dell obiettivo. nomi delle variabili fuori base

Strutture di ponderazione

1 Simulazione di prova d Esame di Stato

COMIC: A tool for composite indices evaluation

Maurizio Vichi Sapienza Università di Roma

Introduzione al Foglio Elettronico

Fondamenti di Informatica. Cosa è l informazione. Informazione. Informatica e Comunicazione Digitale

Introduzione al Foglio Elettronico

Dal progetto Archimede a un sistema di indicatori per le analisi locali

che rappresenta l equazione differenziale del moto armonico. La soluzione dell equazione differenziale è espressa come

Indici sintetici di benessere per le province italiane. Matteo Mazziotta e Adriano Pareto Istituto nazionale di Statistica

WPCustPad Utility per la personalizzazione di WEBpatente 4.2 offline.

Nome Cognome Numero di matricola Coordinata posizione. Quarto compito di Fisica Generale 1 + Esercitazioni, a.a Settembre 2018

Esercitazione: primi passi e uso dei files

Esercitazione n 2. Costruzione di grafici

Fondamenti di Informatica. Cosa è l informazione. A cosa serve. Prof.V.L.Plantamura Informatica e Comunicazione Digitale a.a.

La base informativa statistica del Bes delle province: caratteristiche e margini di miglioramento

Determinazione della densità di solidi.

Cultura Tecnologica di Progetto

Manuale Utente Software ITACA

Esercitazione n 3. Ancora grafici

LAVORO DI UNA FORZA (1)

GLI INDICI DEI PREZZI ALLA PRODUZIONE DEI PRODOTTI INDUSTRIALI

I quattro postulati della Meccanica. Piu avanti vedremo che occorre allargare il quadro per introdurre lo spin, le statistiche quantistiche...

Corso di Fondamenti di Informatica. Dispensa 9: Composizione di Classi. Prof. Domenico Rosaci

I moti. Daniel Gessuti

1. CALCOLI IDRAULICI E ANALISI DEI RISULTATI Per la modellazione matematica degli interventi in progetto è stato utilizzato il software Eraclito

PROBABILITÀ E VARIABILI CASUALI

Esercitazione 06: Verifica di strutture sollecitate a fatica

ANALISI DEI DATI con EXCEL

POLITECNICO DI TORINO 1 a Facoltà di Ingegneria A.A. 2011/2012. Progetto di Infrastrutture Viarie. Corso di Laurea Magistrale in Ingegneria Civile

Aerostato ad aria calda

SCHEMA DI MEZZO POROSO

A.S Classe III H Informatica. Programma didattico finale e indicazioni per il recupero estivo relativi all'insegnamento di Informatica

ANALISI MULTIDIMENSIONALE DEI DATI (AMD)

Moto di caduta di un corpo. Un corpo K, supposto puntiforme e di massa m, cade verso il suolo da un altezza h. Studiamone il moto.

SDE Marco Riani

Cosa sono i report. Prof. Emanuele Papotto 05/10/2010

Analisi delle Componenti Principali con R

MODELLO ATOMISTICO PER I DATI OCSE SULL ISTRUZIONE

Fogli Elettronici: MS Excel

Analisi in componenti principali

3.5.1 PREPARAZ1ONE I documenti che si possono creare con la stampa unione sono: lettere, messaggi di posta elettronica, o etichette.

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Programmazione Web D B M G. Il linguaggio HTML

Bilanci dei Comuni: Analisi statistiche territoriali. Breve guida alla fruizione degli strumenti di analisi

CIRCUITI MAGNETICI GIOGO TRAFERRO COLONNA

Svolgimento di un esercizio-tipo

CALCOLO STATISTICHE PER GLI STUDI DI SETTORE. Cosa fare per abilitare il calcolo dei dati per gli Studi di Settore

We model for you. Proposta agli istituti di ricerca che operano in Italia Marzo 2013

Svolgimento di un esercizio-tipo

La matrice delle correlazioni è la seguente:

Disposizione tecnica di funzionamento n. 07 Rev. 06 ME

L INTERFACCIA GRAFICA DI EXCEL

Statistica multivariata Donata Rodi 21/11/2016

Piattaforma FPA per gli Obiettivi di Sviluppo Sostenibile

Estrazione solido-liquido

GRAFICO DI PARETO. variabile rispetto a cui si vuole ordinare (ossia nel nostro esempio

Capitolo 1 Fisica, grandezze, unità di misura, metodo scientifico.

Corso di Access. Prerequisiti. Modulo L2A (Access) 1.2 Strumenti di Access. Utilizzo elementare del computer Concetti fondamentali di basi di dati

Istruzioni per l utilizzo di Prode Properties

Gli strumenti necessari per lo studio

AiSRE, Ancona Settembre 2016

MANUALE MODULO WIDGET EVENT TRACKING LICENZA SaaS

D B M G Il linguaggio HTML

Scheda di Lavoro relativa all'esperienza di laboratorio: LA TAVOLA DEI LEGUMI

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Transcript:

COMIC Guida all uso (Ver. 1.0 anno 2017 Pierpaolo Massoli Adriano Pareto Istat

Indice 1 1. Finalà del software 2. Requisi del software 3. Cosa fa il software? 4. Metodi ipleentati 5. Struttura delle directory 6. I dati di input L interfaccia utente 7. Gli output L indice dei risultati Grafici e tabelle 8. Sviluppi futuri Riferienti bibliografici 1 I paragrafi 2, 3, 5 e 8 sono redatti da P. Massoli; i paragrafi 1, 4, 6 e 7 sono redatti da A. Pareto. 2

1. Finalà del software COMIC (COMpose Indices Creator è un software sviluppato presso l Istuto Nazionale di Statistica (Istat, nell abo del gruppo BES (Benessere Equo e Sostenibile. Il software consente di: calcolare indici sintetici e costruire graduatorie; coparare agevolente diversi etodi di sintesi per scegliere il più opportuno; scrivere una reportistica efficace dei risultati ottenuti. Co è noto, un indice sintetico (o indice coposo è una cobinazione ateatica (o aggregazione di un insiee di indicatori eleentari 2 (variabili che rappresentano le diverse coponenti di un concetto ultidiensionale da isurare (per es., sviluppo, qualà della va, benessere, ecc.. Quindi, gli indici sintetici sono usati per isurare concetti che non possono essere catturati da un unico indicatore. Generalente, un indice sintetico dovrebbe essere basato su un quadro teorico che consenta di selezionare, cobinare e pesare gli indicatori eleentari in odo da riflettere le diensioni o la struttura del fenoeno che si sta isurando. Tuttavia, la sua costruzione non è seplice e, spesso, richiede una serie di decisioni/scelte (etodologiche o no da prendere. La procedura per costruire un indice sintetico prevede i seguenti passi. 1 Definizione del fenoeno da isurare. La definizione del concetto dovrebbe fornire un senso chiaro di ciò che si intende isurare con l indice sintetico. Essa dovrebbe riferirsi a un quadro teorico, coprendente diversi sottogruppi e indicatori sottostanti. Un aspetto fondaentale riguarda l identificazione del odello di isurazione, per il quale si distinguono due diversi approcci: odello riflessivo, se gli indicatori sono visti coe effetto del fenoeno da isurare, per cui un cabiaento nella variabile latente si riflette in un cabiaento degli indicatori osservati (gli indicatori sono intercabiabili e le correlazioni tra di essi sono spiegate dal odello; odello forativo, se gli indicatori sono visti coe causa del fenoeno da isurare, per cui un cabiaento nella variabile latente non iplica necessariaente un 2 Un indicatore eleentare è un dato elaborato costruo, generalente, rapportando un dato grezzo ad un altro che ne costuisce una base di riferiento (per es., reddo pro-cape. 3

cabiaento di tutti gli indicatori osservati (gli indicatori non sono intercabiabili e le correlazioni tra di essi non sono spiegate dal odello. 2 Selezione di un gruppo di indicatori eleentari. La forza e la debolezza di un indice sintetico riflettono la qualà degli indicatori eleentari sottostanti. Gli indicatori dovrebbero essere selezionati in base alla loro rilevanza, validà, tepestivà, disponibilà, ecc. La fase di selezione è il risultato di un coproesso tra possibili ridondanze e perda di inforazione. Un approccio statistico alla scelta degli indicatori consiste nel calcolare le correlazioni tra potenziali indicatori e includere quelli eno correlati tra loro. Tuttavia, il processo di selezione dipende dal odello di isurazione adottato: in un odello riflessivo, tutti gli indicatori devono essere correlati tra loro, entre in un odello forativo possono essere incorrelati. 3 Noralizzazione degli indicatori eleentari. La noralizzazione ha lo scopo di rendere gli indicatori coparabili in quanto essi, spesso, sono espressi in unà di isura diverse e possono avere polarà 3 differenti. Pertanto, è necessario portare gli indicatori a uno stesso standard, invertendo la polarà, laddove necessario, e trasforandoli in nueri puri, adiensionali. Esistono vari etodi di noralizzazione, coe la trasforazione in indici relativi (o etodo Min-Ma e la standardizzazione (calcolo dei z-scores. 4 Aggregazione degli indicatori noralizzati. E la cobinazione di tutte le coponenti per forare l indice sintetico (funzione ateatica. Tale passo richiede la definizione dell iportanza di ciascun indicatore eleentare (sistea di ponderazione e l identificazione della tecnica di sintesi (copensativa o non-copensativa. Il sistea più seplice e usato per la definizione del sistea di ponderazione a non per questo esente da criche consiste nell assegnare lo stesso peso a tutti gli indicatori. Per quanto riguarda la tecnica di sintesi, si distinguono due approcci: approccio copensativo, se gli indicatori eleentari sono considerati sostuibili 4 ; in tal caso, si adottano delle funzioni lineari, coe la edia aretica; approccio non copensativo, se gli indicatori eleentari sono considerati nonsostuibili 5 ; in tal caso, si adottano delle funzioni non lineari in cui si tiene conto iplicaente o esplicaente dello sbilanciaento tra i diversi valori, in terini di penalizzazione. 3 La polarà (o verso di un indicatore eleentare è il segno della relazione tra l indicatore e il fenoeno da isurare (per es., nella costruzione di un indice sintetico di sviluppo, la speranza di va ha polarà posiva, entre la ortalà infantile ha polarà negativa. 4 Gli indicatori eleentari sono detti sostuibili se un defic in un indicatore può essere copensato da un surplus in un altro (per es., un valore basso in Percentuale di persone che hanno partecipato ad attivà spiruali o religiose può essere copensato da un valore alto in Percentuale di persone che hanno partecipato a incontri di associazioni ricreative o culturali e viceversa. 5 Gli indicatori eleentari sono detti non-sostuibili se un defic in un indicatore non può essere copensato da un surplus in un altro (per es., un valore basso in Letti di ospedale per 1.000 abanti non può essere copensato da un valore alto in Medici per 1.000 abanti e viceversa. 4

5 Validazione dell indice sintetico. Consiste nel verificare che l indice sintetico è coerente con il quadro teorico generale. In particolare, occorre valutare la capacà dell indice di produrre risultati stabili e corretti (Analisi di Influenza e/o Analisi di Robustezza e la sua capacà discriinante. 2. Requisi del software COMIC è scrto interaente in SAS e richiede l'installazione del Base SAS Syste (ver. 9.1 o superiore. Non sono necessari pacchetti aggiuntivi che potrebbero ostacolarne l'ipiego. COMIC è alquanto facile da usare e non richiede alcuna installazione: basta copiare il prograa sul proprio pc, indipendenteente dal Sistea Operativo utilizzato (Windows, Linu, Uni, ecc.. 3. Cosa fa il software? Le principali funzioni di COMIC sono le seguenti: elaborazione di dati relativi a qualsiasi tipo di unà statistica, attualente è ottiizzato per lavorare a livello di regione e ripartizione geografica (acroregione; analisi esplorativa dei dati di input (statistiche descrtive, atrice di correlazione, atriplot; Analisi in Coponenti Principali/Analisi Fattoriale, Scree-plot, ecc.; costruzione delle graduatorie delle unà statistiche, per ciascun etodo di sintesi o indice sintetico selezionato; creazione di appe geografiche degli indici sintetici (per regione e ripartizione geografica; calcolo delle serie storiche degli indici sintetici (per più anni; creazione di grafici velocà-accelerazione, per ettere in relazione l intensà dei valori degli indici sintetici (velocà con la loro variazione nel tepo (accelerazione; confronti tra i vari etodi di sintesi (atrici di cograduazione e scatter-plot Analisi di Influenza (report e grafici; Analisi di Robustezza (report e grafici. 5

4. Metodi ipleentati I etodi di sintesi, disponibili su COMIC, sono i seguenti: Media indici 0-1; Media z-scores; Indice di Jevons statico e dinaico; Mazziotta-Pareto Inde (MPI; Adjusted Mazziotta-Pareto Inde (AMPI o MPI corretto; Indice edia geoetrica (IMG. Media indici 0-1 Data la atrice X={ i } di n righe (unà statistiche, colonne (indicatori e p strati (anni, si calcola la atrice trasforata R={r i }, con: r i ( i (Ma (Ma (Ma Min j j Min j Min j i j j sel' indicatore sel' indicatore j ha polarà posiva; j ha polarà negativa; dove Min e j j Ma sono, rispettivaente, il inio e il assio dell indicatore j, tra le n unà statistiche, nei p anni considerati o dei valori forni dall esterno. L indice sintetico, per l unà i al tepo t, è dato dalla forula: r 0-1 j 1 i M. Media z-scores Data la atrice X={ i } di n righe (unà statistiche, colonne (indicatori e p strati (anni, si calcola la atrice trasforata Z={z i }, con: ( i M S zi ( i M S sel' indicatore sel' indicatore j ha polarà posiva; j ha polarà negativa; 6

dove M e S sono, rispettivaente, la edia e lo scostaento quadratico edio dell indicatore j al tepo t. L indice sintetico, per l unà i al tepo t, è dato dalla forula: z z j 1 i M. Indice di Jevons statico e dinaico Data la atrice X={ i } di n righe (unà statistiche, colonne (indicatori e p strati (anni, l indice sintetico statico, per l unà i al tepo t, è dato dalla forula: JS j 1 i b 100 1 dove b è il valore base dell indicatore j al tepo t (nel caso delle regioni aliane, è la edia nazionale nell anno di riferiento. L indice sintetico dinaico, per l unà i al tepo t, è dato dalla forula: JD j 1 i ij( t 1 100 1 dove ij( t 1 è il valore dell indicatore j, per l unà i al tepo t-1. Mazziotta-Pareto Inde (MPI Data la atrice X={ i } di n righe (unà statistiche, colonne (indicatori e p strati (anni, si calcola la atrice trasforata Z={z i }, con: z i ( i M 100 S ( i M 100 S 10 10 sel' indicatore sel' indicatore j ha polarà posiva; j ha polarà negativa; dove M e S sono, rispettivaente, la edia e lo scostaento quadratico edio dell indicatore j al tepo t. 7

L indice sintetico, per l unà i al tepo t, è dato dalla forula 6 : MPI /- M z S z cv dove z j 1 i M z ; ( z j i Mz 1 S z ; 2 Sz cv. M z Adjusted Mazziotta-Pareto Inde (AMPI o MPI corretto Data la atrice X={ i } di n righe (unà statistiche, colonne (indicatori e p strati (anni, si calcola la atrice trasforata R={r i }, con: r i ( i (Ma (Ma (Ma Min Min j i Min 60 60 70 70 sel' indicatore sel' indicatore j ha polarà posiva; j ha polarà negativa; dove Min e Ma sono, rispettivaente, il inio e il assio dell indicatore j, tra le n unà statistiche, nei p anni considerati o dei valori forni dall esterno. Tali valori possono essere calcolati in odo da porre uguale a 100 un valore di riferiento (nel caso delle regioni aliane, la edia nazionale nell anno base. L indice sintetico, per l unà i al tepo t, è dato dalla forula 1 : MPI /- M r S r cv dove r j 1 i M r ; ( r j i Mr 1 S r ; 2 cv. S M r r Indice edia geoetrica (IMG Data la atrice X={ i } di n righe (unà statistiche, colonne (indicatori e p strati (anni, si calcola la atrice trasforata R={r i }, con: 6 E una fora generalizzata, poiché include due indici in uno. Se l indicatore è posivo, ossia se a variazioni crescenti dell indicatore corrispondono variazioni posive del fenoeno (per esepio, il benessere, si utilizza MPI -.Viceversa, se l indicatore è negativo, ossia se a variazioni crescenti dell indicatore corrispondono variazioni negative del fenoeno (per esepio, il alessere, si utilizza MPI +. 8

r i ( i (Ma (Ma (Ma Min Min j i Min 198 198 1 1 sel' indicatore sel' indicatore j ha polarà posiva; j ha polarà negativa; dove Min e Ma sono, rispettivaente, il inio e il assio dell indicatore j, tra le n unà statistiche, nei p anni considerati o dei valori forni dall esterno. Tali valori possono essere calcolati in odo da porre uguale a 100 un valore di riferiento (nel caso delle regioni aliane, la edia nazionale nell anno base. L indice sintetico, per l unà i al tepo t, è dato dalla forula: IMG. r i j 1 1 5. Struttura delle directory COMIC è distribuo ediante un archivio copresso. Decopriendo l archivio, l albero delle directory è: Directory DATI, che contiene le seguenti sub-directory: INPUT: dove possono essere eorizzati i dati di ingresso (in alternativa, è possibile utilizzare una qualsiasi directory selezionata dall utente; MAPS: dove devono essere eorizzati tutti i dati necessari per creare una appa geografica; OUTPUT: dove possono essere eorizzati i dati di usca (in alternativa, è possibile utilizzare una qualsiasi directory selezionata dall utente; Directory PGM, che contiene le acro SAS; Directory SETTINGS, in cui sono eorizzati tutti i paraetri di esecuzione, allo scopo di facilare eventuali riesecuzioni del software. 9

6. I dati di input COMIC prevede quattro tipi di file di input: foglio di lavoro Ecel (.ls; file di testo ASCII - Coa Separated Values (.csv; file di testo ASCII - Tab Separated Values (.tt; data set SAS (file senza estensione. I dati devono essere eorizzati nel file di input, coe riportato: la pria riga (forato stringa deve contenere i noi delle variabili 7 nella seguente successione: unà statistica (per es., region, anno di riferiento (per es., year, tipologia di unà statistica (per es., type, peso dell unà statistica (per es., wgt, indicatori eleentari (per es., ind1, ind2, ind3, ind4, ecc.; dalla seconda riga in poi: la pria colonna (forato stringa deve contenere le etichette delle unà statistiche; la seconda colonna (forato nuerico deve contenere gli anni di riferiento degli indicatori eleentari; la terza colonna (forato nuerico deve contenere la tipologia delle unà statistiche: 1=ripartizione geografica, 2=regione e -1=unà statistica generica; la quarta colonna (forato nuerico deve contenere i pesi ( 1 delle unà statistiche; il valore corrispondente alla riga del totale di riferiento viene ignorato. la quinta colonna e le successive (forato nuerico devono contenere i valori degli indicatori eleentari; alla fine delle righe contenenti le unà statistiche, per ciascun anno, deve essere riportato il totale di riferiento (per es., totale o edia nazionale. i dati ancanti (issing non sono aessi. Nella figura 1 è riportato un esepio di file di input. Si noti che alcuni paraetri, coe la polarà e il peso degli indicatori eleentari o i valori inii e assii da utilizzare per la loro noralizzazione, non devono essere riportati nel file di input, a possono essere inseri nel prograa durante l esecuzione (in caso contrario, si utilizzano le ipostazioni di default. 7 I noi delle variabili devono coinciare con una lettera, non devono contenere spazi, caratteri speciali o parole chiave del SAS. 10

Figura 1 L interfaccia utente COMIC può essere utilizzato anche da utenti senza alcuna conoscenza di SAS grazie ad una seplice, a efficace, interfaccia grafica GUI. Gli utenti counicano con il software solo attraverso tale interfaccia, ipleentata attraverso l istruzione acro SAS Base %WINDOW/%DISPLAY per consentire l inseriento di tutti i paraetri necessari all esecuzione. I dati iessi trae la GUI sono salvati in un file ASCII nella directory SETTINGS. Nella figura 2 è illustrata la pria pagina del enù di input. In questa pagina occorre selezionare (trae una gli indici che si vogliono calcolare, distinguendo tra statici e dinaici 8. In quest ultio caso, devono essere presenti aleno due anni diversi nel file di input (per es., 2015 e 2016. Quindi, è necessario specificare se si vuole effettuare l Analisi di Influenza e/o l Analisi di Robustezza (trae y o n. Infine, occorre inserire il noe del file di input e la directory dei file di output (con i relativi percorsi. 8 Gli indici sintetici statici isurano l intensà del fenoeno in un dato periodo di riferiento (per es., anno, entre gli indici sintetici dinaici isurano la variazione dell intensà del fenoeno tra due periodi di riferiento (per es., un anno e quello successivo. 11

Figura 2 L Analisi di Influenza ha lo scopo di valutare se - e con quale intensà - la graduatoria delle unà statistiche cabia, a seguo dell eliinazione di un indicatore eleentare dall insiee di partenza. Dati indicatori eleentari, si conducono replicazioni eliinando, ogni volta, un indicatore diverso e calcolando i valori degli indici sintetici sulla base degli -1 indicatori rianenti. Per ogni replicazione, si costruiscono le graduatorie delle unà statistiche secondo i vari etodi e, per ciascuna unà, si calcolano le differenze assolute di rango tra la posizione nella graduatoria originaria e la posizione nella graduatoria relativa agli -1 indicatori eleentari. Infine, per ciascun indice sintetico, si calcolano la edia e lo scostaento quadratico edio delle differenze assolute di rango (shift. L analisi viene ripetuta per ciascun anno, presente nel file di input. L Analisi di Robustezza si propone di verificare la stabilà di un indice sintetico al variare di perturbazioni casuali della atrice di partenza. Se si sceglie di effettuare questa analisi, coparirà una pagina aggiuntiva (figura 3 in cui si chiede l inseriento dei seguenti paraetri: 1. percentuale di unà statistiche da perturbare p (valore copreso tra 5 e 100; 2. fattore oltiplicativo o intensà dei disturbi λ (valore copreso tra 0,01 e 100; 3. nuero di replicazioni o ripetizioni del disturbo r (valore copreso tra 1 e 999. 12

Figura 3 Sulla base di tali valori, per ciascun anno t, vengono generate r atrici di input, in cui si perturba il p% di unà statistiche scelte casualente. La forula di perturbazione è la seguente: dove: ˆ i i λ N(0, σ ˆ i è il valore perturbato dell indicatore j, per l unà i, al tepo t; i è il valore originario dell indicatore j, per l unà i, al tepo t; N 0, σ è una deterinazione di una variabile casuale norale con edia nulla e ( scostaento quadratico edio dell indicatore j, al tepo t. Quindi, su ciascuna delle r atrici perturbate, si calcolano gli indici coposi selezionati e le corrispondenti graduatorie. Tali graduatorie sono confrontate con quella originale (ottenuta dalla atrice di partenza, ediante il calcolo della edia e dello scostaento quadratico edio delle differenze assolute di rango (shift. Nella seconda pagina (figura 4, occorre selezionare gli indicatori eleentari da elaborare (trae una e definire la loro polarà (trae + o -. Inoltre, è necessario specificare se i valori inii e assii da utilizzare per la noralizzazione degli indicatori eleentari (goalpost devono essere calcolati dal software o forni dall esterno (trae y o n. Nel prio 13

caso, saranno considerati, per ciascun indicatore eleentare, il inio e il assio tra tutte le unà statistiche, in tutti gli anni considerati. Figura 4 La terza pagina (figura 5 è dedicata alla definizione dei pesi degli indicatori. Ciascun valore deve essere copreso tra 0,001 e 100. Per default, tutti gli indicatori hanno lo stesso peso, pari a 1. Inoltre, occorre specificare se si desidera ponderare le unà statistiche con i pesi contenuti nel file di input (trae y o n. Per default, i pesi della colonna 4 del file di input sono ignorati e tutte le unà statistiche hanno lo stesso peso, pari a 1. Nella quarta pagina (figura 6 sono riportati i valori inii e assii calcolati dal software o già usati in precedenza che possono essere conferati o odificati dall utente. Quindi, occorre specificare l anno di riferiento per la noralizzazione (tale valore ha senso soltanto se, nel file di input, ci sono più anni da analizzare. Infine (figura 7, è necessario selezionare gli anni per i quali effettuare l elaborazione. Nel caso in cui il file di input contenga più anni, infatti, l utente potrebbe essere interessato solo ad alcuni di essi. 14

Figura 5 Figura 6 15

Figura 7 Preendo F3 alla fine di ogni pagina, è possibile passare alla pagina successiva e, quindi, avviare l elaborazione dei dati che può richiedere anche diversi inuti a seconda delle funzioni che sono state richieste. 16

7. Gli output Durante l esecuzione del software, viene creata autoaticaente una directory di output con lo stesso noe del file di input (se questa esiste, viene sovrascrta. Tale directory è contenuta nella directory DATI\OUTPUT o in qualsiasi altra directory scelta dall utente. L albero della directory di output è il seguente: DATI: dove sono salvati i data-set SAS di output (graduatorie, serie storiche, ecc.; WORD: dove sono salvati tutti i report in rich tet forat (.rtf; HTML: dove sono salvati tutti i report in htl (.htl. Per facilare la navigazione tra i report, un indice dei risultati viene creato autoaticaente nella directory di output con un file ipertestuale in htl (soario.htl. L indice dei risultati Aprendo il file soario.htl copare l indice dei risultati (figure 8-11. A partire dall indice, cliccando sulle voci evidenziate in blu, è possibile visualizzare prospetti riepilogativi, grafici e tabelle. Figura 8 17

Figura 9 Figura 10 18

Figura 11 Grafici e tabelle Le inforazioni visualizzabili a partire dall indice dei risultati sono le seguenti: Valori degli indicatori base selezionati e opzioni di esecuzione; Analisi descrtiva dei dati di input (per ogni anno: Matri plot degli indicatori selezionati; Media, scarto quadratico edio e frequenza degli indicatori selezionati; Matrice di correlazione degli indicatori selezionati; Autovalori della atrice di correlazione degli indicatori selezionati; Scree plot dell Analisi in Coponenti Principali (ACP degli indicatori selezionati; Autovettori della atrice di correlazione degli indicatori selezionati; Counala' degli indicatori selezionati; Punteggi delle unà statistiche ottenuti dall ACP (Coponenti Principali; Graduatorie e valori degli indici coposi selezionati (per ogni anno; Mappe dei valori degli indici coposi selezionati (per ogni anno; Serie storiche degli indici coposi selezionati (per ciascun indice sintetico selezionato; Grafici veloca' - accelerazione degli indici coposi (per ogni anno e ciascun indice sintetico dinaico selezionato; Confronti fra gli indici coposi selezionati: report e grafici (per ogni anno; 19

Analisi di influenza degli indici coposi selezionati (N. B. i pesi degli indicatori eleentari non vengono considerati; Shift delle graduatorie per indicatore base riosso (per ogni anno e ciascun indice sintetico selezionato; Media e scarto quadratico edio degli shifts delle graduatorie: report (per ogni anno e ciascun indice sintetico selezionato; Media e scarto quadratico edio degli shifts delle graduatorie: grafici (per ogni anno e ciascun indice sintetico selezionato; Media e scarto quadratico edio degli shifts delle graduatorie: riepiloghi (per ogni anno; Analisi di robustezza degli indici coposi selezionati (N. B. i pesi degli indicatori non vengono considerati Media e scarto quadratico edio degli shifts delle graduatorie: report (per ogni anno e ciascun indice sintetico selezionato; Media e scarto quadratico edio degli shifts delle graduatorie: grafici (per ogni anno e ciascun indice sintetico selezionato; Media e scarto quadratico edio degli shifts delle graduatorie: riepiloghi (per ogni anno. Nelle pagine seguenti sono illustrati alcuni esepi dei risultati. In figura 12 è ostrata la pagina relativa a Valori degli indicatori base selezionati e opzioni di esecuzione. La figura 13 rappresenta il Matri plot degli indicatori selezionati, dove ciascun indicatore selezionato è esso in relazione con gli altri, al fine di visualizzare le relazioni esistenti. Nella figura 14 è riportata la Matrice di correlazione degli indicatori selezionati; entre in figura 15 è illustrato lo Scree plot dell Analisi in Coponenti Principali, da cui è possibile desuere la presenza di eventuali diensioni latenti. La figura 16 contiene la tabella riguardante Graduatorie e valori degli indici coposi selezionati ; tale tabella include anche il totale di riferiento (in tal caso, la edia nazionale. I valori degli indici coposi sono rappresentati graficaente ediante le Mappe dei valori degli indici coposi selezionati, illustrate in figura 17. Nella figura 18 è riportata una Serie storiche degli indici coposi selezionati ; entre la figura 19 ostra un esepio di Grafici veloca' - accelerazione degli indici coposi. Infine, le figure 20-21 riguardano i Confronti fra gli indici coposi selezionati: report e grafici ; le figure 22-23 l Analisi di Influenza e le figure 24-25 l Analisi di Robustezza. 20

Figura 12 Figura 13 21

Figura 14 Figura 15 22

Figura 16 Figura 17 23

Figura 18 Figura 19 24

Figura 20 Figura 21 25

Figura 22 Figura 23 26

Figura 24 Figura 25 27

8. Sviluppi futuri I possibili sviluppi di COMIC riguardano i seguenti aspetti: ipleentazione di procedure SAS per igliorare l analisi esplorativa dei dati di input; possibilà di creare delle appe geografiche Mondo ed Europa ; versione alternativa in linguaggio R. 28

Riferienti bibliografici Aureli Cutillo E. (1996, Lezioni di statistica sociale. Parte seconda, sintesi e graduatorie, CISU, Roa. Delvecchio F. (1995, Scale di isura e indicatori sociali, Cacucci edore, Bari. Mazziotta M., Pareto A. (2011, Un indice sintetico non copensativo per la isura della dotazione infrastrutturale: un'applicazione in abo sanario, Rivista di Statistica Ufficiale, 1/2011, pp. 63-79. Mazziotta, M., Pareto, A. (2016, On a Generalized Non-copensatory Copose Inde for Measuring Socio-econoic Phenoena, Social Indicators Research, 127, pp. 983-1003. OECD (2008, Handbook on Constructing Copose Indicators. Methodology and user guide, OECD Publications, Paris. Tarantola, S. (2008, European Innovation Scoreboard: strategies to easure country progress over tie, JRC Scientific and Technical Reports, EUR 23526 EN, Luebourg. UNDP (2010, Huan Developent Report 2010, Palgrave Macillan, New York. 29