3. La matrice dei dati e le analisi preliminari 3.1 Introduzione



Documenti analoghi
Capitolo 16. La teoria dell equilibrio generale. Soluzioni delle Domande di ripasso

Il moto circolare uniforme

MODELLI DI SCELTA DEL PERCORSO PER RETI DI TRASPORTO COLLETTIVO

Un modello di ricerca operativa per le scommesse sportive

Pozzetti a sezione quadrata per rete fognaria

MATRICI SIMILI E MATRICI DIAGONALIZZABILI

d r da informazione r r y x Cinematica seconda parte

Componenti per l aritmetica binaria. Motivazioni. Sommario. Sommario. M. Favalli

θ 2 º Esercizio 1

NUOVO PETIT CUT. Velocità elevata, precisione ed efficienza MBC020 MB8025 MBC010 MB4020. Serie di inserti di tornitura CBN

GONIOMETRIA GONIOMETRIA E TRIGONOMETRIA LEZIONI. Introduzione alla goniometria e alla trigonometria

capacità si può partire dalla sua definizione: C = e dalla relazione fra la differenza di potenziale ed il campo elettrico: V

Facoltà di Ingegneria Fisica I 1 marzo 2005 Compito C

3. Calcolare l angolo di carico nelle condizioni di cui al punto precedente [ ] m Reattanza di dispersione

Elementi di Cinematica COORDINATE CARTESIANE. r r. & r COOORDINATE LOCALI COORDINATE POLARI. r = r. λ r

Geometria elementare. Sezione Prima Geometria nel piano

Vettori e scalari. Scalari: sono completamente definite quando se ne conosce la sola misura (es. tempo, massa, temperatura, GRANDEZZE FISICHE

Classe 4 G dicembre 2010.

come per coppia di punt

METODO VOLTAMPEROMETRICO

15. Le onde elastiche

MATEMATICA FINANZIARIA CAP

Legge dei grandi numeri e significato probabilistico della distribuzione normale

Momento di una forza rispettto ad un punto

Investimento. 1 Scelte individuali. Micoreconomia classica

1 O , calcola l area della regione piana delimitata da C dalla curva di equazione y = gl(x) nell intervallo [-2;

Trasformata di Laplace unilatera Teoria

Facoltà di Economia - Università di Sassari Anno Accademico Dispense Corso di Econometria Docente: Luciano Gutierrez.

I equazione cardinale della dinamica

Componenti per l aritmetica binaria

Lezioni di Fisica Generale Per il corso di laurea in Ingegneria Edile A.A. 2002/2003 (in costruzione)

Approfondimento Altri tipi di coefficienti di correlazione

Il lavoro è quindi una grandezza scalare le cui unita di misura sono: = Joule = J

Per ogni domanda ci può essere più di una risposta esatta. Puoi confrontarti con i tuoi compagni. Domanda Risposta A Risposta B Risposta C Risposta D

ageometria rafforzata per una lavorazione stabile. aper un elevata qualità di foratura. Lega resistente al calore Tolleranza D1 Tolleranza D4

r v E r = Quadrilatero articolato 3 β α ω 1 v r δ v r E v r E/B 1 = manovella 2 = bilanciere 3 = biella

Un modello attuariale per il Fair Value del rischio calamità naturali in agricoltura

16. LA RESISTENZA A FATICA: EFFETTO DELLA SOLLECITAZIONE MEDIA = (16.1,2) 2 2

11. Geometria piana ( ) ( ) 1. Formule fondamentali. Rettangolo. A = b = h = = b h. b = base h = altezza. Quadrato

1 VETTORI. 1.1 Operazioni tra vettori

r r ω t r Pr r r r r r CINEMATICA DEI MOTI RELATIVI velocità del punto P

AUTOVALORI ED AUTOVETTORI. Sia V uno spazio vettoriale di dimensione finita n.

AZIONAMENTI ELETTRICI 2. Modello del motore asincrono trifase ed osservatori di flusso

MOTORE SINCRONO A MAGNETI PERMANENTI

Capitolo IV L n-polo

Angoli e funzioni. goniometriche

Definizione delle specifiche per un sistema di controllo a retroazione unitaria

Energia potenziale e dinamica del punto materiale

P O M P E. Per un impianto generico, il cui schema è rappresentato in figura, si adotta la seguente terminologia: H g è la PREVALENZA GEODETICA

Corso di Microonde II

Esempi di campi magnetici e calcolo di induttanze.

Modelli per problemi di equilibrio di reti

CENTRO DI ISTANTANEA ROTAZIONE

d y d u + u y des C(s) F(s) Esercizio 1 Si consideri lo schema di controllo riportato in figura:

INTRODUZIONE ALL ANALISI DI MISSIONI SPAZIALI TRASF. COPLANARI

Dinamica: Applicazioni delle leggi di Newton

V. SEPARAZIONE DELLE VARIABILI

Problemi di collegamento delle strutture in acciaio

3. Funzioni iniettive, suriettive e biiettive (Ref p.14)

Vettori e scalari. Scalari: sono completamente definite quando se ne conosce la sola misura (es. tempo, massa, temperatura, GRANDEZZE FISICHE

STABILITA DEI SISTEMI IN RETROAZIONE CRITERIO DI ROUTH ESERCIZI

Capitolo. Il comportamento dei sistemi di controllo in regime permanente. 6.1 Classificazione dei sistemi di controllo. 6.2 Errore statico: generalità

Lagrangiane. Fenomenologia delle Interazioni Forti. Diego Bettoni Anno Accademico

I vettori. Grandezze scalari: Grandezze vettoriali

REALTÀ E MODELLI SCHEDA DI LAVORO

ESERCIZI VARI di GEOMETRIA AFFINE

Sintesi tramite il luogo delle radici

Lezioni di Ricerca Operativa 2 Dott. F. Carrabs

" Osservazione. 6.1 Integrale indefinito. R Definizione (Primitiva) E Esempio 6.1 CAPITOLO 6

Note su alcuni principi fondamentali di macroeconomia Versione parziale e provvisoria. Claudio Sardoni Sapienza Università di Roma

Da Alpe Adria all U.E. Sistemi sanitari regionali e programmi europei per la salute e la ricerca biomedica

4) Ebollizione-Condensazione come convezione ma con cambiamento di fase

LE INCERTEZZE E LA LORO PROPAGAZIONE NELLE MISURE INDIRETTE

Capitolo 16. La teoria dell equilibrio generale. Soluzioni dei Problemi

Le ipotesi di base che si utilizzano sono le stesse quattro già viste con riferimento al caso della flessione semplice e cioè:

Ing. Mariagrazia Dotoli Controlli Automatici NO (9 CFU) Antitrasformata di Laplace PROCEDIMENTI DI ANTITRASFORMAZIONE

22 - Il principio dei lavori virtuali

1.1 Legge di trasformazione del vettore di posizione per traslazioni del sistema di riferimento

9. Metrica di Friedmann, Robertson e Walker.

INTEGRAZIONE NUMERICA DI UNA FUNZIONE

I PROBLEMI DI MASSIMO E DI MINIMO

1 b a. f(x) dx. Osservazione 1.2. Se indichiamo con µ il valore medio di f su [a, b], abbiamo che. f(x) dx = µ(b a) =

Motore CC. Motore a corrente continua. Motore in corrente continua Schema elettrico Modello Motore+Carico. (medio) (piccolo)

UNITÀ DI GUIDA E SLITTE

ESAME DI STATO DI LICEO SCIENTIFICO CORSO DI ORDINAMENTO 2003

Laboratorio di Algoritmi e Strutture Dati

Esame di allineamento di Fisica - 24 novembre Facoltà di Ingegneria - Università di Bologna, sede di Cesena -a-

Esercizi vari di GEOMETRIA AFFINE METRICA

MINI-MWS FORATURA (METALLO DURO) MWS L METALLO DURO NEW

Determinanti e caratteristica di una matrice (M.S. Bernabei & H. Thaler

SISTEMI DI CONDOTTE: La verifica idraulica

Y(s) X(s) Per errore statico si intende lo scostamento, a regime, della variabile controllata Y(s) dal valore desiderato.

Circuito Simbolico. Trasformazione dei componenti

Stabilità dei sistemi di controllo in retroazione

MODULO D ORDINE PRATICA IVA NOTAIO Compilare tutti i campi del presente modulo Il modulo è compilabile a video

11. Rango di una matrice.

, x 2. , x 3. è un equazione nella quale le incognite appaiono solo con esponente 1, ossia del tipo:

RAGIONERIA GENERALE ED APPLICATA SIMULAZIONE PRIMA PROVA INTERMEDIA A

si definisce Funzione Integrale; si chiama funzione integrale in quanto il suo * x

Grandezze vettoriali. Descrizione matematica: l ente matematico vettore

Transcript:

3. L mtice dei dti e le nlii pelimini 3. Intoduzione Pe elizze un nlii ttitic concenente fenomeni ziendli, o di qulii lt ntu, non bt ccogliee dti, biogn nche ognizzli in modo ppopito. Si che i dti poengno d fonti econdie (i ed il Cpitolo ) o d ilezioni d hoc (Cpitolo ), ei nno ognizzti in modo d endee poibili le nlii ttitiche, che peo coinolgono contemponemente un plulità di ibili, come i edà più nti (Cpitoli 4 e 5). Ognizze i dti in modo ppopito ignific itemli in un mtice di dti, oeo in un tol compot d un ceto numeo di ighe e di colonne. Nelle ighe engono in genee collocti gli oggetti, cioè le unità di oezione, o unità ttitiche, che poono eee indiidui, impee, o nche modlità di un cttee, d eempio l egione di eidenz o il ettoe di ttiità delle impee, ecc. Nelle colonne engono inece collocti gli ttibuti delle unità ttitiche, cioè le diee ibili miute u di ee. Ad eempio, e i dee elizze un nlii ttitic di dti ccolti tmite un indgine cmpioni ulle impee, nelle ighe dell mtice dei dti enno collocte le diee impee del cmpione, mente nelle colonne enno collocte le ibili che u ognun di ee ono tte ilete. Quete ultime poono eee di tipologie eteogenee pe liello di miuzione: lcune quntittie, come il olume dei ici o il numeo dei dipendenti; lte qulittie odinli, come il titolo di tudio del titole dell impe; lte nco qulittie connee, come l fom giuidic. Le nlii che potnno eee compiute, gli indici ttitici che potnno eee clcolti, ntulmente nno diei econd del tipo di ibili coinolte. In queto cpitolo engono illutte le pincipli nlii pelimini che poono eee condotte u mtici di dti del tipo ccennto. In pticole, enno ichimte le nlii che poono eee condotte ui coiddetti pofili di colonn e quelle ui coiddetti pofili di ig dell mtice. I pofili di colonn i ifeicono lle ditibuzioni delle ingole ibili t le unità ttitiche, mente i pofili di ig deciono le ingole unità ttitiche ull be delle molteplici ibili u di ee ilete. Pe qunto igud le nlii ui pofili di colonn enno tutti tlcite le nlii coiddette uniite, concenenti cioè le ingole ibili, che ono oggetto di ppofondit tttzione nei coi di ttitic di be. Venno inece ichimte le pincipli nlii biite, concenenti in pticole il gdo di ocizione t coppie di ibili peenti nell mtice dei dti. Con ifeimento i pofili ig enno inece ichimte le pincipli miue di ditnz e imilità t unità ttitiche. Gli indici di ocizione o di ditnz che enno illutti in queto cpitolo cotituicono peo il punto di ptenz pe le più complee nlii ttitiche che nno oggetto dei poimi due cpitoli: pe l fomulzione dei modelli di egeione multiit (Cpitolo 4); pe l elizzzione delle diee nlii multidimenionli (Cpitolo 5). Un olt intodott l mtice dei dti nell u fom più comune (Pgfo 3.), il cpitolo i pe con un ichimo i pincipli poblemi di qulità dei dti contenuti nell mtice, in pticole quelli deinti dll peenz di loi nomli (outlie) e dll peenz di mncte ipote pzili (Pgfo 3.3). Succeimente engono illutte le pincipli miue di ocizione t ibili, nei diei ci di ibili qulittie, quntittie o mite (Pgfo 3.4). Infine, engono illutte le pincipli miue di ditnz o di imilità t le unità ttitiche, nch ee diee econd del tipo di ibili coinolte (Pgfo 3.5).

3. L mtice dei dti Nell u fom più comune, un mtice dei dti è un tbell contenente le infomzioni diponibili eltimente d un inieme di unità ttitiche. In genele, upponendo di ee oeto i loi di p cttei u un collettio di n unità ttitiche, l mtice dei dti, denott X (di dimenione n x p), à tuttut nel modo eguente: x x x h x j x p x x xh x j x p xi xi xih xij xip X. x x xh xj xp xn xn xnh xnj xnp Cicun ig dell mtice contiene le p infomzioni eltie d un detemint unità ttitic, mente cicun colonn contiene le modlità unte d un deteminto cttee nelle diee unità ttitiche. Il uo geneico elemento x ij ppeent dunque l modlità che il j-eimo cttee ume in coipondenz dell i-eim unità. L mtice dei dti può nche eee it come un inieme di n ettoi ig (di dimenioni x p) contenenti cicuno il pofilo di cicun unità ttitic, oeo i loi che in e umono le p ibili oete. Se i indic con x i il geneico ettoe ig: x i xi xi xi p l mtice X può dunque eee ppeentt nel modo eguente [ x, x,, x ] i x X, n. Come ccennto, i cttei oeti poono eee di ntu eteogene. Si poono inftti ee: cttei qulittii connei, o in cl nominle, che peedono modlità non numeiche e non odinbili; cttei qulittii odinli, o in cl odinle, che peedono modlità non numeiche m t loo odinbili; cttei quntittii, i u cl d intelli che u cl di ppoti, che peedono modlità numeiche. L mtice dei dti è petnto peo ctteizz dll peenz di ibili mite, lcune quntittie e lte qulittie. Come le ibili, nche le unità ttitiche poono eee di i ntu. Nelle nlii intziendli, d eempio, le unità oete poono eee i ingoli podotti dell ziend, oppue i diei tbilimenti poduttii, i diei epti di uno tbilimento, i dipendenti o i clienti dell ziend. Nelle nlii inte-ziendli, inece, le unità oete poono eee cotituite dlle

diee ziende concoenti o d un cmpione di conumtoi dei podotti del ettoe. In lte nlii i poono ee, quli unità ttitiche, le diee egioni di un pee o i diei ettoi poduttii. 3.3 L qulità dei dti e le mncte ipote pzili Un olt cotuit l mtice dei dti, un poblem d ffonte in i pelimine igud l qulità delle infomzioni in e contenute. Come i è ito nei due pecedenti cpitoli, poblemi di qulità poono igude i i dti deinti d ilezioni pimie che quelli deunti d fonti econdie. Nel pimo co lcuni poblemi di qulità poono eee peenuti nell fe dell ilezione: tteo l fomulzione chi ed unioc dei queiti; l celt di un degut tecnic di cquiizione delle infomzioni; l ddetmento dei iletoi; l elizzzione di indgini pilot, ecc. Nel econdo co i ttt inece di cquiie, inieme i dti, nche le infomzioni ul loo poceo di fomzione e ull loo qulità, l fine di lutne l utilizzbilità nello pecifico conteto di nlii. I due pincipli poblemi di qulità in un mtice dei dti ono cotituiti dll peenz di loi eti o di loi mncnti. I pimi poono deie d diee, come i edà nel poimo pgfo, e occoe in pimo luogo indiiduli. I econdi ono inece diettmente indiidubili, deindo o d mncte ipote pzili nelle ilezioni pimie o d buchi infomtii peenti nelle fonti ttitiche di dti econdi, e il poblem è cegliee il modo di tttli, come i edà nel pgfo ucceio. 3.3. I loi eti Nel co di dti ileti tmite indgine i loi eti poono deie d: eoe di ipot dell'inteitto che non h intepetto coettmente il queito poto, h oluto delibetmente ipondee in modo eto o, infine, h fonito un ipot impeci pe poblemi di memoi o non conocenz puntule del fenomeno; eoe dell'inteittoe nel poe il queito; eoe nel dt enty o negli tumenti utomtici di cquiizione u uppoto infomtico dei quetioni ctcei. L peenz di loi eti può eee egnlt d: loi fuoi dominio, cioè non pptenenti d un inieme pedefinito di loi mmiibili; loi nomli, o outlie, cioè ignifictimente diei d quelli oeti nell mggio pte delle unit; incomptibilità di ipote ll'inteno dello teo quetionio, qundo i loi di un o piu ibili in eo ilete contddicono pedefinite egole di ntu logic e/o elzioni di tipo mtemtico. L'indiiduzione dei loi eti in genee i le di un eie di contolli, clificbili nelle eguenti ctegoie: contolli di conitenz. Veificno che pefite combinzioni di loi unti d ibili ilete in un te unità oddifino deteminti equiiti (egole di incomptibilità); contolli di lidità o di nge. Veificno che i loi unti d un dt ibile ino inteni ll intello di definizione dell ibile te; contolli pe gli outlie. Utilizzti pe iole le unità ttitiche che peentno, pe lcune delle ibili, loi che i dicotno in modo ignifictio di loi che le tee umono nel eto delle unità ilete o ipetto ilezioni pecedenti. Queti loi ono Nonotnte il poceo di infomtizzzione mett dipoizione tumenti pottili di dimenioni empe più comptte, il quetionio ctceo è empe molto utilizzto pecilmente pe i quetioni utoomminitti in luoghi peti l pubblico, nei quetioni potli, ecc. (edi Cpitolo ).

con lt pobbilità eti, m l ezione dell loo non coettezz neceit di ulteioi eifiche come, d eempio, l einteit dell unità utilizzndo un dieo tumento di ilezione. Gli eoi poono eee douti d un qulunque delle fi di ccolt e me punto dei dti o d un eie di concue. Pe queto motio, mente tdizionlmente il poceo di contollo e coezione eni in un momento ucceio ll fe di egitzione dei dti, l tendenz ttule e quell di pote il contollo dei dti il più poibile icino ll fe di ccolt delle infomzioni peo le unità ttitiche, in modo d endee poibile l coezione immedit di infomzioni che iulteo non comptibili o nomle. 3.3. Le mncte ipote pzili Le mncte ipote un o più domnde nelle ilezioni cmpionie, o l enz di qulche dto nelle fonti econdie, poono eee tttte in diei modi. Un pimo e più bigtio modo conite nell eliminzione dll mtice dei dti di tutte le unità oete olo pzilmente. L utilizzo delle ole unità oete completmente detemin peò u olt due non tcubili coneguenze negtie. L pim è l iduzione dell numeoità delle oezioni, che influenz l efficienz delle time. L econd coneguenz, foe nco più ge dell pim, i può detemine ull coettezz delle time. Ciò iene qundo l peenz di dti mncnti non è cule, oeo qundo l pobbilità di oee un mnct ipot pzile pe un ibile dipende d lte ctteitiche delle unità. Un die oluzione l poblem, fequentemente dottt, conite nell utilizze diei iniemi di unità pe elizze le diee nlii dei dti. Si ctno cioè non tutte le unità oete pzilmente, m olo quelle con dti mncnti eltimente lle ibili di inteee pe ogni pecific nlii. Le nlii uniite nno cioè bte olo ulle ipote effettimente fonite pe quell pecific domnd; le nlii biite olo ulle unità che hnno i dti completi pe quell coppi di ibili; le nlii multiite nno bte olo ulle unità che peentno ipote lide pe tutte le ibili utilizzte nell pecific nlii. Adottndo quet oluzione, l coneguenz negti è che l numeoità del cmpione iulteà ibile nelle diee nlii effettute, il che complic l lettu e l intepetzione dei iultti. Un oluzione nco die, pe molti petti pefeibile tutte le pecedenti, conite nell impute l mnct ipot, egnndo l dto mncnte un loe pluibile. Ciò conente di mntenee l dimenione oigini dell mtice pe tutte le nlii d elizze. Le tecniche di imputzione poono eee diee. Le più comuni ono le eguenti. Imputzione di un loe medio. All mnct ipot pzile iene otituito il loe medio clcolto ulle unità oete. In genee i utilizz l medi itmetic o l medin pe cttei quntittii o qulittii odinli e l mod pe cttei qulittii connei. Se i utilizz l medi itmetic, un olt effettut l imputzione non cmbi l medi dell ditibuzione m i iduce l ibilità poiché tutti i dti imputti umono lo teo loe. Se inece i utilizz l medin, i lci init l medin te, i icinno medi e medin e i iduce l ibilità. Un modlità un po più comple di ppliczione di tle metodo conite nell impute l mnct ipot pzile con l medi o l medin clcolte, inece che ul compleo delle unità, u un ottoinieme più omogeneo ipetto ll unità oggetto di imputzione. In lti temini, pe un detemint ibile con mncte ipote, i uddiide l inieme delle unità oete in ottoiniemi omogenei - poibilmente cotuiti ull be di un o più ibili pie di mncte ipote e legte ll ibile oggetto di imputzione - e i imputno i dti mncnti di ogni ottoinieme con l ipetti medi (o medin). Ne dei un modificzione dell medi timt pim delle imputzioni, in diezione di quell e dell popolzione, e un minoe effetto di Si ttt, d eempio, delle einteite telefoniche o diette ui quetioni dubbi eguito di un indgine potle.

ppittimento ugli indici di ibilità. Imputzione con pelieo d dontoe. Inece che un loe medio, cicun mnct ipot pzile iene imputto un loe indiidule donto d un unità il più poibile imile quell con dto mncnte. Pe indiidue l unità dontoe di ipot i metodi più utilizzti ono quelli denominti cold deck e hot deck. Entmbi peedono le eguenti fi: - i diidono le unità in due guppi: quelli con mncte ipote pzili, che neceitno di iceee un dto, e quelli completi, che cotituicono i potenzili dontoi; - cicun mnct ipot pzile i imput l ipot dt dll unità più imile in elzione d lte ctteitiche peenti nell mtice dei dti; qulo i indiiduino più unità come potenzili dontoi e ne ceglie un culmente. L diffeenz t i due metodi t nel ftto che, mente con il metodo cold deck il guppo dei potenzili dontoi et il medeimo pe tutto il poceo di imputzione, con il metodo hot deck eo iene ggionto d ogni imputzione uccei. Imputzione d modello. Pe cicun ibile ffett d oezioni mncnti i pecific un modello di egeione multipl utilizzndo k egeoi celti t le lte ibili peenti nell mtice dei dti, in qulche modo collegte ll ibile d impute. Effettut l tim dei pmeti del modello, cicun unità con mnct ipot i imput il loe pedetto dl modello, dti i loi in e unti di egeoi. Nel co l unità conidet peenti mncte ipote nche t le ibili eplictie del modello in genee i utilizz un modello con un minoe numeo di egeoi. Imputzione toctic. A cicun dto mncnte e ne otituice uno ettto culmente d un ditibuzione itenut pluibile pe l ibile. Il poblem pinciple conite nell indiidue, di olt in olt, l più pluibile ditibuzione delle ibili ffette d mncte ipote. Il ntggio t inece nell poibilità di ipetee più olte l pocedu e ice utili indiczioni ull ibilità intodott nelle time dl poceo di imputzione.

3.4 Le nlii ui pofili di colonn Come ccennto nell intoduzione, le nlii ui pofili di colonn dell mtice di dti engono di eguito limitte quelle biite, olte d nlizze le ocizioni eitenti t le ibili conidete coppie. In genele, l obiettio delle nlii biite è ottenee, ptie dll mtice dei dti X (di dimenioni n x p) un mtice delle ocizioni A (di dimenioni p x p) del tipo eguente: h A j p h j p h h hh jh ph j j hj jj pj p p hp jp pp, doe hj è un miu dell ocizione eitente t l h-eim e l j-eim ibile dell mtice dei dti. L miu di tle ocizione dipende dl tipo di ibili conidete, che come più olte icodto poono eee qulittie connee, qulittie odinli, quntittie, mite. Di eguito engono ichimti i pincipli indici di ocizione utilizzbili in peenz di quete diee tipologie di ibili. Vibili qulittie connee. A ptie d cicun coppi di colonne dell mtice dei dti può eee cotuit un ditibuzione doppi di fequenze e u di e i può clcole l indice di ocizione chi-qudto, definito come: S T ct t n t χ, doe: S e T ono ipettimente il numeo di modlità del pimo e del econdo cttee; n t (n. n.t ) / n ono le fequenze teoiche di indipendenz nell tbell doppi, cioè le fequenze che i ebbeo oete, dti i loi mginli di ig e di colonn, nel co di pefett indipendenz t i due cttei; c t n t n t ono le contingenze, cioè le diffeenze t le fequenze oete e quelle teoiche di indipendenz. Se i due cttei ono pefettmente indipendenti, tutti i numetoi dei ppoti ono pi zeo e quindi l indice ume loe zeo. Qunto più le fequenze oete i dicotno dlle fequenze teoiche di indipendenz l indice χ ume loi più eleti. L indice non h un mimo definito e il uo loe, pità di ocizione, dipende dll numeoità del collettio. Un miu elti di ocizione, che ume loi compei t zeo ed uno, è dt dll indice di Cmé, denominto indice medio di contingenz e definito come:

min χ n [( S ),( T ) ] /. L indice le nco zeo qundo i due cttei ono indipendenti, mente ume loe pi d uno qundo t i due cttei i è mim ocizione. Clcolto l indice pe ogni coppi di ibili (colonne) dell mtice dei dti oigini, hj pe le geneiche colonne h-eim e j-eim, i otteà dunque un mtice V (di dimenioni p x p) del tipo eguente: V h j p h j p h h hh jh ph j j hj jj pj p p hp jp pp. L mtice V è immetic con loi uniti ull digonle pinciple. Eempio 3. Supponimo di dipoe dell eguente mtice dei dti elti te ibili qulittie connee - eo, condizione loti e pot pefeito - ilete u noe indiidui e di ole clcole il gdo di ocizione t le due ibili. Indiidui Seo Condizione Spot F Impegto Clcio M Opeio Bket 3 F Impiegto Clcio 4 M Libeo pof. Nuoto 5 M Impiegto Clcio 6 M Opeio Clcio 7 F Opeio Nuoto 8 M Opeio Nuoto 9 F Impiegto Bket T l coppi di cttei eo e condizione loti i può cotuie l eguente tbell doppi entt Seo Condizione loti Impiegto Lib. Pof. Opeio Totle F 3 0 4 M 3 5 Totle 4 4 9 D e i poono ice le eguenti tbelle delle fequenze teoiche e delle contingenze: Fequenze teoiche: Seo Condizione loti Impiegto Lib. Pof. Opeio Totle F,78 0,44,78 4

M, 0,56, 5 Totle 4 4 9 Contingenze: Seo Condizione loti Impiegto Lib. Pof. Opeio Totle F, -0,44-0,78 0 M -, 0,44 0,78 0 Totle 0 0 0 0 L indice di ocizione chi-qudto è pi :,488 0,94 0,60,488 0,94 0,60 χ + + + + +,9 ;,78 0,44,78, 0,56, mente l indice è pi :,9 9 0,57. Pocedendo in modo nlogo pe le lte coppie di cttei i ottiene l eguente mtice di ocizione V ; V 0,57 0,5. 0,6 0,57 0,5 0,6 Vibili qulittie odinli. Nel co di ibili qulittie odinli un indice di ocizione dee pote miue, olte ll intenità dell ocizione peente t i due cttei, nche il eo dell elzione. L indice dee cioè pote ditinguee t un elzione poiti, doe l cecee delle modlità di un cttee tendono cecee nche le modlità dell lto, d un elzione negti, doe l cecee delle modlità di un cttee quelle dell lto tendono dececee. Se il numeo delle modlità dei due cttei non è toppo eleto, i può clcole, ptie dll ditibuzione doppi di fequenze, l indice gmm di Goodmn e Kukl: N N c d γ, c N + N d doe N c e N d ono, ipettimente, il numeo di coppie in cui i cttei ono odinti llo teo modo, e mnifetno quindi un concodnz, e il numeo di coppie in cui, l contio, i due cttei ono odinti in modo dieo (dicodnz). Un coppi di unità eidenzi concodnz, e petnto pptiene N c qundo, ipetto ll pim unità, le modlità che i due cttei umono nell econd ono entmbe mggioi o entmbe minoi. Al contio, un coppi di unità eidenzi dicodnz, e dunque pptiene N d, qundo, ipetto ll pim unità, le modlità che i due cttei umono nell econd ono un mggioe e l lt minoe. L indice γ ume loi compei t e, doe il egno indic il eo dell elzione (concodnz o dicodnz), mente il loe oluto indic l intenità dell te. L indice ume inftti il uo loe mimo qundo N d 0, qundo cioè tutte le coppie di unità eidenzino concodnz, mente ume loe pi qundo N c 0 e quindi tutte le coppie epimono dicodnz.

Se inece il numeo delle modlità dei due cttei è eleto, icinndoi l numeo delle unità del collettio, i può utilizze l indice di ocizione t gdutoie ρ di Spemn definito come: 6 di i ρ, n( n ) n doe d i indic l diffeenz t le poizioni in gdutoi pe i due cttei in eme elti ll i- eim unità. Clcolti γ o ρ pe tutte le coppie di cttei, i ottenno, ipettimente, le mtici Γ o Ρ (entmbe di dimenioni p x p). Eempio 3. Si dipone dei eguenti dti eltii i lielli di oddifzione di 3 clienti di un upemecto pe i epti tglio, mcellei e pechei. Clienti Repto Repto Repto tglio mcellei pechei lto medio medio medio lto bo 3 lto lto bo 4 bo medio medio 5 bo bo medio 6 medio bo lto 7 lto medio lto 8 medio lto bo 9 lto lto medio 0 bo medio lto lto lto lto lto bo medio 3 medio medio bo Pe i cttei oddifzione pe il epto tglio e oddifzione pe il epto mcellei i può cotuie l eguente tbell doppi entt Soddifzione Soddifzione epto mcellei epto tglio Alto Medio Bo Totle Alto 3 6 Medio 4 Bo 0 3 Totle 5 5 3 3 Ptendo dll unic unità che peent bo liello di oddifzione i pe il epto tglio che pe il epto mcellei, le lte unità che epimono concodnz con quet ono: le te unità che epimono lto liello di oddifzione pe entmbi i cttei; le due unità che epimono lt oddifzione pe il epto tglio e medi pe il epto mcellei; le due unità che epimono medi oddifzione pe il epto tglio e lt pe il epto mcellei, olte ll unità che epime medi oddifzione pe entmbi i epti. Il numeo di coppie di unità che epimono concodnz e che compendono il cliente con b oddifzione pe entmbi i cttei e pi (3+++). Il numeo compleio di coppie di unità che epimono concodnz è dunque pi :

N c (3+++)+(3+)+(0)+(3+)+(3)+(0)+0(0)+(0)+3(0)6. Ptendo dl etice dell tbell che contiene il numeo di clienti con b oddifzione pe il epto tglio e lt oddifzione pe il epto mcellei i può clcole il numeo di coppie che epimono dicodnz nel modo eguente: N d 0( + + + ) + ( + ) + ( + ) + () ; L indice γ iult petnto pi : 6 5 γ 0,4. 6 + 37 Pocedendo in modo nlogo pe le lte coppie di ibili i ottiene l mtice di ocizione Γ 0,4 0,49. 0,05 0,4 0,49 0,05 Eempio 3.3 Si ipotizzi che d un cmpione di conumtoi ino tte ftte ggie cinque mche di pt con il medeimo condimento e che ino tti ileti gli odinmenti in elzione lle ctteitiche guto e cpcità di tenee l cottu, ttibuendo l pim poizione () ll pt giudict miglioe e l ultim (5) ll peggioe. Si ipotizzi inolte che con un ilezione peo un cmpione di eecizi commecili ino tti ileti i pezzi medi di endit delle cinque mche di pt, epei nch ei u cl odinle, egnndo punteggio pi d ll mc più coto e coì i fino l punteggio 5 egnto ll più economic. Si uppong che l mtice dei dti i l eguente: Mc di pt Guto Cottu Pezzo A 3 3 B 4 C 4 5 5 D 3 E 5 4 T i cttei guto e cpcità di tenee l cottu i clcolno le diffeenze t le poizioni in gdutoi e le diffeenze l qudto: Mc di pt Poizioni in gdutoi Guto Cottu d d A 3-4 B C 4 5 - D 3 E 5 4 L indice ρ à petnto pi : 6 8 48 ρ 0,60. 5(5 ) 0

Pocedendo in modo nlogo pe le lte coppie di ibili i ottiene l mtice di ocizione eguente: 0,6 0,4 Ρ 0,6 0,3. 0,4 0,3 Cttei quntittii. Le più comuni miue di ocizione t ibili quntittie ono l coinz e il coefficiente di coelzione linee. Indicti con x ih e x ij i loi unti dlle ibili h-eim e j-eim nell unità i-eim e con xh e x j i ipettii loi medi, l coinz è definit dll eguente epeione: hj n ( x xh)( xij x ih j ) i n Si hnno loi poitii dell coinz qundo l omm lgebic dei podotti l numetoe è poiti e quindi pelgono podotti di egno poitio, che indicno concodnz t le due ibili (loi di x h e x j congiuntmente o mggioi delle ipettie medie itmetiche, o minoi di ee). Vloi negtii i hnno inece qundo pelgono podotti che indicno dicodnz t i due cttei (loi di x h mggioi dell medi e loi di x j minoi, o icee). Vloi pi zeo i hnno infine qundo l omm lgebic dei podotti l numetoe i nnull, cioè qundo non pelgono né i podotti che indicno concodnz né quelli che indicno dicodnz, oeo i due cttei ono linemente indipendenti. Clcolt l coinz pe tutte le coppie di ibili i può cotuie un mtice del tipo eguente (di dimenioni p x p), dett mtice delle coinze: h S j p h j p h h hh jh ph j j hj jj pj p p hp jp pp. L mtice è immetic e ull digonle pinciple peent le inze delle p ibili, oeo le coinze di ogni ibile con e te. Pe l geneic ibile h i h inftti: hh n i ( x ih x )( x h n ih xh) n i ( x x ) ih n h σ h I loi unti dlle coinze dipendono dlle cle di miu delle ibili nell mtice dei dti, il che li ende non diettmente confontbili t loo l fine di lute e t un coppi di ibili i i un ocizione mggioe o minoe ipetto d un'lt. Pe oie tle poblem i può icoee l coefficiente di coelzione linee di Bi e Peon, definito dll eguente epeione:

hj hj, σ h σ j doe σ h e σ j ono le deizioni tndd dei due cttei. Il coefficiente di coelzione linee ume lo teo egno dell coinz ed è compeo t e. Clcolti i coefficienti di coelzione linee t tutte le coppie di ibili i ottiene dunque un mtice di coelzione R, del tipo eguente: h R j p h j p h h hh jh ph j j hj jj pj p p hp jp pp. L mtice è immetic e con loi uniti ull digonle pinciple. Eempio 3.4 Si ipotizzi di e ileto lcuni indici di bilncio u qutto ziende, ipotti nell eguente mtice dei dti. Aziend ROI ROE ROS Indebitmento A 7, 8, 5,7 5,3 B 0,3,5,8 53,4 C 0,4,5 5, 34, D 5,,0,,7 Reltimente gli indici ROI e ROE i clcolno medie itmetiche e deizioni tndd: x 3,3 ; x 3, 55 ; σ, 96 ; σ, 7. ROI ROE ROI Gli indici di coinz e di coelzione i clcolno nel modo eguente: ROE ROIROE ( 7, 3,3)( 8, 3,55) + ( 0,3 3,3)(,5 3,55) + ( 0,4 3,3)(,5 3,55) + ( 5, 3,3)(,0 3,55) 5 4,08 6,0 ; 4 6,0 ROIROE 0,75.,96,7 Pocedendo in modo nlogo pe tutte le lte coppie di ibili di ottengono le mtici S e R:

8,77 6,0 0,36 33,4 6,0 7,33 3,36,4 S ; 0,36 3,36 3,33 5,33 33,4,44 5,33 9,07,00 0,75 0,07 0,74 0,75,00 0,68 0,8 R. 0,07 0,68,00 0,9 0,74 0,8 0,9,00 Cttei miti. Come i è più olte ipetuto, nelle nlii ttitiche di dti ziendli o di mecto l mtice dei dti è peo cttee mito, con lcune ibili quntittie e lte qulittie, odinli o connee. Diponendo di un mtice di dti con ibili mite, occoe dotte miue di ocizione diee pe ogni combinzione di tipologie di ibili d nlizze. Ntulmente, le miue di ocizione eltie ibili dello teo tipo (qulittie connee, odinli, quntittie) nno quelle già illutte nei punti pecedenti, mente poblemi di celt di indici ppopiti i pongono nel co in cui i debb miue l ocizione t ibili pptenenti tipologie diffeenti. I poibili ci ono i eguenti: ) - ibili qulittie connee con qulittie odinli; b) - ibili qulittie connee con ibili quntittie; c) - ibili qulittie odinli con ibili quntittie. In queti ci, un pim oluzione conite nel icondue le ibili ll medeim tipologi tfomndo oppotunmente l cl di miu delle ibili: nel co ) iconducendo le ibili miute u cl odinle in connee; nei ci b) e c) iconducendo le ibili miute u un cl quntitti in qulitti (conne nel pimo co; odinle nel econdo). Ricondotte le ibili ll te tipologi, i clcolno i eltii indici già illutti. Il limite di tle oluzione t oimente nel ftto che iene pedut un pte dell infomzione contenut nell mtice dei dti oigini. Un dieo ppoccio l poblem, che upe l inconeniente ppen ichimto, conite nel clcole un indice di ocizione intodotto ppoitmente pe il co di ibili mite. Tle indice è il ppoto di coelzione, dto dll eguente epeione: σ medi( y / x) η y / x, y σ doe: x e y indicno, ipettimente, l ibile qulitti (conne o odinle) e quell quntitti; σ y è l inz dell ibile quntitti; σ medi(y/x) è l inz delle medie del cttee quntittio condizionte lle modlità di quello qulittio. Il ppoto di coelzione epime dunque l quot dell inz complei di un ibile quntitti piegt dlle medie condizionte lle modlità di un ibile qulitti: qundo tli medie ono uguli t loo uol die che l ibile y non dipende, in medi, dlle modlità dell ibile x e l indice le zeo; qundo tli medie ono inece diee t loo, uol die che eite un elzione t le modlità delle due ibili, che h intenità mim qundo tutt l inz di y è piegt dll ibilità t le medie condizionte, nel qul co l indice le uno.

Clcolti i ppoti di coelzione t tutte le coppie di ibili i ottiene dunque un mtice di ppoti di coelzione nlog lle pecedenti. Il qudo completo delle miue di ocizione utilizzbili nel co di ibili mite è ipotto nell mtice eguente, doe i diei blocchi coipondono i poibili incoci t le ibili delle diee tipologie. Qulittii connei Qulittii odinli Quntittii Qulittii connei V V V Qulittii odinli, P, P Quntittii S e R Nei te blocchi digonli i poono clcole le mtici V,, P, S ed R ite in pecedenz. Nei blocchi non digonli, che i ifeicono ll ocizione t un cttee quntittio e uno qulittio, i poono clcole lcune delle medeime mtici (V,, P), un olt icondotte le ibili quntittie connee o odinli, econd dei ci, oppue i può clcole l mtice dei ppoti di coelzione. Eempio 3.5 Si uppong di dipoe delle eguenti infomzioni eltimente d un guppo di clienti di un ziend commecile: pofeione, eo, liello di oddifzione l eecizio commecile (LS), pe il noto eecizio, liello di oddifzione pe il pinciple competito (LSC), eddito, quot cquiti peo l eecizio. Clienti Pofeione Seo LS LSC Reddito Quot cquiti Impiegto F Alto Medio,8 58, Opeio M Medio Bo, 65,0 3 Impiegto M Bo Bo,4 64,5 4 Opeio F Medio Bo,3 63,0 5 L. Aut. M Alto Alto,0 5,0 6 Impiegto F Alto Bo, 70,0 7 Opeio M Bo Medio,5 40,0

8 L. Aut. M Medio Bo,5 4,5 9 Opeio M Alto Alto,4 66,0 0 L. Aut. F Medio Bo 3,0 38,5 Opeio M Alto Medio,0 60,0 T l pofeione e il eddito i può clcole il ppoto di coelzione nel modo eguente: medi (eddito),65; σ eddito 0,353; medi (eddito/pofimpiegto),43 ; medi (eddito/pofopeio),8 ; medi (eddito/pofl.utonomo),50. η eddito / pofeioe (,43,65) 3 + (,8,65) 5 + (,50,65) 0,353 3 0,7 0,77. 0,353 L mtice di ocizione è l eguente: Pofeione Seo LS LSC Reddito Quot cquiti Pofeione,00 0,40 0,38 0,33 0,77 0,5 Seo,00 0,4 0,39 0,03 0,0 LS,00 0,63 0,9 0,6 LSC,00 0,04 0,04 Reddito,00-0,79 Quot cq.,00 Appliczioni in Poc Co

3.5 Le nlii ui pofili di ig Le nlii ui pofili di ig hnno l obiettio di miue in modo intetico l ditnz o l imilità t coppie di unità del collettio ttitico, che ono ppunto collocte nelle ighe dell mtice dei dti. L ditnz oimente non è inte in eno pzile, benì come diffeenz, t le due unità, eltimente i loi unti dlle ibili contenute nell mtice dei dti. Ad eempio, ipotizzimo di ee condotto un indgine olt miue il liello di oddifzione d pte dei clienti di un compgni ee in elzione diee ctteitiche (qulità dei eizi di te, puntulità dei oli, cotei del peonle di olo, qulità del eizio di itozione, ecc). Miue l ditnz t due clienti ignific peenie d un miu intetic di qunto ei ono t loo diei in elzione lle ctteitiche ilete. Indict con d i l ditnz t le unità i-eim e -eim, tle miu doebbe godee delle eguenti popietà: d i 0, non negtiità.gli indici di ditnz ono in genee poitii e iultno uguli zeo olo qundo le due unità peentno le tee modlità pe tutti i cttei peenti nell mtice dei dti; d ii 0, l ditnz t cicun unità e e te è pi zeo; d i d i, immeti. L ditnz t l unità i-eim e l unità -eim dee iulte ugule quell t l unità -eim e l i-eim; d i d i + d, dieguglinz tingole. L omm delle ditnze t le unità i e e le unità e dee eee minoe o l più ugule ll ditnz t i e. Se un miu di ditnz oddif tutte le popietà op epote i dice che lo pzio di ifeimento è uno pzio metico. A ptie dll mtice dei dti X, un olt clcolte tutte le ditnze t le n unità ttitiche i ottiene un mtice di ditnz D, di dimenione n x n, del tipo eguente: D d d d d d d d d d d d d d d d d d d d d d d d d d i n i n i i ii i in i n n n ni n nn Nel eguito enno illutte le diee miue di ditnz che poono eee clcolte in coipondenz lle diee tipologie di cttei peenti nell mtice dei dti. Cttei qulittii connei politomici. In peenz di un mtice dei dti compot d p cttei qulittii connei politomici i può utilizze l indice di ditnz di Sneth, dto dll fequenz elti dei cttei pe i quli le unità i-eim e -eim peentno modlità diee. Pe il geneico cttee k i pone: d i,k e x ik x k, d i,k 0 e x ik x k. L indice di ditnz di Sneth t i ed è:

d i p d i, k k p. In otnz i contno le colonne pe le quli le ighe i e dell mtice dei dti peentno modlità diee e i ppot tle numeo p, cioè l totle dei cttei peenti nell mtice dei dti. Eendo definito come fequenz elti, l indice è compeo t 0 e. Altentimente, i può definie un coipondente miu di imilità t due unità, denotto c i, come l fequenz elti dei cttei con modlità uguli. Oimente à d i + c i. Nel eguito, pe ogni miu di ditnz compee t 0 e eà definito un coipondente indice di imilità c i dto dl complemento dell indice di ditnz: c i - d i. Eempio 3.6 Si ipotizzi di ole miue l ditnz t i oggetti ptie dll eguente mtice dei dti contenente le mche pefeite di cffè, thè e pt, nonché l inegn dell gnde ditibuzione pefeit in un cmpione di 5 oggetti: Soggetto Cffè Thè Pt Inegn Splendid Lipton De Cecco Cond So Infè Bill Sidi 3 Lzz Lipton De Cecco Cond 4 Splendid Infè Bill Coop 5 So Lipton Bill Coop L ditnz t i oggetti e è pi d (mimo) poiché in ei tutte le modlità dei qutto cttei ono diee. Si h cioè: d, ; d, ; d,3 ; d,4. L indice di ditnz à dunque: + + + d. 4 Inece, l ditnz t il oggetto e 3 è molto minoe poiché in te ci u qutto le modlità coincidono. Si h inftti: d 3, ; d 3, d 3,3 d 3,4 0 e quindi: d 3 /4 0,5. Clcolt pe tutte le coppie di oggetti, l mtice delle ditnze iulteà l eguente: 0 0,5 0,75 0,75 0 0,5 0,5 D 0,5 0 0,75. 0,75 0,5 0 0,5 0,75 0,5 0,75 0,5 0 Cttei qulittii dicotomici. Ipotizzimo che l mtice dei dti conteng p miuzioni nominli dicotomiche del tipo peenz/enz, indicte ipettimente con e 0. Due geneiche ighe dell mtice dei dti poono eee intetizzte nell eguente tbell di contingenz: unità i 0 unità b

0 c d doe ppeent il numeo di cttei peenti in entmbe le unità, b il numeo di cttei peenti nell unità m enti nell unità i, c il numeo di cttei peenti nell unità i m enti nell unità e d il numeo di cttei enti in entmbe le unità. A ptie d tli elementi poono eee clcolte diee miue di ditnz, econdo gli ppocci di eguito ichimti. Simple mtching. L più immedit miu di ditnz è dt dll fequenz elti degli ttibuti peenti in un unità e enti nell lt: b + c d i. p Il coipondente indice di imilità à: + d ci di. p Indice di ditnz di Jccd. A diffeenz dell ppoccio imple mtching, l indice di Jccd eclude dl denomintoe l elemento d, cioè il numeo di cttei enti in entmbe le unità. L indice è dunque il eguente: b + c d i, + b + c mente il coipondente indice di imilità è: ci di. + b + c Quet die definizione del denomintoe è uggeit dll non oppotunità di conidee come indictoe di imilitudine t due unità il ftto di peente entmbe modlità ente in elzione d un cttee. Pe chiie meglio i conidei, d eempio, il co di un ondggio in cui i chiede d lcuni indiidui e il bto e ono oliti nde in pizzei. Conidendo due unità, e entmbe ipondono ì ciò è icumente indice di imilitudine, mente e un iponde ì e l lt no è ltettnto inequiocbilmente indice di dieità. M e entmbe ipondono no ciò non può eee conideto indice di imilitudine peché un indiiduo potebbe eee olito nde l pub, mente l lto potebbe uulmente ete c. Indice di ditnz di Czeknowki. L indice f popi l citic di Jccd ll ppoccio Simple mtching e, in più, egn un peo doppio l numeo di ttibuti peenti in entmbe le unità. L indice di ditnz è dto petnto dll epeione: b + c d i, + b + c mente quello di imilità è: ci di + b + c Eempio 3.7 Si ipotizzi di e ileto i pei in cui un guppo di ziende concoenti epotno i loo podotti, ottenendo i eguenti dti: Aziend Fnci Gemni Pei Bi Spgn Auti Geci A Si Si No Si No No

B Si No No Si Si Si C No No No No Si No D Si No Si Si Si Si Se conideimo l coppi di ziende BD emo: 4, b, c 0, d, con p 6. Se i utilizz l ppoccio imple mtching emo petnto d BD /6. Utilizzndo l indice di Jccd emo d BD /5. Se i utilizz infine l indice di Czeknowki i ottiene d BD /9. Pe il olo indice di imple mtching, l mtice complet delle ditnze t le qutto ziende è l eguente: 0 / 6 4/6 4/ 6 / 6 0 3/ 6 / 6 D. 4/ 6 3/ 6 0 4/ 6 4/ 6 / 6 4/6 0 Cttei qulittii odinli. Nel co di un mtice dei dti contenente tutte ibili odinli, come d eempio il liello di oddifzione pe un eie di ctteitiche di un podotto o eizio (in genee è ileto u cl odinle, con modlità del tipo: pe niente; poco; bbtnz; molto; moltiimo) un poibile oluzione conite nell ttibuie un punteggio cecente di un te quntità l cecee dell miuzione odinle. Ad eempio: pe niente; poco; 3 bbtnz; 4 molto; 5 moltiimo. Compiut quet opezione i può utilizze un indice di ditnz pe dti quntittii (edi più nti). Oimente, coì fcendo i intoduce un elemento di bitietà nell nlii, poiché i ipotizz: ) che l diffeenz t due modlità contigue i empe l te (d eempio, che l diffeenz di oddifzione che eite t poco e bbtnz i pi quell che eitente t molto e moltiimo); b) che l diffeenz t due modlità epte d un tez i doppi ipetto quell t modlità contigue (d eempio, che l diffeenz di oddifzione t bbtnz e moltiimo i doppi ipetto quell t poco e bbtnz). L ltenti conite nel conidee l miuzione liello nominle e pplice l indice di Sneth; in queto modo peò i inunci d un gn pte del contenuto infomtio peente nell mtice dei dti, gion pe cui in genee i pefeice dotte l pim oluzione. Cttei quntittii. Nel co di cttei quntittii l pim e più elemente miu di ditnz che i può dotte è cotituit dll ditnz euclide, definit come l dice qudt dell omm delle diffeenze l qudto t le modlità pptenenti lle due unità eltie tutti i cttei peenti nell mtice dei dti. Indicte con x ik e x k le modlità unte dll ibile k nelle unità i ed, l ditnz euclide d i t le due unità è dt dll eguente epeione: / p d i ( xik xk ). k In temini ettoili, l ditnz euclide può nche eee it come l nom dell diffeenz t i ettoi ig dell mtice dei dti. Inftti l (3.) i può nche ciee come: di ( xi x ) ( xi x ) xi x /.

Eempio 3.8 Si ipotizzi che pe un guppo di ziende ino tti ileti gli indici di bilncio ipotti nell eguente mtice dei dti: Aziend ROI ROE ROS Indebitmento A 7, 8, 5,7 5,3 B 0,3,5,8 53,4 C 0,4,5 5, 34, D 5,,0,,7 L ditnz euclide t l pim e l econd ziend iulteà pi : d AB [( 7, 0,3) + ( 8,,5) + ( 5,7,8) + ( 5,3 53,4) ] / 9, 8 Pocedendo in modo nlogo pe le lte coppie di ighe, i ottiene l eguente mtice delle ditnze euclidee: 0 9,8,45 5,74 9,8 0 9,47 4,0 D.,45 9,47 0 3,4 5,74 4,0 3,4 0 L ditnz euclide peent tutti due odini di poblemi. Anzitutto un poblem di cl. Come i ede i dll fomul che dll eempio, engono inftti ommte diffeenze l qudto eltie cttei diei e miuti in unità di miu diee. L ipotei che i dott è che, i fini dell ditnz t le due unità, un diffeenz di un unità epe nell unità di miu di un cttee bbi l te impotnz di un diffeenz di un unità epe nell unità di miu di un lto cttee. Ripendendo l eempio pecedente, l ditnz t due ziende iene clcolt egnndo ll diffeenz di un punto di ROI l te impotnz dell diffeenz di un punto nel gdo di indebitmento, il che non ppe ppopito. M lti eempi poono chiie meglio come tle unzione ppeenti un eidente foztu. Si conidei, d eempio, di e ileto in un guppo di potenzili clienti il numeo di figli e l cilindt dell utomobile, miut in centimeti cubi. In queto co dotte l miu di ditnz euclide pe confonte due indiidui ignific ipotizze che un diffeenz di un figlio in più o in meno bbi l te impotnz di un diffeenz di un centimeto cubo nell cilindt dell uto poedut. Pe oie tle poblem i può icoee ll tnddizzzione dell mtice dei dti, depundo le ibili dll effetto delle diee unità di miu dottte e poi clcole l ditnz euclide ui pofili tnddizzti. L fom più comune di tnddizzzione è quell che conite nel otte cicun elemento dell mtice dei dti l medi di colonn e diidee pe l elti deizione tndd, come nell epeione eguente: z ik xik xk σ k L mtice dei dti tnddizzti è di coneguenz dimenionle con tutti i ettoi colonn che peentno medi pi zeo e inz uniti.

Eempio 3.9 Ripendendo l eempio pecedente, i ttt di clcole peliminmente medi itmetic e deizione tndd pe le qutto ibili ilete: Vibile ROI ROE ROS INDEB Medi 3,3 3,55 3,73 3,3 Deizione tndd,96,7,8 5,4 Il loe tnddizzto coipondente x à quindi: 7, 3,3 z,3.,96 In modo nlogo poono eee clcolti i etnti loi ottenendo l eguente mtice Z dei dti tnddizzti:,3,7,08 0,38 0,99 0,76 0,5,47 Z. 0,95 0,39 0,8 0,0 0,63 0,57,38,8 L coipondente mtice delle ditnz euclidee clcolt ptie dll mtice Z è, infine, l eguente: 0 4,7 3,6 3,55 4,7 0,87 3,3 D. 3,6,87 0 3,09 3,55 3,3 3,09 0 Un econdo limite dell ditnz euclide è che e non tiene conto delle eentuli coelzioni eitenti t le diee ibili dell mtice dei dti. Se due ibili iultno fotemente coelte ignific che ono epeione dello teo fenomeno e che nell miu dell ditnz (euclide) t le due unità i tiene conto due olte dello teo fttoe. Un poibile oluzione queto econdo poblem conite nel clcole l ditnz euclide pondet, dt dll eguente epeione: d i p / ( xik xk ) wk k doe w k è un coefficiente di pondezione. In temini mticili l te epeione i può ciee nel modo eguente: di ( x ) ( ) i x W xi x / doe W è un mtice digonle (di dimenioni p x p) contenente i coefficienti di pondezioni delle p ibili. Tli coefficienti doebbeo iulte tnto mggioi qunto più l k-eim ibile è incoelt con le lte p- ibili peenti nell mtice dei dti, cioè qunto più il contibuto infomtio dell k-eim ibile è oiginle ipetto quello peente nelle ibili etnti. E l contio, i coefficienti di pondezione doebbeo eee tnto minoi qunto più l

k-eim ibile iult coelt con le lte, in qunto il uo contibuto infomtio iult lmeno pzilmente duplicto ipetto quello ppotto dlle lte ibili. Inece di un mtice digonle i può utilizze un mtice W immetic pien 3. Un co pticole di ditnz euclide pondet tmite un mtice immetic pien è l ditnz di Mhlnobi, che ume come mtice di pondezione l ine dell mtice di coinz. L u epeione è dunque l eguente: di / x ( ) i S xi x. ( x ) L ditnz di Mhlnobi cotituice dunque un miu di ditnz clcolt l netto dell coelzione eitente t le ibili. Allo teo tempo e elimin nche l effetto deinte dlle diee cle di miu dottte pe le ibili e può eee quindi clcolt diettmente ulle ibili ilete 4. Eempio 3.0 Si conidei l eguente mtice dei dti contenente le ibili eddito menile, pe pe conumo menile e impoto medio dello contino ilete peo lcuni clienti di un eecizio commecile: eddito conumo Impoto medio,5 0 4 3 9 3,8,3 9,5 A ptie dll mtice dei dti i clcolno le mtici D delle ditnze euclidee, S delle coinze e R delle coelzioni: 0,69,45,4,69 0,54 3,48 D ;,45,54 0,55,4 3,48,55 0 0,69 0,53,06 S 0,53 0,44,90 ;,06,90 0,69,00 0,9 0,08 R 0,9,00 0,46. 0,08 0,46,00 3 In ogni co, ffinché i bbi d ij 0, l mtice W dee eee emi definit poiti 4 Si può dimote inftti che l ditnz di Mhlnobi è ugule nche ll ditnz euclide pondet clcolt ulle ibili tnddizzte utilizzndo come mtice di pondezione l ine dell mtice di coelzione: dij / ( x x ) S ( x x ) ( z z ) i j i j i j R ( z z i j ) /

Come e lecito ttendei, i ile un fote coelzione poiti t eddito e conumo, il che ignific che le due ibili eidenzino un contenuto infomtio lmeno in pte comune. Supponimo o di ole clcole l ditnz euclide t l econd e l qut unità, quelle che peentno l mim diffeenz pe il eddito e il conumo. Sommndo diffeenze l qudto t 4 e e poi t 3 e,3 i ommno diffeenze che, lmeno in pte, epimono lo teo fenomeno (l diffeenz di liello di beneee economico). L ditnz euclide t l econd e l qut unità iult inftti pi 3,48, l ditnz più gnde ipetto tutte le lte coppie di unità. Clcolimo o l ditnz di Mhlnobi t le medeime due unità. Si dee innnzi tutto clcole l ine dell mtice delle coinze, che è l eguente: 3,63 5,5 3,05 S 5,5 94,7 6,80. 3,05 6,80 0,7 Quindi l ditnz di Mhlnobi t le unità e 4 à: 3,63 5,5 3,05 3 / d 4 ( x x4 ) S ( x x4 ) ( 3,7 0,5) 5,5 94,7 6,80,7 5, 40. 3,05 6,80 0,7 0,5 Clcolndo in modo nlogo gli indici di ditnz t tutte le lte coppie di unità di ottiene l eguente mtice delle ditnze di Mhlnobi: 0 4,68,8 3,64 4,68 0 5,0 5,40 D.,8 5,0 0 6,37 3,64 5,40 6,37 0 Si può oee come, utilizzndo l indice di Mhlnobi, l ditnz t l econd e l qut unità non è più l più elet ipetto tutte le lte coppie di unità: l mim ditnz o è quell t l tez e l qut unità. Un indice di ditnz più genele pe cttei quntittii è dto dll ditnz di Minkowki, definito dll eguente epeione: / Si oe fcilmente che qundo l ditnz di Minkowki coincide con l ditnz euclide. Qundo l ditnz di Minkowki iene dett ditnz di Mnhttn o ditnz dell città blocchi, e ume l eguente epeione: L definizione di ditnz di Mnhttn dei dl ftto che in un eempio due dimenioni (x e x) l ditnz t due etici di un edificio Cttei miti. Nell nlii ui pofili di colonn i è ito come non eit un unico indictoe che conent di clcole l intenità e l diezione delle elzioni di ocizione t coppie di ibili, pecindee dll tipologi delle medeime (qulittie o quntittie) e utilizzndo tutto il contenuto infomtio peente nell mtice dei dti. Nel co delle elzioni t unità un miu intetic dell ditnz eitente t due pofili di ig di un mtice di dti con ibili di tipo mito i può inece ottenee. Tle miu è dt dll indice di ditnz di Gowe, definito nel modo eguente:

d i p k p k d δ i, k i, k, doe d i,k è un miu di ditnz t le ighe i e dell mtice dei dti in elzione l k-eimo ttibuto, mente δ ij,k è un ibile dicotomic che ume loe uno e le due unità poono eee confontte in elzione ll ttibuto k e zeo ltimenti. L miu dell ditnz i econd del tipo di cttee. Cttei quntittii: d i, k xik xk, δ i, k Rnge( k) doe Rnge(k) è il cmpo di izione dell ibile k. Cttei qulittii odinli: Si tfomno le ibili in quntittie ttibuendo punteggi cecenti l cecee delle modlità del cttee, iconducendoci l co pecedente. Cttei qulittii dicotomici: d i,k ume loi 0 o econd che le due unità peentino modlità uguli o diee; δ i,k ume empe loe lo il co di ipot negti pe entmbe le unità, nel qul co ume loe 0. Lo chem eguente iume i loi unti d d i,k e δ i,k nei diei ci: d i,k Unità i Unità Si No Si 0 No 0 δ i,k Unità i Unità Si No Si No 0 Il ftto di poe δ i,k ugule zeo nel co di enz del fenomeno in entmbi i cttei equile d dotte pe queto tipo di cttei l miu di ditnz popot d Jccd. Cttei qulittii connei politomici: Si ume come miu di ditnz quell di Sneth; petnto d i,k ume loe uno e le unità i e j peentno modlità die in elzione l cttee k e zeo ltimenti, mente δ i,k. L miu di ditnz popot d Gowe è compe t zeo e uno. Anche d e coiponde dunque un indice di imilità definito come il complemento d uno dell ditnz: c i - d i

Eempio 3. Si uppong che u qutto clienti di un compgni ee ino tti ileti il numeo di oli nell ultimo nno, il gdo di oddifzione, l eentule uo di intenet pe l penotzione e il pee di eidenz, ottenendo l eguente mtice dei dti: Clienti N. oli ultimo nno Soddifzione Uo intenet Pee eidenz A 8 moltiimo No Itli B bbtnz No Fnci C 3 molto Si Fnci D poco Si Gemni Pe l oddifzione i pone pe niente, poco, 3 bbtnz, 4 molto e 5 moltiimo. Pe l uo di intenet pe l penotzione, il ftto di e ipoto entmbi no, ende non confontbili le unità, in qunto non poimo pee e l penotzione è enut con l medeim modlità o con modlità die, pe cui δ i,k iene poto pi zeo. L ditnz t le unità A e B è: 8 5 3 + + 0 + 8 5 d AB 0,83 ; + + 0 + mente quell t A e C è: 8 3 5 4 + + + 8 5 d AC 0,74. + + + Pocedendo nlogmente pe le lte coppie di ibili i ottiene l eguente mtice delle ditnze di Gowe: 0 0,83 0,74 0,90 0,83 0 0,38 0,60 D. 0,74 0,38 0 0,4 0,90 0,60 0,4 0 3.6 Le nlii ui pofili di colonn e di ig in S, R ed Xltt In SAS l nlii ui pofili di colonn può eee elizzt tteo l pocedu CORR. L pocedu conente di clcole l mtice di coinz e l mtice di coelzione medinte l indice di Bi o il coefficiente di coelzione t nghi di Spemn. L inti fondmentle è l eguente: PROC CORR DATAnome PEARSON Specific il d di input; qulo l opzione i ome iene Conideto l ultimo dt et ceto nell eione di loo. Clcol l mtice di coelzione utilizzndo il coefficiente di

SPEARMAN COV OUTPnome OUTSnome VAR elenco ibili BY elenco ibili coelzione linee di Bi e Peon. Clcol l mtice di coelzione utilizzndo il coefficiente di coelzione t nghi di Spemn; qulo le ibili peenti nel dt et di input ino quntittie, ee engono peentimente tfomte in nghi. Clcol l mtice di coinze. Specific il d di output doe iene memoizzt l mtice di coelzione (Bi e Peon). Specific il d di output doe iene memoizzt l mtice di coelzione (Spemn). Specific l elenco delle ibili ulle quli clcole l mtice di coelzione; e omeo engono conidete tutte le ibili numeiche del dt et. Clcol tnte mtici di coelzione ull be dei guppi fomti dlle diee modlità delle ibili che eguono lo ttement BY. In mbiente R pe il clcolo dell mtice di coelzione i può utilizze l funzione co; l funzione, eguit come gomento olo dll mtice dei dti, clcol pe defult l mtice di coelzione utilizzndo il coefficiente di coelzione linee di Bi e Peon. Qulo i deidei clcole il coefficiente di coelzione t nghi di Spemn occoe ineie l opzione method pemn. Pe il clcolo dell indice di ocizione gmm di Goodmn e Kukl, in peenz di ibili odinli con un idotto numeo di modlità, i può icoee ll funzione co.cen, peente nel pcchetto Hmic; in queto co gli gomenti d ineie ono le due ibili pe le quli i ichiede il clcolo dell indice gmm e l opzione outxtrue. Nell output l indice gmm iene identificto con Dxy. Oimente, pe iucie d cquiie l odinmento delle modlità dei cttei qulittii odinli, le ibili donno eee definite come quntittie con modlità cecenti eguendo l odinmento delle ibili qulittie. In Xltt, un olt itemt l mtice dei dti nel foglio Excel, pe ottenee l mtice di coelzione i doà cegliee l opzione decizione dei dti (econd opzione nel menù pinciple di Xltt) e ucceimente l opzione mtici di imilità/diimilità (coelzione) (qut opzione). Nel dilog box che i pe doemo indice l zon del foglio excel in cui è contenut l mtice dei dti, cegliee l opzione quntittii pe il tipo dei dti, indice imilità e coefficiente di coelzione di Peon pe l celt del tipo di poimità, e di clcole le poimità pe le colonne. Eempio 3. Pocedue in S, R e Xltt pe il clcolo dell mtice di coelzione Un ziend di cedito dipone delle infomzioni ull clientel ziendle eltie l numeo di ddetti, ll dut del ppoto (nni) e l ldo (milioni di euo). I pogmmi eguenti, coedti di eltii output, clcolno l mtice di coelzione utilizzndo l indice di Bi e Peon in S, R e Xltt. * eempio pocedu CORR; dt bnc; input n_ddetti dut ldo; cd; 8 4 0. 5 0.8 9 0.9 8 4.5 3 0.3 43 5.3

7-0. 8-0.6 54 3 -.7 4 -.4 ; poc co dtbnc peon outpiu ; un;!"#"!$#$!$!""# # %!# "#"!#%$!&""# # '# ( #" #'')$ ("# (#& # ** +,-.,/00. # # )&'%( #%!! #%&$ #' # )&'%# ( # )%!" #%&$ #%& ( #%!!( # )%!"# #' #%& > dti n_ddetti dut ldo 8 4 0. 5 0.8 3 9-0.9 4 8 4 -.5 5 3-0.3 6 43 5.3 7 7-0. 8 8-0.6 9 54 3 -.7 0 4 -.4 > co(dti) n_ddetti dut ldo n_ddetti.00000000 0.05797905-0.338308 dut 0.05797905.00000000-0.05835 ldo -0.338308-0.05835.00000000 >