La dissomiglianza tra due distribuzioni normali

Documenti analoghi
Prova di autovalutazione Prof. Roberta Siciliano

La distribuzione Normale. La distribuzione Normale

Slide Cerbara parte1 5. Le distribuzioni teoriche

Metodi statistici per le ricerche di mercato

Il concetto di valore medio in generale

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI

Elementi di Psicometria con Laboratorio di SPSS 1

Misure della dispersione o della variabilità

La distribuzione Gaussiana

Statistica. Alfonso Iodice D Enza iodicede@unina.it

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Metodi statistici per le ricerche di mercato

I punteggi zeta e la distribuzione normale

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

VARIABILI ALEATORIE CONTINUE


Capitolo 6. Soluzione degli esercizi a cura di Rosa Falotico

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

24 : 3 = 8 con resto 0 26 : 4 = 6 con resto 2

Lezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Elementi di Psicometria con Laboratorio di SPSS 1

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Esempi di funzione. Scheda Tre

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

1. Distribuzioni campionarie

Consideriamo due polinomi

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Statistica Applicata all edilizia Lezione 2: Analisi descrittiva dei dati

STATISTICA (A-K) a.a Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007

LE FUNZIONI A DUE VARIABILI

( x) ( x) 0. Equazioni irrazionali

2 Argomenti introduttivi e generali

Corso di Psicometria Progredito

Capitolo 26: Il mercato del lavoro

4. Operazioni elementari per righe e colonne

a) Il campo di esistenza di f(x) è dato da 2x 0, ovvero x 0. Il grafico di f(x) è quello di una iperbole -1 1

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004

Facciamo qualche precisazione

Matematica e Statistica

risulta (x) = 1 se x < 0.

Grafici delle distribuzioni di frequenza

Esercizi di Macroeconomia per il corso di Economia Politica

4 Dispense di Matematica per il biennio dell Istituto I.S.I.S. Gaetano Filangieri di Frattamaggiore EQUAZIONI FRATTE E SISTEMI DI EQUAZIONI

Lezione n. 2 (a cura di Chiara Rossi)

Capitolo 13: L offerta dell impresa e il surplus del produttore

Relazioni statistiche: regressione e correlazione

Il simbolo. è è = = = In simboli: Sia un numero naturale diverso da zero, il radicale. Il radicale. esiste. esiste 0 Il radicale

Serie Storiche Trasformazioni e Aggiustamenti

Lenti sottili/1. Menisco convergente. Menisco divergente. Piano convessa. Piano concava. Biconcava. Biconvessa. G. Costabile

Statistica. Lezione 6

~ Copyright Ripetizionando - All rights reserved ~ STUDIO DI FUNZIONE

p atm 1. V B ; 2. T B ; 3. W A B 4. il calore specifico a volume costante c V

Politecnico di Milano - Scuola di Ingegneria Industriale. I Prova in Itinere di Statistica per Ingegneria Energetica 9 maggio 2013

Statistica inferenziale

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Dipartimento di Economia Aziendale e Studi Giusprivatistici. Università degli Studi di Bari Aldo Moro. Corso di Macroeconomia 2014

Corso di. Dott.ssa Donatella Cocca

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

RETTE, PIANI, SFERE, CIRCONFERENZE

Dr. Marco Vicentini Anno Accademico Rev 30/03/2011

DATI NORMATIVI PER LA SOMMINISTRAZIONE DELLE PROVE PAC-SI A BAMBINI DI INIZIO SCUOLA PRIMARIA 1

Teoria dei Giochi. Anna Torre

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

2 FUNZIONI REALI DI VARIABILE REALE

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Metodi Matematici e Informatici per la Biologia Maggio 2010

Prof.ssa Paola Vicard

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Indice. 1 Introduzione alle Equazioni Differenziali Esempio introduttivo Nomenclatura e Teoremi di Esistenza ed Unicità...

3 GRAFICI DI FUNZIONI

FASCI DI RETTE. scrivere la retta in forma esplicita: 2y = 3x + 4 y = 3 2 x 2. scrivere l equazione del fascio di rette:

Capitolo 5. Funzioni. Grafici.

LA STATISTICA NEI TEST INVALSI

Appunti di complementi di matematica

Istituzioni di Statistica e Statistica Economica

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

Elementi di Psicometria con Laboratorio di SPSS 1

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

2. Leggi finanziarie di capitalizzazione

Come visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1)

FONDO PENSIONE PER I DIRIGENTI IBM STIMA DELLA PENSIONE COMPLEMENTARE (PROGETTO ESEMPLIFICATIVO STANDARDIZZATO)

19txtI_BORRA_ /11/13 10:52 Pagina 449 TAVOLE STATISTICHE

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

Il valore assoluto. F. Battelli Università Politecnica delle Marche, Ancona. Pesaro, Precorso di Analisi 1, Settembre 2005 p.

Analisi Matematica di circuiti elettrici

Ottimizazione vincolata

Secondo Rapporto sulla Previdenza Privata I giovani. A cura del centro studi AdEPP

Che cosa e come valutano le prove di matematica e con quali risultati. nell A.S

IL RISCHIO D IMPRESA ED IL RISCHIO FINANZIARIO. LA RELAZIONE RISCHIO-RENDIMENTO ED IL COSTO DEL CAPITALE.

Capitolo 12 La regressione lineare semplice

Le scale di riduzione

2. GLI INTERNATIONAL STUDENT A MILANO: QUANTI SONO

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.

Curriculum Vitae Antonella Nannavecchia. Esperienza professionale

Transcript:

Annali del Dipartimento di Scienze Statistiche Carlo Cecchi Università degli Studi di Bari Aldo Moro - Vol. X (2011): 43-50 Editore CLEUP, Padova - ISBN: 978-88-6129-833-0 La dissomiglianza tra due distribuzioni normali Angela Maria D'Uggento Università degli Studi di Bari Aldo Moro, Macro Area Controllo strategico, analisi statistica e programmazione Francesco Girone Università degli Studi di Bari Aldo Moro, Dipartimento di Studi aziendali e giusprivatistici Riassunto: La presente nota si propone di illustrare il procedimento mediante il quale ottenere l espressione compatta dell indice di dissomiglianza di Gini come misura globale della distanza tra distribuzioni normali, di medie diverse e di varianze diverse. L applicazione dimostra come tale formula dell indice semplice di dissomiglianza per distribuzioni normali sia di agevolissimo calcolo. Keywords: indice di dissomiglianza, distribuzione normale I paragrafi 1 e 2 sono dovuti a F. Girone e i paragrafi 3 e 4 ad A.M. D'Uggento. Autore di riferimento: Angela M. D Uggento, Università degli studi di Bari Aldo Moro, Palazzo Ateneo, p.za Umberto I, 70100 Bari; e-mail: a.duggento@das.uniba.it

D Uggento A.M., Girone F. La dissomiglianza tra due distribuzioni normali 45 1. PREMESSA Gini (1914) ha proposto come misura della divergenza tra due distribuzioni l indice semplice di dissomiglianza. Tale indice è pari alla media delle differenze in valore assoluto tra modalità cograduate o anche all area contenuta tra le corrispondenti funzioni di ripartizione (Girone, 2009). Nel caso di caratteri continui, pertanto, l indice di dissomiglianza è pari all integrale della differenza in valore assoluto tra le due funzioni di ripartizione. Il pregio dell'indice di dissomiglianza sta nel fatto che esso è una misura globale della divergenza tra due distribuzioni che considera la totalità degli aspetti (medie, variabilità, forma ecc.) e, come tale, può essere utilizzato per misurare la distanza tra distribuzioni, godendo delle tre proprietà della distanza. In questa nota ci proponiamo di ottenere una formula chiusa dell indice di dissomiglianza nel caso di due distribuzioni normali di medie diverse e di varianze diverse. 2. DEFINIZIONI Siano X₁ e X₂ due caratteri distribuiti normalmente con medie µ₁ e µ₂ e varianze σ₁² e σ₂² e quindi con funzioni di densità definite su tutto l asse reale ₁ σ₁² σ₁ 2π e σ ² σ 2π e funzioni di ripartizione 1 2 1 σ₁ 2

46 Annali del Dipartimento di Scienze Statistiche Carlo Cecchi, Vol. X (2011) e 1 σ. L indice semplice di dissomiglianza di Gini è dato dalla seguente formula: X X Non è facile ottenere il valore di tale indice sia per la presenza di quattro parametri che per la presenza del valore assoluto. Possiamo traslare le due funzioni di ripartizione in maniera da porre uguale a 0 la media più piccola, denominando la differenza tra la più grande e la più piccola con µ= µ₂ - µ₁. Questa traslazione lascia invariato l indice di dissomiglianza. Possiamo, poi, trasformare le due variabili dividendole per lo scarto quadratico medio più piccolo, in maniera da rendere unitario tale scarto quadratico medio più piccolo e indicare semplicemente il rapporto tra lo scarto quadratico medio più grande a quello più piccolo con /. Anche tale trasformazione lascia invariato l'indice di dissomiglianza. Con le suddette trasformazioni le due variabili normali hanno medie 0 e µ e varianze 1 e σ². L indice di dissomiglianza, utilizzando le variabili trasformate, quindi, dipende solo da detti due parametri. Le funzioni di ripartizione delle variabili trasformate sono: 1 e 1 σ È facile dimostrare che esse hanno il solo punto di intersezione per = a sinistra del quale F(x) G(x) e a destra del quale F(x) G(x). L indice di dissomiglianza X X si può spezzare eliminando il valore assoluto X X.

D Uggento A.M., Girone F. La dissomiglianza tra due distribuzioni normali 47 Con semplici artifici di calcolo abbiamo ottenuto il risultato X X [1]. La suddetta funzione, in termini di µ e σ, è rappresentata graficamente nella Fig.1 dalla quale emerge chiaramente che l indice semplice di dissomiglianza per due distribuzioni normali cresce al crescere di µ, ossia al crescere della differenza delle medie e al crescere di σ, ossia al crescere del rapporto tra i due scarti quadratici medi. Figura 1. Indice semplice di dissomiglianza tra due distribuzioni normali di medie 0 e µ e s.q.m. 1 e σ. 3. APPLICAZIONE La formula proposta nel presente lavoro consente di calcolare l indice semplice di dissomiglianza per due distribuzioni normali. Per una sua applicazione sono stati utilizzati i dati delle stature osservate su 172 studenti universitari, di cui 94 maschi e 78 femmine (Tab.1).

48 Annali del Dipartimento di Scienze Statistiche Carlo Cecchi, Vol. X (2011) Tabella 1. Stature osservate su 172 studenti universitari, per sesso Stature (cm) Maschi Femmine Stature (cm) Maschi Femmine 152 0 2 176 1 1 154 0 1 177 4 1 155 0 1 178 9 1 156 0 1 179 6 0 157 0 3 180 6 1 158 0 4 181 6 0 159 0 1 182 4 0 160 2 11 183 3 1 162 0 5 184 2 0 163 1 5 185 6 0 164 0 3 186 4 0 165 1 10 187 4 0 167 1 2 188 1 0 168 3 6 190 1 0 169 1 2 193 2 0 170 2 6 195 1 0 171 3 1 196 1 0 172 5 2 207 1 0 173 5 3 Totale 94 78 174 3 3 Medie 178,70 165,17 175 5 1 s.q.m. 7,65 6,51 Indichiamo con N=3.666 il minimo comune multiplo tra il numero dei maschi e quello delle femmine e con e con, per i=1,2,,n, le graduatorie ampliate, ossia moltiplicate per.. 39 e 47, rispet- tivamente per i maschi e per le femmine. L indice di dissomiglianza delle due distribuzioni, calcolato utilizzando la media delle differenze in valore assoluto tra osservazioni cograduate, risulta: 49.621 3.666 13,53.

D Uggento A.M., Girone F. La dissomiglianza tra due distribuzioni normali 49 Atteso che la distribuzione delle stature in gruppi omogenei è approssimativamente normale, abbiamo sostituito alle distribuzioni empiriche le curve normali con medie e varianze stimate rispettivamente per gli studenti e per le studentesse: 178,70, 165,17 e 7,65, 6,51. La differenza delle medie risulta 178,70 165,17 13,53, il rapporto tra gli scarti quadratici medi risulta 7,65 6,51 1,175. Possiamo applicare, pertanto, la formula [1] dell'indice di dissomiglianza tra due distribuzioni normali ricavata nel paragrafo precedente: 2 1 2 13,53. 1 2 Figura 2. Funzioni di ripartizione empiriche e teoriche delle distribuzioni delle stature di 94 studenti e 78 studentesse universitari.

50 Annali del Dipartimento di Scienze Statistiche Carlo Cecchi, Vol. X (2011) L'identità dei risultati consente di fare le seguenti considerazioni: - le osservazioni delle stature per i maschi e per le femmine sono ben rappresentate dalle curve normali, la qual cosa viene confermata dalla vicinanza dalle funzioni di ripartizione empiriche e teoriche rappresentate nella Fig.2; - il calcolo dell'indice di dissomiglianza risulta più agevole laddove si utilizzi la formula [1]; - il contributo all'indice di dissomiglianza è dovuto principalmente alla differenza delle medie e non alla differenza tra gli scarti quadratici medi. 4. CONSIDERAZIONI FINALI In questa nota abbiamo ottenuto l espressione in forma compatta dell indice di dissomiglianza per due variabili normali con medie e varianze diverse. Il risultato si rivela particolarmente utile quando, in varie discipline (indagini sociali, indagini di marketing, analisi dei gruppi ecc.), occorre stratificare un collettivo senza voler privilegiare i singoli aspetti (medie, variabilità, asimmetria ecc.) ma tenendo conto della distanza globale tra le distribuzioni stesse. Può essere interessante, infatti, usare il risultato dell indice di dissomiglianza globale tra le coppie di distribuzioni normali delle variabili oggetto di studio quale criterio di selezione e aggregazione delle unità statistiche. BIBLIOGRAFIA GINI C. (1914) Di una misura della dissomiglianza tra due gruppi di quantità e delle sue applicazioni allo studio delle relazioni statistiche, Reale Istituto Veneto di Scienze, Lettere ed Arti, Venezia. GIRONE G. (2009) Statistica, Cacucci Editore, Bari.