Fonti e strumenti statistici per la comunicazione

Documenti analoghi
Analisi dei dati per la comunicazione

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione

Analisi dei dati per la comunicazione. La costruzione di misure relative semplici e complesse. Prof.ssa Isabella Mingo

Analisi dei dati per la comunicazione

Misurare le variazioni: le differenze

Fonti e strumenti statistici per la comunicazione

Esempio Il numero medio di figli per donna in età feconda negli ultimi 22 anni in Italia

Stesso valore medio per distribuzioni diverse

Costruire nuove variabili

Variabile divisa in classi: varianza

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

Fonti e strumenti statistici per la comunicazione

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Distribuzione di frequenza relativa e percentuale: esempio

La struttura dei dati

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Relazioni Statistiche

Indici di variabilità relativa

Dalla distribuzione unitaria a quella di frequenza

Stesso valore medio per distribuzioni diverse

L indice di vulnerabilità sociale e materiale

Analisi dei dati per la comunicazione

Classificazione dei caratteri

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

Metodi statistici per le ricerche di mercato

Misurazione dei caratteri quantitativi

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

La gestione dei risultati della valutazione. Claudio Mantovani

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Dispense Associazione PRELIMINARY DRAFT

Conclusione del percorso di studio

Variabilità. ..senza variabilità non ci sarebbe la statistica

Analisi delle corrispondenze

Fonti e strumenti statistici per la comunicazione. La costruzione di misure relative semplici e complesse. Prof.ssa Isabella Mingo

Stefania Taralli Anno Accademico 2017/2018 1

Elementi di Statistica

LA STATISTICA

Classificazione dei caratteri

Fondamenti e metodi analisi empirica nelle scienze sociali

Statistica a.a Autovalutazione 1

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

Metodi statistici per le ricerche di mercato

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

STATISTICA 1 ESERCITAZIONE 2

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I ( )

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Fonti e strumenti statistici per la comunicazione. La costruzione di misure relative semplici e complesse. Prof.ssa Isabella Mingo

ESERCIZI STATISTICA DESCRITTIVA

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

Analisi dell associazione tra due caratteri

ANALISI STATISTICHE BIVARIATE. Tabelle di contingenza

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Progetto per l analisi e la sintesi degli indicatori di intensità delle rapine ai danni delle dipendenze bancarie. Matteo Mazziotta e Adriano Pareto

Statistica. Alfonso Iodice D Enza

La dipendenza. Antonello Maruotti

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Statistica dei consumi alimentari e delle tendenze nutrizionali Lezione 6-16/10/2015

Corso di Statistica. Indici di posizione: Medie,Moda Mediana, Quartili, Percentili. Prof.ssa T. Laureti a.a

Regressione & Correlazione

Fonti e strumenti statistici per la comunicazione

Stefania Taralli Anno Accademico 2017/2018 1

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

La Variabilità statistica

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Range interquartile. Calcolare e interpretare Range interquartile

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

SDE Marco Riani

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Esercitazioni di statistica

Statistica descrittiva II

Statistiche e relazioni

Statistica Sociale - modulo A

Esercitazioni di statistica

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

x i. Δ x i

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03

Compiti tematici dai capitoli 2,3,4

Istituzioni di Statistica

Istituzioni di Statistica e Statistica Economica

STATISTICA 1 ESERCITAZIONE 6

Metodi statistici per le ricerche di mercato

ESERCITAZIONI N. 2 corso di statistica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

Definizione Impiego Esempi Fonti:

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

La variabilità. Antonello Maruotti

STATISTICA SOCIALE - CORSO DI LAUREA IN SCIENZE TURISTICHE Prova intermedia del 15/11/07 COMPITO A

L'analisi monovariata

Transcript:

Fonti e strumenti statistici per la comunicazione La costruzione di misure relative semplici e complesse Prof.ssa Isabella Mingo A.A. 2017-2018 Numeri indice complessi Si usano quando l obiettivo dell analisi è quello di descrivere in modo sintetico la variazione di un insieme di fenomeni connessi tra loro. Esempi: Analizzare le variazioni dei prezzi di un insieme di beni e/o di servizi: es. Indici dei prezzi al consumo. Analizzare le variazioni del benessere di una collettività : es. Indici di Qualità della vita Tali indici sono valori sintetici che quantificano le variazioni congiunte che possono avvenire in situazioni differenti territoriali o temporali. 1

Numeri indice complessi: procedura di costruzione Fasi: 1. Scelta dei caratteri elementari (ad esempio quali beni e servizi o quali aspetti della qualità della vita) dovranno essere considerati; 2. Costruzione di indici semplici, scegliendo la base del rapporto, ossia la situazione a cui ciascun carattere deve essere confrontato; 3. Individuazione di un eventuale sistema di pesi, qualora si voglia attribuire importanza diversa ai singoli caratteri elementari presi in considerazione; 4. Scelta della formula di sintesi degli indici semplici. Approfondimento: Sintesi delle informazioni quantitative Le informazioni contenute in una matrice di dati possono essere sintetizzate secondo i due versi della matrice, le colonne e le righe Gli indici di tendenza centrale (le medie), di variabilità e dispersione, ecc., rappresentano dei valori di sintesi per ciascuna colonna, rappresentano cioè, per ciascuna variabile, un solo valore calcolato considerando tutti i valori assunti dalle unità statistiche rappresentate nelle righe della matrice; Altri indici possono invece essere costruiti operando delle sintesi per ciascuna riga, in modo che rappresentino, per ciascuna unità statistica, più variabili rilevate su di essa e poste nelle colonne della matrice. 2

Matrice di dati e sintesi dei valori assunti da ciascuna unità statistica ( sintesi per ogni riga) X1 X2 Xj Xk I 1 u1 x 11 x 12 x 1j x 1k I 11 X = u2 x 21 x 22 x 2j x 2k ui x i1 x i2 x ij x ik un x n1 x n2 x nj X nk I 21 I i1 I n1 FSC FSSC - I.Mingo - I.Mingo 2017-2018 2017-2018 Il sole 24Ore12 dicembre 2016 3

http://www.ilsole24ore.com/speciali/qvita_2016_dati/home.shtml Le variabili del 2016 4

Un caso di studio Gli indici QdV secondo il Sole 24 Ore Il concetto di qualità della vita viene: 1. scomposto in sei dimensioni differenti : tenore di vita, affari e lavoro, servizi e ambiente, criminalità, popolazione, tempo libero 2. Operazionalizzato utilizzando trentasei variabili, sei per dimensione. Le variabili utilizzate hanno le seguenti caratteristiche: sono rapporti statistici, espressi in unità di misure diverse (persone, euro, domande..) con campi di variazione eterogenei; si muovono in direzioni diverse: alcuni di essi sono indicatori positivi di qualità della vita (es. depositi bancari, importo delle pensioni, numero di ristoranti..) altri hanno invece una valenza negativa rispetto a tale concetto (es: numero di rapine, di furti, di divorzi). E evidente pertanto che gli indicatori elementari non possono essere utilizzati per ottenere indici sintetici senza una preventiva trasformazione. FSC - I.Mingo 2017-2018 Sintesi delle informazioni quantitative: problemi Nella pratica di ricerca non è raro il caso in cui le variabili considerate: si riferiscono a unità di misura incommensurabili: numero di persone, quantità di moneta, numero di ore, numero di abitazioni e così via. Hanno «direzione» differente (positiva o negativa) rispetto al fenomeno che quantificano. Per una corretta procedura di sintesi è opportuno tenere sotto controllo: La direzione delle variabili, indicatori elementari del concetto La diversa unità di misura variabili, indicatori elementari del concetto Spesso sono necessarie delle trasformazioni delle variabili originarie! FSC - I.Mingo 2017-2018 5

QdV secondo il Sole 24 Ore La trasformazione delle variabili: i numeri indice Nel caso di indicatori positivi di qualità della vita, la trasformazione viene effettuata come rapporto dal valore massimo e cioè = Nel caso di indicatori negativi, in cui è il valore minimo dell indicatore ad esprimere un elevata qualità della vita, il rapporto viene invertito: Esempio - Metodo dei numeri indice Indicatore di qualità nella classifica della QdV del Sole 24 Ore 4486/33126x1000=135,4 6

Esempio - Metodo dei numeri indice Indicatore di disagio nella classifica della QdV del Sole 24 Ore 66,91/494,96*1000=135,2 Esercizio Normalizzare indicatori di disagio Sapendo che l indicatore % di disoccupati in alcune province considerate varia da 1,34 a 27,74, applicando il metodo dei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore, normalizzare il valore di una provincia che è pari a 21,41. Si tratta di un indicatore di disagio, negativamente correlato con la qualità della vita, pertanto l indicatore normalizzato sarà pari a: valore minimo/ valore effettivo * 1000 1,34 / 21,41 *1000= 62,58 7

Esercizio Normalizzare indicatori di qualità Sapendo che l indicatore importo medio mensile delle pensioni in alcune province considerate varia da 395 euro a 849 euro, applicando il metodo dei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore, normalizzare il valore di una provincia che è pari a 518 euro. Si tratta di un indicatore di qualità, positivamente correlato con la qualità della vita, pertanto l indicatore normalizzato sarà pari a: valore effettivo/ valore massimo *1000, 518/849 *1000= 610,13 Esercizi Normalizzare indicatori con il metodo dei numeri indice 1- Sapendo che l indicatore importo medio dei protesti per abitanti in alcune province considerate varia da 9.17 euro a 1767 euro, applicando il metodo dei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore, normalizzare il valore di una provincia che è pari a 102 euro. valore minimo/ valore effettivo *1000 9.17/102*1000=89.90 2- Sapendo che l indicatore Nuove iscrizioni di imprese alla Camera di commercio in rapporto alle cessazioni in alcune province considerate varia da 0.89 imprese a 2.19, applicando il metodo dei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore, normalizzare il valore di una provincia che è pari a 1.07. valore effettivo/valore massimo *1000 1.07/2.19*1000=488.58 8

Indici sintetici di dimensione e di Qdv Per ogni dimensione l indice sintetico per ciascuna provincia è dato dalla media aritmetica semplice dei 6 indicatori elementari trasformati che appartengono a quella dimensione. L indice finale di Qdv è dato dalla media aritmetica semplice di tutti i 36 indicatori elementari trasformati. Indici Medi di dimensione Indice QDV provincia tenore di vita affari e lavoro ( popolazione servizi criminalità tempo libero complessivo (media dei 6 indicatori elementari trasformati) media dei 6 indicatori elementari trasformati) (media dei 6 indicatori elementari trasformati) (media dei 6 indicatori elementari trasformati) (media dei 6 indicatori elementari trasformati) (media dei 6 indicatori elementari trasformati) (media aritmetica dei 6 Indici medi di dimensione) Bologna 672 588,48 355,53 581,95 193,03 641,72 505,45 Milano 797,88 568,82 349,22 546,2 218,15 546,72 504,50 Trento 550,25 529,17 471,68 559,68 478,45 431,33 503,43 Forlì 595,78 456,55 400,07 552,9 360 637,93 500,54 Firenze 610,95 514,2 416,6 563,3 237,42 643,2 497,61 Siena 554,63 433,62 460,83 540,28 432,8 544,3 494,41 Aosta 702,85 397,42 467,15 497,08 369,95 527,38 493,64 Trieste 596,78 517,5 304,52 685,95 313,6 531,7 491,68 Bolzano 542,93 541,88 376,73 551,47 476,05 438,02 487,85 Gorizia 598,05 479,27 351,15 534,28 489,33 468,27 486,73................ Tab. 9

QdV Sole 24 Ore Schema del processo di sintesi: matrici e procedure Matrice indicatori elementari Province x 36 indicatori elementari Trasformazione in numeri indice Matrice indicatori elementari trasformati Province x 36 indicatori elementari trasformati Sintesi X = U1 U2 Ui Un V1 V2 Vj Vk I1 X11 X12 X1j X1k I11 X21 X22 X2j X2k I21 Xi1 Xi2 Xij Xik Ii1 Xn1 Xn2 Xnj Xnk In1 Matrice indici sintetici di dimensione Province x 6 indici sintetici Sintesi Matrice indice sintetico di QDV (vettore colonna) Province x 1 indice sintetico Calcolo dell Indice sintetico di Qdv Esercizio A partire dai punteggi della tabella, si applichi la procedura di sintesi utilizzata dal Sole 24Ore, per calcolare l indice sintetico di qualità della vita per le seguenti Provincie. In quale Provincia si vive meglio? L indice sintetico di Qdv per ciascuna provincia sarà uguale alla media aritmetica dei punteggi ottenuti nelle diverse sottodimensioni. L indice di Ragusa, ad esempio, sarà: QDVRG= (521+427+540+539+307+346)/6= 466,67 FSSC- I.Mingo 2017-2018 Indice di QDV Ragusa 446,67 Perugia 536,67 Roma 557,50 10

La costruzione di indici complessi: fasi In definitiva, la costruzione di indici compelssi compositi passa per le fasi seguenti: Individuazione delle dimensioni ritenute rilevanti per la misurazione del fenomeno Operativizzazione delle singole dimensioni (costruzione e/o scelta delle variabili) Costruzione di indici semplici ed eventuale trasformazione per eliminare l effetto delle diverse unità di misura, o della diversa direzione Eventuale ponderazione delle dimensioni o nel loro ambito degli indici semplici (ponderazione) Ricombinazione degli indici semplici per dimensione (scelta del metodo di sintesi) Ricombinazione degli indici di dimensione nell indice sintetico finale (scelta del metodo di sintesi). Ancora sui metodi di trasformazione Per eliminare i problemi relativi alle diverse unità di misura Trasformare i caratteri in numeri indice (es. QdV sole 24 ore) Per controllarne anche la diversa variabilità si può: Relativizzare i valori con il campo di variazione Standardizzare 11

La relativizzazione con il campo di variazione Tra i diversi metodi utilizzabili per eliminare l influenza della diversità del campo di variazione, si può adottare il seguente metodo che trasforma la distribuzione di ogni variabile in modo che il suo valore minimo valga 0, il suo valore massimo valga 1 o multipli di 10, mentre gli altri valori vengono riscalati e ricollocati tra questi due estremi: Questo tipo di trasformazione è utile nei casi in cui si vogliono confrontare distribuzioni che presentano campi di variazioni differenti. Rendere omogenei i campi di variazione Esempio Tabella 10.17. Trasformazione del campo di variazione: esempio. Regione Regione A Regione B Regione C Regione D Regione E Speranza di vita Reddito Procapite Speranza di vita trasformato Reddito pro-capite trasformato 82,5 770 0,72 0,16 77,4 2400 0,00 1,00 84,5 1670 1,00 0,63 79,6 450 0,31 0,00 78,2 560 0,11 0,06 Min 77,4 450 0,00 0,00 Max 84,5 2400 1,00 1,00 12

Relativizzare con il campo di variazione esercizio Si trasformi la seguente distribuzione in modo da ottenere una nuova variabile con min=0 e max=1 Es. Normalizzare la variabilità: il metodo della standardizzazione Seguendo questo metodo i valori delle variabili vengono espressi come differenza dalla media aritmetica e rapportati allo scarto quadratico medio, in modo da ottenere una nuova variabile(detta standardizzata) con media 0 e varianza pari a 1. z ij = (x ij M x )/σ M= media aritmetica σ = scarto quadratico medio A seguito di questa trasformazione i valori originari inferiori alla media diventano negativi mentre quelli superiori positivi. Gli indicatori così trasformati risultano liberati dall unità di misura e dalla differente variabilità, in quanto ciascun indicatore presenta media uguale a 0 e varianza unitaria 13

Metodo della standardizzazione: esempio FSC - I.Mingo 2017-2018 Esercizio Standardizzare un valore Sapendo che la media di una variabile X è pari a 1550 e lo scarto quadratico medio è 8,5, calcolare il punteggio standardizzato dell unità statistica i che presenta il valore x=1140. La formula di standardizzazione è: z i = (x i M x )/σ Nel nostro caso : zi=(1140 1550)/ 8,5 = - 48,24. 14

Esercizi Standardizzare un valore Sapendo che la media di una variabile X è pari a 50.5 e lo scarto quadratico medio è 5.5, calcolare il punteggio standardizzato del valore x= 75. z= (75 50.5)/ 5.5 = 4.45 Sapendo che la media di una variabile X è pari a 180 e lo scarto quadratico medio è 9, calcolare il punteggio standardizzato del valore x= 135. z= (135 180)/ 9 = -5 Esercizio Trasformare il seguente carattere, che ha media 118,65 e = 10, 39, applicando: 1- Il metodo della standardizzazione (2,5 punti) 2- La relativizzazione con il campo di variazione (2,5 punti) (esplicitare in entrambi i casi le caratteristiche della distribuzione ottenuta e la formula applicata.) prov1 X1 Trend delitti Z1 (X1standardizzato Avellino 125,60 Catania 99,36 Enna 113,97 Pesaro 132,67 Sondrio 121,67 Y1 (X1 relativizzato con il campo di variazione) FSSC- 15

Esercizi Sapendo che l indicatore % di disoccupati in alcune province considerate varia da 1,74 a 28,15, applicando il metodo dei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore, normalizzare il valore di una provincia che è pari a 20,35. Sapendo che l indicatore Associazioni culturali su 1000 abitanti in alcune province considerate varia da da 40,5 a 96,38 abitanti, applicando il metodo dei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore, normalizzare il valore di una provincia che è pari a 53,34. Applicando il metodo della relativizzazione con campo di variazione, si relativizzi l'indicatore Speranza di vita alla nascita che in un Paese assume un valore pari a 79, sapendo che il minimo è 25 e il massimo 86. Applicando il metodo della relativizzazione con campo di variazione, si relativizzi l'indicatore Rapporto lordo di iscrizione che in un Paese assume un valore pari a 85., sapendo che il minimo è 15 e il massimo 98. Sapendo che la media di una variabile X è pari a 80 e lo scarto quadratico medio è 1,5, calcolare il punteggio standardizzato del valore x= 86,4. Sapendo che la media di una variabile X è pari a 18 e lo scarto quadratico medio è 2, calcolare il punteggio standardizzato del valore x= 24. Esempi di uso di indici compositi: il BES Il progetto BES, realizzato dall Istat con lo scopo di individuare gli indicatori statistici più adeguati al fine di misurare le dimensioni del «Benessere equo e sostenibile» Complessivamente sono stati individuati 12 domini e 130 indicatori, che tengono conto sia di aspetti che hanno un diretto impatto sul benessere umano ed ambientale sia di quelli che misurano gli elementi funzionali al miglioramento del benessere della collettività e dell ambiente che la circonda. Questi indicatori sono diventati strumenti di programmazione e valutazione della politica economica nazionale, come previsto dalla riforma della Legge di Bilancio, entrata in vigore nel settembre 2015. 16

I dominio del BES Costruzione di indici compositi per alcuni domini 17

Indici compositi nel tempo Diagramma a radar: caratteristiche E un grafico bidimensionale in cui si rappresenta una sequenza di raggi che si originano da un punto centrale e formano angoli uguali tra loro. Ogni raggio può rappresentare una delle unità statistiche, oppure una diversa modalità di una o più caratteri. La distanza dal centro a ciascuno dei punti segnati su ogni raggio è proporzionale all intensità o alla frequenza che si rappresenta, rispetto al valore massimo raggiungibile. I punti sui raggi vengono congiunti con segmenti, così che il grafico ha la forma di una stella o di una ragnatela. FSSC- Mingo 2017-2018 18

Indici compositi nel tempo per ripartizione Analisi dei dati per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 2017-2018 19

Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel casi di caratteri qualitativi: I valori delle celle derivano dall analisi della tabella unitaria! ADC-FSSC Distribuzione doppia di frequenze: caratteristiche Tabella che consente di sintetizzare l informazione disponibile su due caratteri osservati contemporaneamente sul medesimo collettivo di n u.s. In colonna : Lista di modalità del carattere 1 In riga : Lista di modalità del carattere 2 Nella tabella si considerano tutte le possibili coppie di modalità (una del car. 1 ed una del car. 2). I valori rappresentati sono il conteggio, ossia le frequenze assolute, del numero di u.s. del collettivo considerato che presentano una coppia di modalità dei 2 caratteri. ADC-FSSC 20

Distribuzione doppia di frequenze: struttura Ha un numero di righe uguale al numero di modalità della variabile rappresentata in riga più 1 e un numero di colonne uguale a quello delle modalità della variabile rappresentata in colonna più 1. Distribuzioni condizionate ADC-FSSC Distribuzioni marginali di riga e di colonna Dalla distribuzione unitaria multipla alla distribuzione doppia di frequenza: esempio 1- Costruiamo un tabella che ha: un numero di righe uguale al numero di modalità della variabile che vogliamo rappresentare in riga più 1 per i totali di colonna un numero di colonne uguale a quello delle modalità della variabile che vogliamo rappresentare in colonna più 1 per i totali di riga. ADC-FSSC 21

Dalla distribuzione unitaria multipla alla distribuzione doppia di frequenza: esercizio (segue) 2 Contiamo per ciascun carattere le unità che presentano una stessa modalità e scriviamo i totali nelle rispettive celle marginali della tabella. 3- Contiamo le unità statistiche che presentano congiuntamente le modalità a due a due e scriviamo le frequenze nelle rispettive celle condizionate 4- verifichiamo che le somme dei valori siano coerenti. Sesso Uso_PC 1-Si 2-No Totale 1-Maschio somma dei maschi 2-Femmina somma delle femmine Totale somma dei SI somma dei NO Totale unità ADC-FSSC la formalizzazione Y Tot. X Tot. x 1 x 2 x j x K y 1 n 11 n 12 n 1j n 1K n 1. y 2 n 21 n 22 n 2j n 2K n 2. : : : : : : y i n i 1 n i 2 n ij n ik n i. : : : : : : y H n H 1 n H 2 n Hj n HK n H. n. 1 n. 2 n. j n. K n Frequenze assolute del carattere Y Distribuzione marginale di Y Frequenze assolute del carattere X Distribuzione marginale di X ADC-FSSC 22

la formalizzazione X x 1 x 2 x j x K Tot. Y y 1 n 11 n 12 n 1j n 1K y 2 n 21 n 22 n 2j n 2K : : : : : y i n i 1 n i 2 n ij n ik : : : : : Tot. n y H n H 1 n H 2 n Hj n HK Frequenze assoluta della coppia di modalità (y i, x j ) ADC-FSSC Riga i Colonna j Y Tot. X Tot. x 1 x 2 x j x K y 1 n 11 n 12 n 1j n 1K n 1. y 2 n 21 n 22 n 2j n 2K n 2. : : : : : : y i n i 1 n i 2 n ij n ik n i. : : : : : : y H n H 1 n H 2 n Hj n HK n H. n. 1 n. 2 n. j n. K n Tot. Somma Frequenze n.j ADC-FSSC Tot. Somma Frequenze n i. 23

Esempio Distribuzione degli studenti di Scienze della Comunicazione frequentanti il corso di Analisi dei dati nell a.a. 2011/2012 per Corso di Laurea e Numero di Corsi Frequentati Numero Corsi Frequentati CDL 1 2 3 4 5 6 7 Totale STC 12 19 50 47 20 3 1 152 SCPO 2 23 49 32 12 5 1 124 SCOSV 1 1 4 1 0 0 0 7 Totale 15 43 103 80 32 8 2 283 n 2. n 24 n.6 n ADC-FSSC Distribuzione condizionata del carattere Num.Corsi Freq. alla modalità y 1 =STC del carattere CDL Esempio Numero Corsi Frequentati CDL 1 2 3 4 5 6 7 Totale STC 12 19 50 47 20 3 1 152 SCPO 2 23 49 32 12 5 1 124 SCOSV 1 1 4 1 0 0 0 7 Totale 15 43 103 80 32 8 2 283 Distribuzione condizionata del carattere CDL alla modalità x 5 =5 del carattere Num.Corsi Freq. ADC-FSSC 24

Osserviamo che Distribuzione marginale del CDL CDL STC 152 SCPO 124 SCOSV 7 Totale 283 n j Distribuzione marginale del Num. Corsi Freq. Num. Corsi Freq. n j 1 15 2 43 3 103 4 80 5 32 6 8 7 2 Totale 283 Numero Corsi Frequentati CDL 1 2 3 4 5 6 7 Totale STC 12 19 50 47 20 3 1 152 SCPO 2 23 49 32 12 5 1 124 SCOSV 1 1 4 1 0 0 0 7 Totale 15 43 103 80 32 8 2 283 AdC Tipi di distribuzioni doppie: assolute e percentuali Frequenze assolute Frequenze percentuali sul totale (n=43290) 20757/43290 *100=47,9% 1179/43290 FSC *100=2,7% 25

Tipi di distribuzioni doppie : profili di riga % Frequenze assolute Frequenze percentuali (sui totali=n i. ) profili di riga % 2856/20757 *100=13,8% 2514/22533 *100=11,2% 5370/43290 *100=12,4% ADC-FSSC Tipi di distribuzioni doppie : profili di colonna% Frequenze assolute Frequenze percentuali (sui totali=n.j ) : profili di colonna % 1072/2251*100=47,6 FSC 18947/35669*100=63,1% 2514/5370*100=46,8% 22533/43290 *100=52,1% 26