Parte V La descrizione dei fenomeni attraverso la statistica

Documenti analoghi
Esercitazione parte 1 Medie e medie per dati raggruppati. Esercitazione parte 2 - Medie per dati raggruppati

Statistica 1 A.A. 2015/2016

Gli Indici di VARIABILITA

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

LE MISURE DI TENDENZA CENTRALE

Fonti e strumenti statistici per la comunicazione

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Lezione 4 Corso di Statistica. Francesco Lagona

Daniela Tondini

Lezione 5. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 5. A. Iodice.

Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Probabilità e Statistica (cenni)

7. ASSOCIAZIONE TRA CARATTERI

7. ASSOCIAZIONE TRA CARATTERI

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli

Costo manutenzione (euro)

Argomenti. Stima Puntuale e per Intervallo. Inferenza. Stima. Leonardo Grilli. Università di Firenze Corso di Laurea in Statistica Statistica

Quartili. Esempio Q 3 Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Elementi di statistica

Statistica. Lezione 5

Elementi di statistica descrittiva. Tabella dei dati :

Intervalli di Fiducia

Caso studio 9. Distribuzioni doppie. Esempi

Esempio: distribuzione di frequenze. =, Pagina 90. Esempio: distribuzione di frequenze

Metodi statistici per le ricerche di mercato

Daniela Tondini

STATISTICA 1 ESERCITAZIONE 4

Metodi statistici per le ricerche di mercato

Lezione 9. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 9. A. Iodice

Metodi statistici per le ricerche di mercato

5. INDICI DI DISUGUAGLIANZA

PRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 21 ottobre 2015 COMPITO B

Campionamento casuale da popolazione finita (caso senza reinserimento )

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Inferenza Statistica. L inferenza statistica cerca di risalire al modello del fenomeno sulla base delle osservazioni.

5. INDICI DI VARIABILITA'

7. RELAZIONE TRA CARATTERI

Distribuzione normale

2,3, (allineamenti decimali con segno, quindi chiaramente numeri reali); 4 ( = 1,33)

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2013

Lezione 4 Corso di Statistica. Domenico Cucina

1.6 Serie di potenze - Esercizi risolti

LE MISURE DI SINTESI (misure di tendenza centrale)

Probabilità CENNI DI PROBABILITÀ

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA

Popolazione e Campione

Esperimentazioni di Fisica 1. Prova scritta del 1 febbraio 2016 SOLUZIONI

Popolazione e Campione

REGRESSIONE LINEARE E POLINOMIALE

Lezioni di Matematica 1 - I modulo

Metodi quantitativi per l analisi dello sviluppo

Esercitazioni di Statistica Dott.ssa Cristina Mollica

STUDIO DEL LANCIO DI 3 DADI

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

Corso di Laurea in Ingegneria Informatica Anno Accademico 2016/2017 Calcolo delle Probabilità e Statistica Matematica

1. Saper conteggiare il numero totale di scelte in uno schema ad albero. 2. Saper risolvere problemi con permutazioni, disposizioni e combinazioni

(a 0, a 1, a 2,..., a n,...) (0, a 0 ), (1, a 1 ), (2, a 2 ),... (1, 3, 5, 7,...) Lezione del 26 settembre. 1. Successioni.

Metodi di valutazione delle prestazioni di rete

Metodi statistici per le ricerche di mercato

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!)

SUCCESSIONI DI FUNZIONI

Esercizi di Probabilità e Statistica

Insiemi numerici. Sono noti l insieme dei numeri naturali: N = {1, 2, 3, }, l insieme dei numeri interi relativi:

La correlazione e la regressione. Antonello Maruotti

STATISTICA 1 ESERCITAZIONE 5

TEORIA DELLE MATRICI. dove aij K. = di ordine n, gli elementi aij con i = j (cioè gli elementi a 11

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

a n (x x 0 ) n. (1.1) n=0

Una funzione delle osservazioni campionarie è una statistica che, nel contesto della stima di un parametro, viene definita stimatore.

Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice

Prof.ssa Paola Vicard

Esercitazioni del Corso di Probabilitá e Statistica Lezione 6: Stime di parametri puntuali e per intervalli

Argomenti trattati: Stima puntuale e stimatore Proprietà degli stimatori Stima puntuale della media della

SERIE DI POTENZE Esercizi risolti. Esercizio 1 Determinare il raggio di convergenza e l insieme di convergenza della serie di potenze. x n.

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD e 4038) 15 gennaio 2003

Le successioni: intro

1. a n = n 1 a 1 = 0, a 2 = 1, a 3 = 2, a 4 = 3,... Questa successione cresce sempre piú al crescere di n e vedremo che {a n } diverge.

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1

Stimatori, stima puntuale e intervalli di confidenza Statistica L-33 prof. Pellegrini

Formulazione del problema - 1

LABORATIORIO 3. Taratura statica

Statistica bivariata Tabella di contingenza % di riga I tre tipi di percentuale rimandano a significati differenti. Tabella di contingenza

Matematica con elementi di Informatica

4 - Le serie. a k = a k. S = k=1

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

LE MISURE DI VARIABILITÀ DI CARATTERI QUANTITATIVI

ES 1.3. Data la distribuzione unitaria di una variabile quantitativa X. la media aritmetica di X è data dal rapporto tra il totale n

CAMBIAMENTO DI BASE IN UNO SPAZIO VETTORIALE

Approfondimento 2.1 Scaling degli stimoli mediante il metodo del confronto a coppie

Corso di Statistica Facoltà di Economia

STATISTICA INFERENZIALE

Analisi Matematica Soluzioni prova scritta parziale n. 1

Materiale didattico relativo al corso di Matematica generale Prof. G. Rotundo a.a.2009/10

c calcolare i diversi tipi di valori di sintesi di un insieme di dati

Entropia ed informazione

Statistica. Lezioni : 11, 12. Statistica Descrittiva Bivariata 2. a.a

Stima della media di una variabile X definita su una popolazione finita

La dinamica dei sistemi - intro

Transcript:

64 Parte V La descrizioe dei feomei attraverso la statistica Dai capitoli presedeti è stato possibile verificare l importaza odale che il sistema iformativo detiee elle scelte di piaificazioe territoriale. I particolare si soo illustrati i passaggi fodametali per la realizzazioe di ua baca dati, cosiderado sia gli aspetti teorici, sia quelli pratici. Come più volte richiamato, la moltitudie dei dati, iformazioi, cartografie, che ogi ete possiede devoo ecessariamete dialogare tra loro per cosetire la miglior descrizioe della realtà osservata, la miglior classificazioe è permettere alle ammiistrazioi di effettuare delle scelte elle migliori codizioi di coosceza possibile. La realizzazioe di u piao ifatti attraversa ecessariamete tre fodametali cardii: (i) descrizioe; (ii) classificazioe; (iii) decisioe. Per poter descrivere u feomeo e classificarlo, chi scrive utilizza, la Geostatistica ossia l utilizzo della statistica multivariata applicata alle iformazioi territoriali. Ua metodologia che potremo defiire descrittivo-esplorative i quato richiede a priori la costituzioe di ipotesi comportametali forti sulle quali basare il proseguo delle aalisi oché, tede ad esplorare, per compredere, le relazioi esisteti el reale e rilevabile attraverso i dati raccolti. Tale metodologia ioltre ha la capacità di sitetizzare gradi quatità di dati perdedolo soo ua margiale parte dell iformazioe e riuscedo a classificare il territorio di aalisi i classi. Prima di addetrarci el modo della geostatistica e i particolare el pacchetto software Addati che cosete di effettuare ua serie di aalisi statistiche multivariate sulle diverse variabili e compoeti che defiiscoo il territorio di aalisi, è cosigliabile aprire ua fiestra riguardate le variabili statistiche sia semplici che doppi e cosiderare ua serie di elemeti che possoo certamete essere utili ella fase della descrizioe. 1 Le variabili statistiche a ua dimesioe Come primo passo el campo della statistica, è opportuo cocetrarsi sulle variabili ad ua dimesioe, ossia le variabili che tetao l iterpretazioe del feomeo soltato sulla base delle maifestazioi osservate del feomeo stesso. Nello specifico l aalisi statistica ad ua dimesioe si basa sulle osservazioi effettuate del feomeo e descritte el seguete modo: X 1, X 2,, X i, X N 1, N 2, N i, N Valori argometali Preseze i i=1 = Numerosità complessiva = N Il sistema sopra riportato si defiisce distribuzioe di preseze Suppoiamo che volessimo calcolare la frequeza di ogi sigola osservazioe. I questo caso sarebbe ecessario dividere il umero di volte che compare tale osservazioe per il umero di osservazioi complessive. X 1, X 2,, X i, X f 1, f 2, f i, f Valori argometali Frequeze fi = Ni/N ( i = 1, 2, ) Ovviamete vale la codizioe di ormalizzazioe ella quale la somma di tutte le frequeza di ua distribuzioe è uguale a 1 fi =1 i=1 Il sistema prede così il ome di distribuzioe di frequeze defiedosi (el caso che l argometo sia quatitativo o espresso i forma quatitativa) variabile statistica.

65 Quado le osservazioi ad u feomeo soo molto umerose è opportuo operare dei raggruppameti X 0 X1,, X 1 X 2,, X i-1 Xi, f 1 f 2 f i I questo caso l ampiezza degli itervalli è data dalla seguete formula: dalla quale è possibile calcolare la desità di frequeza: Dx i = X i-1 Xi p i = f i / Dx i 1.1 I cetri di ordie r Rilevato mediate osservazioe u certo feomeo, si sete la ecessità di sitetizzare la distribuzioe (di preseze o frequeze) mediate valori che la caratterizzio e permettao di cofrotarla co distribuzioi di feomei aaloghi osservati i tempi o i luoghi diversi. I particolare risulta ecessario codesare le iformazioi i u uico umero C che esprime la posizioe o tedeza cetrale del feomeo studiato. Per fare ciò è ecessario imporre la codizioe che C sia alla miima distaza possibile dell isieme dei valori argometali teedo coto delle rispettive frequeze. U modo per realizzare tale fuzioe è quello di cercare il miimo rispetto a Cr della fuzioe: z = (i) Xi Cr r f i (1) Così facedo è possibile otteere i cosiddetti cetri di ordie r che per 0,1,2, corrispodoo ai pricipali idici di posizioe. 1.1.1. La media come cetro di ordie 2 I particolare se sostituiamo ad r il valore 2 otteiamo la media. La media di u isieme è u qualsiasi valore compreso tra il miimo e il massimo; è chiaro che si possoo avere molti tipi di medie. Si può chiamare media di ua distribuzioe x 1,, x, rispetto ad ua fuzioe f(x 1,, x ), quella quatità m che sostituita alle x i ella fuzioe lascia ivariato il risultato. I statistica si distiguoo solitamete due tipi di medie: (i) Medie di calcolo (o ferme); soo quelle che soddisfao ad ua codizioe d'ivariaza e che si calcolao teedo coto di tutti i valori della distribuzioe; (ii) Medie di posizioe (o lasche); soo quelle che si calcolao teedo coto solo di alcui valori. Ovviamete la scelta del tipo di media da utilizzare dipede dal problema che si sta esamiado. Nello specifico aalizziamo tre tipi di medie di calcolo (aritmetica, geometrica, armoica) e due tipi di medie di posizioe (mediaa, moda o valore ormale). Si defiisce media aritmetica di più umeri quel valore che, sostituito ai dati, lascia ivariata la loro somma. Idicati co x 1, x 2,, x i umeri dati, per la defiizioe si ha: si ha così la media aritmetica semplice che s'idica ache co. Se i valori di x i hao frequeze diverse, ossia compaioo più volte elle osservazioi, per esempio il valore x 1 ha frequeza f 1, x 2 ha frequeza f 2, la codizioe d'ivariaza della somma diveta:

66 che si chiama media aritmetica poderata perché le frequeze soo ache dette pesi. Se si predoo i cosiderazioe le frequeze relative: e si sostituiscoo tali valori la formula diveta: (2) Si può affermare che la media aritmetica poderata è la somma dei prodotti dei valori x i per le corrispodeti frequeze relative. Per arrivare alla (2) partedo dalla (1) quado r = 2 è possibile far riferimeto alla seguete dimostrazioe z = (i) Xi C 2 2 f i 1 Derivado rispetto a C 2 si trova: z i = - 2 (i) (x i C 2 ) fi = 0 se (i) x i f i = C2 (i) p i C 2 = xi fi che corrispode ad u miimo i quato Z ii = 2 (i) f i = 2>0 Nel caso di ua serie statistica, se ha seso il calcolo dell ammotare complessivo, si applica la media aritmetica semplice; el caso di ua seriazioe si applica la media aritmetica poderata. Per quato si riferisce alle seriazioi co i valori raggruppati i classi, occorre, per ogi classe, calcolare il valore cetrale come semi somma dei valori estremi dell itervallo, salvo che, per ogi classe, l ammotare sia già stato rilevato isieme alla frequeza. Assumedo il valore cetrale, si commette u errore di approssimazioe che si dimostra essere o rilevate se le classi hao piccola ampiezza, ma che è più o meo grave el caso di classi ampie o di classi co frequeze gradi. Osserviamo che spesso il risultato di ua media è u umero o itero; i caso di gradezze misurate da umeri aturali (come persoe, staze) è più coerete arrotodare la media al umero itero più prossimo. Fra le medie di calcolo la media aritmetica (semplice o poderata) è quella più utilizzata ed è u valore medio sigificativo se si vuole determiare u valore che esprima l'equidistribuzioe del feomeo quale, ad esempio, il reddito medio di ua popolazioe, la spesa media per l alimetazioe, l altezza media di u gruppo di giovai della stessa età. La media aritmetica si applica correttamete per determiare il valore cetrale di ua serie co adameto lieare e ache per avere ua misura attedibile di ua serie di misure di ua gradezza geometrica, fisica. Oltre alla media aritmetica abbiamo la media geometrica defiita quel umero G che sostituito ai valori x i lascia ivariato il loro prodotto:

67 Nel caso di valori x i co frequeze o pesi y i, si ha: Dove G rappreseta la media geometrica poderata. Ovviamete o si può calcolare la media geometrica se uo dei valori è zero perché il prodotto sarebbe ullo per qualuque valore assuto dagli altri. Ioltre le x i o possoo essere egative. La media armoica A è quel valore che sostituito ai dati matiee ivariata la somma dei reciproci, i altre parole: che è la media armoica semplice. Se i valori hao frequeze y i diverse, co procedimeto aalogo si perviee alla formula: che esprime la media armoica poderata. La media armoica, semplice o poderata, è eguale al reciproco della media aritmetica, semplice o poderata, dei reciproci. La media armoica si applica quado ha seso calcolare il reciproco dei dati; ad esempio, per determiare il potere di acquisto medio della moeta si calcola il reciproco della media armoica dei prezzi (ricordado che si defiisce potere di acquisto la quatità di merce che si può acquistare co ua data uità di moeta e che il potere di acquisto è il reciproco del prezzo della merce). La media armoica si applica ache per cooscere la velocità media come media armoica della velocità, poiché il reciproco di ua velocità rappreseta il tempo ecessario a percorrere l uità di spazio U valore sitetico si può calcolare i vari modi. Alcui valori medi soddisfao a ua codizioe d'ivariaza di u valore globale e precisamete: la media aritmetica lascia ivariata la somma dei termii, la media geometrica lascia ivariato il prodotto e la media armoica la somma dei reciproci dei termii. Altri valori medi o cosiderao tutti i valori della distribuzioe, ma solo alcui di essi, come la moda, che dà importaza al valore che preseta la maggior frequeza, o come la mediaa, che occupa la posizioe cetrale della distribuzioe. Si usa la media aritmetica per determiare u valore che esprima u cocetto di equi distribuzioe quado, per esempio, si vuole determiare ua media delle spese, dei cosumi, dei redditi, delle temperature. Si applica pure la media aritmetica, per le proprietà dei suoi scarti, per determiare il valore più preciso di ua serie di misure, purché gli errori di misurazioe siao accidetali e o sistematici (i pratica dovuti agli strumeti); ioltre si applica la media aritmetica se i dati si succedoo circa i progressioe aritmetica. La media geometrica è utilizzata per determiare il tasso medio di accrescimeto (o di decremeto) di u feomeo, i tasso d'iteresse medio di più tassi ella capitalizzazioe composta, oppure per determiare ua media ei cambi moetari. La media geometrica si utilizza pure quado i dati si susseguoo i progressioe geometrica. La media armoica è applicata quado si vuole cooscere u valore medio utilizzado i valori reciproci di u altro carattere, come el caso del potere di acquisto della moeta. Ha iteresse determiare la moda o il valore ormale di ua distribuzioe di frequeze, quado è importate cooscere il valore che ha la maggiore probabilità di presetarsi. Ad esempio, l altezza ormale dei giovai di leva è quella che ha maggior frequeza, la composizioe ormale di ua famiglia, ossia il umero di compoeti di ua famiglia, è quella che si preseta co maggior frequeza e la coosceza di

68 tale valore è più sigificativo della media aritmetica. Il valore mediao è il valore cetrale della distribuzioe e risulta idipedete da forti differeze fra i dati. No si può dare ua regola geerale di scelta del tipo di media, ma si deve calcolare più di u valore medio e scegliere quello più iteressate per il problema i esame. Le medie cui si ricorre più frequetemete i pratica soo la media aritmetica, la mediaa e, el caso di distribuzioi di frequeze, il valore modale. 1.1.2 La mediaa come cetro di ordie 1 La mediaa è ua media di posizioe e rappreseta il valore cetrale della distribuzioe quado i dati soo ordiati. Per otteere la mediaa è sufficiete sostituire ad assegare r=1 ella (1) Siao x 1, x 2,, x i valori ordiati i seso o decrescete, si dice mediaa Me il valore che bipartisce la successioe, ossia il valore o iferiore a metà dei valori e o superiore all altra metà. Ordiati i valori, se il umero dei termii è dispari, la mediaa è proprio il valore cetrale; se è pari, si assume come mediaa la semi somma dei due valori cetrali. Il procedimeto sopra esposto si applica per le serie. Per le distribuzioi di frequeze co valori discreti, i dati soo geeralmete già ordiati; occorre allora calcolare le frequeze assolute cumulate, che si ottegoo associado a ogi valore la somma della rispettiva frequeza co tutte quelle che la precedoo, e determiare quale valore corrispode: alla frequeza cumulata, se la somma è pari; alla frequeza cumulata, se la somma è dispari; tale valore è la mediaa. Se i dati soo raggruppati i classi, si determia la classe mediaa mediate le frequeze assolute cumulate. Per otteere esattamete il valore mediao, si applica u'iterpolazioe lieare fra i due valori estremi della classe i cui cade la mediaa, suppoedo che le frequeze siao distribuite ella classe a itervalli regolari. Per il calcolo approssimato i questo caso è utile servirsi del grafico della poligoale delle frequeze relative cumulate. È sufficiete trovare l ascissa del puto di ordiata seguete:, come si può rilevare dal grafico Ioltre, se la distribuzioe è molto asimmetrica, il valore mediao è più appropriato della media aritmetica per esprimere u valore sitetico della distribuzioe 1.1.3 La moda come cetro di ordie 0 Se ella (1) sostituiamo ad r il valore 0 otteiamo la moda La moda o valore ormale (detta ache valore modale o orma ) è u valore caratteristico di ua distribuzioe di frequeze la cui determiazioe o richiede alcu calcolo. Si dice moda o valore ormale di ua distribuzioe di frequeze la modalità o il valore della variabile al quale corrispode la massima frequeza. Se i dati soo raggruppati i classi, il calcolo della moda preseta maggiori difficoltà. Se l ampiezza della classe è costate si dirà classe modale quella che ha la frequeza maggiore. Se le

69 classi hao ampiezza diversa, si divide ogi frequeza per l ampiezza della rispettiva classe e la classe modale è la classe alla quale corrispode il rapporto maggiore. 1.2 Gli idici di dispersioe: scarto quadratico medio e variaza Nel paragrafo precedete si è detto dei cetri di ordie r e i particolare si è parlato della media (elle sue varie forme), mediaa e moda. Occorre ora teere presete u cocetto esseziale della statistica, e cioè che u valore medio, comuque calcolato, o è sufficiete a rappresetare l isieme delle osservazioi effettuate (o l isieme dei valori assuti dalla variabile statistica); è ecessario quidi affiacare ad esso altri idici che siao i grado di forire delle iformazioi sulla dispersioe, i pratica sulla distaza delle varie osservazioi dal valore medio che rappreseta il cetro della distribuzioe. Tato miore è la distaza (o dispersioe) delle osservazioi dal cetro, tato maggiore sarà la rappresetatività e l affidabilità del valore medio. Gli idici di variabilità assumoo valore zero solo se è ulla la variabilità, e tutti i valori xi soo quidi uguali fra loro; all aumetare della variabilità tali idici assumerao valori sempre maggiori. Riassumedo, possiamo affermare che u carattere saliete dei dati statistici è la variabilità. Per aalizzare ua distribuzioe, dopo aver calcolato uo o più valori medi si cerca di evideziare la dispersioe dei dati, dispersioe che caratterizza la variabilità del feomeo. Può iteressare cooscere sia di quato i dati differiscoo da u valore medio, sia di quato i dati differiscoo fra loro. Vi soo vari idici che misurao la variabilità di u feomeo. I particolare ritroviamo la variaza o è altro che la misura della deviazioe dei valori della variabile rispetto alla media. Cosideriamo gli scarti dei valori dalla media aritmetica, ossia le differeze xi-m. Per valutare la maggiore o miore dispersioe dei valori dalla media aritmetica. Abbiamo già visto che la media aritmetica degli scarti è zero e pertato o è sigificativa. Uo degli idici più utilizzato è lo scarto quadratico medio. Si defiisce scarto quadratico medio la media quadratica, semplice o poderata, degli scarti dei valori dalla media aritmetica. Nel caso di serie si ha: Nel caso di seriazioi, dette yi le frequeze, si ha: Lo scarto quadratico medio è tato più piccolo quato più i dati soo prossimi al valore medio ed è uguale a zero se e solo se i dati soo tutti eguali fra loro. Il quadrato dello scarto quadratico medio s ² è detto variaza. Per il calcolo della variaza s ², o dello scarto quadratico medio s, si può utilizzare ua formula che si ottiee co semplici passaggi. La ricaviamo per le serie, otado che ua relazioe aaloga vale per le seriazioi.

70 La variaza è eguale alla differeza fra la media aritmetica semplice o poderata dei quadrati dei valori e il quadrato della media. La variaza è = 0 se e solo se tutti i valori argometali di ua variabile statistica soo uguali fra loro (e quidi uguali alla media). Negli altri casi ivece la variaza è maggiore di 0. Lo scarto quadratico medio è u idice della dispersioe dei dati molto sesibile per misurare l esisteza dei dati che si scostao molto dal valore medio. Lo scarto quadratico medio (o la variaza) soo utilizzati per determiare u modello teorico del feomeo. 2. Le variabili statistiche a due dimesioi: il cocetto di covariaza e correlazioe La variabilità a due dimesioi cosiste ell osservare u feomeo da due differeti puti di vista che origiao due compoeti (x e y). Tali compoeti soo collegati da u isieme di frequeze detto tessuto coettivo. Si hao due casi limite: (i) idipedeza stocastica i cui la coosceza di ua variabile o da assolutamete iformazioi sull altra; (ii) perfetta dipedeza i cui ua variabile determia perfettamete l altra. Il grado di coessioe tra x e y viee misurato co vari idici che sostazialmete soo distaze ormalizzate fra la situazioe osservata e quella teorica di idipedeza stocastica. I particolare è possibile far affidameto alle aalisi di correlazioe che studiao i legami di iterdipedeza tra due variabili e le aalisi di regressioe i cui ua delle due variabili viee cosiderata dipedete dall altra. 2.1. Il mometo doppio cetrale: la covariaza Seza approfodire ulteriormete la questioe alla quale si rimadao ai libri specializzati se oltre a cosiderare il tessuto coettivo di ua variabile doppia, si cosidera ache il tessuto metrico (xi e yj supposte quatitative) è possibile calcolare i mometi doppi cetrali come è la covariaza Ifatti possiamo defiire la Covariaza tra due variabili, x e y è ua misura della loro associazioe lieare. Se a gradi valori di x corrispodoo gradi valori di y allora la correlazioe sarà positiva. Al cotrario, se a gradi valori della variabile x corrispodoo piccoli valori di y (e viceversa, a piccoli valori di x corrispodoo gradi valori di y) la covariaza sarà egativa. La covariaza vale 0 i caso di idipedeza stocastica fra X e Y. cov ( x y) i= 1, = [ x E( x) ][ y E( y) ] i 1 i Dove la media viee defiita dalla seguete E( x) i= = 1 x i 2.2. Il coefficiete di correlazioe Il più importate idice ell ambito della variabilità a due dimesioi è il coefficiete di correlazioe lieare. La correlazioe tra due variabili è calcolata dividedo la covariaza delle due variabili per il prodotto delle rispettive deviazioi stadard. cov ρ = σ σ ( x, y) x y

71 La correlazioe è adimesioale. Esprime il grado di correlazioe tra due variabili i qualuque uità di misura esse siao espresse. Il coefficiete di correlazioe di Pearso ha u valore compreso 1 tra -1 e +1. 2.3. Elemeti di base della teoria della regressioe Siora abbiamo cosiderato le due compoeti di ua variabile doppia; X e Y, sullo stesso piao el seso che si soo cercate relazioi di iterdipedeza fra loro. Co la teoria della regressioe ivece, ua variabile (di solito Y) viee cocepita logicamete come dipedete dall altra che i modo più o meo diretto è chiamata a spiegare la variabilità della prima. U modo per evideziare le evetuali relazioi di dipedeza di Y da X è quello di calcolare le medie delle distribuzioi di Y da X chiamate medie vicolate o codizioate di Y date da: m Y i = Y j p ij / p i X j = Y j p ij / p i j=1 j=1 ( i = 1,2, ) ( j = 1,2,,m) m 3. L utilizzo di excel per il calcolo della statistica descrittiva Solo brevi cei per evideziare le potezialità di excel i campo statistico. Ifatti il software cosete co pochi e semplici passi di calcolare per ua data tabella, ua serie di idici statisti e i particolare: (i) media; (ii) errore stadard; (iii) mediaa; (iv) moda; (v) deviazioe stadard; (vi) variaza campioaria; (vii) curtosi; (viii) asimmetria; (ix) itervallo; (x) miimo; (xi) massimo; (xii) somma; (xiii) coteggio; (xiv) più grade; (xv) più piccolo; (xvi) livello di cofideza. Ua volta aperto il file da sottoporre ad aalisi il procedimeto di selezioe e avvio della procedura è semplicissimo; basta ifatti selezioare dal meù a tedia strumeti la voce Aalisi dati e cliccare due volte sulla voce statistica descrittiva. 1 ρ = 0,0 sigifica che o c è correlazioe ρ = +1,0 sigifica che c è correlazioe perfetta positiva tra le variabili ρ = -1,0 sigifica che c è correlazioe perfetta egativa tra le variabili

72 Media 59,078 Errore stadard 2,080 Mediaa 59,000 Moda 60,000 Deviazioe stadard 22,307 Variaza campioaria 497,599 Curtosi -1,262 Asimmetria 0,122 Itervallo 81,000 Miimo 22,000 Massimo 103,000 Somma 6794,000 Coteggio 115,000 Più grade(1) 103,000 Più piccolo(1) 22,000 Livello di cofideza(95.0% 4,121 Per otteere i dati è ecessario sputare riepilogo statistiche i modo tale che il software calcoli tutti gli idici precedetemete evideziati. Ioltre l utilizzo di Excel è assai utile per la realizzazioe della retta di regressioe. I particolare è possibile realizzare per ogi tabella u grafico a dispersioe, come evidezia l immagie sottostate e, partedo da tale grafico, chiedere ad Excel di realizzare la corrispodete retta di regressioe. La retta di regressioe, opportuamete iserita, cosete ioltre di evideziare l equazioe della retta oché il valore di dipedeza. U valore di R molto alto vuol dire che la dipedeza delle due variabili è molto alta. Oltre ad iserire la liea di tedeza, che Il comado Aggiugi liea di tedeza forisce solamete ua liea che si adatta ai dati, l equazioe di questa liea e il valore R 2. Per otteere ulteriori iformazioi che cosetoo di determiare la relazioe tra due variabili, applichiamo lo strumeto di aalisi Regressioe. Scegliete il comado Aalisi dati dal meu Strumeti. Nella fiestra di dialogo Aalisi dati, scegliete Regressioe dalla lista e fate OK. La fiestra di dialogo regressioe è sopra illustrata. Come è facilmete ituibile Excel forisce tutta ua serie di applicativi, possibilità che, se opportuamete utilizzati, cosetoo di effettuare ed otteere iformazioi utili per il successivo trattameto dei dati.