Analisi delle relazioni tra due caratteri

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Analisi delle relazioni tra due caratteri"

Transcript

1 Analisi delle relazioni tra due caratteri Le misure di connessione misurano il grado di associazione tra due caratteri qualsiasi sotto il profilo statistico (e non causale in quanto non è compito della statistica formulare affermazioni su rapporti di causa-effetto). Se i due caratteri sono entrambi quantitativi, della loro relazione si può anche, oltre che misurare l intensità, definire la forma. In particolare, se il legame manifestato dai due caratteri quantitativi X e Y è di tipo lineare, se ne potrà misurare intensità e segno Fonte: ISTAT, Rapporto

2 Analisi delle relazioni tra due caratteri Nello scatter precedente vengono riportate le spese per ricerca e sviluppo (Y, in ordinata) e il valore aggiunto per addetto nelle regioni italiane (X, in ascissa). Emerge chiaramente un apprezzabile relazione diretta tra le due variabili. (Nello scatter successivo la relazione è, invece, inversa). a) Come misurare questa relazione? b) Cosa significa (e come si ottiene ) la retta che attraversa la nuvola di punti? Due temi da approfondire: a) la correlazione e b) la regressione. 2

3 Analisi delle relazioni tra due caratteri Tra due variabili X e Y esiste correlazione positiva (concordanza) se al crescere di X anche Y, nel complesso, tende a crescere e se al diminuire di X anche Y, nel complesso, tende a diminuire. La correlazione è invece negativa (discordanza) se al diminuire di X la variabile Y, nel complesso, tende a crescere e se al crescere di X, nel complesso, Y tende a diminuire. Se le variabili sono correlate, i punti dello scatter si disporranno secondo un andamento facilmente individuabile: se tale andamento è lineare, si parlerà di correlazione lineare. Y quadrante II y quadrante I y x quadrante III x quadrante IV X 3

4 Classificazione delle coordinate dei punti nei 4 quadranti secondo il segno algebrico Quadrante Segno algebrico I + + II - + III - - IV + - x i y = Y y = Xi x i i Codevianza e Covarianza I prodotti ( Xi X )( Yi Y ) avranno segno positivo per i punti del I e III quadrante e negativo per i punti del II e IV quadrante. La somma dei prodotti è detta codevianza n i = 1 n i = 1 ( Xi X )( Yi Y ) Dividendo per n si ottiene la covarianza ( Xi X )( Yi Y ) n 4

5 Codev (X,Y) >0 prevalgono i prodotti tra scarti di segno uguale: ( + ) ( + ) ( ) ( ) concordanza Codev (X,Y) <0 prevalgono i prodotti tra scarti di segno opposto: ( + ) ( ) ( ) ( + ) discordanza Coefficiente di correlazione lineare Rapportando la codevianza al suo massimo si ottiene il coefficiente r di correlazione lineare di Bravais-Pearson: r = = ( X,Y ) ( X ) Dev ( Y ) ( X,Y ) ( X ) V ( Y ) Codev Dev Co var V E un indicatore simmetrico della relazione lineare tra Y e X 5

6 Il segno algebrico di r dipende solo dalla covarianza e 0 r 1 r = +1 perfetta correlazione lineare positiva tra X e Y r =-1 perfetta correlazione lineare negativa; r = 0 assenza di correlazione lineare: caratteri linearmente indipendenti r = +1 perfetta correlazione lineare positiva tra X e Y; punti empirici tutti allineati su una sola retta ascendente 6

7 r = -1 perfetta correlazione lineare negativa; punti empirici tutti allineati su una sola retta discendente r = 0 assenza di correlazione lineare Caratteri linearmente indipendenti 7

8 Il valore di r è INVARIANTE PER TRASFORMAZIONI LINEARI operate sulle variabili originarie Una variabile X subisce una trasformazione lineare quando: - viene moltiplicata per una costante b (positiva o negativa) - al valore ottenuto viene poi aggiunta un altra costante a (positiva o negativa) La variabile Z, trasformata lineare di X, è quindi definita da: Z= a+ bx Esempio mese X = prezzo del Brent ( barile ) Y= prezzo benzina alla pompa ( litro) 03/ ,13 1,170 06/ ,71 1,209 09/ ,32 1,303 12/ ,00 1,220 03/ ,66 1,253 06/ ,30 1,336 09/ ,48 1,269 12/ ,17 1,219 r = 0,914 Fonte: ENI, Bollettino Studi Energetici 8

9 Esprimiamo ora: - il prezzo del petrolio Brent in lire per litro = Z - il prezzo benzina in lire al netto delle accise = V I valori da utilizzare per la trasformazione lineare sono: - / = 1936,27 - barile =166 litri - accise = 0,564 per litro (non si considera l IVA) Quindi: 1 Z = 1936,27 X = 11,664 X 166 V = 1936,27(Y 0,564) = 1092, ,27 Y nella 1a uguaglianza : a=0 e b=11,664 nella 2a uguaglianza : a= 1092,056 e b=1936,27 La nuova tabella è: mese Z = prezzo del Brent ( lire per litro ) Y= prezzo benzina alla pompa ( lire per litro al netto accise ) 03/ / / / / / / / r = 0,914 (invariato) 9