Università di Napoli Federico II cristina.tortora@unina.it
Standardizzare una variabile Standardizzazione Data una variabile X distribuita secondo una media µ e una varianza σ 2 la standardizzazione permette di ottenere una variabile Z di media 0 e varianza 1. Z = X µ σ Per calcolare la media con R si usa il comando mean(nome variabile). Per calcolare la varianza con R si usa il comando var(nome variabile). N.B. per standardizzare è necessario dividere per lo scarto quadratico medio, la radice quadrata si calcola con il comando sqrt(nome variabile).
Esercizio 1 Standardizzazione Caricare il dataset trees; standardizzare le variabili altezza e circonferenza (Height and Girth); verificare che le variabili ottenute siano standardizzate.
Standardizzare una matrice Ogni variabile ha una propria media e una propria varianza. Per standardizzare una matrice bisogna: Calcolare le medie di ogni variabile; creare una matrice di medie; sottrarre le medie a dati; calcolare lo scarto quadratico medio di ogni variabile; creare una matrice con gli scari quadratici medi; dividere i dati centrati per la varianza. Esercizio 2 Standardizzare la matrice trees In R esiste un comando che standardizza la matrice: scale(nome variabile)
Standardizzare una matrice Ogni variabile ha una propria media e una propria varianza. Per standardizzare una matrice bisogna: Calcolare le medie di ogni variabile; creare una matrice di medie; sottrarre le medie a dati; calcolare lo scarto quadratico medio di ogni variabile; creare una matrice con gli scari quadratici medi; dividere i dati centrati per la varianza. Esercizio 2 Standardizzare la matrice trees In R esiste un comando che standardizza la matrice: scale(nome variabile)
Standardizzare una matrice Ogni variabile ha una propria media e una propria varianza. Per standardizzare una matrice bisogna: Calcolare le medie di ogni variabile; creare una matrice di medie; sottrarre le medie a dati; calcolare lo scarto quadratico medio di ogni variabile; creare una matrice con gli scari quadratici medi; dividere i dati centrati per la varianza. Esercizio 2 Standardizzare la matrice trees In R esiste un comando che standardizza la matrice: scale(nome variabile)
Matrice di varianza e covarianza La matrice di varianza e covarianza è uguale al prodotto X X x ij = y ij ȳ j. n 1 Se standardizzo Y: x ij = y ij ȳ j σ n 1 la matrice X X coincide con la matrice di correlazione Per usare l algebra matriciale su un dataset è necessario trasformarlo con il comando matrix=as.matrix(nome datase) Esercizio 3 Calcolare la matrice di varianza e covarianza e la matrice di correlazione del dataset trees
Matrice di varianza e covarianza La matrice di varianza e covarianza è uguale al prodotto X X x ij = y ij ȳ j. n 1 Se standardizzo Y: x ij = y ij ȳ j σ n 1 la matrice X X coincide con la matrice di correlazione Per usare l algebra matriciale su un dataset è necessario trasformarlo con il comando matrix=as.matrix(nome datase) Esercizio 3 Calcolare la matrice di varianza e covarianza e la matrice di correlazione del dataset trees
Matrice di varianza e covarianza La matrice di varianza e covarianza è uguale al prodotto X X x ij = y ij ȳ j. n 1 Se standardizzo Y: x ij = y ij ȳ j σ n 1 la matrice X X coincide con la matrice di correlazione Per usare l algebra matriciale su un dataset è necessario trasformarlo con il comando matrix=as.matrix(nome datase) Esercizio 3 Calcolare la matrice di varianza e covarianza e la matrice di correlazione del dataset trees
Matrice di varianza e covarianza La matrice di varianza e covarianza è uguale al prodotto X X x ij = y ij ȳ j. n 1 Se standardizzo Y: x ij = y ij ȳ j σ n 1 la matrice X X coincide con la matrice di correlazione Per usare l algebra matriciale su un dataset è necessario trasformarlo con il comando matrix=as.matrix(nome datase) Esercizio 3 Calcolare la matrice di varianza e covarianza e la matrice di correlazione del dataset trees
Definizione Data una matrice A: x è un autovettore di A e λ è un autovalore di A se: Ax = λx In R per calcolare autovalori e autovettori si usa il comando: eigen(nome matrice).
Esercizio 4 Standardizzazione Calcolare autovalori e autovettori della matrice V di varianza e covarianza del dataset trees. Verificare che l equazione Vx = λx è verificata. Calcolare gli autovatori della trasposta di V. Calcolare la traccia di V e verificare che sia uguale alla somma degli autovalori. Calcolare il determinante di V e verificare che sia uguale al prodotto degli autovalori.