VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.



Documenti analoghi
MINIMI QUADRATI. REGRESSIONE LINEARE

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Relazioni statistiche: regressione e correlazione

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Grafici delle distribuzioni di frequenza

Slide Cerbara parte1 5. Le distribuzioni teoriche

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

2 + (σ2 - ρσ 1 ) 2 > 0 [da -1 ρ 1] b = (σ ρσ1 σ 2 ) = (σ 1

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

STATISTICA DESCRITTIVA UNIVARIATA

E naturale chiedersi alcune cose sulla media campionaria x n

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Dott.ssa Caterina Gurrieri

Metodi statistici per le ricerche di mercato

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

La distribuzione Normale. La distribuzione Normale

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

1. Distribuzioni campionarie

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE

Prova di autovalutazione Prof. Roberta Siciliano

EQUAZIONI DIFFERENZIALI. 1. Trovare tutte le soluzioni delle equazioni differenziali: (a) x = x 2 log t (d) x = e t x log x (e) y = y2 5y+6

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

Microeconomia, Esercitazione 3 Effetto reddito, sostituzione, variazione compensativa, domanda di mercato, surplus del consumatore.

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Analisi delle relazioni tra due caratteri

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

STATISTICA ESERCITAZIONE 11 Dott. Giuseppe Pandolfo 3 febbraio Modelli continui di probabilità: la v.c. uniforme continua

Elementi di Psicometria con Laboratorio di SPSS 1

SCHEDA DI RECUPERO SUI NUMERI RELATIVI

Basi di matematica per il corso di micro

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Funzioni. Il concetto di funzione nasce da quello di corrispondenza fra grandezze. Tale corrispondenza può essere data in svariati modi:

~ Copyright Ripetizionando - All rights reserved ~ STUDIO DI FUNZIONE

Lezione n. 2 (a cura di Chiara Rossi)

Il concetto di valore medio in generale

Capitolo 12 La regressione lineare semplice

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente:

ESERCIZI DI STATISTICA DESCRITTIVA

Appunti di complementi di matematica

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia

SPC e distribuzione normale con Access

SOLUZIONI D = (-1,+ ).

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

L espressione torna invece sempre vera (quindi la soluzione originale) se cambiamo contemporaneamente il verso: 1 < 0.

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

Analisi di dati di frequenza

Metodi Matematici e Informatici per la Biologia Maggio 2010

Lezione 13 Il mercato e il prezzo

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

u 1 u k che rappresenta formalmente la somma degli infiniti numeri (14.1), ordinati al crescere del loro indice. I numeri u k

Errori di una misura e sua rappresentazione

Elementi di Psicometria con Laboratorio di SPSS 1

Capitolo 13: L offerta dell impresa e il surplus del produttore

FASCI DI RETTE. scrivere la retta in forma esplicita: 2y = 3x + 4 y = 3 2 x 2. scrivere l equazione del fascio di rette:

CONTINUITÀ E DERIVABILITÀ Esercizi proposti. 1. Determinare lim M(sinx) (M(t) denota la mantissa di t)

Temi di Esame a.a Statistica - CLEF

SUCCESSIONI NUMERICHE

Complementi di Termologia. I parte

Il concetto di correlazione

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

MATEMATICA p = 4/6 = 2/3; q = 1-2/3 = 1/3. La risposta corretta è quindi la E).

CRITERI DI CONVERGENZA PER LE SERIE. lim a n = 0. (1) s n+1 = s n + a n+1. (2) CRITERI PER LE SERIE A TERMINI NON NEGATIVI

STATISTICA DESCRITTIVA. Le misure di tendenza centrale

Brugnaro Luca Boscaro Gianni (2009) 1

Misure finanziarie del rendimento: il Van

La categoria «ES» presenta (di solito) gli stessi comandi

Esponenziali elogaritmi

Statistica Applicata all edilizia Lezione 2: Analisi descrittiva dei dati


Misure finanziarie del rendimento: il Van

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

GEOMETRIA DELLE MASSE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

Le scelte del consumatore in condizione di incertezza (cap.5)

La misura degli angoli

Esercizi sulle variabili aleatorie Corso di Probabilità e Inferenza Statistica, anno , Prof. Mortera

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Appunti di Statistica Descrittiva

ESAME DI STATISTICA Nome: Cognome: Matricola:

Dimensione di uno Spazio vettoriale

VARIABILI ALEATORIE CONTINUE

4 Dispense di Matematica per il biennio dell Istituto I.S.I.S. Gaetano Filangieri di Frattamaggiore EQUAZIONI FRATTE E SISTEMI DI EQUAZIONI

l insieme Y è detto codominio (è l insieme di tutti i valori che la funzione può assumere)

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

Scheda n.5: variabili aleatorie e valori medi

2 CERTAMEN NAZIONALE DI PROBABILITA E STATISTICA FELICE FUSATO Fase di Istituto 15 febbraio 2011

Anno 5 4 Funzioni reali. elementari

Rette e curve, piani e superfici

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

Probabilità II Variabili casuali discrete

b. Che cosa succede alla frazione di reddito nazionale che viene risparmiata?

I ricavi ed i costi di produzione

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.

Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : = y

Perché il logaritmo è così importante?

PROBABILITA CONDIZIONALE

Il rischio di un portafoglio

Statistica descrittiva: prime informazioni dai dati sperimentali

Transcript:

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza s = 1 (x i x) 2 = 1 ( xi 2 n x 2 ) Nota che lo scarto quadratico medio è misurato nelle stesse unità delle variabili x i e della loro media x.

UN ALTRA PROPRIETA DELLA VARIANZA CAMPIONARIA Se si somma una costante c a tutti i dati la varianza non cambia. In formule: data una variabile x di taglia n con valori x 1,..,x n si definisce la variabile y con valori y i = x i +c, i = 1,..., n. Sappiamo che ȳ = x+c quindi s 2 y = 1 = 1 (y i ȳ) 2 = 1 (x i x) 2 = sx 2 Utile per fare i calcoli. (x i +c x c) 2

ANCORA UNA PROPRIETA DELLA VARIANZA CAMPIONARIA Si moltiplicano tutti i valori per un numero c 0 e si ottiene la variabile numerica y con valori y i = cx i, i = 1, 2,..., n La media campionaria ȳ = c x e la varianza s 2 y = 1 ( (cx i ) 2 n(c x) 2) = 1 ( c 2 xi 2 n c 2 x 2) = c 2 1 ( x 2 i n x 2) = c 2 s 2 x

RIEPILOGO Data una variabile numerica x di taglia n con valori x 1, x 2,... x n e due numeri non nulli a e b, la variabile numerica y di taglia n con valori y 1 = ax 1 + b, y 2 = ax 2 + b,... y n = ax n + b valgono le seguenti relazioni: ȳ = a x + b, s 2 y = a 2 s 2 x che possono essere direttamente verificate come Esercizio. La seconda relazione può anche essere espressa in termini di scarto quadratico come s y = a s x dove a = a 2 è il modulo (o valore assoluto) di a.

Esercizio di ricapitolazione 1 Si consideri il seguente campione di taglia n = 9: 1 6 5 6 2 5 2 6 3 Si calcoli la mediana, la moda, la media campionaria, la varianza e lo scarto quadratico. La media campionaria è : x = 1 9 ( 1 + 6 + 5 + 6 + 2 + 5 + 2 + 6 + 3 ) = 36 9 = 4 Ordiniamo i dati in ordine crescente 1 2 2 3 5 5 6 6 6 la mediana corrisponde al valore centrale per cui m = x 5 = 5 e la moda corrisponde al valore della classe più numerosa per cui è uguale a 6.

Calcoliamo ora la varianza campionaria s 2 : Usando la formula s 2 = 1 (x i x) 2 otteniamo: s 2 = 1 8 ( 9 + 4 + 4 + 1 + 1 + 1 + 4 + 4 + 4 ) = 32 8 = 4 Usando la formula s 2 = 1 ( xi 2 n x 2) : s 2 = 1 8( 1 + 4 + 4 + 9 + 25 + 25 + 36 + 36 + 36 144 ) = 4 Lo scarto quadratico è semplicemente s = 2.

Esercizio di ricapitolazione 2 Le temperature alle ore 6 del primo gennaio sono state rilevate all Aquila negli ultimi 100 anni. In questo esercizio le temperature sono le variabili x i con i = 1, 2,..., n e n = 100. Dai dati risulta che la temperatura media, calcolata in gradi Celsius, è stata x = 2, 4 con scarto quadratico s x = 4, 4 (si noti che a volte si usa dire che la temperatura è stata di 2, 4 ± 4, 4). Quale è stata la temperatura media e lo scarto quadratico in gradi Fahrenheit? Le temperature y i in gradi Fahrenheit si ottengono dalle temperature x i in gradi Celsius dalla relazione y i = ax i + c con a = 1, 8 e c = 32 (alla pressione di una atmosfera l acqua congela a 32 gradi e bolle a 212 gradi Fahrenheit). Si avrà ȳ = a x + c = 2, 4 1, 8 + 32 = 27, 68 e s y = as x = 4, 4 1, 8 = 7, 92.

COPPIE DI DATI Si possono considerare le due variabili separatamente producendo grafici e indici statistici separatamente per entrambo, ma il problema tipico, in questo caso, è verificare se esiste una dipendenza (correlazione) tra le due variabili. Spesso nell indagine statistica si eseguono analisi di tipo comparativo: si osservano più variabili su un medesimo gruppo di individui. Esempio. Una ragazza vuole acquistare un automobile usata di un certo modello. Rileva in 5 giorni diversi gli annunci sul giornale registrando il numero di anni dell auto (variabile numerica x) e il prezzo in migliaia di euro (variabile numerica y). Anni: x 9 12 8 15 6 Costo: y 18 8 17 7 20

Il primo passo utile per indagare qualitativamente l eventuale dipendenza delle due variabili consiste nel disegnare un grafico detto diagramma di dispersione o scatterplot. Si pongono in ascissa i dati relativi alla variabile x, in ordinata quelli relativi alla variabile y e si rappresentano con punti le singole osservazioni. Se esiste una relazione semplice tra le due variabili, il diagramma dovrebbe evidenziarla. y variabile x In questo esempio (che non è qullo dell auto) sembra che non vi sia una correlazione: i punti sono sparsi senza apparenti regolarità.

Invece nel caso dell auto da acquistare: Anni (x) 9 12 8 15 6 Costo (y) 18 8 17 7 20 22 20 18 16 14 12 10 8 6 4 4 6 8 10 12 14 16 Al crescere degli anni il prezzo diminuisce (non proprio inaspettato!).

COVARIANZA CAMPIONARIA Date n osservazioni congiunte di due variabili x ed y che indichiamo con (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ) il seguente numero si chiama covarianza campionaria delle due variabili s xy = 1 (x i x)(y i ȳ). Se si vuole la somma in forma esplicita si può scrivere: s xy = (x 1 x)(y 1 ȳ) + +(x n x)(y n ȳ).

La covarianza è positiva se dati sono ordinati in modo approssimativamente crescente nello scatter plot, negativa se sono ordinati in modo approssimativamente decrescente. Esempio. Acquisto di un automobile usata. Anni (x) 9 12 8 15 6 Costo (y) 18 8 17 7 20 x = 1 5 ȳ = 1 5 5 x i = 5 y i = 9 + 12 + 8 + 15 + 6 = 10 5 18 + 8 + 17 + 7 + 20 = 14 5

La covarianza è quindi s xy = 1 (x i x)(y i ȳ) = = ( 1)(4) + (2)( 6) + ( 2)(3) + (5)( 7) + ( 4)(6) 4 = 4 12 6 35 24 4 = = 20, 25 = La covarianza è negativa perché i dati sono ordinati in modo approssimativamente decrescente.

UNA PROPRIETÀ DELLA COVARIANZA È facile vericare (stessi passi che abbiamo usato per la varianza) che che implica che (x i x)(y i ȳ) = x i y i n xȳ s xy = 1 (x i x)(y i ȳ) = 1 x i y i n xȳ

ANCORA UNA PROPRIETÀ DELLA COVARIANZA È facile vericare (stessi passi che abbiamo usato per la varianza) che la covarianza di coppie di dati (ax i + c, by i + d), i = 1,, n è uguale a ab s xy Esercizio. Si mostri che la covarianza dei dati che si ottengono da con le trasformazioni lineari Anni (x) 9 12 8 15 6 Costo (y) 18 8 17 7 20 (3x i 18, 2y i 40) è uguale a 3 2 ( 20, 25) = 121, 5

Con le trasformazioni lineari si ottengono le seguenti coppie di dati: 9 18 6 27 0-4 -24-6 -26 0 Le medie sono 12 (prima riga) e 12 (seconda riga). La covarianza è = ( 3)(8) + (6)( 12) + ( 6)(6) + (15)( 14) + ( 12)(12) 4 = = 24 72 36 210 144 4 = 121, 5