Contenuti. Facoltà di Economia. Scatterplot o diagramma a dispersione Analisi grafica della relazione tra due. francesco mola.

Documenti analoghi
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

Sommario. Facoltà di Economia. Generalità sulla variabilità A B C. francesco mola. Lezione n 4. Variabilità e Dispersione. Concetto di variabilità

12/11/2015 STATISTICA 1. Esercitazione 4. Dott.ssa Vera Gurtovaya

L analisi della correlazione lineare

Analisi dei Dati. La statistica è facile!!! Correlazione

Regressione e Correlazione

Caso studio 12. Regressione. Esempio

MEDIA DI Y (ALTEZZA):

Caso studio 10. Dipendenza in media. Esempio

Sommario. Corso di Statistica Facoltà di Economia. Indici Statistici di posizione o locazione Medie (cont.) Moda Mediana. Lezione n 5.

y = α + βx + ε Qui ci soffermeremo su un unica classe di modelli, detti modelli statistici lineari. Si veda la seguente figura:

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

LA REGRESSIONE LINEARE SEMPLICE

Analisi delle distribuzioni doppie: dipendenza

Lezione 4. La Variabilità. Lezione 4 1

Statistica. Maura Mezzetti Sono indipendenti i caratteri X e Y? Y Totale. Totale

Indipendenza in distribuzione

Sommario. Facoltà di Economia. Medie secondo Chisini. Indici statistici di posizione o locazione o di tendenza centrale Medie Moda Mediana Quantile

Quale retta? La retta migliore è quella che più si avvicina all insieme dei 115

Sommario. Facoltà di Economia francesco mola ( ) ( ) Boxplot (grafico a scatola) Esempio riepilogativo sulla forma di una distribuzione

ρ XY risponde alla domanda esiste un associazione lineare tra le variabili X e Y?

INDICI DI VARIABILITA

Ellissi di densità costante. Distribuzione normale multivariata. Ellissoidi di isodensità. Esempio isodensità: X~N 2 (μ,σ) Consideriamo

Variabilità = Informazione

Esercitazione 6 del corso di Statistica (parte 1)

Correlazione. Obiettivo: studiare la dipendenza fra due fenomeni quantitativi

Gli indici sintetici Forma. Gli indici sintetici. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Sommario. Facoltà di Economia francesco mola. Distribuzioni (cont.) Distribuzioni di frequenza. Distribuzioni Distribuzioni di quantità

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Voti Diploma Classico Scientifico Tecn. E Comm Altro

Esercitazione 3 del corso di Statistica (parte 1)

Analisi di regressione con SAS. Ci interessa. Matrice di covarianza. Esempio: due test su 31 individui PROC CORR PROC GPLOT PROC REG

ANALISI DELLA REGRESSIONE ANALISI BIVARIATA DELLA REGRESSIONE

Unità 11. Studio di più variabili. Interpolazione. Regressione. Correlazione. Notazione matriciale

Il termine regressione fu introdotto da Francis Galton ( ), antropologo (promotore dell eugenetica).

Statistica descrittiva Campioni vettoriali

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

Sommario. Corso di Statistica Economia e Commercio. Distribuzioni (cont Distribuzioni di frequenza. Distribuzioni

Elementi di Statistica descrittiva Parte III

Esercitazione 4 del corso di Statistica (parte 1)

Capitolo 6 Gli indici di variabilità

Prof. Massimiliano Giacalone

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Esercitazione 5 del corso di Statistica (parte 1)

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

SECONDA PROVA INTERMEDIA DI STATISTICA CLEA gennaio 2005 COMPITO C2

MISURE DI TENDENZA CENTRALE. Psicometria 1 - Lezione 2 Lucidi presentati a lezione AA 2000/2001 dott. Corrado Caudek

Dott.ssa Marta Di Nicola

La regressione lineare. Rappresentazione analitica delle distribuzioni

Variabili casuali doppie

La Regressione. Y = f ( X ) Le motivazioni che ci spingono alla ricerca di f essenzialmente due: la Previsione ed il Controllo.

Associazione tra due variabili quantitative

pè via che, lì, la media è sempre eguale risurta che te tocca un pollo all'anno: Me spiego: da li conti che se fanno seconno le statistiche d'adesso

dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo K, possiamo affermare che:

I percentili e i quartili

DI IDROLOGIA TECNICA PARTE II

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

Sommario. Facoltà di Economia. Obiettivo. Quando studiarla? Lezione n 7. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

LA REGRESSIONE LINEARE SEMPLICE

Sommario. Corso di Statistica Facoltà di Economia. Test parametrici. Lezione n 26. Francesco Mola

LA FUNZIONE DI VEROSIMIGLIANZA

Analisi statistiche bivariate

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

CENNI DI STATISTICA DESCRITTIVA BIVARIATA DISTRIBUZIONI MARGINALI RETTA DI REGRESSIONE. Angela Donatiello 1

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

valido se i dati E dato da max(x i )-min(x i )

Università degli Studi di Napoli Parthenope. STATISTICA per il Turismo. IV Lezione

LEZIONI DI STATISTICA MEDICA

DATA MINING PER IL MARKETING (63 ore)

Introduzione. Che cosa è la statistica? La statistica è una disciplina che si occupa dell analisi quantitativa dei fenomeni collettivi.

Seconda Prova Parziale di STATISTICA Modalità A

L analisi bivariata. L analisi bivariata. L analisi bivariata. Tabelle di contingenza. Corso di. docente: Cristina Davino. a.a.

Compito A1- Soluzioni

Istogrammi e confronto con la distribuzione normale

Analisi della Dipendenza. Analisi della Dipendenza

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

ESERCITAZIONE NUMERO 4

Anche le rette raccontano

Le modalità con cui si esprime la grandezza Ysaranno:

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini e Leonardo Bertini. Lezione 2:

La media aritmetica. La sua individuazione si basa sulla logica della trasferibilità di un carattere. Se la funzione f( ) corrisponde alla somma:

Analisi Matematica Lezione 30, 4 dicembre 2014 e x2 dx =

Approfondimenti Lezione 3. Mara Bruzzi

Soluzione degli esercizi del capitolo 11

Esercitazioni di Calcolo delle Probabilità (16/12/2011) Soluzioni

Statistica descrittiva

Facoltà di Economia - STATISTICA - Corso di Recupero a.a Prof.ssa G. Balsamo CONCETTI di BASE Carattere X [o A ] i = 1

Elementi di Statistica descrittiva Parte II

7 STIMATORI DI REGRESSIONE LINEARE 7.1 INTRODUZIONE

4 CAMPIONE DI n UNITA STATISTICHE (lettere latine)

Le misure di variabilità

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

Statistica descrittiva per l Estimo

III Esercitazione: Sintesi delle distribuzioni semplici secondo un carattere qualitativo ordinale.

Statistica per le ricerche di mercato. 10. La regressione lineare semplice

PROVA SCRITTA DI STATISTICA (COD ) 4 Febbraio 2004 MODALITÀ A APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE

Transcript:

Coteut Corso d Statstca Facoltà d Ecooma a.a. - fracesco mola Lezoe 9 Correlazoe leare Scatterplot e aals grafca L uso delle varabl stadardzzate La covaraza Il coeffcete d correlazoe leare d Bravas-Pearso Formule alteratve Per dat grezz Per tabelle a doppa etrata co varabl umerche (tabelle d correlazoe Lez9_a.a. - statstca-fracesco mola I caso d varabl quattatve possamo rappresetare grafcamete la varable doppa co uo SCATTER PLOT (dagramma a dspersoe, ube d put, grafco (, Lez9_a.a. - statstca-fracesco mola 3 Scatterplot o dagramma a dspersoe Aals grafca della relazoe tra due varabl umerche osserv. ( ( 6 9 9 3 33 33 4 99.3 5 354 64 6 45 35 7 467.76 8 77 5 9 6 36 58 378.4.. 8 6 4 Scatterplot 3 4 5 Lez9_a.a. - statstca-fracesco mola 4

L uso d varabl stadardzzate Sao e due varabl umerche (o ecessaramete co la stessa scala d msura La stadardzzazoe fa s che abbamo Z( Z( Lez9_a.a. - statstca-fracesco mola 5 Varable stadardzzata,,..., Z Z(, 3 Z ( Z Z( z z 3 z Lez9_a.a. - statstca-fracesco mola 6 3 3 Propretà z ( ( z z ( Lez9_a.a. - statstca-fracesco mola 7 ( Come s stadardzzao dat ( 6 9 9 33 33 99.3 354 64 45 35 467.76 77 5 6 36 Z( Z( Meda,4 Meda 57,5 Varaza 59 Varaza 5346 Sqm 7,67 Z( Z( -,85 -,63 -,96 -,55,9 -,47 -,,7,3,34 -,63 -,95,36,7 -,33 -,7 -,48 -,46 58 378 Sqm 39,74 -,5 -,33 5 57,5 39,74,4 7,67 Lez9_a.a. - statstca-fracesco mola 8

( 4 8 6 4 3 4 5 Z(,5,,5,,5, -,5 -, -,5 -,5,,5,,5,,5 3, -, -,5 Se rappresetamo grafcamete sa le dstrbuzo orgal e che quelle stadardzzate Z( e Z( otamo che la relazoe tra dat o muta ma camba Il cetro d rfermeto (le mede d Z( e Z( soo par a I dat ( ( Z Z 6 -,85 -,63 67.6 9 9 -,96 -,55 85.64 33 33,9 -,47 4.39 99.3 -,,7.74.4 354 64,3,34 49.6 45 35 -,63 -,95 8.5 467.76,36,7.38.976 77 5 -,33 -,7 5.65 6 36 -,48 -,46 6.76 58 378 -,5 -,33 4.884 utle per calcol successv Lez9_a.a. - statstca-fracesco mola 9 Lez9_a.a. - statstca-fracesco mola Aals grafca Il coeffcete d correlazoe leare, 8, 6, 4,,, -,5 -, -,5,,5,,5,,5 -, S defsce come z ( ( z S dmostra che covaraza Lez9_a.a. - statstca-fracesco mola Lez9_a.a. - statstca-fracesco mola

Il coeffcete d correlazoe come espressoe della devaza Cod (, ( ( Cod (, ( ( Formulazo alteratve ( ( ( ( Cod(, ( ( Lez9_a.a. - statstca-fracesco mola 3 Lez9_a.a. - statstca-fracesco mola 4 Propretà d. 3 Il sego d dpede da Se e soo dpedet allora: α β.8 α + β Lez9_a.a. - statstca-fracesco mola 5 Lez9_a.a. - statstca-fracesco mola 6

.3.8 4,5 4 3,5 3 3 4 4 5,5,5,5 Esempo 4 6 3 Esste ua relazoe fuzoale Lez9_a.a. - statstca-fracesco mola 7 Lez9_a.a. - statstca-fracesco mola 8 I calcol ( ( ( ( - 4 - - 3 4 4 4 5 4 - - 6 DEV( Lez9_a.a. - statstca-fracesco mola 9 DEV( COD(, I calcol fao s che Esempo cot. *6 Le varabl soo correlate ma. o soo dpedet. E evdete dall aals grafca che esste ua relazoe fuzoale tra le varabl ma questa relazoe o è d tpo leare! Ma come è possble? Il coeffcete d correlazoe msura la relazoe leare tra varabl e o resce ad tercettare altre relazo! Dcamo qud che:, d Lez9_a.a. - statstca-fracesco mola

Per tabelle a doppa etrata k h ( ( ( ( Lez9_a.a. - statstca-fracesco mola Esempo su dat grezz Calcolare la covaraza e la correlazoe tra caratter e per le osservazo. osserv. ( ( 6 9 9 3 33 33 4 99.3 5 354 64 6 45 35 7 467.76 8 77 5 9 6 36 58 378 Lez9_a.a. - statstca-fracesco mola osserv. Esempo su dat grezz ( ( 6 3.46 4.64 67.6 9 9 3.88.88 85.64 3 33 33 75.59 54.89 4.39 4 99.3 6.68 39.6.74.4 5 354 64 6.56 5.36 49.6 6 45 35 9.575.5 8.5 7 467.76 549.9 8.89.38.976 8 77 5 39.85 3.39 5.65 9 6 36 5.486 5.9 6.76 58 378 59.74 4.964 4.884 Totale.4 5.75.348.589 567.56 4..79 Lez9_a.a. - statstca-fracesco mola 3 Calcolo della covaraza.4,4 5.75 57,5.348.589 34.858,9 (,4 57,5 7.65, 9 34.858,9 Lez9_a.a. - statstca-fracesco mola 4

Calcolo della correlazoe Scatterplot 567.56 56.75,6 4..79 4.7,9 7.65,9 56.75,6,4 4.7,9 57,5 ( (,64.4.. 8 6 4 Scatterplot 3 4 5 Lez9_a.a. - statstca-fracesco mola 5 Lez9_a.a. - statstca-fracesco mola 6 Correlazoe leare tabelle a doppa etrata Data la seguete dstrbuzoe doppa: ( ( - 3 3-55 55-95 >95 Totale 5 9 7 5-3 5 3-4 3 7 4-5 3 5 >5 5 8 Totale 7 3 9 5 Correlazoe leare tabelle a doppa etrata Per l calcolo della covaraza s costrusce la tabella degl elemet 5 45 75 3.68 5. 5. 97.5 5. 7.6 5 5. 6.5 6.5 375. 35 35. 75. 48.75 787.5 45 675. 4.87.8.56 34..884..658.4 Calcolare la covaraza e la correlazoe. Lez9_a.a. - statstca-fracesco mola 7 La somma degl elemet all tero d tale tabella è par a 33.56.4 Lez9_a.a. - statstca-fracesco mola 8

Correlazoe leare tabelle a doppa etrata Calcolo della covaraza Per l calcolo delle mede e delle varaze è utle cosderare la seguete tabella: 5 7.5 7. 5.. 7. 5 5 5 3.5 3.5 6.5 3.5 6.5 8.5 35 7 45 9.45 3.85.5 857.5 8.65.65.65 45 5 75.5 8.5.5..5 56.5 6.87.5.56 8 3.68.48 36.8.577.536.6.88 3.7.664 3.76.64 8.498 5.5 5.5.788 38.87.65 8.498 369,96 5 5.5.4, 5 33.56.4 369,96.4, 5 67.3 385.536 85.687 Lez9_a.a. - statstca-fracesco mola 9 Lez9_a.a. - statstca-fracesco mola 3 Calcolo della correlazoe 5.5.788 369,96 + 5 + 38.87.65.4, 5 85.687 + + ( 3.56 369,96 (.777.445.4, Lez9_a.a. - statstca-fracesco mola 3,54