Analisi dei Dati. La statistica è facile!!! Correlazione

Documenti analoghi
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

Caso studio 12. Regressione. Esempio

MEDIA DI Y (ALTEZZA):

LA REGRESSIONE LINEARE SEMPLICE

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

Variabilità = Informazione

Associazione tra due variabili quantitative

Regressione e Correlazione

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

LEZIONI DI STATISTICA MEDICA

Gli indici sintetici Forma. Gli indici sintetici. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Caso studio 10. Dipendenza in media. Esempio

Il termine regressione fu introdotto da Francis Galton ( ), antropologo (promotore dell eugenetica).

Indipendenza in distribuzione

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Istogrammi e confronto con la distribuzione normale

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

MISURE DI TENDENZA CENTRALE. Psicometria 1 - Lezione 2 Lucidi presentati a lezione AA 2000/2001 dott. Corrado Caudek

Dott.ssa Marta Di Nicola

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

Funzioni di più variabili Massimi e Minimi una funzione definita in un insieme E. Un punto ( x0, y0)

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

Formulario e tavole. Complementi per il corso di Statistica Medica

Lezione 4. La Variabilità. Lezione 4 1

Statistica. Maura Mezzetti Sono indipendenti i caratteri X e Y? Y Totale. Totale

I percentili e i quartili

Un esempio. le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze empiriche.

Capitolo 17. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 17.1: Suggerimento

INDICI DI VARIABILITA

DI IDROLOGIA TECNICA PARTE II

TRATTAMENTO STATISTICO DEI DATI ANALITICI

Classi di reddito % famiglie Fino a Oltre Totale 100

Design of experiments (DOE) e Analisi statistica

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

Caso studio 2. Le medie. Esercizio. La media aritmetica. Esempio

Elementi di Statistica descrittiva Parte III

LE MEDIE. Le Medie. Medie razionali. Medie di posizione

Stima puntuale Quando un parametro della popolazione incognito è valutato (stimato) da una sola statistica (parametro) tratto da un campione

2 si da eguale peso alle misure senza tener conto dell incertezza, che in generale possono essere diverse.

ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.

Variabili casuali ( ) 1 2 n

Il campionamento e l inferenza

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

Analisi della Dipendenza

Università della Calabria

dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo K, possiamo affermare che:

Sommario. Facoltà di Economia. Obiettivo. Quando studiarla? Lezione n 7. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

Consentono di descrivere la variabilità all interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Capitolo 2 Errori di misura: definizioni e trattamento

Laboratorio di Fisica I: laurea in Ottica e Optometria. Misura di una resistenza con il metodo VOLT-AMPEROMETRICO

Statistica descrittiva

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

Esercitazione 5 del corso di Statistica (parte 1)

3 Variabilità. variabilità. Senza deviazione dalla norma il progresso non è possibile. (Frank Zappa) Statistica - 9CFU

Lezione 4. Metodi statistici per il miglioramento della Qualità

Capitolo 6 Gli indici di variabilità

Aritmetica 2016/2017 Esercizi svolti in classe Quarta lezione

Regressione. Modelli statistici. Esempio: le automobili si vendono a peso? Esempio: le automobili si vendono a peso? prezzo=a+b*(peso-500)+errore

DISTRIBUZIONE DI STUDENT

ESERCIZI SU DISTRIBUZIONI CAMPIONARIE

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER ATTRIBUTI

Esercizi su Rappresentazioni di Dati e Statistica

Le misure di variabilità

valido se i dati E dato da max(x i )-min(x i )

Voti Diploma Classico Scientifico Tecn. E Comm Altro

Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso

Il modello di regressione multipla

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in due gruppi

Propagazione di errori

IL MODELLO DI REGRESSIONE LINEARE MULTIPLA

Elementi di Statistica descrittiva Parte II

Statistica descrittiva per l Estimo

Interpolazione. Definizione: per interpolazione si intende la ricerca di una funzione matematica che approssima l andamento di un insieme di punti.

CORSO DI STATISTICA I (Prof.ssa S. Terzi) 1 STUDIO DELLE DISTRIBUZIONI SEMPLICI. Esercitazione n 3

= = stimatori degli indici statistici di variabilità. Definizione della varianza campionaria. Definizione dello scarto quadratico medio.

CAPITOLO XI STIMA DEI PARAMETRI DI UNA VARIABILE ALEATORIA.

x... Gli indici sintetici La media aritmetica Gli indici sintetici Indici assoluti Indici relativi Indici normalizzati Forma

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in

STATISTICA DESCRITTIVA modulo 1 Corso di Laurea SMID Elda Guala e Ivano Repetto Dipartimento di Matematica - Università degli Studi di Genova

Modelli di accumulo del danno dovuto a carichi ciclici

Appunti di. Elaborazione dei dati sperimentali

Statistica per le ricerche di mercato. 10. La regressione lineare semplice

frazione 1 n dell ammontare complessivo del carattere A x

Lezione 3. Gruppi risolubili.

corrispondenza della generica i-esima modalità. Indicando con #(.) la cardinalità di un insieme, per esse si ha, rispettivamente:

Generalmente sia l ampiezza che il valore medio della sollecitazione sono variabili nel tempo.

Matematica elementare art.1 di Raimondo Valeri

III Esercitazione: Sintesi delle distribuzioni semplici secondo un carattere qualitativo ordinale.

Modello dinamico nello spazio dei giunti: relazione tra le coppie di attuazione ai giunti ed il moto della struttura

COMPLEMENTI DI STATISTICA. L. Greco, S. Naddeo

STATISTICA DESCRITTIVA

Variabili casuali. Esempio. Variabili casuali discrete. W discreto. W continuo. V.C. discreta. V.C. discreta o continua


CONFRONTI TRA RETTE, CALCOLO DELLA RETTA CON Y RIPETUTE, CON VERIFICA DI LINEARITA E INTRODUZIONE ALLA REGRESSIONE LINEARE MULTIPLA

Analisi di dati vettoriali. Direzioni e orientazioni

Vogliamo ora riprendere i concetti principali per poi applicarli a qualche esempio concreto.

Transcript:

Aals de Dat La statstca è facle!!! Correlazoe

A che serve la correlazoe? Mettere evdeza la relazoe esstete tra due varabl stablre l tpo d relazoe stablre l grado d tale relazoe stablre la drezoe d tale relazoe Esemp: età e peso tempo esecuzoe e umero d error Stress e stom pscosomatc

Esempo Abbamo 6 soggett cu chedamo la loro tezoe d eserctars all uso del computer durate la settmaa successva; oltre chedamo loro se pesao sa dffcle eserctars al computer. Voglamo verfcare se esste ua relazoe fra tezoe e percezo d cotrollo. Sogg. I(x) C(y) 1 3 5 6 4 3 6 5 4 3 3 5 6 6 6 6 8 3

Esempo Y Cotrollo Puto = coppa d valor Coordate I=x C=y 3 5 6 4 6 5 3 3 6 6 6 8 Varable x: Itezoe Varable y: Cotrollo Itezoe y= f (x) 4 X

Correlazoe Y La ube de put s svluppa secodo ua retta Relazoe d tpo leare 5 X

Correlazoe Y M y M x Come fare per stetzzare? Calcolare l puto le cu coordate soo le mede 6 X

Correlazoe Y M y M x Msurare dspersoe della ube d put Devazoe stadard d x e y 7 X

Correlazoe COVARIANZA: Msura del grado d assocazoe d due varabl Cov xy x M x y M y può assumere valor postv e egatv quado è 0 x e y soo dpedet aumeta al crescere del grado d dpedeza tra x e y Lmte: msura relatva, dpede dall utà d msura delle varabl 8

Correlazoe Il coeffcete d correlazoe r d Pearso costtusce u dce della botà d adattameto della retta, otteuta co l metodo de mm quadrat, a dat compoar. Il coeffcete è ua sorta d covaraza stadardzzata r 1 1 r Il coeffcete r d Pearso Msura: la forza della relazoe l valore; la drezoe della relazoe l sego z x 9 z y 1 MEDIA de prodott de putegg x e y stadardzzat

CORRELAZIONE Il coeffcete d correlazoe r (d Bravas-Pearso o prodottomometo) costtusce u dce della botà d adattameto della retta, otteuta co l metodo de mm quadrat, a dat campoar Attezoe! Può essere usato solo co varabl msurate almeo a scala tervall 10

CORRELAZIONE l coeffcete d correlazoe può essere calcolato attraverso vare formule, equvalet alla precedete rxy z N z X Y r XY X M Ns X X Y s Y M Y r N X N X Y X N X Y Y Y Questa è la formula pù coveete da usare ella maggor parte degl esercz 11

Correlazoe r xy r xy x S xy S x S y r xy M x S 1 x y S y zx z r = covaraza stadardzzata, rapporto tra la covaraza S xy e le devazo stadard S x e S y è dpedete dall utà d msura d x e y M y y

Correlazoe Msura: la forza della relazoe l valore la drezoe della relazoe l sego 1 r 1 r =-.80 r = 0 r =.80 13

Iterpretazoe (a aso) della correlazoe se r = 1 relazoe leare perfetta se r = 0 asseza d relazoe leare se r<.0 relazoe molto debole se.0 <r<.40 relazoe moderata se.40 <r<.60 relazoe abbastaza forte se r>.60 relazoe forte 14

Esemp Y Y RELAZIONE LINEARE NEGATIVA DEBOLE RELAZIONE LINEARE POSITIVA FORTE X X 15

Esemp Y Y ASSENZA DI RELAZIONE LINEARE ASSENZA DI RELAZIONE X X 16

Esempo =6 r 1 x x 1 1 x y 1 1 x 1 y y 1 y Sogg. I(x) C(y) xy x y 1 3 5 15 9 5 6 4 4 36 16 3 6 5 30 36 5 4 3 3 9 9 9 5 6 6 36 36 36 6 6 8 48 36 64 30 31 16 16 175 x) y) 900 961 Utlzzate sempre questo geere d tabella per calcolare la r d Pearso!!! r 4 80.05.5 17

Rassumedo Trasformazoe utà stadard: s perdoo le utà d msura orgal d og varable r : umero dpedete dall utà d msura. Cambameto orde della varabl o determa cambameto del coeffcete d correlazoe (r = meda de prodott delle varabl stadardzzate); altre parole, la correlazoe o c dce ulla sulla drezoe dell effetto. 18

Correlazoe Verfca potes Come posso valutare se la relazoe stetzzata tramte l coeffcete d correlazoe è sgfcatva, coè dversa da zero? Verfca dell potes su (rho) Rho = (parametro ella popolazoe corrspodete alla statstca r) L potes vee verfcata trasformado la r ua t Soo ache dspobl de valor crtc del coeffcete r (per pccol campo), ma solo per potes moodrezoal. Qud usare t è ua scelta spesso pù comoda e geerale 19

Correlazoe Verfca potes Calcolo l t a partre dal valore d r trovato attraverso dat campoar: t r 1 r 0

Correlazoe Verfca potes S defsce l potes: H 0 : =0 H 1 : 0, oppure H 1 : > 0, o < 0 S fssa S calcolao gdl gdl S delea la regoe d rfuto d H 0 trovado u sulla Tavola t crtco 1

Correlazoe Verfca potes t t crtco Decsoe: Accetto H 0 L potes d u asseza d relazoe ( =0) è probablmete vera la relazoe tra le due varabl o è sgfcatva. t t crtco Decsoe: Rfuto H 0 L potes d u asseza d relazoe ( =0) è probablmete falsa la relazoe tra le due varabl è sgfcatva.

Correlazoe Verfca potes Dall esempo precedete: r =.5 S defsce l potes: H 0 : =0 H 1 : 0 S fssa =.05 S calcolao gdl gdl 6 4 3

Correlazoe Verfca potes S delea la regoe d rfuto d H 0, rtraccado l valore crtco d t : 4

Correlazoe Verfca potes Calcolo l t a partre dal valore d r trovato attraverso dat campoar: t.5 6 1.5 1. Decsoe: 1. <.78 Accetto H 0 L potes d u asseza d relazoe ( =0) è probablmete vera o ho elemet per pesare essta ua relazoe tra le due varabl, la relazoe o è sgfcatva. 5

Correlazoe Idagare la relazoe esstete tra due varabl sgfca: A) stablre l essteza d ua relazoe la verfca dell potes sul valore del coeffcete d correlazoe otteuto attesta la preseza o meo d ua relazoe LINEARE sgfcatva B) stablre l grado (testà o strettezza) d tale relazoe l valore del coeffcete d correlazoe dca la forza della relazoe LINEARE (ad esempo: valor d r attoro a.70 dcao ua relazoe molto forte, attoro a.0 debole) C) stablre la drezoe della relazoe l sego del coeffcete d correlazoe dca la drezoe della relazoe LINEARE (ad esempo, se r è postvo dca che al crescere d X cresce Y) 6

Correlazoe Per terpretare la correlazoe dobbamo chederc: 1. La relazoe è dversa da zero?. Qual è l verso della relazoe? 3. Quato è forte la relazoe? I base alle rsposte a queste domade terpretamo l rsultato. 7

Eserczo Abbamo sommstrato ad u campoe d se dvdu due scale per la msura dell asa. I dat soo: Sogg. A B C D E F Asa 1 1 3 4 6 7 9 Asa 4 4 5 7 Le due msure d asa soo coverget ( =.005)? 8

Eserczo Trascrvere dat ell apposta tabella che semplfca calcol! Sogg. x y x y x y 1 1 1 4 3 6 9 4 3 4 4 16 16 16 4 6 4 4 36 16 5 7 5 35 49 5 6 9 7 63 81 49 30 4 146 19 114 r 1 x x y 1 x 1 1 1 x 1 y y 1 y r [619 6146 30 30 4 ][6114 4 ].95 9

Eserczo Il coeffcete è sgfcatvo? N = 6 =.005; potes moodrezoale Gdl = N = 6 = 4 r. 95 30

Valore crtco (.005, moodrezoale): t crt = 4.604 Eserczo t r t.95 6. 13 1 r 1 6.95 Decsoe: 6.13 > 4.604 Rfuto H 0 Sotto l ombrello dell potes ulla ( = 0), otteere ua correlazoe come quella da o osservata è u eveto estremamete raro ( p <.005); qud rtego pù plausble l potes alteratva che stablsce ua relazoe postva fra le due msure d Asa. Le due msure d asa covergoo modo sstematco e sgfcatvo. 31