Correlazione. Daniela Valenti, Treccani Scuola 1

Documenti analoghi
Statistica 28/10/09 Gruppo H-Z Programma ed esercizi svolti

ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio

Corso di Laurea in MQEGA

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

Matematica Lezione 22

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Corso in Statistica Medica

ESERCITAZIONI N. 3 corso di statistica

Limiti di funzioni I. Limiti per x che tende all infinito

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

SCOPO DELL ANALISI DI CORRELAZIONE

Statistica descrittiva: misure di associazione

Lezione 6 Corso di Statistica. Domenico Cucina

Statistica inferenziale

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

STATISTICA. Esercitazione 5

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

Distribuzioni di Probabilità

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Regressione & Correlazione

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Associazione tra caratteri quantitativi: gli indici di correlazione

Tecniche statistiche di analisi del cambiamento

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Misure di variabilità: Varianza e deviazione standard. Daniela Valenti, Treccani Scuola 1

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

1) D0MINIO. Determinare il dominio della funzione f (x) = ln ( x 3 4x 2 3x). Deve essere x 3 4x 2 3x > 0. Ovviamente x 0.

Lezione 6 Corso di Statistica. Francesco Lagona

Nome: Corso di laurea: 9 o 12 crediti?

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

= = 28,3333 C. x =

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

Variabilità e Concentrazione Esercitazione n 02

7. Si confronti la variabilità del carattere età nel gruppo dei maschi ed in quello delle femmine.

REGRESSIONE E CORRELAZIONE

Statistica descrittiva III

MODULO 1: EQUAZIONI E DISEQUAZIONI 15 ore 1 quadrimestre

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Corso di Laurea in Amministrazione Aziendale Complex Learning. Statistica per l azienda (T) SECS-S/01 a. a. 2017/2018

Capacità: Analizzare un problema semplice. Valutare la congruenza dei risultati con i dati e le informazioni iniziali.

Geometria analitica di base (seconda parte)

Rappresentazioni grafiche di distribuzioni doppie

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice

La regressione lineare. Rappresentazione analitica delle distribuzioni

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Analisi bivariata. Il caso di caratteri quantitativi

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Le caratteristiche della ricerca correlazionale

Esercitazioni di Statistica Dott.ssa Cristina Mollica

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

docente: J. Mortera/P. Vicard Nome

Anno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE TERZA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE

ESERCITAZIONI N. 3 corso di statistica

Fondamenti e metodi analisi empirica nelle scienze sociali

TRIGONOMETRIA: DISEQUAZIONI TRIGONOMETRICHE

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2017/2018

Esercitazione III Soluzione

ISTITUTO Di ISTRUZIONE SUPERIORE. Enrico Mattei

Funzione esponenziale

STATISTICA DESCRITTIVA I

Test per la correlazione lineare

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Esercizi su Regressione e Connessione

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Questo simbolo significa che è disponibile una scheda preparata per presentare l esperimento

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

COME SI STUDIANO MOLTISSIME MISURE?

Statistica descrittiva in due variabili

Correlazione e regressione per problemi di Luciano Corso

i) Si tratta di uno studio di osservazione V F ii) Quale delle seguenti affermazioni è corretta? a b c

lezione 7 AA Paolo Brunori

MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Regressione Lineare Semplice e Correlazione

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Esercizi di statistica

LOGARITMI. Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA. L uguaglianza: a x = b

Corsi di Laurea in Scienze Biologiche Prova scritta di Informatica e Statistica Generale (A). 20/06/2007

Classi: Prime Disciplina: MATEMATICA Ore settimanali previste: 4

Liceo scientifico Pascal Manerbio Esercizi di matematica per le vacanze estive

MATEMATICA CORSO A II COMPITINO (Tema 2) 27 Aprile 2011

REGISTRO DELLE LEZIONI*

Esercizio 2: voto e ore dedicate allo studio

Nuovo Ordinamento Esame di Statistica I 24 giugno 2002 Cognome docente: J. Mortera / P. Vicard Nome

Classi: Prime Disciplina: MATEMATICA Ore settimanali previste: 4

STATISTICA. Esercitazione 6

Esercitazioni di statistica

Correlazione lineare e regressione

1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione

Teorema del limite centrale TCL

Classi: Prime Disciplina: MATEMATICA Ore settimanali previste: 4

Laboratorio di Probabilità e Statistica

Teoria e tecniche dei test. Concetti di base

Indipendenza, Dipendenza e interdipendenza

MATEMATICA CORSO A II COMPITINO (Tema 1) 27 Aprile 2011

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

Transcript:

Correlazione 1

I dati di un indagine per riflettere Cominciamo con i dati di un indagine svolta in una quinta classe di scuola superiore. Dopo l Esame di Stato 12 studenti si sono iscritti a corsi di laurea umanistici e 12 a corsi di laurea scientifici. Gli studenti sono stati seguiti nel loro percorso universitario e si è rilevata la media degli esami sostenuti durante i primi due anni. Le tabelle seguenti mostrano i dati raccolti. 2

I dati di un indagine per riflettere 3

I dati trattati con un foglio di calcolo Retta di regressione Retta di regressione I due gruppi di dati sono molto diversi 4

I dati trattati con un foglio di calcolo Punti sparsi e lontani dalla retta di regressione Punti tutti molto vicini alla retta di regressione C è un indicatore statistico per stabilire quanto i punti sono vicini alla retta di regressione? 5

Studi di Galton e Pearson F. Galton, Regno Unito 1822-1911 K. Pearson, Regno Unito 1857-1936 6

Il termine correlazione : origini Galton riprende un termine già usato nelle scienze con un largo significato di relazione fra due variabili, in modo che a variazioni di una si accompagnino variazioni dell altra. I lavori di Galton, Pearson e dei successivi ricercatori portano a precisare il significato statistico del termine. F. Galton 7

Correlazione: il cammino delle idee Retta di regressione e correlazione lineare Forte correlazione lineare fra le due variabili Variabili non correlate linearmente Lunghe ricerche per trovare un indice di correlazione lineare, cioè un numero adatto a misurare l intensità della correlazione lineare. 8

L indice di correlazione lineare r Galton Il numero r è legato alla pendenza m s della retta di regressione, ma anche alla deviazione standard σ X dei dati X e σ Y dei dati Y. r = m s σ X σ Y La formula di Galton sembra snella, ma ogni simbolo sintetizza calcoli che diventano molto lunghi se è grande il numero N di dati: 9

L indice di correlazione lineare r Se espando ogni simbolo, ottengo una formula che mostra esplicitamente i calcoli da eseguire a partire dalle N coppie (X, Y) di dati. 10

Indice di correlazione lineare r Indice di correlazione di Pearson Il numero r è espresso tramite i dati e le medie M X ed M Y r = k=n k=1 k=n ( x k M x ) y k M y ( ) ( x k M x ) 2 y k M y k=1 k=n k=1 ( ) 2 M X è la media degli N dati X M Y è la media degli N dati Y 11

Indice di correlazione lineare e covarianza Indice di correlazione di Pearson Il numero r è espresso tramite i dati e le medie M X ed M Y r = k=n k=1 k=n ( x k M x ) y k M y ( ) ( x k M x ) 2 y k M y k=1 ( ) 2 La covarianza σ xy è un indice di variabilità congiunta che porta a scrivere anche la formula di Pearson in una forma più sintetica. k=n k=1 12

Attività 2. Indice di correlazione lineare Dividetevi in gruppi di 2 4 persone. Ad ogni gruppo viene data una scheda di lavoro da completare per studiare e applicare l indice di correlazione lineare. Avete 30 minuti di tempo 13

Che cosa abbiamo ottenuto 14

Quesiti 1-2 a, b Valori dell indice r 15

Valori dell indice r Quesito 3a 16

Il linguaggio della statistica r > 0 correlazione positiva Se cresce X, cresce anche Y. r < 0 correlazione negativa Se cresce X, decresce Y. 17

Il segno dell indice r r ha lo stesso segno di m s m s = pendenza della retta di regressione s 18

Valori dell indice r Quesito 4a 19

Il linguaggio della statistica r = 1 Correlazione lineare perfettamente positiva I punti appartengono tutti alla retta di regressione con pendenza m s > 0. r = -1 Correlazione lineare perfettamente negativa I punti appartengono tutti alla retta di regressione con pendenza m s < 0. 20

Valori dell indice r Quesito 5a 21

Il linguaggio della statistica r = 0 Assenza di correlazione lineare Dati non correlati linearmente 22

Correlazione lineare e valori di r 23

r = 0 e retta di regressione Quesito 5c Ma ora la retta di regressione s F non è utile a fini statistici, perché r = 0 indica che i punti sono sparsi lontano da s F. 24

Regressione e correlazione lineari: come inizio a esaminare dati? Le formule studiate e l uso del computer permettono di esaminare dati anche senza rappresentarli come punti del piano OXY. I calcoli sono svolti rapidamente, ma quando i dati sono molto numerosi, come spesso avviene nelle applicazioni, conviene programmare il computer in modo da: I. Calcolare l indice di correlazione r. II. Stabilire se il valore di r indica una correlazione significativa per l indagine. III. In caso affermativo determinare la retta di regressione. 25