Correlazione. Daniela Valenti, Treccani Scuola 1
|
|
|
- Niccolina Cicci
- 9 anni fa
- Visualizzazioni
Transcript
1 Correlazione 1
2 I dati di un indagine per riflettere Cominciamo con i dati di un indagine svolta in una quinta classe di scuola superiore. Dopo l Esame di Stato 12 studenti si sono iscritti a corsi di laurea umanistici e 12 a corsi di laurea scientifici. Gli studenti sono stati seguiti nel loro percorso universitario e si è rilevata la media degli esami sostenuti durante i primi due anni. Le tabelle seguenti mostrano i dati raccolti. 2
3 I dati di un indagine per riflettere 3
4 I dati trattati con un foglio di calcolo Retta di regressione Retta di regressione I due gruppi di dati sono molto diversi 4
5 I dati trattati con un foglio di calcolo Punti sparsi e lontani dalla retta di regressione Punti tutti molto vicini alla retta di regressione C è un indicatore statistico per stabilire quanto i punti sono vicini alla retta di regressione? 5
6 Studi di Galton e Pearson F. Galton, Regno Unito K. Pearson, Regno Unito
7 Il termine correlazione : origini Galton riprende un termine già usato nelle scienze con un largo significato di relazione fra due variabili, in modo che a variazioni di una si accompagnino variazioni dell altra. I lavori di Galton, Pearson e dei successivi ricercatori portano a precisare il significato statistico del termine. F. Galton 7
8 Correlazione: il cammino delle idee Retta di regressione e correlazione lineare Forte correlazione lineare fra le due variabili Variabili non correlate linearmente Lunghe ricerche per trovare un indice di correlazione lineare, cioè un numero adatto a misurare l intensità della correlazione lineare. 8
9 L indice di correlazione lineare r Galton Il numero r è legato alla pendenza m s della retta di regressione, ma anche alla deviazione standard σ X dei dati X e σ Y dei dati Y. r = m s σ X σ Y La formula di Galton sembra snella, ma ogni simbolo sintetizza calcoli che diventano molto lunghi se è grande il numero N di dati: 9
10 L indice di correlazione lineare r Se espando ogni simbolo, ottengo una formula che mostra esplicitamente i calcoli da eseguire a partire dalle N coppie (X, Y) di dati. 10
11 Indice di correlazione lineare r Indice di correlazione di Pearson Il numero r è espresso tramite i dati e le medie M X ed M Y r = k=n k=1 k=n ( x k M x ) y k M y ( ) ( x k M x ) 2 y k M y k=1 k=n k=1 ( ) 2 M X è la media degli N dati X M Y è la media degli N dati Y 11
12 Indice di correlazione lineare e covarianza Indice di correlazione di Pearson Il numero r è espresso tramite i dati e le medie M X ed M Y r = k=n k=1 k=n ( x k M x ) y k M y ( ) ( x k M x ) 2 y k M y k=1 ( ) 2 La covarianza σ xy è un indice di variabilità congiunta che porta a scrivere anche la formula di Pearson in una forma più sintetica. k=n k=1 12
13 Attività 2. Indice di correlazione lineare Dividetevi in gruppi di 2 4 persone. Ad ogni gruppo viene data una scheda di lavoro da completare per studiare e applicare l indice di correlazione lineare. Avete 30 minuti di tempo 13
14 Che cosa abbiamo ottenuto 14
15 Quesiti 1-2 a, b Valori dell indice r 15
16 Valori dell indice r Quesito 3a 16
17 Il linguaggio della statistica r > 0 correlazione positiva Se cresce X, cresce anche Y. r < 0 correlazione negativa Se cresce X, decresce Y. 17
18 Il segno dell indice r r ha lo stesso segno di m s m s = pendenza della retta di regressione s 18
19 Valori dell indice r Quesito 4a 19
20 Il linguaggio della statistica r = 1 Correlazione lineare perfettamente positiva I punti appartengono tutti alla retta di regressione con pendenza m s > 0. r = -1 Correlazione lineare perfettamente negativa I punti appartengono tutti alla retta di regressione con pendenza m s < 0. 20
21 Valori dell indice r Quesito 5a 21
22 Il linguaggio della statistica r = 0 Assenza di correlazione lineare Dati non correlati linearmente 22
23 Correlazione lineare e valori di r 23
24 r = 0 e retta di regressione Quesito 5c Ma ora la retta di regressione s F non è utile a fini statistici, perché r = 0 indica che i punti sono sparsi lontano da s F. 24
25 Regressione e correlazione lineari: come inizio a esaminare dati? Le formule studiate e l uso del computer permettono di esaminare dati anche senza rappresentarli come punti del piano OXY. I calcoli sono svolti rapidamente, ma quando i dati sono molto numerosi, come spesso avviene nelle applicazioni, conviene programmare il computer in modo da: I. Calcolare l indice di correlazione r. II. Stabilire se il valore di r indica una correlazione significativa per l indagine. III. In caso affermativo determinare la retta di regressione. 25
ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio
ITCS Erasmo da Rotterdam Anno Scolastico 014/015 CLASSE 4^ M Costruzioni, ambiente e territorio INDICAZIONI PER IL LAVORO ESTIVO DI MATEMATICA e COMPLEMENTI di MATEMATICA GLI STUDENTI CON IL DEBITO FORMATIVO
Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003
Compito di Statistica del 7/1/2003 I giovani addetti all agricoltura in due diverse regioni sono stati classificati per età; la distribuzione di frequenze congiunta è data dalla tabella seguente Età in
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
Limiti di funzioni I. Limiti per x che tende all infinito
Limiti di funzioni I. Limiti per x che tende all infinito 1 La crescita della popolazione mondiale La crescita della popolazione umana mondiale e il suo impatto sull ambiente: discussioni e studi matematici
SCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
Statistica descrittiva: misure di associazione
Statistica descrittiva: misure di associazione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
Lezione 6 Corso di Statistica. Domenico Cucina
Lezione 6 Corso di Statistica Domenico Cucina Università Roma Tre D. Cucina ([email protected]) 1 / 17 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative
x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
Distribuzioni di Probabilità
Distribuzioni di Probabilità Distribuzioni discrete Distribuzione uniforme discreta Distribuzione di Poisson Distribuzioni continue Distribuzione Uniforme Distribuzione Gamma Distribuzione Esponenziale
Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
Associazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
Tecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.0, 3 dicembre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2015-16
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
Misure di variabilità: Varianza e deviazione standard. Daniela Valenti, Treccani Scuola 1
Misure di variabilità: Varianza e deviazione standard Daniela Valenti, Treccani Scuola 1 Perché la variabilità? Tabelle e grafici sono ingombranti, lunghi da leggere e da riprodurre per analizzare le risposte
Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome
Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 Cognome docente: P. Vicard Nome Al termine di ogni esercizio è lasciato lo spazio per scrivere la soluzione (corredata degli opportuni passaggi). La
Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
1) D0MINIO. Determinare il dominio della funzione f (x) = ln ( x 3 4x 2 3x). Deve essere x 3 4x 2 3x > 0. Ovviamente x 0.
D0MINIO Determinare il dominio della funzione f ln 4 + Deve essere 4 + > 0 Ovviamente 0 Se > 0, 4 + 4 + quindi 0 < < > Se < 0, 4 + 4 4 e, ricordando che < 0, deve essere 4 < 0 dunque 7 < < 0 Il campo di
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
Variabilità e Concentrazione Esercitazione n 02
Variabilità e Concentrazione Esercitazione n 02 ESERCIZIO 1 Nella tabella di seguito sono riportati i dati relativi al tempo necessario a 8 studenti per svolgere un test di valutazione (in ore): Tempo
7. Si confronti la variabilità del carattere età nel gruppo dei maschi ed in quello delle femmine.
Esercizio n. 1 Da un collettivo di 20 individui si è rilevata la seguente distribuzione univariata multipla relativa ai caratteri età, sesso, numero di automobili possedute: unità età sesso n.auto 1 35
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
MODULO 1: EQUAZIONI E DISEQUAZIONI 15 ore 1 quadrimestre
MODULI CLASSE TERZA TEMA ALGEBRA MODULO 1: EQUAZIONI E DISEQUAZIONI 15 ore 1 quadrimestre COMPETENZE: utilizzare le tecniche e le procedure del calcolo aritmetico e algebrico, rappresentandole anche sotto
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
Capacità: Analizzare un problema semplice. Valutare la congruenza dei risultati con i dati e le informazioni iniziali.
MATEMATICA: PROGRAMMAZIONE CLASSE QUINTA LICEO TURISTICO A.S. 2011-2012 A) OBIETTIVI Conoscenze: Le caratteristiche di una funzione lineare in due variabili reali. Gli scopi e i metodi della ricerca operativa.
Geometria analitica di base (seconda parte)
SAPERE Al termine di questo capitolo, avrai appreso: il concetto di luogo geometrico la definizione di funzione quadratica l interpretazione geometrica di un particolare sistema di equazioni di secondo
Rappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice
Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Esercizio 1 Efficacia di un disinfettante I dati della Tabella 1 mostrano i conteggi relativi alla presenza o meno
La regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria [email protected] Il concetto di interpolazione In matematica, e in particolare in
docente: J. Mortera/P. Vicard Nome
A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi
Anno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE TERZA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE
LICEO LAURA BASSI - BOLOGNA Anno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE TERZA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE MATEMATICA ARGOMENTI: DIVISIONE
TRIGONOMETRIA: DISEQUAZIONI TRIGONOMETRICHE
FACOLTÀ DI INGEGNERIA CORSI DI POTENZIAMENTO - MATEMATICA E LOGICA ANNO ACCADEMICO 008-009 ESERCIZI DI TRIGONOMETRIA: DISEQUAZIONI TRIGONOMETRICHE Esercizio : Risolvere la seguente disequazione >. Svolgimento:
Esercitazione III Soluzione
Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato
Test per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA Elementi di statistica medica STATISTICA DESCRITTIVA È quella branca della statistica che ha il fine di descrivere un fenomeno. Deve quindi sintetizzare tramite pochi valori(indici
Esercizi su Regressione e Connessione
Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
Questo simbolo significa che è disponibile una scheda preparata per presentare l esperimento
IL CAMPO ELETTRICO Questo simbolo significa che l esperimento si può realizzare con materiali o strumenti presenti nel nostro laboratorio Questo simbolo significa che l esperimento si può realizzare anche
Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 7 home - indice In base agli arrotondamenti effettuati nei calcoli,
Esercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
LOGARITMI. Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA. L uguaglianza: a x = b
Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA LOGARITMI L uguaglianza: a x = b nella quale a e b rappresentano due numeri reali noti ed x un incognita, è un equazione
Liceo scientifico Pascal Manerbio Esercizi di matematica per le vacanze estive
Di alcuni esercizi non verranno riportati i risultati perché renderebbero inutile lo svolgimento degli stessi. Gli esercizi seguenti risulteranno utili se i calcoli saranno eseguiti mentalmente applicando
Nuovo Ordinamento Esame di Statistica I 24 giugno 2002 Cognome docente: J. Mortera / P. Vicard Nome
Esame di Statistica I 24 giugno 2002 Cognome 1. [12] Da un campione di 100 aziende agricole della provincia di Bologna è stata rilevata la classe di superficie (in migliaia di ettari) ottenendo i seguenti
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Teorema del limite centrale TCL
Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni
Classi: Prime Disciplina: MATEMATICA Ore settimanali previste: 4
Classi: Prime Disciplina: MATEMATICA Ore settimanali previste: 4 MACRO UNITÀ PREREQUISITI TITOLO UNITÀ DI APPRENDIMENTO COMPETENZE ORE PREVISTE PERIODO INSIEMI NUMERICI Conoscenze di base sulle operazioni
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
Indipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
