REGRESSIONE E CORRELAZIONE

Documenti analoghi
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Esercitazione del

Quadro riassuntivo di geometria analitica

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

SCOPO DELL ANALISI DI CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Associazione tra caratteri quantitativi: gli indici di correlazione

Esercitazione di Statistica Indici di associazione

Esercitazioni di statistica

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

METODO DEI MINIMI QUADRATI

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Alfonso Iodice D Enza

Corso di Psicometria Progredito

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

UNITÀ DIDATTICA 5 LA RETTA

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

La retta di regressione

UNITÀ DIDATTICA 2 LE FUNZIONI

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Anno scolastico 2015/2016 PROGRAMMA SVOLTO. Docente: Catini Romina. Materie: Matematica. Classe : 4 L Indirizzo Scientifico Scienze Applicate

Geometria analitica di base (seconda parte)

RELAZIONE FINALE DEL DOCENTE. Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 3PTVE A. S. 2015/2016

Relazioni statistiche: regressione e correlazione

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Minimi quadrati pesati per la Regressione Lineare

Istituzioni di Statistica e Statistica Economica

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili

Statistica Un Esempio

Elementi di Statistica

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2

Piano cartesiano e retta

EQUAZIONE DELLA RETTA

La retta nel piano cartesiano

PIANO DI STUDIO DELLA DISCIPLINA MATEMATICA e COMPLEMENTI di MATEMATICA

C I R C O N F E R E N Z A...

Condizione di allineamento di tre punti

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

LA RETTA NEL PIANO CARTESIANO

In un triangolo un lato è maggiore della differenza degli altri due, pertanto dal triangolo si ha > dividendo per =1.

PROGRAMMA DI MATEMATICA PER LA CLASSE 2^A DEL LICEO SCIENTIFICO MALPIGHI SEZIONE ASSOCIATA I.I.S

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Capacità: Analizzare un problema semplice. Valutare la congruenza dei risultati con i dati e le informazioni iniziali.

[ RITORNA ALLE DOMANDE] 2) Definisci la parabola come luogo geometrico. 1) Che cos è una conica?

Questionario 1. Sono assegnati i seguenti dati

Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Esempio sulla media geometrica

Statistica descrittiva II

PROGRAMMA di MATEMATICA A. S. 2015/16 PRIVATISTI CLASSE PRIMA Aritmetica: Gli insiemi numerici N, Z, Q con le operazioni e le proprietà.

(x B x A, y B y A ) = (4, 2) ha modulo

Statistica multivariata Donata Rodi 17/10/2016

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Esercitazioni del corso ufficiale di Statistica. Ottobre - Novembre Corso di Laurea in Economia Aziendale. Lezione di Sabato 18 Novembre

Stesso valore medio per distribuzioni diverse

Geometria analitica di base. Equazioni di primo grado nel piano cartesiano Funzioni quadratiche Funzioni a tratti Funzioni di proporzionalità inversa

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Una funzione può essere:

ESERCIZI DI RIEPILOGO 1

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Lezione n. 1 _Complementi di matematica

Appunti: il piano cartesiano. Distanza tra due punti

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

GENETICA QUANTITATIVA

SCHEDA N 8 DEL LABORATORIO DI FISICA

Test per la correlazione lineare

Teoria e tecniche dei test. Concetti di base

STATISTICHE DESCRITTIVE Parte II

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Tema d esame del 15/02/12

Calcolo Algebrico. Primo grado. ax 2 + bx + c = 0. Secondo grado. (a 0) Equazioni e disequazioni in una incognita e coefficienti reali: ax + b = 0

GEOMETRIA ANALITICA 1 IL PIANO CARTESIANO

Transcript:

REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1. Esso prende il nome di regressione se lo scopo è quello di ricercare legami di dipendenza, di correlazione se lo scopo è quello di evidenziare tra le variabili legami di interdipendenza. Se e sono le due variabili statistiche ed, le coppie di valori per esse osservati, riportando i valori in una tabella semplice entrata (composta da due sole colonne) e tracciando il diagramma a dispersione, si può capire il tipo di funzione idonea a rappresentare la distribuzione iniziale. Lo studio della regressione consiste, appunto, nel determinare, con il metodo dei minimi quadrati 2, una funzione, detta funzione di regressione, che ci permetta di valutare le variazioni della al variare della e viceversa. Se la funzione prescelta è la retta si parlerà di regressione lineare. Eventuale assenza di regressione lineare non significa assenza di regressione perché le due variabili potrebbero dipendere secondo una parabola, una iperbole, ecc. RETTE DI REGRESSIONE La retta, specie se i dati sono numerosi, è la funzione matematica più utilizzata per esprimere la dipendenza tra e. Dette: = + e = + le due rette di regressione si determinano, con il metodo dei minimi quadrati, le incognite,,, mediante le formule seguenti: = ; = ; = ; = ; 1 Si definisce variabile statistica un insieme di valori, rilevati per un carattere di tipo quantitativo (altezza, peso, cilindrata di un automobile, numero di vani di un abitazione ecc.) associati ad un insieme di frequenze assolute o relative (si ottengono dividendo ogni frequenza assoluta per il totale delle frequenze). Se i valori sono espressi da singoli numeri, si parla di variabile statistica a carattere discreto, se sono espressi in classi si parla di variabile statistica a carattere continuo. Se al posto dei valori troviamo degli attributi (nomi, anni, ecc.) si parla di mutabile statistica. 2 Il metodo dei minimi quadrati è un procedimento di calcolo approssimato che consente di determinare una funzione rappresentativa di un fenomeno di natura qualsiasi. La funzione si ricava trovando dei parametri,,,, che rendono minima la somma dei quadrati delle differenze tra i valori osservati e quelli teorici.

dove = ed = sono le medie aritmetiche dei valori iniziali ed. Entrambe le rette devono passare per il punto,, baricentro della distribuzione, e possono essere scritte anche nella forma: = = Le differenze = ed = sono gli scarti da ed rispettivamente di ed ; (coefficiente angolare della retta = + ) è detto coefficiente di regressione di rispetto a ed indica di quanto varia al variare di una unità di, mentre (reciproco del coefficiente angolare della retta = + è detto coefficiente di regressione di rispetto a indica di quanto varia al variare di una unità di. Il segno di e è lo stesso e dipende dal numeratore: se e sono entrambi positivi al crescere di la cresce, se e sono entrambi negativi al crescere di la decresce. Le rette = + e = + prendono il nome di rette di regressione di rispetto a e viceversa. La bontà della retta, come funzione di regressione, si può dedurre dall ampiezza dell angolo da esse formate: più l angolo è piccolo e più la funzione lineare rappresenta bene il legame di dipendenza. Casi limite: = cioè = rette coincidenti e regressione lineare ottima; = = rette perpendicolari e regressione nulla. CORRELAZIONE Lo studio della correlazione ha lo scopo di evidenziare tra le variabili statistiche e un legame di interdipendenza, cioè di vedere se esse si influenzano reciprocamente. Si premette alla regressione, perché se e son prive di legame dovranno essere forzatamente indipendenti. La correlazione lineare si misura mediante un numero puro 3 tale che sia 1 1. Si chiama indice di correlazione lineare di Bravais-Pearson ed è dato dal rapporto della covarianza (o varianza congiunta) di e,, ed il prodotto degli scarti quadratici medi di e. 3 Un numero che misura una grandezza adimensionale e, quindi, non seguito dall unità di misura.

= = = = = >0 correlazione diretta o positiva, < 0 correlazione inversa o negativa, = 1 correlazione perfetta positiva, = 1 correlazione perfetta negativa, = 0 assenza di correlazione, 1<<0 rette decrescenti che formano un angolo acuto,mentre 0<<1 rette crescenti formanti un angolo acuto. Elevando entrambi i membri al quadrato abbiamo che: = da cui segue: = ± media geometrica di e. Essa va presa col segno più se e >0, col segno meno se e <0; prende il nome di coefficiente di determinazione, ovviamente è :, ed indica la bontà del modello lineare: più esso è vicino ad più la retta rappresenta bene il legame di dipendenza tra le variabili. Moltiplicando per 100 si ha la percentuale di varianza 4 spiegata,, dalla relazione di dipendenza, mentre il suo complemento a 100 ci dà la percentuale di varianza non spiegata,, da detta relazione ma da altre cause. Più alta è la prima e più il modello lineare va bene. La loro somma fornisce la varianza totale. Risulta: = + = + Dove rappresenta il valore teorico ottenuto sostituendo le iniziali nella retta di regressione = +. Se la funzione non è una retta, per determinare si devono calcolare e il cui rapporto vale: = =. 4 La varianza è un indice di dispersione (come lo è lo scarto quadratico medio o errore standard) che ci dice se la media aritmetica trovata è rappresentativa o no della distribuzione di dati iniziale. Trattasi di una media quadratica, cioè che conserva la somma dei quadrati. Essa è la più grande delle medie. Tra le medie aritmetica, geometrica, armonica e quadratica vale la disuguaglianza seguente: valendo l uguale se i numeri sono uguali.