Regressione & Correlazione

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Regressione & Correlazione"

Transcript

1 Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20

2 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione Covarianza Coefficiente di correlazione lineare Proprietà del coefficiente di correlazione lineare Ranalli M. Dipendenza Settimana # 4 2 / 20

3 Esempio - Introduzione alla regressione Obiettivo: Studiare il legame che intercorre tra due variabili quantitative Y e X. Esempio. 25 famiglie secondo reddito e spesa (dato mensile medio) Il grafico pone in evidenza l esistenza di un legame tra il reddito e la spesa. Ranalli M. Dipendenza Settimana # 4 3 / 20

4 Funzioni Lineari Il legame tra due variabili viene espresso mediante una funzione del tipo y = f (x) Una delle funzioni più semplici è quella lineare y = β 0 + β 1 x Interpretazione β 0 : valore di y per x = 0; β 1 : variazione di y per un aumento unitario di x. Ranalli M. Dipendenza Settimana # 4 4 / 20

5 Modello di regressione lineare semplice Nella realtà due variabili non sono legate da una relazione deterministica, ma statistica del tipo y i = β 0 + β 1 x i + ɛ i con i = 1, 2,..., n. β 0 : intercetta β 1 : coefficiente di regressione (pendenza) y i : variabile risposta (dipendente) x i : variabile esplicativa (indipendente) ɛ i : residuo o errore (riflette le imperfezioni della relazione lineare ed eventuali variabili esplicative omesse) Ranalli M. Dipendenza Settimana # 4 5 / 20

6 Stima dei parametri: metodo dei minimi quadrati Ipotizziamo che il termine residuale sia di minima entità. Determiniamo quindi la retta (ossia β 0 e β 1 ) in modo da rendere minima la somma n (y i β 0 β 1 x i ) 2 Ranalli M. Dipendenza Settimana # 4 6 / 20

7 Soluzione del problema dei minimi quadrati Coefficiente di regressione. n b 1 = (x i µ X )(y i µ Y ) n (x i µ X ) 2 Intercetta. b 0 = µ Y b 1 µ X La retta dei minimi quadrati passa per il baricentro (alla media di x corrisponde la media di y) Fitted value. ŷ i = b 0 + b 1 x i Residuo. ˆɛ i = e i = y i ŷ i Ranalli M. Dipendenza Settimana # 4 7 / 20

8 Esempio Per sette famiglie abbiamo rilevato il reddito x ed il consumo y x i y i sx i = (x i µ X ) sy i = (y i µ Y ) sx i sy i sxi 2 syi Totale µ X = 26 7 = 3.714; µ Y = 22 7 = b 1 = = 0.84 b 0 = = ŷ 1 = = 1.703; e 1 = = Ranalli M. Dipendenza Settimana # 4 8 / 20

9 Adattamento del modello ai dati Varianza totale σy 2 = 1 n (y i µ Y ) 2 n Varianza spiegata σ 2 Ŷ = 1 n (ŷ i µ Y ) 2 n Varianza residua σe 2 = 1 n (y i ŷ i ) 2 = 1 n n n Scomposizione della varianza totale σy 2 = σ2 Ŷ + σ2 e e 2 i Ranalli M. Dipendenza Settimana # 4 9 / 20

10 Coefficiente di determinazione un indice della bontà di adattamento del modello ai dati è dato dal rapporto tra variabilità spiegata dalla regressione e variabilità totale r 2 = σ2 Ŷ σ 2 Y = n (y i ŷ i ) 2 n (y i µ Y ) 2 la decomposizione della devianza totale garantisce che r 2 varia tra 0 (pessimo adattamento) e 1 (ottimo adattamento, la relazione è perfettamente lineare). una formula utile per il calcolo è r 2 = [ n (x i µ X )(y i µ Y )] 2 n (x i µ X ) 2 n (y i µ Y ) 2 Riprendendo lesempio precedente: r = = Ranalli M. Dipendenza Settimana # 4 10 / 20

11 Osservazione & Esempio Importante. Se con la variabile x otteniamo intercetta b 0 e coefficiente b 1, allora con la variabile scarto x µ X otteniamo la diversa intercetta b 0 + b 1 µ X ma lo stesso coefficiente b 1. Esempio. Riprendiamo lesempio precedente e calcoliamo la retta di regressione di y sulla variabile scarto x µ X x i y i sx i = (x i µ X ) sy i = (y i µ Y ) sx i sy i sxi 2 syi Totale µ X = = 0; µ Y = = b 1 = = 0.84 b 0 = = Ranalli M. Dipendenza Settimana # 4 11 / 20

12 Esempio - Introduzione alla correlazione Una distribuzione doppia secondo due variabili quantitative può essere rappresentata graficamente mediante un diagramma di dispersione Esempio. 25 famiglie secondo reddito e spesa (dato mensile medio) È interessante osservare come il grafico pone in evidenza l esistenza di una relazione (di concordanza) tra il reddito e la spesa. Ranalli M. Dipendenza Settimana # 4 12 / 20

13 Osservazione Date due variabili quantitative, diremo che sono correlate positivamente se variano in modo concorde, ossia all aumentare [diminuire] dell una aumenta [diminuisce] anche l altra; correlate negativamente se variano in modo discorde, ossia all aumentare [diminuire] dell una l altra diminuisce [aumenta]; incorrelate se sono indifferenti, ossia non c è regolarità fra le variazioni dell una e dell altra. Osserviamo che due caratteri risultano concordi se gli scarti dalla media tendono ad essere dello stesso segno mentre risultano discordi se tali scarti tendono ad essere di segno opposto. Ranalli M. Dipendenza Settimana # 4 13 / 20

14 Covarianza la covarianza è una misura del legame lineare tra due caratteri quantitativi X e Y. È data dalla media aritmetica del prodotto degli scarti di due caratteri dalle loro rispettive medie σ XY = 1 n n (x i µ X )(y i µ Y ) = n x i y i µ X µ Y n scarti positivi (negativi) di X tendono ad associarsi a scarti positivi (negativi) di Y i loro prodotti saranno positivi e σ XY risulterà positiva scarti positivi di X tendono ad associarsi a scarti negativi di Y (o viceversa) i loro prodotti saranno negativi e σ XY risulterà negativa Minimo e massimo: non è un indice relativo σ X σ Y < σ XY < σ X σ Y Ranalli M. Dipendenza Settimana # 4 14 / 20

15 Il coefficiente di correlazione lineare Al fine di avere un indice relativo, calcoliamo il coefficiente di correlazione lineare. Come? standardizziamo le variabili z xi = x i x σ X, z yi = y i ȳ σ Y costruiamo la variabile prodotto degli scarti standardizzati c i = z xi z yi = x i x σ X y i ȳ σ Y e ne calcoliamo la media aritmetica r = 1 n n c i = 1 n n x i x σ X y i ȳ σ Y Tale media è detta coefficiente di correlazione lineare. Ranalli M. Dipendenza Settimana # 4 15 / 20

16 Proprietà I del coefficiente di correlazione lineare è positivo nel caso di correlazione positiva, negativo nel caso di correlazione negativa e pari a zero nel caso di incorrelazione; ha lo stesso segno del coefficiente di regressione b 1 ; è compreso tra -1 e 1 estremi inclusi; è pari a 1 se i punti sono allineati su di una retta con inclinazione positiva; è pari a -1 se i punti sono allineati su di una retta con inclinazione negativa; si può anche calcolare come r = n (x i x)(y i ȳ) n (x i x) 2 n (y i ȳ) 2 Ranalli M. Dipendenza Settimana # 4 16 / 20

17 Proprietà II del coefficiente di correlazione lineare elevato al quadrato è uguale all indice di determinazione r 2, quindi tanto più vicino è vicino a 1 o -1, quanto più la nuvola dei punti può essere ben interpolata con una retta; non cambia in valore assoluto (i.e. può cambiare solo il segno) se a una delle due variabili viene sommata e/o moltiplicata una costante (una delle variabili è trasformata linearmente). In formule: se X : x 1, x 2,..., x n ; Y : y 1, y 2,..., y n e W : w 1, w 2,..., w n con w i = a + by i, allora r XW = 1 n = 1 n = n n b 1 b n x i x σ X x i x σ X n w i w σ W a + by i a bȳ b σ Y x i x σ X y i ȳ σ Y = b b r XY Ranalli M. Dipendenza Settimana # 4 17 / 20

18 Esempio Calcolo del coefficiente di correlazione lineare x i y i sx i = x i x sy i = y i ȳ sx i sy i sxi 2 syi Totale x = 27 5 = 5.4 ȳ = 39 5 = r = = Ranalli M. Dipendenza Settimana # 4 18 / 20

19 Diversi valori di r Ranalli M. Dipendenza Settimana # 4 19 / 20

20 Osservazioni r coglie solo l esistenza di un legame di tipo lineare; una relazione di causa-effetto implica l esistenza di un legame, non è necessariamente vero il vice versa. Esempio x i y i (x i µ X ) (y i µ Y ) (x i µ X )(y i µ Y ) Totale µ X = 48 8 = 6 e µ Y = 52 8 = 6.5 La correlazione è nulla ma il legame è molto forte Y = 3 + (X 6) 2. Ranalli M. Dipendenza Settimana # 4 20 / 20

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

ESERCITAZIONI N. 3 corso di statistica

ESERCITAZIONI N. 3 corso di statistica ESERCITAZIONI N. 3corso di statistica p. 1/18 ESERCITAZIONI N. 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 3corso di statistica p. 2/18 Introduzione Media e Varianza Covarianza

Dettagli

Indipendenza, Dipendenza e interdipendenza

Indipendenza, Dipendenza e interdipendenza Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili

Dettagli

Correlazione lineare e regressione

Correlazione lineare e regressione 7c e regressione Se i due caratteri sono entrambi quantitativi, X e Y, possiamo studiare la loro correlazione lineare. Prima di tutto cerchiamo di capire di cosa si tratta. Se elenchiamo le N osservazioni

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

ESERCITAZIONI N. 3 corso di statistica

ESERCITAZIONI N. 3 corso di statistica ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente

Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione

Dettagli

La correlazione e la regressione. Antonello Maruotti

La correlazione e la regressione. Antonello Maruotti La correlazioe e la regressioe Atoello Maruotti Outlie 1 Correlazioe 2 Associazioe tra caratteri quatitativi Date due distribuzioi uitarie secodo caratteri quatitativi X e Y x 1 x 2 x y 1 y 2 y associate

Dettagli

Analisi bivariata. Il caso di caratteri quantitativi

Analisi bivariata. Il caso di caratteri quantitativi Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

La regressione lineare semplice

La regressione lineare semplice La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono

Dettagli

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza

Dettagli

Esercitazione III Soluzione

Esercitazione III Soluzione Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

ESERCITAZIONE IV - Soluzioni

ESERCITAZIONE IV - Soluzioni umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

Metodologie Quantitative

Metodologie Quantitative Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione

Dettagli

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA)

Dettagli

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili

Dettagli

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003 19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25

Dettagli

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. S.S.I.S. TOSCANA F.I.M. II anno FUNZIONI DI REGRESSIONE E METODO DEI MINIMI QUADRATI Supponiamo di star conducendo uno studio sulla crescita della radice di mais in funzione del contenuto di saccarosio

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

8. RELAZIONE TRA CARATTERI

8. RELAZIONE TRA CARATTERI UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea in Scienze per l'investigazione e la Sicurezza 8. RELAZIONE TRA CARATTERI REGRESSIONE

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Associazione tra caratteri quantitativi: gli indici di correlazione

Associazione tra caratteri quantitativi: gli indici di correlazione Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa

Dettagli

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 4 1. La seguente tabella riporta la distribuzione

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y 1 Analisi della interdipendenza lineare Quando si analizzano due o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo dettagliato la relazione che emerge dai dati,

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Relazioni Statistiche

Relazioni Statistiche Relazioni Statistiche L analisi congiunta di due o più caratteri è utile per studiare le relazioni tra di essi. Analisi dell associazione Indipendenza Interdipendenza Dipendenza Tipi di relazioni tra caratteri

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

METODO DEI MINIMI QUADRATI

METODO DEI MINIMI QUADRATI METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità

Dettagli

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati: DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione

Dettagli

Esercizi su Regressione e Connessione

Esercizi su Regressione e Connessione Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

STATISTICA. Regressione-2

STATISTICA. Regressione-2 STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante

Dettagli

Lezione 7 Corso di Statistica. Francesco Lagona

Lezione 7 Corso di Statistica. Francesco Lagona Lezione 7 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 12 Outline 1 2 Rette di regressione e correlazione distribuzioni bivariate quantitative consideriamo

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte Metodi Quantitativi per Economia, Finanza e Management Lezione n 4 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla

Dettagli

Fondamenti e metodi analisi empirica nelle scienze sociali

Fondamenti e metodi analisi empirica nelle scienze sociali CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.

Dettagli

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo I due semplici esercizi seguenti hanno l obiettivo di consolidare le nostre nozioni in tema di

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

Corso di formazione per Mathesis

Corso di formazione per Mathesis Statistica descrittiva II (Distribuzioni doppie e relazione tra variabili) 8 Marzo 2017 :: Secondo incontro Formazione Docenti :: Programma Incontro preliminare Statistica e Probabilità a Scuola :: le

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 8 Massimo Guerriero Ettore Benedetti Consegna 1. Implementare delle funzioni che, accettando opportuni parametri in ingresso, risolvano le formule viste

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la

Dettagli

Esercizio 2: voto e ore dedicate allo studio

Esercizio 2: voto e ore dedicate allo studio La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede

Dettagli

docente: J. Mortera/P. Vicard Nome

docente: J. Mortera/P. Vicard Nome A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi

Dettagli

Indici di variabilità ed eterogeneità

Indici di variabilità ed eterogeneità Indici di variabilità ed eterogeneità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università della Basilicata a.a. 011/01

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

Indice di contingenza quadratica media (phi quadro) χ n

Indice di contingenza quadratica media (phi quadro) χ n Indice di contingenza quadratica media (phi quadro) Φ χ n Proprietà L influenza del numero di unità n è eliminata Assume valore 0 se X e Y sono perfettamente indipendenti Pagina Indice di Cramer V min

Dettagli

STATISTICA. Regressione-4 ovvero Macron!

STATISTICA. Regressione-4 ovvero Macron! STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio

Dettagli

Analisi Multivariata Prova intermedia del 20 aprile 2011

Analisi Multivariata Prova intermedia del 20 aprile 2011 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

La dipendenza. Antonello Maruotti

La dipendenza. Antonello Maruotti La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

LA REGRESSIONE LINEARE SEMPLICE

LA REGRESSIONE LINEARE SEMPLICE LA REGRESSIONE LINEARE SEMPLICE Se due variabili X e Y sono tra loro correlate, e sono entrambe su scala a intervalli o rapporti equivalenti, la tecnica statistica della regressione lineare consente di

Dettagli

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze;

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; EsercitazioneII In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; la correlazione; la regressione; introduzione alla probabilità. 1 Esercizio 1 Gli stipendi

Dettagli