Correlazione lineare e regressione
|
|
- Floriana Grosso
- 5 anni fa
- Visualizzazioni
Transcript
1 7c e regressione
2 Se i due caratteri sono entrambi quantitativi, X e Y, possiamo studiare la loro correlazione lineare. Prima di tutto cerchiamo di capire di cosa si tratta.
3 Se elenchiamo le N osservazioni secondo la rilevazione congiunta dei due caratteri, otteniamo la cosiddetta serie doppia. Unità X Y 1 x 1 y 1 2. x 2. y 2. i. x i. y i. N x N y N
4 Quindi ad ogni unità statistica viene associata una coppia di valori, grazie alla quale ogni unità può venire rappresentata come un punto in un piano cartesiano con gli assi dedicati ai due caratteri, di coordinate pari ai valori osservati. Il grafico che si ottiene quando tutti i punti sono stati rappresentati in questo modo è detto nube di punti o scatterplot.
5 Pensiamo ad esempio al nostro dataset Altroconsumo e riportiamo la serie doppia dei 283 vini osservati secondo i due caratteri quantitativi Grado (gradazione alcolica misurata, X) e Prezzo(Y).
6 Grado Prezzo
7 Grado Prezzo
8 Grado Prezzo
9
10 L osservazione dello scatteplot è in grado di dirci molto riguardo la relazione che intercorre tra i due caratteri.
11 Poveramente parlando, possiamo dire che tra i due caratteri sussiste correlazione lineare se il loro scatterplot ha approssimativamente la forma di una retta, crescente (correlazione lineare positiva) o descrescente (correlazione lineare negativa).
12 Per definire questo aspetto in termini più precisi, introduciamo il concetto di concordanza tra due caratteri quantitativi. Abbiamo: concordanza negativa se i valori più grandi di un carattere tendono ad associarsi con quelli più piccoli dell altro concordanza positiva se i valori più grandi di un carattere tendono ad associarsi con quelli più grandi dell altro
13 Valutiamo la concordanza utilizzando lo scatterplot Concordanza positiva Concordanza negativa
14 La presenza di concordanza positiva fa sì che i punti siano maggiormente concentrati nel1 enel3 quadrante
15 Valutiamo gli scarti tra i valori e la loro media,nel1 enel3 quadrante. x y i i M(X) M(Y) > > 0 0 x y i i M(X) M(Y) < < 0 0
16 Poichè gli scarti hanno segno concorde, il loro prodotto avrà sempre segno positivo. x y i i M(X) M(Y) > > 0 0 x y i i M(X) M(Y) < < 0 0
17 Poichè gli scarti hanno segno concorde, il loro prodotto avrà sempre segno positivo. [ x M(X) ] [ y M(Y) ] 0 i i > [ x M(X) ] [ y M(Y) ] 0 i i >
18 La presenza di concordanza negativa, invece fa sì che i punti siano maggiormente concentrati nel 2 e nel 4 quadrante
19 Qui gli scarti hanno segno discorde... x y i i M(X) M(Y) < > 0 0 x y i i M(X) M(Y) > < 0 0
20 ... quindi il loro prodotto avrà sempre segno negativo. [ x M(X) ] [ y M(Y) ] 0 i i < [ x M(X) ] [ y M(Y) ] 0 i i <
21 Calcoliamo un indice dato dalla media, per tutte le unità statistiche, del prodotto degli scarti dalla media. Questo indice si chiama covarianzatraxey. cov( X, Y) = N i= 1 [ x M(X) ] [ y M(Y) ] i N i
22 In caso di concordanza positiva la covarianza avrà segno positivo perchè i punti nel 1 e nel 3 quadrante sono la maggioranza. cov( X, Y) = 1 N N [ x ] [ ] i M(X) yi M(Y) i= 1
23 In caso di concordanza negativa la covarianza avrà segno negativo perchè i punti nel 2 e nel 4 quadrante sono la maggioranza. cov( X, Y) = 1 N N [ x ] [ ] i M(X) yi M(Y) i= 1
24 Vediamo il nostro esempio Grado Prezzo M(X) M(Y) = =
25 Vediamo il nostro esempio Grado Prezzo Grado - media Prezzo - media Prodotto degli scarti i= N 1 cov( X, Y) N 1 = N i= [ x M(X) ] [ y M(Y) ] = i i =
26 Per la covarianza esiste anche una formula di calcolo alternativa, meno laboriosa: Cov(X, Y) = N i= 1 x i N y i M(X) M(Y) media aritmetica dei prodotti prodotto delle medie aritmetiche
27 Vediamo il nostro esempio Grado Prezzo Grado Prezzo N i= xi yi = Cov (X,Y) = =
28 Poichè la covarianza ha segno positivo, allora sappiamo che vi è una concordanza positiva.... Ma abbiamo il solito problema: non sappiamo valutare se si tratti di un valore elevato... abbiamo bisogno di rapportarlo a un massimo per ottenere un indicatore standardizzato, facile da interpretare.
29 Disuguaglianza di Cauchy-Schwartz Si può dimostrare che σ σ Cov(X,Y) X Y σ X σ Y quindi abbiamo un massimo per i valori positivi (caso di concordanza positiva) e un minimo per i valori negativi (caso di concordanza negativa)
30 Possiamo quindi ottenere un indice standardizzato detto coefficiente di correlazione lineare ρ ( X,Y) = Cov(X,Y) σ X σ Y
31 Il coefficiente di correlazione lineare: assume valori negativi in caso di correlazione lineare negativa assume valori positivi in caso di correlazione lineare positiva è pari a 0 in caso di assenza di correlazione lineare
32 Un coefficiente di correlazione positivo: assume valori crescenti al crescere dell intensità della correlazione lineare assume al massimo il valore 1 in caso di massima correlazione lineare positiva, che si ha quando i punti dello scatterplot sono tutti esattamente disposti su una retta crescente
33 ρ=0.5 ρ=0.8 ρ=0.95 ρ=1
34 Un coefficiente di correlazione negativo: assume valori decrescenti al crescere dell intensità della correlazione lineare assume al minimo il valore -1 in caso di massima correlazione lineare negativa, che si ha quando i punti dello scatterplot sono tutti esattamente disposti su una retta decrescente
35 ρ=-0.5 ρ=-0.8 ρ=-0.95 ρ=-1
36 Vediamo il nostro esempio: Grado Prezzo Cov(X, Y) σ σ ρ X Y = = ( X,Y) = = tra Prezzo e Grado vi è una correlazione lineare positiva pari al 66.68% del massimo teorico. =
37 Regressione Una volta accertata la presenza di correlazione lineare di un certo grado, potrebbe essere utile formalizzare la relazione dei due caratteri attraverso una funzione matematica. Visto che la correlazione lineare implica una nube di punti dalla forma «simile a una retta», la funzione più ovvia è appunto la retta.
38 Regressione In altre parole vogliamo definire l equazione della retta che meglio sintetizza la nube di punti. Y=a+bX a=? b=?
39 Regressione Abbiamo bisogno di un criterio per decidere, tra le infinite rette che attraversano il piano, quale sia la retta migliore per descrivere la nostra nube di punti.
40 Regressione Prendiamo lo scatterplot del nostro esempio e tracciamo una retta che passa attraverso lanubedipunti.
41 Regressione Per ogni unità statistica, possiamo valutare qual è lo scarto tra il punto ad essa corrispondente e la retta stessa.
42 Regressione Come calcoliamo la lunghezza dei segmenti rossi?
43 Regressione y i ( y a ) i bx i Y=a+bX ŷ i =a+bx i x i
44 Regressione Possiamo effettuare il calcolo per tutte le unità statistiche e sommare tutte le lunghezze ottenute (elevate al quadrato, per evitare le compensazioni di segno). otteniamo una misura di quanto complessivamente la retta «dista» dalla nube di punti. N ( y a bx ) i i i= 1 2
45 Regressione Allora tutto si risolve nel cercare, tra le infinite rette del piano, quella per cui tale «distanza» è minima. Matematicamente parlando, cerchiamo i valori dei parametri a e b che rendono minima questa funzione N ( ) = ( y a bx ) i i Sa,b i= 1 2
46 Regressione Questo modo di calcolare i parametri della retta interpolante si chiama criterio dei minimi quadrati. Si dimostra che secondo questo criterio, i valori ottimali dei due parametri a e b sono dati da bˆ = cov(x, Y) 2 σ X â = M(Y) bˆm(x)
47 Regressione Vediamo il nostro esempio: Grado Prezzo Cov(X, Y) = σ 2 X = M(X) = M(Y) =
48 Regressione Vediamo il nostro esempio: Grado Prezzo bˆ â Y = = = = X =
49 Regressione Vediamo il nostro esempio: Grado Prezzo
50 Regressione A questo punto abbiamo bisogno di un indice che ci informi sulla bontà della retta interpolante, cioè che ci dica se la retta che abbiamo individuato rappresenta bene o malelanubedipunti.
51 Regressione L idea più semplice è quella di utilizzare la stessa funzione dei minimi quadrati che abbiamo minimizzato per trovare i valori ottimalideiparametriaeb. N ( ) = ( y a bx ) i i Sa,b i= 1 2
52 Regressione La funzione dei minimi quadrati, calcolata per i parametri a e b della retta ottimale, cioè â e b, viene chiamata devianza residua, DEV RES. ( ) N ( ) = DEV = y â bˆ x RES i i Sâ,bˆ i= 1 2
53 Regressione Il valore di questafunzioneci dicequantola nostra retta ottimale «dista» complessivamente dalla nube di punti. N ( ) yi â bˆ x i i= 1 rappresenta la somma dei segmenti rossi tratteggiati. 2
54 Regressione Se DEV RES =0 significa che per ogni unità statistica i-esima, abbiamo ( ) y â bˆx 0 i i = quindi per ogni unità statistica il segmento tratteggiato rosso ha lunghezza 0, cioè la retta interpola perfettamente tutti i punti.
55 Regressione Se DEV RES 0 abbiamo il solito problema: non sappiamo valutare quanto è elevato il valore di DEV RES e come al solito abbiamo bisogno di un massimo per ottenere un indice standardizzato. Si dimostra che 0 DEV Nσ RES 2 Y
56 Regressione Quindi possiamo rapportare DEV RES al suo massimo per ottenere un indice che varia tra0e1.però DEV Nσ RES 2 Y vale 0 in caso di perfetto adattamento della retta alla nube vale 1 in caso di pessimo adattamento della retta alla nube
57 Regressione Quindi possiamo rapportare DEV RES al suo massimo per ottenere un indice che varia tra0e1.però DEV Nσ RES 2 Y E controintuitivo!!!
58 Regressione Per questo motivo l indice di adattamento generalmente utilizzato, detto indice di determinazioner 2 sicalcolacome R 2 = 1 DEV Nσ RES 2 Y
59 Regressione L indicedideterminazioner 2 vale 0 in caso di pessimo adattamento della retta alla nube vale 1 in caso di perfetto adattamento della retta alla nube
60 Regressione Vediamo il nostro esempio. Grado Prezzo Grado xi yi a+bxi (yi - a - bxi)^ N i= 1 = ( ) y â bˆx i i 2 =
61 Regressione Vediamo il nostro esempio. 2 DEVRES R = 1 = Nσ 11 Y ( ) = La bontà di adattamento della retta alla nube di punti è pari al 44.47% del massimo teorico.
62 Regressione AltreformuleperR 2 (1) (2) R R 2 = 2 2 bˆ σx 2 σy bˆ σ 2 cov(x, Y) = 2 Y 2 ( 3) R = ρ (X,Y) 2
63 Regressione Una volta definito il modello statistico e verificato che ha un buon adattamento, esso può servire fondamentalmente a due scopi: interpretazione previsione
64 Regressione Dal punto di vista dell interpretazione, la retta ci dice qual è la dinamica di fondo del fenomeno. Nel nostro esempio, abbiamo verificato che esiste una relazione positiva di media intensità tra prezzo del vino e gradazione alcolica e che il prezzo tende ad aumentare inmedia di per ogni grado alcolico in più.
65 Regressione Dal punto di vista della previsione, possiamo spingerci a dare una valutazione di quale può essere il prezzo medio atteso di un vino con una data gradazione alcolica. Ad esempio, per un vino di 14 gradi stimiamo un prezzo medio atteso pari a = 7.56
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliVogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.
S.S.I.S. TOSCANA F.I.M. II anno FUNZIONI DI REGRESSIONE E METODO DEI MINIMI QUADRATI Supponiamo di star conducendo uno studio sulla crescita della radice di mais in funzione del contenuto di saccarosio
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
DettagliEsercizi su Regressione e Connessione
Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni
Dettaglix, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
DettagliIndipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con
DettagliRappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
DettagliMatematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliMETODO DEI MINIMI QUADRATI
Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. Sia f(x) = mx + q, la coppia di dati (x i, y i ) appartiene
DettagliEsercitazione III Soluzione
Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato
DettagliConsideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y
1 Analisi della interdipendenza lineare Quando si analizzano due o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo dettagliato la relazione che emerge dai dati,
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliStatistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliPsicometria con Laboratorio di SPSS 2
Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18
DettagliFacoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B
Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliCorrelazione tra due variabili
Correlazione tra due variabili Federico Plazzi 26 Novembre 2015 Correlazione tra due variabili Correlazione tra due variabili Variabili dipendenti e variabili indipendenti La variabile indipendente è quella
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Dettagli8. RELAZIONE TRA CARATTERI
UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea in Scienze per l'investigazione e la Sicurezza 8. RELAZIONE TRA CARATTERI REGRESSIONE
DettagliCorso di Statistica. Distribuzioni doppie Relazioni tra due variabili. Prof.ssa T. Laureti a.a
Corso di Statistica Distribuzioni doppie Relazioni tra due variabili Prof.ssa T. Laureti a.a. 2013-2014 1 Distribuzione doppia di frequenza Addet ti Genere respons 6 M 6 M 10 F 10 F 7 M 3 M 3 M 6 F 4 F
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N. 3corso di statistica p. 1/18 ESERCITAZIONI N. 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 3corso di statistica p. 2/18 Introduzione Media e Varianza Covarianza
DettagliLezione 7 Corso di Statistica. Domenico Cucina
Lezione 7 Corso di Statistica Domenico Cucina Università Roma Tre D. Cucina (domenico.cucina@uniroma3.it) 1 / 12 obiettivi della lezione comprendere la retta di regressione e le sue proprietà D. Cucina
DettagliCovarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
DettagliAnalisi di regressione: approccio matriciale. Abbiamo rilevato i seguenti caratteri su n = 25
Analisi di regressione: approccio matriciale Abbiamo rilevato i seguenti caratteri su n = 25 unità Y X 1 X 2 X 3 10.98 35.3 20 4 11.13 29.7 20 5 12.51 30.8 23 4 8.40 58.8 20 4 9.27 61.4 21 5 8.73 71.3
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliDISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione
DettagliFondamenti e metodi analisi empirica nelle scienze sociali
CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliEsercitazione 1. 6 Marzo 2019
Esercitazione 1 6 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)
DettagliCorrelazione e regressione per problemi di Luciano Corso
Correlazione e regressione per problemi di Luciano Corso Presidente della sezione di Verona della Mathesis Direttore della Rivista MatematicaMente Email: lcorso@iol.it CASTELLAMMARE DI STABIA 20180717
DettagliStatistica descrittiva in due variabili
1 / 69 Statistica descrittiva in due variabili Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con X = (x 1,...,x N ) Y = (y 1,...,y N ) i valori
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliLaboratorio di Probabilità e Statistica
Laboratorio di Probabilità e Statistica lezione 8 Massimo Guerriero Ettore Benedetti Consegna 1. Implementare delle funzioni che, accettando opportuni parametri in ingresso, risolvano le formule viste
DettagliStatistica 28/10/09 Gruppo H-Z Programma ed esercizi svolti
) Statistica 8/1/9 Gruppo H-Z Programma ed esercizi svolti Coppie ( X, Y di variabili aleatorie (v.a.) X e Y considerate congiuntamente pag. 1 Rappresentazioni grafiche di una coppia ( X, Y ) di v.a. pag.
DettagliSTATISTICA DESCRITTIVA I
- 1 - APPUNTI DI STATISTICA DESCRITTIVA I Corso di Laurea in Informatica voto Numero studenti 18 6 1 8 4 3 10 5 11 6 8 9 9 1 30 9 σ k 1 = ( xi x) ni = n i = 1 k 1 = xi ni n i = 1 ( x ) - - Elementi di
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliAnalisi bivariata. Il caso di caratteri quantitativi
Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma
DettagliCOME SI STUDIANO MOLTISSIME MISURE?
COME SI STUDIANO MOLTISSIME MISURE? Pb1 In una indagine sanitaria si riscontrano i seguenti dati, relativamente ad un certo tipo di infezione batterica: Area immuni a rischio infetti Nord 46 12 25 Centro
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliEsercitazioni di Statistica Dott.ssa Cristina Mollica
Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma.it Regressione Esercizio. Siano dati i seguenti valori per le due variabili X ed Y: 4 5 3 5 3 3 Con riferimento al modello
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliSOLUZIONI. = x x x
. Data la funzione a) scrivi qual è il dominio di f SOLUZIONI f ( b) scrivi quali sono gli intervalli in cui f( risulta positiva e quelli in cui risulta negativa c) determina le eventuali intersezioni
DettagliSOLUZIONI Data la funzione. = x. a) scrivi qual è il dominio di f
. Data la funzione a) scrivi qual è il dominio di f SOLUZIONI f ) ( b) scrivi quali sono gli intervalli in cui f() risulta positiva e quelli in cui risulta negativa c) determina le eventuali intersezioni
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliCorso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica
Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliIl metodo dei minimi quadrati e la retta di regressione
Il metodo dei minimi quadrati e la retta di regressione Dipartimento di Matematica e Informatica Università della Calabria, 8736 Rende (CS), Italia Nuovo Progetto Lauree Scientifiche 3/4/6 Che cos è l
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone
DettagliNuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome
Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 Cognome docente: P. Vicard Nome Al termine di ogni esercizio è lasciato lo spazio per scrivere la soluzione (corredata degli opportuni passaggi). La
DettagliIl metodo dei minimi quadrati. Molto spesso due grandezze fisiche x e y, misurabili direttamente, sono legate tra loro da una legge del tipo:
Il metodo dei minimi quadrati Molto spesso due grandezze fisiche x e y, misurabili direttamente, sono legate tra loro da una legge del tipo: Dove A e B sono costanti y = A + Bx (ad esempio in un moto uniformemente
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliArgomenti della lezione:
Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,
DettagliRelazioni Statistiche
Relazioni Statistiche L analisi congiunta di due o più caratteri è utile per studiare le relazioni tra di essi. Analisi dell associazione Indipendenza Interdipendenza Dipendenza Tipi di relazioni tra caratteri
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliProva d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003
19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25
DettagliLezione 6 Corso di Statistica. Francesco Lagona
Lezione 6 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 19 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative
DettagliINTRODUZIONE ALLA STATISTICA (parte 3)
1 / 1 INTRODUZIONE ALLA STATISTICA (parte 3) A.A.2017/2018 Calcolare le misure di variabilità 2 / 1 In sette città in Canada il 14 gennaio 2006 sono state registrate le seguenti temperature. 12 5 2 2 0
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
DettagliCorso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte
Metodi Quantitativi per Economia, Finanza e Management Lezione n 4 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla
DettagliCorrelazione e regressione
Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliInterpolazione e metodo dei minimi quadrati
A. A. 017-018 Interpolazione e metodo dei minimi quadrati prof. ing. Antonio Comi Department of Enterprise Engineering Tor Vergata University of Rome Relazioni tra variabili Molto spesso si verifica che
DettagliEQUAZIONE DELLA RETTA
EQUAZIONE DELLA RETTA EQUAZIONE DEGLI ASSI L equazione dell asse x è 0. L equazione dell asse y è 0. EQUAZIONE DELLE RETTE PARALLELE AGLI ASSI L equazione di una retta r parallela all asse x è cioè è uguale
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
DettagliLezione 6 Richiami di Geometria Analitica
1 Piano cartesiano Lezione 6 Richiami di Geometria Analitica Consideriamo nel piano due rette perpendicolari che si intersecano in un punto O Consideriamo ciascuna di queste rette come retta orientata
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
Dettagli3) Vengono di nuovo ripetute le misure del punto 2 e i risultati sono s, s, s, s, s, s, s, 96.
Problema A Un pendolo e costituito da una massa di dimensioni trascurabili appesa a un filo considerato in estensibile, di massa trascurabile, lunghezza L, e fissato a un estremo. L Il periodo di oscillazione
DettagliIl punto di intersezione degli assi coordinati prende il nome di origine O degli assi
GEOMETRIA ANALITICA PIANO CARTESIANO Ad ogni punto P del piano corrisponde una coppia di numeri sugli assi cartesiani. La coppia di numeri che indichiamo con (x,) prendono il nome di coordinate cartesiane
DettagliRegressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente
Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione
DettagliCorrezione secondo compitino, testo B
Correzione secondo compitino, testo B 7 aprile 2010 1 Parte 1 Esercizio 1.1. Tra le funzioni del vostro bestiario, le funzioni che più hanno un comportamento simile a quello cercato sono le funzioni esponenziali
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliSettimana 3. G. M. Marchetti. Marzo 2017
Settimana 3 G. M. Marchetti Marzo 2017 1 / 26 Prima parte Relazioni tra variabili e regressione lineare 2 / 26 Una legge fisica approssimata Il fisico scozzese Forbes 3 / 26 L esperimento di Forbes Sulla
Dettagli1 Fit di dati sperimentali: il χ 2. Il metodo dei minimi quadrati.
1 Fit di dati sperimentali: il χ 2. Il metodo dei minimi quadrati. Per comprendere dei fenomeni fisici, non basta raccogliere buoni dati sperimentali, occorre anche interpretarli. Molto spesso lo scopo
Dettagli