ESERCIZI CORRELAZIONE
|
|
|
- Oliviero Ceccarelli
- 9 anni fa
- Visualizzazioni
Transcript
1 ESERCIZI CORRELAZIONE Marco Riani Es: 6 famiglie, ammontare della spesa annua (in euro) per l acquisto di due generi di largo consumo: latte fresco e biscotti. Famiglia Spesa annua per l acquisto di latte fresco ( ) A B C D E F Spesa annua per l acquisto di biscotti ( ) M(x)= M(y)= (i) r xy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra r xy e diagramma di dispersione (v) Perché r xy invece della retta di regressione? 1
2 Soluzione r xy n i1 ( x n n 2 ( xi M x) i1 i1 i M )( y M x i ( y M i y ) 1/ 2 2 y ) Fami glia A B C D E F Tot. (x i M x ) (y i M y ) (x i -M x ) (y i -M y ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) r xy (x i -M x ) 2 (y i -M y ) 2 ( ) 2 ( ) 2 ( ) 2 ( ) / Diagramma di dispersione 2
3 Diagramma di dispersione in termini di scostamenti dalla media Analisi del diagramma di dispersione Il punto C è un valore anomalo bivariato Se cancelliamo il punto C ci attendiamo che il valore di r xy aumenti r xy senza il punto C è uguale a
4 CORRELAZIONE FRA DUE S.S. Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount Calcolare e commentare r XY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile Anni X Y CORRELAZIONE FRA DUE S.S. Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount Calcolare e r XY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile r xy Anni X Y COV ( X, Y) ,36 0,933 (27.300,88705,42) x Correlazione spuria relazione tra i livelli y 4
5 NI base mobile X (numero di extracomunitari) e Y (numero di discount Anni n. i. base mobile n. i. base mobile Var % X Var % Y Scost media X Scost media Y ,38 216,67 18,38 116,67-0,34 68, ,97 148,46 11,97 48,46-6,75-0, ,22 120,62 42,22 20,62 23,50-27, ,31 108,38 2,31 8,38-16,41-40,16 Media 118,72 148,53 18,72 48,53 0,00 0,00 Var 0,0217 0,1758 0,0217 0,1758 Cov(Nix,NIy)=- 0, r xy (tra n. i. a base mobile) =-0,000496/(0,0217*0,1758) ½ = -0,008 Osservazioni finali Non esiste relazione lineare tra le variazioni annue di X e Y Si ottiene r xy = -0,008 anche effettuando il calcolo sulle variazioni % rispetto all anno precedente (proprietà di invarianza per trasformazioni lineari crescenti) 5
6 X = PREZZI (in euro) Y = QUANTITA VENDUTE (in n. di pezzi) Calcolare rxy sui dati originali, sui NI a base fissa e sulle variazioni percentuali. Commentare i risultati Anni X Y v(x) % v(y)% , , , , , ,1 +6, , ,8 +0, , ,0 +8, , ,0 +8,7 Esempio di regressione spuria X = PREZZI (in euro) Y = QUANTITA VENDUTE (in n. di pezzi) Anni X Y v(x) % v(y)% , , , , , ,1 +6, , ,8 +0, , ,0 +8, , ,0 +8,7 6
7 Coefficiente di correlazione Calcolato sui livelli r xy = 0,97 Calcolato sulle variazioni percentuali r v(x)v(y) = -0,998 Es. X= tasso di indebitamento delle famiglie, in percentuale, (X) e del fabbisogno di energia elettrica, in migliaia di megawatt, (Y) in Italia nel periodo anni X Y , , , , ,
8 r xy COV ( X, Y ) VAR( X ) VAR( Y ) r xy 26,82 5,73140,8 0,944 Correlazione sui NI a base mobile X Y n. i. base mobile n. i. base mobile 27,8 279, ,1 286,0 111,9 102,5 32,6 299,0 104,8 104,5 32,6 305,0 100,0 102,0 35,1 311,0 107,7 102,0 r xy 0,094 0,02 4,321,05 8
9 ESERCIZI REGRESSIONE LINEARE Es. 7 famiglie Spesa per manifestazio ni culturali (Z) A 200 1,9 B 420 4,0 C 250 2,5 D 70 1,6 E 180 2,2 F 300 2,8 G 100 1,5 Reddito mensile del capofamiglia (x 1000 Euro) (Y) Calcolare e commentare r YZ Sulla base dei risultati ottenuti si dica se è ragionevole adattare una retta di regressione; in questo caso quale sarebbe la dipendente e quale sarebbe l esplicativa? Costruire il diagramma di dispersione con sovraimposta la retta di regressione Commentare i parametri ottenuti 9
10 Spesa per manifestazioni cul Spesa per manifestazioni cultur (Z) 21/03/2013 Diagramma di dispersione ,5 2 2,5 3 3,5 4 4,5 Reditto mensile del capofamiglia (x 1000 Euro) (Y) r xy =0,97; il grafico mostra la forte relazione lineare diretta tra le 2 variabili. Il reddito mensile è utile per prevedere la spesa per manifestazioni culturali Diagramma di dispersione con retta di regressione Z = 134,65Y - 100, ,5 2 2,5 3 3,5 4 4,5 Reditto mensile del capofamiglia (x 1000 Euro) (Y) 10
11 Esercizio: giocatori titolari d una squadra di pallavolo: la seguente tabella riporta il numero di punti segnati in attacco ed il numero di punti segnati a muro in una partita. Giocatore Punti segnati in attacco Punti segnati a muro A 14 4 B 10 3 C 4 1 D 15 1 E 18 2 F 9 5 Calcolare r xy e commentarlo Diagramma di dispersione. Si confrontino le informazioni traibili dal diagr. di dispersione con il valore prima calcolato di r xy. C è accordo tra le due analisi? A quale causa possono essere imputate le differenze riscontrate? Soluzione r xy 0, Punti segnati a muro Punti segnati in attacco 11
12 Soluzione r xy 0, Punti segnati a muro y = x R 2 = Punti segnati in attacco Ci sono outliers? 12
13 Soluzione: confronto r xy diagramma di dispersione Il giocatore C si discosta molto dai rimanenti. Se lo si esclude relazione inversa: r xy = Il giocatore C è l alzatore per lui la relazione non vale Retta di regressione senza il punto (giocatore) C 0,683 r xy 6 5 Punti segnati a muro y = -0,292x + 6,854 R 2 = 0, Punti segnati in attacco 13
14 L INTERPOLAZIONE DI UNA SERIE STORICA p. 241 Esempio (Es eserciziario) Y = concentrazione di anidride carbonica nell'aria, in parti per milione, al Polo Sud dal 1981 al 1995: anni Y Grafico della serie storica. Calcolo dei parametri della funzione interpolante lineare e potenza Bontà di adattamento Valore previsto della concentrazione di anidride carbonica nel
15 concentrazione C02 (Y) 21/03/2013 Scelta della scala anni biennale annuale Y Grafico della serie storica (in scala naturale) anni 15
16 Grafico della serie storica (in scala doppio-logaritmica) Scala biennale Scala annuale Calcolo dei parametri della funzione interpolante lineare anni Scala dei tempi biennale t = 1, 2, 3, 4, 5, 6, 7, 8 yˆ t 321,786 2, 631t Scala dei tempi annuale t = 1, 3, 5, 7, 9, 11, 13, 15 yˆ t 323,1011, 3155t Interpretazione 16
17 anni Relazione tra le due intercette Scala biennale 321,786 = valore teorico al 1979 yˆ t 321,786 2, 631t Scala annuale 323,101 = valore teorico al tempo t = 1980 yˆ t 323,1011, 3155t Relazione tra le due intercette 321,786= valore teorico 1979 = valore teorico variazione teorica da un anno al successivo variazione teorica da un anno al successivo = coeff. angolare della regressione su scala annuale 321,786=323,101-1,
18 Bontà di adattamento In entrambi i casi: = 0,996 Adattamento quasi perfetto anni Previsione al 2005 biennale annuale ˆ y t ˆ y t Scala biennale (t = 13) yˆ t 321,786 2, 631t 321,786 2, Scala annuale (t = 25) yˆ t 323,1011, 3155t 323,1011, Significato e limiti della previsione 18
19 Parametri della funzione interpolante potenza Parametri della funzione interpolante potenza 19
20 Esercizio: 8 alimenti (cereali e derivati) si conosce la seguente matrice di covarianza riferita alle tre variabili: X = acqua, in gr. per 100 grammi di prodotto Y = proteine, in gr. per 100 gr. di prodotto Z = energia, in Kcal per 100 gr. di prodotto X Y Z X 165,59-15,18-822,82 Y 5,20 87,26 Z 4.418,69 Esercizio Si determini quale variabile risulta più utile ai fini della previsione del contenuto energetico degli 8 alimenti (Z). Si determini la retta di regressione (in termini di scostamenti dalla media) di cui al punto precedente e se ne commenti il significato e la validità. 20
21 Soluzione Variabile dipendente: Contenuto energetico (Z) Variabile esplicativa: la migliore tra X e Y Scelta della variabile esplicativa matrice di correlazione X Y Z X 165,59-15,18-822,82 Y 5,20 87,26 Z 4.418,69 X Y Z X 1-0,517-0,962 Y 1 0,576 Z 1 zˆ a bx i 1,..., 8 i i Retta di regressione in termini di scostamenti: calcolo di e b = (-0,962) 2 = 0,925 Interpretazione X Y Z X 165,59-15,18-822,82 Y 5,20 87,26 b ( zˆ i M z) b( xi M x) r xz z 4.418,69 0,962 4,97 165,59 x Z 4.418,69 21
STATISTICA A K (63 ore)
STATISTICA A K (63 ore) Marco Riani [email protected] http://www.riani.it Soluzione esercizi 4 settimana + esercizi da svolgere 5 settimana 1 Rendimenti, in quintali per ettaro, d una certa varietà di frumento,
Il volume: A. Cerioli M.A. Milioli M. Riani Esercizi di statistica parte I, Uni.nova, Parma, 2006
Il volume: A. Cerioli M.A. Milioli M. Riani Esercizi di statistica parte I, Uni.nova, Parma, 2006 contiene una raccolta di temi d esame di statistica descrittiva, adeguati per la preparazione dell esame
Il volume: A. Cerioli M.A. Milioli M. Riani Esercizi di statistica parte I, Uni.nova, Parma, 2006
Il volume: A. Cerioli M.A. Milioli M. Riani Esercizi di statistica parte I, Uni.nova, Parma, 2006 contiene una raccolta di temi d esame di statistica descrittiva, adeguati per la preparazione dell esame
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
Rappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Destagionalizzazione, detrendizzazione delle serie storiche
DATA MINING PER IL MARKETING (63 ore) Marco Riani [email protected] Sito web del corso http://www.riani.it/dmm Destagionalizzazione, detrendizzazione delle serie storiche 1 Serie storica della vendita di
Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.
Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3
STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006
STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 La seguente tabella contiene i dati inerenti le unità del settore della ristorazione in un dato comune: Unità X 1 X 2 X 3 X 4 X
Tema d esame del 15/02/12
Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi
METODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
METODO DEI MINIMI QUADRATI
Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. Sia f(x) = mx + q, la coppia di dati (x i, y i ) appartiene
Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
Indipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E possibile,
ESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
Interpolazione e metodo dei minimi quadrati
A. A. 017-018 Interpolazione e metodo dei minimi quadrati prof. ing. Antonio Comi Department of Enterprise Engineering Tor Vergata University of Rome Relazioni tra variabili Molto spesso si verifica che
docente: J. Mortera/P. Vicard Nome
A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi
Associazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto
Scale Logaritmiche. Matematica con Elementi di Statistica, Anna Torre a.a
Scale Logaritmiche SCALA LOGARITMICA: sull asse prescelto (ad esempio, l asse x) si rappresenta il punto di ascissa = 0 0 nella direzione positiva si rappresentano, a distanze uguali fra di loro, i punti
Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente
Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione
Trasformazioni Logaritmiche
Trasformazioni Logaritmiche Una funzione y = f(x) può essere rappresentata in scala logaritmica ponendo Si noti che y = f(x) diventa ossia Quando mi conviene? X = log α x, Y = log α y. log α (x) = log
Esercitazione 9 del corso di Statistica (parte seconda)
Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione
Scale Logaritmiche. Matematica con Elementi di Statistica a.a. 2015/16
Scale Logaritmiche Scala Logaritmica: sull asse prescelto (ad esempio, l asse x) si rappresenta il punto di ascissa = 0 0 nella direzione positiva si rappresentano, a distanze uguali fra di loro, i punti
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
Esercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
1. LO STUDIO DELLA CONCENTRAZIONE
1. LO STUDIO DELLA CONCENTRAZIONE Una delle applicazioni piuá significative dello studio della concentrazione eá relativa alla distribuzione del reddito. Supponiamo, ad esempio, che il reddito di 382 lavoratori
Università degli Studi di Padova Facoltà di Scienze Politiche
Università degli Studi di Padova Facoltà di Scienze Politiche STATISTICA Nuovo ordinamento Scienze Sociologiche Prof.ssa A. Dalla Valle Vecchio ordinamento Prova del 27/6/2007 (A) Cognome e nome: N. matricola:
Esercitazione III Soluzione
Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato
Classi di spesa Frequenza Sino a >
I volumi: A. Cerioli M.A. Milioli M. Riani Esercizi di statistica parte I, Uni.nova, Parma, 2009 A. Cerioli M.A. Milioli Esercizi di statistica, II parte, Uni.nova, Parma, 2009 contengono una raccolta
Statistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana
STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana Classificazione di 80 aziende in base a: X = numero di dipendenti Y = fatturato (in milioni di euro) X \ Y 0,5 1 1 2 2 4 4 20 Totale
Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale)
Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale) Grafici e distribuzioni univariate 1. Da un campione di 100 aziende agricole della provincia di Bologna è stata rilevata la classe di superficie
Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
