Esercitazione III Soluzione

Documenti analoghi
Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Corso in Statistica Medica

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

STATISTICA 1 ESERCITAZIONE 6

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I ( )

Statistica. Alfonso Iodice D Enza

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

X \Y Liceo Classico Liceo Scientifico Altro le distribuzioni di frequenza marginali relative, f i. e f.

Correlazione e regressione per problemi di Luciano Corso

Analisi dell associazione tra due caratteri

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Matematica Lezione 22

Regressione & Correlazione

La Dipendenza. Monia Ranalli. Ranalli M. Dipendenza Settimana # 3 1 / 19

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

Statistica. Alfonso Iodice D Enza

Indipendenza, Dipendenza e interdipendenza

STATISTICA (I modulo - Statistica descrittiva) Esercitazione I ( )

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

La dipendenza. Antonello Maruotti

ESERCITAZIONE IV - Soluzioni

ESERCITAZIONI N. 3 corso di statistica

Corso di Laurea in Amministrazione Aziendale Complex Learning. Statistica per l azienda (T) SECS-S/01 a. a. 2017/2018

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

REGRESSIONE E CORRELAZIONE

Esercitazione di Statistica Indici di associazione

Corso di Statistica. Distribuzioni doppie Relazioni tra due variabili. Prof.ssa T. Laureti a.a

Correlazione lineare e regressione

Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03

ESERCITAZIONI N. 3 corso di statistica

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

Esercitazione 1. 6 Marzo 2019

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I

Statistica 1 A.A. 2015/2016

Statistica Descrittiva Soluzioni 8. Dipendenza

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Statistica. Alfonso Iodice D Enza

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte

Corso di Laurea in MQEGA

Corso di Statistica. Variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Esame di Statistica TEMA B Corso di Laurea in Economia Prof.ssa Giordano. 19 giugno 2017

Esame di Statistica -- TEMA Corso di Laurea in Economia Prof.ssa Giordano. 19 giugno 2017

Fondamenti e metodi analisi empirica nelle scienze sociali

Indici di variabilità ed eterogeneità

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

STATISTICA DESCRITTIVA (canale B)

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Rappresentazioni grafiche di distribuzioni doppie

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte

STATISTICA. Regressione-4 ovvero Macron!

Metodi statistici per le ricerche di mercato

Esercitazioni di statistica

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.

Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia

ESAME DI STATISTICA TEMA B Corso di Laurea in Economia Prof.ssa Giordano luglio 2017

Esercizi su Regressione e Connessione

Regressione lineare semplice

ESAME DI STATISTICA TEMA A Corso di Laurea in Economia Prof.ssa Giordano luglio 2017

docente: J. Mortera/P. Vicard Nome

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Statistica. Alfonso Iodice D Enza

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Statistica inferenziale

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

ESERCITAZIONI N. 2 corso di statistica

METODO DEI MINIMI QUADRATI

Statistica. Alfonso Iodice D Enza

Statistica Analisi bidimensionale La dipendenza in media. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Esercitazioni di Statistica Dott.ssa Cristina Mollica

Esame di Statistica tema B Corso di Laurea in Economia Prof.ssa Giordano 06 Luglio 2012

STATISTICA. Esercitazione 5

STATISTICA (I MODULO - STATISTICA DESCRITTIVA) Esercitazione I 23/02/2007

Esercizio 2: voto e ore dedicate allo studio

Stesso valore medio per distribuzioni diverse

Esercitazione del

Università di Cassino. Esercitazione di Statistica 1 del 28 novembre Dott.ssa Paola Costantini

Relazioni Statistiche

Statistica di base per l analisi socio-economica

Statistica. Esercizi: 7. Statistica Descrittiva Bivariata 3 Probabilità 1

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Capitolo 12 La regressione lineare semplice

Analisi economica NUTS (regioni) Europee

Regressione Lineare Semplice e Correlazione

Relazioni tra variabili: le tabelle di contingenza

Indice di contingenza quadratica media (phi quadro) χ n

Transcript:

Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato di ricerca 0 1 3 Totale 5 6 4 15 Frequenze congiunte relative: f ij = n ij /N Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 0.7 0.07 0.00 0.33 Laurea magistrale 0.07 0.7 0.13 0.47 Dottorato di ricerca 0.00 0.07 0.13 0.0 Totale 0.33 0.40 0.7 1.00 La percentuale di dipendenti titolari di laurea magistrale e che percepiscono un reddito mensile tra 1000 e 000 euro è 7%. La percentuale di dipendenti titolari di dottorato di ricerca e che percepiscono un reddito mensile tra 5000 e 8000 euro è 13%. b) Distribuzioni delle frequenze relative del reddito condizionate al Titolo di studio (LT = Laurea Triennale, LM = Laurea Magistrale, DOT = Dottorato di ricerca): Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 0.80 0.0 0.00 1.00 Laurea magistrale 0.14 0.57 0.9 1.00 Dottorato di ricerca 0.00 0.33 0.67 1.00 0.33 0.40 0.7 1.00 Tra coloro che sono titolari di laurea triennale, la percentuale di dipendenti con reddito mensile compreso tra i 000 e 5000 euro è il 0%. Tra coloro che sono titolari di dottorato di ricerca, la percentuale di dipendenti con reddito mensile compreso tra i 5000 e gli 8000 euro è il 67%. 1

c) Redditi mensili medi condizionati alle tipologie di titolo di studio: Media (Reddito mensile Titolo di studio = LT) = 1500*0.80 + 3500*0.0 + 6500*0 = 1900 euro Media (Reddito mensile Titolo di studio = LM) = 1500*0.14 + 3500*0.57 + 6500*0.9 = 4071.43 euro Media (Reddito mensile Titolo di studio = DOT) = 1500*0 + 3500*0.33 + 6500*0.67 = 5500 euro d) Sfruttando la proprietà associativa della media aritmetica: Media (Reddito mensile) = 1/15 * (1900*5 + 4071.43*7 + 5500*3) = 1/15 * 54500 = 3633.33 euro Verifico il risultato ottenuto calcolando il reddito medio mensile a partire dalla sua distribuzione marginale (sempre raggruppando in classi): Valore centrale classe x j Reddito mensile n j. x j n j. 1500 1000-000 5 7500 3500 000-5000 6 1000 6500 5000-8000 4 6000 15 54500 Media (Reddito mensile) = 1/15 * (1500*5 + 3500*6 + 6500*4) = 1/15 * 54500 = 3633.33 euro

Esercizio a) L opportuno indice sintetico dell associazione tra i due caratteri qualitativi è il Chi-quadrato. χ = n ij n ij i j n ij n ij Giudizio su politiche UE Corso di studio frequentato Favorevole Contrario Totale Lettere 1 6 18 Ingegneria 1 16 37 Scienze Politiche 37 8 45 Giurisprudenza 31 17 48 Statistica 3 14 37 Totale 14 61 185 Tabella di indipendenza statistica: n ij n ij = n i. n.j Giudizio su politiche UE N Corso di studio Favorevole Contrario Totale frequentato Lettere 1.07 5.93 18 Ingegneria 4.80 1.0 37 Scienze Politiche 30.16 14.84 45 Giurisprudenza 3.17 15.83 48 Statistica 4.80 1.0 37 Totale 101 84 185 Per calcolare il Chi-quadrato calcolo prima le quantità: n ij n ij n ij n ij n ij n ij Giudizio su politiche UE Corso di studio frequentato Favorevole Contrario Totale Lettere 0.00 0.00 0.00 Ingegneria 0.58 1.18 1.77 Scienze Politiche 1.55 3.15 4.70 Giurisprudenza 0.04 0.09 0.13 Statistica 0.13 0.7 0.40 Totale.31 4.69 6.99 3

In forma estesa: χ = (1 1.07) 1.07 + (6 5.93) 5.93 + (1 4.80) 4.80 (17 15.83) 15.83 + (16 1.0) 1.0 + (3 4.80) 4.80 + (37 30.16) 30.16 + (14 1.0) 1.0 = + (8 14.84) 14.84 + (31 3.17) 3.17 = 0 + 0 + 0.58 + 1.18 + 1.55 + 3.15 + 0.04 + 0.09 + 0.13 + 0.7 = 6.99 Valore massimo del Chi-quadrato: max χ = N min k 1, h 1 = 185 min(4,1) = 185 1 = 185 + Si registra un grado di associazione tra i due caratteri basso in quanto l indice Chi-quadrato assume un valore molto ridotto rispetto al suo massimo. Questo significa che i due caratteri hanno un basso grado di associazione. Possiamo infatti osservare come le frequenze osservate siano molto simili alle frequenze teoriche di indipendenza statistica (confronto tra n ij e n ij ). b) Si ha perfetta dipendenza unilaterale di un carattere Y (Giudizio su politiche UE) da un carattere X (Corso di studio frequentato) quando ad ogni modalità di X è associata una sola modalità di Y: n ij Giudizio su politiche UE Corso di studio frequentato Favorevole Contrario Totale Lettere 18 0 18 Ingegneria 0 37 37 Scienze Politiche 45 0 45 Giurisprudenza 48 0 48 Statistica 0 37 37 Totale 111 74 185 4

Esercizio 3 a) Numero di accessi giornalieri 450 400 350 300 50 00 150 100 50 0 0 5 10 15 0 5 30 Numero di notizie pubblicate (al giorno) b) Sito web Notizie pubblicate Accessi web U x u y u x u y u y u x u 1 1 301 631 90601 441 7 86 60 7396 49 3 7 409 11043 16781 79 4 4 4 168 1764 16 5 7 97 8019 8809 79 6 13 19 1677 16641 169 7 18 09 376 43681 34 8 11 198 178 3904 11 9 9 83 747 6889 81 10 6 66 396 4356 36 11 19 171 349 941 361 1 5 300 7500 90000 65 Totale 187 91 4566 58563 3681 μ x = 187 = 15.58 μ 1 y = 91 = 190.9 1 σ x = 3681 1 15.58 = 63.91 σ y = 58563 190.9 = 13.74 1 σ x = 63.91 = 7.99 σ y = 13.74 = 111.01 σ xy = 4566 1 (15.58 190.9) = 830.05 r xy = 830.05 7.99 111.01 = 0.94 Esiste un alta correlazione lineare positiva tra i due caratteri osservati. Alta in quanto il coefficiente di correlazione lineare assume un valore assoluto (0.94) vicino al suo massimo (1). Inoltre un valore positivo di r xy indica che la relazione lineare tra i due caratteri è positiva, ovvero al crescere dei valori di un carattere si osservano valori crescenti dell altro carattere: al crescere del numero di notizie pubblicate, cresce il numero di accessi web, e viceversa. Nota: possiamo riconoscere questa relazione positiva anche dal grafico ottenuto al punto precedente, osservando la disposizione della nuvola di punti (allungata dal basso verso l alto). 5

c) Parametri della retta di regressione per gli accessi web registrati in funzione delle notizie pubblicate: β 1 = 830.05 63.91 = 1.99 β 0 = 190.9 (1.99 15.58) = 11.48 β 0 rappresenta il numero di accessi stimato quando il numero di notizie pubblicate sul sito web è nullo. β 1 indica la variazione che subisce il numero di accessi giornalieri se il numero di notizie pubblicate aumenta di 1. Quindi secondo il modello stimato, pubblicando una notizia in più ci aspettiamo un incremento di circa 13 visite web giornaliere. d) x = 0 y = 11.48 + 1.99 0 = 48.3 e) Valutiamo la bontà di adattamento del modello ai dati attraverso l indice di determinazione lineare R. 1 modo di calcolo Poiché abbiamo già calcolato r xy al punto b) abbiamo che: R = r xy = (0.94) = 0.88 modo di calcolo R = Dev reg Dev y Calcoliamo: Dev y = N σ y = 1 13.74 = 14787.9 Dev reg = y u μ y u impostando la seguente tabella: Sito web Notizie pubblicate Accessi web stimati (Nota: μ y = 190.9) U x u y u = 11.48 + 1.99 x u y u μ y 1 1 61.31 4954.75 7 79.45 145.56 3 7 339.5 001.79 4 4 40.48 63.19 5 7 339.5 001.79 6 13 157.39 114.61 7 18.34 987.164 8 11 131.41 3541.44 9 9 105.43 7308.54 10 6 66.46 15490.9 11 19 35.33 197.48 1 5 313.7 14969.5 Totale 187 19409.60 Quindi R = 19409.60 14787.9 = 0.88 Il modello di regressione spiega l 88% della variabilità di Y, accessi web. Percentuale relativamente alta che indica un buon adattamento del modello ai dati. 6

Esercizio 4 Calcoliamo il coefficiente di correlazione lineare (sono entrambi caratteri quantitativi). Tempo trascorso prima trovare lavoro Voto laurea 1-6 6-1 1-4 Totale 80-90 7 11 90-100 4 3 8 15 100-105 3 8 6 17 105-110 4 6 1 Totale 13 19 3 55 Tempo trascorso prima trovare lavoro (c j ) Voto laurea (c i ) 3.5 9 18 Totale 85 7 11 95 4 3 8 15 10.5 3 8 6 17 107.5 4 6 1 Totale 13 19 3 55 Prodotti: Tempo trascorso prima trovare lavoro (c j ) Voto laurea (c i ) 3.5 9 18 Totale 85 595.00 1,530.00 10,710.00 1,835.00 95 1,330.00,565.00 13,680.00 17,575.00 10.5 1,076.5 7,380.00 11,070.00 19,56.5 107.5 1,505.00 5,805.00 3,870.00 11,180.00 Totale 4,506.5 17,80.00 39,330.00 61,116.5 Voto laurea: x i c i n i c i n i c i c i n i 80-90 85 11 935 75 79475 90-100 95 15 145 905 135375 100-105 10.5 17 174.5 10506.5 178606.3 105-110 107.5 1 190 11556.5 138675 Totale 55 539.5 53131.3 μ x = 539.5 55 = 98.05 σ x = 53131.3 55 98.05 = 6.0 σ x = 6.0 = 7.89 7

Tempo trascorso prima di trovare lavoro: y j c j n j c j n j c j c j n j 1-6 3.5 13 45.5 1.5 159.5 6-1 9 19 171 81 1539 1-4 18 3 414 34 745 Totale 55 630.5 9150.5 μ y = 630.5 = 11.46 σ 55 y = 9150.5 11.46 = 34.95 σ 55 y = 34.95 = 5.91 σ xy = 61,116.5 55 98.05 11.46 = 1.75 r xy = 1.75 7.89 5.91 = 0.7 Si nota una moderata correlazione lineare negativa tra i due caratteri in esame. Moderata in quanto il coefficiente di correlazione lineare assume un valore assoluto (0.7) piuttosto distante dal suo massimo (1), ma comunque non nullo. Inoltre un valore negativo di r xy indica che la relazione lineare tra i due caratteri è negativa, ovvero al crescere dei valori di un carattere si osservano valori decrescenti dell altro carattere: all aumentare del voto di laurea, diminuisce il tempo trascorso per trovare lavoro, e viceversa. 8