Esercitazione III Soluzione
|
|
|
- Fabia De Angelis
- 7 anni fa
- Visualizzazioni
Transcript
1 Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio Totale Laurea triennale Laurea magistrale Dottorato di ricerca Totale Frequenze congiunte relative: f ij = n ij /N Reddito mensile Titolo di studio Totale Laurea triennale Laurea magistrale Dottorato di ricerca Totale La percentuale di dipendenti titolari di laurea magistrale e che percepiscono un reddito mensile tra 1000 e 000 euro è 7%. La percentuale di dipendenti titolari di dottorato di ricerca e che percepiscono un reddito mensile tra 5000 e 8000 euro è 13%. b) Distribuzioni delle frequenze relative del reddito condizionate al Titolo di studio (LT = Laurea Triennale, LM = Laurea Magistrale, DOT = Dottorato di ricerca): Reddito mensile Titolo di studio Totale Laurea triennale Laurea magistrale Dottorato di ricerca Tra coloro che sono titolari di laurea triennale, la percentuale di dipendenti con reddito mensile compreso tra i 000 e 5000 euro è il 0%. Tra coloro che sono titolari di dottorato di ricerca, la percentuale di dipendenti con reddito mensile compreso tra i 5000 e gli 8000 euro è il 67%. 1
2 c) Redditi mensili medi condizionati alle tipologie di titolo di studio: Media (Reddito mensile Titolo di studio = LT) = 1500* * *0 = 1900 euro Media (Reddito mensile Titolo di studio = LM) = 1500* * *0.9 = euro Media (Reddito mensile Titolo di studio = DOT) = 1500* * *0.67 = 5500 euro d) Sfruttando la proprietà associativa della media aritmetica: Media (Reddito mensile) = 1/15 * (1900* * *3) = 1/15 * = euro Verifico il risultato ottenuto calcolando il reddito medio mensile a partire dalla sua distribuzione marginale (sempre raggruppando in classi): Valore centrale classe x j Reddito mensile n j. x j n j Media (Reddito mensile) = 1/15 * (1500* * *4) = 1/15 * = euro
3 Esercizio a) L opportuno indice sintetico dell associazione tra i due caratteri qualitativi è il Chi-quadrato. χ = n ij n ij i j n ij n ij Giudizio su politiche UE Corso di studio frequentato Favorevole Contrario Totale Lettere Ingegneria Scienze Politiche Giurisprudenza Statistica Totale Tabella di indipendenza statistica: n ij n ij = n i. n.j Giudizio su politiche UE N Corso di studio Favorevole Contrario Totale frequentato Lettere Ingegneria Scienze Politiche Giurisprudenza Statistica Totale Per calcolare il Chi-quadrato calcolo prima le quantità: n ij n ij n ij n ij n ij n ij Giudizio su politiche UE Corso di studio frequentato Favorevole Contrario Totale Lettere Ingegneria Scienze Politiche Giurisprudenza Statistica Totale
4 In forma estesa: χ = (1 1.07) (6 5.93) (1 4.80) 4.80 ( ) (16 1.0) (3 4.80) ( ) (14 1.0) 1.0 = + ( ) ( ) 3.17 = = 6.99 Valore massimo del Chi-quadrato: max χ = N min k 1, h 1 = 185 min(4,1) = = Si registra un grado di associazione tra i due caratteri basso in quanto l indice Chi-quadrato assume un valore molto ridotto rispetto al suo massimo. Questo significa che i due caratteri hanno un basso grado di associazione. Possiamo infatti osservare come le frequenze osservate siano molto simili alle frequenze teoriche di indipendenza statistica (confronto tra n ij e n ij ). b) Si ha perfetta dipendenza unilaterale di un carattere Y (Giudizio su politiche UE) da un carattere X (Corso di studio frequentato) quando ad ogni modalità di X è associata una sola modalità di Y: n ij Giudizio su politiche UE Corso di studio frequentato Favorevole Contrario Totale Lettere Ingegneria Scienze Politiche Giurisprudenza Statistica Totale
5 Esercizio 3 a) Numero di accessi giornalieri Numero di notizie pubblicate (al giorno) b) Sito web Notizie pubblicate Accessi web U x u y u x u y u y u x u Totale μ x = 187 = μ 1 y = 91 = σ x = = σ y = = σ x = = 7.99 σ y = = σ xy = ( ) = r xy = = 0.94 Esiste un alta correlazione lineare positiva tra i due caratteri osservati. Alta in quanto il coefficiente di correlazione lineare assume un valore assoluto (0.94) vicino al suo massimo (1). Inoltre un valore positivo di r xy indica che la relazione lineare tra i due caratteri è positiva, ovvero al crescere dei valori di un carattere si osservano valori crescenti dell altro carattere: al crescere del numero di notizie pubblicate, cresce il numero di accessi web, e viceversa. Nota: possiamo riconoscere questa relazione positiva anche dal grafico ottenuto al punto precedente, osservando la disposizione della nuvola di punti (allungata dal basso verso l alto). 5
6 c) Parametri della retta di regressione per gli accessi web registrati in funzione delle notizie pubblicate: β 1 = = 1.99 β 0 = ( ) = β 0 rappresenta il numero di accessi stimato quando il numero di notizie pubblicate sul sito web è nullo. β 1 indica la variazione che subisce il numero di accessi giornalieri se il numero di notizie pubblicate aumenta di 1. Quindi secondo il modello stimato, pubblicando una notizia in più ci aspettiamo un incremento di circa 13 visite web giornaliere. d) x = 0 y = = 48.3 e) Valutiamo la bontà di adattamento del modello ai dati attraverso l indice di determinazione lineare R. 1 modo di calcolo Poiché abbiamo già calcolato r xy al punto b) abbiamo che: R = r xy = (0.94) = 0.88 modo di calcolo R = Dev reg Dev y Calcoliamo: Dev y = N σ y = = Dev reg = y u μ y u impostando la seguente tabella: Sito web Notizie pubblicate Accessi web stimati (Nota: μ y = 190.9) U x u y u = x u y u μ y Totale Quindi R = = 0.88 Il modello di regressione spiega l 88% della variabilità di Y, accessi web. Percentuale relativamente alta che indica un buon adattamento del modello ai dati. 6
7 Esercizio 4 Calcoliamo il coefficiente di correlazione lineare (sono entrambi caratteri quantitativi). Tempo trascorso prima trovare lavoro Voto laurea Totale Totale Tempo trascorso prima trovare lavoro (c j ) Voto laurea (c i ) Totale Totale Prodotti: Tempo trascorso prima trovare lavoro (c j ) Voto laurea (c i ) Totale , , , ,330.00, , , , , , , , , , , Totale 4, , , ,116.5 Voto laurea: x i c i n i c i n i c i c i n i Totale μ x = = σ x = = 6.0 σ x = 6.0 =
8 Tempo trascorso prima di trovare lavoro: y j c j n j c j n j c j c j n j Totale μ y = = σ 55 y = = σ 55 y = = 5.91 σ xy = 61, = 1.75 r xy = = 0.7 Si nota una moderata correlazione lineare negativa tra i due caratteri in esame. Moderata in quanto il coefficiente di correlazione lineare assume un valore assoluto (0.7) piuttosto distante dal suo massimo (1), ma comunque non nullo. Inoltre un valore negativo di r xy indica che la relazione lineare tra i due caratteri è negativa, ovvero al crescere dei valori di un carattere si osservano valori decrescenti dell altro carattere: all aumentare del voto di laurea, diminuisce il tempo trascorso per trovare lavoro, e viceversa. 8
Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
STATISTICA 1 ESERCITAZIONE 6
STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
Indipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
La dipendenza. Antonello Maruotti
La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno
ESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE
ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di
Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi
ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
Esercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA
STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
Indici di variabilità ed eterogeneità
Indici di variabilità ed eterogeneità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università della Basilicata a.a. 011/01
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione
Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
Rappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte
Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Esercizi su Regressione e Connessione
Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni
Regressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
docente: J. Mortera/P. Vicard Nome
A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo [email protected] Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
METODO DEI MINIMI QUADRATI
Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. Sia f(x) = mx + q, la coppia di dati (x i, y i ) appartiene
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Università di Cassino. Esercitazione di Statistica 1 del 28 novembre Dott.ssa Paola Costantini
Università di Cassino Esercitazione di Statistica del 28 novembre 2007 Dott.ssa Paola Costantini Esercizio Considerando il DATASET DIPENDENTI, si calcoli la correlazione tra i caratteri STIPENDIO PERCEPITO
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo [email protected] Definizioni di base Una popolazione è l insieme
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
Analisi economica NUTS (regioni) Europee
Analisi economica NUTS (regioni) Europee Con riferimento al dataset fornito: 1. Calcolare la distribuzione di frequenze assolute, relative e percentuali delle microaree NUTS per le cinque classi di popolazione
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Relazioni tra variabili: le tabelle di contingenza
Lezione 6 Relazioni tra variabili: le tabelle di contingenza "The Physicians Health Study" è uno studio clinico randomizzato condotto allo scopo di valutare il possibile effetto di riduzione della mortalità
Indice di contingenza quadratica media (phi quadro) χ n
Indice di contingenza quadratica media (phi quadro) Φ χ n Proprietà L influenza del numero di unità n è eliminata Assume valore 0 se X e Y sono perfettamente indipendenti Pagina Indice di Cramer V min
