CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
|
|
|
- Ilario Damiano
- 9 anni fa
- Visualizzazioni
Transcript
1 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione tra il numero di volte che viene trasmesso un annuncio pubblicitario durante il week end (X) e l ammontare ricavato (in dollari) a fronte delle vendite realizzate nella settimana successiva (Y).A tale proposito, decide di effettuare un indagine statistica e raccoglie le seguenti informazioni: Settimana X Y Totale Valutare il legame di associazione e l eventuale relazione lineare tra i due caratteri. Sol. Nello studio della relazione tra due variabili quantitative, risulta di grande utilità la rappresentazione dei valori di X e di Y in una diagramma a dispersione (o scatterplot). Questo grafico mette in evidenza, con una buona approssimazione, il tipo di legame tra Y e X. Dal grafico risulta che esiste una associazione (interdipendenza) lineare tra X e Y.
2 Scatterplot di Y e X. Una misura del grado di associazione tra le variabili in esame è rappresentata dalla covarianza:,= = 1 Il numeratore della covarianza è detto codevianza. Dal segno del numeratore è possibile individuare se tra i caratteri X e Y esiste concordanza ossia se a valori crescenti di X corrispondono valori crescenti di Y σ >0), discordanza ossia se a valori crescenti di X corrispondono valori decrescenti di Y (σ <0) oppure se gli scostamenti positivi e negativi di X e Y dalle rispettive medie si compensano (σ =0 per cui non esiste associazione tra i caratteri. Formula alternativa della covarianza: = 1 =
3 Settimana X Y XY X Y Totale =3 =51 = =9.9 La covarianza è un indice assoluto di correlazione la cui unità di misura è pari al prodotto delle unità di misura in cui sono espressi i caratteri osservati. Pertanto, essa non può essere utilizzata per confrontare l interdipendenza tra coppie di caratteri espressi in unità di misura differenti. Il coefficiente di correlazione di Bravais-Pearson misura l intensità del legame lineare che sussiste tra due variabili X e Y: ρ = σ σ σ ρ è un indice che varia tra 1 e 1 e non dipende dall unità di misura dei due caratteri. Se tra due caratteri non vi è correlazione lineare, si ha che ρ =0 Se tra i due caratteri sussiste un legame lineare perfetto (Y= a± bx ) allora ρ = ±1 Sapendo che: = 1 = =2 = 1 = =56.6
4 allora = 2=1.41 e = 56.6=7.52 = = =0.93 Il valore del coefficiente di correlazione è prossimo a 1, quindi indica un legame lineare molto forte tra i due caratteri. In particolare:
5 Esercizio 2. Covarianza e correlazione lineare per dati in tabella Consideriamo il seguenti dati relativi alla distribuzione delle famiglie italiane del 2008 per numero di componenti e spesa mensile (in migliaia di euro): X=spesa mensile Y=nr.componenti Totale (ni.) (0,2] (2,4] (4,6] (6,8] Totale (n.j) Notazione: n frequenza congiunta i-esima riga (i=1,,h) j-esima colonna (j=1,,k). n. = n frequenza marginale di riga. Esprime il numero di soggetti che possiedono la modalità x indipendentemente da quello che avviene per il carattere Y n. = n frequenza marginale di colonna. Esprime il numero di soggetti che possiedono la modalità y a prescindere da quello che avviene per il carattere X... =N=11104 Vale inoltre la seguente relazione: n.. = n = n. = n. a) Costruire la distribuzione congiunta in frequenze relative dei caratteri X e Y b) Costruire la distribuzione marginale di Y e X c) Valutare, se esiste, una correlazione lineare tra i caratteri X e Y. Commentare i risultati ottenuti.
6 Sol. a)distribuzione congiunta di X e Y in frequenze relative X=spesa mensile Y=nr.componenti Totale (ni.) (0,2] (2,4] (4,6] (6,8] Totale (n.j) b) Distribuzione marginale di Y Y=nr.componenti n.j = 1. = =2.44 Distribuzione marginale di X X=spesa mensile (valori centrali ci) ni = 1. = =3.92
7 d)per calcolare il coefficiente di correlazione lineare dobbiamo calcolare la covarianza e le varianze di X e Y rispettivamente. Per comodità calcoliamo: Matrice dei valori X Y Matrice dei valori X Y = =10.54 = 1 = = =0.96 Calcoliamo quindi le varianze di X e Y: = 1. =3.911 =1.978 = 1. =1.030 =1.015 ρ = σ 0.96 = σ σ =0.48
8 Esercizio 3. La covarianza in caso di trasformazioni lineari La tabella seguente contiene le distribuzioni dei caratteri X=spesa mensile per il tempo libero (in euro) sostenuta dalle famiglie e Y=peso (in kg) dei figli. L indagine ha coinvolto un collettivo di 5 famiglie residenti a Milano con un solo figlio a carico in età scolare. X=spesa Y=Peso XY Totale Un economista italiano è interessato a valutare, se esiste, un legame/associazione tra la spesa per il tempo libero sostenuta dalle famiglie e il peso dei figli in età scolare. A tale proposito calcola la covarianza come misura dell interdipendenza tra i caratteri: =140 =62.4,= 1 = = 44 Un economista americano è interessato ad effettuare lo stesso studio sullo stesso set di dati. Tuttavia, ritiene opportuno esprimere i valori della spesa in dollari anziché in euro. Il tasso di cambio di 1 euro è di 1.34 dollari. Inoltre, effettua una trasformazione di scala sulla distribuzione del peso registrato in chilogrammi nel corrispondente valore in libbre (unità di misura utilizzata negli USA, per cui 1kg=2.2 lbs). Quale sarà il valore della covarianza tra i due caratteri calcolato dall economista americano?
9 Sol. Le variabili X e Y vengono opportunamente trasformate: Z=1.34 X W=2.2Y ZW Totale =1.34 =187.6 =2.2 =137.28,= 1 = = Nota: per la proprietà della covarianza in caso di trasformazioni lineari potevamo ottenere esattamente lo stesso valore sfruttando la seguente: Quindi:,= 1, = = 1 =,,= ,=
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
Lezione 6 Corso di Statistica. Domenico Cucina
Lezione 6 Corso di Statistica Domenico Cucina Università Roma Tre D. Cucina ([email protected]) 1 / 17 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative
Associazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
Esercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
SCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Differenze semplici medie, confronti in termini di mutua variabilità La distribuzione del prezzo
Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
Esercitazioni di Statistica
Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni [email protected] Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
Rappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Indice di contingenza quadratica media (phi quadro) χ n
Indice di contingenza quadratica media (phi quadro) Φ χ n Proprietà L influenza del numero di unità n è eliminata Assume valore 0 se X e Y sono perfettamente indipendenti Pagina Indice di Cramer V min
Indipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi
Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. La variabile casuale normale Da un analisi di bilancio è emerso che, durante i giorni feriali
Analisi Multivariata Prova intermedia del 20 aprile 2011
Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.
Esercitazione III Soluzione
Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
Statistica (COSTANZO, MISURACA) - CdL in Economia Aziendale, appello del 12/02/2014. Cognome Nome Matricola
Statistica (COSTANZO, MISURACA) - CdL in Economia Aziendale, appello del 12/02/2014 Cognome Nome Matricola Nella seguente tabella sono stati registrati i dati riguardanti l età e il n medio di giorni d
ESERCIZI CORRELAZIONE
ESERCIZI CORRELAZIONE Marco Riani Es: 6 famiglie, ammontare della spesa annua (in euro) per l acquisto di due generi di largo consumo: latte fresco e biscotti. Famiglia Spesa annua per l acquisto di latte
Generazione di Numeri Casuali- Parte 2
Esercitazione con generatori di numeri casuali Seconda parte Sommario Trasformazioni di Variabili Aleatorie Trasformazione non lineare: numeri casuali di tipo Lognormale Trasformazioni affini Numeri casuali
LEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA A.A. 2010/2011 Lezione n.6 - Distribuzione bivariata Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona Esempio: distribuzione dell abitudine al
Corso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli
Esercizio 1: Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli [email protected] (a) Religione (b) Reddito familiare (c) Salario in Euro (d) Classe di reddito (I, II, ecc.) (e)
Distribuzioni di Probabilità
Distribuzioni di Probabilità Distribuzioni discrete Distribuzione uniforme discreta Distribuzione di Poisson Distribuzioni continue Distribuzione Uniforme Distribuzione Gamma Distribuzione Esponenziale
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Sintesi a cinque e misure di variabilità rispetto ad un centro Una catena di fast-food ha selezionato
Tema d esame del 15/02/12
Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi
Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003
Compito di Statistica del 7/1/2003 I giovani addetti all agricoltura in due diverse regioni sono stati classificati per età; la distribuzione di frequenze congiunta è data dalla tabella seguente Età in
Variabilità e Concentrazione Esercitazione n 02
Variabilità e Concentrazione Esercitazione n 02 ESERCIZIO 1 Nella tabella di seguito sono riportati i dati relativi al tempo necessario a 8 studenti per svolgere un test di valutazione (in ore): Tempo
3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;
Esercizio 1 Il corso di Statistica è frequentato da 10 studenti che presentano le seguenti caratteristiche Studente Sesso Colore Occhi Voto Soddisfazione Età Stefano M Nero 18 Per niente 21 Francesca F
Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.
Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 26 Outline 1 2 3 4 () Statistica 2 / 26 Misura del legame Data una variabile doppia (X, Y ), la misura
Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
Correlazione. Daniela Valenti, Treccani Scuola 1
Correlazione 1 I dati di un indagine per riflettere Cominciamo con i dati di un indagine svolta in una quinta classe di scuola superiore. Dopo l Esame di Stato 12 studenti si sono iscritti a corsi di laurea
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione
STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006
STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 La seguente tabella contiene i dati inerenti le unità del settore della ristorazione in un dato comune: Unità X 1 X 2 X 3 X 4 X
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
Esempio sulla media geometrica
Media geometrica La media geometrica di un insieme di n valori positivi x, x 2,, x n di un carattere quantitativo X è pari alla radice n-esima del prodotto dei singoli valori: x g n x x2 K x n Esempio
STATISTICA DESCRITTIVA BIVARIATA
STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X, X 2,,X s. Si
Analisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
ESERCIZI DI RIEPILOGO 1
ESERCIZI DI RIEPILOGO 1 ESERCIZIO 1 La tabella seguente contiene la distribuzione di frequenza della variabile X = età (misurata in anni) per un campione casuale di bambini: x i 4.6 8 3.2 3 5.4 6 2.6 2
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
