Corso di Statistica. Distribuzioni doppie Relazioni tra due variabili. Prof.ssa T. Laureti a.a
|
|
- Chiara Rizzi
- 4 anni fa
- Visualizzazioni
Transcript
1 Corso di Statistica Distribuzioni doppie Relazioni tra due variabili Prof.ssa T. Laureti a.a
2 Distribuzione doppia di frequenza Addet ti Genere respons 6 M 6 M 10 F 10 F 7 M 3 M 3 M 6 F 4 F Adde etti Genere responsabile M F Quanti sono i punti vendita con 3 addetti, il cui responsabile è un maschio? 2 Quanti sono i punti vendita con 3 addetti, il cui responsabile è una femmina? 0 2
3 Distribuzione doppia di frequenza Adde etti Genere responsabile M F Tot Tot è la frequenza congiunta associata alla modalità 4 del Numero di addetti e alla modalità F del Genere responsabile 3
4 Distribuzione doppia di frequenza Adde etti Genere responsabile M F Tot Tot Distribuzione marginale del genere del responsabile (distribuzione di frequenza semplice del carattere genere del responsabile ) Qual è la proporzione di punti vendita il cui responsabile è una femmina? 4 p = = 0,44 (44%) 9 4
5 Distribuzione doppia di frequenza Adde etti Genere responsabile M F Tot Tot Distribuzione marginale degli addetti (distribuzione di frequenza semplice del carattere numero di addetti ) Qual è la media del numero di addetti? E la mediana? E la moda? 5
6 Distribuzione doppia di frequenza Adde etti Genere responsabile M F Tot Tot Distribuzione parziale del numero di addetti, condizionata alla modalità maschio del carattere genere del responsabile Distribuzione del numero di addetti dato che il genere del responsabile è maschio Qual è il numero medio di addetti dei punti vendita il cui responsabile è un uomo? 6
7 Distribuzione doppia di frequenza Adde etti Genere responsabile M F Tot Tot Distribuzione parziale del genere del responsabile, condizionata alla modalità 6 del carattere numero di addetti Distribuzione del genere del responsabile dato che il numero di addetti è pari a 6 Considerando i punti vendita con 6 addetti, qual è la proporzione il cui responsabile è una femmina? 7
8 Distribuzione doppia di frequenza Ubicazione centro Vendita on line si Vendita on line Tot periferia si si no Semicentro periferia centro centro no no no no one Ubicazi Centro Semic entro Perif periferia Semicentro centro no no si Tot
9 Distribuzione doppia di frequenza Ubicazio one Vendita on line si no Tot Centro Semic entro Perif Tot Qual è la proporzione di p.v. ubicati in centro? Nel sottoinsieme dei p.v. che effettuano anche la vendita on line, qual è la proporzione di p.v. ubicati in centro? Qual è la proporzione di p.v. che vendono anche on line? Nel sottoinsieme di p.v. ubicati in periferia, qual è la proporzione di p.v. che vendono anche on line? 9
10 Distribuzione doppia di frequenza Y Tot y 1 y j y K X 1 n 11 n 1j n 1k n 1. X X i n i1 n ij n ik n i. x H n H1 n Hj n HK n H. Tot n.1 n.j n.k n 2 distribuzioni ib i i marginali H distribuzioni parziali di Y, condizionate ad ogni valore di X K distribuzioni parziali di X, condizionate ad ogni valore di Y 10
11 X carattere quantitativo Nella distribuzione marginale e in ogni distribuzione parziale condizionata a una data modalità di Y possiamo calcolare indici di: Tendenza centrale Dispersionei Asimmetria Avremo quindi, ad esempio, la media e la varianza condizionata, la mediana marginale 11
12 X carattere qualitativo Nella distribuzione marginale e in ogni distribuzione parziale condizionata a una data modalità di Y possiamo calcolare indici di: Tendenza centrale Eterogeneità Avremo quindi, ad esempio, la moda marginale, l indice di entropia condizionato 12
13 Relazioni tra variabili: indipendenza d Quando si osservano due caratteri X e Y diventa interessante studiare la relazione tra di essi Se tra X e Y non c è alcun legame X e Y sono indipendenti statisticamente Tra due caratteri esiste indipendenza statistica quando la conoscenza della modalità di uno dei due caratteri non migliora la previsione della modalità dell altro 13
14 Associazione In presenza di un qualche legame (associazione) tra X e Y, lo studio della relazione tra i due caratteri richiede di: distinguere la tipologia di caratteri che si esaminano specificare se si è interessati a studiare la dipendenza o l interdipendenza 14
15 Dipendenza e interdipendenza Dipendenza: studia come le modalità di un carattere dipendano da quelle di un altro carattere secondo un legame unidirezionale Interdipendenza: Si assume che i due caratteri abbiano lo stesso ruolo e che il legame sia bidirezionale 15
16 Caratteri qualitativi sconnessi Tabella doppia di frequenza Frequenze osservate n ij Frequenze teoriche (quelle se si osserverebbero in caso di indipendenza statistica) ni. n '.j n ij = n La condizione di indipendenza statistica si verifica a partire dalle differenze c ij tra ciascuna frequenza osservata e la corrispondente frequenza teorica c = n ij ij n ' ij 16
17 Freq. osservate e freq. teoriche X Y y 1 y j y K Tot X 1 n 11 n 1j n 1k n 1. X i n i1 n ij n ik n i. Freq. osservate Freq. che si utilizzano per ricavare le freq. teoriche x H n H1 n Hj n HK n H. ij n Tot n.1 n.j n.k n n ' = n i. n.j 17
18 Frequenze osservate Vendita on line si no Tot Ubicazio one Centro Semice ntro Perif Tot
19 Frequenze teoriche Ubic cazione Vendita on line Tot si no Se ci fosse indipendenza Centro statistica quali esarebbero 9 9 le Semice frequenze ntro 9 9 congiunte? Perif. 3 Tot
20 Frequenze osservate e teoriche Vendita on Tot Vendita on Tot Osservate line Teoriche line si no si no zione Ubica Centro Semice ntro Perif zione Ubica Centro 1,33 2,67 4 Semice 0,67 1,33 2 ntro Perif Tot Tot Non tutte le freq. teoriche sono uguali alle corrispondenti freq. osservate Non c è indipendenza statistica tra i due caratteri Qual è il grado di associazione tra i due caratteri? 20
21 Indice Chi-quadrato Studia l interdipendenza tra due caratteri qualitativi sconnessi a partire da una tabella doppia χ 2 = H K i= 1 j= 1 c n 2 ij ' ij c ij = n ij n ' ij χ 2 = 0 indipendenza statistica χ 2 > 0 interdipendenza 21
22 Indice V di Cramer Indice relativo per misurare l associazione (interdipendenza) tra due caratteri qualitativi V 2 χ / n = 0 V 1 min H 1, K 1 [( ) ( )] V=0 indipendenza statistica V=1 associazione perfetta Più V si avvicina ad 1 e più aumenta il grado di associazione tra X e Y 22
23 Calcolo di χ 2 e V χ = 2 2 ( 2 1,33) ( 2 2,67) 1,33 + 2,67 2 ( 0 0,67) ( 2 1,33) 0, ( 1 1) ( 2 2) , χ 2 = 0,33 + 0, ,33 + 0,67 = 1,5 1,50 9 H=3, K=2 quindi il minimo tra H-1 e K-1 è uguale a 1 V = = 0, 41 23
24 Per caratteri che non sono qualitativi sconnessi Se X e/o Y sono qualitativi ordinati o quantitativi (in classi), un analisi esplorativa sulla tabella doppia con l indice Chi-quadrato è sempre possibile Tuttavia ci sono indici più opportuni da utilizzare 24
25 Y y Interdipendenza tra due caratteri quantitativi quadrante II y quadrante I x Consideriamo un diagramma di dispersione in cui l origine degli assi sia stata traslata sul baricentro (variabili scarto): quadrante III quadrante IV x X Classifichiamo le coordinate dei punti nei 4 quadranti secondo il loro segno algebrico: quadrante segno algebrico X x Y y i i I + + Scostamenti concordi II - + III - - IV + - Scostamenti discordi i
26 Interdipendenza tra due caratteri quantitativi Perciò i prodotti degli scarti avranno segno positivo per i punti del I e III quadrante e negativo per i punti del II e IV quadrante. La somma dei prodotti degli scarti, chiamata codevianza tra X e Y, sintetizza ti la distribuzione ib i dei punti nei 4 quadranti: n i= 1 ( x x)( y y) > 0 i i 0 prevalgono i punti nel I e III quadrante: relazione ea epositiva (concordanza) a) punti uniformemente distribuiti nei 4 quadranti: relazione circa nulla < 0 prevalgono i punti nel II e IV quadrante: relazione negativa (discordanza) Occorre però eliminare i dalla codevianza l influenza della numerosità delle osservazioni, dividendola per n, ottenendo quindi la covarianza
27 Interdipendenza tra due caratteri quantitativi Covarianza: Indice simmetrico di associazione tra due variabili quantitative Cov(X, Y) = σ XY = n n 1 ( x x)( y y) i= 1 Cov > 0 se prevalgono scostamenti concordi di X e Y (bassi valori di X corrispondenti a bassi valori di Y oppure alti valori di X corrispondenti a alti valori di Y). Cov < 0 se prevalgono scostamenti discordi (alti valori di una variabile associati a bassi valori dell altra variabile) Cov = 0 in assenza di relazione lineare tra X e Y i i 27
28 Covarianza nulla Cov(X,Y)=0 28
29 Covarianza positiva (concordanza) Cov(X,Y)>0 29
30 Covarianza negativa (discordanza) Cov(X,Y)<0 30
31 Legame non lineare La relazione tra X e Y non è di tipo lineare Ci aspettiamo un valore di Cov(X,Y) prossimo allo 0, il che indica assenza di legame e lineare e X e Y NON sono indipendenti, ma legati da una forte relazione di tipo non lineare 31
32 Correlazione lineare Eliminare l influenza sulla covarianza delle differenti unità di misura scelte, dividendo la suddetta quantità per le deviazioni standard delle due variabili. Indice di correlazione lineare di Bravais-Pearson Corr(X, Y) = ρ XY = σxy σ σ X Y = n ( xi x)( yi y) i= 1 n 2 ( xi x) ( yi y) i= 1 n i= ρ XY 1 ρxy = 11 1 < ρ < 0 XY correlazione lineare positiva perfetta correlazione negativa ρ = 0 XY 0 < XY 1 assenza di legame lineare correlazione positiva ρ = 1 XY correlazione lineare positiva perfetta 32
33 Correlazione lineare Il segno algebrico del coefficiente ρ xy covarianza dipende dalla Tra due variabili X e Y esiste correlazione positiva (concordanza) se al crescere di X anche Y, nel complesso, tende a crescere e se al diminuire di X anche Y, nel complesso, tende a diminuire. La correlazione è invece negativa (discordanza) se al diminuire di X la variabile Y, nel complesso, tende a crescere e se al diminuire di X, nel complesso, Y tende a crescere. Se le variabili sono correlate, i punti del diagramma di dispersione si disporranno secondo un andamento globale facilmente individuabile: se tale andamento è lineare, si parlerà di correlazione lineare. 33
34 Correlazione lineare circa nulla σ XY ρ XY = 00 σ σ X Y II quadrante I quadrante Y μ Y III quadrante IV quadrante μ X X
35 Correlazione lineare positiva σ XY ρ XY = > σ Xσ Y 0 II quadrante I quadrante Y μ Y III quadrante IV quadrante μ X X
36 Correlazione lineare negativa σ XY ρ XY = <00 σ σ X Y II quadrante I quadrante Y μ Y III quadrante IV quadrante μ X X
37 Correlazione lineare perfetta ρ=1 Perfetta correlazione positiva ρ=-1 Perfetta correlazione negativa
38 Calcolo della covarianza Ricavi Costi (X) (Y) Scarti X Scarti (Scarti X) x Y (Scarti Y) ,11-88,99 402, , , , , , ,11-611, , , , , ,7 316, , ,00 n Media , ( xi x) ( yi y) = Cov(X, Y) = = 10219, 44 n i=
39 Media Dev std Calcolo del coefficiente di correlazione lineare Ricavi Costi (X) (Y) Cov (X, Y) = 10219,44 ρ = σ σ X Y 10219,44 134,66 78,48 XY = = C è una forte concordanza tra ricavi e costi ,89 134,66 78,48 σ 0,97 39
40 Ancora sulla covarianza formule alternative per i calcoli Codevianza (X, Y) = n ( xi x)( yi y) = i = 1 i = 1 n x y i i nxy Cov (X, Y ) = Codev (X, n Y ) = 1 n n i= 1 x i y y x y 40
41 Relazioni tra variabili: riepilogo Tipo di relazione Caratteri aa Struttura u Indici dati Interdipendenza tra X e Y Dipendenza in media di Y da X qualsiasi (se qualitativi sconnessi è l unico tipo di relazione da studiare) Y quantitativo X qualsiasi (se qualitativo continuo, in classi) Tabella doppia di frequenze Valori raggruppati in base alle modalità di X χ 2 V (relativo) η 2 (relativo) Interdipendenza quantitativi Coppie di Cov tra X e Y valori ρ (relativo) (concordanza/di scordanza) 41
42 Relazioni tra variabili: applicazioni Si vuole investire nel mercato azionario italiano e in quello di un altro Paese con l obiettivo di diversificare il portafoglio. Sulla base delle serie mensili delle variazioni i i del Morgan Stanley Capital Index (MSCI) riferito a Italia, Germania, Francia e Singapore si hanno i seguenti risultati: ρ Italia-Francia Italia-Germania 0.88 Italia-Singapore 0.63 Il suggerimento è di investire in titoli azionari italiani e di Singapore. Perché? 42
43 Relazioni tra variabili: applicazioni Dalla teoria economica sappiamo che esiste una relazione tra la variabile produzione (misurata tramite il valore aggiunto) e gli input fattore capitale e fattore lavoro. Dalle serie storiche ( ) delle tre variabili si ottengono i grafici di dispersione del valore aggiunto e, rispettivamente, l input di capitale e l input di lavoro 43
44 Relazioni tra variabili: applicazioni Il valore aggiunto ha una correlazione maggiore con l input di capitale (grafico a sinistra) che con l input di lavoro (grafico a destra) 44
45 Relazione tra variabili esempio [rif. Bracalente et al.2009] Per decidere le dimensioni di nuovo punto vendita, una catena di supermercati ha effettuato un indagine per studiare la relazione tra dimensione del negozio e le vendite settimanali. A tale proposito viene estratto un campione di 10 supermercati: IPOTESI DI RICERCA: Si ipotizza che a maggiori spazi espositivi tendano a corrispondere valori più elevati delle vendite
46 Rappresentiamo graficamente la distribuzione doppia V o l u m e v e n d i t e ,0 50,0 100,0 150,0 200,0 Spazio espositivo Calcoliamo la correlazione lineare Il coefficiente di correlazione lineare è molto altro ρ=0,893 Per studiare tale relazione dovremmo utilizzare un modello di regressione lineare
Corso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliCorso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
DettagliAnalisi bivariata Il caso di caratteri qualitativi
Analisi bivariata Il caso di caratteri qualitativi Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano dall analisi
DettagliRelazioni Statistiche
Relazioni Statistiche L analisi congiunta di due o più caratteri è utile per studiare le relazioni tra di essi. Analisi dell associazione Indipendenza Interdipendenza Dipendenza Tipi di relazioni tra caratteri
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte
Metodi Quantitativi per Economia, Finanza e Management Lezione n 4 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla
DettagliSTATISTICA 1 ESERCITAZIONE 6
STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
DettagliCorso di Statistica. Variabilità ed eterogeneità. Prof.ssa T. Laureti a.a
Corso di Statistica Variabilità ed eterogeneità Prof.ssa T. Laureti a.a. 03-04 Variabilità Il calcolo di una media non esaurisce la descrizione sintetica di un fenomeno osservato in un collettivo Due insiemi
DettagliAnalisi bivariata. Il caso di caratteri qualitativi
Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano
DettagliStesso valore medio per distribuzioni diverse
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliIndice di contingenza quadratica media (phi quadro) χ n
Indice di contingenza quadratica media (phi quadro) Φ χ n Proprietà L influenza del numero di unità n è eliminata Assume valore 0 se X e Y sono perfettamente indipendenti Pagina Indice di Cramer V min
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 015-016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliEsercitazione III Soluzione
Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato
DettagliAnalisi bivariata. Il caso di caratteri quantitativi
Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma
DettagliMatematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
DettagliFonti e strumenti statistici per la comunicazione
Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto
DettagliRappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 4 1. La seguente tabella riporta la distribuzione
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliAnalisi dell associazione tra due caratteri
Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliStesso valore medio per distribuzioni diverse
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 017-018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati
DettagliCorrelazione lineare e regressione
7c e regressione Se i due caratteri sono entrambi quantitativi, X e Y, possiamo studiare la loro correlazione lineare. Prima di tutto cerchiamo di capire di cosa si tratta. Se elenchiamo le N osservazioni
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliConsideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y
1 Analisi della interdipendenza lineare Quando si analizzano due o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo dettagliato la relazione che emerge dai dati,
DettagliSTATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I ( )
STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I (09.10.2003) Esercizio A. a) L unità statistica è lo studente che ha sostenuto l esame conclusivo nell ultima sessione. Il collettivo
DettagliSTATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.
STATISTICA Esonero 8 novembre 2014 Soluzione Quesito 1. Si consideri la seguente distribuzione unitaria dei salari degli impiegati di una compagnia (migliaia di euro): 2 3 5 3 2 9 3 7 8 1 a) calcolare
DettagliLezione 5 Corso di Statistica. Domenico Cucina
Lezione 5 Corso di Statistica Domenico Cucina Università Roma Tre D.Cucina (domenico.cucina@uniroma3.it) 1 / 24 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni condizionate
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
Dettaglix, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
DettagliSTATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.
STATISTICA Esonero 8 novembre 2014 Soluzione Quesito 1. Si consideri la seguente distribuzione unitaria dei salari degli impiegati di una compagnia (migliaia di euro): 3 4 6 4 3 10 4 8 9 2 a) calcolare
DettagliLezione 5 Corso di Statistica. Francesco Lagona
Lezione 5 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 23 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni
DettagliDISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliCorso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.
Corso di Statistica Indici di posizione: Medie,Moda Mediana, Quartili, Percentili Prof.ssa T. Laureti a.a. 203-204 Indicatori sintetici Gli aspetti più importanti di una distribuzione di frequenza riguardano:.
DettagliDispense Associazione PRELIMINARY DRAFT
Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di
DettagliIndipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 016-017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. La variabile casuale normale Da un analisi di bilancio è emerso che, durante i giorni feriali
DettagliCorso di Statistica. Indici di posizione: Medie,Moda Mediana, Quartili, Percentili. Prof.ssa T. Laureti a.a
Corso di Statistica Indici di posizione: Medie,Moda Mediana, Quartili, Percentili Prof.ssa T. Laureti a.a. 202-203 Corso di Statistica a.a. 202-203 DEIM, Univ.TUSCIA - Prof.ssa Laureti Indicatori sintetici
DettagliProva d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003
19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25
DettagliDistribuzioni secondo due caratteri. Rappresentazioni e prime sintesi
Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 19 Analisi dell associazione
DettagliCorso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016
Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Indici di posizione GLI INDICI DI POSIZIONE sono indici sintetici che evidenziano le caratteristiche essenziali
Dettagli1.1 Obiettivi della statistica Struttura del testo 2
Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza
DettagliLezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 26 Outline 1 2 3 4 () Statistica 2 / 26 Misura del legame Data una variabile doppia (X, Y ), la misura
DettagliLezione 6 Corso di Statistica. Francesco Lagona
Lezione 6 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 19 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliFondamenti e metodi analisi empirica nelle scienze sociali
CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliSettimana 2. G. M. Marchetti. 4 Marzo 2017
Settimana 2 G. M. Marchetti 4 Marzo 2017 1 / 54 Mediana Un indice di posizione alternativo alla media e molto usato è la mediana È basato sull ordinamento dei dati La mediana è il valore Me tale che la
DettagliMedia: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.
Misure di tendenza centrale e di variabilità: Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Il valore medio di una variabile in un gruppo di osservazioni
DettagliLa Dipendenza. Monia Ranalli. Ranalli M. Dipendenza Settimana # 3 1 / 19
La Dipendenza Monia Ranalli Ranalli M. Dipendenza Settimana # 3 1 / 19 Sommario Distribuzioni doppie Distribuzioni condizionate e marginali Analisi della dipendenza Caratteri indipendenti Massima dipendenza
DettagliCorrelazione e regressione per problemi di Luciano Corso
Correlazione e regressione per problemi di Luciano Corso Presidente della sezione di Verona della Mathesis Direttore della Rivista MatematicaMente Email: lcorso@iol.it CASTELLAMMARE DI STABIA 20180717
DettagliCorso di formazione per Mathesis
Statistica descrittiva II (Distribuzioni doppie e relazione tra variabili) 8 Marzo 2017 :: Secondo incontro Formazione Docenti :: Programma Incontro preliminare Statistica e Probabilità a Scuola :: le
DettagliUniversità degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia
Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia Esame di Statistica Descrittiva mod. B, Appello del 4/7/2007 CORREZIONE 1) Un azienda produce bulloni di diametro pari
DettagliEsercizi su Regressione e Connessione
Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliDistribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03
Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03 ESERCIZIO 1 Tra le famiglie del Comune di Vigata sono stati rilevati congiuntamente la PROFESSIONE DEL CA- POFAMIGLIA () e l AMMONTARE
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA
Dettagli8. RELAZIONE TRA CARATTERI
UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea in Scienze per l'investigazione e la Sicurezza 8. RELAZIONE TRA CARATTERI REGRESSIONE
DettagliCorso di probabilità e statistica
Università degli Studi di Verona Facoltà di Scienze MM.FF.NN. Corso di Laurea in Informatica Corso di probabilità e statistica (Prof. L.Morato) Esercizi Parte III: variabili aleatorie dipendenti e indipendenti,
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliStatistica. Congiunte. Capitolo 5. Distribuzioni di Probabilità. Chap 5-1. Statistics for Business and Economics, 6e 2007 Pearson Education, Inc.
Statistica Capitolo 5 Distribuzioni di Probabilità Congiunte Statistics for Business and Economics, 6e 2007 Pearson Education, Inc. Chap 5-1 Distribuzione di Probabilità Congiunta Una variabile casuale
DettagliLa dipendenza. Antonello Maruotti
La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno
DettagliIndice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII
Indice XI XI XIII XV XVII L Editore ringrazia Ringraziamenti Autori Prefazione Obiettivi formativi XIX Istruzioni per gli studenti XIX Un po di storia XX Cosa è la Statistica XXI Come usare questo libro
DettagliStatistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza
DettagliINDICATORI DI TENDENZA CENTRALE
INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla
DettagliLa variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le
DettagliX \Y Liceo Classico Liceo Scientifico Altro le distribuzioni di frequenza marginali relative, f i. e f.
Esercizio 1 La seguente tabella riporta la distribuzione di un collettivo di 70 studenti per numero di anni impiegati per conseguire la laurea (Y) e titolo di studio (X) X \Y 3 4 5 Liceo Classico 15 10
DettagliRegressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente
Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione
DettagliStatistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi
ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliLaboratorio di Probabilità e Statistica
Laboratorio di Probabilità e Statistica lezione 8 Massimo Guerriero Ettore Benedetti Consegna 1. Implementare delle funzioni che, accettando opportuni parametri in ingresso, risolvano le formule viste
DettagliCapitolo uno STATISTICA DESCRITTIVA BIVARIATA
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto
DettagliEsercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
DettagliProf. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale
INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla scala di misura dei dati in
DettagliEsercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a
Corso di Statistica Esercitazione.3 Indici di variabilità ed eterogeneità Concentrazione Asimmetria Prof.ssa T. Laureti a.a. 202-203 Esercizio Si considerino i seguenti dati relativi al numero di addetti
DettagliSTATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I
2. e 3. STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 1. Le unità statistiche sono costituite dai singoli ristoranti, mentre la popolazione è costituita da tutte le unità del
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo I due semplici esercizi seguenti hanno l obiettivo di consolidare le nostre nozioni in tema di
Dettagliper togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione
Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
Dettagli7. STATISTICA DESCRITTIVA
7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole
DettagliStatistiche e relazioni
tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i
Dettagli