STATISTICA DESCRITTIVA BIVARIATA
|
|
|
- Costanza Vecchi
- 9 anni fa
- Visualizzazioni
Transcript
1 STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X, X 2,,X s. Si parla di Analisi Bivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rilevano due caratteri X e Y. Può trattarsi di due caratteri qualitativi (ovvero mutabili), o di due caratteri quantitativi (ovvero variabili), oppure di un carattere qualitativo e di un carattere quantitativo. Distribuzione bivariata semplice X x x 2 x i x n Y y y 2 y i y n Distribuzione bivariata doppia o congiunta: TABELLA A DOPPIA ENTRATA ( TABELLA DI CONTINGENZA) X Y Y 2 Y j Y h Y X f f 2 f j f h f X 2 f 2 f 22 f 2j f 2h f 2 : : : : : : : :. : : : X i f i f i2 f ij f ih f i : : : : : : : : : : : : X k f k f k2 f kj f kh f k f f 2 f j f h N ij f FREQUENZA CONGIUNTA ASSOLUTA: è il numero delle volte con cui la coppia di modalità (x i, y j ) si presenta, ovvero la frequenza con la quale, su di un unità statistica, il carattere X assume la modalità x i e contemporaneamente il carattere Y assume la modalità y j.
2 h = j= f i f ij Frequenza assoluta MARGINALE per Riga (: riferita alla riga i-ma): esprime la frequenza della modalità i-ma del carattere X per riga, senza tener conto delle modalità dell altro carattere Y. f k j = f ij i= Frequenza assoluta MARGINALE per Colonna (: riferita alla colonna j- ma): esprime la frequenza della modalità j-ma del carattere Y per colonna, senza tener conto delle modalità dell altro carattere X. Da cui vale la seguente uguaglianza: N = h k fij = j = i= i= k h i = j= f f j Distribuzione marginale o Distribuzione univariata del carattere X: data una distribuzione doppia di frequenze relativa alla rilevazione di N unità statistiche, si definisce distribuzione marginale del carattere X la distribuzione statistica semplice delle N unità statistiche secondo il carattere X. X f(x) X f X i X k f i f k N Distribuzione marginale o Distribuzione univariata del carattere Y: data una distribuzione doppia di frequenze relativa alla rilevazione di N unità statistiche, si definisce distribuzione marginale del carattere Y la distribuzione statistica semplice delle N unità statistiche secondo il carattere Y. Y f(y) Y f Y j Y h f j f h N
3 R f ij FREQUENZA CONGIUNTA RELATIVA: è la proporzione dei casi in cui, su una popolazione di N unità statistiche, la coppia di modalità (x i, y j ) si presenta: f R ij = f ij N h k j= i= R f ij = NOTAZIONE Frequenza congiunta assoluta f ij (notazione Cicchitelli n ij ) Frequenza assoluta MARGINALE per Riga f i (notazione Cicchitelli i0 n ) Frequenza assoluta MARGINALE per Colonna f j (notazione Cicchitelli n 0 j ) ESEMPIO Si analizzano 000 famiglie secondo la variabile X = numero di auto possedute dalla famiglia e Y = numero di componenti della famiglia. I risultati di tale rilevazione sono raccolti nella seguente Tabella a doppia entrata: Y X
4 Y X Distribuzioni univariate: X f(x) Y f(y) Tabella a doppia entrata di Frequenze congiunte relative: Y X ,0 0,02 0,02 0,5 0,05 0,25 0,085 0,085 0,33 0,05 0,05 0,6 2 0,005 0,085 0, , 3 0 0,0 0, ,05 0, 0,2 0,4 0,2 0, Distribuzioni univariate relative: X f R (x) Y f R (y) 0 0,25 0, 0,60 2 0,2 2 0,0 3 0,4 3 0,05 4 0,2,00 5 0,,0
5 DISTRIBUZIONI CONDIZIONATE La Distribuzione CONDIZIONATA di X dato y j (carattere CONDIZIONATO X/Y=y j ) si ottiene fissando una modalità y j per il carattere Y ed esaminando la distribuzione di X limitatamente alle unità statistiche che possiedono quella modalità y j per il carattere Y: X/Y=y j frequenze assolute relative X f j f j /f j X i f ij f ij /f j X k f kj f kj /f j f j (per ogni j, con j=,,h) La Distribuzione CONDIZIONATA di Y dato x i (carattere CONDIZIONATO Y/X=x i ) si ottiene fissando una modalità x i per il carattere X ed esaminando la distribuzione di Y limitatamente alle unità statistiche che possiedono quella modalità x i per il carattere X: Y/X=x i frequenze assolute relative Y f i f i /f i Y j f ij f ij /f i Y h f ih f ih /f i f i (per ogni i, con i=,,k)
6 Esempio di distribuzione condizionata (v. esempio precedente di tabella a doppia entrata): frequenze frequenze X/Y=2 assolute relative Y/X= assolute relative , , , , , , , , , ,
7 Media aritmetica della SOMMA di 2 o più variabili statistiche Siano X, X 2,,X s delle variabili statistiche costituite ognuna da n determinazioni, di media, rispettivamente m, m 2,,m s, e sia Z= X +X 2 + +X s la loro somma. La media della SOMMA risulta uguale alla somma delle medie dei singoli addendi: M(z)=M(x )+M(x 2 )+ +M(x s )= m +m 2 + +m s ESERCIZIO Sui seguenti dati: Determinare la variabile Z=X+Y. Di essa: Y X a) presentare la distribuzione di probabilità; b) calcolare la media di Z e verificare le relazione che lega la media della somma alle medie degli addendi; SOLUZIONI a) z f(z) p(z) z*f(z) , , , , , , ,
8 b) M(z)=060/2000=5,08 x f(x) x*f(x) y f(y) y*f(y) M(x)=2530/2000=,265 M(y)=7630/2000=3,85 M(z)=5,08=M(x)+M(y)=,265+3,85=5,08
9 Varianza della SOMMA di due o più variabili statistiche Siano X, X 2,,X s delle variabili statistiche costituite ognuna da n determinazioni, di media e varianza, rispettivamente m, m 2,,m s, e σ, σ,, 2 σ s, sia la loro somma. Z= X +X 2 + +X s La varianza della somma risulta uguale a V ( z) = σ s s σ 2... σ s 2 Cov i, i= j = i+ ( x x ) j s ( ) Dove il simbolo s Cov x i, x j i= j= i+ indica la somma di tutte le s s! = 2 2!( s 2)! Covarianze ottenibili associando fra di loro s variabili prese 2 a 2.
10 ESERCIZIO (Variabile SOMMA) Le famiglie di un Comune sono state classificate secondo i caratteri X n. di viaggi all estero e Y n. di viaggi in Italia. I risultati sono i seguenti: Y X a) definire la variabile somma Z = X + Y e dare la distribuzione di frequenze di Z. b) Verificare la relazione esistente fra la media della somma e le medie delle variabili; c) Verificare la relazione esistente fra la varianza della somma e le varianze delle variabili. SOLUZIONI a) z f(z) b) z f(z) z*f(z) M(z)=820/400=4,55
11 X f(x) x*f(x) y f(y) y*f(y) M(x)=720/400=,8 M(y)=00/400=2,75 M(z)= M(x)+M(y)=,8+2,75=4,55 c) z f(z) z*f(z) z 2 *f(z) Var(z)=0740/400-(4,55) 2 =26,85-20,7025=6,475 Var(z)= V(x)+V(y)+2*Cov(x,y) X f(x) x*f(x) x 2 *f(x) Var(x)=860-(,8) 2 =,4 y f(y) y*f(y) y 2 *f(y) Var(y)=3880/400-(2,75) 2 =2,375 Cov(x,y)=M(x*y)-M(x)*M(y)
12 x*y fxy x*y*fxy M(x*y)=2500/400=6,25 Cov(x,y)=6,25-(,8)*(2,75)=,3 Var(z)= V(x)+V(y)+2*Cov(x,y)=,4+2,375+2*,3=6,475 (c.v.d)
13 Media aritmetica del PRODOTTO di 2 variabili statistiche Sia X una variabile di media M(x)=m x e Y una variabile di media M(y)=m y. Sia Z=X Y la variabile PRODOTTO delle due variabili. La media aritmetica di Z risulta: M ( Z ) = M ( X Y ) = m m Cov( x, y) x y + ESERCIZIO (Variabile PRODOTTO) Date le variabili X e Y, calcolare la media del prodotto Z=X Y. Metodo diretto di calcolo: X Y M(Z)=80/5=6 X Y Z
14 Metodo indiretto di calcolo: M(x)=5/5=3 M(y)=30/5=6 M(z)=3*6+(-0/5)=8-2=6 X Y x-m x y-m y (x-m x )(y-m y )
STATISTICA DESCRITTIVA BIVARIATA
STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X 1, X 2,,X s. Si
La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente
La statistica descrittiva seconda parte a cura della prof.ssa Anna Rita Valente INDICI DI POSIZIONE CENTRALE Sono dei valori che descrivono in modo sintetico una serie di dati raccolti. I più semplici
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. La variabile casuale normale Da un analisi di bilancio è emerso che, durante i giorni feriali
Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
Distribuzioni di due variabili aleatorie
Statistica e analisi dei dati Data: 6 Maggio 206 Distribuzioni di due variabili aleatorie Docente: Prof. Giuseppe Boccignone Scriba: Noemi Tentori Distribuzioni congiunte e marginali Consideriamo due variabili
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA
La dipendenza. Antonello Maruotti
La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
Lezione 5 Corso di Statistica. Francesco Lagona
Lezione 5 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona ([email protected]) 1 / 23 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni
Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
Variabili casuali multidimensionali
Capitolo 1 Variabili casuali multidimensionali Definizione 1.1 Le variabili casuali multidimensionali sono k-ple ordinate di variabili casuali unidimensionali definite sullo stesso spazio di probabilità.
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.
Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 26 Outline 1 2 3 4 () Statistica 2 / 26 Misura del legame Data una variabile doppia (X, Y ), la misura
Statistica descrittiva con fogli di calcolo. Stoianov, Ceccato
Statistica descrittiva con fogli di calcolo Stoianov, Ceccato Distribuzioni di probabilità empirica 1) OSSERVAZIONI campione X: N osservazioni {x 1,x 2 x N } scala di misura Y K livelli [y 1 y K ] Esempio:
Variabili casuali multidimensionali
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA
STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
Esercitazioni del corso: RELAZIONI TRA VARIABILI
A. A. 009 010 Esercitazioni del corso: RELAZIONI TRA VARIABILI Isabella Romeo: [email protected] ommario Esercitazione 1: Tabelle a doppia entrata Distribuzioni marginali e condizionate Indipendenza
ANALISI STATISTICHE BIVARIATE. Tabelle di contingenza
ANALISI STATISTICHE BIVARIATE Tabelle di contingenza 1 Analisi Statistica Bivariata Generalmente, lo studio quantitativo di un fenomeno di interesse si svolge rilevando contemporaneamente più caratteri
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte
Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla
Analisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E possibile,
ESERCIZI STATISTICA DESCRITTIVA
ESERCIZI STATISTICA DESCRITTIVA Frequenze assolute e relative Titolo di studio Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza
Paolo Baldi Appunti di Metodi Matematici e Statistici, 1996, Ediz CLUEB. Giovanni Prodi Metodi Matematici e Statistici, 1992, Ediz.
S.S.I.S. TOSCANA F.I.M. II ANNO STATISTICA BIBLIOGRAFIA DI RIFERIMENTO: Paolo Baldi Appunti di Metodi Matematici e Statistici, 1996, Ediz CLUEB Giovanni Prodi Metodi Matematici e Statistici, 199, Ediz.
Calcolo delle Probabilità 2
Prova d esame di Calcolo delle Probabilità 2 Maggio 2006 Sia X una variabile aleatoria distribuita secondo la densità seguente ke x 1 x < 0 f X (x) = 1/2 0 x 1. 1. Determinare il valore del parametro reale
Compiti tematici dai capitoli 2,3,4
Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica
Cognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
I VETTORI GAUSSIANI E. DI NARDO
I VETTOI GAUSSIANI E. DI NADO. L importanza della distribuzione gaussiana I vettori di v.a. gaussiane sono senza dubbio uno degli strumenti più utili in statistica. Nell analisi multivariata, per esempio,
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
Corso di Psicometria Progredito
Corso di Psicometria Progredito 43 I principali test statistici per la verifica di ipotesi: Il test del χ 2 per tavole di contingenza a 2 vie Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia
Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi
Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni
Relazioni tra variabili: le tabelle di contingenza
Lezione 6 Relazioni tra variabili: le tabelle di contingenza "The Physicians Health Study" è uno studio clinico randomizzato condotto allo scopo di valutare il possibile effetto di riduzione della mortalità
CALCOLO DELLE PROBABILITÀ - 9 giugno 1998 Scrivere le risposte negli appositi spazi Motivare dettagliatamente le risposte su fogli allegati
CALCOLO DELLE PROBABILITÀ - 9 giugno 1998 1. Dati gli eventi A,B,C, ognuno dei quali implica il successivo, e tali che P (A) è metà della probabilità di B, che a sua volta ha probabilità metà di quella
Prova scritta di Statistica
Prova scritta di Statistica 5 Febbraio 2016 1. Da un indagine riguardante l utilizzo del telefono cellulare si sono ottenuti i seguenti risultati: Età No.telefonini Chiamate Spesa sett. Bluetooth 20 2
Elaborazione statistica di dati
Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:
Esercizi di Calcolo delle Probabilità
Esercizi di Calcolo delle Probabilità Versione del 1/05/005 Corso di Statistica Anno Accademico 00/05 Antonio Giannitrapani, Simone Paoletti Calcolo delle probabilità Esercizio 1. Un dado viene lanciato
1.1 Obiettivi della statistica Struttura del testo 2
Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza
Istituzioni di Statistica
Istituzioni di Statistica CORSO DI LAUREA IN ECONOMIA DEL COMMERCIO INTERNAZIONALE CORSO DI LAUREA IN ECONOMIA E AMMINISTRAZIONE DELLE IMPRESE A.A. 2007/2008 DOCENTE: Marco Minozzo PROGRAMMA - STATISTICA
Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 16/06/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Cinque lettere
NOZIONI DI CALCOLO DELLE PROBABILITÀ
NOZIONI DI CALCOLO DELLE PROBABILITÀ ESPERIMENTO CASUALE: un esperimento si dice casuale quando gli esiti (manifestazioni o eventi) non possono essere previsti con certezza. PROVA: le ripetizioni, o occasioni
Ulteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
