DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI. Ci limiteremo a considerare il caso di due variabili.

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI. Ci limiteremo a considerare il caso di due variabili."

Transcript

1 DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI Sinora abbiamo considerato l analisi di un unica variabile per volta Tuttavia, le rilevazioni su un unità statistica sono in generale relative ad un insieme di variabili (confronto con la matrice di dati vista nella prima lezione) Ci limiteremo a considerare il caso di due variabili Siano X e Y due variabili che possono essere entrambe qualitative, entrambe quantitative, oppure una di un tipo e una di un altro Distribuzioni doppie unitarie (dati bivariati in forma grezza) Unità (X, Y ) 1 (x 1, y 1 ) Coppia di modalità osservate 2 (x 2, y 2 ) su ciascuna unità statistica i (x i, y i ) N (x N, y N ) In questo caso su ogni unità statistica rileviamo una coppia di modalità, quella di X e quella di Y Esempi: Per ogni persona, sesso e età; per ogni azienda, settore e fatturato; per ogni nucleo familiare, reddito e consumo mensile 84

2 Alcuni dati sul Titanic Dopo il disastro, una commissione d inchiesta del British Board of Trade ha compilato una lista di tutti i 1316 passeggeri con alcune informazioni aggiuntive riguardanti: l esito (salvato, non salvato), la classe (I,II, III) in cui viaggiavano, il sesso, l età, ecc Ci limitiamo a considerare le informazioni sull esito e la classe I dati bivariati in forma grezza saranno del tipo Passeggero Classe Esito nome 1 II salvato nome 2 III non salvato nome 3 I non salvato nome 1316 III salvato 85

3 Una prima sintesi che possiamo operare consiste nel costruire una tabella del tipo Classe Esito I II III Totale Salvato Non Salvato Totale chiamata Tabella a doppia entrata o Tabella di contingenza Ci dice, ad esempio, che 203 è il numero di passeggeri che viaggiavano in I classe e sono sopravvissuti Analogamente, 528 è il numero di passeggeri che viaggiavano in III classe e non sono sopravvissuti Ci dice ancora che 499 è il numero complessivo di passeggeri che sono sopravvissuti, a prescindere dalla classe, e, similmente, che 285 è il numero di passeggeri che viaggiavano in II classe, a prescindere dall esito del disastro 86

4 Una tabella di contingenza contiene diverse informazioni Parte centrale della tabella: Distribuzione di frequenza assoluta congiunta delle due variabili Classe Esito I II III Totale Salvato Non Salvato Totale I bordi della tabella: Distribuzione di frequenza assoluta marginale (di una sola variabile) Classe Esito I II III Totale Salvato Non Salvato Totale Distribuzione marginale della variabile Esito, a prescindere dalla variabile Classe 87

5 Classe Esito I II III Totale Salvato Non Salvato Totale Distribuzione marginale della variabile Classe, a prescindere dalla variabile Esito Una sola riga (o colonna): Distribuzione di frequenza assoluta di una variabile condizionata ad una modalità dell altra variabile Classe Esito I II III Totale Salvato Non Salvato Totale Distribuzione della variabile Classe condizionata alla modalità Salvato della variabile Esito: guardiamo alla distribuzione delle frequenze assolute della variabile Classe limitando l attenzione ai sopravvissuti 88

6 Classe Esito I II III Totale Salvato Non Salvato Totale Distribuzione della variabile Esito condizionata alla modalità II classe della variabile Classe: guardiamo alla distribuzione delle frequenze assolute della variabile Esito limitando l attenzione ai viaggiatori della II classe N B: Le distribuzioni marginali e condizionate sono distribuzioni univariate, per le quali valgono tutte le considerazioni fatte nella prima parte del corso 89

7 STRUTTURA GENERALE DI UNA TABELLA A DOPPIA ENTRATA Variabile X con modalità x 1, x 2,, x r Variabile Y con modalità y 1, y 2,, y s Y X y 1 y 2 y j y s Totale x 1 n 11 n 12 n 1j n 1s n 1 x 2 n 21 n 22 n 2j n 2s n 2 x i n i1 n i2 n ij n is n i x r n r1 n r2 n rj n rs n r Totale n 1 n 2 n j n s N Quando una o entrambe le variabili sono continue o discrete con molte modalità, le righe e/o le colonne possono anche corrispondere alle classi di suddivisione della variabile 90

8 Distribuzione di frequenza assoluta congiunta (parte centrale della tabella) Y X y 1 y 2 y j y s x 1 n 11 n 12 n 1j n 1s x 2 n 21 n 22 n 2j n 2s x i n i1 n i2 n ij n is x r n r1 n r2 n rj n rs N n ij = numero di unità con la modalità i esima di X e j esima di Y = frequenza assoluta congiunta della coppia (x i, y j ) r i=1 s j=1 n ij = N 91

9 Distribuzioni di frequenza assoluta marginali (bordi della tabella) X x 1 n 1 x 2 n 2 x i n i x r n r Totale N n i =numero di unità che hanno il valore x i della variabile X senza tener conto del valore della Y = frequenza assoluta marginale di x i n i = s j=1 n ij Y y 1 n 1 y 2 n 2 y j y s n j n s Totale N n j =numero di unità che hanno il valore y j della variabile Y senza tener conto del valore della X= frequenza assoluta marginale di y j n j = r i=1 n ij 92

10 Distribuzione di frequenza assoluta di X condizionata alla modalità y j di Y (colonna j esima della tabella) Si denota con X Y = y j o X y j X x 1 x 2 x i x r n 1j n 2j n ij n rj Totale n j È una distribuzione univariata Una tabella a doppia entrata contiene s distribuzioni condizionate di X Distribuzione di frequenza assoluta di Y condizionata alla modalità x i di X (riga i esima della tabella) Si denota con Y X = x i o Y x i Y y 1 y 2 y j y s n i1 n i2 n ij n is Totale n i È una distribuzione univariata Una tabella a doppia entrata contiene r distribuzioni condizionate di Y 93

11 DISTRIBUZIONI DI FREQUENZA RELATIVA Y X y 1 y 2 y j y s ToT x 1 f 11 f 12 f 1j f 1s f 1 x 2 f 21 f 22 f 2j f 2s f 2 frequenze relative x i f i1 f i2 f ij f is f i marginali di X x r f r1 f r2 f rj f rs f r ToT f 1 f 2 f j f s 1 frequenze relative marginali di Y f ij =frequenza relativa congiunta della coppia (x i, y j )= n ij N r s i=1 j=1 f ij = 1 f i =frequenza relativa marginale di x i = n i N = s j=1 f ij f j =frequenza relativa marginale di y j = n j N = r i=1 f ij Esempio TITANIC Classe Esito I II III Totale Salvato 0,15 0,09 0,14 0,38 Non Salvato 0,09 0,13 0,40 0,62 Totale 0,25 0,22 0,

12 Distribuzione di frequenza relativa di X condizionata alla modalità y j di Y X freq ass X freq rel x 1 n 1j x 1 n 1j /n j x 2 n 2j x 2 n 2j /n j x i n ij x i n ij /n j x r n rj x r n rj /n j Totale n j Totale 1 ATTENZIONE: Le frequenze relative congiunte f ij NON sono le frequenze relative condizionate!! Si noti che n ij /n j = f ij /f j Esempio TITANIC Classe Esito I II III Salvato Non Salvato Totale Classe Esito I II III Salvato 0,62 0,41 0,25 Non Salvato 0,38 0,59 0,75 Totale

13 Distribuzione di frequenza relativa di Y condizionata alla modalità x i di X Y freq ass Y freq rel y 1 y 2 y j y s n i1 n i2 n ij n is y 1 n i1 /n i y 2 n i2 /n i y j n ij /n i y s n is /n i Totale n i Totale 1 Si noti che n ij /n i = f ij /f i Esempio TITANIC Classe Esito I II III Totale Salvato Non Salvato Classe Esito I II III Totale Salvato 0,41 0,24 0,36 1 Non Salvato 0,15 0,20 0,

14 Medie e varianze marginali e condizionate Si consideri il caso in cui X è quantitativa Poiché le distribuzioni marginali e condizionate di X sono univariate, possiamo calcolare medie e varianze marginali e condizionate Marginali M(X) = 1 r N i=1 x i n i = r i=1 x i f i V (X) = 1 r N i=1 x2 i n i M 2 (X) Condizionate M(X Y = y j ) = 1 n j r i=1 x in ij V (X Y = y j ) = 1 n j r i=1 x in ij M 2 (X Y = y j ) calcolabili per ogni j = 1,, s Analogo ragionamento per Y, se è quantitativa Esempio Voto all esame Sesso Totale M F Totale M(Voto)= = V(Voto)= =2 M(Voto Sesso=M)= = 28 M(Voto Sesso=F)= = V(Voto Sesso=M)= = 3, V(Voto Sesso=F)= = 0, 8 97

15 DIPENDENZA E INDIPENDENZA STATISTICA (IN DISTRIBUZIONE) TRA DUE VARIABILI Spesso due caratteri vengono osservati insieme per vedere se vi è tra loro dipendenza Si vuole, allora, usare i dati della tabella a doppia entrata per stabilire se tra X e Y c è dipendenza o se sono tra loro indipendenti Riprendiamo l esempio del TITANIC Le distribuzioni di frequenza relativa della variabile Esito condizionate alle tre modalità della variabile Classe sono: Classe Esito I II III freq rel marg di Esito Salvato 0,62 0,41 0,25 0,38 Non Salvato 0,38 0,59 0,75 0,62 Totale È evidente che l Esito dipende dalla Classe Si noti, infatti, che in I classe si è salvato il 62% dei passeggeri, mentre in III classe solo il 25% dei passeggeri è sopravvissuto (viene da pensare che i viaggiatori della I classe abbiano avuto un trattamento preferenziale) NB: Il confronto tra le tre distribuzioni condizionate ha senso solo in termini di frequenze relative; non ha senso in termini di frequenze assolute, poiché le marginali della Classe sono diverse Ad esempio, è sbagliato dire che si sono salvate più persone nella III classe rispetto alla II classe (178 contro 118), dato che 178 rappresenta solo il 25% del numero complessivo di passeggeri della 98

16 III classe, mentre 118 rappresenta ben il 41% del numero complessivo di passeggeri della II classe Se l Esito e la Classe fossero indipendenti, ci aspetteremmo di osservare delle distribuzioni di frequenza relativa condizionate fatte in questo modo: Classe Esito I II III freq rel marg di Esito Salvato 0,38 0,38 0,38 0,38 Non Salvato 0,62 0,62 0,62 0,62 Totale ossia 1 tutte uguali tra loro 2 uguali alla distribuzione di frequenza relativa marginale di Esito, dato che questa non tiene conto della suddivisione in classi Questo ragionamento intuitivo si formalizza nella definizione di indipendenza statistica (o in distribuzione) DEFINIZIONE: X è statisticamente indipendente da Y se le s distribuzioni di frequenza relativa di X condizionate alle modalità di Y sono uguali alla distribuzione di frequenza relativa marginale di X: n ij n j = n i N per ogni i = 1,, r e per ogni j = 1,, s 99

17 L indipendenza è un concetto simmetrico Vale, infatti, la seguente proposizione PROPOSIZIONE: Se X è indipendente da Y, allora Y è indipendente da X e viceversa DIMOSTRAZIONE: X indipendente da Y equivale a da cui n ij n j = n i N n ij = n j n i N i = 1,, r j = 1,, s i = 1,, r j = 1,, s ossia le r distribuzioni di frequenza relativa di Y condizionate alle modalità di X sono tutte uguali alla distribuzione di frequenza relativa marginale di Y e quindi Y è statisticamente indipendente da X Analogamente, Y indipendente da X equivale a da cui n ij = n j n i N n ij n j = n i N i = 1,, r j = 1,, s i = 1,, r j = 1,, s ossia le s distribuzioni di frequenza relativa di X condizionate alle modalità di Y sono tutte uguali alla distribuzione di frequenza relativa marginale di X e quindi X è statisticamente indipendente da Y In base a questa proposizione possiamo tranquillamente parlare di indipendenza di X e Y senza specificare la direzione 100

18 In sintesi, X e Y sono indipendenti se le distribuzioni di frequenza relativa di X Y sono uguali alla distribuzione di frequenza relativa marginale di X e se le distribuzioni di frequenza relativa di Y X sono uguali alla distribuzione di frequenza relativa marginale di Y Dalla definizione di indipendenza, dire che X e Y sono statisticamente indipendenti equivale a n ij = n i n j N ossia ogni frequenza assoluta congiunta n ij è pari al prodotto del totale della riga i e il totale della colonna j diviso per il numero complessivo di unità 101

19 DIPENDENZA Abbiamo visto cosa significa indipendenza tra X e Y Se X e Y non sono indipendenti, allora vi è dipendenza Casi estremi di dipendenza: MASSIMA ASSOCIAZIONE (DIPENDENZA PERFETTA): Y dipende perfettamente da X se in corrispondenza ad ogni modalità di X si verifica una sola modalità di Y (ossia, per ogni i si ha un solo j tale che n ij 0) INTERDIPENDENZA PERFETTA: se ciascuna variabile dipende perfettamente dall altra Esempio Y X y 1 y 2 y 3 x x x x Y dipende perfettamente da X, ma X non dipende perfettamente da Y L interdipendenza perfetta è possibile solo in tabelle La dipendenza perfetta è rara, si osserva esclusivamente quando tra le due variabili esiste una dipendenza deterministica (una delle due variabile è funzione dell altra) 102

20 MISURA DI ASSOCIAZIONE IN UNA TABELLA A DOPPIA ENTRATA: L INDICE CHI QUADRATO Come valutiamo se una tabella doppia osservata è vicina o lontana dalla situazione di indipendenza? Possiamo calcolare i valori teorici delle frequenze assolute congiunte che si avrebbero nel caso in cui X e Y fossero indipendenti: n ij = n i n j N e confrontarli con le frequenze assolute congiunte effettivamente osservate n ij Se rileviamo delle differenze notevoli tra le due frequenze abbiamo l indicazione che tra le due variabili non c è indipendenza Potremmo pensare di costruire le differenze c ij = n ij n ij e ottenere una misura dell associazione nella tabella osservata dall indice r s i=1 j=1 Il problema è che questo indice è sempre identicamente uguale a 0, dato che r s r s n ij = N = Infatti, r s n ij = i=1 j=1 i=1 r i=1 j=1 s j=1 n i n j N 103 c ij = 1 N i=1 r i=1 j=1 n i n ij s j=1 n j = N2 N = N

21 Possiamo ovviare a questo problema usando c 2 ij al posto di c ij Il principale indice utilizzato per misurare l associazione in una tabella è l indice chi quadrato: r s χ 2 c 2 r s ij (n ij n ij = = )2 i=1 j=1 n ij i=1 j=1 n ij Caratteristiche dell indice chi quadrato 1 χ χ 2 = 0 nel caso di indipendenza tra X e Y 3 χ 2 è tanto più grande quanto più ci allontaniamo dal caso di indipendenza 4 può essere calcolato anche attraverso la formula r s χ 2 n 2 ij = N( 1) n i n j i=1 j=1 5 è un indice di dipendenza simmetrico: non tiene conto della direzione della dipendenza (causa effetto) e rimane invariato se scambiamo il ruolo di X e Y 104

22 Il valore dell indice chi quadrato dipende anche da N e dalla dimensione della tabella (r e s) Per facilitarne l interpretazione, si ricorre spesso a indici normalizzati (compresi tra 0 e 1) derivati da χ 2 In particolare, è frequente l uso di T = χ 2 N min(r 1, s 1) e V = T Sono entrambi compresi tra 0 e 1 Entrambi sono pari a 1 in caso di interdipendenza perfetta T tende a sottovalutare il livello di dipendenza, questo problema è un pò attenuato con l uso di V Esempi di calcolo dell indice chi quadrato 1 IL TITINIC Classe Esito I II III Totale Salvato Non Salvato Totale La tabella delle frequenze teoriche sotto l ipotesi di indipendenza, n ij = n i n j /N, è Classe Esito I II III Totale Salvato = 123, 2 108, = 267, Non Salvato = 201, 8 176, = 438, Totale

23 Il confronto tra frequenze teoriche e frequenze osservate è istruttivo Ad esempio, ci indica che, senza la preferenza accordata ai passeggeri di I classe, si sarebbero salvati un centinaio di passeggeri di III classe in più χ 2 = ( , 2) , 2 V = ( , 1)2 ( , 3) , 1 438, 3 133, min(3 1, 2 1) = 0, 32 che indica un certo grado di associazione tra Classe ed Esito 2 ATTEGGIAMENTO RIGUARDO L IM- MIGRAZIONE DI EXTRA COMUNITARI = 133, 05 Area di provenienza Atteggiamento Nord Centro Sud Isole Totale Favorevoli Contrari Totale Costruiamo le 4 distribuzioni di frequenza relativa dell Atteggiamento condizionate all Area di provenienza 106

24 Area di provenienza freq rel marg Atteggiamento Nord Centro Sud Isole di Atteggiamento Favorevoli 0,219 0,355 0,433 0,178 0,327 Contrari 0,781 0,645 0,567 0,822 0,633 Totale Da cui notiamo, ad esempio, che la percentuale di favorevoli al Sud è superiore sia rispetto al Nord che rispetto al Centro Questo ci fa pensare che ci sia una qualche forma di associazione tra le due variabili Ricordiamo che, se le due variabili fossero indipendenti, le distribuzioni di frequenza relativa dell Atteggiamento condizionate all Area di provenienza dovrebbero essere uguali alla distribuzione di frequenza relativa marginale dell Atteggiamento, ossia, si dovrebbe avere una tabella del tipo Area di provenienza freq rel marg Atteggiamento Nord Centro Sud Isole di Atteggiamento Favorevoli 0,327 0,327 0,327 0,327 0,327 Contrari 0,633 0,633 0,633 0,633 0,633 Totale Per valutare il grado di associazione all interno della tabella osservata, costruiamo l indice chi quadrato, partendo dalla tabella delle frequenze teoriche sotto l ipotesi di indipendenza che risulta essere 107

25 Area di provenienza Atteggiamento Nord Centro Sud Isole Totale Favorevoli 119,6 94,8 137,2 29,4 381 Contrari 246,4 195,2 282,8 60,6 785 Totale Possiamo calcolare l indice chi quadrato: χ 2 = (80 119, 6)2 (103 94, 8)2 (74 60, 6) , 6 94, 8 60, 6 e da questo V = 51, 3 = 0, min(2 1, 4 1) = 51, 3 che indica una forma di associazione tra le due variabili, seppure non molto forte 108

26 Talvolta sono possibili associazioni spurie, ossia la presenza di un legame statistico empirico tra due variabili logicamente indipendenti Spesso sono dovute ad una variabile latente Esempio -R=reddito basso, +R=reddito medio-alto <165=statura< 165 cm, 165=statura 165cm Maschi -R +R < Femmine -R +R < Totale -R +R < V=0,004 V=0,005 V=0,19 Si provi a calcolare l indice chi quadrato tra Sesso e Reddito 109

27 Esercizi Si usino i dati del TITANIC 1 Potrebbe venire il dubbio che la preferenza accordata alla I classe sia dipesa dal fatto che in I classe viaggiava un numero più elevato di donne e di bambini (associazione spuria) e quindi che quello che abbiamo osservato era semplicemente una manifestazione di una politica di salvataggio del tipo prima le donne e i bambini La seguente tabella si riferisce solo alle donne e ai bimbi Classe Esito I II III Salvato Non Salvato Lo studenti commenti questa nuova tabella e calcoli la distribuzione di frequenza relativa congiunta; le distribuzioni di frequenza relativa marginale di entrambe le variabili; le distribuzioni di frequenza relativa dell Esito condizionate alla Classe; l indice chi quadrato 2 Lo studente ricostruisca dai dati forniti la distribuzione congiunta di Esito e Classe riferita solo ai maschi e la analizzi con le tecniche studiate 110

28 DIPENDENZA DI UNA VARIABILE QUANTITATIVA DA UNA QUALITATIVA Spesso si osserva una variabile quantitativa Y classificata secondo le modalità di una variabile qualitativa X e l interesse principale riguarda l analisi del comportamento di quella quantitativa Più precisamente, si vuole verificare se l analisi di Y può essere approfondita quando, invece di analizzare l intero insieme delle sue osservazioni indistintamente, si considerano queste suddivise in classi identificate dalle modalità della variabile qualitativa Ad esempio, la distribuzione del reddito pro capite (Y ) per provincia italiana (X), oppure il peso (Y ) per uomini/donne (X) In questi contesti, i dati sono organizzati per gruppi distinti: X x 1 x 2 x 3 x r y 11 y 12 y 13 y 1r y n3,3 y nr,r y n2,3 y n1,1 111

29 Si noti che le y della tabella non sono frequenze, ma le osservazioni della variabile Ciascuna colonna della tabella ci dà la distribuzione di Y condizionata a ciascuna delle modalità di X: Y X = x i Per verificare quanto è utile la suddivisione in gruppi, bisogna sapere se queste distribuzioni condizionate sono simili oppore no Vogliamo quindi rappresentare in modo sintentico ciascuna distribuzione Y X = x i Due delle soluzioni possibili sono: 1 Costruzione di una tabella a doppia entrata Possiamo raggruppare la variabile Y in s classi In tal modo, otteniamo una tabella a doppia entrata per la quale possiamo verificare se c è indipendenza guardando al valore dell indice chi quadrato La tabella avrà la seguente forma Y X y 0 y 1 y 1 y 2 y s 1 y s Totale x 1 n 11 n 12 n 1s n 1 x 2 n 21 n 22 n 2s n 2 x r n r1 n r2 n rs n r Totale n 1 n 2 n s N 112

30 2 Rappresentazione grafica di ciascuna distribuzione condizionata Possiamo rappresentare graficamente ciascuna distribuzione condizionata Y X = x i, ad esempio tramite istogramma, e confrontare i diversi istogrammi Se tutti gli istogrammi sono uguali, allora le distribuzioni condizionate sono uguali e non vi è dipendenza statistica tra Y e X Tuttavia, il confronto degli istogrammi potrebbe essere laborioso e di difficile interpretazione Può risultare più agevole un confronto dei boxplot Ancora, se tutti i boxplot sono uguali, Y e X sono indipendenti 113

31 Numero di insetti A B C D E F Tipo di Spray Esempio di confronto mediante boxplot: distribuzione del numero di insetti rilevati su unità agricole trattate con 6 differenti tipi di insetticida (A, B, C, D, E e F) Non solo dal confonto possiamo concludere che c è dipendenza del numero di insetti Y dal tipo di insetticida adottato X, ma possiamo anche notare che alcuni insetticidi (C, D e E) hanno un efficacia nettamente superiore agli altri 114

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 43 I principali test statistici per la verifica di ipotesi: Il test del χ 2 per tavole di contingenza a 2 vie Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni

Dettagli

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Esercizio 1 Per stimare la percentuale di fumatori nella popolazione italiana adulta viene intervistato un campione di 60 donne e uno di 40

Dettagli

Analisi congiunta di più fenomeni

Analisi congiunta di più fenomeni Analisi congiunta di più fenomeni Dati relativi al disastro del Titanic: Morti Sopravvissuti Classe Sesso Età 1 a Uomini Bambini 0 5 Adulti 118 57 Donne Bambini 0 1 Adulti 4 140 2 a Uomini Bambini 0 11

Dettagli

La dipendenza. Antonello Maruotti

La dipendenza. Antonello Maruotti La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno

Dettagli

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.

Dettagli

Statistica dei consumi alimentari e delle tendenze nutrizionali Lezione 6-16/10/2015

Statistica dei consumi alimentari e delle tendenze nutrizionali Lezione 6-16/10/2015 Statistica dei consumi alimentari e delle tendenze nutrizionali Lezione 6-16/10/2015 a.a. 2015/16 Prof. Maria Francesca Romano mariafrancesca.romano@sssup.it Libri di riferimento per la statistica descrittiva

Dettagli

L affondamento del Titanic

L affondamento del Titanic L affondamento del Titanic Livello scolare: biennio Abilità interessate Identificare situazioni che richiedono di rilevare lo stesso carattere su una unità statistica formata da elementi, o caratteri diversi

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 4. STATISTICA DESCRITTIVA ESERCIZI Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144

Dettagli

Esercitazioni del corso: STATISTICA

Esercitazioni del corso: STATISTICA A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ

Dettagli

A proposito di valutazione scolastica

A proposito di valutazione scolastica A proposito di valutazione scolastica Livello scolare: 2 biennio Abilità interessate Identificare situazioni che richiedono di rilevare lo stesso carattere su una unità statistica formata da 2 elementi,

Dettagli

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello

Dettagli

Istituzioni di Statistica 1 Esercizi su strumenti grafici e funzione di frequenza relativa cumulata

Istituzioni di Statistica 1 Esercizi su strumenti grafici e funzione di frequenza relativa cumulata Istituzioni di Statistica 1 Esercizi su strumenti grafici e funzione di frequenza relativa cumulata Esercizio 1 La seguente tabella riguarda il tempo per passare da 0 a 100 km/h di 17 automobili tedesche

Dettagli

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA STATISTICA: esercizi svolti sulla MEDIA ARITMETICA 1 1 MEDIA ARITMETICA 2 1 MEDIA ARITMETICA 1. La seguente tabella riporta il numero di persone divise per sesso che si sono presentate durante l anno 1997

Dettagli

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto

Dettagli

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati: DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Esercitazioni del corso: RELAZIONI TRA VARIABILI

Esercitazioni del corso: RELAZIONI TRA VARIABILI A. A. 009 010 Esercitazioni del corso: RELAZIONI TRA VARIABILI Isabella Romeo: i.romeo@campus.unimib.it ommario Esercitazione 1: Tabelle a doppia entrata Distribuzioni marginali e condizionate Indipendenza

Dettagli

Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli. Esercizio 1

Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli. Esercizio 1 Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli Esercizio 1 Il seguente data set riporta la rilevazione di alcuni caratteri su un collettivo di 20 soggetti.

Dettagli

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 2. e 3. STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 1. Le unità statistiche sono costituite dai singoli ristoranti, mentre la popolazione è costituita da tutte le unità del

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili

Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 26 Outline 1 2 3 4 () Statistica 2 / 26 Misura del legame Data una variabile doppia (X, Y ), la misura

Dettagli

Indice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione...

Indice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione... INSEGNAMENTO DI STATISTICA DEL TURISMO LEZIONE IX LE RELAZIONI TRA CARATTERI PROF. GIOVANNI DI TRAPANI Indice 1. Premessa.... 3 2. Le relazioni tra coppie di caratteri.... 4 3. L analisi della contingenza....

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it TIPI DI MEDIA: GEOMETRICA, QUADRATICA, ARMONICA Esercizio 1. Uno scommettitore puntando una somma iniziale

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 6 home - indice In base agli arrotondamenti effettuati nei calcoli,

Dettagli

Analisi della varianza a una via

Analisi della varianza a una via Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica Marcella Montico e Lorenzo Monasta Servizio di epidemiologia e biostatistica Inferenza statistica: insieme di metodi che permette di generalizzare i risultati ottenuti dai dati raccolti

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 7 home - indice In base agli arrotondamenti effettuati nei calcoli,

Dettagli

Distribuzione di frequenza e rappresentazioni grafiche

Distribuzione di frequenza e rappresentazioni grafiche Distribuzione di frequenza e rappresentazioni grafiche Argomenti della lezione La distribuzione di frequenza in classi La rappresentazione grafica Le tabelle di frequenza Le distribuzioni di frequenza

Dettagli

STATISTICA DESCRITTIVA BIVARIATA

STATISTICA DESCRITTIVA BIVARIATA STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X, X 2,,X s. Si

Dettagli

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Una statistica è una quantità numerica il cui valore è determinato dai dati. STATISTICHE CAMPIONARIE Quando i dati sono molti e illeggibili nella forma grezza, si rende necessario introdurre quantità numeriche che possano essere usate per sintetizzarli. Queste misure riassuntive

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,

Dettagli

Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli

Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli Esercizio 1: Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli danilo.alunnifegatelli@uniroma1.it (a) Religione (b) Reddito familiare (c) Salario in Euro (d) Classe di reddito (I, II, ecc.) (e)

Dettagli

Esercitazione di Statistica Indici di associazione

Esercitazione di Statistica Indici di associazione Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza

Dettagli

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale

Dettagli

7. Si confronti la variabilità del carattere età nel gruppo dei maschi ed in quello delle femmine.

7. Si confronti la variabilità del carattere età nel gruppo dei maschi ed in quello delle femmine. Esercizio n. 1 Da un collettivo di 20 individui si è rilevata la seguente distribuzione univariata multipla relativa ai caratteri età, sesso, numero di automobili possedute: unità età sesso n.auto 1 35

Dettagli

STATISTICA DESCRITTIVA (canale B)

STATISTICA DESCRITTIVA (canale B) STATISTICA DESCRITTIVA (canale B) compito n. 1 del 28 marzo 2008 nome e cognome: corso di laurea: Astronomia matricola: Parte teorica Si ricorda che la corretta risposta ai quesiti della parte teorica

Dettagli

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati. Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n 1 ESERCIZIO 1: Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati. ESERCIZIO 1 Soluzione:

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Università degli Studi di Napoli. Corso di Laurea in Management per le Imprese Turistiche. STATISTICA per il Turismo. I Lezione

Università degli Studi di Napoli. Corso di Laurea in Management per le Imprese Turistiche. STATISTICA per il Turismo. I Lezione Università degli Studi di Napoli Parthenope Facoltà di ECONOMIA Corso di Laurea in Management per le Imprese Turistiche STATISTICA per il Turismo I Lezione Docente: Sergio Longobardi a.a. a 2010/2011 sergio.longobardi@uniparthenope.it

Dettagli

STATISTICA 1 ESERCITAZIONE 2

STATISTICA 1 ESERCITAZIONE 2 Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

Statistica Analisi bidimensionale La dipendenza in media. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Analisi bidimensionale La dipendenza in media. alessandro polli facoltà di scienze politiche, sociologia, comunicazione Statistica Analisi bidimensionale La dipendenza in media alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Nella sezione precedente abbiamo esaminato i principali metodi

Dettagli

E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano

E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E possibile,

Dettagli

Indici di eterogeneità e di concentrazione

Indici di eterogeneità e di concentrazione Indici di eterogeneità e di concentrazione Dario Malchiodi e Anna Maria Zanaboni 12 gennaio 2016 1 Indici di eterogeneità Nel caso di variabili qualitative nominali la varianza e gli altri indici da essa

Dettagli

Statistiche e relazioni

Statistiche e relazioni tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

Generazione di Numeri Casuali- Parte 2

Generazione di Numeri Casuali- Parte 2 Esercitazione con generatori di numeri casuali Seconda parte Sommario Trasformazioni di Variabili Aleatorie Trasformazione non lineare: numeri casuali di tipo Lognormale Trasformazioni affini Numeri casuali

Dettagli

Premessa: la dipendenza in media

Premessa: la dipendenza in media Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione variabilità e forma per caratteri qualitativi Il seguente data set riporta la rilevazione

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità. Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale Corso di laurea in biotecnologie

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983:

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983: ESERCIZI ESERCIZIO_1 La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983: Reddito Numero di famiglie (in migliaia) 0 6 1.128

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4

Dettagli

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,

Dettagli

STATISTICA NOZIONI DI BASE

STATISTICA NOZIONI DI BASE STATISTICA NOZIONI DI BASE Italo Nofroni Statistica medica - Sapienza - Roma Si definisce statistica la scienza cha ha per oggetto la raccolta, l analisi e l interpretazione dei dati (intensità e/o frequenze)

Dettagli

Statistica 1. Dati bivariati. I - Associazione. Alessandra Salvan e Laura Ventura

Statistica 1. Dati bivariati. I - Associazione. Alessandra Salvan e Laura Ventura Statistica 1 Dati bivariati. I - Associazione Alessandra Salvan e Laura Ventura Dipartimento di Scienze Statistiche Università di Padova http://www.stat.unipd.it/ salvan@stat.unipd.it ventura@stat.unipd.it

Dettagli

Statistica. Relazioni tra variabili. Francesco Pauli A.A. 2015/2016

Statistica. Relazioni tra variabili. Francesco Pauli A.A. 2015/2016 Relazioni tra variabili Francesco Pauli Statistica A.A. 2015/2016 Solo una variabile... Finora abbiamo trattato di come rappresentare graficamente, sintetizzare numericamente (con medie, mediane, varianze,

Dettagli

Il χ 2 (Pearson, 1900)

Il χ 2 (Pearson, 1900) Il χ 2 (Pearson, 1900) Relazioni tra variabili: le tabelle di contingenza "The Physicians' Health Study" è uno studio clinico randomizzato condotto allo scopo di valutare il possibile eetto di riduzione

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 3 Massimo Guerriero Ettore Benedetti Indice Lezione Requisiti dalla lezione scorsa Calcolo delle probabilità e spazio campionario Analisi di dipendenza:

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Differenze semplici medie, confronti in termini di mutua variabilità La distribuzione del prezzo

Dettagli

Esercitazioni di Statistica: ES.1.1

Esercitazioni di Statistica: ES.1.1 Esercitazioni di Statistica: ES.1.1 Le componenti fondamentali dell analisi statistica Unità statistica Oggetto dell osservazione di ogni fenomeno individuale che costituisce il fenomeno collettivo Carattere

Dettagli

Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso. Il test del chi quadrato

Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso. Il test del chi quadrato Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso Il test del chi quadrato Si tratta di un test molto importante che ha trovato innumerevoli applicazioni da quando

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

La distribuzione delle frequenze. T 10 (s)

La distribuzione delle frequenze. T 10 (s) 1 La distribuzione delle frequenze Si vuole misurare il periodo di oscillazione di un pendolo costituito da una sferetta metallica agganciata a un filo (fig. 1). A Figura 1 B Ricordiamo che il periodo

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A) Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,

Dettagli

Statistica Sociale - modulo A

Statistica Sociale - modulo A Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it Uno dei principali limiti della media aritmetica e che essa risente fortemente dei valori estremi della distribuzione. Cosi pu accadere che

Dettagli

Analisi Bivariata. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 4

Analisi Bivariata. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 4 Analisi Bivariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 4 Lavoro di gruppo Inviare il questionario via mail a gdeppieri@liuc.it e gmagistrelli@liuc.it entro oggi 30/10/2015

Dettagli

Esame di Statistica TEMA A Corso di Laurea in Economia Prof.ssa S. Giordano 21 Gennaio 2013

Esame di Statistica TEMA A Corso di Laurea in Economia Prof.ssa S. Giordano 21 Gennaio 2013 Esame di Statistica TEMA A Corso di Laurea in Economia Prof.ssa S. Giordano Gennaio 0 Cognome Nome Matr. TEORIA: dimostrare la proprietà di linearità della media e della varianza. Esercizio Nel seguente

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA AZIENDALE Modulo Controllo di Qualità STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la

Dettagli

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016 Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione

Dettagli

I principali tipi di grafici

I principali tipi di grafici I principali tipi di grafici Esiste una grande varietà di rappresentazioni grafiche. I grafici più semplici e nello stesso tempo più efficaci e comunemente utilizzati sono: I GRAFICI A BARRE I GRAFICI

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

ESERCIZI DI RIEPILOGO 1

ESERCIZI DI RIEPILOGO 1 ESERCIZI DI RIEPILOGO 1 ESERCIZIO 1 La tabella seguente contiene la distribuzione di frequenza della variabile X = età (misurata in anni) per un campione casuale di bambini: x i 4.6 8 3.2 3 5.4 6 2.6 2

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche 1 Una rappresentazione grafica Per una rappresentazione sintetica della

Dettagli

4 0 = 4 2 = 4 4 = 4 6 = 0.

4 0 = 4 2 = 4 4 = 4 6 = 0. Elementi di Algebra e Logica 2008. Esercizi 4. Gruppi, anelli e campi. 1. Determinare la tabella additiva e la tabella moltiplicativa di Z 6. (a) Verificare dalla tabella moltiplicativa di Z 6 che esistono

Dettagli

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza

Dettagli

2.6 Calcolo degli equilibri di Nash

2.6 Calcolo degli equilibri di Nash 92 2 Giochi non Cooperativi Per queste estensioni di giochi non finiti si possono provare risultati analoghi a quelli visti per i giochi finiti. Rimandiamo alla bibliografia per uno studio più approfondito

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli

Statistica bivariata: il problema della dipendenza

Statistica bivariata: il problema della dipendenza Statistica bivariata: il problema della dipendenza Antonio Punzo Università di Catania, Dipartimento di Economia e Impresa antoniopunzo@unictit Orario delle lezioni: Martedì, ore 16:00-18:00, Palazzo delle

Dettagli