Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi"

Transcript

1 Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi

2 Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni anziani intervistati sono state fatte, tra l altro, due domande: qual è il livello della tua felicità e quale pensi che sia il livello della felicità dei tuoi coetanei. Le risposte variavano da 1 a 10 per ciascuna domanda posta. Le risposte ottenute sono rappresentate in questa tabella che mostra la distribuzione unitaria delle due risposte, cioè la lista delle risposte di ciascun intervistato (colonne x e y) identificato con un numero progressivo visibile nella prima colonna della tabella. Questa è già una tabella doppia

3 Rappresentazioni delle distribuzioni doppie In generale, se indichiamo con X e Y i due caratteri e con x i e y i le modalità dei due caratteri nell unità i (i = 1, 2,, n), possiamo rappresentare la unitaria come: Questa rappresentazione può andare bene solo fino a che le unità nel collettivo sono poche. Per n molto grande occorre passare ad una forma più compatta di rappresentazione, proprio come abbiamo visto per le distribuzioni semplici.

4 Rappresentazioni delle distribuzioni doppie Utilizziamo allora la (o bidimensionale o bivariata) di frequenze che otteniamo contando le unità del collettivo che possiedono la stessa coppia di modalità dei due caratteri. Una di frequenze è rappresentata generalmente con la tabella a doppia entrata: nella colonna madre abbiamo le modalità del carattere X, nella testata ci sono le modalità del carattere Y e nel mezzo ci sono le frequenze assolute

5 Rappresentazioni delle distribuzioni doppie L ultima riga e l ultima colonna della tabella doppia contengono le somme delle frequenze assolute per riga o per colonna. Con notazione analitica, scriviamo

6 Rappresentazioni delle distribuzioni doppie Esempio. Consideriamo la distribuzione di alunni delle scuole del Lazio, di 8 anni nel 1999, dei quali sono stati misurati la statura (X) e il peso (Y) (Fonte, Inran) Questa tabella doppia ha una colonna madre che rappresenta le modalità del carattere statura in classi, una testata che rappresenta il carattere peso in classi, una serie di valori all interno che rappresentano le frequenze assolute dei ragazzi che presentano la coppia di modalità dei due caratteri a cui corrispondono riga e colonna. L ultima riga e l ultima colonna sono costituite dai totali. Il valore all incrocio di queste righe e colonne è il totale generale delle frequenze, cioè è il numero di unità nel collettivo.

7 Rappresentazioni delle distribuzioni doppie La contiene s+t+2 distribuzioni unidimensionali: 1. la distribuzione delle unità del collettivo secondo il carattere X, qualunque sia la modalità del carattere Y che è presente nelle unità detta distribuzione totale o marginale, secondo il carattere X, della ; 2. la distribuzione totale o marginale, secondo il carattere Y, della distribuzione doppia;

8 Rappresentazioni delle distribuzioni doppie 3. le t (tante quante sono le modalità del carattere Y) distribuzioni unidimensionali, secondo il carattere X, delle unità del collettivo che presentano tutte o la modalità y 1 del carattere, o la modalità y 2,, o la modalità y t ; la generica distribuzione, corrispondente alla modalità y i del carattere Y è detta distribuzione parziale secondo il carattere X corrispondente alla modalità y i del carattere Y; 4. le s (tante quante sono le modalità del carattere X) distribuzioni unidimen- sionali, secondo il carattere Y, delle unità del collettivo che presentano tutte o la modalità x 1 del carattere, o la modalità x 2,, o la modalità x s ; la generica distribuzione, corrispondente alla modalità x h del carattere X, è detta distribuzione parziale secondo il carattere Y corrispondente alla modalità x h del carattere X.

9 Rappresentazioni delle distribuzioni doppie Possiamo considerare anche la distribuzione delle frequenze relative in cui con h=1,2,...,s e i=1,2,...,t è la frequenza relativa con cui si presentano associate la modalità x h del carattere X e la modalità y i del carattere Y.

10 Rappresentazioni delle distribuzioni doppie Graficamente, una si può rappresentare con una nuvola di punti su un piano cartesiano. Se però abbiamo una distribuzione di frequenze, si passa alla rappresentazione cartesiana ortogonale tridimensionale o stereogramma.

11 Rappresentazioni delle distribuzioni doppie Le sintesi delle distribuzioni doppie possono derivare da una generalizzazione di quanto visto per le distribuzioni unidimensionali. Quindi, anche in questo caso, possiamo calcolare moda, mediana, media, misure della variabilità, ecc. a seconda del livello di misura dei due caratteri della. Ora avremo una coppia di mode, per il carattere X e per il carattere Y, una coppia di mediane (un punto mediano della ) e una coppia di medie (un punto medio della, anche detto baricentro) e varianze.

12 Rappresentazioni delle distribuzioni doppie Esempio. Per la distribuzione vista prima di un certo numero di anziani interrogati sulla propria felicità e su quella dei coetanei, si possono calcolare il baricentro B, il punto Q medio quadratico e il punto M mediano Per calcolare il baricentro B basta fare la somma dei punteggi dichiarati divisa per il numero di intervistati per ciascuna delle due domande. Si ottiene il punto B(6,2;5,1)

13 Rappresentazioni delle distribuzioni doppie Per calcolare il punto mediano utilizziamo la distribuzione di frequenze assolute. Nella prima distribuzione le unità che occupano nella distribuzione ordinata il 20 o e il 21 o posto, presentano entrambe la modalità 7, mentre nella seconda ciò accade per la modalità 5. Quindi il punto mediano è M(7; 5) Infine la media quadratica è il punto Q(6,7;5,5) Esempio. Determiniamo il baricentro B della distribuzione, secondo la statura e il peso, di alunni delle scuole del Lazio, di 8 anni nel A tale scopo è sufficiente calcolare la media aritmetica della statura e quella del peso che sono rispettivamente Statura media=133,2 cm Peso medio=33,1 kg. Perciò il baricentro della distribuzione considerata è B (133,2; 33,1).

14 Rappresentazioni delle distribuzioni doppie Non è detto che le medie assunte per i due caratteri debbano essere le stesse, perché possiamo assumere, ad esempio, come rappresentativo della distribuzione il punto (media aritmetica dei valori x h, mediana dei valori y i ). Ciò vale soprattutto quando i caratteri non sono dello stesso tipo, come accade, ad esempio, se il carattere X è quantitativo e l altro è qualitativo ordinato rettilineo, ecc. Se però i due caratteri sono quantitativi ed espressi nella stessa unità di misura, come indice di variabilità delle distribuzioni doppie si può usare lo scostamento quadratico medio dal baricentro

15 Diciamo che il carattere Y dipende perfettamente dal carattere X se ogni modalità x h di X individua una modalità di Y. Cioè: Il carattere Y dipende perfettamente dal carattere X se ad ogni modalità x h di X corrisponde una modalità y i del carattere Y per la quale è n hi = n i e quindi è n hj =0 per ogni j i ; inoltre debbono esserci almeno due modalità x h e x l di X a cui corrispondono rispettivamente due modalità y i e y j di Y fra loro diverse. Sono perciò le modalità di X a determinare quelle di Y. La perfetta dipendenza di Y da X non implica però generalmente la perfetta dipendenza di X da Y, in quanto, se ad ogni x h corrisponde una sola modalità y i, non si ha di conseguenza che ad ogni modalità y i corrisponda una sola x h. Pertanto la nozione di dipendenza perfetta generalmente è unilaterale e non bilaterale.

16 Se Y e X sono reciprocamente in dipendenza perfetta, ossia se la dipendenza fra i due caratteri è bilaterale, ad ogni x h deve corrispondere una sola modalità y i e viceversa. Ciò si verifica se è s=t, ossia se la tabella doppia è quadrata e se i due gruppi n 1, n 2,, n s e n 1, n 2,, n t, oltre che avere lo stesso numero di termini, sono costituiti dagli stessi numeri e cioè un gruppo deve essere una permutazione dell altro. Il caso opposto della dipendenza perfetta è quello dell indipendenza Prendendo come guida il concetto matematico di indipendenza di y da x, diciamo che in una il carattere Y è indipendente da X, o che Y non è connesso con X, se sono fra loro uguali tutte le distribuzioni parziali, secondo il carattere Y, corrispondenti alle varie modalità di X.

17 Se invece fra tutte le possibili coppie di distribuzioni parziali ve ne sono almeno due che sono fra loro diverse, noi diciamo che Y è connesso con X o che Y dipende da X. Esempio. Il carattere «colore dei capelli» (Y) è connesso con il carattere «regione di nascita» (X) perché, per esempio, la distribuzione secondo il colore dei capelli di coloro che sono nati in Sardegna (tra i quali prevale il colore nero dei capelli) è diversa da quella dei nati nel Trentino-Alto Adige (tra i quali non prevale il colore nero). Esempio. Il peso dei neonati dipende dall età della madre in quanto i pesi dei neonati si distribuiscono diversamente a seconda dell età della madre Quindi, per affermare che, in una, un carattere è dipendente o indipendente da un altro, dobbiamo confrontare le distribuzioni parziali o operando direttamente sulle distribuzioni stesse oppure ricorrendo agli indici con cui si sintetizzano le distribuzioni

18 Nel primo caso possiamo considerare uguali due distribuzioni se hanno le stesse modalità e se ogni modalità ha, nelle due distribuzioni, frequenze relative uguali (consideriamo le frequenze relative e non quelle assolute per non essere vincolati dal numero di unità delle distribuzioni). Nel secondo caso diciamo uguali due distribuzioni, per esempio rispetto alla media aritmetica, se esse hanno la stessa media aritmetica; se però le due distribuzioni non sono uguali rispetto alla media aritmetica, possiamo misurare la diversità fra le due distribuzioni mediante la disuguaglianza fra le medie aritmetiche; se le due distribuzioni hanno uguali scostamenti quadratici medi le diciamo uguali rispetto a tale caratteristica ma, se le distribuzioni non sono uguali rispetto allo scostamento quadratico medio, possiamo misurare la loro disuguaglianza mediante la diversità fra gli scostamenti quadratici medi.

19 La prima definizione di uguaglianza di due distribuzioni è più vincolante dell uguaglianza rispetto ad una caratteristica perché implica un maggior numero di condizioni di quante ne richieda l uguaglianza rispetto ad una caratteristica. Noi prenderemo in esame dapprima l indipendenza che fa riferimento al primo tipo di uguaglianza delle distribuzioni parziali e poi quella che si riferisce all uguaglianza rispetto ad una caratteristica. Nel primo caso parleremo di connessione o dipendenza e di connessione nulla o indipendenza (in caso di assenza di connessione); nel secondo caso di dipendenza o di indipendenza rispetto alla caratteristica considerata (la media artimetica)

20 Connessione nulla o indipendenza I caratteri X e Y, che consideriamo possono essere di qualunque tipo (ossia o sconnessi o qualitativi ordinati o quantitativi) in quanto facciamo riferimento soltanto alle frequenze relative delle loro modalità Diciamo che il carattere Y non è connesso con il carattere X nella se sono uguali fra loro tutte le distribuzioni parziali, secondo il carattere Y, corrispondenti alle varie modalità del carattere X ossia se sono uguali le s distribuzioni parziali corrispondenti alle modalità x 1, x 2,, x s del carattere X. Quindi il carattere Y non è connesso con il carattere X se, qualunque sia i (i=1, 2,, t), valgono le uguaglianze

21 Connessione nulla o indipendenza che, con un semplice passaggio matematico diventa Cioè: se Y non è connesso con X ogni distribuzione parziale secondo il carattere Y (corrispondente ad una qualunque modalità x h di X) è uguale alla distribuzione marginale o totale secondo il carattere Y. Viceversa, se ogni distribuzione parziale secondo il carattere Y è uguale alla distribuzione marginale o totale, sono anche uguali fra loro tutte le coppie di distribuzioni parziali secondo il carattere Y e quindi Y non è connesso con X Inoltre: ogni distribuzione parziale secondo il carattere X, corrispondente ad una qualunque modalità y i di Y, è uguale alla distribuzione marginale o totale secondo il carattere Y, in quanto la formula precedente si può scrivere come:

22 Connessione nulla o indipendenza Tutte le distribuzioni parziali secondo il carattere X, essendo ognuna uguale alla marginale, sono anche uguali tra loro; pertanto, se in una il carattere Y non è connesso con X, anche il carattere X non è connesso con Y. Possiamo perciò dire che X e Y sono non connessi o indipendenti o che fra essi vi è connessione nulla o indipendenza. Infine, sempre dalla formula precedente, si ricava che: Quindi è possibile calcolare la distribuzione di connessione nulla, sia di frequenze assolute che di frequenze relative.

23 Connessione nulla o indipendenza

24 Indici di connessione: contingenza quadratica media Un indice di connessione deve assumere il valore minimo, generalmente 0, nel caso di connessione nulla e il massimo (possibilmente 1) nel caso di dipendenza perfetta. Esso è una sintesi delle diversità fra le frequenze relative della distribuzione osservata e le corrispondenti frequenze relative della di connessione nulla L indice più usato è stato proposto da K. Pearson ed è denominato contingenza quadratica media. Indicandolo con Φ 2, l indice ha la seguente forma analitica

25 Indici di connessione: indice medio di contingenza Φ 2 =s 1 solo se la dipendenza di X da Y è perfetta Φ 2 =t 1 solo se la dipendenza di Y da X è perfetta Sono pertanto indici relativi unilaterali di connessione: mentre è un indice relativo bilaterale di connessione: detto contingenza quadratica media relativa o indice medio di contingenza

26 Indici di connessione Esempio. Calcoliamo gli indici Φ 2, ϕ 2 X/Y, ϕ 2 Y/X, ϕ 2 per la distribuzione doppia della tabella. Per farlo, calcoliamo le quantità Il totale di queste quantità è 1,527 Poiché la formula era basta sottrarre 1 da questa somma Φ 2 =1,527-1=0,527 Essendo s=t=4, ϕ 2 X/Y= ϕ 2 Y/X = ϕ 2 = =Φ 2 /(s-1)=0,527/3=0,18 Bassa connessione fra i due caratteri

27 Indici di connessione: il χ 2 di Pearson Un altro indice collegato a Φ 2 è il celeberrimo χ 2 (chi quadrato) di K. Pearson, L indice χ 2 si annulla nel caso di connessione nulla ma il suo massimo dipende da n Esempio. Calcoliamo l indice χ 2 per la della tabella precedente. Per la formula appena vista abbiamo χ 2 = nφ 2 = 264,097 0,527 =

28 Dipendenza in media Passiamo ora al caso 2, cioè quello dell uguaglianza delle distribuzioni parziali rispetto alla media aritmetica Supponiamo anzitutto che Y sia quantitativo e X qualunque. Se Y è indipendente in media da X, ogni distribuzione parziale secondo il carattere Y deve avere la stessa media aritmetica, cioè deve aversi che qualunque distribuzione parziale con media: y h = 1 n h. t i=1 y i n hi è uguale a tutte le altre ed è uguale alla media generale Altrimenti diciamo che c è dipendenza in media di Y da X. Quindi un indice relativo di dipendenza in media deve contenere le distanze delle medie parziali dalla media generale.

29 Dipendenza in media: rapporto di correlazione Quindi è un indice relativo di dipendenza in media il rapporto introdotto da K. Pearson che lo chiamò rapporto di correlazione dove σ y non è altro che lo scostamento quadratico medio del carattere Y e quello indicato al numeratore di questo indice è lo scostamento quadratico medio delle medie del carattere Y.

30 Dipendenza in media: rapporto di correlazione Esempio. Calcoliamo η y per la distribuzione, secondo la statura (X) e il peso (Y), di alunni delle scuole del Lazio, di 8 anni nel È necessario anzitutto calcolare la media aritmetica e la varianza del peso e per fare ciò occorre rappresentare ogni classe con un solo valore. Scegliamo come valori rappresentativi quelli centrali per le classi interne e per la prima e l ultima classe, rispettivamente, i valori 19 kg e 45,4 kg. La media aritmetica del peso risulta quindi essere y = , = = 33, E la varianza σ y 2 = , , ,4 33, = , = 52,42

31 Dipendenza in media: rapporto di correlazione Ora dobbiamo determinare le medie aritmetiche delle distribuzioni parziali, secondo il peso, corrispondenti alle varie classi di statura.

32 Correlazione fra due caratteri quantitativi Date due unità di un collettivo sulle quali rileviamo i due caratteri quantitativi X e Y, diciamo che in esse vi è concordanza fra i due caratteri, se, nel passaggio da un unità all altra, entrambi i caratteri o crescono o decrescono; diciamo che vi è discordanza se, al crescere dell uno, l altro decresce; diciamo che vi è indifferenza se almeno uno dei due caratteri è costante Cioè, in termini analitici, rilevati i valori x j e y j sull unità j e x l e y l sull unità l, diciamo che nelle due unità vi è, rispettivamente, concordanza, discordanza o indifferenza a seconda che il prodotto (x j x l )(y j y l ) sia positivo, negativo o nullo Abitualmente nella statistica i termini concordanza, discordanza e indifferenza di due caratteri sono sostituiti all unico sostantivo correlazione

33 Correlazione fra due caratteri quantitativi Un indice di correlazione molto utilizzato è il coefficiente di correlazione di Bravais (1846) Ovunque il coefficiente di correlazione di Bravais è indicato con r (o con la corrispondente lettera greca ρ). Questo indice varia tra -1 e 1 ed assume valore 0 quando la correlazione tra X e Y è nulla. Una formulazione di esso più semplice ai fini del calcolo, fa uso degli scarti, degli scarti standardizzati o dello scostamento quadratico medio.

34 Correlazione fra due caratteri quantitativi: coefficiente di correlazione di Bravais Con gli scarti dalla media Con lo scostamento quadratico medio dove il numeratore di questa formula è chiamato covarianza e si calcola come oppure con gli scarti standardizzati

35

36 Esempio. Calcoliamo r per la riportata nelle prime tre colonne della tabella precedente. Utilizziamo le formule appena viste. Dalla tabella otteniamo: Quindi vi è una certa correlazione. Questo valore deve essere ottenuto anche con le altre formule. Per fare ciò ci conviene calcolare gli scarti e poi il calcolo diventa immediato La piccola differenza è dovuta alle approssimazioni nei calcoli

37 Infine, questi calcoli possono essere usati anche per l ultima formula.

38 Naturalmente, le formule che abbiamo visto fino ad ora, che valgono per le distribuzioni unitarie, possono essere scritte anche per le distribuzioni di frequenza. Poiché in questo caso la covarianza è e le varianze sono la formulazione con covarianza e scarto quadratico medio non cambia Infine la formula con gli scarti standardizzati diventa

39 Esempio. Utilizziamo la formula con gli scarti per calcolare il coefficiente di correlazione lineare per la distribuzione, secondo la statura e il peso, degli alunni delle scuole del Lazio di 8 anni nel Scegliamo un valore rappresentativo delle classi e calcoliamo gli scarti dalla media, che per il peso è stata già calcolata in un esempio precedente ed è pari a 33,1 kg. Analogamente procediamo per le stature che hanno media pari 133,2 cm. I due totali di questa tabella sono le varianze da porre al denominatore. Per il calcolo della covarianza usiamo un altra tabella. Quindi

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati: DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione

Dettagli

Lezione 5 Corso di Statistica. Domenico Cucina

Lezione 5 Corso di Statistica. Domenico Cucina Lezione 5 Corso di Statistica Domenico Cucina Università Roma Tre D.Cucina ([email protected]) 1 / 24 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni condizionate

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Lezione 5 Corso di Statistica. Francesco Lagona

Lezione 5 Corso di Statistica. Francesco Lagona Lezione 5 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona ([email protected]) 1 / 23 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

La dipendenza. Antonello Maruotti

La dipendenza. Antonello Maruotti La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno

Dettagli

Indice di contingenza quadratica media (phi quadro) χ n

Indice di contingenza quadratica media (phi quadro) χ n Indice di contingenza quadratica media (phi quadro) Φ χ n Proprietà L influenza del numero di unità n è eliminata Assume valore 0 se X e Y sono perfettamente indipendenti Pagina Indice di Cramer V min

Dettagli

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella

Dettagli

Indipendenza, Dipendenza e interdipendenza

Indipendenza, Dipendenza e interdipendenza Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Esercitazione di Statistica Indici di associazione

Esercitazione di Statistica Indici di associazione Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /

Dettagli

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri; Esercizio 1 Il corso di Statistica è frequentato da 10 studenti che presentano le seguenti caratteristiche Studente Sesso Colore Occhi Voto Soddisfazione Età Stefano M Nero 18 Per niente 21 Francesca F

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali [email protected] Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le

Dettagli

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.

Dettagli

Le medie. Antonello Maruotti

Le medie. Antonello Maruotti Le medie Antonello Maruotti Outline 1 Medie di posizione 2 Definizione Moda La moda di un collettivo, distributio secondo un carattere qualsiasi, è la modalità prevalente del carattere ossia quella a cui

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza

Dettagli

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ Corso di Statistica (canale P-Z) A.A. 009/0 Prof.ssa P. Vicard LA VARIABILITÀ Mediante i valori medi abbiamo cercato di sintetizzare una distribuzione statistica mediante un solo valore tipico. Questo

Dettagli

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010. Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

Analisi bivariata. Il caso di caratteri qualitativi

Analisi bivariata. Il caso di caratteri qualitativi Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano

Dettagli

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22 Medie Monia Ranalli Ranalli M. Medie Settimana # 2 1 / 22 Sommario Medie analitiche Media aritmetica Definizione Proprietà Medie di posizione Moda Definizione Proprietà Mediana Definizione Proprietà Calcolo

Dettagli

METODO DEI MINIMI QUADRATI

METODO DEI MINIMI QUADRATI METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità

Dettagli

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi

Dettagli

ANALISI STATISTICHE BIVARIATE. Tabelle di contingenza

ANALISI STATISTICHE BIVARIATE. Tabelle di contingenza ANALISI STATISTICHE BIVARIATE Tabelle di contingenza 1 Analisi Statistica Bivariata Generalmente, lo studio quantitativo di un fenomeno di interesse si svolge rilevando contemporaneamente più caratteri

Dettagli

Statistica Elementare

Statistica Elementare Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui

Dettagli

Associazione tra caratteri quantitativi: gli indici di correlazione

Associazione tra caratteri quantitativi: gli indici di correlazione Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa

Dettagli

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.

Dettagli

Esercitazione III Soluzione

Esercitazione III Soluzione Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni [email protected] Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4

Dettagli

MODELLI QUANTITATIVI. f x r = c

MODELLI QUANTITATIVI. f x r = c MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA

Dettagli