Dott.ssa Caterina Gurrieri

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Dott.ssa Caterina Gurrieri"

Transcript

1 Dott.ssa Caterina Gurrieri

2 Le relazioni tra caratteri

3

4

5

6 Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo legate tra loro. Si parla a tal proposito di Dipendenza se tra due variabili esiste un rapporto di causa ed effetto (es. reddito percepito e spesa per il tempo libero) Interdipendenza se tra due variabili non esiste un rapporto di causa ed effetto, ovvero se non è possibile definire un antecedente e un conseguente (es. colore degli occhi e colore dei capelli) Indipendenza se si ha assenza di legame tra i due caratteri

7 Si distingue ancora tra Misure di correlazione per studiare i legami tra due variabili quantitative misurate su scala a intervalli o su scala a rapporti Misure di cograduazione per studiare i legami tra variabili almeno qualitative ordinali Misure di associazione per analizzare le relazioni anche tra fenomeni espressi su scala nominale

8 Misurare l indipendenza Data una tabella di contingenza, due variabili X e Y si dicono indipendenti se le modalità di X non influenzano il verificarsi delle modalità di Y, e viceversa l indipendenza statistica è una relazione bidirezionale: se X è indipendente da Y anche Y è indipendente da X.

9 In assenza di indipendenza statistica si parla di connessione: le due variabili X e Y tendono ad influenzarsi reciprocamente e tra di loro esiste una qualche relazione generica l indipendenza statistica e la connessione sono concetti che si escludono reciprocamente.

10 Misure di associazione

11 Le misure di associazione valutano il legame esistente tra due caratteri attraverso l analisi congiunta delle frequenze dei caratteri stessi. Tali misure si basano, inoltre, sulle differenze esistenti tra frequenze osservate e frequenze teoriche, ovvero le frequenze che si presenterebbero in situazione di perfetta indipendenza. Tali differenze sono dette contingenze e la loro somma è sempre nulla.

12 Indice chi-quadrato di Pearson Per valutare se e in che misura due variabili X e Y sono tra loro indipendenti si utilizza il c.d. indice di associazione chi-quadrato (χ ), che si basa sul confronto tra le frequenze assolute osservate f ij (contenute nella tabella di contingenza) e le frequenze teoriche f ij che si osserverebbero in caso di perfetta indipendenza tra X e Y. In formula si ha che i j c f ij ij ' Dove c ij sono le differenze (contingenze) tra le frequenze assolute osservate f ij e le frequenze teoriche f ij.

13 Modalità del carattere X Data una generica tabella a doppia entrata, Modalità del carattere Y 1 j c 1 f 11 f 1 f 1j f 1c f 1. i r f 1 f f j f i1 f i f ij f r1 f r f rj f c f. f ic f i. f rc f r. f. 1 f. f.j f. c f..

14 Da essa si otterranno le frequenze teoriche di ogni cella, tali che i marginali di riga e di colonna restino costanti, secondo la formula f ij ' f i f f j Tali valori vengono riportati in una tabella, detta di indipendenza. Le differenze tra le frequenze osservate e quelle teoriche vengono riportate in una ulteriore tabella, detta delle contingenze. ATTENZIONE: tabella di contingenza tabella delle contingenze!

15 Il χ assume - valore = 0 se i caratteri sono perfettamente indipendenti (dunque le contingenze sono nulle) - valore > 0 se i caratteri sono associati (il valore sarà tanto maggiore quanto più grande sarà la differenza tra le frequenze osservate e quelle teoriche).

16 Per stabilire se la connessione tra X e Y è alta o bassa è possibile ricorrere alla normalizzazione dell indice. A tal fine è necessario rapportare il valore di χ ottenuto al suo massimo, che è n min r 1, c 1 Dove r è il numero delle righe della tabella e c il numero delle colonne

17 Nella sua forma normalizzata, il χ sarà allora espresso come ~ n min r 1, c 1

18 ESEMPIO Ad una società di ricerche è stata commissionata un indagine per verificare l esistenza di una relazione tra la zona di residenza (X) e la marca di automobile acquistata (Y). Con un indagine campionaria su 500 individui sono stati rilevati i dati relativi a - Zona di residenza, distinguendo tra - centro urbano - periferia - area rurale - Marca di automobile acquistata, distinguendo tra - General Motors - Ford - Chrysler - marchio europeo - marchio asiatico

19 I risultati dell indagine sono riportati nella seguente tabella Centro urbano General motors Ford Chrysler Marchio europeo Marchio asiatico Periferia Area rurale

20 SOLUZIONE Per verificare se esiste una relazione tra le due variabili rilevate occorre in primo luogo calcolare le frequenze teoriche c ij secondo la formula f ij ' f i f f j Tali frequenze teoriche sono riportate nella successiva tabella di indipendenza

21 Tabella di indipendenza General motors Ford Chrysler Centro urbano =00*170/500=68 =00*10/500=48 =00*80/500=3 Periferia =150*170/500=51 =150*10/500=36 =150*80/500=4 Area rurale =150*170/500=51 =150*10/500=36 =150*80/500= Marchio europeo Marchio asiatico Centro urbano =00*0/500=8 =00*110/500=44 00 Periferia =150*0/500=6 =150*110/500= Area rurale =150*0/500=6 =150*110/500=

22 A questo punto si può creare la tabella delle contingenze, in cui vengono riportate le differenze tra le frequenze osservate e quelle teoriche Tabella delle contingenze Centro urbano General motors Ford Chrysler Marchio europeo Marchio asiatico =64-68=-4 =40-48=-8 =6-3=-6 =8-8=0 =6-44=18 0 Periferia =53-51= =35-36=-1 =4-4=0 =6-6=0 =3-33=-1 0 Area rurale =53-51= =45-36=9 =30-4=6 =6-6=0 =16-33= ATTENZIONE. I totali di riga e di colonna di una tabella delle contingenze sono sempre pari a 0

23 Sostituendo nella formula i valori ottenuti è possibile calcolare il valore di χ, che in questo caso è i j c f ij ij ' ,35 0,078 0,078 1,333 0,08,5 1,15 1,5 7,364 0,030 8,757

24 Da cui,778 Volendo normalizzare l indice occorre rapportarlo al suo massimo, che si calcola come n min r 1, c 1 Poiché nella colonna sono presenti 3 righe e 5 colonne, il massimo in questo caso

25 Il valore dell indice normalizzato è allora ~, ,0 Tale valore indica che esiste un basso livello di associazione tra Zona di residenza e Marca dell auto acquistata. NB. Si ricorda che essendo normalizzata, quest ultima misura assume valori compresi tra 0 e 1.

26 Principali misure alternative Poiché il valore massimo del χ dipende dalla numerosità della tabella e dalle dimensioni della stessa, spesso viene trasformato in altre misure. Contingenza quadratica media, che è indipendente dalla numerosità ma non dalla forma della tabella. In formula assume la forma f Tale indice assume valore 0 in caso di indipendenza. Il suo valore massimo, invece, è pari a 1 se il numero di righe o di colonne è uguale a, altrimenti è maggiore di 1.

27 Nel caso proposto nell esercizio precedente esso assumerebbe il valore, ,045 Anche in questo caso il valore ottenuto indica che siamo in presenza di una debole associazione tra Zona di residenza e Marca di auto acquistata.

28 Per avere un indice normalizzato, e dunque con un valore che vari tra 0 e 1, si può usare il seguente Indice medio di contingenza V di Cramer, che in formula assume la forma V f min( r 1, c 1) Poiché f Allora l indice V di Cramer può essere scritto anche come V min( r 1, c 1)

29 Poiché f Allora l indice V di Cramer può essere scritto anche come V min( r 1, c 1) Il valore di tale indice varia tra 0 (massima indipendenza) e 1 (massima associazione).

30 Tornando ai dati dell esempio precedente, si avrà dunque che V 0,045 0,15 Che indica, ancora una volta, bassa associazione tra i caratteri. Naturalmente, allo stesso risultato si sarebbe giunti utilizzando la formula alternativa V f min( r 1, c 1), ,0 0,15

31 Misure di cograduazione

32 Qualora si intenda approfondire l analisi della connessione esistente tra due variabili qualitative ordinali X e Y, è possibile ricorrere al concetto di cograduazione. Si parla di cograduazione (o di contrograduazione) quando i due fenomeni in esame tendono ad associare le rispettive modalità in modo che a modalità crescenti dell uno corrispondano preferibilmente modalità crescenti (o decrescenti) dell altro (in relazione alla scala ordinale che le caratterizza). In particolare, si distingue tra Concordanza se a valori elevati di X corrispondono più (o relazione diretta) frequentemente valori elevati di Y e a valori bassi di X corrispondono più frequentemente valori bassi di Y Discordanza se a valori elevati di X corrispondono più (o relazione indiretta) frequentemente valori bassi di Y e a valori bassi di X corrispondono più frequentemente valori alti di Y

33 Indice di cograduazione rho di Spearman Si basa sul concetto di rango (posto d ordine) e fornisce la formula per il calcolo della cograduazione tra due variabili. Per definire il rango si ordinano i caratteri in senso non decrescente (ovvero dal più piccolo al più grande) e si assegna ad ogni unità statistica il rango, ovvero quel numero che indica la posizione dell unità all interno dell ordinamento per modalità, facendo attenzione al caso in cui più unità presentino la stessa modalità. In questo ultimo caso, il rango sarà definito dalla media delle posizioni dei soggetti con la stessa modalità.

34 Una volta assegnati i ranghi è possibile calcolare il coefficiente rho di Spearman, che in formula assume la forma s n ( RXi RYi ) i1 1 6 n ( n 1) dove R Xi e R Yi sono, rispettivamente, il rango della variabile X e il rango della variabile Y per il medesimo soggetto i (i=1,,,n).

35 Il coefficiente rho di Spearman assume valori compresi tra 1 e +1 Se ρ = -1 Se ρ = +1 Se ρ = 0 contrograduazione massima: a modalità crescenti (decrescenti) di X corrispondo modalità decrescenti (crescenti) di Y e viceversa cograduazione è massima: a modalità crescenti (decrescenti) di X corrispondono modalità crescenti (decrescenti) di Y X e Y sono indipendenti statisticamente (ma non vale il viceversa).

36 ESEMPIO Nella tabella successiva sono riportati i dati relativi al gradimento di un servizio (X) e al titolo di studio (Y) di 0 individui. Calcolare l indice rho di Spearman. Gradimento Titolo di studio 1 Basso Licenza scuola media inf. Medio Diploma 3 Basso Diploma 4 Alto Licenza scuola media inf. 5 Alto Licenza scuola media inf. 6 Alto Licenza scuola media inf. 7 Basso Diploma 8 Basso Diploma 9 Medio Licenza scuola media inf. 10 Basso Licenza scuola media inf. 11 Alto Diploma 1 Alto Laurea I livello 13 Medio Laurea I livello 14 Medio Diploma 15 Basso Licenza scuola media inf. 16 Basso Laurea I livello 17 Medio Diploma 18 Basso Laurea I livello 19 Alto Diploma 0 Alto Diploma

37 SOLUZIONE Per calcolare il valore della rho di Spearman occorre innanzitutto creare le graduatorie per i due caratteri analizzati e assegnare a ciascuna modalità un rango. Dopo aver ordinato in ordine non decrescente le modalità, quindi, si assegneranno prima le posizioni e poi i ranghi. I risultati sono riportati nelle tabelle successive.

38 - Gradimento Gradimento Ordinamento numerico 1 Basso 1 3 Basso 7 Basso 3 8 Basso 4 10 Basso 5 15 Basso 6 16 Basso 7 18 Basso 8 Medio 9 9 Medio Medio Medio 1 17 Medio 13 4 Alto 14 5 Alto 15 6 Alto Alto 17 1 Alto Alto 19 0 Alto 0 Rango = ( )/8 = 4,5 = ( )/5 = 11 = ( )/7 = 17

39 -Titolo di studio Titolo di studio Ordinamento numerico Rango 1 Licenza s.m.inf. 1 4 Licenza s.m.inf. 5 Licenza s.m.inf. 3 6 Licenza s.m.inf. 4 9 Licenza s.m.inf Licenza s.m.inf Licenza s.m.inf. 7 Diploma 8 3 Diploma 9 7 Diploma 10 8 Diploma Diploma 1 14 Diploma Diploma Diploma 15 0 Diploma 16 1 Laurea I livello Laurea I livello Laurea I livello Laurea I livello 0 = ( )/7 = 4 = ( )/9 = 1 = ( )/4 = 18,5

40 R X R Y (R X -R Y ) A questo punto è possibile creare una ulteriore tabella in cui, per ogni unità statistica, è riportato il rango in ciascuna delle due graduatorie. Nell ultima colonna sono riportati i valori di (R X -R Y ), necessari per il calcolo dell indice. 1 4,5 4 = (4,5-4) = 0, =(11-1) = 1 3 4,5 1 =(4,5-1) = 56, =(17-4) = =(17-4) = =(17-4) = ,5 1 =(4,5-1) = 56,5 8 4,5 1 =(4,5-1) = 56, =(11-4) = ,5 4 (4,5-4) = 0, =(17-1) = ,5 =(17-18,5) =, ,5 =(11-18,5) = 56, =(11-1) = ,5 4 (4,5-4) = 0,5 16 4,5 18,5 =(4,5-18,5) = =(11-1) = ,5 18,5 =(4,5-18,5) = =(17-1) = =(17-1) = 5 Totale 154

41 E adesso possibile calcolare il valore dell indice rho di Spearman sostituendo i valori nella formula s n ( RXi RYi ) i1 1 6 n ( n 1) s , ,950 0 (0 1) ,05 Poiché il valore del coefficiente è prossimo allo 0, è possibile affermare che tra le due variabili esiste una bassa cograduazione.

42 Misure di correlazione

43 Nel caso in cui si intenda approfondire l analisi del legame esistente tra due variabili quantitative (continue o discrete) X e Y così da cogliere oltre all intensità anche l eventuale natura lineare (proporzionale) del legame, è possibile ricorrere al concetto di correlazione lineare. Si dice che X e Y sono correlate positivamente (o negativamente) quando i due fenomeni in esame tendono ad associare le rispettive modalità in modo che a modalità crescenti dell uno corrispondano preferibilmente modalità proporzionalmente crescenti (o decrescenti) dell altro.

44 Covarianza Un primo modo di misurare il legame tra due variabili quantitative X e Y è quello di analizzare la covarianza delle stesse variabili, ovvero la media aritmetica dei prodotti degli scostamenti delle variabili X e Y dalle rispettive medie. In formula si indica come COV ( X, Y) n ( xi X )( yi Y ) i 1 n

45 In caso di distribuzione in classi diventa COV ( X, Y) k h ( xi X )( y j Y ) n i j 1 1 n ij Dove n ij indica la frequenza assoluta nella cella ij-esima, con cui va ponderato il prodotto degli scarti di X e degli scarti di Y.

46 Il valore massimo che la covarianza può assumere è uguale al prodotto degli scarti quadratici medi dei due caratteri esaminati. In simboli si avrà allora che COV(X,Y) σ(x)*σ(y) In generale, la covarianza - assume valore 0 quando tra i caratteri esaminati non esiste un legame di tipo lineare (per cui se la covarianza assume valore 0 non esclude altri tipi di legame) - assume il massimo in valore assoluto positivo quando i punti sono quando i punti sono tutti allineati su una retta crescente e negativo quando i punti sono tutti allineati su una retta decrescente

47 ATTENZIONE La covarianza risente dell unità di misura in cui è espressa, per cui non è possibile fare confronti tra distribuzioni doppie diverse. Essa, inoltre, risente anche dell ordine di grandezza delle variabili, per cui non permette nemmeno di dire se il variabile tra le variabili stesse è stretto o meno.

48 Coefficiente di correlazione lineare di Bravais e Pearson Il coefficiente di correlazione lineare r misura l intensità del legame lineare (interpretabile graficamente da una retta) tra due variabili quantitative X e Y, ovvero il grado di proporzionalità esistente tra X e Y. Si calcola come rapporto tra la covarianza tra X e Y e il rapporto degli scarti quadratici medi. In formula esso è allora r XY COV ( X, Y) ( X ) ( Y)

49 Il coefficiente di correlazione lineare assume valori compresi tra -1 e +1 in particolare, r=-1 perfetta correlazione negativa: la relazione tra X e Y è di assoluta proporzionalità inversa e può essere perfettamente interpretata da una retta con pendenza negativa r=+1 perfetta correlazione positiva: la relazione tra X e Y è di perfetta proporzionalità diretta e può essere perfettamente interpretata da una retta con pendenza positiva r=0 i due fenomeni sono incorrelati (non esiste legame lineare tra X e Y)

50

51

52

53 ATTENZIONE Il coefficiente di correlazione lineare è fortemente influenzato dai valori anomali, per cui è opportuno calcolare il suo valore con e senza outliers, in modo da verificare l effetto che essi hanno sul risultato finale.

54 ESEMPIO Si considerino i caratteri X e Y riportati nella tabella successiva. Si rappresentino graficamente e si stabilisca se sono linearmente dipendenti. In caso affermativo si calcoli l entità di tale dipendenza. X Y

55 SVOLGIMENTO Rappresentiamo i dati relativi ai due caratteri X e Y attraverso un diagramma a dispersione. La disposizione dei punti nel grafico già suggerisce l esistenza di una relazione di dipendenza lineare tra X ed Y.

56 Per verificare puntualmente la presenza di dipendenza lineare tra i due caratteri, calcoliamo la covarianza tra X e Y applicando la formula COV ( X, Y) n ( xi X )( yi Y ) i 1 n Poiché per il calcolo della covarianza è necessario conoscere il valore degli scarti dalla media dei valori sia di X che di Y, occorre preliminarmente calcolare le medie delle due variabili. Si avrà dunque che n xi yi i1 183 i ( X ) 18,3 ( Y) 864 n 10 n 10 n

57 A questo punto abbiamo tutti gli elementi per calcolare i valori necessari per calcolare la covarianza. Alla tabella originaria, quindi, si aggiungono tre colonne che riportano, rispettivamente, gli scostamenti dalla media di X, gli scostamenti dalla media di Y e i prodotti degli scostamenti. X Y x i -μ y i -μ (x i -μ)(y i -μ) , , , , , , , , , , ,7 36 5, , , , , , , , ,

58 Sostituendo i valori ottenuti alla formula, si avrà che COV ( X, Y) n i1 ( x i )( y X n i ) Y ,8 Poiché la covarianza di X ed Y è diversa da 0, si deduce che esiste dipendenza lineare tra le due variabili. Il segno positivo della covarianza informa anche del fatto che esiste una dipendenza lineare positiva: a valori crescenti della X sono associati valori crescenti della Y.

59 Per valutare l entità di tale dipendenza lineare, tuttavia, è necessario calcolare il coefficiente di correlazione lineare: r XY COV ( X, Y) ( X ) ( Y) Per calcolare il valore di r occorre conoscere preliminarmente il valore della varianza di X e della varianza di Y.

60 Conoscendo già l entità degli scarti dalla media di X e di Y, è sufficiente calcolare i quadrati e rapportarli a n. I risultati dei calcoli sono riportati nella tabella successiva X Y x i -μ y i -μ (x i -μ) (y i -μ) , , , , , , , , ,3-64 5, ,7 36 0, , , , , , , , , ,

61 In base ai dati della tabella precedente si ottiene che 8,98 80, ,1 ) ( 1 n x X n i i 380, ) ( 1 n y Y n i i

62 Da cui r XY COV ( X, Y) ( X ) ( Y) 3345,8 8,98380, ,8 3418,6 0,98 Il coefficiente di correlazione lineare ha un valore molto prossimo ad 1, rivelando una dipendenza lineare molto forte tra i due caratteri. Il segno positivo del coefficiente di correlazione lineare, inoltre, conferma che la dipendenza lineare è positiva.

63 ATTENZIONE In alcuni casi è necessario ponderare r tenendo conto della diversa importanza che i vari aspetti ricoprono. Si parla in tal caso di coefficiente di correlazione lineare ponderata, definito come covarianza ponderata tra gli scostamenti standardizzati, con peso ω i delle unità statistiche. La formula diventa in questo caso r XY n i1 z( x i n i1 ) z( y i i ) i

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

Il concetto di correlazione

Il concetto di correlazione SESTA UNITA Il concetto di correlazione Fino a questo momento ci siamo interessati alle varie statistiche che ci consentono di descrivere la distribuzione dei punteggi di una data variabile e di collegare

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE 1 Associazione tra variabili quantitative ASSOCIAZIONE FRA CARATTERI QUANTITATIVI: COVARIANZA E CORRELAZIONE 2 Associazione tra variabili quantitative Un esempio Prezzo medio per Nr. Albergo cliente (Euro)

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it A.Studio dell interdipendenza tra variabili: riepilogo Concetto relativo allo studio delle relazioni tra

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Analisi delle relazioni tra due caratteri

Analisi delle relazioni tra due caratteri Analisi delle relazioni tra due caratteri Le misure di connessione misurano il grado di associazione tra due caratteri qualsiasi sotto il profilo statistico (e non causale in quanto non è compito della

Dettagli

Elementi di Psicometria

Elementi di Psicometria Elementi di Psicometria 12-Correlazione vers. 1.1 (27 novembre 2012) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2011-2012 G. Rossi (Dip. Psicologia)

Dettagli

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che VARIABILI ALATORI MULTIPL TORMI ASSOCIATI Fonti: Cicchitelli Dall Aglio Mood-Grabill. Moduli 6 9 0 del programma. VARIABILI ALATORI DOPPI Dopo aver trattato delle distribuzioni di probabilità di una variabile

Dettagli

Soluzioni Esercizi elementari

Soluzioni Esercizi elementari Soluzioni sercizi elementari Capitolo. carattere: itolo di Studio, carattere qualitativo ordinato modalità: Diploma, Licenza media, Laurea, Licenza elementare unità statistiche: Individui. carattere: Fatturato,

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

MINIMI QUADRATI. REGRESSIONE LINEARE

MINIMI QUADRATI. REGRESSIONE LINEARE MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione

Dettagli

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

Statistica. Alfonso Iodice D Enza iodicede@unicas.it

Statistica. Alfonso Iodice D Enza iodicede@unicas.it Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 2 Outline 1 2 3 4 () Statistica 2 / 2 Misura del legame Data una variabile doppia (X, Y ), la misura

Dettagli

1. Richiami di Statistica. Stefano Di Colli

1. Richiami di Statistica. Stefano Di Colli 1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche

Dettagli

CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT

CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT CONVENZIONE SULLE CIFRE SIGNIFICATIVE La convenzione usata sul troncamento delle cifre è troncare

Dettagli

Appunti di Statistica Descrittiva

Appunti di Statistica Descrittiva Appunti di Statistica Descrittiva 30 dicembre 009 1 La tabella a doppia entrata Per studiare dei fenomeni con caratteristiche statistiche si utilizza l espediente della tabella a doppia entrata Per esempio

Dettagli

Cenni di statistica descrittiva

Cenni di statistica descrittiva Cenni di statistica descrittiva La statistica descrittiva è la disciplina nella quale si studiano le metodologie di cui si serve uno sperimentatore per raccogliere, rappresentare ed elaborare dei dati

Dettagli

La categoria «ES» presenta (di solito) gli stessi comandi

La categoria «ES» presenta (di solito) gli stessi comandi Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:

Dettagli

Anno Accademico 2014-2015. Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA

Anno Accademico 2014-2015. Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA Statistica, CLEA p. 1/68 Anno Accademico 2014-2015 Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA Monia Lupparelli monia.lupparelli@unibo.it http://www2.stat.unibo.it/lupparelli

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza. VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Lezione n. 2 (a cura di Chiara Rossi)

Lezione n. 2 (a cura di Chiara Rossi) Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,

Dettagli

1 La Matrice dei dati

1 La Matrice dei dati Dispense sull uso di Excel Daniela Marella 1 La Matrice dei dati Un questionario è costituito da un insieme di domande raccolte su un determinato supporto (cartaceo o elettronico) e somministrate alla

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

STATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE

STATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) STATISTICA DESCRITTIVA

Dettagli

STATISTICA DESCRITTIVA BIVARIATA

STATISTICA DESCRITTIVA BIVARIATA STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X 1, X 2,,X s. Si

Dettagli

In una tabella 2 x 2 il valore del chiquadrato, che quantifica la differenza fra i numero osservati e quelli attesi, è la somma delle quattro celle

In una tabella 2 x 2 il valore del chiquadrato, che quantifica la differenza fra i numero osservati e quelli attesi, è la somma delle quattro celle Test statistici il chi quadrato Valutare la differenza tra due percentuali o proporzioni L'ipotesi zero (o ipotesi nulla) afferma che la differenza osservata - di qualsiasi entità essa sia - è dovuta al

Dettagli

Strumenti statistici per l analisi di dati genetici

Strumenti statistici per l analisi di dati genetici Strumenti statistici per l analisi di dati genetici Luca Tardella + Maria Brigida Ferraro 1 email: luca.tardella@uniroma1.it Lezione #1 Introduzione al software R al suo utilizzo per l implementazione

Dettagli

Esercizi di Statistica

Esercizi di Statistica Esercizi di Statistica Selezione di esercizi proposti durante le esercitazioni dei corsi di Statistica tenute presso la Facoltà di Economia dell Università di Salerno Versione del 17 ottobre 2006 2 Per

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di

Dettagli

DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare.

DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare. Appunti di Statistica DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare. PROCESSO STATISTICO L indagine statistica comprende

Dettagli

Il coefficiente di correlazione di Spearman per ranghi

Il coefficiente di correlazione di Spearman per ranghi Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili

Dettagli

STATISTICA (A-K) a.a. 2007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007

STATISTICA (A-K) a.a. 2007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007 A STATISTICA (A-K) a.a. 007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 007 STESS N.O. RD 00 GORU N.O. RD 006 ) La distribuzione del numero degli occupati (valori x 000) in una provincia

Dettagli

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 8 Marzo 007 Facoltà di Astronomia ESERCIZIO 1 La seguente tabella riporta la distribuzione congiunta della situazione lavorativa e dello

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

Fonti e strumenti statistici per la comunicazione (prof.ssa I.Mingo) Esercizi (soluzioni e suggerimenti )

Fonti e strumenti statistici per la comunicazione (prof.ssa I.Mingo) Esercizi (soluzioni e suggerimenti ) Esercizio 1 Fonti e strumenti statistici per la comunicazione (prof.ssa I.Mingo) Esercizi (soluzioni e suggerimenti ) Qualitativo Sconnesso: Marca di Jeans preferita, Partito votato nelle ultime elezioni,

Dettagli

Statistica Medica. Verranno presi in esame:

Statistica Medica. Verranno presi in esame: Statistica Medica Premessa: il seguente testo cerca di riassumere e rendere in forma comprensibile ai non esperti in matematica e statistica le nozioni e le procedure necessarie a svolgere gli esercizi

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

INDICE PREFAZIONE VII

INDICE PREFAZIONE VII INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 4. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 4. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 4 Materiale di supporto per le lezioni. Non sostituisce il libro di testo Dipendenza di un carattere QUANTITATIVO da un carattere QUALITATIVO

Dettagli

STATISTICA DESCRITTIVA UNIVARIATA

STATISTICA DESCRITTIVA UNIVARIATA Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla

Dettagli

Statistica Applicata all edilizia Lezione 2: Analisi descrittiva dei dati

Statistica Applicata all edilizia Lezione 2: Analisi descrittiva dei dati Lezione 2: Analisi descrittiva dei dati E-mail: orietta.nicolis@unibg.it 1 marzo 2011 Prograa 1 Analisi grafica dei dati 2 Indici di posizione Indici di dispersione Il boxplot 3 4 Prograa Analisi grafica

Dettagli

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza Titolo della lezione Analisi dell associazione tra due caratteri: indipendenza e dipendenza Introduzione Analisi univariata, bivariata, multivariata Analizzare le relazioni tra i caratteri, per cercare

Dettagli

Confronto tra media e mediana Indice di Yule-Bowley Indice di Fisher

Confronto tra media e mediana Indice di Yule-Bowley Indice di Fisher ESERCIZIO La tabella littlecompany,disponibile sul sito (in formato pdf e xls) riporta i dati relativi a dipendenti dell'azienda Little Company S.r.l. su cui sono state rilevate le seguenti variabili:

Dettagli

Dipartimento di Scienze dell Educazione Università degli studi Roma Tre

Dipartimento di Scienze dell Educazione Università degli studi Roma Tre Dipartimento di Scienze dell Educazione Università degli studi Roma Tre Materiale del Laboratorio sulle Procedure Statistiche di base con SPSS CASD Centro Analisi Statistica Dati 1 1. Il Questionario Nella

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

ELEMENTI DI STATISTICA PER IDROLOGIA

ELEMENTI DI STATISTICA PER IDROLOGIA Carlo Gregoretti Corso di Idraulica ed Idrologia Elementi di statist. per Idrolog.-7//4 ELEMETI DI STATISTICA PER IDROLOGIA Introduzione Una variabile si dice casuale quando assume valori che dipendono

Dettagli

UN ESPOSIZIONE IPERTESTUALE DI ALCUNI ELEMENTI DI STATISTICA DESCRITTIVA

UN ESPOSIZIONE IPERTESTUALE DI ALCUNI ELEMENTI DI STATISTICA DESCRITTIVA Alma Mater Studiorum Università di Bologna FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI Corso di Laurea in Matematica UN ESPOSIZIONE IPERTESTUALE DI ALCUNI ELEMENTI DI STATISTICA DESCRITTIVA Tesi

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti)

UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti) UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA Programma del modulo di STATISTICA I (6 crediti) ECOCOM (lettere A-Lh): ECOCOM (lettere Li-Z): ECOBAN: ECOAMM (Lettere A-Lh):

Dettagli

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI Docente: Prof. Massimo Mariani 1 SOMMARIO Il rendimento di un attività finanziaria: i parametri rilevanti Rendimento totale, periodale e medio Il market

Dettagli

Elaborazione dati in Analisi Sensoriale

Elaborazione dati in Analisi Sensoriale Elaborazione dati in Analisi Sensoriale Si è parlato di interpretazione corretta dei risultati ottenuti; a questo concorrono due fattori: affidabilità e validità. Se i test fossero stati ripetuti con lo

Dettagli

Appunti di complementi di matematica

Appunti di complementi di matematica Appunti di complementi di matematica UITA STATISTICA: è l unità su cui si raccolgono le informazioni oggetto dell indagine e possono essere individui, famiglie, oggetti. UIVERSO STATISTICO O POLAZIOE STATISTICA

Dettagli

Analisi fattoriale. esplorativa vers. 1.0. Germano Rossi 1 germano.rossi@unimib.it. 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Analisi fattoriale. esplorativa vers. 1.0. Germano Rossi 1 germano.rossi@unimib.it. 1 Dipartimento di Psicologia, Università di Milano-Bicocca Analisi fattoriale esplorativa vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2009 Rossi (Dip. Psicologia) Analisi fattoriale 2009 1 / 47 Prima

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Statistica descrittiva univariata

Statistica descrittiva univariata Statistica descrittiva univariata Elementi di statistica 2 1 Tavola di dati Una tavola (o tabella) di dati è l insieme dei caratteri osservati nel corso di un esperimento o di un rilievo. Solitamente si

Dettagli

6. Modelli statistici: analisi della regressione lineare

6. Modelli statistici: analisi della regressione lineare BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Il rischio di un portafoglio

Il rischio di un portafoglio Come si combinano in un portafoglio i rischi di 2 titoli? dipende dai pesi e dal valore delle covarianze covarianza a a ρ a b ρ a b ρ b b ρ coefficiente di correlazione = cov / ² p = a² ² + b² ² + 2 a

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

PARTE TERZA. STATISTICA DESCRITTIVA MULTIDIMENSIONALE (Analisi delle Relazioni)

PARTE TERZA. STATISTICA DESCRITTIVA MULTIDIMENSIONALE (Analisi delle Relazioni) PARTE TERZA STATISTICA DESCRITTIVA MULTIDIMESIOALE (Analisi delle Relazioni) La notazione matriciale 3 III.. LA OTAZIOE MATRICIALE III... L analisi statistica dei fenomeni multivariati L intrinseca complessità

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 2.1 Statistica descrittiva (Richiami) Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario

Dettagli

LEZIONI DI STATISTICA

LEZIONI DI STATISTICA ez10 l GIOVANNI GIRONE Ordinario nell'università di Bari TOMMASO SALVEMINI Ordinario nel!' Università di Roma LEZIONI DI STATISTICA Volume Secondo CACUCCI EDITORE - BARI - 1992 CENTRO " G. ASTENGO» INVENTARIO

Dettagli

Esame di Statistica Prof.ssa Paola Zuccolotto

Esame di Statistica Prof.ssa Paola Zuccolotto Esame di Statistica Prof.ssa Paola Zuccolotto Tema 1 indicare cognome, nome e numero di matricola su tutti i fogli; utilizzare i fogli protocollo per effettuare i calcoli, indicando tutti i passaggi necessari

Dettagli

Valori medi e misure della tendenza centrale

Valori medi e misure della tendenza centrale TERZA UNITA Valori medi e misure della tendenza centrale Una delle maggiori cause di confusione presso l uomo della strada nonché di diffidenza verso la statistica, considerata più un arte che una scienza,

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia STATISTICA GIUSEPPE DE NICOLAO Dipartimento di Informatica e Sistemistica Università di Pavia SOMMARIO V.C. vettoriali Media e varianza campionarie Proprietà degli stimatori Intervalli di confidenza Statistica

Dettagli

Statistica. L. Freddi. L. Freddi Statistica

Statistica. L. Freddi. L. Freddi Statistica Statistica L. Freddi Statistica La statistica è un insieme di metodi e tecniche per: raccogliere informazioni su un fenomeno sintetizzare l informazione (elaborare i dati) generalizzare i risultati ottenuti

Dettagli

Il test del Chi-quadrato

Il test del Chi-quadrato Il test del Chi-quadrato Prof.ssa Montomoli- Univ. di Pavia Prof.ssa Zanolin Univ. di Verona Il rischio di contrarre epatite C è associato all avere un tatuaggio? Cosa vuol dire ASSOCIAZIONE tra due variabili?

Dettagli

IL TEST CHI QUADRATO χ 2

IL TEST CHI QUADRATO χ 2 IL TEST CHI QUADRATO χ 2 Test parametrici I test studiati nelle lezioni precedenti (test-t, testz) consentono la verifica di ipotesi relative al valore di specifici parametri di popolazione Esempio: differenza

Dettagli

Lezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Standardizzazione di una variabile Standardizzare una variabile statistica

Dettagli

Statistica. A.A. 2014/2015 CREDITI (CFU): 9 CORSO DI LAUREA IN ECONOMIA E COMMERCIO (Verona)

Statistica. A.A. 2014/2015 CREDITI (CFU): 9 CORSO DI LAUREA IN ECONOMIA E COMMERCIO (Verona) Statistica A.A. 2014/2015 CREDITI (CFU): 9 CORSO DI LAUREA IN ECONOMIA E COMMERCIO (Verona) DOCENTE: Marco Minozzo (marco.minozzo@univr.it) TELEFONO: 045-8028234 ORARIO DI RICEVIMENTO: martedì 12:00 13:00

Dettagli

1) A partire dalla seguente tabella a doppia entrata per le variabili QUALIFICA FUNZIONALE e STIPENDIO PERCEPITO (3 classi): STIPENDIO PERCEPITO

1) A partire dalla seguente tabella a doppia entrata per le variabili QUALIFICA FUNZIONALE e STIPENDIO PERCEPITO (3 classi): STIPENDIO PERCEPITO ESERCIZIO La tabella littlecompany,disponibile sul sito (in formato pdf e xls) riporta i dati relativi a 40 dipendenti dell'azienda Little Company S.r.l. su cui sono state rilevate le seguenti variabili:

Dettagli

LEZIONI DI STATISTICA E CALCOLO DELLE PROBABILITA STATISTICA

LEZIONI DI STATISTICA E CALCOLO DELLE PROBABILITA STATISTICA LEZIONI DI STATISTICA E CALCOLO DELLE PROBABILITA UMBERTO MAGAGNOLI Materiale per il Corso di lezioni di STATISTICA Laurea magistrale in Matematica Facoltà di Scienze Matematiche, Fisiche e Naturali Università

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

UNIVERSITÀ DEGLI STUDI DI FERRARA

UNIVERSITÀ DEGLI STUDI DI FERRARA UNIVERSITÀ DEGLI STUDI DI FERRARA Anno Accademico 2012/2013 REGISTRO DELL ATTIVITÀ DIDATTICA Docente: ANDREOTTI MIRCO Titolo del corso: MATEMATICA ED ELEMENTI DI STATISTICA Corso: CORSO UFFICIALE Corso

Dettagli

Scheda n.5: variabili aleatorie e valori medi

Scheda n.5: variabili aleatorie e valori medi Scheda n.5: variabili aleatorie e valori medi October 26, 2008 1 Variabili aleatorie Per la definizione rigorosa di variabile aleatoria rimandiamo ai testi di probabilità; essa è non del tutto immediata

Dettagli

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI STATISTICA 1 ESERCITAZIONE 1 Dott. Giuseppe Pandolfo 30 Settembre 2013 Popolazione statistica: insieme degli elementi oggetto dell indagine statistica. Unità statistica: ogni elemento della popolazione

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B Laurea in Ingegneria Meccatronica A.A. 2010 2011 n-dimensionali Riepilogo. Gli esiti di un esperimento aleatorio

Dettagli

Capitolo 9: PROPAGAZIONE DEGLI ERRORI

Capitolo 9: PROPAGAZIONE DEGLI ERRORI Capitolo 9: PROPAGAZIOE DEGLI ERRORI 9.1 Propagazione degli errori massimi ella maggior parte dei casi le grandezze fisiche vengono misurate per via indiretta. Il valore della grandezza viene cioè dedotto

Dettagli

ESAME DI STATISTICA Nome: Cognome: Matricola:

ESAME DI STATISTICA Nome: Cognome: Matricola: ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli

Dettagli

CAPITOLO 10. Controllo di qualità. Strumenti per il controllo della qualità e la sua gestione

CAPITOLO 10. Controllo di qualità. Strumenti per il controllo della qualità e la sua gestione CAPITOLO 10 Controllo di qualità Strumenti per il controllo della qualità e la sua gestione STRUMENTI PER IL CONTROLLO E LA GESTIONE DELLA QUALITÀ - DIAGRAMMI CAUSA/EFFETTO - DIAGRAMMI A BARRE - ISTOGRAMMI

Dettagli

x 1 f 1 Proprietà: n i=1 fi = N = somma delle frequenze = f1 + f2 + n i=1 f/n = 1

x 1 f 1 Proprietà: n i=1 fi = N = somma delle frequenze = f1 + f2 + n i=1 f/n = 1 Appunti di Statistica descrittiva di Davide Benza Introduzione al corso (su aula web di Imperia ci sono i testi degli appelli passati) Appunti di probabilità, fino a pag. 100, + argomenti di statistica

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.

Dettagli

Statistica corso base Canale N Z prof. Francesco Maria Sanna. Prove scritte di esame a.a. 2012-13

Statistica corso base Canale N Z prof. Francesco Maria Sanna. Prove scritte di esame a.a. 2012-13 Statistica corso base Canale N Z prof. Francesco Maria Sanna Prova scritta del 8/1/2013 Prove scritte di esame a.a. 2012-13 Esercizio 1 (5 punti). Nella seguente tabella è riportata la distribuzione delle

Dettagli

CORSO DI STATISTICA N.O. - II CANALE Esercizi

CORSO DI STATISTICA N.O. - II CANALE Esercizi CORSO DI STATISTICA N.O. - II CANALE Esercizi Dott.ssa CATERINA CONIGLIANI Facoltà di Economia Università Roma Tre 1 Esercizi su sintesi di distribuzioni semplici Esercizio 1.1 Data la seguente distribuzione

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Un breve riepilogo: caratteri, unità statistiche e collettivo UNITA STATISTICA: oggetto dell osservazione

Dettagli

CONTROLLI STATISTICI

CONTROLLI STATISTICI CONTROLLI STATISTICI Si definisce Statistica la disciplina che si occupa della raccolta, effettuata in modo scientifico, dei dati e delle informazioni, della loro classificazione, elaborazione e rappresentazione

Dettagli

Statistica. Alfonso Iodice D Enza iodicede@unina.it

Statistica. Alfonso Iodice D Enza iodicede@unina.it Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 16 Outline 1 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16

Dettagli

Dipendenza tra caratteri: connessione. N:B: Si tratta di coppie di caratteri sia qualitativi

Dipendenza tra caratteri: connessione. N:B: Si tratta di coppie di caratteri sia qualitativi 1 Associazione tra variabili Tratteremo: Dipendenza tra caratteri: connessione N:B: Si tratta di coppie di caratteri sia qualitativi che quantitativi!!!! 2 Associazione tra variabili Riprendiamo l esempio

Dettagli

LE PROVE OGGETTIVE. DOMENICI -Manuale della valutazione scolastica Laterza Editore TIPI E STRUTTURA DEI QUESITI

LE PROVE OGGETTIVE. DOMENICI -Manuale della valutazione scolastica Laterza Editore TIPI E STRUTTURA DEI QUESITI LE PROVE OGGETTIVE Rif. DOMEICI -Manuale della valutazione scolastica Laterza Editore TIPI E STRUTTURA DEI QUESITI 9 VERO/FALSO Richiedono una scelta fra due radicali e semplici risposte alternative. Questi

Dettagli

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Indici di Affidabilità L Attendibilità È il livello in cui una misura è libera da errore di misura È la proporzione di variabilità della misurazione

Dettagli