Statistica15-30/11/2015 ANALISI DEI RAPPORTI DISCONTINUI (FREQUENZE)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Statistica15-30/11/2015 ANALISI DEI RAPPORTI DISCONTINUI (FREQUENZE)"

Transcript

1 Statistica15-30/11/2015 ANALISI DEI RAPPORTI DISCONTINUI (FREQUENZE) Osservazioni congiunte su due variabili Sono stati raccolti dei dati di schiusa di due incubatrici la lista dei dati è mostrata nella tabella accanto raggruppiamo i dati per incubatrice e poi per risultato di schiusa uovo n incubatrice pulcino 1 2 Sì 2 1 Sì 3 2 No 4 1 No 5 1 Sì 6 2 No 7 2 No 8 1 Sì 9 2 Sì 10 2 No 11 1 Sì 12 1 No 13 2 No 14 2 No 15 2 No 16 2 No 17 2 No 18 2 No 19 1 Sì 20 1 No 21 1 Sì 22 2 No 23 1 Sì 24 1 No 25 1 Sì 26 2 No 27 2 No 28 1 No 29 2 No 30 2 No 1

2 uovo n incubatrice pulcino 4 1 No 12 1 No 20 1 No 24 1 No 28 1 No 2 1 Sì 5 1 Sì 8 1 Sì 11 1 Sì 19 1 Sì 21 1 Sì 23 1 Sì 25 1 Sì 3 2 No 6 2 No 7 2 No 10 2 No 13 2 No 14 2 No 15 2 No 16 2 No 17 2 No 18 2 No 22 2 No 26 2 No 27 2 No 29 2 No 30 2 No 1 2 Sì 9 2 Sì raggruppiamo i dati per incubatrice e poi per risultato di schiusa numero incubatrice =1 13 Si 8 No 5 incubatrice =2 17 Si 2 No 15 2

3 I dati si possono tabulare più efficacemente nel modo seguente (distribuzione doppia - 2 criteri) incubatrice =1 incubatrice =2 somma pulcino Si No somma Questa è una tipica tabella di contingenza (vedi lezione 1 classificazione con 2 criteri). quali sono i parametri che regolano tale tipo di distribuzioni? 3

4 Analogamente si possono fare tabelle di contingenza a più vie (vedi lezione 1 classificazione con più criteri). Tabelle di contingenza m x n (3 x2) tesi A tesi B Uova incubate uova non fertili 4 11 uova con embrione morto 26 4 uova schiuse Per testare se le due serie di osservazioni differiscono devo ipotizzare che le due serie appartengano ad un unica popolazione dalla quale vengono estratti a caso le due serie di osservazioni e calcolare la probabilità dell'evento osservato 4

5 Da lezione 5: la funzione di frequenza di Bernoulli o distribuzione binomiale Calcola la probabilità che descrive il lancio di due dadi o l'estrazione delle palline estratte, perdenti o vincenti, da un'urna senza considerare la modifica causata dalla estrazione delle singole palline (definita statisticamente con reinserimento ). Nella distribuzione binomiale la probabilità p di un evento è costante 5

6 Quando la probabilità p di una estrazione casuale varia in funzione degli eventi precedenti, come succede in una popolazione limitata e di piccole dimensioni, si ha una distribuzione ipergeometrica. La Distribuzione Ipergeometrica Calcola la probabilità che descrive l'estrazione senza reinserimento di alcune palline, perdenti o vincenti, da un'urna. Ad esempio, data un'urna contenente 10 palline, 3 bianche e 7 nere, il numero di palline bianche estratte in una estrazione di 5 palline è descritto dalla distribuzione ipergeometrica. Generalizzando Ad esempio, data un'urna contenente n palline, h bianche e n-h nere, il numero di palline bianche estratte in una estrazione di r palline è descritto dalla distribuzione ipergeometrica. 6

7 Utilizzando un esempio tratto dal gioco delle carte per chiarire la differenza tra distribuzione binomiale e distribuzione ipergeometrica, proviamo a calcolare la probabilità di estrazione di un asso da un mazzo di 40 carte (con 4 assi): Con re-immissione della carta estratta la probabilità di estrarre un asso la prima volta è uguale a 4/40 o 1/10. Se la carta viene reintrodotta nel mazzo, la probabilità che la seconda carta sia un asso rimane 1/10; in queste estrazioni, la probabilità di tutte le carte è sempre P = 0,1. Senza re-immissione della carta estratta la probabilità che la seconda carta sia un asso dipende dalla prima estrazione. 1) Se la prima carta era un asso, la probabilità che la seconda lo sia è di 3/39, quindi P = 0,077; b) se la prima carta non era un asso, la probabilità che la seconda lo sia è di 4/39, quindi P = 0,103 Per la seconda carta e quelle successive, la probabilità P varia in funzione di quanto è avvenuto nelle estrazioni precedenti! Da questo esempio è facile comprendere che, se il mazzo di carte fosse molto grande (n grande), la probabilità P rimarrebbe approssimativamente costante. In altre parole la distribuzione binomiale (normale) rappresenta una buona approssimazione della distribuzione ipergeometrica con n grande. 7

8 Vediamo di generalizzare il calcolo delle probabilità: Supponiamo che: - un'urna contenga N bilie, delle quali n 1 bianche e k= N - n 1 nere; - si estraggono dall'urna x bilie Si vuole determinare la probabilità P(r/N) che delle x bilie estratte r siano bianche: necessariamente si può estrarre solo fino a tutte le bilie bianche, cioè: r n 1 ; necessariamente si può estrarre solo fino ad un massimo di tutte le bilie, cioè x N Per il corretto calcolo delle probabilità devo ricordare che le bilie possono essere estratte in combinazione differente e che ognuna delle combinazioni di estrarre bilie nere si combinerà con ognuna delle combinazioni di estrarre bilie bianche. Il calcolo richiede quindi 3 sotto-calcoli: 8

9 1. Delle N bilie totali le x estratte possono essere estratte in combinazione diversa; cioè in C x modi differenti. N 2.Delle n 1 bilie bianche r possono essere estratte in combinazione diversa; cioè in C r n1 3.Delle k = N-n 1 modi differenti. diversa; cioè in C x-r N-n1 bilie nere x-r possono essere estratte in combinazione modi differenti. Ognuna delle diverse possibilità di estrarre bilie bianche C r n1 si combinerà con le diverse possibilità di estrarre bilie nere C x-r N-n1 La combinazione totale sarà quindi uguale alla combinazione delle due combinazioni sulla combinazione totale; cioè la 2 per la 3 sulla 1.: P(r/N) = C r mox n1 Cx-r N-n1 C x N Per terminologia vedi lezione 1 e 5, definizione combinazione Per il calcolo delle probabilità devo ricordare che ognuna delle combinazioni di estrarre bilie nere si combina con ognuna delle combinazioni di estrarre bilie bianche. Il calcolo richiede quindi 4 passaggi: 9

10 La combinazione totale sarà quindi uguale alla combinazione delle due combinazioni dei casi sulla combinazione totale: P(r/N) = C r * C x-r n1 N-n1 C x N Campione-Y Campione-y Totale Risposta-X a b = a+b Risposta-x c d = c+d Totale = n 3 =a+c n 4 =b+d N = a+b+c+d Ma applicando la formula delle combinazioni (da lezione 1): (a+c)! * (b+d)! P(r/N) = C r * n1 Cx-r = a!*c! b!*d! = (a+b)!*(c+d)!*(a+c)!*(b+d)! = N-n1 N! N!*a!*c!*b!*d! C x N n = 1!*n 2!*n 3!*n 4! a!*b!*c!*d! (a+b)! *(c+d)! 10 n 1 n 2

11 ESEMPIO 1. ho due incubatrici A e B, nella prima incubatrice ho 7 uova e nella seconda 5, nella prima incubatrice schiudono 6 pulcini e nella seconda nessuno. E statisticamente fondato il sospetto che le due incubatrici forniscano performance diverse in modo statisticamente significativo? Per stabilire se esiste una differenza significativa tra le due distribuzioni osservate dei campioni A e B E necessario*: 1.Disporre i numeri osservati in forma di tabella 2.Calcolare la probabilità della distribuzione osservata 3.Calcolare le probabilità di tutte le altre distribuzioni più estreme 4.Sommare tutte le probabilità trovate. *Fisher R. A. (1935)-The logic of scientific inference. J. of the Royal Statistical Society, 98: Disporre i numeri osservati in forma di tabella Incubatrice-A Incubatrice-B Totale Nati 6 0 = 6 non nati 1 5 = 6 Totale = 7 5 N = 12 n 1 n 2 11

12 2.Calcolare la probabilità della distribuzione osservata: (a+c)! * (b+d)! P(r/N) = C r * n1 Cx-r N-n1 = a!*c! b!*d! = (a+b)!*(c+d)!*(a+c)!*(b+d)! = N! N!*a!*c!*b!*d! C x N Incubatrice-A Incubatrice-B (a+b)! *(c+d)! = n!*n!*n!*n 1! = 5!*7!*6!*6! = 0, a!*b!*c!*d! 12!*5!*0!*1!*6! Totale Nati 5 1 = 6 non nati 0 6 = 6 Totale = 5 7 N = 12 n 1 n ,1E+011 4,1386E+013 0,007576

13 3.Calcolare la probabilità di tutte le distribuzioni più estreme: Incubatrice-A Incubatrice-B Totale Nati 5 0 = 5 non nati 0 7 = 7 Totale = 5 7 N = 12 n 1 n 2 3.Calcolare la probabilità della seconda ed ultima distribuzione più estrema: (a+c)! * (b+d)! P(r/N) = C r * n1 Cx-r a!*c! b!*d! (a+b)!*(c+d)!*(a+c)!*(b+d)! N-n1 = = = N! N!*a!*c!*b!*d! C x N (a+b)! *(c+d)! n!*n!*n!*n! = 1 7!*5!*7!*5! = = a!*b!*c!*d! 12!*5!*0!*0!*7! ,7E+011 1,7521E+020 0,

14 Il foglio calcola il test esatto di Fisher per una tabella 2x2 con un totale massimo di 50. P value: 0,015 ATTENZIONE è possibile scrivere solo nelle caselle verdi Tesi1 Tesi 2 Totali vivi morti Totali ordina i più piccoli: column 1 column 2 Totali Riga 1 5 a 1 b 6 a+b Riga 2 0 c 6 d 6 c+d Totali 5 a+c 7 b+d 12 N (tot) colonna dei più piccoli ,008 calcola tutte le probabilità fino a n positivi colonna1 = n colonna totale 0 0, , ,

15 Il test esatto di Fisher in tabelle 2x2 Nel caso di tabelle 2 x 2 con piccoli numeri è possibile tramite calcolatore calcolare la probabilità esatta della differenza fra l due numeri. Ragionando in questo modo: dato un campione di N animali (30 nel nostro caso) nel quale m sono nati (10 nel nostro caso), se ne preleviamo n (17 nel nostro caso) e troviamo che k (2 nel nostro caso) sono nati, quale è la probabilità che tale evento si verifichi? incubat rice =1 incubat rice =2 som ma pulcino Si No somma N.B. la probabilità del successo ad ogni estrazione cambia a seconda di quanti successi sono già stati ottenuti nelle estrazioni precedenti (essendo il campione di partenza finito e non essendovi reimbussolamento. 15

16 La formula del calcolo della probabilità si riduce quindi al rapporto fra -un numeratore che è il prodotto dei fattoriali dei 4 totali marginali, -e un denominatore che è il prodotto dei fattoriali dei valori delle 4 celle moltiplicato per il fattoriale del totale generale (N). Nel nostro caso: probabilità P = (10!*20!*17!*13!)/(2!*8!*15!*5!*30!) = 0, per calcolare la probabilità totale dobbiamo però sommare alla probabilità appena calcolata anche tutte le probabilità delle tabelle ancora più sfavorevoli cioè: probabilità P = (10!*20!*17!*13!)/(1*9!*16!*4!*30!) = 0,0004 e probabilità P = (10!*20!*17!*13!)/(0!*10!*17!*7!*30!) = 0,

17 Il calcolo del test esatto è quindi estremamente complicato. Richiede l'uso di prodotti di fattoriali, che diventano quantità enormi al crescere delle numerosità osservate. Anche se sono disponibili calcolatori potenti a basso costo si rischia di introdurre approssimazioni nel calcolo perché il numero di cifre significative che gestiscono i calcolatori è comunque finito e le quantità da gestire sono enormi per numerosità superiori alle decine. Pertanto il test esatto di Fisher è raccomandabile solo quando le numerosità osservate sono molto limitate (poche decine di osservazioni), deve essere effettuato con l'ausilio del PC (foglio di calcolo) e non può essere calcolato con l'ausilio della semplice calcolatrice. 17

18 Nella pratica inoltre è frequente la necessità di verificare se esiste accordo tra una frequenza osservata e la frequenza attesa o teorica con numerosità elevata (n tot > o = 20). Il test viene definito test per la bontà dell adattamento (in inglese, goodness of fit test). Si applica a: - dati qualitativi che possono essere classificati in categorie nominali ma non numeriche continue (es. mortalità) - dati quantitativi distribuiti in classi di frequenza non numerici continui (es. nella ricerca ambientale: uso del suolo) 18

19 Si calcola (se non è definita a priori) la distribuzione attesa (nel caso di due o più confronti la distribuzione attesa sarà quella che deriva dal totale). Si confronta la distribuzione osservata con quella attesa (è evidente che tra distribuzione osservata e distribuzione attesa non si avrà quasi mai una perfetta coincidenza, anche quando si possono constatare valori molto simili). E ovvio, con il semplice buon senso, che - differenze piccole (attesa-osservata) potranno essere ritenute accidentali e quindi tali da non permettere di negare un sostanziale accordo tra osservato ed atteso. - differenze molto grandi (attesa-osservata) permettono di supporre che le differenze non siano state dovute al caso, ma che siano dovute a fattori reali che rendono significativa la differenza fra distribuzione attesa ed osservata. 19

20 Il problema statistico è di poter dedurre scientificamente ed in modo universalmente accettato se le frequenze (proporzioni) provengono dalla stessa popolazione o da due popolazioni diverse) o meglio - se sono di dimensioni tali da fare più ragionevolmente supporre una distribuzione realmente diversa da quella attesa. Test della ipotesi nulla che viene indicata con H0. se le differenze sono trascurabili (probabilmente dovute solo al caso) contro ipotesi alternativa che viene indicata con H1 oppure con HA (esistenza di una differenza reale anche se le cause sono ignote). Analogamente a quanto fatto per la distribuzione normale si standardizzano le differenze: 20

21 La legge matematica che descrive il fenomeno è molto complessa (c'è una funzione per ogni grado di libertà) ma tutte le funzioni possono essere riassunte in una tabella nella quale vengono riportati solo alcuni punti corrispondenti alle aree rimaste fuori. Analogamente ai precedenti (Z,T,F) il test del χ2 (chi-quadro) consiste nel confrontare il valore calcolato nelle serie osservate con quello tabulato corrispondente alle aree del 5% e 1%. Se il valore trovato è più grande del tabulato vuol dire che l'area è minore di quella corrispondente al valore tabulato. 21

22 LA DISTRIBUZIONE χ2 La distribuzione Chi-quadrato (χ2) (messa a punto da statistico inglese Karl Pearson, ), può essere fatta derivare dalla distribuzione normale. Date n variabili casuali indipendenti x1, x2,, xn, normalmente distribuite con µ = 0 e σ = 1, il χ2 è una variabile casuale data dalla somma dei loro quadrati. Analogamente alla distribuzione della densità di probabilità di t e di f la distribuzione della densità di probabilità del χ2 dipende dai suoi gradi di libertà (g.l.) (in inglese, degrees of freedom, abbreviato in d.f.) dove, per definizione, i gradi di libertà sono il numero di classi che restano indipendenti, 22

23 23

24 Tasso di Probabilità di un valore di chi quadro calcolato maggiore del valore in tabella gl 0,95 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,05 0,02 0,01 1 0,004 0,02 0,06 0,15 0,27 0,45 0,71 1,07 1,64 2,71 3,84 5,41 6,63 2 0,10 0,21 0,45 0,71 1,02 1,39 1,83 2,41 3,22 4,61 5,99 7,82 9,21 3 0,35 0,58 1,01 1,42 1,87 2,37 2,95 3,66 4,64 6,25 7,81 9,84 11,34 4 0,71 1,06 1,65 2,19 2,75 3,36 4,04 4,88 5,99 7,78 9,49 11,67 13,28 5 1,15 1,61 2,34 3,00 3,66 4,35 5,13 6,06 7,29 9,24 11,07 13,39 15,09 6 1,64 2,20 3,07 3,83 4,57 5,35 6,21 7,23 8,56 10,64 12,59 15,03 16,81 7 2,17 2,83 3,82 4,67 5,49 6,35 7,28 8,38 9,80 12,02 14,07 16,62 18,48 8 2,73 3,49 4,59 5,53 6,42 7,34 8,35 9,52 11,03 13,36 15,51 18,17 20,09 9 3,33 4,17 5,38 6,39 7,36 8,34 9,41 10,66 12,24 14,68 16,92 19,68 21, ,94 4,87 6,18 7,27 8,30 9,34 10,47 11,78 13,44 15,99 18,31 21,16 23, ,57 5,58 6,99 8,15 9,24 10,34 11,53 12,90 14,63 17,28 19,68 22,62 24, ,23 6,30 7,81 9,03 10,18 11,34 12,58 14,01 15,81 18,55 21,03 24,05 26, ,89 7,04 8,63 9,93 11,13 12,34 13,64 15,12 16,98 19,81 22,36 25,47 27, ,57 7,79 9,47 10,82 12,08 13,34 14,69 16,22 18,15 21,06 23,68 26,87 29, ,26 8,55 10,31 11,72 13,03 14,34 15,73 17,32 19,31 22,31 25,00 28,26 30, ,96 9,31 11,15 12,62 13,98 15,34 16,78 18,42 20,47 23,54 26,30 29,63 32, ,67 10,09 12,00 13,53 14,94 16,34 17,82 19,51 21,61 24,77 27,59 31,00 33, ,39 10,86 12,86 14,44 15,89 17,34 18,87 20,60 22,76 25,99 28,87 32,35 34, ,12 11,65 13,72 15,35 16,85 18,34 19,91 21,69 23,90 27,20 30,14 33,69 36, ,85 12,44 14,58 16,27 17,81 19,34 20,95 22,77 25,04 28,41 31,41 35,02 37, ,59 13,24 15,44 17,18 18,77 20,34 21,99 23,86 26,17 29,62 32,67 36,34 38, ,34 14,04 16,31 18,10 19,73 21,34 23,03 24,94 27,30 30,81 33,92 37,66 40, ,09 14,85 17,19 19,02 20,69 22,34 24,07 26,02 28,43 32,01 35,17 38,97 41, ,85 15,66 18,06 19,94 21,65 23,34 25,11 27,10 29,55 33,20 36,42 40,27 42, ,61 16,47 18,94 20,87 22,62 24,34 26,14 28,17 30,68 34,38 37,65 41,57 44, ,38 17,29 19,82 21,79 23,58 25,34 27,18 29,25 31,79 35,56 38,89 42,86 45, ,15 18,11 20,70 22,72 24,54 26,34 28,21 30,32 32,91 36,74 40,11 44,14 46, ,93 18,94 21,59 23,65 25,51 27,34 29,25 31,39 34,03 37,92 41,34 45,42 48, ,71 19,77 22,48 24,58 26,48 28,34 30,28 32,46 35,14 39,09 42,56 46,69 49,59 24 Tabella generata con la funzione inv.chi di excel

25 Quanti sono i gradi di libertà della differenza? Differenza fra frequenza incubatrice 1 da popolazione e Differenza incubatrice 2 da popolazione incubatrice =1 incubatrice =2 somma pulcino Si No somma Oppure: (2 incubatrici -1) per (due possibilità di pulcino -1) 25

26 NUMERI tesi A tesi B n osservato teorici osservati teorici totali morti 5 8, , vivi 8 4, , totali PERCENTUALE tesi A tesi B osservati osservati totali morti 38,46% 88,24% 66,67% vivi 61,54% 11,76% 33,33% totali 100,00% 100,00% 100,00% A morti 13 * 66,67% = 8, vivi 13 * 33,33% = 4, B morti 17 * 66,67% = 11,33333 vivi 17 * 33,33% = 5, scarti 5-8, = -3, ^2 = 13, , = 3, ^2 = 13, , = 3, ^2 = 13, , = -3, ^2 = 13,44444 CHI^2 = 13, , , , , , , , = 8,

27 CHI^2 PER UNA SOMMA DI CONFRONTI DI TABELLE 2*2 NUMERI tesi A tesi B osservati osservati totali morti 5 a 15 b 20 vivi 8 c 2 d 10 totali PERCENTUALE tesi A tesi B osservati osservati totali morti 38,46% 88,24% 66,67% vivi 61,54% 11,76% 33,33% totali 100,00% 100,00% 100,00% corr = (ad - bc)^2 * tot (a+b) * (c+d) * (a+c) * (b+d) = 8,21267 P % <o= 0,01 27

28 Probabilità di un valore di chi quadro maggiore del valore in tabella gl 0,95 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,05 0,02 0,01 1 0,004 0,02 0,06 0,15 0,27 0,45 0,71 1,07 1,64 2,71 3,84 5,41 6,63 2 0,10 0,21 0,45 0,71 1,02 1,39 1,83 2,41 3,22 4,61 5,99 7,82 9,21 3 0,35 0,58 1,01 1,42 1,87 2,37 2,95 3,66 4,64 6,25 7,81 9,84 11,34 4 0,71 1,06 1,65 2,19 2,75 3,36 4,04 4,88 5,99 7,78 9,49 11,67 13,28 5 1,15 1,61 2,34 3,00 3,66 4,35 5,13 6,06 7,29 9,24 11,07 13,39 15,09 6 1,64 2,20 3,07 3,83 4,57 5,35 6,21 7,23 8,56 10,64 12,59 15,03 16,81 7 2,17 2,83 3,82 4,67 5,49 6,35 7,28 8,38 9,80 12,02 14,07 16,62 18,48 8 2,73 3,49 4,59 5,53 6,42 7,34 8,35 9,52 11,03 13,36 15,51 18,17 20,09 9 3,33 4,17 5,38 6,39 7,36 8,34 9,41 10,66 12,24 14,68 16,92 19,68 21, ,94 4,87 6,18 7,27 8,30 9,34 10,47 11,78 13,44 15,99 18,31 21,16 23, ,57 5,58 6,99 8,15 9,24 10,34 11,53 12,90 14,63 17,28 19,68 22,62 24, ,23 6,30 7,81 9,03 10,18 11,34 12,58 14,01 15,81 18,55 21,03 24,05 26, ,89 7,04 8,63 9,93 11,13 12,34 13,64 15,12 16,98 19,81 22,36 25,47 27, ,57 7,79 9,47 10,82 12,08 13,34 14,69 16,22 18,15 21,06 23,68 26,87 29, ,26 8,55 10,31 11,72 13,03 14,34 15,73 17,32 19,31 22,31 25,00 28,26 30, ,96 9,31 11,15 12,62 13,98 15,34 16,78 18,42 20,47 23,54 26,30 29,63 32,00 28 Tabella generata con la funzione inv.chi di excel

29 CONDIZIONI DI VALIDITA DEL χ2 E CORREZIONE DI YATES - Il test (si opera su percentuali) è valido (sufficientemente restrittivo) quando il numero totale di osservazioni è superiore a 100; Il test è meno attendibile ed ha bisogno di una correzione, quando il numero di osservazioni è inferiore a 100 oppure si dispone di un solo grado di libertà; Il test non dovrebbe essere mai effettuato quando il numero totale di osservazioni è inferiore a 20 (vedi approssimazione distribuzione normale e dovrebbe essere calcolato solo il test perfetto di Fisher con il calcolo della probabilità di verifica e l utilizzo dei fattoriali vedi: Statistica05-probabilità.ppt). 29

30 Correzione di Yates: proposta da Frank Yates nel 1934 (con l articolo Contingency tables involving small numbers and the test χ2, pubblicato sulla rivista inglese J. of the Royal Statistical Society, Suppl. 1, pp ). Yates nato nel 1902 e morto nel 1994 (assistente di Fisher) poi direttore del Dipartimento di Statistica a Cambridge dal 1933 al 1968). 30

31 CHI^2 PER UN CONFRONTO IN UNA SOLA TABELLA DI CONTINGENZA 2*2 NUMERI tesi A tesi B osservati teorici osservati teorici totali morti 5 8, , vivi 8 4, , totali PERCENTUALE tesi A tesi B osservati osservati totali morti 38,46% 88,24% 66,67% vivi 61,54% 11,76% 33,33% totali 100,00% 100,00% 100,00% A morti 13 * 66,67% = 8, vivi 13 * 33,33% = 4, B morti 17 * 66,67% = 11,33333 vivi 17 * 33,33% = 5, Il rimedio di Yates consiste nell'aggiustare i dati ad una mezza unità più vicina alla frequenza attesa cioè -0,5 0,5 osservata correz. attesa scarti 5 0,5-8, = -3, ^2 = 10, ,5-4, = 3, ^2 = 10, ,5-11,33333 = 3, ^2 = 10, ,5-5, = -3, ^2 = 10,02778 CHI^2 = 10, , , , , , , , corr = 6,

32 CHI^2 PER UN CONFRONT O IN UNA SOLA TABELLA DI CONTINGENZA 2*2 NUMERI tesi A tesi B osservati osservati totali morti 5 a 15 b 20 vivi 8 c 2 d 10 totali PERCENTUALE tesi A tesi B osservati osservati totali morti 38,46% 88,24% 66,67% vivi 61,54% 11,76% 33,33% totali 100,00% 100,00% 100,00% P % corr = [ ad - bc - tot/2 ]^2 * tot 6, ,01 (a+b) * (c+d) * (a+c) * (b+d) 5,4119 0,02 3, ,05 2, ,1 corr = 6, , ,2 32 1,0742 0,3 P % <o= 0,02 0, ,5 0, ,7 0, ,8 0, ,9 0, ,95

33 Il test è meno attendibile ed ha bisogno di una correzione, quando il numero di osservazioni è inferiore a 100 oppure si dispone di un solo grado di libertà qualsiasi sia il numero delle osservazioni; Metodo rapido di calcolo: NUMERI tesi A tesi B osservati osservati totali morti 24 a 11 b 35 vivi 10 c 15 d 25 totali PERCENTUALE tesi A tesi B osservati osservati totali morti 70,59% 42,31% 58,33% vivi 29,41% 57,69% 41,67% totali 100,00% 100,00% 100,00% corr = (ad - bc)^2 * tot (a+b) * (c+d) * (a+c) * (b+d) = 4,84809 P % <o= 0,05 33

34 Metodo rapido di calcolo: NUMERI tesi A tesi B osservati osservati totali morti 24 a 11 b 35 vivi 10 c 15 d 25 totali PERCENTUALE tesi A tesi B osservati osservati totali morti 70,59% 42,31% 58,33% vivi 29,41% 57,69% 41,67% totali 100,00% 100,00% 100,00% P % corr = [ ad - bc - tot/2 ]^2 * tot 6, ,01 (a+b) * (c+d) * (a+c) * (b+d) 5, ,02 3, ,05 2, ,1 corr = 3, , ,2 1, ,3 P % <o= 0,1 0, ,5 34

35 tesi A tesi B Uova incubate uova non fertili 4 11 uova con embrione morto 26 4 uova schiuse Analizza i dati (riportando i passaggi intermedi) (è sufficiente appurare se i risultati di A differiscono da quelli di B senza sapere per quali parametri); descrivi però tutti risultati. Non posso usare il metodo rapido! 35

36 tesi A tesi B Uova incubate uova non fertili 4 11 embrioni morti 26 4 pulcini nati P % 6,635 9,210 0,01 5,412 7,824 0,02 3,841 5,991 0,05 2,706 4,605 0,1 1,642 3,219 0,2 1,074 2,408 0,3 0,455 1,386 0,5 0,148 0,713 0,7 0,064 0,446 0,8 0,016 0,211 0,9 0,004 0,103 0,95 CHI^2 PER UNA SOMMA DI CONFRONTI DI TABELLE 2*2 NUMERI tesi A tesi B n osservato teorici osservati teorici totali chiare ,00% morti ,00% pulcini ,00% totali tesi A tesi B osservati osservati totali chiare 2,00% 11,00% 5,00% morti 13,00% 4,00% 10,00% pulcini 85,00% 85,00% 85,00% totali 100,00% 100,00% 100,00% A B chiare 200 * 0,05 = 10 morti 200 * 0,10 = 20 pulcini 200 * 0,85 = 170 chiare 100 * 0,05 = 5 morti 100 * 0,10 = 10 pulcini 100 * 0,85 = 85 scarti 4-10 = -6 ^2 = = 6 ^2 = = 0 ^2 = = 6 ^2 = = -6 ^2 = = 0 ^2 = 0 CHI^2 = = 16,2 = tesi A tesi B n ,2 infertilità 2,00% 11,00% g.l. mortalità 13,00% 4,00% Schiusa 85,00% 85,00% ** Nota della tabella: * indica differenze significative fra le tesi per p<0,05 ** indica differenze significative fra le tesi per p<0,01 36

37 Posso dire che la prima serie di misure (Tesi A) differsice dalla seconda (tasi B) ma non posso dire per quale parametro: se per l'infertilità o la mortalità o entrambe. 37

38 SCOMPOSIZIONE CHI QUADRO PER SINGOLI 2*2 tesi A tesi B n osservato teorici osservati teorici totali chiare fertili totali tesi A tesi B Uova incubate uova non fertili 4 11 embrioni morti 26 4 pulcini nati tesi A tesi B n osservato teorici osservati teorici totali morti 26 20, , pulcini , , fertili correz. chiare 4 0, ,5 ^2 fertili 196-0, ,5 ^2 chiare 11-0,5-5 5,5 ^2 fertili 89 0, ,5 ^2 CHI^2 = 30,25 30,25 30, ,25 95 = 9, morti 26-0,5-20, , ^2 pulcini 170 0,5-175,3684-4, ^2 morti 4 0,5-9, , ^2 pulcini 85-0,5-79, , ^2 1 2 P % 6,635 9,210 0,01 5,412 7,824 0,02 3,841 5,991 0,05 2,706 4,605 0,1 1,642 3,219 0,2 1,074 2,408 0,3 0,455 1,386 0,5 0,148 0,713 0,7 0,064 0,446 0,8 0,016 0,211 0,9 0,004 0,103 0,95 tesi A tesi B n Yates infertilità 2,00% 11,00% 9,55 ** mortalità 13,00% 4,00% 4,11 * CHI^2 = 23, , ,70152 Schiusa 85,00% 85,00% , ,3684 9, ,70152 Nota della tabella: * indica differenze significative fra le + = 4, ,63158 tesi per p<0,05 ** indica differenze significative 38 fra le tesi per p<0,01

39 SCOMPOSIZIONE CHI QUADRO PER SINGOLI 2*2 tesi A tesi B n osservato teorici osservati teorici totali non fertili ,00% morti ,00% totali non nati tesi A tesi B n osservato teorici osservati teorici totali non nati 26 20, , ,53% nati , , ,47% totali incubate non fertili ^2 36 morti ^2 36 non fertili ^2 36 morti ^2 36 CHI^2 = = 11,36842 non nati 26-20, , ^2 28,81994 nati ,3684-5, ^2 28,81994 non nati 4-9, , ^2 28,81994 nati 85-79, , ^2 28,81994 CHI^2 = 28, , , , ,3684 9, , = 4, , ,63158 tesi A tesi B Uova incubate uova non fertili 4 11 embrioni morti 26 4 pulcini nati Servono solo per calcolare la somma non vanno riportati tesi A tesi B n infertilità 2,00% 11,00% 16,20 mortalità 13,00% 4,00% 0,00 Schiusa 85,00% 85,00% 16,36 ** Nota della tabella: * indica differenze significative fra le tesi per p<0,05 ** indica differenze significative fra le tesi per p<0, P % 6,635 9,210 0,01 5,412 7,824 0,02 3,841 5,991 0,05 2,706 4,605 0,1 1,642 3,219 0,2 1,074 2,408 0,3 0,455 1,386 0,5 0,148 0,713 0,7 0,064 0,446 0,8 0,016 0,211 0,9 0,004 0,103 0,95

40 tesi A tesi B Uova incubate uova non fertili 4 11 embrioni morti 26 4 pulcini nati tesi A tesi B n infertilità 2,00% 11,00% 4,11 * mortalità 13,00% 4,00% Schiusa 85,00% 85,00% 16,20 ** Nota della tabella: * indica differenze significative fra le tesi per p<0,05 ** indica differenze significative fra le tesi per p<0,01 9,55 ** 1 2 P % 6,635 9,210 0,01 5,412 7,824 0,02 3,841 5,991 0,05 2,706 4,605 0,1 1,642 3,219 0,2 1,074 2,408 0,3 0,455 1,386 0,5 0,148 0,713 0,7 0,064 0,446 0,8 0,016 0,211 0,9 0,004 0,103 0,95 40

I test statistici sulle frequenze

I test statistici sulle frequenze I test statistici sulle frequenze test ² (chi quadrato) test esatto di Fisher test di McNemar Camillo Pieramati Facoltà di Medicina Veterinaria di Perugia Perugia, 9 settembre 011 chi quadrato (indice

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

INFERENZA STATISTICA I (CANALE B)

INFERENZA STATISTICA I (CANALE B) INFERENZA STATISTICA I (CANALE B) FORMULE E TAVOLE a.a. 2005/06 Indice A. Formule 2 B. Quantili di una distribuzione normale standard 4 C. Quantili di una distribuzione t di Student 5 D. Quantili di una

Dettagli

INFERENZA STATISTICA I (CANALE B)

INFERENZA STATISTICA I (CANALE B) INFERENZA STATISTICA I (CANALE B) FORMULE E TAVOLE PER L ESAME a.a. 2003/04 Indice A. Formule 2 B. Quantili di una distribuzione normale standard 4 C. Quantili di una distribuzione t di Student 5 D. Quantili

Dettagli

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

7 punti Fosforo ematico punti punti

7 punti Fosforo ematico punti punti Test 13-LUG-2015 Accoppio 2 Labrador retriver neri eterozigoti. Sapendo che la probabilità di avere cuccioli biondi è p = 1/4 = 0,25, quale è la probabilità di avere almeno un cucciolo maschio nero in

Dettagli

Note sulla probabilità

Note sulla probabilità Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI IL PROBLEMA Si vuole verificare se un nuovo trattamento per la cura dell otite è più efficace

Dettagli

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi Esercizio 1 Data la variabile casuale X con funzione di densità f(x) = 2x, per 0 x 1; f(x) = 0 per x [0, 1], determinare: a) P( - 0,5 < X< 0,7) b)

Dettagli

DISTRIBUZIONI DI CAMPIONAMENTO

DISTRIBUZIONI DI CAMPIONAMENTO DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Statistica. Lezione 8

Statistica. Lezione 8 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica Marcella Montico e Lorenzo Monasta Servizio di epidemiologia e biostatistica Inferenza statistica: insieme di metodi che permette di generalizzare i risultati ottenuti dai dati raccolti

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

STATISTICA: esercizi svolti sulle VARIABILI CASUALI STATISTICA: esercizi svolti sulle VARIABILI CASUALI VARIABILI CASUALI 2 VARIABILI CASUALI. Variabili casuali generiche. Si supponga che un dado truccato, formato da sei facce contrassegnate dai numeri

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE 1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono

Dettagli

COMPLEMENTI DI PROBABILITA E STATISTICA. 3 Crediti

COMPLEMENTI DI PROBABILITA E STATISTICA. 3 Crediti CMPLEMENTI DI PRBABILITA E STATISTICA 3 Crediti Docente : Elvira Di Nardo (dinardo@unibas.it, 097-05890) Modalità di esame: Prova scritta alla fine del corso + Tesina (facoltativa) Testi consigliati: Manuale

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE 1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono

Dettagli

Probabilità e Statistica Esercitazioni. a.a. 2009/2010. C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica.

Probabilità e Statistica Esercitazioni. a.a. 2009/2010. C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica. Probabilità e Statistica Esercitazioni a.a. 2009/200 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Estrazioni I Ines Campa Probabilità e Statistica - Esercitazioni -

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.

Dettagli

Analisi della varianza a una via

Analisi della varianza a una via Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici

Dettagli

ESERCIZI SU EVENTI E VARIABILI ALEATORIE DISCRETE

ESERCIZI SU EVENTI E VARIABILI ALEATORIE DISCRETE ESERCIZI SU EVENTI E VARIABILI ALEATORIE DISCRETE Docente titolare: Irene Crimaldi 26 novembre 2009 Es.1 Supponendo che la probabilità di nascita maschile e femminile sia la stessa, calcolare la probabilità

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA AZIENDALE Modulo Controllo di Qualità STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

Copyright Esselibri S.p.A.

Copyright Esselibri S.p.A. 70 3000 500 000 1500 1000 500 A B C D (a) Capitolo Terzo A B C D 500 1000 1500 000 5003000 3500 Fig. 1 - Ortogramma a colonne (a) e ortogramma a nastri (b) 4. MISURE DI ASSOCIAZIONE E DI COGRADUAZIONE

Dettagli

Il test (o i test) del Chi-quadrato ( 2 )

Il test (o i test) del Chi-quadrato ( 2 ) Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero

Dettagli

Esercizi di Calcolo combinatorio: disposizioni

Esercizi di Calcolo combinatorio: disposizioni Calcolo combinatorio: disposizioni La Big Triple all ippodromo del luogo consiste nell indicare il corretto ordine di arrivo dei cavalli classificati tra i primi tre nella nona corsa. Se ci sono 12 cavalli

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

È possibile trovare la popolazione di origine conoscendone un campione? o meglio. partendo dalla conoscenza di n, x e d.s.?

È possibile trovare la popolazione di origine conoscendone un campione? o meglio. partendo dalla conoscenza di n, x e d.s.? Statistica6-06/10/2015 È possibile trovare la popolazione di origine conoscendone un campione? o meglio. È possibile conoscere σ e μ partendo dalla conoscenza di n, x e d.s.? 1 A partire da un campione

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 8/04/2016

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 8/04/2016 Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 8/4/26 NOME: COGNOME: MATRICOLA: Esercizio Si supponga di avere

Dettagli

Criteri di Valutazione della scheda (solo a carattere indicativo)

Criteri di Valutazione della scheda (solo a carattere indicativo) Criteri di Valutazione della scheda (solo a carattere indicativo) Previsioni - A Sono state fatte le previsioni e discussi i valori attesi insieme al ragionamento con cui sono stati calcolati? E stata

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli

distribuzione normale

distribuzione normale distribuzione normale Si tratta della più importante distribuzione di variabili continue, in quanto: 1. si può assumere come comportamento di molti fenomeni casuali, tra cui gli errori accidentali; 2.

Dettagli

NOZIONI DI CALCOLO DELLE PROBABILITÀ

NOZIONI DI CALCOLO DELLE PROBABILITÀ NOZIONI DI CALCOLO DELLE PROBABILITÀ ESPERIMENTO CASUALE: un esperimento si dice casuale quando gli esiti (manifestazioni o eventi) non possono essere previsti con certezza. PROVA: le ripetizioni, o occasioni

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Domande di teoria. Esercizi

Domande di teoria. Esercizi 1 Domande di teoria 1. Vedi pp. 131-132 2. Vedi pp. 132-134 3. Vedi p. 134 4. Vedi p. 135 5. Vedi pp. 136-142 6. Vedi pp. 138-139 7. Vedi pp. 141-142 8. Vedi pp. 143-146 9. Vedi pp. 146-148 Esercizi Esercizio

Dettagli

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE Ψ PSICOMETRIA Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE STATISTICA INFERENZIALE CAMPIONE caratteristiche conosciute POPOLAZIONE caratteristiche sconosciute STATISTICA INFERENZIALE STIMA

Dettagli

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a. UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 CDF empirica

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

Analisi di proporzioni e distribuzioni con la distribuzione binomiale

Analisi di proporzioni e distribuzioni con la distribuzione binomiale Analisi di proporzioni e distribuzioni con la distribuzione binomiale Nell analisi delle proporzioni avevamo accennato alla distribuzione binomiale o la distribuzione teorica di probabilità della statistica

Dettagli

Statistica4-29/09/2015

Statistica4-29/09/2015 Statistica4-29/09/2015 Raccogliere i dati con il maggior numero di cifre significative ed arrotondare eventualmente solo al momento dei calcoli (min. 3); nella grande maggioranza delle ricerche biologiche

Dettagli

Corso di Fondamenti di TLC Esercizi di Probabilitá

Corso di Fondamenti di TLC Esercizi di Probabilitá Corso di Fondamenti di TLC Esercizi di Probabilitá Exercise 0.1 Unurna contiene 2 biglie bianche e 5 nere. Estraiamo una prima biglia: se nera la rimettiamo dentro con altre due dello stesso colore, se

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17

Dettagli

Modelli probabilistici variabili casuali

Modelli probabilistici variabili casuali Modelli probabilistici variabili casuali Le variabili casuali costituiscono il legame tra il calcolo della probabilità e gli strumenti di statistica descrittiva visti fino ad ora. Idea: pensiamo al ripetersi

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Significatività statistica per la correlazione vers. 1.0 (5 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 4.1 I principali test statistici per la verifica di ipotesi: Il test t Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico

Dettagli

Probabilità delle cause:

Probabilità delle cause: Probabilità delle cause: Probabilità condizionata 2 Teorema delle probabilità composte A B) A) B/A) 3 Teorema delle probabilità totali B )! 4 Teorema delle probabilità delle cause n i A! B ) A / B ) B

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 43 I principali test statistici per la verifica di ipotesi: Il test del χ 2 per tavole di contingenza a 2 vie Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

Esercizi di Calcolo delle Probabilità

Esercizi di Calcolo delle Probabilità Esercizi di Calcolo delle Probabilità Versione del 1/05/005 Corso di Statistica Anno Accademico 00/05 Antonio Giannitrapani, Simone Paoletti Calcolo delle probabilità Esercizio 1. Un dado viene lanciato

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

Scopo del Corso: Lezione 1. La Probabilità. Organizzazione del Corso e argomenti trattati: Prerequisiti:

Scopo del Corso: Lezione 1. La Probabilità. Organizzazione del Corso e argomenti trattati: Prerequisiti: Lezione 1 La Probabilità Scopo del Corso: Introduzione alla probabilità e alle procedure di inferenza statistica Introduzione ad alcune importanti tecniche di analisi multivariata dei dati Organizzazione

Dettagli

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si

Dettagli

SCHEDA DIDATTICA N 7

SCHEDA DIDATTICA N 7 FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA CIVILE CORSO DI IDROLOGIA PROF. PASQUALE VERSACE SCHEDA DIDATTICA N 7 LA DISTRIBUZIONE NORMALE A.A. 01-13 La distribuzione NORMALE Uno dei più importanti

Dettagli

Test per una media - varianza nota

Test per una media - varianza nota Situazione Test per una media - varianza nota Popolazione N(µ,σ 2 ); varianza σ 2 nota. µ 0 numero reale fissato. Test di livello α per µ Statistica: Z n = X n µ 0 σ/ n. H 0 H 1 Rifiutiamo H 0 se p-value

Dettagli

Statistica. Lezione 4

Statistica. Lezione 4 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 4 a.a 2011-2012 Dott.ssa Daniela

Dettagli

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1 Variabili casuali ad una dimensione Testi degli esercizi 1 Costruzione di variabile casuale discreta Esercizio 1. Sia data un urna contenente 3 biglie rosse, 2 biglie bianche ed una biglia nera. Ad ogni

Dettagli

CORRELAZIONE NON PARAMETRICA

CORRELAZIONE NON PARAMETRICA Fondamenti di psicometria Corso di Laurea triennnale (classe 34) CORRELAZIONE NON PARAMETRICA Spesso capita di non avere a disposizione delle misure di tipo metrico per le due variabili, X e Y, che si

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

5. Test per proporzioni: confronto tra campioni e associazione

5. Test per proporzioni: confronto tra campioni e associazione BIOSTATISTICA 5. Test per proporzioni: confronto tra campioni e associazione Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Chi-quadro. sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria

Chi-quadro. sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria Chi-quadro In generale, se sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria si distribuisce secondo una distribuzione Chi-quadro con k gradi di libertà Chi-quadro Dunque

Dettagli

Matematica e Statistica per Scienze Ambientali

Matematica e Statistica per Scienze Ambientali per Scienze Ambientali LABORATORIO R - Appunti 1 1 Dipartimento di Matematica Sapienza, Università di Roma Roma, Gennaio 2014 Argomenti La distribuzione normale e applicazioni La distribuzione binomiale

Dettagli

Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.

Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta. TEST D IPOTESI 1 Le resistenze alla rottura delle funi prodotte da una fabbrica hanno una media pari a µ = 1800N ed uno scarto quadratico medio di σ = 100N Immettendo una nuova tecnica nel processo produttivo,

Dettagli

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

La probabilità matematica

La probabilità matematica 1 La probabilità matematica In generale parliamo di eventi probabili o improbabili quando non siamo sicuri se si verificheranno. DEFINIZIONE. Un evento (E) si dice casuale, o aleatorio, quando il suo verificarsi

Dettagli

Differenze tra metodi di estrazione

Differenze tra metodi di estrazione Lezione 11 Argomenti della lezione: L analisi fattoriale: il processo di estrazione dei fattori Metodi di estrazione dei fattori Metodi per stabilire il numero di fattori Metodi di Estrazione dei Fattori

Dettagli

Statistica per le le ricerche ricerche di mercato 9.b 9.b Analisi Analisi preliminari preliminari Verifica di ipotesi: test test di indipendenza

Statistica per le le ricerche ricerche di mercato 9.b 9.b Analisi Analisi preliminari preliminari Verifica di ipotesi: test test di indipendenza Statistica per le ricerche di mercato a.a. 014/15 9.b Analisi preliminari Verifica di ipotesi: test di indipendenza Test di indipendenza Permette di verificare se tra due variabili X e Y esiste o meno

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot.

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot. UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 I Esonero - 29 Ottobre 2013 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

C.I. di Metodologia clinica

C.I. di Metodologia clinica C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni

Dettagli

esercitazione1 12/10/2015

esercitazione1 12/10/2015 esercitazione1 12/10/2015 VARIABILE CLASSIFICAZIONE TIPOLOGIA Peso vivo del cavallo Ora della deposizione dell uovo Colore mantello Presenza corna Latte prodotto N. uova prodotte Presenza speroni alle

Dettagli

Prof.ssa Laura Pagnozzi Prof. Ivano Coccorullo. Calcolo Combinatorio

Prof.ssa Laura Pagnozzi Prof. Ivano Coccorullo. Calcolo Combinatorio Prof.ssa Laura Pagnozzi Prof. Ivano Coccorullo Calcolo Combinatorio Calcolo Combinatorio ü Molti dei problemi classici di calcolo delle probabilità si riducono al calcolo dei casi favorevoli e di quelli

Dettagli

Test per l omogeneità delle varianze

Test per l omogeneità delle varianze Test per l omogeneità delle varianze Le carte di controllo hanno lo scopo di verificare se i campioni estratti provengono da un processo produttivo caratterizzato da un unico valore dello s.q.m. σ. Una

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 20/10/201 NOME: COGNOME: MATRICOLA: Esercizio 1 Se supponiamo

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 15-La probabilità vers. 1.0a (26 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2014-2015

Dettagli

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017 Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................

Dettagli

Precorso di Analisi Matematica Facoltà d'ingegneria Università del Salento

Precorso di Analisi Matematica Facoltà d'ingegneria Università del Salento Precorso di Analisi Matematica Facoltà d'ingegneria Università del Salento Calcolo Combinatorio Prof. A. Albanese Dipartimento di Matematica e Fisica E. De Giorgi - Università del Salento Disposizioni

Dettagli

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

Esercitazione 1 del corso di Statistica 2

Esercitazione 1 del corso di Statistica 2 Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Dott.ssa Paola Costantini Esercizio n. 1 Estraendo due carte da un mazzo di carte napoletane con la reimmissione della carta nel mazzo

Dettagli

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Analisi degli Errori di Misura. 08/04/2009 G.Sirri Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia

Dettagli

Sperimentazioni di Fisica I mod. A Statistica - Lezione 3

Sperimentazioni di Fisica I mod. A Statistica - Lezione 3 Sperimentazioni di Fisica I mod. A Statistica - Lezione 3 A Garfagnini, M Mazzocco, C Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Teoria della Probabilità L ineliminabile

Dettagli

Lezione 2. La probabilità oggettiva : definizione classica e frequentistica e loro problemi

Lezione 2. La probabilità oggettiva : definizione classica e frequentistica e loro problemi Lezione 2 La probabilità oggettiva : definizione classica e frequentistica e loro problemi La definizione classica Definizione classica: La probabilità di un evento E è il rapporto tra il numero dei casi

Dettagli

Distribuzioni di probabilità

Distribuzioni di probabilità Distribuzioni di probabilità Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA. Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi

Dettagli

distribuzione della popolazione campionata distribuzione di quantità che dipendono dal campione (distribuzioni campionarie)

distribuzione della popolazione campionata distribuzione di quantità che dipendono dal campione (distribuzioni campionarie) Obiettivi lezione 4 CAPIRE: distribuzione della popolazione campionata distribuzione di quantità che dipendono dal campione (distribuzioni campionarie) CONOSCERE: Le distribuzioni della media campionaria,

Dettagli

Esercitazione N. 1 (11 ottobre 2016)

Esercitazione N. 1 (11 ottobre 2016) Esercitazione N. 1 (11 ottobre 2016) Un'urna contiene elementi. Vengono estratti di seguito elementi, ogni elemento una volta estratto è riposto nell'urna. Calcolare la probabilità dell evento: Problema

Dettagli

Abbiamo visto come si possa determinare il numero di possibili anagrammi di una parola, con lettere tutte distinte o con alcune lettere ripetute.

Abbiamo visto come si possa determinare il numero di possibili anagrammi di una parola, con lettere tutte distinte o con alcune lettere ripetute. MODELLI (Approfondimenti) Approfondiamo i 3 modelli più frequentemente utilizzati nell'analisi Combinatoria e nel Calcolo delle Probabilità, precisamente il modello ANAGRAMMA, il modello ESTRAZIONE e il

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento

Dettagli