Stima di parametri e intervalli di confidenza

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Stima di parametri e intervalli di confidenza"

Transcript

1 Capitolo 3 Stima di parametri e intervalli di confidenza 3.1 Stima di parametri La statistica parametrica consiste nell ipotizzare che i dati osservati provengano da un modello probabilistico ben definito eccetto per il valore di alcuni parametri. Le osservazioni ci forniscono allora delle informazioni per inferire il valore di tali parametri. Contrariamente all approccio Bayesiano in cui vogliamo arrivare ad assegnare una probabilità ai possibili valori dei parametri, nell approccio frequentista (tuttora il più diffuso nella statistica inferenziale) si ritiene che esista un valore vero dei parametri (non ha quindi senso assegnarvi una probabilità) e si tratta di stimarlo meglio possibile sulla base delle osservazioni. A questo scopo useremo delle statistiche, cioè dei valori numerici calcolati a partire dai dati osservati: se x 1,... x n sono i dati osservati, una statistica è una funzione g(x 1,..., x n ); ad esempio, la media campionaria x = (x x n )/n è una statistica. Generalizzando quanto detto prima sul campionamento, assumiamo che le n osservazioni siano il risultato di n variabili casuali X 1,... X n con una data distribuzione che però contiene parametri ignoti. Ogni statistica può essere considerata quindi il risultato della variabile casuale g(x 1,... X n ) che avrà anch essa una sua distribuzione; potremo quindi parlare del valore atteso o della varianza di una statistica, come visto nel capitolo dedicato a media e varianza campionarie. I parametri ignoti li rappresentiamo in genere con la lettera ϑ dove ϑ può essere uni-dimensionale (ed essere quindi un unico parametro) oppure multi-dimensionale (ad esempio potremmo non conoscere né la media µ né 23

2 la varianza σ 2 di una distribuzione normale e quindi ϑ rappresenterebbe la coppia: ϑ = (µ, σ 2 ). Se conoscessimo ϑ, il modello probabilistico sarebbe definito; indichiamo quindi con P ϑ0 (A) la probabilità di un evento A (che coinvolge le variabili X 1,... X n ) usando il valore ϑ 0 per il parametro ignoto, e con E ϑ0 (Y ) il valore atteso di una variabile casuale Y (costruita a partire da X 1,... X n ) usando il valore ϑ 0 per il parametro ignoto. In genere vogliamo stimare ϑ ovvero una delle componenti nel caso ϑ sia multidimensionale; ad esempio, potrebbe essere ϑ = (µ, σ 2 ) e a noi interessa stimare solo µ o solo σ 2 (o comunque è utile considerare separatamente le due quantità). Volendo usare una notazione unica, scrivo che vogliamo stimare la quantità τ(ϑ) dove τ è una qualche funzione del parametro ϑ. In genere τ(ϑ) = ϑ se ϑ è uni-dimensionale, oppure se ϑ = (µ, σ 2 ) sarà τ(ϑ) = µ oppure τ(ϑ) = σ 2. La notazione τ(ϑ) è solo un modo per scrivere il problema in generale, senza dover considerare troppi casi particolari. Uno stimatore di τ(ϑ) è semplicemente una statistica che usiamo per stimare τ(ϑ). Ovviamente vorremmo trovare una statistica g(x 1,..., x n ) che effettivamente approssimi il valore vero τ(ϑ). Siccome i dati x 1,..., x n sono il prodotto delle variabili casuali X 1,..., X n anche lo stimatore ˆτ = g(x 1,..., X n ) è una variabile casuale. Non possiamo quindi pretendere che fornisca sempre il valore giusto. Una delle proprietà che spesso si richiede ad uno stimatore è che sia corretto (o non distorto), ossia che valga E ϑˆτ = E ϑ g(x 1,..., X n ) = τ(ϑ) (3.1) ovvero che se ripetessimo tante volte il processo di stima usando osservazioni diverse, in media troveremmo il valore giusto. Ci sono delle altre proprietà che si possono richiedere ad uno stimatore, come quello di avere una varianza piccola (o minima possibile) in modo che le deviazioni dal valore giusto non siano troppo grandi. Possiamo anche domandarci se ci siano dei metodi standard per costruire stimatori. Esiste tutta una teoria statistica che discute questi problemi, che però non affronto in questo corso. Mi limito a ricordare gli stimatori standard per media e varianza di una distribuzione, ossia la media e varianza campionaria, visti prima come (1.6) e (1.9). Preferisco invece affrontare la stima intervallare, ossia il metodo per assegnare un intervallo in cui si ritiene debba essere il valore vero τ(ϑ). 24

3 3.2 Intervalli di confidenza Un intervallo di confidenza per τ(ϑ) al livello γ (tradizionalmente per γ si usa il 95% o il 90% o il 99%) è un intervallo casuale (T 1, T 2 ) dove T 1 = t 1 (X 1,..., X n ) e T 2 = t 1 (X 1,..., X n ) sono funzioni dei dati e quindi sono variabili casuali tali che P ϑ (T 1 τ(ϑ) T 2 ) γ ϑ. (3.2) La relazione (3.2) va letto come la probabilità che l intervallo casuale (T 1, T 2 ) contenga il valore vero e non come la probabilità che τ(ϑ) appartenga ad un dato intervallo, perché nel modello usato τ(ϑ) è un numero (non una variabile casuale) e quindi non ha senso parlarne di probabilità (non avrebbe senso parlare della probabilità che 3 sia minore di 5). In altri termini, se ad esempio γ = 95%, chiedamo che se ripetessimo 100 volte le osservazioni con lo stesso ϑ, costruendo ogni volta l intervallo casuale (T 1, T 2 ) (che sarà diverso tutte le volte), ci aspetteremmo che 95 di queste volte il valore vero τ(ϑ) sarebbe nell intervallo costruito e 5 volte sarebbe fuori. Come facciamo a costruire un intervallo di confidenza? Senza voler fare una teoria generale, facciamo alcuni esempi. Si noterà nel seguito una certa similarità al problema del test di ipotesi Intervallo di confidenza per µ con σ 2 noto. Supponiamo che X 1,..., X n siano normali indipendenti di media µ e varianza σ 2. Vogliamo trovare un intervallo di confidenza per µ supponendo che σ 2 sia noto (anche se la situazione mi sembra improbabile). Abbiamo già visto che in questo caso X N(µ, σ2 ). Questo fatto si può n anche scrivere come Z = X µ σ/ = ( X µ) σ N(0, 1). Dalle tabelle della distribuzione normale troviamo z γ tale che P( Z z γ ) = γ. Ad esempio, se γ = 95%, z γ = Usando la definizione di Z, abbiamo allora P( z g ( X µ) σ 25 z g ) = γ (3.3)

4 Poiché z g ( X µ) σ ( X µ) possiamo riscrivere (3.3) come σ µ X + σz g z g X σz g µ e P( X σz g µ X + σz g ) = γ. (3.4) Confrontando (3.4) con (3.2) possiamo dire che ( X σzg, X + σzg ) è un intervallo di confidenza per µ al livello γ. Dalla definizione sarebbe possibile anche scegliere intervalli di confidenza non simmetrici. Ad esempio si ha anche P( 1.75 N(0, 1) 2.33) = 95% = P( 1.96 N(0, 1) 1.96), Usando questo fatto possiamo dire che ( X σ1.75, X + σ2.33 ) è un intervallo di confidenza per µ al 95% tanto quanto lo è ( X σ1.96, X + σ1.96 ). E pero consuetudine (giustificabile in vari modi) scegliere intervalli di confidenza σzg σzg simmetrici (in probabilità) e quindi diremo che ( X, X+ ) è l intervallo di confidenza per µ al livello γ Intervallo di confidenza per la probabilità di successo nel modello binomiale Approssimazione normale.1 Come si è visto, il modello binomiale è molto utilizzato ed è naturale volere stimare la probabilità di successo p. Ad esempio, possiamo aver fatto un sondaggio elettorale su un campione di n elettori e vogliamo dare un intervallo di confidenza per la vera percentuale di votanti per il candidato Y. Possiamo formalizzare il tutto dicendo che X i = 1 in caso di successo alla prova i, i = 1... n (con probabilità p che vogliamo stimare) e X i = 0 incaso di insuccesso (con probabilità 1 p) Chiamando S = X 1 + +X n il numero di successi, abbiamo che la media campionaria X = S/n è lo stimatore naturale della media µ di X i, ossia di p; chiameremo ˆp = S/n. Per trovare un intervallo di confidenza, possiamo usare il fatto che X è approssimativamente normale se n è grande, ossia X N(p, p(1 p)/n). Applicando brutalmente il calcolo compiuto per l intervallo di confidenza per 26

5 µ nel caso di σ 2 noto (possiamo usare la formula (3.4) con σ 2 = p(1 p)/n e ˆp(1 ˆp)zg n = 1), troveremmo (ˆp ) come intervallo di confidenza per p al livello γ. Se ad esempio fosse n = 6, S = 4 e quindi ˆp = 2/3, e scegliessimo γ = 95%, otterremmo l intervallo ( , ) (0.290, 1.044) , ˆp+ˆp(1 ˆp)zg Queto calcolo è poco ragionevole per due motivi: prima di tutto perché abbiamo utilizzato ˆp(1 ˆp) per la varianza, come se essa fosse nota; in secondo luogo perché n = 6 certamente non è abbastanza grande perché l approssimazione normale sia giustificata. Approssimazione normale.2 Per correggere il primo problema, notiamo che il teorema centrale afferma che (ˆp p) p(1 p) = N(0, 1). Quindi trovato z γ possiamo scrivere ˆp p P( z γ ) = γ. (3.5) p(1 p) Dobbiamo quindi trasformare le disuguaglianze ˆp p p(1 p) z γ in p 1 p p 2. Facendo il quadrato di entrambi i membri, abbiamo n(ˆp p) 2 p(1 p) z2 γ p 2 (n + z 2 γ) p(2nˆp + z 2 γ) + nˆp 2 0, (3.6) che si risolve facilmente in p 1 p p 2 dove 0 < p 1 < p 2 < 1 sono le radici dell equazione quadratica ottenuta da (3.6). Nell esempio n = 6, S = 4, l equazione è 9.84p p = 0 = p 1 = 0.30, p 2 = 0.90 e quindi l intervallo di confidenza al 95% sarebbe (0.30, 0.90). Per tenere conto del fatto che si approssima una distribuzione discreta (la binomiale) con una continua, si usa la correzione di continuità di Yates che va al di là del livello di queste note. In R la procedura prop.test calcola (anche) l intervallo di confidenza per p, applicando (a meno che uno esplicitamente 27

6 indichi il contrario) la correzione di Yates. Calcolando questo esempio in R, si trova che, grazie alla correzione di Yates, In questo modo l intervallo trovato è (0.24, 0.94), un po diverso da quanto trovato senza correzione. Se n è più grande, la differenza fra gli intervalli di confidenza con e senza correzione di Yates è invece molto piccola. Intervallo di confidenza per la probabilità di successo nel modello binomiale: calcolo esatto E possibile calcolare l intervallo di confidenza usando in modo esatto la distribuzione binomiale. Il calcolo è molto più lungo, ma se n è piccolo, vale decisamente la pena fare il calcolo esatto, se uno ha a disposizione un computer. Il metodo per il calcolo dell intervallo di confidenza è generale, anche se specificato solo per l; esempio della binomiale. Consideriamo una funzione dei dati che ci serve per stimare il parametro che ci interessa; in questo caso il parametro è p, e come funzione scegliamo S, il numero di successi 1. Per ogni p troviamo quali sono i valori possibili di S al livello di confidenza richiesto. Per la precisione troviamo g 1 (p) e g 2 (p) tali che P p (g 1 (p) S g 2 (p)) γ, P p (S < g 1 (p)) 1 γ 2, P p(s > g 2 (p)) 1 γ 2. Richiediamo 1 γ 1 γ, e non = perché S ha una distribuzione discreta 2 2 e non si può in genere trovare un valore g 2 (p) tale che P p (S > g 2 (p)) = 1 γ. 2 Ad esempio, se γ = 95%, n = 6 e p = 1/2, vediamo che P p (S > 5) = P p (S = 6) = p 6 = < 2.5%, quindi g 2 (p) 5, ma P p (S > 4) = P p (S = 5) + P p (S = 6) = > 2.5%, quindi g 2 (p) = 5. Analogamente g 1 (p) = 1. 1 potremmo usare anche ˆp = S/n, ma la notazione è più semplice usando S 28

7 Supponendo che g 1 e g 2 siano funzioni crescenti di p, possiamo considerarne le inverse g1 1 (S) e g2 1 (S) e poniamo t 1 (S) = g2 1 (S), t 2 (S) = g1 1 (S). Abbiamo (vedi figura) Di conseguenza g 1 (p) S g 2 (p) t 1 (S) p t 2 (S). (3.7) P p (t 1 (S) p t 2 (S)) = P p (g 1 (p) S g 2 (p)) γ p cioè (t 1 (S), t 2 (S)) è un intervallo di confidenza per p al livello γ. In realtà non abbiamo bisogno di costruire esplicitamente le funzioni g 1 e g 2 e di invertirle, e neanche che tali funzioni siano invertibili. Per esempio, nel caso della distribuzione binomiale, g 1 e g 2 sono delle funzioni a scalino che possono prendere solo i valori 0, 1,..., n e quindi non sono invertibili. Dal disegno ci accorgiamo che, fissato un valore S 0 se p < t 1 (S 0 ) si ha S 0 > g 2 (p) e quindi P p (S S 0 ) (1 γ)/2. Possiamo allora definire. t 1 (S 0 ) = max{p : P p (S S 0 ) (1 γ)/2} t 2 (S 0 ) = min{p : P p (S S 0 ) (1 γ)/2}. (3.8) La definizione (3.8) si può usare senza problemi anche al caso di distribuzioni discrete. Riprendiamo l esempio precedente di un campionamento dalla binomiale con n = 6, S = 4 e scegliamo γ = 95%. Per prima cosa dobbiamo trovare {p : P p (S 4) 0.025}, ossia l insieme dei p tali che la probabilità di avere almeno 4 successi su 6 tentativi sia più piccola del 2,5%. t 1 (4) sarà il massimo di tale insieme. Si ha P p (S 4) = P p (S = 6)+P p (S = 5)+P p (S = 4) = p 6 +6p 5 (1 p)+15p 4 (1 p) 2. Ponendo f(p) = p 6 +6p 5 (1 p)+15p 4 (1 p) 2, dobbiamo trovare il massimo valore di p tale che f(p) Poiché f(p) è crescente 2 in [0, 1] (l insieme dei valori posssibili per p), dobbiamo trovare p [0, 1] tale che f(p) = Risolvendo questa equazione con l aiuto di un apposito programma al computer troviamo p 0.223, ossia t 1 (4) Passiamo ora al limite superiore. Dobbiamo trovare min{p : P p (S 4) 0.025}. P p (S 4) = 1 P p (S = 5) P p (S = 6) = 1 p 6 6p 5 (1 p). 2 controllare 29

8 Questa volta dobbiamo risolvere 1 p 6 6p 5 (1 p) = 0.025, ossia p 6 + 6p 5 (1 p) = La soluzione è p 0.957, ossia t 2 (4) In conclusione, l intervallo di confidenza trovato è (0.223, 0.957). Come si è visto, si tratta di calcoli non fattibili a mano, neanche nel caso di numeri estremamente piccoli. Esistono delle tabelle per n piccolo, ma soprattutto è possibile calcolare l intervallo di confidenza tramite software statistici; in R si usa l istruzione binom.test Intervallo di confidenza per µ con σ 2 ignoto. Supponiamo come prima che X 1,..., X n siano normali indipendenti di media µ e varianza σ 2, ma che σ 2 non sia noto. I conti precedenti valgono ancora, ma ( X σzg, X + σzg ) non può essere considerato un intervallo di confidenza, perché non conosciamo σ e quindi non possiamo calcolare tale intervallo. Si potrebbe sostituire σ con la varianza campionaria S 2, ma allora i calcoli precedenti non sarebbero corretti, anche se, per n grande, l intervallo calcolato sarebbe quasi giusto, come discusso sotto. Consideriamo invece la variabile ottenuta da Z sostituendo S 2 a σ 2. Otteniamo T = X µ n( S/ = X µ). S Abbiamo già visto in (1.16) che T segue la distribuzione t(n 1). Leggendo le tabelle della distribuzione t con n 1 gradi di libertà, possiamo allora trovare t γ tale che P( T t γ ) = γ. Con passaggi analoghi ai precedenti, arriviamo a P( X St γ µ X + St γ ) = γ (3.9) ossia ( X Stγ, X + Stγ ) è un intervallo di confidenza al livello γ per µ. La quantità t γ è sempre un po maggiore di z γ, quindi l intervallo trovato è un pochino più ampio di quanto avremmo avuto sostituendo S a σ nel caso precedente. Però la distribuzione t(n) tende alla normale standard al crescere di n ; quindi la differenza fra i due casi diventa sempre più piccola fino ad essere trascurabile per n > 100 e poco significativa già per n > 20. In R la procedura t.test calcola (anche) l intervallo di confidenza (di default al 95%) per la media di un campione di dati. 30

9 I calcoli precedenti valgono solo se X 1,..., X n seguono la distribuzione normale. Però il teorema centrale afferma che X si può approssimare con una normale per n abbastanza grande. E quindi comune usare gli intervalli di confidenza per la media calcolati sopra, anche nel caso in cui X 1,..., X n non seguano la distribuzione normale, purché n non sia troppo piccolo e le distribuzioni di X i troppo asimmetriche Intervallo di confidenza per la varianza Si è detto in (1.15) che (n 1)S 2 /σ 2 segue una distribuzione chi-quadro con n 1 gradi di libertà, se X 1,..., X n sono distribuiti secondo una normale (e vi si avvicina per n grande, qualunque sia la distribuzione di X 1,..., X n ). Possiamo usare questo fatto per calcolare gli intervalli di confidenza per σ 2. Fissato il livello di confidenza γ, troviamo c 1 e c 2 tali che P(c 1 χ 2 (n 1) c 2 ) = γ, P(χ 2 (n 1) c 1 ) = 1 γ = P (χ 2 (n 1) c 2 ). 2 (3.10) [Notare che in (3.10) abbiamo scelto c 1 e c 2 in modo che le probabilità dei segmenti esclusi sia uguale sui due lati]. Ad esempio, se γ = 95% e n = 20, ossia n 1 = 19, troviamo c 1 8.9, c L equazione (3.10) indica che P(c 1 (n 1)S2 σ 2 c 2 ) = γ. E molto semplice riscrivere questa espressione in termini di un intervallo di confidenza per σ 2. Infatti c 1 (n 1)S2 σ 2 σ 2 (n 1)S2 c 1 e (n 1)S2 σ 2 c 2 σ 2 (n 1)S2 c 2. ( (n 1)S2 c 2, (n 1)S2 c 1 ) è quindi un intervallo di confidenza al livello γ per σ 2. Supponiamo per esempio che con n = 20 abbiamo trovato S 2 = 1.9. L intervallo di confidenza al 95% per σ 2 satà circa (1.10, 4.05). Se n = 100, l intervallo di confidenza sarebbe (1.46, 2.56). Non mi sembra che esista in R un istruzione per calcolare direttamente tale intervallo. 31

10 3.2.5 Intervallo di confidenza per la differenza fra le medie di due gruppi Spesso più che stimare quanto vale la media di una certa quantità in una popolazione, ci interessa confrontare i valori di una quantità in due gruppi diversi; per dare qualche esempio della cui verosimiglianza biologica non sono certo, confrontare la concentrazione di clorofilla nelle piante di una certa specie che crescono nel sottobosco con quelle che crescono nelle radure, ovvero fra le foglie appena spuntate e quelle più vecchie della stessa pianta; confrontare i livelli di colesterolo fra le persone che svolgono attività sportiva e quelle con vita sedentaria, oppure in un certo gruppo di individui prima e dopo una cura farmacologica. Gli esempi dovrebbero mostrare che ci possono essere due classi di osservazioni: quelle in cui i due gruppi studiati sono indipendenti, e quelle in cui ci sono campioni naturalmente appaiati (le foglie della stessa pianta; la stessa persona prima e dopo il trattamento). Il tipo di analisi e di ipotesi sono diversi nei due casi. Campioni indipendenti Abbiamo due gruppi di campioni x 1,..., x n e y 1,..., y m, di cui supponiamo X 1,..., X n N(µ X, σ 2 X), Y 1,..., Y m N(µ Y, σ 2 Y ), e indipendenti. Vogliamo ottenere una stima di µ X µ Y, il cui stimatore più ovvio è x ȳ. Si trova facilmente che X Ȳ N(µ X µ Y, σ2 X n + σ2 Y m ). Supponendo di non conoscere σx 2 e σ2 Y, vogliamo ricondurci al caso della distribuzione t usato nel caso di un solo campione. Per potere procedere con passaggi matematici relativamente semplici, è necessario fare l ipotesi di uguaglianza delle varianze: σx 2 = σ2 Y = σ2. Quando si procede in questo modo, è bene assicurarsi (almeno tramite un ispezione veloce dei valori della varianza campionaria nei due gruppi) che tale ipotesi sia verosimile. Senza questa ipotesi, le procedure diventano più complesse e approssimate; in ogni caso, i programmi statistici analizzano senza problemi anche il caso in cui le varianze sono diverse. Per esempio in R, il comando t.test, quando viene usato per il confronto di due campioni, svolge i calcoli sotto l ipotesi che le varianze siano diverse, a meno che l utente chieda altrimenti tramite l opzione var.equal=true. 32

11 Supponendo la varianza uguale nei due gruppi, prima di tutto ci serve uno stimatore della varianza comune. Quello standard è S 2 X,Y = n 1 n + m 2 S2 X + m 1 n + m 2 S2 Y dove SX 2 e S2 Y sono la varianza campionaria nei due gruppi; si vede che S2 X,Y è una media pesata (dalla dimensione del gruppo) delle varianze campionarie dei due gruppi. Poi, con dei conti analoghi a quelli usati per un gruppo solo, si vede che X Ȳ (µ X µ Y ) 1 S + 1 n m t(n + m 2). (3.11) Il modo di ottenere un intervallo di confidenza per µ X µ Y da (3.11) è uguale ai casi precedenti. Fissato il livello di confidenza γ (es. 95%), troviamo t γ tale che P( t(n + m 2) t γ ) = γ. Allora P( X Ȳ (µ X µ Y ) S 1 n + 1 m t γ ) = γ e con un po di manipolazioni algebriche troviamo P( X 1 Ȳ t γs n + 1 m µ X µ Y X 1 Ȳ + t γs n + 1 m ) = γ ossia ( X 1 Ȳ t γs n + 1 m, X 1 Ȳ + t γs n + 1 m ) è un intervallo di confidenza per µ X µ Y. Campioni appaiati Nel caso di campioni appaiati, necessariamente m = n e l ipotesi generale che facciamo è che X i Y i N(µ, σ 2 ), i = 1... n. Notiamo che non facciamo alcuna ipotesi su come le variabili X i e Y i siano distribuite nella popolazione, ma soltanto che la loro differenza abbia una certa distribuzione, normale, con dato valore atteso (µ su cui vogliamo ottenere un intervallo di confidenza) e varianza. 33

12 Di conseguenza, posto Z i = X i Y i, cerchiamo di trovare un intervallo di confidenza per la media della variabile Z; possiamo quindi usare le tecniche viste nel caso di un singolo campione alla differenza dei due. Per fare i calcoli avremo bisogno di conoscere S 2 X Y = 1 n 1 n i=1 (z i z) 2 = 1 n 1 n (x i y i ( x ȳ)) 2 i=1 non sono quindi suffi- la varianza delle differenze. Informazioni su SX 2 e S2 Y cienti, in questo caso. 3.3 La stima di massima verosimiglianza Gli esempi di stima di parametri visti finora appaiono tutti metodi ad hoc seppure ragionevoli. Esistono invece metodi generali per costruire stimatori ed intervalli di confidenza. Qui presento brevemente un metodo generale per costruire stimatori, il metodo della massima verosimiglianza, giustificandolo soltanto perché convincente a livello intuitivo. Non discuto invece proprietà generali di tale metodo. La verosimiglianza è un termine che comprende i casi di probabilità sia discreta sia continua. Siano x 1,..., x n i dati osservati. Se le variabili casuali X 1,..., X n previste nel modello (comprendente i parametri ϑ da stimare) che si ritiene abbia generato i dati sono discrete, definiamo la funzione di verosimiglianza L( ) come L(ϑ) = P ϑ (X 1 = x 1,..., X n = x n ). Se, come in tutti i casi considerati, X 1,..., X n sono indipendenti, L si scrive come prodotto L(ϑ) = P ϑ (X 1 = x 1 ) P ϑ (X n = x n ). Se invece le variabili casuali X 1,..., X n sono continue, esse avranno una densità f e porremo L(ϑ) = f ϑ (x 1,..., x n ) = (se X 1,..., X n sono indipendenti) = f ϑ (x 1 ) f ϑ (x n ). Esempi. Se X 1,..., X n sono variabili casuali indipendenti distribuite secondo Poisson, il parametro da stimare è λ e x 1,..., x n sono i dati osservati (necessariamente interi) avremo L(λ) = λx 1 x 1! e λ λxn x n! e λ = λx1+ +xn x 1! x n! e λn. 34

13 Se X 1,..., X n sono variabili casuali indipendenti normali, i parametri da stimare sono µ e σ 2 e x 1,..., x n sono i dati osservati L(µ, σ 2 ) = 1 (x 2πσ 2 e 1 µ)2 1 (xn µ)2 2σ 2 e 2σ 2 = (2πσ 2 ) n/2 e (x 1 µ)2 + +(xn µ) 2 2σ 2. 2πσ 2 Se X 1,..., X n sono variabili casuali di Bernoulli (ossia che può avere valore 1 con probabilità p e 0 con probabilità 1 p), ossia X X n è una variabile casuale binomiale di parametri n e p dove n è noto mentre p è da stimare, e i dati consistono in k successi e n k insuccessi, allora ( ) n L(p) = p k (1 p) n k. k Il criterio della massima verosimiglianza consiste nello stimare ϑ tramite il valore ˆϑ che rende L massima. In altre parole lo stimatore di massima verosimiglianza ˆϑ ha la proprietà che L( ˆϑ) = max L(ϑ) dove il massimo si cerca su tutti i valori ϑ ammissibili. Esempio. Consideriamo il caso della stima di p, la probabilità di successo in un modello binomiale. Abbiamo visto L(p) = ( n k) p k (1 p) n k. Per trovarne il massimo, conviene passare ai logaritmi, ossia considerare ( ) n LL(p) = log(l(p)) = log + k log(p) + (n k) log(1 p) k la cui derivata LL (p) = k p n k 1 p = k(1 p) (n k)p p(1 p) = k np p(1 p) E evidente che LL (p) = 0 se p = k/n, LL (p) > 0 se 0 < p < k/n, LL (p) < 0 se k/n < p < 1 (trascuriamo il caso banale in cui sia k = 0 ovvero k = n). Di conseguenza il massimo di LL (e quindi anche di L) si ha in p = k/n, ovvero lo stimatore di massima verosimiglianza ˆp = k/n, la scelta più ovvia (numero di successi/numero di tentativi). 35

Alcune formule di statistica inferenziale per il corso di Matematica e Statistica II A. A. 2009/10

Alcune formule di statistica inferenziale per il corso di Matematica e Statistica II A. A. 2009/10 Alcune formule di statistica inferenziale per il corso di Matematica e Statistica II A. A. 2009/10 Andrea Pugliese 1 Valore atteso e varianza di variabili casuali Definizione 1. Se X è una variabile casuale

Dettagli

Statistica Applicata all edilizia: Stime e stimatori

Statistica Applicata all edilizia: Stime e stimatori Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica

Dettagli

Elementi di Probabilità e Statistica - 052AA - A.A

Elementi di Probabilità e Statistica - 052AA - A.A Elementi di Probabilità e Statistica - 05AA - A.A. 014-015 Prima prova di verifica intermedia - 9 aprile 015 Problema 1. Dati due eventi A, B, su uno spazio probabilizzato (Ω, F, P), diciamo che A è in

Dettagli

Esercitazione del 29 aprile 2014

Esercitazione del 29 aprile 2014 Esercitazione del 9 aprile 014 Esercizio 10.13 pg. 94 Complemento: Calcolare la probabilità che un negozio apra tra le sette e venti e le nove e quaranta del mattino. Soluzione: Siccome non è nota la distribuzione

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 014/015 II Esonero - 15 Gennaio 015 1 3 4 5 6 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Contenuto del capitolo

Contenuto del capitolo Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come

Dettagli

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017 Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................

Dettagli

ELEMENTI DI STATISTICA INFERENZIALE ELEMENTI DI STATISTICA INFERENZIALE

ELEMENTI DI STATISTICA INFERENZIALE ELEMENTI DI STATISTICA INFERENZIALE ELEMENTI DI STATISTICA INFERENZIALE 133. ELEMENTI DI STATISTICA INFERENZIALE In questo paragrafo verranno illustrati alcuni elementi di Statistica che sono essenziali per procedere alla costruzione di

Dettagli

4. Stime & Test. Corso di Simulazione. Anno accademico 2008/09

4. Stime & Test. Corso di Simulazione. Anno accademico 2008/09 Anno accademico 2008/09 Media campionaria X 1, X 2,..., X n v.c. indipendenti con distribuzione F, e: E[X i ] = µ Var[X i ] = σ 2, i = 1,..., n Media campionaria: X n è uno stimatore di µ. È uno stimatore

Dettagli

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##

Dettagli

I modelli probabilistici

I modelli probabilistici e I modelli probabilistici Finora abbiamo visto che esistono modelli probabilistici che possiamo utilizzare per prevedere gli esiti di esperimenti aleatori. Naturalmente la previsione è di tipo probabilistico:

Dettagli

Stima puntuale di parametri

Stima puntuale di parametri Probabilità e Statistica Esercitazioni a.a. 2009/2010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Stima puntuale di parametri Ines Campa Probabilità e Statistica -

Dettagli

Campionamento e stima di parametri

Campionamento e stima di parametri Sia X una variabile aleatoria associata a un dato esperimento. Ripetiamo l esperimento n volte, ottenendo una famiglia di valori sperimentali della v.a. X : X = (X 1, X 2,..., X n ) ogni X i é una v.a.

Dettagli

Stima puntuale di parametri

Stima puntuale di parametri Probabilità e Statistica Esercitazioni a.a. 006/007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana Statistica Lez. 1 Gli intervalli di confidenza Intervallo di confidenza per la media (σ nota) nel caso di popolazione Gaussiana Sia X una v.c Gaussiana di media µ e varianza σ. Se X 1, X,..., X n è un

Dettagli

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti

Dettagli

Il Teorema del limite Centrale (TLC)

Il Teorema del limite Centrale (TLC) (TLC) Teorema. Sia X 1,..., X n un campione i.i.d. per una v.a. X, avente E(X ) = µ e Var(X ) = σ 2 entrambi finiti. Allora Z n = X µ σ 2 n n Y N(0, 1) Si noti che nel calcolare Z n ho standardizzato X.

Dettagli

Test per una media - varianza nota

Test per una media - varianza nota Situazione Test per una media - varianza nota Popolazione N(µ,σ 2 ); varianza σ 2 nota. µ 0 numero reale fissato. Test di livello α per µ Statistica: Z n = X n µ 0 σ/ n. H 0 H 1 Rifiutiamo H 0 se p-value

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Stima Puntuale Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio In ciascuno dei casi seguenti determinare quale tra i due stimatori S e T per il parametro θ è distorto

Dettagli

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo Statistica 2 Esercitazioni Dott. L 1 1 Dipartimento di Scienze Statistiche e Matematiche S. Vianelli, Università di Palermo ricevimento: lunedì ore 15-17 mercoledì ore 15-17 e-mail: luigi.augugliaro@unipa.it

Dettagli

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte Cap.1: Probabilità 1. Esperimento aleatorio (definizione informale): è un esperimento che a priori può avere diversi esiti possibili

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

Probabilità e Statistica

Probabilità e Statistica Probabilità e Statistica Stima puntuale di parametri Marco Pietro Longhi C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica a.s. 018/019 Marco Pietro Longhi Prob. e Stat.

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE S.S.I.S TOSCANA F.I.M. -II anno STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE PROBLEMA 1 Vogliamo valutare la percentuale p di donne fumatrici tra le donne in età fertile. Procediamo all estrazione

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni

Dettagli

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in Scienze e Tecnologie Alimentari Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Intervalli di confidenza Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Matematica con elementi di Informatica

Matematica con elementi di Informatica Statistica descrittiva ed inferenziale Matematica con elementi di Informatica Tiziano Vargiolu Dipartimento di Matematica vargiolu@math.unipd.it Corso di Laurea Magistrale in Chimica e Tecnologie Farmaceutiche

Dettagli

STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA

STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA STATISTICA APPLICATA Prof.ssa Julia Mortera INTRODUZIONE al CAMPIONAMENTO e all INFERENZA STATISTICA Inferenza Statistica Nell inferenza statistica si usano le statistiche campionarie per fare previsioni

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie Le distribuzioni campionarie sono quelle che derivano dalla presenza di campioni i.i.d. a distribuzione normale. Definizione. Se X è una v.a. avente distribuzione N(0, ), allora Y = X ha distribuzione

Dettagli

UNIVERSITÀ DEGLI STUDI DI PERUGIA

UNIVERSITÀ DEGLI STUDI DI PERUGIA SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale

Dettagli

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con

Dettagli

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica Strumenti quantitativi per la gestione Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli

Dettagli

Stima dei parametri. I parametri di una pdf sono costanti che caratterizzano la sua forma. r.v. parameter. Assumiamo di avere un campione di valori

Stima dei parametri. I parametri di una pdf sono costanti che caratterizzano la sua forma. r.v. parameter. Assumiamo di avere un campione di valori Stima dei parametri I parametri di una pdf sono costanti che caratterizzano la sua forma r.v. parameter Assumiamo di avere un campione di valori Vogliamo una funzione dei dati che permette di stimare i

Dettagli

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una

Dettagli

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo

Dettagli

Esercitazione 3 - Statistica (parte II) Davide Passaretti 23/2/2017

Esercitazione 3 - Statistica (parte II) Davide Passaretti 23/2/2017 Esercitazione 3 - Statistica parte II Davide Passaretti 3//017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media.................................1.1

Dettagli

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018 Esperimentazioni di Fisica 1 Prova in itinere del 1 giugno 018 Esp-1 Prova in Itinere n. - - Page of 6 1/06/018 1. (1 Punti) Quesito L incertezza da associare alle misurazioni eseguite con un certo strumento

Dettagli

Stima puntuale. Stimare: attribuire un valore plausibile ad una grandezza. (parametro) non misurabile esattamente.

Stima puntuale. Stimare: attribuire un valore plausibile ad una grandezza. (parametro) non misurabile esattamente. Stima puntuale Stimare: attribuire un valore plausibile ad una grandezza (parametro) non misurabile esattamente. Stimatore del parametro θ: ogni statistica T = t(x 1, X 2,..., X n ) utilizzata per stimare

Dettagli

Statistica 2 parte ARGOMENTI

Statistica 2 parte ARGOMENTI Statistica 2 parte ARGOMENTI Vettori gaussiani Matrice di covarianza e sua positività Marginali di un vettore normale Trasformazioni affini di vettori normali Indipendenza delle componenti scorrelate di

Dettagli

TEST DI AUTOVALUTAZIONE APPROSSIMAZIONE NORMALE

TEST DI AUTOVALUTAZIONE APPROSSIMAZIONE NORMALE TEST DI AUTOVALUTAZIONE APPROSSIMAZIONE NORMALE I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. Sia X, X,...

Dettagli

DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34

DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34 DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34 Distribuzione Binomiale 2 / 34 La più importante distribuzione di probabilità per variabili casuali discrete è la distribuzione binomiale. Questa distribuzione

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 2015-16 P.Baldi Lista di esercizi 4, 11 febbraio 2016. Esercizio 1 Una v.a.

Dettagli

Stima dell intervallo per un parametro

Stima dell intervallo per un parametro Stima dell intervallo per un parametro In aggiunta alla stima puntuale di un parametro dobbiamo dare l intervallo che rappresenta l incertezza statistica. Questo intervallo deve: comunicare in modo obbiettivo

Dettagli

CP110 Probabilità: Esame 13 settembre Testo e soluzione

CP110 Probabilità: Esame 13 settembre Testo e soluzione Dipartimento di Matematica, Roma Tre Pietro Caputo 2011-12, II semestre 13 settembre, 2012 CP110 Probabilità: Esame 13 settembre 2012 Testo e soluzione 1. (6 pts) Una scatola contiene 10 palline, 8 bianche

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

SOLUZIONI DEL 2 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA

SOLUZIONI DEL 2 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA SOLUZIONI DEL 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA Esercizio 0.1 Una moneta non truccata viene lanciata 10 volte. Calcolare la probabilità che non esca mai testa. Quale risulta la probabilità

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Problema Nello studio delle distribuzioni teoriche di probabilità si suppone di conoscere i principali parametri della popolazione che esaminiamo (ad esempio la media, varianza).

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 205- P.Baldi Lista di esercizi 5, 8 febbraio 20. Esercizio Si fanno 25 estrazioni

Dettagli

Esame di Istituzioni di Matematica II del 18 gennaio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola

Esame di Istituzioni di Matematica II del 18 gennaio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Esame di Istituzioni di Matematica II del 8 gennaio 00 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Es. Es. Es. 3 Es. 4 Somma Voto finale Attenzione: si

Dettagli

DISTRIBUZIONI DI CAMPIONAMENTO

DISTRIBUZIONI DI CAMPIONAMENTO DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

9. Test del χ 2 e test di Smirnov-Kolmogorov. 9.1 Stimatori di massima verosimiglianza per distribuzioni con densità finita

9. Test del χ 2 e test di Smirnov-Kolmogorov. 9.1 Stimatori di massima verosimiglianza per distribuzioni con densità finita 9. Test del χ 2 e test di Smirnov-Kolmogorov 9. Stimatori di massima verosimiglianza per distribuzioni con densità finita Supponiamo di avere un campione statistico X,..., X n e di sapere che esso è relativo

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2

Dettagli

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica Costruzione di macchine Modulo di: Progettazione probabilistica e affidabilità Marco Beghini Lezione 7: Basi di statistica Campione e Popolazione Estrazione da una popolazione (virtualmente infinita) di

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 II Esonero - 10 Gennaio 2014 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr. Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame del 16/6/2013 NOME COGNOME N. Matr. Rispondere ai punti degli esercizi nel modo più completo possibile, cercando

Dettagli

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori. Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri

Dettagli

Calcolo delle Probabilità e Statistica Matematica previsioni 2003/04

Calcolo delle Probabilità e Statistica Matematica previsioni 2003/04 Calcolo delle Probabilità e Statistica Matematica previsioni 2003/04 LU 1/3 Esempi di vita reale : calcolo delle probabilità, statistica descrittiva e statistica inferenziale. Lancio dado/moneta: definizione

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

Matematica e Statistica per Scienze Ambientali

Matematica e Statistica per Scienze Ambientali per Scienze Ambientali LABORATORIO R - Appunti 1 1 Dipartimento di Matematica Sapienza, Università di Roma Roma, Gennaio 2014 Argomenti La distribuzione normale e applicazioni La distribuzione binomiale

Dettagli

Elementi di Probabilità e Statistica - 052AA - A.A

Elementi di Probabilità e Statistica - 052AA - A.A Elementi di Probabilità e Statistica - AA - A.A. -6 Prova scritta - giugno 6 Problema. (pt 9) Supponiamo che ad un centralino arrivino n chiamate, agli istanti aleatori T, T,..., T n.. Supponiamo che T,

Dettagli

Statistica. Lauree Triennali in Biologia e Biologia Molecolare Nome: 13 luglio 2010 Matricola: Cognome: Tema C

Statistica. Lauree Triennali in Biologia e Biologia Molecolare Nome: 13 luglio 2010 Matricola: Cognome: Tema C Statistica Cognome: Lauree Triennali in Biologia e Biologia Molecolare Nome: 13 luglio 2010 Matricola: Tema C 1. Parte A 1.1. Indichiamo con Q 1 e Q 3 il primo e terzo quartile, con m la mediana e con

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Minimi quadrati vincolati e test F

Minimi quadrati vincolati e test F Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Approssimazione normale della Poisson (TLC) In un determinato tratto di strada il numero di incidenti

Dettagli

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali A.A 2009-2010 Esercitazione E Scopo dell esercitazione Applicazioni del teorema del limite centrale. Rappresentazione delle incertezze

Dettagli

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07 PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 006/07 Esercizio 1 Prova scritta del 16/1/006 In un ufficio postale lavorano due impiegati che svolgono lo stesso compito in maniera indipendente, sbrigando

Dettagli

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr. Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame del 9/9/2013 NOME COGNOME N. Matr. Rispondere ai punti degli esercizi nel modo più completo possibile, cercando

Dettagli

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

E n 1 n. n i. n 2. n 2 ( n

E n 1 n. n i. n 2. n 2 ( n Lezione n. 7 7.1 Ancora sulle proprietà degli stimatori Esempio 7.1 [continua dall Esempio 6.1] Studiare varianza e MSE dei due stimatori e verificare se T n raggiunge il limite di Cramer- Rao. Soluzione.

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2009/2010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Intervalli di confidenza Ines Campa Probabilità e Statistica - Esercitazioni

Dettagli

CP210 Introduzione alla Probabilità: Esame 2

CP210 Introduzione alla Probabilità: Esame 2 Dipartimento di Matematica, Roma Tre Pietro Caputo 2018-19, II semestre 9 luglio, 2019 CP210 Introduzione alla Probabilità: Esame 2 Cognome Nome Matricola Firma Nota: 1. L unica cosa che si può usare durante

Dettagli

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1 Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa

Dettagli

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Esercizi possibili di probabilità e statistica Notazioni: U(a, b) è la distribuzione di probabilità uniforma nell intervallo (a,

Dettagli

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica Medica Le distribuzioni teoriche di probabilità La distribuzione Normale (o di

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015 1 2 3 4 5 6 7 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Metodi statistici per lo studio dei fenomeni biologici

Metodi statistici per lo studio dei fenomeni biologici Metodi statistici per lo studio dei fenomeni biologici Alla fine di questa lezione dovreste essere in grado di: descrivere la distribuzione di campionamento della differenza di due medie costruire gli

Dettagli

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 5-19/11/2009: A. Matricola: Corso:

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 5-19/11/2009: A. Matricola: Corso: Facoltà di Economia Statistica Esame 5-19/11/2009: A Cognome, Nome: Matricola: Corso: Problema 1. In un indagine di mercato tre tipologie di consumatori, A, B e C hanno espresso un giudizio di gradimento,

Dettagli

Richiami di Statistica

Richiami di Statistica Università di Pavia Richiami di Statistica Eduardo Rossi Popolazione e campione casuale Un idea centrale della statistica è che un campione sia una rappresentazione della popolazione. Si possono sfruttare

Dettagli

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell ' Lezione 2 Argomenti della lezione: La statistica inferenziale: concetti di base Campionamento Stima Distribuzione campionaria Popolazione (o universo) Insieme di tutti gli elementi cui si rivolge il ricercatore

Dettagli

I appello di calcolo delle probabilità e statistica

I appello di calcolo delle probabilità e statistica I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale

Dettagli

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata; di : dado : normale Finora abbiamo visto test d ipotesi per testare ipotesi differenti, ma tutte concernenti il valore atteso di una o due popolazioni. In questo capitolo vediamo come testare 1 l ipotesi

Dettagli

Calcolo delle Probabilità e Statistica, Ing. Informatica e dell Automazione, a.a. 2009/10 30/6/2010

Calcolo delle Probabilità e Statistica, Ing. Informatica e dell Automazione, a.a. 2009/10 30/6/2010 Calcolo delle Probabilità e Statistica, Ing. Informatica e dell Automazione, a.a. 29/ /6/2 Nota. E obbligatorio sia scegliere le risposte numeriche, o le formule nali a seconda del caso) negli appositi

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 7 1. Utilizzando le tavole della distribuzione

Dettagli

Esercizi. 1. Sia X una variabile aleatoria normale N(3.2, 1.44). Calcolare

Esercizi. 1. Sia X una variabile aleatoria normale N(3.2, 1.44). Calcolare 1 E. Vitali Matematica (Scienze aturali) Esercizi 1. Sia X una variabile aleatoria normale (3.2, 1.44). Calcolare P (X 4.94), P (1 X 4). [0.9265, 0.715] 2. Sia X la variabile aleatoria che rappresenta

Dettagli

, B con probabilità 1 4 e C con probabilità 1 4.

, B con probabilità 1 4 e C con probabilità 1 4. Laurea triennale in MATEMATICA, Corso di PROBABILITÀ Prof. L. Bertini - G. Nappo - F. Spizzichino Esonero del 0.06.00 N.B. Scrivere le soluzioni degli esercizi su questi fogli giustificando brevemente

Dettagli

Primi elementi di Probabilità

Primi elementi di Probabilità Primi elementi di Probabilità Sergio Polidoro Dipartimento di Matematica, Università di Bologna In queste dispense vengono introdotte le nozioni di valore atteso e di varianza per variabili aleatorie discrete

Dettagli

Statistica ARGOMENTI. Calcolo combinatorio

Statistica ARGOMENTI. Calcolo combinatorio Statistica ARGOMENTI Calcolo combinatorio Probabilità Disposizioni semplici Disposizioni con ripetizione Permutazioni semplici Permutazioni con ripetizioni Combinazioni semplici Assiomi di probabilità

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli