STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in quale proporzione di campioni la percentuale di ordini evasi entro questo termine: a) E compresa fra il 96% e il 99% b) È superiore al 99% a) La proporzione di ordini evasi segue una distribuzione binomiale (relativa) con Y=numero di ordini evasi e parametri n = 300 e p = 0.96 Occorre determinare: essendo n sufficientemente grande, per il TLC, è possibile sfruttare un approssimazione normale, per cui: 1
b) Esercizio 2 (Scozzafava). Applicazioni del T.L.C. Una ferrovia metropolitana è servita da treni costituiti da 5 carrozze non comunicanti. Alla partenza 150 passeggeri scelgono a caso una delle carrozze. Determinare il numero (minimo) di posti a sedere che devono essere disponibili su ciascuna carrozza affinché la probabilità che restino viaggiatori in piedi sia minore di 0.01. Si indichi con C una qualunque delle 5 carrozze e sia l evento il passeggero i-esimo sale sulla carrozza C (i = 1,2,,5). La scelta a caso corrisponde a supporre indipendenti ed equiprobabili, con probabilità p = 1/5 questi 150 eventi. Il numero di successi, cioè il numero di passeggeri che sale su C è dato da: Indichiamo con x il numero di posti a sedere. Quindi restano viaggiatori in piedi se per il numero x di posti a sedere, si ha. Si richiede quindi che: In modo equivalente: Le variabili sono indipendenti e identicamente distribuite come Bernoulli con i momenti: 2
per cui: infatti la somma di n v.c. i.i.d. bernoulliane con lo stesso parametro p è una v.c. binomiale di parametri n e p. Tuttavia, essendo n sufficientemente grande, per il T.L.C. è ulteriormente possibile approssimare ad una Normale: Risolvere equivale a determinare, dalle tavole della Normale standardizzata, il percentile della distribuzione che lascia a destra una probabilità di 0.01. Sfruttando la proprietà di simmetria della v.c. Normale dalle tavole risulta che il valore z che si lascia a destra una probabilità 0.01 è, approssimando: Infine si ricava il valore di x: Su ogni carrozza devono essere disponibili almeno 42 posti a sedere. Esercizio 3 Proprietà desiderabili degli stimatori (piccoli campioni) Sia X una popolazione distribuita secondo la legge Bernoulliana di parametro π, con (0 < π < 1), e sia uno stimatore di π a partire dal campione. 3
a) Determinare se lo stimatore è corretto. Nel caso non lo sia calcolare la sua distorsione b) Calcolare l errore quadratico medio EQM dello stimatore a) Se la popolazione è distribuita secondo una v.c. bernoulliana allora per cui Uno stimatore si dice non distorto per θ se ossia quando si escludono deviazioni sistematiche nella stima di θ per cui la media dello stimatore coincide col parametro. Distorsione (bias) dello stimatore: b) 4
Esercizio 4 Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un azienda che produce manufatti cementizi è interessato a determinare la lunghezza μ del diametro di tubi in calcestruzzo fabbricati in serie. Egli sa che, a causa degli errori di misurazione, la misura che può effettuare con i suoi strumenti è una realizzazione di una variabile casuale normale di media μ e varianza. Dopo aver effettuato 25 misurazioni ottiene che la somma dei valori osservati è pari a 4250 mm, e la varianza è 225 mm 2. a) Ricavare un intervallo di confidenza al 95% e al 99% per μ. Commentare i risultati ottenuti. b) Determinare la numerosità campionaria necessaria affinché l intervallo di confidenza per la lunghezza media del diametro dei tubi al livello del 95% abbia un ampiezza b = 10 mm. c) Considerando un IC al 99% per la media, volendo mantenere lo stesso margine di errore richiesto al punto b) quanto dovrebbe essere grande il campione da esaminare? d) Senza fare i conti, sarebbe diversa la risposta ottenuta al punto a) se il responsabile avesse ottenuto le stesse stime della media e della varianza con un campione di 256 misure? Perchè? a) X=lunghezza del diametro dei tubi segue una legge normale, la varianza è ignota. A partire dal campione sappiamo che: indica il quantile della distribuzione t con n - 1 gradi di libertà. Intervallo casuale Sostituendo i dati campionari si ottiene l intervallo di confidenza. In particolare:,, con, n = 25. indica il livello di copertura fornito dall'intervallo. 5
Intervallo di confidenza al 95%: L interpretazione probabilistica dell IC tiene conto del Principio del campionamento ripetuto: estraendo n campioni casuali da X (con n ) e su ciascuno di essi si stima un intervallo di confidenza, il 95% degli intervalli costruiti come illustrato in (1) contiene (copre) il parametro vero. Intervallo di confidenza al 99%: con. Commento: un aumento del livello (1- ) - che corrisponde a richiedere maggiore affidabilità - si ottiene solo al prezzo di un ampliamento dell IC. b) In generale, la lunghezza (ampiezza) dell intervallo di confidenza è data da: Occorre determinare la numerosità campionaria affinché l intervallo di confidenza per la media al 95% non sia più lungo di un valore fissato b=10 mm Ossia n deve essere almeno pari a Sostituendo nel nostro caso, S = 15, b = 10 si ottiene 6
Nota: Ampiezza IC per μ al 95% =12.38 mm. Se b=10 mm è l ampiezza richiesta per un IC al 95% ( quindi un ampiezza minore) occorre aumentare la numerosità campionaria. c) Se si vuole mantenere lo stesso margine d errore di cui al punto b) allora la numerosità campionaria per l IC al 99% per μ sarà pari a: Con, S = 15, b = 10 si ottiene: Osservazione: aumentando il livello di confidenza e volendo mantenere invariata l ampiezza dell intervallo è necessario aumentare ulteriormente la numerosità campionaria. d) Sappiamo che all aumentare della numerosità campionaria, a parità di livello di confidenza, risulta minore la lunghezza degli intervalli di confidenza, poiché la maggiore quantità di informazioni riduce il grado di incertezza sul parametro. Quando n è sufficientemente grande (e questo accade per n = 256), per il TLC, la distribuzione della è ben approssimata dalla Normale standard. Avremo allora che un intervallo di confidenza per μ al livello 1 = 0.95 risulterebbe: 7