Esercitazioni del corso di Statistica Prof. Mortera a.a. 2010/2011 Esercizi di stima puntuale, intervalli di confidenza e test 1. Si consideri il campione (X 1, X 2, X 3, X 4 ) composto da variabili i.i.d. di media µ e varianza σ 2. Si considerino quindi i due stimatori della media: T 1 = 1 4 (4X 1 X 2 X 3 + 2X 4 ) a. I due stimatori sono corretti? T 2 = 1 2 X b. Si calcoli la varianza dei due stimatori c. Sia σ 2 = 1. Per quali valori di µ è preferibile T 2? 2. Per determinare l età media dei suoi acquirenti, un negozio di abbigliamento intervista un campione di 50 acquirenti e determina che x = 36. Sapendo che l età degli acquirenti si distribuisce normalmente e che σ = 12: a. Si determini l intervallo di confidenza al 95% per l età media µ di tutti gli acquirenti b. Si supponga che si vuole ridurre l ampiezza dell intervallo di confidenza al 95%, in modo tale che gli estremi distino dal valore centrale dell intervallo ± 2 anni. Quanto deve essere grande il campione? 3. Un agenzia immobiliare vuole stimare il prezzo medio di vendita degli appartamenti di una zona di Roma. Considera un campione di 25 vendite e calcola il prezzo medio x = 148000 Euro, con deviazione standard campionaria (xi x) s = 2 = 62000 Euro. n 1 a. Si calcoli l intervallo di confidenza al 95% per il prezzo medio delle vendite. b. Un nostro amico ha pagato 206000 Euro per una casa in quella zona. È un valore plausibile o è stato riportato un valore errato? 4. In una università americana è stato preso un campione di professori ai quali è stato chiesto il reddito (in migliaia di dollari) 1
Uomini Donne 9 16 12 19 8 12 10 11 16 22 Si calcoli l intervallo di confidenza per la differenza dei redditi medi tra professori uomini e donne al 95%. 5. Un indagine Gallup studia periodicamente un campione casuale di 1500 americani. La percentuale di individui nel campione che è a favore della legalizzazione del possesso di marijuana è scesa dal 52% nel 1980 al 46% nel 1985. a. Si costruisca un intervallo di confidenza al 95% per la percentuale della popolazione a favore della legalizzazione in ogni anno. b. Si determini un intervallo di confidenza al 95% per il cambiamento di questa percentuale tra il 1980 e il 1985. 6. Si supponga che un campione casuale di 38 alberi ha fornito la seguente distribuzione dei volumi Volume Frequenza 20 8 40 16 60 12 80 2 Si calcoli l intervallo di confidenza al 95% per il volume medio degli alberi. 7. Negli Stati Uniti la clausola Union Shop in un contratto di lavoro obbliga il lavoratore a iscriversi a un sindacato non appena il contratto è firmato. Nel 1973, 31 stati avevano accettato la Union Shop, mentre 19 stati avevano accettato le leggi Right-to-Work, che aboliscono di fatto la Union Shop. Un campione di 5 stati da ogni gruppo ha mostrato i seguenti salari medi orari in ogni stato (in dollari): Stati con la Stati con la Union Shop Right-to-Work 4,00 3,50 3,10 3,60 3,60 3,20 4,20 3,90 4,60 2,80 Sulla base di queste cifre, si è detto che le leggi Right-to-Work costano ai lavoratori 50 centesimi l ora. Questa affermazione è corretta? 2
8. Un campione di intervistati è stato classificato rispetto al grado di istruzione e al guadagno mensile espresso in milioni di lire: Grado di istruzione Reddito Lic. Media Diploma Laurea 0 1,5 40 38 12 1,5 2,5 17 35 43 2,5 4 3 27 45 a. Verificare l ipotesi che la frazione di laureati sia maggiore nella popolazione con guadagno mensile maggiore di 2,5 che in quella con guadagno mensile inferiore a 1,5. Usare un livello di significatività pari al 5%. b. Si può affermare che il reddito medio mensile della popolazione dei diplomati sia inferiore a due milioni? 9. La seguente tabella fornisce i dati sul sussidio di disoccupazione annuale X (in milioni di lire) di due campioni casuali indipendenti di 10 disoccupati inglesi e 5 italiani. Inglesi Italiani n 10 5 x 160 55 x 2 2666 645 Si assume che nelle due popolazioni i sussidi abbiano una distribuzione normale con varianze uguali. a. Trovare l intervallo di confidenza al 95% per la differenza tra sussidio di disoccupazione percepito dagli inglesi e dagli italiani. b. Si può ritenere che il sussidio inglese sia superiore a quello italiano? 10. Si estragga da una popolazione normale di media µ e varianza 1 un campione casuale (X 1, X 2 ) di due unità. Volendo stimare il parametro µ si considerino i seguenti stimatori T 1 = 2 3 X 1 + 1 3 X 2 T 2 = 1 2 X 1 + 1 2 X 2 verificare che tali stimatori sono corretti e determinare quello più efficiente. 11. Si consideri un campione di 4 unità estratte da una popolazione di media µ e varianza 1. Si considerino i seguenti stimatori della media della popolazione 3
T 1 = 1 2 X 1 + 1 8 X 2 + 1 4 X 3 + 1 8 X 4 T 2 = 1 2 X a. si verifichi se i due stimatori sono corretti; b. si calcolino le varianze dei due stimatori; c. si confronti l errore quadratico medio (MSE) di T 1 e T 2 quando µ = 1, quale stimatore scegliete? 12. La società Luccicanti decide di lanciare sul mercato un nuovo tipo di detersivo superwhite. A questo scopo viene inviato gratuitamente un flacone del nuovo detersivo a 150 persone chiedendo loro di provarlo e di dichiarare se saranno favorevoli o meno all acquisto del suddetto prodotto. Di queste persone solo 30 dichiarano di essere interessate all acquisto. a. Costruire un intervallo di confidenza al livello 1 α = 0.7 per la proporzione di soggetti che acquisteranno il prodotto; b. verificare al livello α = 0.05 l ipotesi nulla che la proporzione di soggetti che acquisteranno il prodotto sia superiore al 30%. 13. La filiale di una banca ha di recente installato sui propri computer un nuovo programma che estende i servizi offerti tramite lo sportello Bancomat. I responsabili sanno che prima dell aggiornamento del sistema il numero medio di clienti che si rivolgeva agli sportelli interni in un ora era pari a µ 0 = 148. Dopo alcuni mesi dall aggiornamento si vuole verificare l ipotesi che il numero medio µ per ora di clienti sia diminuito. In un campione casuale di 25 intervalli orari si è ottenuto che x = 139 e s = 20.9. Assumendo che la distribuzione del numero di clienti sia normale, calcolare l intervallo di confidenza per µ e verificare l ipotesi di diminuzione usando sia α = 0.05 che α = 0.01. Commentare. 14. Si vuole verificare l ipotesi che in caso di ballottaggio per l elezione a sindaco, il candidato A prenda la maggiornaza dei voti. In un sondaggio di opinione condotto su 100 persone 60 erano a favore del candidato A. 15. In un sondaggio di opinione condotto a Detroit si voleva studiare l influenza della religione sulla vita quotidiana. Ad un campione casuale di 421 individui (di cui 261 erano di religione protestante ed i rimanenti 160 di religione cattolica) veniva chiesto se secondo loro il governo faceva abbastanza nella loro città per problemi di abitazione, di disoccupazione, di educazione: 89 protestanti e 64 cattolici hanno risposto di No. Vi è evidenza che la loro religione ha influenza sulla loro opinione? 16. In una ricerca sulla carenza di ferro nei bambini sono stati confrontati due campioni. Nel primo campione i bambini erano stati allattati soltanto 4
con latte materno mentre nel secondo campione i bambini erano stati allattati con latte artificiale. La seguente tabella fornisce il livello medio di emoglobina trovato nei bambini a 12 mesi d età (fonte: Journal of Clinical Nutrition, 1980): Gruppo n x S Latte materno 23 13.3 1.7 Latte artificiale 19 12.4 1.8 a. Trovare l intervallo di confidenza al 95% per la differenza tra livello medio di emoglobina nei due gruppi. b. Si può concludere che il livello di emoglobina medio è più elevato nei bambini nutriti con latte materno? Indicare chiaramente H 0 e H 1. Verificare tali ipotesi. c. Specificare le assunzioni necessarie affinchè le procedure a) e b) siano valide. 17. Sia (X 1, X 2,..., X n ) un campione casuale di ampiezza n (n 5) estratto da una popolazione X con valore atteso µ e varianza σ 2. Si considerino i seguenti stimatori per µ T 1 = X 1 + X 2 nx 3 n T 2 = X 1 + (n 2)X 2 + X 5 n a. Lo stimatore T 1 è non distorto? In caso di risposta negativa proporre uno stimatore non distorto per µ che sia funzione di T 1. b. Lo stimatore T 2 è non distorto? In caso di risposta negativa proporre uno stimatore non distorto per µ che sia funzione di T 2. 18. Il numero di matrimoni secondo l età degli sposi in un campione casuale (anno 1990) risulta essere Età della sposa Età dello sposo 20 25 25 30 30 35 20 25 8 3 0 25 30 10 8 3 30 35 0 5 2 a. C è una differenza tra l età media della sposa e dello sposo? Costruire un intervallo di confidenza al 95%. b. Si può concludere che in più del 30% dei matrimoni l età della sposa è compresa tra 20 25 anni? Verificare questa ipotesi al livello del 1%. 5
19. Una marca di gelati sostiene che i loro prodotti contengono soltanto il 12% di grassi. Da un campione di n = 5 gelati si trova che in media contengono il 12.7% con deviazione standard s = 0.38%. a. Fare il test dell ipotesi che i gelati contengano più del 12% di grassi. Usare un livello di significatività del 1%. 6