Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del reddito si suppone approssimativamente normale, con varianza σ 2 nota da precedenti studi. L economista esamina un campione casuale di 100 abitanti. 1. Se l economista avesse scelto un livello di confidenza del 99%, quale numerosità del campione gli avrebbe dato lo stesso margine di errore? (cioè la stessa ampiezza dell intervallo?) 2. Se σ 2, la varianza della popolazione fosse stata la metà, quale numerosità del campione gli avrebbe dato lo stesso margine di errore (cioè la stessa ampiezza dell intervallo) mantenendo 1 α = 0, 95? Esercizio 2 La seguente tabella riporta i furti commessi da donne scoperti in un grande magazzino in un anno, a seconda del settore merceologico e dell età della colpevole. Età Settore 7 15 15 21 > 21 Abbigliamento 312 913 3367 Bigiotteria 710 377 208 Profumi 248 211 341 1. Stimare la probabilità π che se viene compiuto un furto in una bigiotteria l età della colpevole sia nella fascia 15 21. 2. Trovare un intervallo di confidenza di livello 95% per π. 3. Si accetta al livello 5% l ipotesi che π = 0, 3 contro l ipotesi che π 0, 3? Esercizio 3 La confindustria vuole valutare l impatto di una nuova legge che prevede sgravi fiscali per le assunzioni part-time. Per stimare l aumento medio delle ore di lavoro prodotte dall introduzione della nuova legislazione, estrae un campione casuale di 20 piccole e medie imprese. La media campionaria dell aumento risulta essere pari a 3,9 ore alla settimana con deviazione standard campionaria pari a 2,5 ore. 1. Si determini l intervallo di confidenza dell aumento medio di ore di lavoro alla settimana, con livello di confidenza al 90%. 2. Si determini tale intervallo nell ipotesi che con gli stessi dati le imprese intervistate siano 120.
3. Si dica quale numerosità dovrebbe avere il campione per ridurre di 1/4 l ampiezza dell intervallo trovato al punto precedente. Esercizio 4 Per stimare la percentuale di italiani che andranno in settimana bianca durante le vacanze di Natale, sono state intervistate 700 persone, di cui 200 dichiarano che trascorreranno la settimana bianca. Assumendo che gli intervistati rappresentino un campione casuale della popolazione italiana, (a) costruire un intervallo di confidenza di livello 90% per la percentuale di italiani che andranno in settimana bianca. (b) Quanti dovevano essere gli intervistati per avere un intervallo di confidenza di ampiezza inferiore di 0,04, a parità di tutto il resto? (c) Senza effettuare calcoli, in base al punto a) dovremmo accettare o rifiutare al livello 10% l ipotesi che la percentuale in questione sia 24% contro l alternativa che sia diversa? Esercizio 5 Il responsabile di un azienda produttrice di riso vuole testare la veridicità del peso riportato sull etichetta del prodotto, pari a 400 gr. Da un campione casuale di 6 confezioni si è osservato il peso Y di riso contenuto: 415, 430, 395, 399, 408, 418 (gr). Si può assumere per Y una distribuzione normale. (a) Volendo stimare il contenuto medio di prodotto delle confezioni, quale tra questi due stimatori T 1 = 6 i=1 Y i 6 e T 2 = 5Y 1 + 6 i=2 Y i 10 ritieni opportuno utilizzare e perché (giustificare la risposta). (b) Verificare al livello 2% che il peso medio sia 400 gr, contro l alternativa che sia diverso. Esercizio 6 Un comune ha commissionato un indagine per analizzare natura e costi legati all utilizzo della nuova metropolitana di superficie (minimetrò). Dall indagine condotta su un campione di 120 residenti è emerso che il 40% utilizza tale servizio per ragioni lavorative e la spesa media riguardante l uso del minimetrò ammonta a 15 euro ogni due settimane. Si suppone che la spesa in questione possa essere descritta attraverso una variabile casuale normale con varianza nota pari a 5 euro 2. (a) Calcolare un intervallo di confidenza al 95% per la spesa media bisettimanale. (b) Costruire un intervallo di confidenza al 99% per la proporzione di residenti che utilizzano il minimetrò per motivi non riguardanti il lavoro.
(c) Testare al livello di significatività 2% l ipotesi che la proporzione di residenti che utilizzano il minimetrò per ragioni non-lavorative sia il 55%, contro l alternativa che sia superiore. (d) Alla luce del risultato del punto c), il livello di significatività osservato (p-value) del test è superiore al 2%, inferiore all 1% o compres tra 1% e 2%? Giustificare la risposta. Esercizio 7 La tabella sottostante si riferisce ad un campione di osservazioni sui tempi (in secondi) necessari per caricare due pagine web, A e B. A 60 50 65 83 76 B 55 61 57 95 71 Sotto le ipotesi che i tempi siano normalmente distribuiti e di indipendenza tra i tempi per caricare le due pagine: (a) si costruisca un intervallo di confidenza di livello 90% per la differenza tra i tempi medi di caricamento di a A e B; (b) si verifichi al livello 10% se vi è differenza significativa tra i tempi medi di caricamento di a A e B. Per una terza pagina web, C, si è condotto un analogo esperimento, registrando i tempi di caricamento della pagina in 5 diverse occasioni. I dati dell esperimento sono stati poi elaborati al computer con un programma che esegue analisi statistiche e che, sotto ipotesi di normalità, ha prodotto il seguente intervallo di confidenza di livello 95% per il tempo medio di caricamento di C: (52,4; 87,6) secondi. (c) Sapendo che la numerosità campionaria è 5, si derivi da questo intervallo una stima non distorta per la media e la varianza del tempo di caricamento di C, ancora sotto ipotesi di normalità. Esercizio 8 In un gioco televisivo il concorrente vince uno tra venti possibili premi di diverso importo. Il premio più alto è di 200.000 euro e, se il gioco non è truccato, questo ha una probabilità di essere vinto in una data puntata pari a 1 su 20. Per un campione di 200 puntate sono stati rilevati i premi vinti, notando che solo 8 puntate sono risultate nella vincita massima di 200.000 euro. (a) Si verifichi ad un livello di significatività del 1% se il gioco è truccato, ossia se la vera probabilità di vincita del premio massimo è pari a 1 su 20 contro l alternativa che sia inferiore. (b) Si costruisca un intervallo di confidenza di livello 95% per la vera probabilità di vincita del premio massimo.
(c) Si determini la numerosità campionaria necessaria per ridurre di 1/4 l ampiezza dell intervallo del punto (b), a parità di tutto il resto. Gli autori del programma affermano che la vincita media per puntata è pari a 12500 euro. Nel campione di 200 puntate la media dei premi vinti dai concorrenti è risultata pari a 12100 euro con deviazione standard pari a 1800 euro. (d) È possibile dire che la vera vincita media per puntata è significativamente inferiore a quella garantita dagli autori del gioco televisivo, ad un livello pari a 10%? Esercizio 9 Su un campione di 100 famiglie è stata rilevata la località di villeggiatura e la spesa complessivamente sostenuta per le vacanze nell estate 2009, ottenendo i risultati riportati nella tabella Località Mare Montagna Altro Numero di famiglie 55 35 10 Media della spesa per famiglia 2,5 2,3 1,9 Deviazione standard della spesa per famiglia 1 1,2 1,1 Media e deviazione standard sono espressi in migliaia di euro e la deviazione standard è la radice della varianza campionaria corretta. (a) Costruire un intervallo di confidenza di livello 90% per la percentuale di famiglie che preferiscono mete alternative al mare. (b) Nel 2008 la percentuale di famiglie che non hanno villeggiato in località di mare era pari a 40%. Verificare ad un livello di significatività del 5% se nel 2009 vi è stato un aumento della percentuale di famiglie che scelgono mete alternative al mare. (c) Verificare ad un livello di significatività pari a 1% se la spesa media delle famiglie che scelgono il mare è pari a quella delle famiglie che scelgono la montagna contro l alternativa che le vacanze al mare costino mediamente di più che in montagna. (d) Nel 2008 la spesa media per le famiglie che hanno scelto una villeggiatura al mare è stata pari a 2,4 mila euro. Il p-value (livello di significatività osservato) del test che saggia l ipotesi nulla che non vi sia una differenza nella spesa media sostenuta per le vacanze al mare tra il 2008 e il 2009 contro l ipotesi alternativa che quella del 2009 sia maggiore è pari a 0,23. Si commenti questo risultato. Esercizio 10 La seguente tabella riporta i valori dell indice di bilancio CR=Current Ratio (attività correnti/passività correnti) per un campione di 100 imprese, di cui 50 risultano fallite e 50 risultano ancora sane a distanza di 4 anni dalla data a cui si riferiscono i valori dell indice di bilancio:
Stato di salute dell impresa CR Sane Fallite 0,4 1,0 0 24 1,0 1,2 7 22 1,2 1,4 17 4 1,4 2,0 26 0 ToT 50 50 Si assume che la distribuzione di CR per entrambi i gruppi di aziende sia gaussiana. (a) Si costruisca un intervallo di confidenza di livello 90% per il vero valore medio di CR tra le imprese fallite. (b) In base ai risultati del punto (a) e senza effettuare nuovi calcoli, è possibile affermare che il vero valore medio di CR tra le imprese fallite è significativamente diverso da 0,95 ad un livello α = 10%? (Si giustifichi adeguatamente la risposta.) (c) Si verifichi ad un livello di significatività pari a 1% se il valor medio di CR per le imprese fallite è pari a quello delle imprese sane contro l alternativa che le imprese fallite siano caratterizzate da un valor medio di CR più piccolo. (d) Si verifichi ad un livello di significatività del 5% se vi è indipendenza tra CR e lo stato di salute dell impresa.