Esercizi riassuntivi di Inferenza

Documenti analoghi
Esercizi di Probabilità e Statistica

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Esercitazione 8 del corso di Statistica 2

Approssimazione normale alla distribuzione binomiale

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

STATISTICA ESERCITAZIONE

Esercitazione 8 maggio 2014

Test d Ipotesi Introduzione

FACOLTÀ DI ECONOMIA Prova scritta di Statistica II Perugia, 27 gennaio 2006 COGNOME NOME

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Statistica Inferenziale

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

1 Esercizi per l esame finale

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Statistica Inferenziale

Distribuzioni campionarie

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Intervalli di confidenza

STATISTICA A D (72 ore)

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale)

Casa dello Studente. Casa dello Studente

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Giorno n. clienti di attesa

Esercitazioni di statistica

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Esercitazioni di Statistica

ESERCIZIO 1. b) E' necessario formulare ipotesi per procedere al test richiesto al punto a? (motivare brevemente la risposta)

Intervallo di confidenza

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

a) 36/100 b) 1/3 c)

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Distribuzioni e inferenza statistica

Schema lezione 5 Intervalli di confidenza

Esame di Statistica Seconda Prova Parziale Cognome Nome Matricola

L indagine campionaria Lezione 3

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Il confronto fra medie

Prova d esame di Statistica - II canale - 10 CFU

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

Ringraziamenti dell Editore

Teoria e tecniche dei test

Capitolo 9 Verifica di ipotesi: test basati su un campione

Gli errori nella verifica delle ipotesi

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

LE DISTRIBUZIONI CAMPIONARIE

STATISTICA A K (60 ore)

Nuovo Ordinamento Esame di Statistica I 24 giugno 2002 Cognome docente: J. Mortera / P. Vicard Nome

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Caratterizzazione dei consumi energetici (parte 3)

Metodi statistici per le ricerche di mercato

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

STATISTICA AZIENDALE Modulo Controllo di Qualità

Test di ipotesi su due campioni

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.

Il campionamento e l inferenza. Il campionamento e l inferenza

Test delle ipotesi sulla media.

Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Il numero di gradi di libertà del quantile di riferimento è uguale al numero di elementi del campione meno uno;

STATISTICA. Esercizi vari

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Capitolo 8. Probabilità: concetti di base

p = p q OR = p q Misura l esistenza di una malattia. E legato alla incidenza in quanto - Prevalenza = Incidenza x tempo medio di durata della malattia

Costruire la tabella delle frequenze percentuali della variabile innovazione (si/no) per classe di addetti e per i tre macrosettori.

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

Istituzioni di Statistica e Statistica Economica

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

DISTRIBUZIONE NORMALE (1)

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Ulteriori Conoscenze di Informatica e Statistica

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Dal campione alla popolazione

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Capitolo 6. La distribuzione normale

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Analisi della varianza

Capitolo 6 La distribuzione normale

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

standardizzazione dei punteggi di un test

Concetti principale della lezione precedente

Distribuzione Normale

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Transcript:

Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del reddito si suppone approssimativamente normale, con varianza σ 2 nota da precedenti studi. L economista esamina un campione casuale di 100 abitanti. 1. Se l economista avesse scelto un livello di confidenza del 99%, quale numerosità del campione gli avrebbe dato lo stesso margine di errore? (cioè la stessa ampiezza dell intervallo?) 2. Se σ 2, la varianza della popolazione fosse stata la metà, quale numerosità del campione gli avrebbe dato lo stesso margine di errore (cioè la stessa ampiezza dell intervallo) mantenendo 1 α = 0, 95? Esercizio 2 La seguente tabella riporta i furti commessi da donne scoperti in un grande magazzino in un anno, a seconda del settore merceologico e dell età della colpevole. Età Settore 7 15 15 21 > 21 Abbigliamento 312 913 3367 Bigiotteria 710 377 208 Profumi 248 211 341 1. Stimare la probabilità π che se viene compiuto un furto in una bigiotteria l età della colpevole sia nella fascia 15 21. 2. Trovare un intervallo di confidenza di livello 95% per π. 3. Si accetta al livello 5% l ipotesi che π = 0, 3 contro l ipotesi che π 0, 3? Esercizio 3 La confindustria vuole valutare l impatto di una nuova legge che prevede sgravi fiscali per le assunzioni part-time. Per stimare l aumento medio delle ore di lavoro prodotte dall introduzione della nuova legislazione, estrae un campione casuale di 20 piccole e medie imprese. La media campionaria dell aumento risulta essere pari a 3,9 ore alla settimana con deviazione standard campionaria pari a 2,5 ore. 1. Si determini l intervallo di confidenza dell aumento medio di ore di lavoro alla settimana, con livello di confidenza al 90%. 2. Si determini tale intervallo nell ipotesi che con gli stessi dati le imprese intervistate siano 120.

3. Si dica quale numerosità dovrebbe avere il campione per ridurre di 1/4 l ampiezza dell intervallo trovato al punto precedente. Esercizio 4 Per stimare la percentuale di italiani che andranno in settimana bianca durante le vacanze di Natale, sono state intervistate 700 persone, di cui 200 dichiarano che trascorreranno la settimana bianca. Assumendo che gli intervistati rappresentino un campione casuale della popolazione italiana, (a) costruire un intervallo di confidenza di livello 90% per la percentuale di italiani che andranno in settimana bianca. (b) Quanti dovevano essere gli intervistati per avere un intervallo di confidenza di ampiezza inferiore di 0,04, a parità di tutto il resto? (c) Senza effettuare calcoli, in base al punto a) dovremmo accettare o rifiutare al livello 10% l ipotesi che la percentuale in questione sia 24% contro l alternativa che sia diversa? Esercizio 5 Il responsabile di un azienda produttrice di riso vuole testare la veridicità del peso riportato sull etichetta del prodotto, pari a 400 gr. Da un campione casuale di 6 confezioni si è osservato il peso Y di riso contenuto: 415, 430, 395, 399, 408, 418 (gr). Si può assumere per Y una distribuzione normale. (a) Volendo stimare il contenuto medio di prodotto delle confezioni, quale tra questi due stimatori T 1 = 6 i=1 Y i 6 e T 2 = 5Y 1 + 6 i=2 Y i 10 ritieni opportuno utilizzare e perché (giustificare la risposta). (b) Verificare al livello 2% che il peso medio sia 400 gr, contro l alternativa che sia diverso. Esercizio 6 Un comune ha commissionato un indagine per analizzare natura e costi legati all utilizzo della nuova metropolitana di superficie (minimetrò). Dall indagine condotta su un campione di 120 residenti è emerso che il 40% utilizza tale servizio per ragioni lavorative e la spesa media riguardante l uso del minimetrò ammonta a 15 euro ogni due settimane. Si suppone che la spesa in questione possa essere descritta attraverso una variabile casuale normale con varianza nota pari a 5 euro 2. (a) Calcolare un intervallo di confidenza al 95% per la spesa media bisettimanale. (b) Costruire un intervallo di confidenza al 99% per la proporzione di residenti che utilizzano il minimetrò per motivi non riguardanti il lavoro.

(c) Testare al livello di significatività 2% l ipotesi che la proporzione di residenti che utilizzano il minimetrò per ragioni non-lavorative sia il 55%, contro l alternativa che sia superiore. (d) Alla luce del risultato del punto c), il livello di significatività osservato (p-value) del test è superiore al 2%, inferiore all 1% o compres tra 1% e 2%? Giustificare la risposta. Esercizio 7 La tabella sottostante si riferisce ad un campione di osservazioni sui tempi (in secondi) necessari per caricare due pagine web, A e B. A 60 50 65 83 76 B 55 61 57 95 71 Sotto le ipotesi che i tempi siano normalmente distribuiti e di indipendenza tra i tempi per caricare le due pagine: (a) si costruisca un intervallo di confidenza di livello 90% per la differenza tra i tempi medi di caricamento di a A e B; (b) si verifichi al livello 10% se vi è differenza significativa tra i tempi medi di caricamento di a A e B. Per una terza pagina web, C, si è condotto un analogo esperimento, registrando i tempi di caricamento della pagina in 5 diverse occasioni. I dati dell esperimento sono stati poi elaborati al computer con un programma che esegue analisi statistiche e che, sotto ipotesi di normalità, ha prodotto il seguente intervallo di confidenza di livello 95% per il tempo medio di caricamento di C: (52,4; 87,6) secondi. (c) Sapendo che la numerosità campionaria è 5, si derivi da questo intervallo una stima non distorta per la media e la varianza del tempo di caricamento di C, ancora sotto ipotesi di normalità. Esercizio 8 In un gioco televisivo il concorrente vince uno tra venti possibili premi di diverso importo. Il premio più alto è di 200.000 euro e, se il gioco non è truccato, questo ha una probabilità di essere vinto in una data puntata pari a 1 su 20. Per un campione di 200 puntate sono stati rilevati i premi vinti, notando che solo 8 puntate sono risultate nella vincita massima di 200.000 euro. (a) Si verifichi ad un livello di significatività del 1% se il gioco è truccato, ossia se la vera probabilità di vincita del premio massimo è pari a 1 su 20 contro l alternativa che sia inferiore. (b) Si costruisca un intervallo di confidenza di livello 95% per la vera probabilità di vincita del premio massimo.

(c) Si determini la numerosità campionaria necessaria per ridurre di 1/4 l ampiezza dell intervallo del punto (b), a parità di tutto il resto. Gli autori del programma affermano che la vincita media per puntata è pari a 12500 euro. Nel campione di 200 puntate la media dei premi vinti dai concorrenti è risultata pari a 12100 euro con deviazione standard pari a 1800 euro. (d) È possibile dire che la vera vincita media per puntata è significativamente inferiore a quella garantita dagli autori del gioco televisivo, ad un livello pari a 10%? Esercizio 9 Su un campione di 100 famiglie è stata rilevata la località di villeggiatura e la spesa complessivamente sostenuta per le vacanze nell estate 2009, ottenendo i risultati riportati nella tabella Località Mare Montagna Altro Numero di famiglie 55 35 10 Media della spesa per famiglia 2,5 2,3 1,9 Deviazione standard della spesa per famiglia 1 1,2 1,1 Media e deviazione standard sono espressi in migliaia di euro e la deviazione standard è la radice della varianza campionaria corretta. (a) Costruire un intervallo di confidenza di livello 90% per la percentuale di famiglie che preferiscono mete alternative al mare. (b) Nel 2008 la percentuale di famiglie che non hanno villeggiato in località di mare era pari a 40%. Verificare ad un livello di significatività del 5% se nel 2009 vi è stato un aumento della percentuale di famiglie che scelgono mete alternative al mare. (c) Verificare ad un livello di significatività pari a 1% se la spesa media delle famiglie che scelgono il mare è pari a quella delle famiglie che scelgono la montagna contro l alternativa che le vacanze al mare costino mediamente di più che in montagna. (d) Nel 2008 la spesa media per le famiglie che hanno scelto una villeggiatura al mare è stata pari a 2,4 mila euro. Il p-value (livello di significatività osservato) del test che saggia l ipotesi nulla che non vi sia una differenza nella spesa media sostenuta per le vacanze al mare tra il 2008 e il 2009 contro l ipotesi alternativa che quella del 2009 sia maggiore è pari a 0,23. Si commenti questo risultato. Esercizio 10 La seguente tabella riporta i valori dell indice di bilancio CR=Current Ratio (attività correnti/passività correnti) per un campione di 100 imprese, di cui 50 risultano fallite e 50 risultano ancora sane a distanza di 4 anni dalla data a cui si riferiscono i valori dell indice di bilancio:

Stato di salute dell impresa CR Sane Fallite 0,4 1,0 0 24 1,0 1,2 7 22 1,2 1,4 17 4 1,4 2,0 26 0 ToT 50 50 Si assume che la distribuzione di CR per entrambi i gruppi di aziende sia gaussiana. (a) Si costruisca un intervallo di confidenza di livello 90% per il vero valore medio di CR tra le imprese fallite. (b) In base ai risultati del punto (a) e senza effettuare nuovi calcoli, è possibile affermare che il vero valore medio di CR tra le imprese fallite è significativamente diverso da 0,95 ad un livello α = 10%? (Si giustifichi adeguatamente la risposta.) (c) Si verifichi ad un livello di significatività pari a 1% se il valor medio di CR per le imprese fallite è pari a quello delle imprese sane contro l alternativa che le imprese fallite siano caratterizzate da un valor medio di CR più piccolo. (d) Si verifichi ad un livello di significatività del 5% se vi è indipendenza tra CR e lo stato di salute dell impresa.