Esercitazione 8 maggio 2014
|
|
|
- Luisa Paoli
- 9 anni fa
- Visualizzazioni
Transcript
1 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un intervallo di confidenza al 95% per l età media della popolazione dei neo-laureati della triennale, supponendo che l età sia distribuita normalmente con varianza nota σ 2 = 45. b) Determinare la numerosità del campione necessaria perché l errore massimo nella stima della media sia di 0.7, assumendo sempre un intervallo di confidenza del 95%. Sappiamo che la media campionaria è uno stimatore non distorto e consistente della media, e che con le ipotesi di gaussianità introdotte, è una variabile gaussiana con media (incognita) μ e varianza 45/n, con n=10 nel nostro caso. a) L intervallo di confidenza del 95% per la media si ricava allora dal fatto che la media campionaria standardizzata è una normale standard, per cui ove z è il valore tale che P(Z z ) = e Z è una variabile normale standard. Cioè, noti n e σ 2, per ogni valore di α possiamo trovare z tale che la probabilità che un campione x 1,, x n abbia media campionaria tale che (1) è 1- α. La quantità è l errore di stima e, pertanto, la quantità è l errore massimo di stima al livello 1- α, e la lunghezza dell intervallo di confidenza è, ovviamente, 2 z (σ 2 /n). Per i dati dell esercizio si ha, applicando la formula (1), che l intervallo di confidenza del 95% per l età media è ( (45/10), (45/10)) = (17.84, 26.15). b) Cerchiamo n tale che Per quanto svolto al punto a), basta imporre fornisce n , cioè 1.96 (45/n) 0.7, che, risolto, Esercizio p. 342 del libro di testo a) La media campionaria, pari a 0.45, è la stima della proporzione p di favorevoli al candidato A nell intera popolazione. Il numero di favorevoli nel campione è 300 x 0.45 = 135, quella dei contrari 300 x 0.55 = 165: siccome entrambi questi valori sono > 30, sono soddisfatte le condizioni per l uso della formula dell intervallo di confidenza asintotico per la proporzione: 1
2 (2) che è del tutto simile alla formula (1), con la varianza stimata da perché la varianza della media campionaria di una popolazione bernoulliana deriva dalla varianza della Binomiale. Con i dati dell esercizio: = 0.45, n = 300, z = 1.96 l intervallo cercato è (0.394, 0.506), la cui lunghezza (risposta al punto b) ) è Non svolgete il punto c). d) Osserviamo intanto che l intervallo di confidenza trovato al punto a) contiene, seppur di poco, valori superiori a Per rispondere non servono altri calcoli: se alziamo il livello di confidenza dell intervallo a 99%, il corrispondente quantile z è maggiore del quantile z usato per l intervallo al 95%, e quindi, dalla formula (2), l intervallo certamente si allarga. Siccome già quello del 95% superava il valore 0.5, a maggior ragione adesso. Pertanto, il vero valore dei favorevoli al candidato A nella popolazione potrebbe anche essere > 50%. Tuttavia, non dobbiamo stupirci se, ad elezioni compiute e scrutinio ultimato, il candidato A risulti aver raccolto il 43% dei favori, perché anche 0.43 è un valore nell intervallo di confidenza al livello del 95% (e anche del 99%). Domanda aggiuntiva. Supponiamo ora di aver rilevato una percentuale di favorevoli ad A pari, ancora, al 45% ma in un campione di 1000 individui. Con riferimento all intervallo di confidenza del 95% di cui al punto a), il nuovo intervallo di confidenza al 95% risulta più breve: da (2) si vede, infatti, che al crescere di n il termine diminuisce. Il nuovo intervallo è (0.409, 0.490) e quindi, sulla base di un campione di 1000 intervistati, possiamo affermare con la confidenza del 99%, che il candidato A non otterrà la maggioranza assoluta alle elezioni. Esercizio (da completarsi venerdì 16). In una città si raccolgono informazioni sul consumo annuo di energia elettrica per unità abitativa. Nel caso di unità abitative di metratura confrontabile, la varianza del consumo di energia elettrica è un indicatore dei livelli di efficienza energetica, di interesse per l impresa erogatrice così come per l Amministrazione Locale. In un campione di 101 unità abitative confrontabili si è osservata una deviazione standard campionaria del consumo di energia elettrica in un certo anno pari a kwh. a) Costruire un intervallo di confidenza al 95% per la varianza del consumo annuo di energia elettrica per unità abitative confrontabili a quelle del campione. b) Fornire una limitazione superiore alla varianza, al livello del 95%. a) Un intervallo di confidenza al 95% per la varianza è della forma (3) ove 2
3 è lo stimatore non distorto e consistente della varianza della popolazione. Al denominatore nella formula (3) ci sono i quantili della distribuzione chi quadrato ad n-1 gradi di libertà: si veda la Figura 1. χ 2 1- (n-1) χ 2 (n-1) Figura 1 Esempio di una densità chi quadrato e dei quantili usati nella formula (3). Per i dati del problema: = mentre = e quindi l intervallo cercato è (100 x / , 100 x / ) = ( , ). Facendo la radice quadrata dei due estremi abbiamo l intervallo di confidenza per la deviazione standard: (152.7, 201.7) kwh. Svolgeremo il punto b) venerdì 16. Esercizio 1 dal tema d esame del (II) Sia p la proporzione di italiani inclini a votare il partito XYZ alle prossime elezioni. Da un indagine effettuata tramite interviste la percentuale campionaria di favorevoli al partito è risultata essere del 48%. Quanto deve valere la dimensione campionaria n perché l errore di stima di p sia inferiore a 0.05 con un livello di confidenza del 99%? Soluzione Usiamo ancora la formula (2). Ragionando come nel primo esercizio, l errore massimo di stima (in valore assoluto) è (posso sbagliare per eccesso o per difetto), e quindi basta imporre x (0.48x0.52/n) 0.05, da cui n e quindi n 664. Quindi, se il risultato del 48% di favorevoli è stato ottenuto su un campione di almeno 664 individui, possiamo dire che l intervallo di confidenza al 99% per p è contenuto nell intervallo ( , ) = (0.43, 0.53). Se il campione intervistato è di dimensione inferiore, l incertezza, data dalla lunghezza dell intervallo di confidenza, risulta maggiore. Complemento 1. Possiamo chiederci che dimensione deve avere il campione per assicurarsi, al livello del 99%, che il partito XYZ non raggiunga la maggioranza assoluta. Significa determinare il valore di n per cui l errore massimo sia pari a 0.02 (= ). Con gli stessi calcoli si ottiene n > , quindi n Si vede allora come ridurre l errore apparentemente di poco richieda un grosso aumento della dimensione campionaria. 3
4 Complemento 2. Determiniamo la dimensione campionaria in anticipo, per avere un errore di stima non superiore a 0.05, qualunque sia l esito dell indagine. Osserviamo che p (1- p) ¼ perché la funzione p (1- p) per p tra 0 ed 1 disegna una parabola con concavità rivolta verso il basso e vertice in p = ½. Allora, qualunque sia la media campionaria si ha e pertanto, basta richiedere z (1/4n) 0.05 da cui, risolvendo, n 663.5, cioè n 664. Il risultato è uguale a quello di prima perché la media campionaria 0.48 è molto vicina a Questo risultato, però, vale per qualunque valore della media campionaria si ottenga poi, a fine indagine. Esercizio 2 dal tema d esame del Di 10 individui sono stati annotati il sesso e la pressione arteriosa sistolica (la massima ) ottenendo: Individuo Sesso F M F F F M F F M M Pressione Si vuole testare l ipotesi che la pressione media sia la stessa negli uomini e nelle donne. 1. Quali ipotesi bisogna fare? (2. Testare l ipotesi di omoschedasticità. -> non svolto.) 3. Dire se l ipotesi di uguaglianza delle medie si può rifiutare al livello del 5%. 1. Trattandosi di una dimensione campionaria molto bassa, possiamo solo supporre che i due campioni, gruppo dei maschi e gruppo delle femmine, siano indipendenti, che la pressione della popolazione dei maschi sia gaussiana con media μ M e varianza σ 2 M incognite; che la pressione della popolazione delle femmine sia gaussiana con media μ F e varianza σ 2 F incognite e che le due varianze siano uguali. Sotto queste ipotesi si può condurre un test H 0 : μ M = μ F contro l alternativa H 1 : μ M μ F. Sotto l ipotesi nulla di uguaglianza delle medie, mi aspetto che presi due campioni, uno di uomini e uno di donne, la differenza delle medie dei due campioni sia vicina a 0. Il valore prefissato di α = 5% conduce a dare un significato al termine vicina. Infatti, sotto le ipotesi prima elencate la statistica ove ha distribuzione t di Student a (n M + n F -2) gradi di libertà. 4
5 Calcoliamo allora la media campionaria e la varianza campionaria della pressione sia per gli uomini che per le donne ed utilizziamo il fatto di conoscere la distribuzione esatta della statistica T per stabilire la probabilità di osservare i risultati ottenuti dai due campioni. Si ha: Quindi, dai nostri campioni si ricava che T = ( )/( ) = Questo valore è abbastanza vicino a 0? In Figura 2 è rappresentata la distribuzione di T assieme con la regione di rifiuto del test, cioè la regione tale che quando T sconfina lì dentro, non posso più dire che T è abbastanza vicina a 0. Infatti, se T cade nell area grigia vuol dire che il risultato campionario cade in un intervallo di valori che ha probabilità molto bassa, < 0.05, di essere osservato se davvero la pressione media degli uomini è uguale alla pressone media delle donne. Nel nostro caso si vede che il valore campionario di T è davvero abbastanza vicino a 0, al livello α del 5%, infatti rimane dentro l area bianca. In altre parole, usando lo stesso ragionamento dell esercizio 2 dal tema d esame del svolto alla scorsa esercitazione, se il valore campionario di T cade nell area bianca allora la probabilità di osservare un valore campionario della differenza standardizzata delle medie nei due gruppi uguale o superiore a è abbastanza alto, superiore a (= ). Non c è quindi abbastanza evidenza nei dati per rifiutare l ipotesi nulla di uguale media della pressione per uomini e donne T= Figura 2 Densità della distribuzione t di Student a 8 gradi di libertà: l area grigia indica la regione di rifiuto del test al livello α, T = è il valore campionario della statistica test. 5
Esercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017
Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................
Contenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003
Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore
Approssimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe
Matematica II: Calcolo delle Probabilità e Statistica Matematica
Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie
UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014
UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 II Esonero - 10 Gennaio 2014 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,
Test per una media - varianza nota
Situazione Test per una media - varianza nota Popolazione N(µ,σ 2 ); varianza σ 2 nota. µ 0 numero reale fissato. Test di livello α per µ Statistica: Z n = X n µ 0 σ/ n. H 0 H 1 Rifiutiamo H 0 se p-value
Statistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
Intervalli di confidenza
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
STATISTICA ESERCITAZIONE
STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in
Dispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
Esercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
Intervalli di confidenza
Probabilità e Statistica Esercitazioni a.a. 2017/2018 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Intervalli di confidenza Marco Pietro Longhi Probabilità e Statistica
DISTRIBUZIONI DI CAMPIONAMENTO
DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
COGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
Probabilità e Statistica
Probabilità e Statistica Intervalli di confidenza Marco Pietro Longhi C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica a.s. 2018/2019 Marco Pietro Longhi Prob. e Stat. 1
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):
ESERCIZIO SU TEST STATISTICO (Z, T e χ ) Da una ditta di assemblaggio di PC ci viene chiesto di controllare la potenza media dissipata da un nuovo processore, che causa a volte problemi di sovraccarico
Verifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
Esercizi riassuntivi di Inferenza
Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del
Caratterizzazione dei consumi energetici (parte 3)
ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale
Statistica Metodologica
Statistica Metodologica Esercizi di Probabilita e Inferenza Silvia Figini e-mail: [email protected] Problema 1 Sia X una variabile aleatoria Bernoulliana con parametro p = 0.7. 1. Determinare la media
Statistica 1- parte II
Statistica 1- parte II Esercitazione 3 Dott.ssa Antonella Costanzo 25/02/2016 Esercizio 1. Verifica di ipotesi sulla media (varianza nota) Il preside della scuola elementare XYZ sospetta che i suoi studenti
Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
I appello di calcolo delle probabilità e statistica
I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale
Schema lezione 5 Intervalli di confidenza
Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari
UNIVERSITÀ DEGLI STUDI DI PERUGIA
SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale
Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano
Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano Esercizio 1 Una moneta viene lanciata 6 volte. Calcolare a) La probabilità che escano esattamente
Corso di Statistica Esercitazione 1.8
Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli
Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
distribuzione normale
distribuzione normale Si tratta della più importante distribuzione di variabili continue, in quanto: 1. si può assumere come comportamento di molti fenomeni casuali, tra cui gli errori accidentali; 2.
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
Intervallo di confidenza
Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima
Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una
x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +
ESERCIZIO 6.1 Si considerino i 0 campioni di ampiezza n = estratti da una popolazione X di N = 5 elementi distribuiti normalmente, con media µ = 13,6 e σ = 8,33. A partire dalle 0 determinazioni della
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
Vedi: Probabilità e cenni di statistica
Vedi: http://www.df.unipi.it/~andreozz/labcia.html Probabilità e cenni di statistica Funzione di distribuzione discreta Istogrammi e normalizzazione Distribuzioni continue Nel caso continuo la probabilità
LE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Esame di Istituzioni di Matematica II del 18 gennaio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola
Esame di Istituzioni di Matematica II del 8 gennaio 00 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Es. Es. Es. 3 Es. 4 Somma Voto finale Attenzione: si
