Verifica delle ipotesi: Binomiale Esercizio Nel collegio elettorale di una città, alle ultime elezioni il candidato A ha ottenuto il 4% delle preferenze mentre il candidato B il 6%. Nella nuova tornata elettorale i due si ripresentano, e il candidato A vuole utilizzare un sondaggio per sapere se si trovi in vantaggio nelle preferenze. A tal fine, ingaggia una società di sondaggi con l incarico di intervistare 5 persone, le quali devono esprimere la preferenza per uno dei due candidati. Quante persone del campione dovranno esprimere una preferenza per il candidato A al fine di sostenere, con un grado di fiducia del 95%, che egli sarà eletto? Si identifichino, utilizzando i risultati delle precedenti elezioni, la probabilità che un intervistato si esprima a favore di A e la probabilità che si esprima a favore di B. La probabilità che un intervistato si esprima a favore di A è p =, 4, la probabilità che si esprima a favore del candidato B sarà q =,6. Si indichino le ipotesi alternative H e H (si tenga presente che sotto l ipotesi H i due candidati ottengono lo stesso numero di preferenze. : p =,5 : p >,5 Si individuino: la distribuzione campionaria di riferimento ed i suoi parametri. La distribuzione campionaria è la binomiale con N(numero di intervistati=5, p(probabilità che un intervistato preferisca il candidato A=,5; Se indichiamo con x la variabile casuale che esprime il numero di preferenze per il candidato A, allora la probabilità che esattamente soggetti si esprimano a favore di A sarà data dalla N x = = p q ( N 5 =,5,5 (5 Si individui la regione critica (di rifiuto di H Dato che il test è unidirezionale dobbiamo calcolare in modo tale che x = i <,5 ; dalla lettura della tavola dei valori della binomiale con N=5 e p=,5 possiamo osservare che questa condizione è rispettata quando =2, infatti: 5 i= 2 5 i= P ( x = i = x = 2 + x = 3 +... =,4 +,3 +... =,8 Si concluda indicando quanti soggetti del campione devono esprimersi a favore del candidato A per sostenere, a livello di confidenza del 95%, che il candidato è in vantaggio? Per sostenere, a livello di confidenza del 95%, che il candidato A è in vantaggio bisogna che rispondano a suo favore almeno 2 dei 5 intervistati.
Esercizio 2 Si lanci 2 volte un dado e si conti quante volte esce un numero pari. Individuare la regola decisionale per stabilire se il dado sia bilanciato o meno utilizzando un livello di significatività pari a.5: Si definiscano le ipotesi H e H ; : p =,5 : p,5 Si individui la distribuzione campionaria; Facendo riferimento alla distibuzione binomiale avremo:,2,8,6,4,2,,8,6,4,2, 2 3 4 5 6 7 8 9 2 3 4 5 6 7 8 9 2 Si individui la regione critica (di rifiuto di H. Sommando i valori di probabilità estremi si ottengono come valori di soglia 5 e 5 pertanto la regione critica si ha per valori minori di 6 e maggiori di 4.
Esercizio 3 Uno studente sostiene una prova d esame che consiste nel rispondere ad una serie di quindici domande con risposta vero o falso. Alla fine della prova egli avrà un punteggio dato dal numero di domande a cui ha risposto correttamente. Si vuole determinare quante debbano essere le risposte corrette date dallo studente per sostenere, ad un livello di α =,5, che egli non risponda in maniera casuale. Si definiscano le ipotesi H e H. Se lo studente risponde a caso, indicando con p la probabilità di risposta corretta, dovremo avere che p =, 5. Se le risposte non sono casuali dovremo avere : p =,5 : p >,5 p >,5, formalmente: Si individui la distribuzione campionaria di riferimento ed i suoi parametri. La distribuzione campionaria di riferimento è la binomiale con N (numero di domande = 5, e p (probabilità di risposta corretta casuale =,5. Se indichiamo con x la variabile casuale che esprime il numero di risposte corrette, allora la probabilità che lo studente dia esattamente risposte corrette sarà data dalla N x = = p q ( N 5 =,5,5 (5 Si individui la regione critica (di rifiuto di H. Dato che l ipotesi alternativa è monodirezionale (destra dobbiamo calcolare in modo tale che x = i <,5 ; dalla lettura della tavola dei valori della binomiale con N=5 e p=,5 possiamo osservare che questa condizione è rispettata quando =2, infatti: 5 i= 5 i= 2 P ( x = i = x = 2 + x = 3 +... =,4 +,3 +... =,8 Pertanto la regione critica sarà data dai valori di x maggiori o uguali a 2. Quante devono essere le risposte corrette date dallo studente per escludere, con un livello di confidenza del 95%, che egli risponda a caso? Si motivi la risposta. Il numero di risposte corrette deve cadere nella regione critica e pertanto, deve essere maggiore di. Si calcoli la potenza del test nel caso in cui la probabilità di rispondere correttamente a ciascuna domanda sia pari a,9. Si faccia attenzione che sul libro c è una probabilità sbagliata.3 al posto di.3 (Vidotto, Xausa Peron, pag. 439
Dobbiamo prima calcolare il valore di β, che sarà dato dalla probabilità di rispondere correttamente a meno di 2 domande nel caso in cui sia vera H : p, 9. Tale probabilità risulta calcolabile con = la formula della binomiale in cui N (numero di domande = 5, p(probabilità di risposta corretta=,9. β = x < 2 = 2 i= x = i = x = + x = +... + x = 2 =,56 Dato questo valore di β, la potenza del test sarà: β =,56 =,944 Esercizio 4 Un azienda vinicola vuole assumere un assaggiatore di vini per testare la qualità del proprio prodotto. Per operare la scelta al candidato vengono fatte assaggiare coppie di vini; per ciascuna di esse il candidato deve individuare il vino di qualità migliore. Il soggetto può individuare o meno il vino migliore e, alla fine, viene contato il numero di risposte corrette che ha dato. Quante risposte corrette deve dare come minimo il candidato per dimostrare di non rispondere a caso? Si definiscano le ipotesi H e H ; Se indichiamo con p la probabilità di rispondere correttamente avremo : p =,5 : p >,5 Si individui e si rappresenti graficamente la distribuzione campionaria relativa; La distribuzione di riferimento sarà la binomiale, precisamente possiamo calcolare tutte le probabilità di ottenere da a risposte corrette e raffigurarla così: distribuzione binomiale,3,25 probabilità,2,5,,5, 2 3 4 5 6 7 8 9 numero di scelte corrette
Si individui la regione critica (di rifiuto di H ; PROF. GIULIO VIDOTTO Sommando le varie probabilità ottenute otteniamo che la regione critica, quella per cui le probabilità sommate danno un valore inferiore a.5, risulta costituita dai valori maggiori di 8. Si concluda indicando quante devono essere le risposte corrette per escludere, a livello di confidenza del 95%, la possibilità che il candidato assaggiatore risponda a caso. Per escludere, con un livello di confidenza del 95%, che il candidato risponde puramente a caso, bisogna che dia almeno 8 risposte corrette.
7 Difficile Spiegel 2 Preparare una regola di decisione per provare l ipotesi che una moneta no sia truccata, se si prende in considerazione un campione di 64 lanci della moneta e se si desidera un livello di significatività α =,5. ( Poiché P z,96 =,25, il valore di ± z critico =±, 96, per cui si può avere che: H : z zcritico H : z > zcritico Per esprimere la regola di decisione in termini del numero di teste che deve essere ottenuto in 64 lanci della moneta, si noti che la media e la deviazione standard della distribuzione delle teste è dato da: μ = Np = 64,5 = 32 e σ = Npq = 64(,5 2 = 4, nell ipotesi che la moneta sia buona. Per ( X μ X 32 cui z = =. Se, 96 X 32 / 4 =±,96 per cui la regola di decisione σ 4 diviene 24,6 X 39,84. Per cui, con 64 lanci, si accetta l ipotesi che la moneta sia buona se il numero di teste è compreso tra 25 e 39 inclusi. z =, si ha (