PROBLEMI DI INFERENZA SU MEDIE
STIMA PUNTUALE Il problema della stima di ua media si poe allorchè si vuole cooscere, sulla base di osservazioi campioarie, il valore medio μ che u dato carattere preseta ella popolazioe dalla quale il campioe è stato estratto. Il migliore stimatore putuale corretto della media icogita μ di u carattere, secodo la legge ormale ella popolazioe dalla quale è stato estratto il campioe è La variaza di X è σ /. X i ˆ X Ache se il carattere ella popolazioe o si distribuisce ormalmete, la media aritmetica del campioe è sempre uo stimatore corretto i
STIMA PUNTUALE
Stima per itervallo (s oto) Teedo coto che la v.c. Z X è N (μ, σ /), la v.c. X s ha distribuzioe ormale stadardizzata; è possibile allora, scelto u livello di cofideza α, determiare l itervallo che co probabilità α, iclude la media icogita μ. Pr X z s X z s Questa procedura è idetica per i gradi e piccoli campioi
ESEMPIO Le stature dei vetei baresi maschi della classe 979, misurate alla leva, si distribuiscoo secodo la legge ormale. Si voglia determiare l itervallo di cofideza (-α = 0,95) della media, sapedo che lo scarto quadratico medio della popolazioe è σ = 6,5. Si sceglie u campioe di umerosità =6 e utilizzado lo stimatore MEDIA otteiamo : x 70cm. Per cui 0,95 Pr X z s X s Pr 6,5 6,5 70,96 70,96 6 Pr66,8 73,8 z 6 L itervallo di cofideza cercato è 66,8 73,8, il quale, co probabilità pari al 95%, potrebbe essere uo di quelli che icludoo il parametro igoto μ.
ALCUNI VALORI PIU UTILIZZATI DELL INTEGRALE DELLA CURVA NORMALE STANDARDIZZATA Livello di cofideza Livello di sigificatività α α Valori soglia di 0,50 0,50 0,674 0,90 0,0,645 0,95 0,05,960 0,98 0,0,36 0,99 0,0,576 0,998 0,00 3,090 0,999 0,00 3,9 0,9998 0,000 3,79 0,9999 0,000 3,89 z α
Stima per itervallo (s o oto) I geere lo scarto quadratico medio della popolazioe s, al pari della media μ, o è oto. Pertato, per otteere u itervallo di cofideza per la media della popolazioe possiamo basarci sulle sole statistiche campioarie X e S. Se la variabile casuale X ha ua distribuzioe ormale allora la statistica X t S ha ua distribuzioe t di Studet co ( ) gradi di libertà. Se variabile casuale X o ha ua distribuzioe ormale la statistica t ha comuque approssimativamete ua distribuzioe t di Studet i virtù del Teorema del Limite Cetrale.
Variaza campioaria La variaza campioaria è espressa da S ( X i i X ) ( ). Si può dimostrare che E( S ) s, dove s Var ( S ) [ (idice di curtosi). 4 ( )], è ua costate della popolazioe
Stima per itervallo (s o oto) La distribuzioe t di Studet ha ua forma molto simile a quella della ormale stadardizzata. Tuttavia il grafico risulta più appiattito e l area sottesa sulle code è maggiore di quella della ormale a causa del fatto che s o è oto e viee stimato da S. L icertezza su s causa la maggior variabilità di t. All aumetare dei gradi di libertà, la distribuzioe t si avvicia progressivamete alla distribuzioe ormale fio a che le due distribuzioi risultao virtualmete idetiche.
Stima per itervallo (s o oto) I valori critici della distribuzioe t di Studet corrispodeti agli appropriati gradi di libertà si ottegoo dalla tavola della distribuzioe t. Ogi coloa è relativa ad u area a destra della distribuzioe t.
Per la determiazioe dell itervallo di cofideza di μ si utilizzao, così come il caso della ormale stadardizzata, le tavole della T di Studet.
Stima per itervallo (s o oto) Il sigificato dei gradi di libertà è legato al fatto che per calcolare S è ecessario calcolare prevetivamete X. Quidi, dato il valore di X, solo osservazioi campioarie soo libere di variare: ci soo quidi gradi di libertà. L itervallo di cofideza all ( α)% della media quado σ o è oto è defiito ell equazioe (8.). Itervallo di cofideza per la media (σ o oto) X t S (8.) dove t ;α/ è il valore critico a cui corrispode u area cumulata pari a ( α/) della distribuzioe t di Studet co ( ) gradi di libertà. X t,, S
Stima per itervallo(s o oto) Esempio: ua azieda maifatturiera è iteressata a stimare la forza ecessaria a rompere u isolatore termico di propria produzioe. A questo scopo viee codotto u esperimeto dove viee misurato il peso di rottura per u campioe di 30 isolatori: Dai dati campioari si ricava che X =73.4 e S=89.55. Dalla tavola E.3 si ottiee il valore critico t 9;0.05 =.045, quidi u itervallo di cofideza al 95% per μ è dato da X t S ; / / = 73.4±(.045) 89.55/ 30 = 73.4±33.44 perciò si ottiee 689.96 μ 756.84.
Stima per itervallo (s o oto) Possiamo quidi cocludere co u livello di cofideza del 95% che la forza media ecessaria per rompere u isolatore è compresa tra 689.96 e 756.84. La validità dell itervallo dipede dall assuzioe di ormalità per la forza, ache se per campioi di umerosità elevata, questa ipotesi o è così strigete.
Stima per itervallo Variaza o ota Gradi campioi Se la variaza o è ota, ma la dimesioe campioaria è sufficietemete grade, aziché la v.c. T possiamo utilizzare la v.c. Z Pr X z S X z S
Determiazioe dell ampiezza campioaria Per determiare l ampiezza campioaria ecessaria per stimare la media dobbiamo cosiderare l imprecisioe ella stima dovuta alla variabilità campioaria che siamo disposti a tollerare e il livello di cofideza desiderato: X z s e La differeza tra la media campioaria e la media della popolazioe, idicata co e, prede il ome di errore di campioameto. Risolvedo per si ottiee l ampiezza campioaria ecessaria per determiare u itervallo di cofideza per la media co errore campioario iferiore ad e: X z s e
Determiazioe dell ampiezza campioaria Per determiare l ampiezza del campioe dobbiamo quidi disporre di tre elemeti:.il livello di cofideza desiderato, che determia il valore di Z, il valore critico dalla distribuzioe ormale stadardizzata;.l errore campioario e accettabile; 3.lo scarto quadratico medio σ. E importate sottolieare che di tali iformazioi avremo bisogo prima di estrarre il campioe. Nella pratica, può o essere sempre facile determiare queste tre quatità.
Esempio. La XYZ è u azieda di vedita all igrosso di prodotti alimetari. Il revisore dell azieda è resposabile dell accuratezza dell ivetario e dell accuratezza delle registrazioi delle fatture. Ovviamete, sarebbe possibile teere sotto il cotrollo questi aspetti aalizzado ad esempio tutte le fatture. Tuttavia, è evidete che u cotrollo di questo tipo sarebbe eccessivamete oeroso sia i termii di costi che di tempo. U approccio più efficiete potrebbe utilizzare teciche ifereziali per trarre coclusioi sulla popolazioe a partire dalle osservazioi coteute i u campioe. Per questo motivo, alla fie di ogi mese, viee estratto u campioe casuale di fatture per determiare l ammotare medio registrato elle fatture. Quato soo accurati i risultati campioari e come possoo essere utilizzati? Il campioe è abbastaza ampio da cosetire di otteere iformazioi che ci iteressao co la precisioe desiderata?
Esempio. Suppoete di estrarre u campioe casuale di 00 fatture di vedita dalla popolazioe delle fatture di u mese e di osservare u ammotare medio pari a 00,45 euro, co uo scarto quadratico medio s=5,6 euro. Se vogliamo otteere u itervallo di cofideza al 95% per la media della popolazioe dobbiamo utilizzare la formula: Pr X z S X z S Pr 00,45,96 5,6 00,45,96 5,6 00 Pr 95,43 05,47 0, 95 00 0,95
Esempio. Adesso ci chiediamo, come è stata determiata l ampiezza campioaria? Ci soo ampiezze campioarie più opportue di questa? Suppoiamo che, dopo alcue cosultazioi co i fuzioari della società, si stabilisca di essere disposti a tollerare u errore campioario o superiore a 5 euro per u livello di cofideza del 95%. Si osserva ioltre che lo scarto quadratico medio delle vedite è stato pari a 5 euro per u lugo periodo. Quidi, poedo: e = 5; σ = 5 ; Z =,96 (al livello di cofideza pari al 95%) otteiamo z s,96 5 5 e 96,4 Quidi = 97: l ampiezza campioaria scelta, 00, è vicia a quella ecessaria per soddisfare le richieste della società co riferimeto all errore campioario tollerato, al livello di cofideza fissato e sulla base della stima dello scarto quadratico medio dispoibile.
VERIFICA DELLE IPOTESI SULLA MEDIA DELLA POPOLAZIONE (σ oto) SISTEMA D IPOTESI Caso i cui la variaza della popolazioe è ota (gradi e piccoli campioi) Il TEST utilizzato è Fissato α (LIVELLO DI SIGNIFICATIVITA ) si accetterà l ipotesi ulla se z z α/ el caso di ipotesi alterativa bidirezioale; z - z α el caso di ipotesi alterativa uidirezioale siistra; z z α el caso di ipotesi alterativa uidirezioale destra. 0 0 0 0 0 0 0 0 0 : : oppure : : oppure : : H H H H H H X Z s
IPOTESI ALTERNATIVA BIDIREZIONALE
ALCUNI VALORI PIU UTILIZZATI DELL INTEGRALE DELLA CURVA NORMALE STANDARDIZZATA Livello di cofideza Livello di sigificatività α α Valori soglia di 0,50 0,50 0,674 0,90 0,0,645 0,95 0,05,960 0,98 0,0,36 0,99 0,0,576 0,998 0,00 3,090 0,999 0,00 3,9 0,9998 0,000 3,79 0,9999 0,000 3,89 z α
IPOTESI ALTERNATIVA UNIDIREZIONALE
ESEMPIO Il salario medio orario dei lavoratori di u particolare settore idustriale è di 5,0 co u σ di 0,50. I lavoratori di ua particolare ditta, i base ad u campioe di 30 lavoratori, percepiscoo 4,50 all ora. I lavoratori di quella ditta riteevao di essere sottopagati. Verifichiamo: ) SCRIVERE LE IPOTESI H 0 : μ = 5,0 il salario medio o si discosta da quello del settore. H : μ < 5,0 il salario medio è iferiore a quello di settore. ) TROVARE LA STATISTICA PER IL CAMPIONE È il valore medio campioario del salario della ditta: X = 4,50 3) CALCOLARE IL TEST STATISTICO Trattadosi di u test a ua coda, se il livello di sigificatività voluto è acora del 5 %, dalle tavole della ormale si trova che il 5% delle osservazioi si trova al di sopra del valore stadardizzato,645 (coda a destra) o al di sotto di,645 (coda a siistra). Poiché l ipotesi alterativa mi dice che i loro salari soo iferiori alla media azioale, cosidero solo la coda a siistra.
Z x s 4,50 5,0 0,50 30 6,57 4) CONFRONTARE QUESTO VALORE CON QUELLI CRITICI Il test statistico Z è duque - 6,57. Cade quidi ella zoa di rifiuto dell ipotesi ulla H 0. Cioè il salario medio della ditta è sigificativamete iferiore a quello medio azioale.
3) CALCOLARE IL TEST STATISTICO Trattadosi di u test a ua coda, se il livello di sigificatività voluto è acora del 5 %, dalle tavole della ormale si trova che il 5% delle osservazioi si trova al di sopra del valore stadardizzato,645 (coda a destra) o al di sotto di,645 (coda a siistra). Poiché l ipotesi alterativa mi dice di cotrollare che il umero delle bibite sia iferiore a 35, cosidero solo la coda a siistra. Z x s 3 35 0 6, 4) CONFRONTARE QUESTO VALORE CON QUELLI CRITICI Il test statistico Z è duque -,. Cade quidi ella zoa di accettazioe dell ipotesi ulla H 0. Quidi, si decide di lasciare il distributore.
VERIFICA DELLE IPOTESI SULLA MEDIA DELLA POPOLAZIONE (σ igoto) SISTEMA D IPOTESI Caso i cui la variaza della popolazioe è igota (piccoli campioi) Il TEST utilizzato è Fissato α (LIVELLO DI SIGNIFICATIVITA ) si accetterà l ipotesi ulla se t t -,α/ el caso di ipotesi alterativa bidirezioale; t - t -,α/ el caso di ipotesi alterativa uidirezioale siistra; t t -,α/ el caso di ipotesi alterativa uidirezioale destra. 0 0 0 0 0 0 0 0 0 : : oppure : : oppure : : H H H H H H s X T
Il test T Il test t è molto simile al test Z, ma usa la distribuzioe t ivece della ormale. È u tipo di distribuzioe che ha ua forma simile (a campaa) ma è adatta per campioi piccoli. L altezza della campaa della distribuzioe t varia a secoda del umero di osservazioi: tato più è piccole tato più la campaa è bassa e viceversa. Quado ³ 30 la distribuzioe t approssima molto bee quella Normale.
Procedura per il test T A.Va calcolata la statistica usado la formula del test T: T X s Dove, abbiamo già visto s x i x B. Quidi vao idividuati i valori critici che separao la zoa di rifiuto dalla zoa di accettazioe. Per trovarli si deve ricorrere alle tavole della distribuzioe t. Questa è u diversa da quella della Normale. È ecessario cooscere i gradi di libertà: questi dipedoo dalla dimesioe del campioe. I gradi di liberta rappresetao il umero di uità di iformazioi idipedeti i u campioe attieti la stima di u parametro. I gradi di libertà soo pari alla umerosità campioaria meo il umero di parametri oti della popolazioe.
La coloa a siistra della tavola della distribuzioe t cotiee il umero di gradi di libertà, metre le restati coloe dao i valori critici per i vari livelli di sigificatività (la proporzioe dell area che sta su ua delle due code).
ESEMPIO Dai dati azioali il valore medio delle spese settimaali di ua famiglia formata da quattro persoe, risulta essere di 58. Soo state itervistate 6 famiglie della zoa trovado che il loro cosumo medio è di 49 co uo sqm di 33. Al livello del 5% di sigificatività, la loro spesa media è sigificativamete diversa da quella azioale? No si coosce lo σ della popolazioe e il campioe è < 30. Quidi usiamo u test t. ) SCRIVERE LE IPOTESI H 0 : µ = 58 (ipotesi ulla, il cosumo medio è i liea co quello azioale) H : µ 58 (ipotesi alterativa, il cosumo medio o è i liea co quello azioale) ) TROVARE LA STATISTICA PER IL CAMPIONE cosumo medio delle famiglie campioe = 49 (media campioaria) co uo SQM di 33.
3) CALCOLARE IL TEST STATISTICO t Si tratta di u test a due code: T X 49 58 s 33 9,09 4) CONFRONTARE QUESTO VALORE CON QUELLI CRITICI Vao trovati i puti critici: la umerosità del campioe è 6. I gradi di libertà soo 6 meo l uico parametro oto sulla popolazioe che è la media: due i gradi di libertà soo 5. Al livello di sigificatività del 5% i puti critici si trovao a,34 e,34. il test statistico t si trova ella zoa di accettazioe dell ipotesi ulla: la spesa media di questo campioe o è sigificativamete diversa da quella azioale.
ESEMPIO U gruppo di 9 persoe che aspira ad u assuzioe presso u certa ditta, deve sottoporsi ad u test psicometrico. I loro puteggi soo: 7 63 6 74 69 67 59 65 68 65 66 67 Si sa che il puteggio medio di tutti i test precedeti è 6. Si vuole verificare se questo gruppo di persoe ha u puteggio medio superiore a questa media. ) SCRIVERE LE IPOTESI H 0 : µ = 6 (ipotesi ulla, la resa del gruppo è la stessa della media) H : µ > 6 (ipotesi alterativa, la loro resa è maggiore) ) TROVARE LA STATISTICA PER IL CAMPIONE Si tratta di calcolare media e sqm dei dati dispoibili. Il puteggio medio è x = 66,33 e s = 4,03 (si ricordi che <30). 3) CALCOLARE IL TEST STATISTICO t Si tratta di u test a ua coda: T X 66,33 6 s 4,03 3,7
4) CONFRONTARE QUESTO VALORE CON QUELLI CRITICI Avedo osservazioi, i gradi di libertà soo (-). A livello di sigificatività del 5% (0,05) e trattadosi di u test a ua coda, il puto critico il puto critico si trova a,7959 duque il test t cade ella zoa di rifiuto dell ipotesi ulla. La resa del gruppo è sigificativamete superiore rispetto a quella della media
CONFRONTO FRA LE MEDIE DI DUE CAMPIONI Nei problemi co due campioi l obiettivo dell ifereza è cofrotare le risposte ei due trattameti o cofrotare le caratteristiche di due popolazioi. CONDIZIONI PER IL CONFRONTO TRA DUE MEDIE Dobbiamo avere due campioi casuali semplici selezioati da due popolazioi differeti. I campioi devoo essere idipedeti; vale a dire che o deve esserci alcu tipo di associazioe fra le uità del primo e del secodo campioe. Misuriamo la stessa variabile per etrambi i campioi. Etrambe le popolazioi soo distribuite ormalmete. Le medie e la deviazioe stadard delle popolazioi soo icogite. I pratica, è sufficiete che le distribuzioi abbiao ua forma simile e che i dati o presetio degli outlier eccessivi
CONFRONTO FRA LE MEDIE DI DUE CAMPIONI SIMBOLOGIA I POPOLAZIONE II POPOLAZIONE Variabile X X Media µ µ Deviazioe stadard σ σ Numerosità campioaria Media campioaria X X Dev.std. campioaria s s
SISTEMA D IPOTESI Caso i cui le variaze delle popolazioi soo igote ma supposte uguali: Essedo igoto il valore della variaza comue, si procede alla stima di questa co la media aritmetica delle due variaze campioarie poderata co i rispettivi gradi di libertà. Il TEST utilizzato è Se il risultato del test è all itero dell itervallo: (soglie della distribuzioe T di Studet) si accetta H o, se estero si rifiuta S x x T s s s 0 0 0 : : oppure : : oppure : : H H H H H H ) ( ) ( ) ( ) ( x x x x S S S i i i i ; ; ; t t
Esempio Due esperimeti di u dato prodotto agricolo, su sei e otto zoe sperimetali ha dato i segueti risultati (ql per ettaro): I 7 9 3 8 II 9 3 6 4 0 Cosiderado le suddette osservazioi come due campioi casuali proveieti da due popolazioi ormali, si vuole cofrotare il redimeto medio dei due esperimeti. Numerosità campioaria = 6 = 8 Media campioaria = 0 = Variaza campioaria s =5,60 s =5,4 x x Il TEST utilizzato è T S x x 0 5,33 6 8,60 Nelle Tavole della T di Studet co gdl e α=0,05, si legge il valore t=,79: quidi l itervallo è -,79 e +,79. Essedo il risultato del test itero a detto itervallo, possiamo affermare che la differeza riscotrata tra i due campioi è di atura casuale a livello del 5%.
L approccio del P-VALUE Esiste u altro approccio alla verifica di ipotesi: l approccio del p- value. Il p-value rappreseta la probabilità di osservare u valore della statistica test uguale o più estremo del valore che si calcola a partire dal campioe, quado l ipotesi H 0 e vera. U p-value basso porta a rifiutare l ipotesi ulla H 0. Il p-value e ache chiamato livello di sigificatività osservato, i quato coicide co il più piccolo livello di sigificatività i corrispodeza del quale H0 e rifiutata. I base all approccio del p-value, la regola decisioale per rifiutare H0 e la seguete: Se il p-value e α, l ipotesi ulla o e rifiutata. Se il p-value e < α, l ipotesi ulla e rifiutata.
L approccio del P-VALUE Toriamo acora ua volta all esempio relativo alla produzioe delle scatole di cereali. Nel verificare se il peso medio dei cereali coteuti elle scatole e uguale a 368 grammi, abbiamo otteuto u valore di Z uguale a.50 e o abbiamo rifiutato l ipotesi, perche.50 e maggiore del valore critico più piccolo.96 e miore di quello più grade +.96. Risolviamo, ora, questo problema di verifica di ipotesi facedo ricorso all approccio del p-value. Per questo test a due code, dobbiamo, i base alla defiizioe del p-value, calcolare la probabilità di osservare u valore della statistica test uguale o più estremo di.50. Si tratta, più precisamete, di calcolare la probabilità che Z assuma u valore maggiore di.50 oppure miore di.50. I base alla Tavola della CURVA NORMALE STANDARDIZZATA, la probabilità che Z assuma u valore miore di.50 e 0.0668, metre la probabilità che Z assuma u valore miore di +.50 e 0.933, quidi la probabilità che Z assuma u valore maggiore di +.50 e 0.933 = 0.0668. Pertato il p-value per questo test a due code e 0.0668 + 0.0668 = 0.336.
rtato il p-value L approccio per questo del test P-VALUE a due code è 0.0668 0668 = 0.336.