Capitolo 7 TEST DELLE IPOTESI

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Capitolo 7 TEST DELLE IPOTESI"

Transcript

1 B. Chiandotto F. Cipollini Versione 3 Cap. 7 Capitolo 7 TEST DELLE IPOTESI In questo capitolo si affronta il problema della verifica d ipotesi statistiche limitando la trattazione alla cosiddetta teoria classica del test delle ipotesi parametriche. Argomentazioni diverse devono essere svolte sia nei riguardi della impostazione bayesiana della teoria del test delle ipotesi sia nei riguardi della teoria dei test nonparametrici (da non confondere con le ipotesi non-parametriche), aspetti questi che non vengono qui trattati. E stato sottolineato in precedenza che la teoria dell inferenza statistica riguarda principalmente due specifici argomenti: la stima (puntuale e per intervallo) ed il test delle ipotesi. In entrambi i casi si tratta di valutare aspetti incogniti, concernenti una determinata v.c., in base alle informazioni di un campione. Il problema della stima e quello del test delle ipotesi, anche se simili, vanno comunque tenuti distinti in quanto coinvolgono problematiche diverse. Infatti: nel primo caso il campione viene utilizzato per stimare un entità incognita relativa ad una certa v.c.; nel secondo caso il campione viene utilizzato per verificare statisticamente la validità di una certa affermazione (ipotesi) su un entità incognita relativa a una certa v.c.. Concetti di base Per introdurre il test delle ipotesi conviene collegarsi a quanto illustrato nell'introduzione al capitolo 6. Facendo riferimento per semplicità all approccio parametrico all inferenza statistica, il punto di partenza di un problema di test delle ipotesi è identico a quello di un problema di stima dei parametri: c è un certo fenomeno, il cui risultato non è prevedibile con certezza, di cui interessa studiare determinate caratteristiche; dal punto di vista probabilistico questo fenomeno è rappresentato da una v.c., diciamo X; per coglierne il comportamento casuale si sceglie fra quelli a disposizione (o si inventa ex-novo) un modello statistico, sotto forma di funzione di massa se X è discreta o di funzione di

2 B. Chiandotto F. Cipollini Versione 3 Cap. 7 densità se X è continua (oppure si formula un modello più complesso se, ad esempio, interessa studiare la relazione fra più variabili). Quello che cambia, appunto, è proprio il problema. Quando si effettua stima dei parametri, puntuale o per intervallo, l informazione campionaria (eventualmente integrata da conoscenze a priori se si utilizza un approccio bayesiano) viene utilizzata per stimare uno o più parametri incogniti del modello scelto per X. Quando invece si fa test delle ipotesi sui parametri, l informazione campionaria (eventualmente integrata da conoscenze a priori se si utilizza un approccio bayesiano) viene utilizzata per decidere se accettare o rifiutare una certa ipotesi concernente uno o più parametri incogniti del modello scelto per X. La rilevanza del problema di test delle ipotesi è facilmente intuibile se si pensa che all accettazione o al rifiuto di una certa ipotesi è spesso collegata la scelta di una particolare linea di comportamento. Definizione : Definizione di ipotesi statistica. Sia X una v.c. con funzione di massa o di densità f(x; θ), dove θ Θ è un parametro incognito. Allora un ipotesi statistica è un affermazione che specifica completamente o parzialmente la distribuzione di X. Tale affermazione può riferirsi: a θ, cioè ai soli parametri caratteristici della distribuzione (e in tal caso l ipotesi è detta parametrica); a f(x; θ), cioè alla forma funzionale della distribuzione (e in tal caso l ipotesi è detta non-parametrica o distribution free). L ipotesi statistica in oggetto è usualmente detta ipotesi nulla o ipotesi di lavoro ed è indicata con H. Con riferimento a quanto illustrato nell introduzione al capitolo 6, è opportuno fare chiarezza su un aspetto abbastanza sottile. Un ipotesi parametrica, cioè un ipotesi riguardante soltanto certi parametri caratteristici, ha senso sia in un contesto parametrico (in cui il modello è completamente specificato in tutte le sue parti) che semi-parametrico (nel quale del modello sono formulate solo certe componenti fondamentali). Al contrario un ipotesi non-parametrica, cioè relativa la forma funzionale della distribuzione ha senso soltanto in ambito non-parametrico: per

3 B. Chiandotto F. Cipollini Versione 3 Cap. 7 rendersene conto basta pensare al fatto che un eventuale assunzione sulla forma della distribuzione di X configgerebbe con quella dell ipotesi (se diversa) oppure sarebbe una pura tautologia (se uguale). In questo corso ci occuperemo prevalentemente di ipotesi statistiche parametriche, relative cioè ai soli parametri caratteristici θ del modello scelto f(x; θ) (diremo qualcosa sul test d'ipotesi non-parametriche nella sez. 8). In questo caso l ipotesi nulla si concretizza nell affermazione che θ appartiene ad un certo sottoinsieme Θ dello spazio parametrico Θ, in simboli H : θ Θ. D altra parte, poiché Θ è un sottoinsieme di Θ, dall ipotesi nulla precedente risulta automaticamente definita anche un ipotesi alternativa H : θ Θ, dove Θ è il complementare di Θ in Θ. Di conseguenza ipotesi nulla e ipotesi alternativa formano una partizione di Θ in Θ e Θ (si veda Fig. ). Tornando alla definizione precedente, quando un ipotesi statistica specifica completamente la distribuzione di X allora è detta semplice, se invece la specifica solo parzialmente allora è detta composta. E chiaro allora che affinché un ipotesi sia semplice, ovvero affinché la specificazione della distribuzione di X sotto tale ipotesi sia completa, occorre che, contemporaneamente: ) l ipotesi sia di tipo puntuale, cioè individui un solo punto dello spazio parametrico; ) non vi siano altri parametri incogniti. Per chiarire questo aspetto vediamo alcuni esempi. Sia X ~ Be(p). Allora: - se H : p =.3, H : p =.4, entrambe le ipotesi sono semplici (in questo caso lo spazio parametrico è {.3,.4}); - se H : p =.3, H : p >.3, l ipotesi nulla è semplice mentre l alternativa è composta unidirezionale (in questo caso lo spazio parametrico è [.3, ]); - se H : p =.3, H : p.3, l ipotesi nulla è semplice mentre l alternativa è composta bidirezionale (in questo caso lo spazio parametrico è [, ]); - se H : p.3, H : p >.3, sia l ipotesi nulla che l alternativa sono composte unidirezionali (in questo caso lo spazio parametrico è di nuovo [, ]). 3

4 B. Chiandotto F. Cipollini Versione 3 Cap. 7 Sia X ~ N(µ, σ = ). Allora, essendo σ nota: - se H : µ = 5, H : µ =, entrambe le ipotesi sono semplici (in questo caso lo spazio parametrico per µ è {, 5}); - se H : µ = 5, H : µ < 5, l ipotesi nulla è semplice mentre l alternativa è composta unidirezionale (in questo caso lo spazio parametrico per µ è (, 5]); - se H : µ = 5, H : µ 5, l ipotesi nulla è semplice mentre l alternativa è composta bidirezionale (in questo caso lo spazio parametrico per µ è (, + )); - se H : µ 5, H : µ < 5, sia l ipotesi nulla che l alternativa sono composte unidirezionali (in questo caso lo spazio parametrico per µ è di nuovo (, + )). Sia X ~ N(µ, σ ). Allora, essendo σ incognita, qualsiasi ipotesi su µ, sia di tipo puntuale che non, è composta. Tornando a quanto detto in precedenza, obiettivo del test delle ipotesi è decidere se accettare o rifiutare l ipotesi nulla H sulla base del campione. Definizione : Definizione di test delle ipotesi. Un test di ipotesi è una regola attraverso la quale decidere se accettare o rifiutare l ipotesi nulla H sulla base del campione x = (x,, x n ). Concretamente, tale regola è attuata nel modo seguente. Indicato con C l universo dei campioni (cioè l insieme di tutti i possibili campioni x = (x,, x n ) di dimensione fissata n che si possono estrarre da X), un test delle ipotesi consiste nel suddividere l insieme C in due sottoinsiemi disgiunti A e R (quindi A R = C e A R = ø) in modo tale che: se x cade in A si accetta l ipotesi H ; se x cade in R si rifiuta l ipotesi H (e quindi si accetta H ). A è detto regione di accettazione, mentre R è detto regione di rifiuto o regione critica. Il processo decisionale di cui alla definizione precedente è schematizzato in Fig.. 4

5 B. Chiandotto F. Cipollini Versione 3 Cap. 7 Θ Θ A C Θ R Fig. Rappresentazione grafica del processo decisionale del test delle ipotesi. L unico aspetto su cui la teoria può intervenire è sul confine (tratteggiato nella figura) fra regione di accettazione A e regione di rifiuto R. A questo punto, date due ipotesi statistiche H e H che formano una partizione di Θ e data una regola di decisione basata su un campione x quale quella indicata sopra, è banale osservare che, nell accettare o rifiutare H, si può agire correttamente ma si possono anche commettere degli errori. Più in dettaglio, con riferimento all ipotesi H : si ha una decisione corretta se si accetta l ipotesi quando è vera o si rifiuta quando è falsa, mentre si ha una decisione errata se si accetta l ipotesi quando è falsa o si rifiuta quando è vera. Queste quattro situazioni sono schematizzate nella Tabella. Verità Decisione H : θ Θ H : θ Θ x A ok errore di II tipo x R errore di I tipo ok Tabella - Tavola di decisione in un test delle ipotesi. Prima di commentarne il contenuto, si evidenzia che questa tabella fotografa l essenza del test delle ipotesi: si tratta di una partita dell uomo contro la natura, nella quale la seconda stabilisce quale delle due ipotesi è vera, mentre l uomo può solo decidere, basandosi sull informazione del campione, se accettare o rifiutare H. Detto in altre parole la natura stabilisce la colonna della tabella, mentre l uomo può solo decidere la riga. Nella realtà, quindi, non sappiamo mai quale è vera fra H e H (e quindi qual è la 5

6 B. Chiandotto F. Cipollini Versione 3 Cap. 7 colonna giusta), ma possiamo stabilire solo quale decisione prendere (cioè quale riga scegliere). E ovvio però che per prendere la decisione in oggetto occorre valutare cosa succede a seconda delle mosse dell avversario, cioè quali sono le conseguenze di ciascuna decisione a seconda di cosa la natura ha stabilito: il contenuto della tabella evidenzia proprio questo. Nel processo decisionale indicato si possono allora commettere due tipi di errore: a. errore di I tipo: è l errore che si commette quando è vera H ma x R e quindi la decisione è rifiutare H ; b. errore di II tipo: è l errore che si commette quando è vera H ma x A e quindi la decisione è accettare H. Facciamo notare che l errore di I tipo è l unico errore che si può commettere quando è vera H, mentre l errore di II tipo è l unico errore che si può commettere quando è vera H. La probabilità di commettere un errore di I tipo, cioè la probabilità di rifiutare H quando essa è vera, è indicata usualmente con α: α = P(I) = P(X R H ) ed è detta livello di significatività del test. La probabilità di commettere un errore di II tipo, e cioè la probabilità di accettare H quando essa è falsa, è indicata con β: β = P(II) = P(X A H ). La probabilità di rifiutare H quando è vera H, cioè γ = P(X R H ) = β, è detta potenza del test (dall inglese power) ed è pari a β in quanto l evento considerato è complementare all errore di II tipo. Chiaramente: quando l ipotesi alternativa è puntuale allora sia β che γ sono dei valori; se invece H non è di tipo puntuale, allora sia β che γ sono funzione della specificazione di tale ipotesi (maggiori dettagli saranno forniti nella sez. 4). La probabilità di accettare H quando è vera, è data da P(X A H ) = α e non ha un nome particolare. 6

7 B. Chiandotto F. Cipollini Versione 3 Cap. 7. Teoria del test delle ipotesi A questo punto ci sono tutti gli elementi per sviluppare la teoria del test delle ipotesi. Espressa per adesso in termini intuitivi, l idea di base, visto che il processo decisionale relativo al test delle ipotesi può essere affetto da errore (di I o di II tipo) è quella di congegnare tale processo in modo da sbagliare il meno possibile. D altra parte, per quanto detto in precedenza questo equivale a curare la suddivisione di C nelle due regioni A e R nel miglior modo possibile. Infatti: da una parte la formulazione dell ipotesi nulla è suggerita dal fenomeno in analisi e dall interesse di chi lo analizza; dall altra la realizzazione campionaria x non può essere certo stabilita da chi effettua le analisi; l unica cosa su cui si può intervenire è la suddivisione di C in A e R (e quindi, relativamente alla Fig., solo sul confine fra le due regioni). Pertanto tutto ciò che la teoria può fare è effettuare la partizione dell universo dei campioni C in A ed R in modo da sbagliare il meno possibile nel decidere se accettare o rifiutare H : quando nel seguito discuteremo della ricerca del test migliore, per test intenderemo sempre una suddivisione di C in regione di accettazione A e regione di rifiuto R. Così posto il problema, si vede chiaramente che il test ideale sarebbe quello che opera una suddivisione di C in A ed R in modo da non incorrere mai in errore e quindi cadere sempre nelle caselle ok della Tabella, cioè: se è vera H decidere di accettare H, mentre se è vera H rifiutare H. D altra parte se conoscessimo quale delle due ipotesi è vera non ci sarebbe bisogno di decidere, e quindi è ovvio che questa situazione ideale è nella pratica impossibile. Si potrebbe allora cercare, come test ottimale, una suddivisione di C in A ed R capace di minimizzare simultaneamente le probabilità, rispettivamente α e β, di commettere gli errori di I e di II tipo. Purtroppo, in generale non possibile perseguire tale obiettivo, dato che, come vedremo successivamente nella sez. 4, α e β sono collegati in maniera inversa, cioè al diminuire di uno l altro tende ad aumentare e viceversa. La procedura seguita normalmente è quella di cercare il test migliore nel modo seguente: fissato il livello di significatività α (la probabilità dell errore di I tipo) ad un livello piccolo, si cerca la suddivisione di C in A ed R che minimizza β (la probabilità dell errore di II tipo), ovvero, stante la relazione fra β e γ, che massimizza γ (la potenza 7

8 B. Chiandotto F. Cipollini Versione 3 Cap. 7 del test). Un tale test è detto test più potente (o test MP dall inglese Most Powerful) per α prefissato. I valori comunemente utilizzati per α sono.,.5,.,.. Evidentemente, la scelta di fissare α e minimizzare β, è dovuta al ruolo asimmetrico che hanno i due errori, di I e di II tipo. Fissare la probabilità dell errore di I tipo ad un livello piccolo e minimizzare la probabilità di quello di II tipo presuppone il ritenere il primo errore più grave rispetto al secondo. Infatti fissare α ad un livello piccolo implica tenere sotto controllo la probabilità di incorrere nell errore corrispondente, mentre β, una volta trovato il test più potente, sarà sì minimo a parità di α, ma sarà pur sempre quello che sarà, senza poterlo limitare ad un valore prefissato (salvo, come vedremo, il poter stabilire a priori la dimensione del campione). Questo significa che, per operare nel modo più corretto, bisognerebbe sempre porre come ipotesi nulla quella le cui conseguenze sono peggiori in caso di errata decisione. Fatte queste considerazioni, la teoria del test delle ipotesi si regge su diversi risultati teorici di cui diamo soltanto i principali, ovvero:. Il teorema di Neyman-Pearson;. Il test del rapporto di massima verosimiglianza. Il teorema di Neyman-Pearson (che diamo senza dimostrazione) fornisce una risposta esauriente al problema, sopra menzionato, di trovare il test più potente per un prefissato livello di significatività quando entrambe le ipotesi, la nulla e l alternativa, sono semplici. Teorema : Teorema di Neyman-Pearson. Siano: X una v.c. con funzione di massa o di densità f(x; θ); H : θ = θ contro H : θ = θ due ipotesi su θ entrambe semplici; α il prefissato livello di significatività del test. Sia poi x = (x,..., x n ) un campione estratto da X, l informazione da utilizzare per sottoporre a test le ipotesi indicate, e sia L(θ) la verosimiglianza calcolata in θ sulla base di tale campione. Allora il test più potente al livello di significatività α è individuato dalla seguente partizione dell universo dei campioni C: 8

9 B. Chiandotto F. Cipollini Versione 3 Cap. 7 R = {x: L(θ )/L(θ ) < K} A = {x: L(θ )/L(θ ) K}, dove il valore soglia K, detto valore critico, è scelto in modo tale da soddisfare il livello di significatività α, cioè α = P(X R H ) = P(X: L(θ )/L(θ ) < K H ). Questo teorema, ad una prima lettura di non semplice interpretazione, richiede qualche commento.. La prima cosa da notare, peraltro già evidenziata più volte, è il fatto che tale teorema vale solo se entrambe le ipotesi, nulla e alternativa, sono semplici.. In secondo luogo si evidenzia il particolare rilievo che la verosimiglianza ha anche nell ambito del test delle ipotesi, oltre che nella stima (si veda cap. 6). 3. In terzo luogo: il teorema resta valido qualunque sia il numero (purché finito) dei parametri caratteristici della legge di distribuzione della v.c. X; il teorema non richiede esplicitamente l indipendenza delle n osservazioni costituenti il campione; il teorema può essere applicato in modo del tutto equivalente considerando la differenza delle log-verosimiglianze invece rapporto fra le verosimiglianze. Infatti essendo il logaritmo una trasformazione monotona crescente si ha, facendo il logaritmo naturale di ambo i membri, L(θ )/L(θ ) < K l(θ ) l(θ ) < k, dove l(θ) = ln L(θ) e k = ln K [si invita lo studente a dimostrare l equivalenza fra le due relazioni]. Il vantaggio di considerare la log-verosimiglianza è che, di norma, quest ultima è più facile da trattare rispetto alla verosimiglianza. 4. Infine la considerazione più rilevante dal punto di vista pratico. Ricordando che la verosimiglianza in θ è la probabilità o densità del campione osservato x per tale valore del parametro, il teorema stabilisce regione di rifiuto e di accettazione in base al confronto della verosimiglianza nelle due situazioni alternative H, in cui θ vale θ, e H, in cui θ è pari a θ. Fissata una certa soglia K (o k se si considera la differenza fra log-verosimiglianze), anche intuitivamente appare logico accettare quando L(θ )/L(θ ) è superiore alla soglia, e rifiutare quando invece il rapporto è inferiore alla soglia. Riguardo a questo, il calcolo delle due verosimiglianze, per quanto talvolta lungo, generalmente non è un grosso problema. Il punto spinoso, 9

10 B. Chiandotto F. Cipollini Versione 3 Cap. 7 piuttosto, è come determinare la soglia K. Il teorema dice che K deve soddisfare la condizione α = P(X: L(θ )/L(θ ) < K H ): tuttavia per poter utilizzare questa condizione occorre che il rapporto fra le verosimiglianze L(θ )/L(θ ) abbia una distribuzione nota, in base alla quale sfruttare opportune tavole per ricavare K. In generale, però, tale distribuzione non è di semplice derivazione. Nella pratica, allora, come si può sfruttare questo teorema? Ebbene, quando, come nella maggior parte dei casi considerati in questo corso, esistono statistiche sufficienti per il parametro che si vuole sottoporre a test, si può dimostrare che la disuguaglianza L(θ )/L(θ ) < K può essere trasformata in una disuguaglianza perfettamente equivalente del tipo T(X) < c oppure T(X) > c, cioè vale α = P(X: L(θ )/L(θ ) < K H ) = P(X: T(X) < c H ) oppure α = P(X: L(θ )/L(θ ) < K H ) = P(X: T(X) > c H ) a seconda di quale delle due è equivalente a quella originaria (questo aspetto è affrontato sotto). Nelle relazioni precedenti T(X) è una statistica di cui si conosce la distribuzione mentre c è una costante soglia di nuovo detta valore critico. Poiché di T(X) si conosce la distribuzione, c può essere facilmente ricavato dalle tavole corrispondenti sulla base delle relazioni precedenti che lo legano ad α. Per non appesantire eccessivamente il corso, in generale non descriveremo i passaggi che da L(θ )/L(θ ) < K portano infine a T(X) < c oppure a T(X) > c. Ci limiteremo giusto ad un paio di esempi, mentre nei casi successivi indicheremo soltanto la statistica test T(X) e la corrispondente distribuzione. Ma rispetto a questo si può dire anche di più. La prima cosa che si può aggiungere è una semplice sottolineatura, decisiva però ai fini della comprensione della teoria del test delle ipotesi: il valore critico, sia questo K (nella versione per il rapporto fra verosimiglianze L(θ )/L(θ )), k (nella versione per la differenza fra log-verosimiglianze l(θ ) l(θ )) o c (per la versione relativa a T(X)) si trova da una delle condizioni α = P(X: L(θ )/L(θ ) < K H )), α = P(X: l(θ ) l(θ ) < k H )),

11 B. Chiandotto F. Cipollini Versione 3 Cap. 7 α = P(X: T(X) < c H ), α = P(X: T(X) > c H ), e dunque dipende dal comportamento della statistica test sotto H. In altri termini il confine fra regione di accettazione e regione di rifiuto si ricava, sempre, ragionando sotto H. La seconda cosa da aggiungere, fondamentale anch essa, è che nel caso in cui si utilizzi T(X) la regione di rifiuto va sempre messa dalla parte dell ipotesi alternativa H, cioè se θ < θ allora R = {x: T(x) < c} mentre se θ > θ allora R = {x: T(x) > c}. Quindi, riassumendo: il valore critico c va sempre trovato ragionando sotto H, tenendo però presente che la regione di rifiuto sta dalla parte di H. Tutto ciò consente di evidenziare un altro aspetto importante. Le assunzioni del teorema indicano che entrambe le ipotesi H e H devono essere semplici. In realtà per quanto detto al termine del punto precedente, nel caso in cui si possa trasformare α = P(X: L(θ )/L(θ ) < K H )) in α = P(X: T(X) < c H ) oppure α = P(X: T(X) > c H ), mantenendo l ipotesi nulla a H : θ = θ il teorema vale anche se l ipotesi alternativa è composta unidirezionale, cioè del tipo H : θ > θ oppure H : θ < θ. Infatti in questo caso non ha alcuna importanza al valore puntuale dell ipotesi alternativa al fine di stabilire regione di accettazione e regione di rifiuto: l unica cosa che conta è se H sta a destra oppure a sinistra di H. I seguenti due esempi chiariscono nella pratica quanto detto finora. [Avvertenza: essendo i due esempi abbastanza tecnici, se ne consiglia la lettura, che deve essere effettuata con attenzione e carta e penna alla mano, solo a chi ha una certa dimestichezza con i passaggi algebrici.] Esempio Sia X ~ Be(p) e siano

12 B. Chiandotto F. Cipollini Versione 3 Cap. 7 H : p = p contro H : p = p due ipotesi entrambe semplici su p (nella pratica p e p sono due numeri), cosicché lo spazio parametrico è {p, p }. Considerando la differenza fra log-verosimiglianze (punto 3 precedente), allora il test più potente al livello di significatività α è individuato, in base al teorema di Neyman- Pearson, dalla seguente regione di rifiuto R = {x: l(p ) l(p ) < k}, dove il valore critico k è determinato sulla base della distribuzione della statistica test l(p ) l(p ) sotto H, dovendo soddisfare α = P(X R H ) = P(X: l(p ) l(p ) < k H ). Allora (cap. 6, sez. 5..) l(p ) l(p ) = ln p n i= n X i + ln q (n i= n X i ) ln p i= n X i ln q (n i= X i ) < k, che, mettendo in evidenza la statistica sufficiente n i= X i, equivale a n [ln (p /q ) ln (p /q )] X i + n (ln q ln q ) < k, i= ovvero, ragionando sulla media campionaria invece che sulla somma dei successi, a [ln (p /q ) ln (p /q )] n X + n (ln q ln q ) < k. A questo punto, il passaggio successivo dipende da quale è maggiore fra le due ipotesi, se la nulla o l alternativa. Infatti: se p < p allora ln (p /q ) ln (p /q ) > e quindi X < [k/n ln q + ln q ]/[ln (p /q ) ln (p /q )] = c; se p > p allora ln (p /q ) ln (p /q ) < e quindi X > [k/n ln q + ln q ]/[ln (p /q ) ln (p /q )] = c. Possiamo notare che si verifica proprio quanto detto in precedenza: la disuguaglianza sulle verosimiglianze (o sulle log-verosimiglianze) è stata trasformata in una disuguaglianza equivalente relativa ad una particolare statistica di cui si conosce la distribuzione, nel nostro caso X ~ BiRe(n, p); quale delle due disuguaglianze vale

13 B. Chiandotto F. Cipollini Versione 3 Cap. 7 dipende da dove sta l ipotesi alternativa rispetto alla nulla: se p < p allora vale quella con < c, e quindi la regione di rifiuto è R = {x: x < c}; se p > p allora vale quella con > c, e quindi la regione di rifiuto è R = {x: x > c}; In ogni caso la regione di rifiuto sta sempre, rispetto a c, dalla parte dell alternativa. Il valore critico c può essere ricavato direttamente dalla condizione sul livello di significatività, cioè: se p < p, c è tale che α = P(X R H ) = P( X < c H ); se p > p, c è tale che α = P(X R H ) = P( X > c H ); senza quindi dover calcolare l espressione c = [k/n ln q + ln q ]/[ln (p /q ) ln (p /q )] (la determinazione pratica di tale valore critico sarà affrontata successivamente). Esempio Sia X ~ N(µ, σ ) con σ nota, e siano H : µ = µ contro H : µ = µ due ipotesi entrambe semplici su µ (nella pratica µ e µ sono numeri), cosicché lo spazio parametrico è {µ, µ }. Considerando la differenza fra log-verosimiglianze (punto 3 precedente), allora il test più potente al livello di significatività α è individuato, in base al teorema di Neyman- Pearson, dalla seguente regione di rifiuto R = {x: l(µ ) l(µ ) < k}, dove il valore critico k è determinato sulla base della distribuzione della statistica test l(µ ) l(µ ) sotto H, dovendo soddisfare α = P(X R H ) = P(X: l(µ ) l(µ ) < k H ). Allora (cap. 6, sez. 5..4) l(µ ) l(µ ) = n ln(π) n lnσ n σ = i (X i µ ) + n ln(π) + n lnσ + n σ = i (X i µ ) < k, 3

14 B. Chiandotto F. Cipollini Versione 3 Cap. 7 che dopo le opportune semplificazioni diviene n σ = i [(X i µ ) (X i µ ) ] < k. Svolgendo il quadrato e facendo alcune semplificazioni si ottiene equivalente a σ σ [n( µ µ ) + (µ µ ) X i ] < k, n i= [n( µ µ ) + (µ µ )n X ] < k. A questo punto, il passaggio successivo dipende da quale è maggiore fra le due ipotesi, se la nulla o l alternativa. Infatti: se µ < µ allora µ µ > e quindi se µ < µ allora µ µ < e quindi X < [σ k/n ( µ µ )]/[(µ µ )] = c; X > [σ k/n ( µ µ )]/[(µ µ )] = c. Anche in questo caso si verifica quanto detto in precedenza: la disuguaglianza sulle verosimiglianze (o sulle log-verosimiglianze) è stata trasformata in una disuguaglianza equivalente relativa ad una particolare statistica di cui si conosce la distribuzione, nel nostro caso X ~ N(µ,σ /n); quale delle due disuguaglianze vale dipende da dove sta l ipotesi alternativa rispetto alla nulla: se µ < µ allora vale quella con < c, e quindi la regione di rifiuto è R = {x: x < c}; se µ > µ allora vale quella con > c, e quindi la regione di rifiuto è R = {x: x > c}. In ogni caso la regione di rifiuto sta sempre, rispetto a c, dalla parte dell alternativa. Il valore critico c può essere ricavato direttamente dalla condizione sul livello di significatività, cioè: se µ < µ, c è tale che α = P(X R H ) = P( X < c H ); 4

15 B. Chiandotto F. Cipollini Versione 3 Cap. 7 se µ < µ, c è tale che α = P(X R H ) = P( X > c H ); senza quindi dover calcolare l espressione c = [σ k/n ( µ µ )]/[(µ µ )] (la determinazione pratica di tale valore critico sarà affrontata successivamente). Riassumendo quanto detto finora, il teorema di Neyman-Pearson consente di derivare la migliore regione critica soltanto quando le ipotesi nulla e alternativa sono semplici oppure, per certi particolari modelli, quando l ipotesi nulla è semplice e l ipotesi alternativa è composta unilaterale. Quando H o H o entrambe le ipotesi sono composte non esiste un teorema analogo. E stata comunque suggerita, sempre da Neyman e Pearson, una procedura generale per la individuazione della regione critica che dà usualmente buoni risultati: il test del rapporto di verosimiglianza (in inglese likelihood ratio test). Definizione 3: Definizione di test del rapporto di verosimiglianza. Siano: X una v.c. con funzione di massa o di densità f(x; θ); H : θ Θ contro H : θ Θ due ipotesi su θ (una o entrambe composte); α il prefissato livello di significatività del test. Sia poi x = (x,..., x n ) un campione estratto da X, l informazione da utilizzare per sottoporre a test le ipotesi indicate, e sia L(θ) la verosimiglianza calcolata in θ sulla base di tale campione. Allora il test del rapporto di verosimiglianza si basa sul rapporto fra il massimo della verosimiglianza sotto il vincolo di H, L( ˆ θ ) = max L( θ), θ Θ e il massimo della verosimiglianza libero, L(θˆ ) = max L( θ) θ Θ. In particolare il test del rapporto di massima verosimiglianza al livello di significatività α è individuato dalla seguente partizione dell universo dei campioni C: R = {x: r = L( ˆ θ )/L(θˆ ) < K} A = {x: r = L( ˆ θ )/L(θˆ ) K}, 5

16 B. Chiandotto F. Cipollini Versione 3 Cap. 7 dove il valore soglia K è scelto in modo tale da soddisfare il livello di significatività α, cioè α = P(X R H ) = P(X: r = L( ˆ θ )/L(θˆ ) < K H ). Anche questa definizione richiede alcuni commenti.. Per prima cosa, si evidenzia di nuovo il ruolo fondamentale del concetto di verosimiglianza.. In seconda battuta è opportuno chiarire la ratio di questa procedura di test. La logica del test del rapporto di verosimiglianza è quella di rapportare come il campione è spiegato dall ipotesi H (il massimo vincolato L( ˆ θ ) = max L( θ) al θ Θ numeratore) rispetto a come è spiegato senza imporre alcun vincolo (il massimo libero L(θˆ ) = L( θ) max al denominatore). Notato che tale rapporto è θ Θ necessariamente compreso fra e (le verosimiglianze sono sempre non negative e il massimo vincolato non può essere maggiore del massimo libero!), si intuisce che se r è vicino ad allora la spiegazione fornita sotto H si avvicina a quella libera e l ipotesi H sarà tendenzialmente da accettare; viceversa se r è piccolo allora la spiegazione fornita sotto H è significativamente peggiore di quella libera e l ipotesi H sarà tendenzialmente da rifiutare. 3. Come terza cosa si fa notare che, analogamente al teorema di Neyman-Pearson, il test del rapporto di verosimiglianza può essere anche applicato con riferimento alle log-verosimiglianze, che come detto altre volte sono spesso un po più semplici da calcolare. Infatti, essendo il logaritmo naturale una trasformazione monotona crescente, il logaritmo del massimo (della verosimiglianza, sia questa libera che vincolata) è uguale al massimo del logaritmo (e quindi al massimo della logverosimiglianza). Di conseguenza, considerando la disuguaglianza che definisce la regione di rifiuto R abbiamo r = L( ˆ θ )/L(θˆ ) < K ln r = l( ˆ θ ) l(θˆ ) < k, dove l( ˆ θ ) = max l( θ) e l(θˆ ) = l( θ) θ Θ max sono rispettivamente il massimo vincolato θ Θ (sotto H ) e il massimo libero della log-verosimiglianza e k = ln K [di nuovo si invita lo studente a dimostrare l equivalenza delle due relazioni precedenti]. Si fa notare 6

17 B. Chiandotto F. Cipollini Versione 3 Cap. 7 che, poiché il rapporto fra i massimi delle verosimiglianze r è sempre compreso in [, ], la differenza fra i massimi delle log-verosimiglianze è sempre. 4. La costante che discrimina se l ipotesi nulla è da accettare o da rifiutare è il valore critico, K per il rapporto delle verosimiglianze, k per la differenza delle logverosimiglianze. Ovviamente poiché r è compreso fra ed anche K sarà sempre inferiore a, così come essendo ln r anche k sarà sempre negativo. Il valore di K deve essere ricavato in modo da rispettare il livello di significatività fissato, cioè α = P(X R H ) = P(X: r = L( ˆ θ )/L(θˆ ) < K H ) e un discorso analogo vale per k α = P(X R H ) = P(X: ln r = l( ˆ θ ) l(θˆ ) < k H ). D altra parte per ricavare K o k occorre conoscere la distribuzione campionaria di r = L( ˆ θ )/L(θˆ ) o di ln r = l( ˆ θ ) l(θˆ ) in modo da sfruttare opportune tavole per ricavare K o k. In generale, però, tale distribuzione non è di semplice derivazione. E allora si aprono due situazioni alternative: - Se, dopo una serie di passaggi, si riesce a semplificare la disuguaglianza L( ˆ θ )/L(θˆ ) < K o l equivalente l( ˆ θ ) l(θˆ ) < k in modo da ricondurla ad una disuguaglianza perfettamente equivalente relativa ad una statistica la cui distribuzione è nota (operazione analoga a quanto visto in precedenza relativamente al teorema di Neyman-Pearson e che richiede la presenza di statistiche sufficienti), allora conviene procedere per questa strada e la distribuzione della statistica test che si trova consente l esatta derivazione del valore critico; - Se invece non è possibile ricondursi ad una disuguaglianza equivalente per una grandezza la cui distribuzione è nota (e questo è il caso più frequente nella pratica, anche se raro in questo corso) allora non rimane che affidarsi alla distribuzione asintotica del rapporto di massima verosimiglianza r. Sotto condizioni di regolarità abbastanza generali si può infatti dimostrare che per n abbastanza grande, la variabile casuale lnr, ha approssimativamente una distribuzione del tipo χ (v), dove ν rappresenta il numero di vincoli di uguaglianza puntuali sui parametri specificati da H. In simboli ( lnr = [l( ˆ θ ) l(θˆ )] H ) χ (v). 7

18 B. Chiandotto F. Cipollini Versione 3 Cap. 7 In tal caso, poiché la regione di rifiuto è definita da r < K o da ln r < ln K, allora r < K ln r < ln K ln r > ln K, per cui in base alla distribuzione asintotica di lnr dovremo sempre rifiutare a destra del valore critico trovato in base alle tavole della χ (v). Il fatto che la distribuzione asintotica si riferisca alla v.c. lnr è un altra ragione per cui spesso si utilizza la log-verosimiglianza in luogo della verosimiglianza. Il test del rapporto di verosimiglianza gode anche di particolari proprietà. Infatti si dimostra che nei casi in cui esiste la migliore regione critica, cioè quella che a parità di livello di significatività α massimizza la potenza γ, il test del rapporto di verosimiglianza riesce a individuarla. Ad esempio, nelle condizioni del teorema di Neyman-Pearson il test del rapporto di verosimiglianza riesce ad individuare la medesima regione di rifiuto del teorema. Si dimostra inoltre che se esiste un test uniformemente più potente (test UMP dall inglese Uniformly Most Powerful), cioè un test che, relativamente ad una data ipotesi nulla semplice H e per un prefissato livello di significatività α, minimizza la probabilità β dell errore di II tipo qualunque sia la specificazione della ipotesi alternativa composta H, esso è un test del rapporto di verosimiglianza. 3. Esempio X ~ N(µ, σ ): test su µ con σ nota In questa sezione si illustra come sottoporre a test alcune ipotesi sul parametro media µ relativamente al modello Normale con varianza nota. Come detto altre volte, questo modello non è di grande interesse da un punto di vista operativo in quanto la varianza è generalmente una quantità incognita. Tuttavia è utile descriverlo e apprenderlo con cura, sia perché costituisce il prototipo degli esempi che seguiranno (se si capisce questo gli altri diventano banali ) sia perché consente di precisare i concetti già esposti e di illustrarne di nuovi. Sia allora X ~ N(µ, σ ) con σ nota. Si vuole sottoporre a test un ipotesi su µ, al livello di significatività α sulla base del c.c.s. x = (x,, x n ). 8

19 B. Chiandotto F. Cipollini Versione 3 Cap. 7 a) Caso H : µ = µ contro H : µ = µ > µ Questo caso, in cui µ e µ sono due numeri di cui il secondo maggiore del primo, è stato trattato nell Esempio discutendo del teorema di Neyman-Pearson. Essendo le due ipotesi entrambe semplici, il test migliore è individuato dal teorema, la cui applicazione porta: all utilizzo della statistica test X ; a porre la regione di rifiuto dalla parte dell ipotesi alternativa, cioè R = {x: x > c}; a scegliere il valore critico c in base, contemporaneamente, al livello di significatività α prefissato e alla distribuzione della statistica test sotto H, cioè α = P(X R H ) = P( X > c H ). Nell Esempio Avevamo rimandato la ricerca del valore critico c ed ora è il momento di affrontarla. Poiché in base alle assunzioni dell esempio si ha che X ~ N(µ, σ /n), quando è vera H si ha che µ = µ per cui ( X H ) ~ N(µ, σ /n). Di conseguenza per trovare c si sfruttano i seguenti passaggi X µ c µ α = P(X R H ) = P( X > c H ) = P( > H ) = P(Z > z H ), si trova z come valore che nelle tavole della N(, ) lascia a destra una probabilità α, e quindi a sinistra ( α), e infine si calcola il valore critico c = µ + z σ/ n. La regione critica è allora R = {x: x > c = µ + z σ/ n }, dove z è il quantile ( α) della N(, ). A questo punto se la media x calcolata sul campione è inferiore a c si accetta, se è maggiore si rifiuta. Si sottolinea che una decisione identica si poteva prendere, invece che confrontando x col c trovato, confrontando la sua versione standardizzata x µ con lo z (che 9

20 B. Chiandotto F. Cipollini Versione 3 Cap. 7 possiamo chiamare z-critico) trovato dalle tavole. Infatti, in base ai passaggi visti sopra, X > c è del tutto equivalente a X µ > z. b) Caso H : µ = µ contro H : µ = µ < µ Questo caso, in cui µ e µ sono di nuovo due numeri di cui il secondo è stavolta minore del primo, può essere risolto, sfruttando il teorema di Neyman-Pearson, in maniera del tutto analoga al caso precedente. L unica differenza sta nel fatto che, dovendo la regione di rifiuto stare dalla parte dell alternativa, abbiamo R = {x: x < c}. Poiché di nuovo ( X H ) ~ N(µ, σ /n), per trovare c possiamo fare X µ c µ α = P(X R H ) = P( X < c H ) = P( < H ) = P(Z < z H ), trovare z come quantile α della N(, ) e calcolare il valore critico c = µ + z σ/ n. La regione critica è allora R = {x: x < c = µ + z σ/ n }, dove z è il quantile α della N(, ). A questo punto se la media x calcolata sul campione è inferiore a c si rifiuta, se è maggiore si accetta. Di nuovo una decisione identica si poteva prendere, invece che confrontando x col c trovato, confrontando la sua versione standardizzata x µ con lo z-critico trovato dalle tavole. Infatti X < c è del tutto equivalente a X µ < z. c) Caso H : µ = µ contro H : µ > µ In questo caso, l ipotesi alternativa è composta unilaterale. Tuttavia, se si osserva il caso a) trattato precedentemente, in cui l alternativa era H : µ = µ > µ, si nota che nella formulazione della regione di rifiuto R il valore dell ipotesi alternativa non compare:

21 B. Chiandotto F. Cipollini Versione 3 Cap. 7 l alternativa serve solo a stabilire in quale coda della distribuzione di ( X H ) piazzare la regione di rifiuto. Di conseguenza la regione critica è la stessa, cioè R = {x: x > c = µ + z σ/ n }, oppure, se si decide di utilizzare la versione standardizzata, x µ R = {x: > z} dove z è il quantile ( α) della N(,). d) Caso H : µ = µ contro H : µ < µ Anche in questo caso l ipotesi alternativa è composta unilaterale e si può ripetere il ragionamento fatto al punto precedente. Infatti, se si osserva il caso b) in cui l alternativa era H : µ = µ < µ, si vede che nella formulazione della regione di rifiuto R il valore dell ipotesi alternativa non compare: l alternativa, lo ripetiamo, serve solo a stabilire in quale coda della distribuzione di ( X H ) piazzare la regione di rifiuto. Di conseguenza la regione critica è la stessa, cioè R = {x: x < c = µ + z σ/ n }, oppure, se si decide di utilizzare la versione standardizzata, x µ R = {x: < z} dove z è il quantile α della N(,). e) Caso H : µ = µ contro H : µ µ Mentre nei due casi precedenti l ipotesi alternativa era composta unidirezionale, adesso è composta bidirezionale. Questo caso allora non può essere risolto ricorrendo al teorema di Neyman-Pearson, né nella versione base (due ipotesi semplici) né in quella generalizzata (ipotesi nulla semplice, ipotesi alternativa unidirezionale); si può però arrivare ad una soluzione ricorrendo al test del rapporto di verosimiglianza. Infatti, sottraendo al massimo vincolato della log-verosimiglianza sotto H : µ = µ il massimo libero della stessa log-verosimiglianza in base alle espressioni riportate nella

22 B. Chiandotto F. Cipollini Versione 3 Cap. 7 sez del cap. 6, si ottiene, dopo alcuni passaggi e semplificazioni, che la regione di rifiuto è definita dalla disuguaglianza e la regione di accettazione da x µ ln r = < k, x µ ln r = k. Quest ultima ovviamente equivale ad accettare se k x µ k. (si ricorda che k < ). Di nuovo, allora, ricompare la media campionaria X come statistica test sulla base della quale prendere la decisione e, di nuovo, sotto H abbiamo I valori critici X µ ( H ) ~ N(, ). k e k, che come si può notare sono simmetrici rispetto a, vanno trovati in base al livello di significatività del test: X µ X µ α = P(X A H ) = P( k k H ) = P( z z H ) dove z è il quantile ( α/) della N(, ). Allora la regione di accettazione è definita da x µ A = {x: z z }, oppure, nella versione non standardizzata ma perfettamente equivalente, da A = {x: c = µ z σ/ n x c = µ + z σ/ n } dove come detto z è il quantile ( α/) della N(,). f) Caso H : µ µ contro H : µ > µ Questo caso differisce dai precedenti in quanto l ipotesi nulla non è di tipo puntuale. Tuttavia può essere ricondotto al caso c) semplicemente trasformando l ipotesi nulla in H : µ = µ. La ragione è che se si sostituisce l ipotesi nulla originaria con quella indicata si ottiene la situazione peggiore, dal punto di vista della potenza del test, rispetto a

23 B. Chiandotto F. Cipollini Versione 3 Cap. 7 qualsiasi altra situazione in cui, sotto H, µ sia inferiore a µ. Maggiori dettagli su questo saranno forniti nella sez. 4 quando, appunto, parleremo più diffusamente della potenza di un test. g) Caso H : µ µ contro H : µ < µ Questo caso può essere trattato con un ragionamento esattamente analogo a quello precedente. [Si consiglia allo studente di ricostruirne i dettagli per conto proprio]. Per mettere in pratica quanto illustrato consideriamo i seguenti esempi numerici. Esempio 3 Una fabbrica di lampadine afferma che i propri prodotti hanno una durata media di almeno ore e come acquirenti si vuole verificare l'affermazione. Sottoponendo a prova un campione casuale di lampadine si riscontra una durata media di 97 ore. Sapendo che la varianza della durata risulta essere σ = 64 ore, cosa si può concludere riguardo all'affermazione ad un livello di significatività del 5%? Il problema di verifica l'ipotesi da risolvere è H : µ contro H : µ <. D'altra parte, per effettuare in pratica questo test è opportuno correggere l'ipotesi nulla secondo quanto indicato nel precedente caso g), ovvero H : µ = contro H : µ <. Ipotizzando la Normalità della durata delle lampadine, basandoci sulla teoria possiamo utilizzare come v.c. test X, la cui distribuzione, essendo nota la varianza, è data da X µ N(, ). La regione di rifiuto R va determinata, in base al livello di significatività, considerando la distribuzione della v.c. test sotto H mettendo α ed R dalla parte di H : X µ.5 = P(X R H ) = P( < z H ). 3

24 B. Chiandotto F. Cipollini Versione 3 Cap. 7 Dalle tavole si trova z =.645 come quantile.5 della N(, ), per cui la regione di rifiuto per la statistica Z è R = {x: x µ σ / n <.645}. Lo z-empirico risulta invece x µ σ / n = / = 3.75, che confrontato con la regione di rifiuto porta a rifiutare H al livello di significatività del 5% e a concludere quindi che la durata media delle lampadine è significativamente inferiore a quella indicata. Esempio 4 Un'impresa afferma che le batterie da essa prodotte hanno una durata media di ore e che la loro variabilità, misurata attraverso lo scostamento quadratico medio, è pari a 3 ore. Un campione di 9 batterie viene sottoposto a prova; tale prova fornisce una durata media di ore. Ipotizzando per la popolazione una variabilità pari a quella dichiarata dalla casa produttrice e la Normalità della distribuzione, si vuol verificare la validità dell'affermazione fatta dall'impresa. Dobbiamo allora sottoporre a test H : µ = contro H : µ. Grazie all'ipotesi di Normalità, di nuovo, basandoci sulla teoria possiamo utilizzare come v.c. test X, la cui distribuzione, essendo nota la varianza, è data da X µ N(, ). La regione di rifiuto R va determinata, in base al livello di significatività del 5%, considerando la distribuzione della v.c. test sotto H e mettendo R su entrambe le code (α/ a sinistra, α / a destra):.5 = P(X A H ) = P( z X µ z H ). Dalle tavole si trova z =.96 come quantile.975 della N(, ), per cui la regione di accettazione per la statistica Z è A = {x:.96 x µ σ / n.96}. Lo z-empirico risulta invece x µ σ / n = 3 / 9 =, che confrontato con la regione di accettazione porta a 4

25 B. Chiandotto F. Cipollini Versione 3 Cap. 7 rifiutare H al livello di significatività del 5% e a concludere quindi che la durata media delle lampadine è significativamente diversa da quella indicata. 4. La potenza del test Finora abbiamo focalizzato l attenzione sulla costruzione del test, cioè sulla divisione dello spazio campionario in regione di accettazione e di rifiuto, in modo da sfruttare al meglio le informazioni campionarie a disposizione. Questo significa, parafrasando il significato del teorema di Neyman-Pearson e le proprietà del test del rapporto di verosimiglianza, che a parità di livello di significatività la potenza ottenuta è la più alta possibile (nelle condizioni del teorema) o comunque buona. Adesso però è venuto il momento di analizzare in dettaglio come determinare la potenza di un test e approfondire gli elementi che ne determinano il valore. Per determinare la potenza di un test occorre anzitutto ricordarne la definizione. La potenza di un test è la probabilità, quando è vera H, di fare la cosa giusta, cioè di rifiutare: γ = P(X R H ). Se l ipotesi alternativa è semplice, il calcolo della potenza è banale: basta seguire quanto prescritto dalla definizione. Prendiamo come riferimento il modello illustrato nella sezione precedente. Nel caso a) H : µ = µ contro H : µ = µ > µ allora, ricordando che la regione di rifiuto è data in questa situazione da R = {x: x > c = µ + z σ/ n } = {x: dove z è il quantile ( α) della N(, ), e che sotto H x µ σ / n > z}, ( X H ) ~ N(µ, σ /n), abbiamo X µ γ = P(X R H ) = P( X > c H ) = P( > c µ H ) = P(Z > c µ H ). 5

26 B. Chiandotto F. Cipollini Versione 3 Cap. 7 Si evidenzia anche che se si fosse calcolata la potenza a partire dall altro modo di esprimere la regione critica, cioè X µ γ = P(X R H ) = P( > z H ), per procedere al calcolo occorre prima togliere la standardizzazione rispetto alla distribuzione sotto H (che risulta sbagliata sotto H ) e poi standardizzare di nuovo in base alla distribuzione sotto H, riportandosi di fatto al calcolo fatto sopra [si invita lo studente a fare i passaggi]. Analogamente, nel caso b) H : µ = µ contro H : µ = µ < µ, ricordando che la regione di rifiuto è data in questa situazione da R = {x: x < c = µ + z σ/ dove z è il quantile α della N(, ) e che, di nuovo, n } = {x: ( X H ) ~ N(µ, σ /n), abbiamo, sempre per come è distribuito X sotto H, x µ X µ c µ c µ γ = P(X R H ) = P( X < c H ) = P( < H ) = P(Z < H ). Di nuovo, si evidenzia anche che se si fosse calcolata la potenza a partire dall altro modo di esprimere la regione critica, cioè X µ γ = P(X R H ) = P( < z H ), per procedere al calcolo occorre prima togliere la standardizzazione rispetto alla distribuzione sotto H (che risulta sbagliata sotto H ) e poi standardizzare di nuovo in base alla distribuzione sotto H, riportandosi di fatto al calcolo fatto sopra [si invita lo studente a fare i passaggi]. σ / n < z} Sostituendo i valori di c = µ + zσ/ mediante le tavole si ottiene la potenza del test. n, µ, σ, n e calcolando la probabilità in oggetto Si nota immediatamente che, se da una parte il valore di µ non ha alcuna importanza nello stabilire regione di accettazione e regione di rifiuto (se non per il fatto di stare a 6

27 B. Chiandotto F. Cipollini Versione 3 Cap. 7 destra o a sinistra di H ), la specificazione dell ipotesi è invece determinate per la potenza del test, come si può intuire dalla definizione. Si nota anche che nel determinare la potenza del test non ha alcuna importanza il valore campionario della statistica test. Detto in altre parole la potenza di un test può essere calcolata a tavolino, dato che allo scopo il campione non serve assolutamente. Sostituendo l espressione di c = µ + zσ/ n e facendo qualche semplificazione, la potenza del test nei due casi precedenti può essere espressa: in a), in cui H : µ = µ > µ, da µ µ γ = P(Z > + z α H ), e in b), in cui H : µ = µ < µ, da γ = P(Z < µ µ + z α H ). Anche se riferite all'esempio in oggetto, le formule di cui sopra consentono alcune precisazioni che hanno portata generale. In particolare l espressione della potenza mette in evidenza le determinati fondamentali del suo valore (per semplicità commentiamo la formula relativa al caso b, con l avvertenza che considerazioni del tutto speculari possono essere ripetute per a):. Il livello di significatività, nel senso che all aumentare di α aumenta anche la potenza γ. Infatti, a parità di altre condizioni, l aumento di α fa aumentare z α che a sua volta fa aumentare γ = P(Z < µ µ + z α H ). Questo si può vedere anche graficamente dalla Fig. : l incremento di α (probabilità dell errore di I tipo), comporta un allargamento della regione di rifiuto che a sua volta determina un aumento della potenza del test e una riduzione di β.. La specificazione dell ipotesi alternativa, nel senso che all aumentare della distanza di H da H aumenta anche la potenza γ. Infatti, a parità di altre condizioni, l aumento della distanza fra le due ipotesi fa aumentare µ µ (ricordiamo che, nel caso b, µ < µ ), quindi fa aumentare µ µ e questo infine 7

28 B. Chiandotto F. Cipollini Versione 3 Cap. 7 fa accrescere γ = P(Z < µ µ + z α H ). Questo si può vedere anche graficamente dalla Fig. 3: la diminuzione di µ provoca un corrispondente spostamento a sinistra della distribuzione di X sotto H, comportando un aumento, sempre sotto H, della probabilità di stare nella regione di rifiuto e una riduzione di β. 3. La dimensione del campione, nel senso che all aumentare di n aumenta anche la potenza γ. Infatti, a parità di altre condizioni, l aumento di n fa aumentare la quantità µ µ aumentare γ = P(Z <, (ricordiamo che, nel caso b, µ < µ ) che quindi a sua volta fa µ µ + z α H ). Questo si può vedere anche graficamente dalla Fig. 4: l aumento di n provoca una minor variabilità delle distribuzioni della statistica test, sia sotto l ipotesi nulla che sotto l alternativa, che ha per effetto finale un aumento della potenza ed una diminuzione di β. 4. La variabilità intrinseca della v.c. X, nel senso che all aumentare di σ diminuisce la potenza γ. Infatti, a parità di altre condizioni, l aumento di σ fa diminuire la quantità fa diminuire γ = P(Z < µ µ µ µ, (ricordiamo che, nel caso b, µ < µ ) che a sua volta + z α H ). Questo si può vedere anche graficamente dalla Fig. 5: l aumento della variabilità della distribuzione di X, variabilità espressa ad esempio dalla deviazione standard σ, determina una maggiore variabilità anche delle distribuzioni della statistica test, sia sotto l ipotesi nulla che sotto l alternativa, che ha per effetto finale una diminuzione della potenza ed un aumento di β. L effetto è praticamente opposto a quello provocato da un aumento della dimensione del campione. La determinante della potenza del test discussa al precedente punto consente anche di argomentare la soluzione adottata nei casi f) e g) dell'esempio di cui alla sez. 3 (e anche nei casi analoghi degli esempi che seguiranno). Infatti, supponendo fissato il valore del parametro µ sotto l'ipotesi alternativa ad un certo valore µ, è chiaro che spostando la nulla da µ verso l'interno della propria porzione di spazio campionario si ottiene 8

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI Indice 1 Le frazioni algebriche 1.1 Il minimo comune multiplo e il Massimo Comun Divisore fra polinomi........ 1. Le frazioni algebriche....................................

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Capitolo 2. Operazione di limite

Capitolo 2. Operazione di limite Capitolo 2 Operazione di ite In questo capitolo vogliamo occuparci dell operazione di ite, strumento indispensabile per scoprire molte proprietà delle funzioni. D ora in avanti riguarderemo i domini A

Dettagli

1 Serie di Taylor di una funzione

1 Serie di Taylor di una funzione Analisi Matematica 2 CORSO DI STUDI IN SMID CORSO DI ANALISI MATEMATICA 2 CAPITOLO 7 SERIE E POLINOMI DI TAYLOR Serie di Taylor di una funzione. Definizione di serie di Taylor Sia f(x) una funzione definita

Dettagli

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo. DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

risulta (x) = 1 se x < 0.

risulta (x) = 1 se x < 0. Questo file si pone come obiettivo quello di mostrarvi come lo studio di una funzione reale di una variabile reale, nella cui espressione compare un qualche valore assoluto, possa essere svolto senza necessariamente

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

3 GRAFICI DI FUNZIONI

3 GRAFICI DI FUNZIONI 3 GRAFICI DI FUNZIONI Particolari sottoinsiemi di R che noi studieremo sono i grafici di funzioni. Il grafico di una funzione f (se non è specificato il dominio di definizione) è dato da {(x, y) : x dom

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

Per lo svolgimento del corso risulta particolarmente utile considerare l insieme

Per lo svolgimento del corso risulta particolarmente utile considerare l insieme 1. L insieme R. Per lo svolgimento del corso risulta particolarmente utile considerare l insieme R = R {, + }, detto anche retta reale estesa, che si ottiene aggiungendo all insieme dei numeri reali R

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se

Dettagli

Analisi dei Dati 12/13 Esercizi proposti 3 soluzioni

Analisi dei Dati 12/13 Esercizi proposti 3 soluzioni Analisi dei Dati 1/13 Esercizi proposti 3 soluzioni 0.1 Un urna contiene 6 palline rosse e 8 palline nere. Si estraggono simultaneamente due palline. Qual è la probabilità di estrarle entrambe rosse? (6

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

( x) ( x) 0. Equazioni irrazionali

( x) ( x) 0. Equazioni irrazionali Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza

Dettagli

Probabilità discreta

Probabilità discreta Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che

Dettagli

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che:

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che: Teoria dei Giochi, Trento, 2004/05 c Fioravante Patrone 1 Teoria dei Giochi Corso di laurea specialistica: Decisioni economiche, impresa e responsabilità sociale, A.A. 2004/05 Soluzioni degli esercizi

Dettagli

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe

Dettagli

Matematica generale CTF

Matematica generale CTF Successioni numeriche 19 agosto 2015 Definizione di successione Monotonìa e limitatezza Forme indeterminate Successioni infinitesime Comportamento asintotico Criterio del rapporto per le successioni Definizione

Dettagli

Funzioni. Parte prima. Daniele Serra

Funzioni. Parte prima. Daniele Serra Funzioni Parte prima Daniele Serra Nota: questi appunti non sostituiscono in alcun modo le lezioni del prof. Favilli, né alcun libro di testo. Sono piuttosto da intendersi a integrazione di entrambi. 1

Dettagli

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria).

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria). Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria). Aprile 20 Indice Serie numeriche. Serie convergenti, divergenti, indeterminate.....................

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Esponenziali elogaritmi

Esponenziali elogaritmi Esponenziali elogaritmi Potenze ad esponente reale Ricordiamo che per un qualsiasi numero razionale m n prendere n>0) si pone a m n = n a m (in cui si può sempre a patto che a sia un numero reale positivo.

Dettagli

ESEMPIO 1: eseguire il complemento a 10 di 765

ESEMPIO 1: eseguire il complemento a 10 di 765 COMPLEMENTO A 10 DI UN NUMERO DECIMALE Sia dato un numero N 10 in base 10 di n cifre. Il complemento a 10 di tale numero (N ) si ottiene sottraendo il numero stesso a 10 n. ESEMPIO 1: eseguire il complemento

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE 1. Proporzionalità diretta e proporzionalità inversa Analizziamo le seguenti formule Peso Lordo = Peso Netto + Tara Ricavo = Utile + Costo Rata = Importo + Interesse

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile Problemi connessi all utilizzo di un numero di bit limitato Abbiamo visto quali sono i vantaggi dell utilizzo della rappresentazione in complemento alla base: corrispondenza biunivoca fra rappresentazione

Dettagli

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI FUNZIONI ELEMENTARI - ESERCIZI SVOLTI 1) Determinare il dominio delle seguenti funzioni di variabile reale: (a) f(x) = x 4 (c) f(x) = 4 x x + (b) f(x) = log( x + x) (d) f(x) = 1 4 x 5 x + 6 ) Data la funzione

Dettagli

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Inferenza statistica I Alcuni esercizi. Stefano Tonellato Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,

Dettagli

Matematica 1 - Corso di Laurea in Ingegneria Meccanica

Matematica 1 - Corso di Laurea in Ingegneria Meccanica Matematica 1 - Corso di Laurea in Ingegneria Meccanica Esercitazione su massimi e minimi vincolati 9 dicembre 005 Esercizio 1. Considerare l insieme C = {(x,y) R : (x + y ) = x } e dire se è una curva

Dettagli

1. PRIME PROPRIETÀ 2

1. PRIME PROPRIETÀ 2 RELAZIONI 1. Prime proprietà Il significato comune del concetto di relazione è facilmente intuibile: due elementi sono in relazione se c è un legame tra loro descritto da una certa proprietà; ad esempio,

Dettagli

OSSERVAZIONI TEORICHE Lezione n. 4

OSSERVAZIONI TEORICHE Lezione n. 4 OSSERVAZIONI TEORICHE Lezione n. 4 Finalità: Sistematizzare concetti e definizioni. Verificare l apprendimento. Metodo: Lettura delle OSSERVAZIONI e risoluzione della scheda di verifica delle conoscenze

Dettagli

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora:

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora: Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora: G.C.D.( a d, b d ) = 1 Sono state introdotte a lezione due definizioni importanti che ricordiamo: Definizione

Dettagli

Logica Numerica Approfondimento 1. Minimo Comune Multiplo e Massimo Comun Divisore. Il concetto di multiplo e di divisore. Il Minimo Comune Multiplo

Logica Numerica Approfondimento 1. Minimo Comune Multiplo e Massimo Comun Divisore. Il concetto di multiplo e di divisore. Il Minimo Comune Multiplo Logica Numerica Approfondimento E. Barbuto Minimo Comune Multiplo e Massimo Comun Divisore Il concetto di multiplo e di divisore Considerato un numero intero n, se esso viene moltiplicato per un numero

Dettagli

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme G Pareschi Principio di induzione Il Principio di Induzione (che dovreste anche avere incontrato nel Corso di Analisi I) consente di dimostrare Proposizioni il cui enunciato è in funzione di un numero

Dettagli

Teoria delle code. Sistemi stazionari: M/M/1 M/M/1/K M/M/S

Teoria delle code. Sistemi stazionari: M/M/1 M/M/1/K M/M/S Teoria delle code Sistemi stazionari: M/M/1 M/M/1/K M/M/S Fabio Giammarinaro 04/03/2008 Sommario INTRODUZIONE... 3 Formule generali di e... 3 Leggi di Little... 3 Cosa cerchiamo... 3 Legame tra N e le

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Indice. 1 Il monitoraggio del progetto formativo --------------------------------------------------------------- 3. 2 di 6

Indice. 1 Il monitoraggio del progetto formativo --------------------------------------------------------------- 3. 2 di 6 LEZIONE MONITORARE UN PROGETTO FORMATIVO. UNA TABELLA PROF. NICOLA PAPARELLA Indice 1 Il monitoraggio del progetto formativo --------------------------------------------------------------- 3 2 di 6 1 Il

Dettagli

Come visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1)

Come visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1) Transitori Analisi nel dominio del tempo Ricordiamo che si definisce transitorio il periodo di tempo che intercorre nel passaggio, di un sistema, da uno stato energetico ad un altro, non è comunque sempre

Dettagli

La variabile casuale Binomiale

La variabile casuale Binomiale La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

1. Limite finito di una funzione in un punto

1. Limite finito di una funzione in un punto . Limite finito di una funzione in un punto Consideriamo la funzione: f ( ) = il cui dominio risulta essere R {}, e quindi il valore di f ( ) non è calcolabile in =. Quest affermazione tuttavia non esaurisce

Dettagli

CAPITOLO 16 SUCCESSIONI E SERIE DI FUNZIONI

CAPITOLO 16 SUCCESSIONI E SERIE DI FUNZIONI CAPITOLO 16 SUCCESSIONI E SERIE DI FUNZIONI Abbiamo studiato successioni e serie numeriche, ora vogliamo studiare successioni e serie di funzioni. Dato un insieme A R, chiamiamo successione di funzioni

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

Forze come grandezze vettoriali

Forze come grandezze vettoriali Forze come grandezze vettoriali L. Paolucci 23 novembre 2010 Sommario Esercizi e problemi risolti. Per la classe prima. Anno Scolastico 2010/11 Parte 1 / versione 2 Si ricordi che la risultante di due

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Convertitori numerici in Excel

Convertitori numerici in Excel ISTITUTO DI ISTRUZIONE SUPERIORE G. M. ANGIOY CARBONIA Convertitori numerici in Excel Prof. G. Ciaschetti Come attività di laboratorio, vogliamo realizzare dei convertitori numerici con Microsoft Excel

Dettagli

11. Analisi statistica degli eventi idrologici estremi

11. Analisi statistica degli eventi idrologici estremi . Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte

Dettagli

11) convenzioni sulla rappresentazione grafica delle soluzioni

11) convenzioni sulla rappresentazione grafica delle soluzioni 2 PARAGRAFI TRATTATI 1)La funzione esponenziale 2) grafici della funzione esponenziale 3) proprietá delle potenze 4) i logaritmi 5) grafici della funzione logaritmica 6) principali proprietá dei logaritmi

Dettagli

Corrispondenze e funzioni

Corrispondenze e funzioni Corrispondenze e funzioni L attività fondamentale della mente umana consiste nello stabilire corrispondenze e relazioni tra oggetti; è anche per questo motivo che il concetto di corrispondenza è uno dei

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA

ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA Francesco Bottacin Padova, 24 febbraio 2012 Capitolo 1 Algebra Lineare 1.1 Spazi e sottospazi vettoriali Esercizio 1.1. Sia U il sottospazio di R 4 generato dai

Dettagli

Studio di una funzione ad una variabile

Studio di una funzione ad una variabile Studio di una funzione ad una variabile Lo studio di una funzione ad una variabile ha come scopo ultimo quello di pervenire a un grafico della funzione assegnata. Questo grafico non dovrà essere preciso

Dettagli

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una

Dettagli

2. Leggi finanziarie di capitalizzazione

2. Leggi finanziarie di capitalizzazione 2. Leggi finanziarie di capitalizzazione Si chiama legge finanziaria di capitalizzazione una funzione atta a definire il montante M(t accumulato al tempo generico t da un capitale C: M(t = F(C, t C t M

Dettagli

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Nome N. Matricola Ancona, 14 luglio 2015 1. Tre macchine producono gli stessi pezzi

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 28/05/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Nel gico del

Dettagli

4. Operazioni elementari per righe e colonne

4. Operazioni elementari per righe e colonne 4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

LA TRASMISSIONE DELLE INFORMAZIONI QUARTA PARTE 1

LA TRASMISSIONE DELLE INFORMAZIONI QUARTA PARTE 1 LA TRASMISSIONE DELLE INFORMAZIONI QUARTA PARTE 1 I CODICI 1 IL CODICE BCD 1 Somma in BCD 2 Sottrazione BCD 5 IL CODICE ECCESSO 3 20 La trasmissione delle informazioni Quarta Parte I codici Il codice BCD

Dettagli

Esercitazione n.2 Inferenza su medie

Esercitazione n.2 Inferenza su medie Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione

Dettagli

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

Schemi delle Lezioni di Matematica Generale. Pierpaolo Montana

Schemi delle Lezioni di Matematica Generale. Pierpaolo Montana Schemi delle Lezioni di Matematica Generale Pierpaolo Montana Al-giabr wa al-mukabalah di Al Khuwarizmi scritto approssimativamente nel 820 D.C. Manuale arabo da cui deriviamo due nomi: Algebra Algoritmo

Dettagli

Teoria dei Giochi. Anna Torre

Teoria dei Giochi. Anna Torre Teoria dei Giochi Anna Torre Almo Collegio Borromeo 14 marzo 2013 email: anna.torre@unipv.it sito web del corso:www-dimat.unipv.it/atorre/borromeo2013.html IL PARI O DISPARI I II S T S (-1, 1) (1, -1)

Dettagli

CALCOLO COMBINATORIO

CALCOLO COMBINATORIO CALCOLO COMBINATORIO 1 Modi di formare gruppi di k oggetti presi da n dati 11 disposizioni semplici, permutazioni Dati n oggetti distinti a 1,, a n si chiamano disposizioni semplici di questi oggetti,

Dettagli

SISTEMI DI NUMERAZIONE E CODICI

SISTEMI DI NUMERAZIONE E CODICI SISTEMI DI NUMERAZIONE E CODICI Il Sistema di Numerazione Decimale Il sistema decimale o sistema di numerazione a base dieci usa dieci cifre, dette cifre decimali, da O a 9. Il sistema decimale è un sistema

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale Corso di Scienza Economica (Economia Politica) prof. G. Di Bartolomeo Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale Facoltà di Scienze della Comunicazione Università di Teramo Scelta

Dettagli

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione SISTEMI INFORMATIVI AVANZATI -2010/2011 1 Introduzione In queste dispense, dopo aver riportato una sintesi del concetto di Dipendenza Funzionale e di Normalizzazione estratti dal libro Progetto di Basi

Dettagli

Il principio di induzione e i numeri naturali.

Il principio di induzione e i numeri naturali. Il principio di induzione e i numeri naturali. Il principio di induzione è un potente strumento di dimostrazione, al quale si ricorre ogni volta che si debba dimostrare una proprietà in un numero infinito

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Capitolo 4 Probabilità

Capitolo 4 Probabilità Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 4 Probabilità Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli