Appunti: Teoria Dei Test

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Appunti: Teoria Dei Test"

Transcript

1 Appunti: Teoria Dei Test Fulvio De Santis, Luca Tardella e Isabella Verdinelli Corsi di Laurea A + E + D + G + R 1. Introduzione. Il test d ipotesi è un area dell inferenza statistica in cui si valuta una congettura (ipotesi) riguardo un parametro θ della popolazione, sulla base di dati campionari. La congettura che si vuole valutare si chiama ipotesi nulla e viene indicata con H 0. I dati del campione sono raccolti ed analizzati per determinare l evidenza contro l ipotesi nulla. Se l evidenza solleva dubbi sulla plausibilità dell ipotesi nulla, questa viene rifiutata in favore dell ipotesi alternativa. L ipotesi alternativa è indicata con H 1 (o con H a ) e rappresenta quello che si pensa possa essere vero se l ipotesi nulla è falsa. L Inferenza Statistica considera due metodi principali per affrontare il problema: l approccio basato sulle regioni di accettazione e di rifiuto, trattato nel paragrafo 5, e l approccio basato sul valore-p, esaminato nei paragrafi 2, 3 e 4 qui di seguito. Si vedrà che i due metodi sono equivalenti ed utilizzano le distribuzione campionarie di appropriate Statistiche Test, quando si assume vera l ipotesi nulla (H 0 ) individuata dal problema in esame. 2. Concetti di base per il metodo del valore-p. Il valore-p è largamente usato nelle procedure di test d ipotesi, anche se il suo utilizzo è oggetto di critiche, dovute principalmente alle confusioni che possono sorgere nella sua interpretazione. In modo non rigoroso, la motivazione del metodo può essere giustificata attraverso la seguente affermazione: Se, sotto una data assunzione, la probabilità dell evento osservato, (o di un evento più estremo), è molto piccola, allora è plausibile che l assunzione fatta non sia corretta. L idea di base nell attivare una procedura di test d ipotesi è quella di raccogliere ed analizzare un campione, per poter distinguere tra risultati che si verificano facilmente e risultati che sono molto improbabili Esempio 1. Lancio di una Moneta. Affermazione 1: La moneta è bilanciata (H 0 ) Affermazione 2: La moneta favorisce testa (H 1 ) Si consideri un campione di 100 lanci della moneta in questione e si supponga di osservare il risultato: 96 teste e 4 croci. 1

2 Se L Affermazione 1 (H 0 ) fosse vera, sarebbe plausibile aver ottenuto questi dati? Se L Affermazione 2 (H 1 ) fosse vera, sarebbe plausibile aver ottenuto questi dati? Dopo aver osservato i dati vogliamo trarre una conclusione riguardo la moneta lanciata. Il parametro della popolazione è π = P(ottenere testa). Le ipotesi che consideriamo sono: H 0 : π = 1/2 H 0 : π > 1/2 Che conclusione si può trarre una volta visti i dati? H 0 oppure H 1? Se la moneta fosse bilanciata sarebbe plausibile ottenere il risultato: 96 teste su 100 lanci? Ovviamente No Conclusione: La moneta non è bilanciata perché i dati non sono compatibili con l ipotesi H 0 : π = 1/2 (moneta bilanciata). Queste considerazioni intuitive devono essere portate avanti attraverso una rigorosa procedura statistica. Innanzitutto è necessario scegliere una statistica test (in questo caso la proporzione di teste nel campione). Poi bisogna valutare la probabilità di osservare lo specifico valore ottenuto della statistica od un valore più estremo, nel caso in cui H 0 sia vera (Ammettendo, cioè, che π sia proprio uguale ad 1/2): P ( Ottenere 96 [o più] teste in 100 lanci ; la moneta è bilanciata ). Indicando con π oss la proporzione di teste osservate nel campione e con Π MLE lo stimatore di massima verosimiglianza per π ( Π MLE = 1 n Xi ), la precedente probabilità si può scrivere come: P ( ΠMLE π oss ; Ammettendo H 0 vera ) = P ( ΠMLE 0.96 ; H 0 vera ) = P ( ΠMLE 0.96 ; π = 1/2 ) ( 1 n ) = P X i 0.96 ; π = 1/2 = n i=1 ( 100 ) 100 ( )( ) nx ( ) 100 nx P X i 96 ; π = 1/2 = = nx 2 2 i=1 nx=96 E il valore trovato è la corretta valutazione probabilistica che giustifica la conclusione tratta precedentemente in modo intuitivo. Condurre un test di ipotesi in statistica significa valutare probabilisticamente se, partendo dal campione osservato, sia sensato accettare o rifiutare una congettura riguardante un parametro della popolazione. Esempio 2. Cereali. Il peso dichiarato su una scatola di cereali è di 420 grammi. Questo valore è un peso di riferimento che il produttore certifica come peso dei cereali contenuti in ogni scatola messa in commercio. Dunque 420 è il peso medio (netto) di tutte la scatole di cereali di questa marca. È noto che il processo di produzione ha una certa variabilità, e si assume che 2

3 il peso dei cereali in ogni scatola, estratta in un campione casuale di scatole, sia una variabile aleatoria normale di media θ e di varianza considerata, per semplicità, nota, σ 2 = 25. Si assume quindi che la deviazione standard nella determinazione del peso alla produzione sia σ = 5 grammi. Con una procedura casuale, si sceglie un campione di n = 9 scatole di cereali x oss = (x 1, x 2,, x 9 ). In base al particolare campione osservato, vogliamo valutare se la dichiarazione del produttore θ = 420 sia vera o falsa. Vogliamo quindi verificare se sia vera l ipotesi nulla: H 0 : θ = 420 oppure se l ipotesi nulla è falsa ed il peso medio alla produzione è più basso del dichiarato, ed è vera l ipotesi alternativa: H 1 : θ < 420. La notazione statistica è: H 0 : θ = θ 0 contro H 1 : θ < θ 0 dove θ 0 = 420. Per condurre il test d ipotesi e scegliere tra H 0 ed H 1 è necessario: basare l analisi sul campione osservato; utilizzare la distribuzione campionaria dello stimatore θ di θ, quando si assume H 0 vera; valutare la probabilità che lo stimatore θ assuma un valore uguale o più estremo della stima di θ ottenuta con x oss. In questo esempio lo stimatore di θ è θmle = X. Consideriamo due diversi valori possibili di x, ottenuti da due diversi campioni osservati. (a) Supponiamo che si sia osservato x = 416 grammi: Se il peso alla produzione fosse effettivamente 420, si deve valutare se sia facile (molto probabile) o difficile (poco probabile) che il peso medio di 9 scatole sia uguale a 416, e che quindi la distanza tra x e θ 0 (da standardizzare con lo scarto quadratico medio) sia pari a = 4σ X grammi. La procedura statistica richiede di calcolare la probabilità dell evento: P ( X 416 ; Ammettendo H 0 vera ) ( X θ0 = P ( X θ0 P σ/ n < 416 θ ) ( 0 σ/ n ; θ 0 = 420 = P Z < P ( Z < 12/5 ) = pnorm( 12/5) = σ X < 416 θ 0 σ X ; θ 0 = /3 ) = ) = (1) dove Z N(0, 1): Questa probabilità è piuttosto bassa e suggerisce di rifiutare H 0. 3

4 (b) Supponiamo, invece, che si sia osservato x = 419 grammi: Se il peso alla produzione fosse effettivamente 420 si deve valutare se sia facile (molto probabile) o difficile (poco probabile) che il peso medio di 9 scatole sia uguale a 419. Calcoliamo la probabilità di osservare questo valore x = 419 o un valore più piccolo (più estremo): P ( X 419 ; Ammettendo H 0 vera ) ( X θ0 = P ( X θ0 P σ/ n < 419 θ ) ( 0 σ/ n ; θ 0 = 420 = P Z < P ( Z < 3/5 ) = pnorm( 3/5) = σ X < 419 θ 0 σ X ; θ 0 = /3 ) = ) = (2) Questa probabilità non è elevata, ma è decisamente maggiore della probabilità calcolata supponendo x = 416. Potrebbe essere opportuno non rifiutare H 0. L affermazione a pagina 1 suggerisce di rifiutare H 0 nel caso del campione osservato con media x = 416 e di conservare H 0 nel caso del campione osservato con media x = 419. Chiaramente è necessario disporre di un valore di riferimento che permetta di valutare le probabilità calcolate come alte o basse. 3. Livello di significatività e valore-p. Il valore di riferimento per giudicare la dimensione delle probabilità che si valutano in una procedura di test d ipotesi è una probabilità α, detta livello di significatività che si utilizza come quantità di confronto. Il livello di significatività viene scelto pari ad un valore abbastanza piccolo. Valori tipici sono α = 0.05 oppure α = I valori delle probabilità calcolate in (1) e in (2), devono quindi essere dichiarati grandi o piccoli rispetto ad α. La procedura di calcolo per valutare (1) o (2) è la stessa, cambia solamente il campione osservato nei due casi, e quindi cambia il valore della statistica x, media del campione. La probabilità calcolata nelle due formule è la probabilità che la variabile aleatoria X, media campionaria, assuma un valore uguale o più piccolo del valore osservato di x, ammettendo che l ipotesi nulla sia vera. In questo esempio, quando la media del campione è x = 416, la probabiilità dell evento E = X < x H 0 è vera} vale Se invece il la media del campione è x = 419, lo stesso evento E = X < x H 0 è vera} ha probabilità Supponiamo di aver fissato α = 0.05: se nel campione osservato la media x è = 416, la probabilità calcolata è < α; se invece nel campione osservato x = 419, la probabilità calcolata è > α. In questa procedura per condurre un test ipotesi, si devono calcolare i valori delle probabilità di eventi analoghi all evento E. Le probabilità in questione sono chiamate valori-p. Il valore-p è una probabilità che misura l evidenza dei dati contro l ipotesi nulla H 0. Valori-p piccoli (minori di α) indicano che l evidenza proveniente dai dati è contraria ad H 0. Si dice che c è evidenza statisticamente significativa contraria ad H 0. In questo caso l ipotesi nulla H 0 viene rifiutata. 4

5 Valori-p grandi (maggiori di α) indicano che l evidenza dei dati non è contraria ad H 0. Si dice che c è evidenza statisticamente significativa a favore di H 0. L ipotesi nulla viene quindi conservata o non rifiutata. Il livello di significatività α è una probabilità di riferimento che permette di decidere se il valore-p è grande o piccolo. La figura 1, qui di seguito, illustra l Esempio 2, nel caso x = 416 dove la valutazione della probabilità in (1) porta a rifiutare H 0. densita' della media campionaria densita' della normale stanzardizz x.oss x* theta0=420 z.oss. z* 0 Peso delle scatole di cereali Peso standardizzato scatole cereali Fig. 1 Sinistra: Distribuzione campionaria di X ammettendo H 0 vera}. Si è osservato il valore x = 416, indicato nel grafico come x.oss. Destra: Distribuzione normale standardizzata. Il valore z.oss è x.oss θ ottenuto standardizzando x.oss: 0 σ/ = = 2.4. n 5/3 A sinistra nella Fig 1 è riportato il grafico della distribuzione campionaria di X, sotto l ipotesi nulla, cioè assumendo che θ 0 sia vera e quindi che (X ; θ = θ 0 ) N(θ 0, 25/n), o, più esplicitamente (X ; θ = 420) N(420, 25/n). Nel calcolo in (1), infatti, si è utilizzata la distribuzione campionaria dello stimatore θ = X condizionata al fatto che H 0 è vera}, X N(θ 0, 25/n), perchè il processo di produzione che pesa ed inscatola i cereali segue una distribuzione normale con X N(θ, 25). I tre triangoli rossi in Fig 1 (sinistra) indicano, rispettivamente, il valore osservato della media, x = 416 (x.oss), il valore (indicato con x ) del quantile della distribuzione campionaria di X che lascia alla sua sinistra una probabilità pari ad α = 0.05: x = ed il valore della media della distribuzione campionaria di X, condizionata all ipotesi H 0 è vera}. L area in verde al disotto della densità normale è proprio il valore-p, cioè la probabilità: P ( X 416 ; θ = 420 ), che viene calcolata formalmente nella (1) standardizzando la distribuzione normale di X. In questo modo, se necessario, si possono utilizzare le tavole della normale standardizzata Z. In pratica è spesso più immediato usufruire del comando R: dnorm(x.oss,theta0, sigma/sqrt(n)) = dnorm(416, 420, 5/3) =

6 Il grafico a destra in Fig 1 è la distribuzione della variabile normale standardizzata Z. Il valore z.oss. = x θ 0 σ/ n = 2.4 è il valore standardizzato (sotto l ipotesi H 0) corrispondente ad x.oss. Il valore-p, per la normale standardizzata è l area in verde nel grafico a destra, che è chiaramente identica all area in verde nel grafico a sinistra. Il valore α = 0.05 nei due grafici di Fig 1 è dato dall unione delle due aree in verde ed in rosso. Il valore-p (in verde) è, evidentemente, più piccolo di α. La figura 2, qui sotto, illustra l Esempio 2, nel caso x = 419 dove la valutazione della probabilità in (2) porta a non rifiutare (o conservare) H 0. densita' della media campionaria densita' della normale stanzardizz x* Peso delle scatole di cereali z* z.oss 0 Peso standardizzato scatole cereali Fig. 2 Sinistra: Distribuzione campionaria di X condizionata all evento H 0 è vera}. Si è osservato il valore x = 419. Destra: Distribuzione normale standardizzata. Il valore z.oss= = /3 Il calcolo della probabilità (2) per l Esempio 2 è simile al precedente. In figura 2, analogamente a figura 1, sono riportati i grafici della distribuzione campionaria di X, sotto l ipotesi nulla, e della distribuzione della variabile aleatoria normale standardizzata. In questo caso la media del campione x è 419 grammi ed il valore-p, calcolato in (2), è: P ( X 419 ; θ = 420 ) = Nei due grafici, il valore-p è l area a sinistra di x = 419 o di z.oss = = 3/5 ed è 5/3 rappresentato dall unione dell area verde e di quella rossa. L area rossa, a sinistra di x = qnorm(0.05,θ 0, σ/ n) = e di z = qnorm(0.05) = è α = In questo caso il valore-p è maggiore di α. 6

7 Alcuni Commenti sull uso del valore-p Nel confronto del valore-p con il livello di significatività α si possono ottenere due risultati: (a) l ipotesi nulla è rifiutata al livello scelto di α (b) l ipotesi nulla non può essere rifiutata al livello scelto di α (e viene quindi conservata). Non si può semplicemente accettare H 0 se il valore-p > α. Per l accettazione di H 0 è necessario accumulare ulteriore evidenza e considerare altri test come, per esempio, test sulla bontà di adattamento Il valore-p non misura la probabilità che H 0 sia vera. Ma misura la probabilità che la variabile aleatoria X assuma un valore uguale o più estremo di quello osservato. (e quindi misura la probabilità che l ipotesi nulla possa spiegare il risultato ottenuto con x oss ). Esercizi 1. Con riferimento all Esempio 2. Si ritiene possibile che la bilancia utilizzata nella produzione dei cereali sia stata mal tarata, dopo l ultima pulizia dei macchinari. Si estrae un campione casuale di 9 scatole di cereali. Il peso medio nel campione è: x = 423 grammi. Si vuole testare il seguente sistema di ipotesi: H 0 : θ = θ 0 = 420 contro H 1 : θ > θ 0 = 420. Calcolare il valore-p, cioè la probabilità che, se l ipotesi nulla è vera, la variabile aleatoria X assuma valore uguale o più grande di x. Effettuare il test d ipotesi fissando α = Sia noto che in Germania la proporzione media di giovani tra i 12 ed i 18 anni che utilizza regolarmente un computer si distribuisce normalmente con media θ = 3/4 = 0.75 e varianza σ 2 = In un campione casuale di n = 144 ragazzi e ragazze italiani tra i 12 ed i 18 anni si è rilevato che la media campionaria è pari a x = Condurre un test d ipotesi a livello α = 0.05 per verificare l affermazione che in Italia la proporzione di giovani tra i 12 e i 18 anni che usano il computer con regolarità è minore di quella tedesca. 4. Procedura di base per condurre un test d ipotesi Facendo riferimento all Esercizio 1 stabiliamo ora, con maggior precisione, quali sono i punti essenziali per condurre un Test d ipotesi o Test di Significatività. 7

8 1. Fissare le ipotesi: Ipotesi Nulla Ipotesi Alternativa H 0 : θ = 420 (θ 0 ) (Parametro d interesse = valore) H 1 : θ > 420 (Parametro d interesse > di valore) 2. Raccogliere i dati e calcolare il valore osservato della statistica test: Nell Esercizio 1, x = 423, n = 9. Si usa la media campionaria come statistica test (è una statistica sufficiente per θ) e la sua distribuzione campionaria. Per misurare la distanza tra i dati e l ipotesi nulla si standardizza X usando la sua deviazione standard. La variabile aleatoria che si ottiene è la quantità pivotale Q(X, θ 0 ) calcolata in θ = θ 0, la cui distribuzione non dipende dal parametro. Il valore osservato della quantità pivotale z.oss = q(x, θ 0 ) = è: z.oss = x θ 0 σ/ n = / 9 = Calcolare il valore-p : Il valore-p si calcola utilizzando la distribuzione campionaria della quantità pivotale Q(X, θ 0 ) valutata in θ 0. Si calcola cioè la probabilità di ottenere lo specifico valore osservato per la statistica test (z.oss = 1.8) oppure un valore più estremo, ammettendo che H 0 sia vera}. Se è vera H 0 : θ = θ 0, la distribuzione campionaria della media X è: ( ) σ X N θ 0, e la distribuzione di Z = Q(X, θ 0 ) = (X θ 0) n σ/ n N(0, 1). In questo caso l ipotesi alternativa è H 1 : θ > θ 0. Si calcola quindi la probabilità che la v.a. media campionaria sia uguale o maggiore del valore osservato nel campione, x = 423. valore-p = P ( X x ; Ammettendo H 0 vera ) = P ( X θ0 σ/ n x θ ) 0 σ/ = n ( ) X θ0 P σ/ n z.oss = P (Z 1.8) = 1 pnorm(1.8) = = Il valore-p risulta minore del livello di significatività scelto, α = Trarre Conclusioni. Relativamente al livello α scelto, i dati forniscono evidenza contro H 0, a favore dell ipotesi alternativa H 1. C è evidenza statisticamente significativa contraria ad H 0 a livello α = Si conclude che La bilancia utilizzata nella produzione dei cereali è mal tarata con un livello di significatività pari a

9 5. Regione di accettazione e regione di rifiuto. Un altro metodo per condurre un test ipotesi è quello di definire due regioni nello spazio dei campioni o, più semplicemente, nello spazio in cui varia la statistica test. Partendo dal livello di significatività fissato, si individuano una Regione di Rifiuto (RR) ed una Regione di Accettazione (RA). L ipotesi H 0 verrà rifiutata o conservata a livello di significatività α, controllando se il valore osservato della statistica test ottenuto con x oss appartiene alla regione di rifiuto, oppure a quella di accettazione. In figura 3 sono evidenziate la regione di accettazione (in blu) e di rifiuto (in rosso) per l Esempio 2 e per l Esercizio 1. densita' della media campionaria x* Esempio 2 densita' della media campionaria Esercizio 1 x* 423 Peso delle scatole di cereali Peso delle scatole di cereali Fig. 3 Sinistra: Regione di accettazione (in blu) e regione di rifiuto (in rosso) per il test d ipotesi: H 0 : θ = θ 0 = 420 H 1 : θ < θ 0 = 420 e nel campione si è osservato x = 416. Destra: Regione di accettazione (in blu) e regione di rifiuto (in rosso) per il test d ipotesi: H 0 : θ = θ 0 = 420 H 1 : θ > θ 0 = 420 e nel campione si è osservato nel campione x = 423. Nei due grafici il valore osservato di x cade nella regione di rifiuto. Le due regioni sono legate strettamente al valore scelto per α: La Regione di Rifiuto è l intervallo dei valori della statistica test che determinano il livello di significatività α. La Regione di Accettazione è l intervallo complementare alla regione di rifiuto. Dai grafici di figura 3 si vede che valori di x maggiori di x nel grafico a sinistra o minori di x nel grafico a destra appartengono alla regione di accettazione; valori di x minori di x nel grafico a sinistra o maggiori di x nel grafico a destra appartengono alla regione di rifiuto. Dal momento che il valore di x.bar = x (416 nell esempio 2 e 423 nell esercizio 1) è il valore del quantile che identifica il valore-p, questa procedura è equivalente a quella illustrata nei paragrafi precedenti. Alternativamente, le regioni di accettazione e di rifiuto possono essere identificate anche utilizzando la variabile aleatoria normale standardizzata Z, ovvero la quantità pivotale calcolata in θ 0 ed il valore osservato della quantità pivotale q(x oss, θ 0 ) = z.oss = x θ 0 σ/ n. 9

10 Esempio 3. Spesa Alimentare. Consideriamo, come in precedenza, un modello normale con varianza nota. Per un campione casuale di n = 100 famiglie con non più di quattro componenti, si consideri la variabile aleatoria X = spesa media alimentare per settimana. Il campione viene esaminato per verificare se la spesa media per alimenti sia diversa da θ 0 = 600 Euro, ad un livello di significatività α = 0.05 e si assume che il valore dello scarto quadratico medio sia σ 0 = 30 Euro. Supponiamo che la media del campione x oss sia x = Il sistema di ipotesi da porre a confronto è bilaterale, e cioè: Ipotesi nulla H 0 : θ = θ 0 = 600 Ipotesi alternativa: H 1 : θ θ 0 = 600. (3) La distribuzione campionaria della statistica test θ MLE = X è N(θ, σ 2 0/n). Dato che il sistema di ipotesi in (3) è bilaterale, appare ragionevole scegliere come regione di rifiuto un insieme di valori di X che siano lontani da θ 0. Quindi la regione di rifiuto sarà del tipo: RR = X X n : X θ 0 > c } Il valore di c > 0 viene determinato richiedendo che α = P RR } = P X θ 0 > c } X θ 0 = P σ 0 / n > P (Z < k) (Z > k) } = k ϕ(z)dz + k } c σ 0 / = P Z > k } = n ϕ(z)dz k = z 1 α/2 dove ϕ( ) è la funzione di densità della normale standardizzata. Da (4) si ottengono la regione di rifiuto e quella di accettazione, e si ricava che c = z 1 α/2 σ 0 / n. } RR = X X n : X θ 0 σ 0 / n > z 1 α/2 ( X < z 1 α/2 σ 0 / ) ( n + θ 0 X > z1 α/2 σ 0 / )} n + θ 0 } RA = X X n : X θ 0 σ 0 / n z 1 α/2 z 1 α/2 σ 0 / n + θ 0 X z 1 α/2 σ 0 / } n + θ 0. Nell esempio RR = ( X < 1.96 (3) ) ( X > 1.96 (3) )} = ( X < ) ( X > ) } e dato che x = l ipotesi nulla viene conservata. Nei due grafici della figura 4 sono rappresentate la regione di rifiuto e quella di accettazione, nel caso dell ipotesi bilaterale (3) e nel caso in cui, invece per lo stesso livello α = 0.05 fosse stato deciso di portare aventi un test unilaterale del tipo: H 0 : θ = θ 0 = 600 contro H 1 : θ > θ 0 = 600, (5) con la media del campione osservato x oss ancora uguale a Come visto in precedenza, la regione di rifiuto per l ipotesi unilaterale (5) diventa: RR = X > z 1 α σ 0 / n + θ 0 } = X > 1.64 (3) } = X > } E H 0 sarebbe rifiiutata a livello 0.05 in favore di H 1 : La spesa alimentare settimanale per famiglia è maggiore di 600 Euro. (4) 10

11 In figura 4 sono rappresentate le regioni di accettazione e di rifiuto dell esempio 3 per i due sistemi di ipotesi bilaterali e unilaterali fissate nelle equazioni (3) e (5). Il valore x.o corrisponde al valore osservato della media del campione x = L ipotesi H 0 è conservata nel caso (3) e rifiutata nel caso (5). densita' della media campionaria Esempio x.o Media campionaria: Spesa media settimanale per famiglia densita' della media campionaria x.o Media campionaria: Spesa media settimanale per famiglia Fig. 4 In Alto: Regioni di accettazione di rifiuto (rosso) per il test d ipotesi bilaterale in (3). In Basso: Regioni di accettazione e di rifiuto per il test di ipotesi unilaterale in (5) Per il sistema di ipotesi in (3) l area α = 0.05 che determina la regione di accettazione è divisa a metà (α/2) tra le due code della distribuzione di X. Invece per il sistema di ipotesi in (5) l area α = 0.05 interessa solo la coda destra. La somiglianza tra un test d ipotesi bilaterale e la costruzione di un intervallo di confidenza è evidente dalla figura 4 in alto. L intervallo che rappresenta l area di accettazione corrisponde di fatto ad un intervallo di confidenza per θ a livello 1 α = Ricordiamo che il valore-p è la probabilità che la variabile aleatoria (in questo caso la quantità pivotale Z ) assuma valore uguale o più estremo di quello osservato, ammettendo H 0 vera} (pag. 4). Allora il valore-p nel caso di ipotesi bilaterale, si calcola con la distribuzione della quantità pivotale e si valuta la probabilità che Z sia maggiore o uguale al valore pivotale osservato z.o = x θ 0 σ 0 / n = ( )/3 = 1.83 X θ 0 valore-p = P σ 0 / n x θ 0 σ 0 / n }= P } z.o Z z.o = ϕ(z)d(z) + = pnorm( z.o) + 1 pnorm(z.o) = 2 ( 1 pnorm(1.83) ) = > α. z.o ϕ(z)d(z) 11

12 7. Errori di I e di II specie. Ogni volta che si prende una decisione in una procedura statistica di test d ipotesi si possono commettere due tipi di errore, che vengono indicati come errori di I e di II specie. Errore di Prima Specie: consiste nel rifiutare l ipotesi nulla quando, in realtà, è vera. (x oss RR, ma H o è vera). Errore di Seconda Specie: consiste nell accettare l ipotesi nulla che in realtà è falsa. (x oss RA, ma H 1 è vera). Questo è lo schema degli errori che si possono commettere in una procedura statistica di test d ipotesi: Ipotesi Vera H 0 H 1 Ipotesi H 0 Err. I specie Scelta H 1 Err. II specie Questi errori sono sempre possibili. L ideale sarebbe poter minimizzare le rispettive probabilità di commetterli. La procedura vista, però, permette solo di determinare RA e RR utilizzando il livello α scelto. Dato che per definizione α = PRR ; H 0 vera}, allora la probabilità dell errore di I specie è data proprio da α. La probabilità dell errore di II specie viene indicata con β. Si definiscono le seguenti probabilità: α = P x oss RR ; H 0 vera } = P Errore I specie } = Livello del test β = P x oss RA ; H 1 vera } = P Errore II specie } γ = 1 β = P x oss RR ; H 1 vera } = 1 P Errore II specie } = Potenza del test Il test migliore che si può condurre è quello che ha un livello basso ed una poternza alta, così da avere basse le probabilità di commettere un errore di prima o di seconda specie. Generalizzando quanto visto fino qui, i sistemi di ipotesi da porre a verifica statistica possono essere specificati introducendo una partizione dello spazio dei parametri Θ. Si considerano, cioè, due sottoinsiemi dello spazio dei parametri Θ 0 e Θ 1 tali che: θ 0 Θ 1 = Θ e che θ 0 Θ 1 =. Un sistema di ipotesi in generale si scrive come: Ipotesi Nulla. H 0 : θ Θ 0 Contro Ipotesi Alternativa. H 1 : θ Θ 1 Si parla di ipotesi semplici o puntuali se Θ 0 = θ 0 e Θ 1 = θ 1 ed il test riguarda due singoli valori possibili per il parametro: H 0 : θ = θ 0 H 1 : θ = θ 1. 12

13 Si parla di ipotesi composte quando Θ 0 e Θ 1 sono insiemi di più punti. composte si hanno: H 0 : θ > θ 0 H 0 : θ < θ 0 Ipotesi composte unilaterali: e H 1 : θ θ 0 Ipotesi unilaterali: semplice contro composta: Ipotesi bilaterali: semplice contro composta: H 1 : θ θ 0 H 0 : θ = θ 0 H 1 : θ θ 0 H 0 : θ = θ 0 H 1 : θ θ 0. e Tra le ipotesi H 0 : θ = θ 0 H 1 : θ θ 0 densita' theta0 x* theta1 Media campionaria Fig. 5 Test di ipotesi semplici. L area in verde è β quella in rosso è α. La potenza del test è rappresentata dall area sottostante la curva verde a destra di x. Nel caso di un test di ipotesi semplici, sia β che la potenza del test dipendono solamente dal valore fissato per α, in tutti gli altri casi sono funzioni dei valori di θ Θ 1. In generale, allora, è necessario determinare procedure di test d ipotesi che permettano di ottenere valori bassi sia della probabilità α dell errore di I specie, che della probabilità β dell errore di II specie. Il grafico in figura 5 mostra α (area in rosso) e β (area in verde) per un caso di un sistema di test di ipotesi semplici per scegliere tra H 0 : θ = θ 0 contro H 1 : θ = θ 1 dove θ è la media di una variabile aleatoria normale con varianza nota. Il test statistico deve scegliere tra l ipotesi nulla che il campione osservato x oss provenga da X N(θ 0, σ 2 0) o l ipotesi alternativa che provenga da X N(θ 1, σ 2 1) con θ 0 < θ 1 ed entrambe le varianze note. Chiaramente se α fosse stato scelto più piccolo del valore 0.05, fissato in figura 5 il valore x sarebbe spostato verso destra aumentando il valore di β e diminuendo la potenza del test. 13

14 I grafici in figura 6 mostrano la probabilità dell errore di seconda specie e la potenza del test in funzione del valore di θ Θ 1, considerando, come nel caso precedente, un sistema di ipotesi unilaterali semplice contro composta: Θ 0 = θ 0 e Θ 1 = θ > θ 0 }, dove θ è la media di una distribuzione normale con varianza nota: H 0 : θ = θ 0 contro H 1 : θ > θ 0 densita' θ 0 θ v.a. Media Campionaria Beta densita' θ 0 θ v.a. Media Campionaria Potenza Fig. 6. Test di ipotesi unilaterali, semplice contro composta. Funzioni di densità di X. La funzione rossa rappresenta il caso H 0 vera, θ = θ 0. Le altre cinque funzioni colorate rappresentano cinque possibilità per H 1 vera e θ Θ 1 } θ > θ 0 }. Il grafico in alto mostra, in rosso, l area corrispondente ad α e in viola, verde e giallo le aree corrispondenti a β(θ), dove θ è la media delle tre rispettive distribuzioni. Analogamente, il grafico in basso mostra α e le aree corrispondenti alla potenza del test 1 β(θ), dove θ è la media delle due distribuzioni in viola e in giallo. Dalla figura si deduce chiaramente che per α fissato sia la probabilità dell errore di seconda specie, che la potenza del test sono funzioni del valore assunto da θ Θ 1. 14

15 8. Funzione di Potenza di un Test. Si consideri un test con regione di rifiuto RR per un sistema di ipotesi composte, che utilizza una partizione dello spazio dei parametri, per cui: Θ = Θ 0 Θ 1 e Θ 0 Θ 1 = Definizione 4. Funzione di Potenza. si definisce funzione di potenza del test la probabilità, dipendente da θ Θ: γ(θ) = 1 β(θ) = PX RR ; θ Θ}; (6) si definisce dimensione del test la probabilità α = sup θ Θ 0 1 β(θ)} = sup θ Θ 0 γ(θ); si dice che un test ha livello α se la sua dimensione α è minore od uguale ad α. Quindi un test di dimensione α = 0.01 può essere condotto a livello α = 0.05, ma non a livello α = Il grafico in basso nella figura 6 mostra che la dimensione di quel test è α = 1 β(θ 0 ), e dato che in quel caso l ipotesi nulla è semplice (Θ 0 = θ 0 ) si ha che il livello del test è anche uguale alla sua dimensione (α = α). Se invece anche H 0 fosse un ipotesi composta, e Θ 0 fosse, per esempio, un insieme di valori minori o uguali di a θ 0, allora l ipotesi nulla sarebbe rappresentata con più di una curva rossa e l area in rosso sarebbe più grande o più piccole a seconda di quale valore di θ 0 Θ 0 si considera. La minima area in rosso rappresenterebbe la dimensione del test ed i test che si possono condurre dovranno avere livello α α La funzione di potenza di un test può essere valutata analiticamente per sistemi di ipotesi composte unilaterali o bilaterali. La forma analitica della funzione di potenza dipende dalla funzione di ripartizione della statistica test o della corrispondente quantità pivotale. Per illustrazione, consideriamo ancora il caso di un test d ipotesi composte per la media di un modello normale con varianza nota, σ 2. Per questo modello si consideri il seguente sistema di ipotesi: H 0 : Θ 0 θ 0 contro H 1 : Θ 1 > θ 0 (7) Come visto in precedenza, X è la statistica test e la regione di rifiuto di livello α è data da: RR = X X n : X θ } 0 σ/ n > z 1 α. Dalla (6) la funzione di potenza del test è quindi: γ(θ) = 1 β(θ) = P X RR ; θ Θ } = PX > σ/ n z 1 α + θ 0 ; θ Θ } = P X > σ/ } X θ n z 1 α + θ 0 = P σ/ n > z 1 α + θ 0 θ σ/ n ( θ0 θ = 1 Φ σ/ n + z 1 α } = P Zz 1 α + θ } 0 θ σ/ = n ) = 1 pnorm((theta-theta0)/(sigma/sqrt(n) + z 1 α ), 15

16 dove Φ( ) è la funzione di ripartizione di una variabile aleatoria normale standardizzata. Si vede immediatamente che la funzione di potenza dipende da θ Θ e dalla distribuzione (funzione di ripartizione) della quantità pivotale (in questo caso Φ( )). Il grafico in alto nella figura 7 mostra la funzione di potenza γ(θ) del test per il sistema di ipotesi composte unilaterali in (7). La funzione di potenza è rappresentata dalla curva verde; il valore della dimensione del test α si ottiene per θ = θ 0, il valore che separa i due insiemi Θ 0 e Θ 1 ed è infatti α = sup θ Θ0 γ(θ). Il test si conduce, in questo caso, a livello α = α. La regione in blu indica l insieme Θ 1 e quella in rosso l insieme Θ 0. Per θ = θ si raggiunge una potenza pari a 0.8. Potenza α ~ 0.8 Θ 0 θ 0 θ Θ 1 Potenza α ~ = α 0.8 θ 0 θ Θ 1 θ 0 Θ 1 θ 0 + θ Fig. 7 In alto: funzione di potenza di un test di ipotesi composte unilaterali per un modello normale con media θ e varianza nota σ 2. In basso: funzione di potenza di un test di ipotesi bilaterali per un modello normale con media θ e varianza nota σ 2. Per lo stesso modello normale, il grafico in basso mostra la funzione di potenza per il sistema di ipotesi bilaterali H 0 : θ = θ 0 contro H 1 : Θ θ 0. Un calcolo analogo a quello fatto alla fine di pagina 15 mostra che in questo caso la funzione di potenza del test è data da: γ(θ) = 1 β(θ) = P X RR ; θ Θ } ( ) ( ) θ0 θ = 1 Φ σ/ n + z θ0 θ 1 α/2 +Φ σ/ n z 1 α/2. 16

17 Nel grafico l insieme Θ 1 è in blu. Il valore θ 0 è il punto rosso, α = α si ottiene per θ = θ 0 e, data la simmetria della funzione di potenza, il valore 0.8 è raggiunto in due punti dell insieme Θ Lemma di Neyman e Pearson. È importante disporre di procedure di test ipotesi che, una volta scelto il valore di α, permettano di condurre un test con una potenza elevata (o con un valore di β piccolo). Si definisce ottimo un test che, per α fissato ha potenza maggiore o uguale a qualsiasi altro test che ha la stessa probabilità α di un errore di I specie. Teorema 5. (Lemma di Neyman e Pearson) Dato un modello statistico X n, f n (x ; θ), θ Θ } ed un sistema di ipotesi semplici: H 0 : θ = θ 0 contro H 1 : θ = θ 1 la regione di accettazione di un test ottimo è costituita dai campioni in corrispondenza dei quali il rapporto tra la verosimiglianza del parametro θ sotto l ipotesi nulla e quella del parametro θ sotto l ipotesi alternativa risulta elevato. RA = x X n : L } x(θ 0 ) L x (θ 1 ) k. (8) Si può notare che il test ottimo di Neyman Pearson risulta funzione di una statistica sufficiente, infatti, se esiste una statistica sufficiente T (X) per il modello, allora le due verosimiglianze nella (8) possono essere scritte: L x (θ 0 ) L x (θ 1 ) = h(x)g(t (x, θ 0) h(x)g(t (x, θ 1 ) = g(t (x, θ 0) g(t (x, θ 1 ) = λ(t (x)) e quindi, si può identificare la regione di accettazione attraverso una statistica sufficiente: RA = x X n : λ(t (x)) k}. A seconda del modello uniparametrico considerato, sarà necessario risolvere la disuguaglianza che definisce RA in modo che le regioni di accettazione e di rifiuto possano essere costruite considerando un valore soglia k per i valori assunti dalla statistica sufficiente. Fissando la probabilità dell errore di prima specie α, attraverso la distribuzione campionaria della statistica sufficiente T (X) è possibile determinare il valore soglia k che separa le regioni di accettazione e di rifiuto. Analogamente, fissando una soglia k che separa RA ed RR, attraverso la distribuzione campionaria di T (X) è possibile determinare i valori corrispondenti di α, di β e della potenza del test. Esempio 6. Test per un campione Bernoulliano Per un campione casuale di dimensione n proveniente da una popolazione bernoulliana di parametro incognito θ, con distribuzione di probabilità: f X (x; θ) = θ x (1 θ) 1 x, x = 0, 1. θ (0, 1), 17

18 si consideri il sistema di ipotesi: H 0 : θ = θ 0 contro H 1 : θ = θ 1, dove θ 0 < θ 1. Il test ottimo secondo la procedura di Neyman e Pearson si costruisce identificando la regione di accettazione definita in (8). In un modello Bernoulliano il rapporto delle verosimiglianze è: P n i=1 x i L x (θ 0 ) L x (θ 1 ) = θ 0 (1 θ 0 ) n P n i=1 x i P n = i=1 θ x i 1 (1 θ 1 ) n P n i=1 x i Quindi, da (8) si ottiene: ( θ0 θ 1 ) nx ( ) n(1 x) 1 θ0 = 1 θ 1 ( θ0 (1 θ 1 ) θ 1 (1 θ 0 ) ) nx ( ) n 1 θ0. 1 θ 1 L x (θ 0 ) L x (θ 1 ) k [ )] nx [ ] n θ0 (1 θ 1 ) 1 θ0 k θ 1 (1 θ 0 ) 1 θ [ 1 nx log θ ] 0 (1 θ 1 ) log k + n log 1 θ 1 θ 1 (1 θ 0 ) 1 θ 0 nx log k + n log 1 θ 1 1 θ 0 log θ 0 (1 θ 1 ) θ 1 (1 θ 0 ). dove si è invertito il verso della disequazione perché se θ 0 < θ 1 allora θ 0 (1 θ 1 ) θ 1 (1 θ 0 ) < 0. Allora la regione di accettazione per il test ottimo è definita da: RA = x X n : n x i k } dove k = i=1 log k + n log 1 θ 1 1 θ 0 log θ 0 (1 θ 1 ) θ 1 (1 θ 0 ) rapresenta la soglia per la statistica sufficiente n i=1 x i. Valori di n i=1 x i k appartengono alla regione di accettazione RA e valori di n i=1 x i > k appartengono a RR. Per un valore fissato di α è possibile identificare il valore di k e le regioni di accettazione e di rifiuto corrispondenti. Per valori piccoli di n, quando non è opportuno ricorrere ad approssimazioni, è necessario considerare la distribuzione campionaria della statistica S n = n i=1 X i. Quindi, utilizzando la distribuzione Binomiale di parametri n e θ: } α = P X RR ; H o vera = P n } X i > k ; θ = θ 0 = P Sn > k } = 1 F Sn (k ), i=1 cioè 1 α = F Sn (k ), dove F Sn ( ) è la funzione di ripartizione della variabile aleatoria S n Bin(n, θ 0 ) e k è il valore del quantile 1 α di tale distribuzione. Se, per esempio, n = 3, θ 0 = 1/2 e θ 1 = 3/4, allora il valore di k per α = 0.05 è il 95-mo quantile di una binomiale con parametri n = 3 e θ = 1/2: k = qbinom(1/2,3,0.95) = 3. 18

19 Viceversa, se si assume k = 2 si possono ricavare i valori di α e β, supponendo fissate le regioni di accettazione e di rifiuto. α = P ( ) } 3 1 S 3 > 2 ; θ = θ 0 = PS3 = 3 ; θ = 1/2} = 3 2 = ( = dbinom(3,3,1/2) ). 3 β = P S 3 2 ; θ = θ 1 } = PS3 = 0 S 3 = 1 S 3 = 2 ; θ = 3/4} = [ 1 4 ] [ 1 4 ] [ i=0 ( 3 i )[ 3 4 ] i [ ] 3 i 1 = 4 ] 2 = ( = dbinom(0,3,3/4)+ dbinom(1,3,3/4)+ dbinom(2,3,3/4) ). Nel caso di ipotesi composte si considera il test del rapporto tra le verosimiglianze simile, in spirito, al test di Neyman e Pearson. Il test del rapporto tra le verosimiglianze per due ipotesi composte: H 0 ; θ Θ 0 contro H 1 : θ Θ 1 con Θ = Θ 0 Θ 1 ; ; Θ 0 Θ 1 =, definisce la regione di accettazione come: RA = X X n : λ(x) k} dove λ(x) = sup θ Θ 0 L x (θ) sup θ Θ L x (θ). (9) Ci si poteva aspettare che, in analogia con il test di Neyman Pearson, la quantità al denominatore in (9) fosse sup θ Θ1 L x (θ). In pratica, però, sostituire Θ 0 con Θ ha un effetto trascurabile sulla statistica test λ(x). Inoltre le proprietà teoriche di λ(x) sono più semplici se si definisce la statistica test come nella (9). 10. Test di Wald. Quando la numerosità campionaria è elevata, e si considera un modello uniparametrico, il cui parametro è θ, si può utilizzare la procedura di test ipotesi di Wald. Sia θ uno stimatore di θ, con varianza V [ θ ] della quale si possiede uno stimatore V[ θ ]. Definizione 7. Test di Wald. Dato un sistema di ipotesi: H 0 : θ = θ 0 contro H 1 : θ θ 0, se θ è asintoticamente normale, e quindi ( θ θ 0 ) V[ θ ] D N(0, 1). Il test di Wald di livello α rifiuta l ipotesi H 0 se W > z 1 α/2, dove W = ( θ θ 0 ) V[ θ ]. Si consideri, per esempio, lo stimatore di massima verosimiglianza θ MLE per θ che, quando n è elevato, può essere approssimato con una variabile aleatoria normale: θ MLE D N(θ, I 1 n (θ)), e quindi ( θ MLE θ) I 1 n (θ) D N(0, 1). 19

20 È allora possibile utilizzare i risultati dei test d ipotesi per modelli normali, considerando una delle due seguenti statistiche test di Wald: W 1 (X) = ( θ MLE θ 0 ) I 1 ( θ MLE ) oppure W 2 (X) = ( θ MLE θ 0 ) I 1 ( θ 0 ) che, sotto l ipotesi H 0, hanno una distribuzione asintotica normale standardizzata. Si noti che per stimare la varianza di θ MLE è equivalente utilizzare al posto dell inverso dell informazione attesa di Fisher I 1 (θ) sia l inverso dell informazione osservata I 1 ( θ MLE ) che l inverso dell informazione attesa, calcolato in θ = θ 0. Per i test d ipotesi composte esaminati fin ora si hanno le regioni di rifiuto e le funzioni di potenza approssimate nella tavola seguente: H 0 H 1 RR Funzione di potenza approssimata ( ) ( ) θ0 θ θ = θ 0 θ θ 0 W (X) > z 1 α/2 1 Φ I 1 (θ 0 ) + z θ0 θ 1 α/2 +Φ I 1 (θ 0 ) z 1 α/2 ( ) θ0 θ θ θ 0 θ > θ 0 W (X) < z 1 α Φ I 1 (θ 0 ) + z 1 α ( ) θ0 θ θ θ 0 θ < θ 0 W (X) > z 1 α 1 Φ I 1 (θ 0 ) z 1 α 20

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizi test ipotesi Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte

Dettagli

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Introduzione Livelli di significatività Verifica di ipotesi sulla media di una popolazione normale Verifica di ipotesi sulla varianza di una popolazione normale Verifica di ipotesi

Dettagli

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Inferenza statistica I Alcuni esercizi. Stefano Tonellato Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stima puntuale per la proporzione Da un lotto di arance se ne estraggono 400, e di queste 180

Dettagli

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato. Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Esercitazione n.2 Inferenza su medie

Esercitazione n.2 Inferenza su medie Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

Temi di Esame a.a. 2012-2013. Statistica - CLEF

Temi di Esame a.a. 2012-2013. Statistica - CLEF Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei

Dettagli

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se

Dettagli

( x) ( x) 0. Equazioni irrazionali

( x) ( x) 0. Equazioni irrazionali Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI FUNZIONI ELEMENTARI - ESERCIZI SVOLTI 1) Determinare il dominio delle seguenti funzioni di variabile reale: (a) f(x) = x 4 (c) f(x) = 4 x x + (b) f(x) = log( x + x) (d) f(x) = 1 4 x 5 x + 6 ) Data la funzione

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

Capitolo 2. Operazione di limite

Capitolo 2. Operazione di limite Capitolo 2 Operazione di ite In questo capitolo vogliamo occuparci dell operazione di ite, strumento indispensabile per scoprire molte proprietà delle funzioni. D ora in avanti riguarderemo i domini A

Dettagli

Regressione Logistica: un Modello per Variabili Risposta Categoriali

Regressione Logistica: un Modello per Variabili Risposta Categoriali : un Modello per Variabili Risposta Categoriali Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 1 / 54 Introduzione Premessa I modelli di regressione

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 28/05/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Nel gico del

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.

Dettagli

La variabile casuale Binomiale

La variabile casuale Binomiale La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni

Dettagli

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale) Esercizio 1. Un azienda produce palline da tennis che hanno probabilità 0,02 di essere difettose, indipendentemente l una dall altra. La confezione di vendita contiene 8 palline prese a caso dalla produzione

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

ELEMENTI DI STATISTICA

ELEMENTI DI STATISTICA Dipartimento di Ingegneria Meccanica Chimica e dei Materiali PROGETTAZIONE E GESTIONE DEGLI IMPIANTI INDUSTRIALI Esercitazione 6 ORE ELEMENTI DI STATISTICA Prof. Ing. Maria Teresa Pilloni Anno Accademico

Dettagli

1 Serie di Taylor di una funzione

1 Serie di Taylor di una funzione Analisi Matematica 2 CORSO DI STUDI IN SMID CORSO DI ANALISI MATEMATICA 2 CAPITOLO 7 SERIE E POLINOMI DI TAYLOR Serie di Taylor di una funzione. Definizione di serie di Taylor Sia f(x) una funzione definita

Dettagli

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr. Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame dell 11/1/2012 NOME COGNOME N. Matr. Rispondere alle domande nel modo più completo possibile, cercando di

Dettagli

Concetto di potenza statistica

Concetto di potenza statistica Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1 Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

1. PRIME PROPRIETÀ 2

1. PRIME PROPRIETÀ 2 RELAZIONI 1. Prime proprietà Il significato comune del concetto di relazione è facilmente intuibile: due elementi sono in relazione se c è un legame tra loro descritto da una certa proprietà; ad esempio,

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

10. Insiemi non misurabili secondo Lebesgue.

10. Insiemi non misurabili secondo Lebesgue. 10. Insiemi non misurabili secondo Lebesgue. Lo scopo principale di questo capitolo è quello di far vedere che esistono sottoinsiemi di R h che non sono misurabili secondo Lebesgue. La costruzione di insiemi

Dettagli

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr. Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame del 18/7/2013 NOME COGNOME N. Matr. Rispondere ai punti degli esercizi nel modo più completo possibile, cercando

Dettagli

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme G Pareschi Principio di induzione Il Principio di Induzione (che dovreste anche avere incontrato nel Corso di Analisi I) consente di dimostrare Proposizioni il cui enunciato è in funzione di un numero

Dettagli

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni Statistica Economica Materiale didattico a cura del docente Analisi dei residui Test Esatto di Fisher Differenza fra proporzioni 1 Analisi dei residui Il test statistico ed il suo p-valore riassumono la

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

risulta (x) = 1 se x < 0.

risulta (x) = 1 se x < 0. Questo file si pone come obiettivo quello di mostrarvi come lo studio di una funzione reale di una variabile reale, nella cui espressione compare un qualche valore assoluto, possa essere svolto senza necessariamente

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 3 A. Sia una variabile casuale che si distribuisce secondo

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 L4, Corso Integrato di Psicometria - Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Rev. 18/04/2011 Inferenza statistica Formulazione

Dettagli

La funzione è continua nel suo dominio perchè y = f(x) è composizione di funzioni continue. Il punto x = 0 è un punto isolato per D f.

La funzione è continua nel suo dominio perchè y = f(x) è composizione di funzioni continue. Il punto x = 0 è un punto isolato per D f. FUNZIONI CONTINUE - ALCUNI ESERCIZI SVOLTI SIMONE ALGHISI 1. Continuità di una funzione Dati un insieme D R, una funzione f : D R e x 0 R, si è detto che f è continua in x 0 se sono soddisfatte le seguenti

Dettagli

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE 1. Proporzionalità diretta e proporzionalità inversa Analizziamo le seguenti formule Peso Lordo = Peso Netto + Tara Ricavo = Utile + Costo Rata = Importo + Interesse

Dettagli

Esercitazione n.4 Inferenza su varianza

Esercitazione n.4 Inferenza su varianza Esercizio 1 Un industria che produce lamiere metalliche ha ricevuto un ordine di acquisto di un grosso quantitativo di lamiere di un dato spessore. Per assicurare la qualità della propria fornitura, l

Dettagli

2. Leggi finanziarie di capitalizzazione

2. Leggi finanziarie di capitalizzazione 2. Leggi finanziarie di capitalizzazione Si chiama legge finanziaria di capitalizzazione una funzione atta a definire il montante M(t accumulato al tempo generico t da un capitale C: M(t = F(C, t C t M

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

Economia Applicata ai sistemi produttivi. 06.05.05 Lezione II Maria Luisa Venuta 1

Economia Applicata ai sistemi produttivi. 06.05.05 Lezione II Maria Luisa Venuta 1 Economia Applicata ai sistemi produttivi 06.05.05 Lezione II Maria Luisa Venuta 1 Schema della lezione di oggi Argomento della lezione: il comportamento del consumatore. Gli economisti assumono che il

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

Slide Cerbara parte1 5. Le distribuzioni teoriche

Slide Cerbara parte1 5. Le distribuzioni teoriche Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle

Dettagli

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ In questa Appendice mostreremo come trovare la tariffa in due parti che massimizza i profitti di Clearvoice,

Dettagli

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora:

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora: Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora: G.C.D.( a d, b d ) = 1 Sono state introdotte a lezione due definizioni importanti che ricordiamo: Definizione

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano

Dettagli

Appunti sulla Macchina di Turing. Macchina di Turing

Appunti sulla Macchina di Turing. Macchina di Turing Macchina di Turing Una macchina di Turing è costituita dai seguenti elementi (vedi fig. 1): a) una unità di memoria, detta memoria esterna, consistente in un nastro illimitato in entrambi i sensi e suddiviso

Dettagli