Inferenza sui parametri della normale multidimensionale

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Inferenza sui parametri della normale multidimensionale"

Transcript

1 Capitolo 3 Inferenza sui parametri della normale multidimensionale Un campione casuale semplice k-dimensionale di numerosità n è rappresentato da X 1 X 11. X 1k,..., X n X n1. X nk dove i vettori aleatori X i che individuano le singole osservazioni sono tra loro indipendenti ed hanno la stessa distribuzione. Complessivamente la matrice casuale delle osservazioni campionarie è data da X X 1. X n X X 1k.. X n1... X nk 3.1 Stimatori di massima verosimiglianza dei parametri della normale multivariata Siano x 1,..., x n n realizzazioni indipendenti del vettore aleatorio X N k (µ, Σ). Considerando la Definizione 1.1 e la (.7), la funzione di verosimiglianza assume la forma seguente L(µ, Σ) (π) nk/ Σ n/ exp [ 1 1 (x i µ) Σ 1 (x i µ) (3.1)

2 A. Pollice - Statistica Multivariata Prendendo il logaritmo naturale di detta funzione otteniamo la funzione di log-verosimiglianza l(µ, Σ) nk ln(π) n ln Σ 1 (x i µ) Σ 1 (x i µ) (3.) Per ricavare le espressioni degli stimatori di massima verosimiglianza dei parametri µ e Σ dovremmo risolvere il sistema seguente l(µ,σ) µ o l(µ,σ) Σ Al fine di semplificare i calcoli possiamo riparametrizzare il problema assumendo di voler stimare Σ 1. Le equazioni di verosimiglianza diventano quindi l(µ,σ 1 ) µ o l(µ,σ 1 ) Σ 1 o o (3.3) Sviluppando il termine a sinistra della prima equazione del sistema (3.3) otteniamo l(µ, Σ 1 ) 1 µ µ (x i µ) Σ 1 (x i µ) Σ 1 (x i µ) (3.4) mentre per la seconda equazione l(µ, Σ 1 ) Σ 1 n Σ 1 ln Σ 1 1 }} A Σ 1 (x i µ) Σ 1 (x i µ) }} B (3.5) Ricordando che Σ 1 è simmetrica e che per qualsiasi matrice quadrata Q vale Q / Q Q (Q ) 1 risulta A 1 Σ 1 Σ 1 (Σ 1 ) 1 (Σ 1 ) 1 (3.6) Inoltre indicando con Σ 1 jl l elemento jl-esimo della matrice Σ 1 e con [a jl la matrice di elemento generico a jl, si ha [ Σ 1 B jl (x ij µ j )(x il µ l ) Σ 1 jl [(x ij µ j )(x il µ l ) (x i µ)(x i µ) (3.7)

3 Cap.3: Inferenza sui parametri della normale multidimensionale 3 Sostituendo la (3.4), la (3.6) e la (3.7) il sistema (3.3) delle equazioni di verosimiglianza diventa dunque ˆΣ 1 n (x i ˆµ) o n (ˆΣ 1 ) 1 1 n (x i ˆµ)(x i ˆµ) o cioé con pochi passaggi ˆµ 1 n n x i X (ˆΣ 1 ) 1 1 n n (x i X)(x i X) S Vettore delle medie campionarie (3.8) Indichiamo con u n il vettore unitario di dimensione n e con X la matrice casuale le cui righe X 1,..., X n rappresentano le unità k-dimensionali di un campione casuale semplice estratto da una popolazione X N k (µ, Σ). È evidente che X 1 n X u n (3.9) ha distribuzione normale k-dimensionale. Inoltre poiché X ( X 1,..., X k ) ho che: E( X) [E( X 1,..., X k ) (µ 1,..., µ k ) µ (3.10) Il vettore delle medie campionarie è dunque uno stimatore corretto. È ben noto che per j 1,..., k Var( X j ) σ j n Inoltre per j l, con j, l 1,..., k Cov( X j, X l ) 1 n Cov ( X ij, ) X hl h1 1 n Cov(X ij, X il ) (3.11) 1 n σ jl (3.1) Complessivamente, dunque, risulta che lo stimatore di massima verosimiglianza del vettore di parametri µ è caratterizzato dalla seguente distribuzione campionaria: X N k (µ, 1 Σ) (3.13) n

4 4 A. Pollice - Statistica Multivariata 3.1. Matrice di varianze e covarianze campionarie Ponendo Y i X i µ ed Y (Y 1,..., Y n ) per i 1,..., n otteniamo la seguente espressione per la matrice di varianze e covarianze campionarie S 1 n 1 n (X i X)(X i X) (Y i Ȳ )(Y i Ȳ ) 1 n (Y Y + nȳ Ȳ nȳ Ȳ nȳ Ȳ ) 1 ( Y Y 1 ) n n Y u n u ny 1 (I n Y n 1 ) n U n Y (3.14) La matrice I n 1 n U n è simmetrica e da semplici calcoli risulta anche idempotente. Di conseguenza il suo rango è uguale alla traccia, ovvero ad n 1. Dalla (.6) discende dunque che lo stimatore di massima verosimiglianza della matrice Σ è caratterizzato dalla seguente distribuzione campionaria: ns Y (I n 1 n U n)y W k (Σ, n 1) (3.15) Infine poiché S 1... S 1k S..... S k1... Sk con E(S j ) (n 1)σ j /n e E(S jl) (n 1)σ jl /n, la matrice di varianze e covarianze campionarie S risulta essere uno stimatore distorto di Σ: E(S) n 1 n Σ (3.16) Uno stimatore corretto di Σ è semplicemente definito da: S n n 1 S (3.17)

5 Cap.3: Inferenza sui parametri della normale multidimensionale 5 3. Teorema del limite centrale multivariato Teorema 3.1 Siano X 1,..., X n vettori aleatori k-dimensionali indipendenti aventi media µ e matrice di varianze e covarianze Σ. La distribuzione della quantità n (X i µ)/ n per n è N k (o, Σ) 1 n L (X i µ) N k (o, Σ) (3.18) Infatti se si pone Y n (X i µ)/ n e per qualsiasi t R k ed s R, si può scrivere la seguente funzione generatrice dei momenti M Y (ts) Eexp[st Y } M Z (s) (3.19) nella (3.19) la funzione generatrice dei momenti della variabile k dimensionale Y coincide con quella della variabile unidimensionale Z t Y n (t X i t µ)/ n. Le variabili aleatorie t X i sono indipendenti e hanno media e varianza comuni per i 1,..., n e rispettivamente pari a t µ e t Σt. Per il teorema del limite centrale univariato possiamo dire che per n la variabile aleatoria Z converge in distribuzione alla N(0, t Σt). Quindi per n la funzione generatrice dei momenti di Z ha forma nota data da ( ) 1 lim M Z(s) exp n s t Σt lim M Y (ts) (3.0) n In particolare se s 1 ( ) 1 lim M Y (t) exp n t Σt (3.1) e per la (.17) si deduce che al divergere di n il vettore aleatorio Y converge in distribuzione alla N k (o, Σ). 3.3 Principi generali per la costruzione di test in ambito multivariato Sia X un vettore aleatorio k-dimensionale dotato di densità f(x, ω) governata dal parametro multidimensionale ω a valori nello spazio parametrico Ω. Sia inoltre ω (θ, ψ) dove θ Θ è il parametro oggetto di indagine e ψ è detto parametro di disturbo.

6 6 A. Pollice - Statistica Multivariata Principio del rapporto di verosimiglianze generalizzato Siano Θ 0 Θ e Θ 1 Θ Θ 0. Si consideri il seguente generico sistema di ipotesi: H0 : θ Θ 0 H 1 : θ Θ 1 Se osserviamo n repliche indipendenti del vettore aleatorio X, è possibile rappresentare l informazione riguardante θ contenuta nel campione x 1,..., x n tramite la funzione di verosimiglianza L(θ) n f(x i, θ) Consideriamo allora la quantità λ sup θ Θ 0 L(θ) sup θ Θ L(θ) (3.) La (3.) risulta da una generalizzazione del lemma di Neyman-Pearson. Intuitivamente λ, che assume valori compresi tra 0 e 1, misura la plausibilità dell ipotesi nulla alla luce del dato oservato: quanto maggiore è il suo valore, tanto più verosimile risulta H 0. La regione critica di un generico test del rapporto di verosimiglianze generalizzato ha quindi la forma (x 1,..., x n ) λ < c} dove c è una costante scelta in modo che il test abbia livello di significatività prefissato e pari ad α: Prλ < c H 0 } α. Wilks (196) ha dimostrato come sotto l ipotesi nulla e se si verificano determinate condizioni di regolarità della verosimiglianza, la distribuzione campionaria asintotica dei test del rapporto di verosimiglianze generalizzato sia assimilabile alla χ. In particolare la quantità ln λ tende a distribuirsi come una χ con numero di gradi di libertà p pari alla dimensione del parametro oggetto dell ipotesi nulla: ln λ L χ p (3.3) La regione critica è dunque data da (x 1,..., x n ) : ln λ > χ p,α} Principio di unione-intersezione In questa sezione si assume che una data ipotesi parametrica multidimensionale sia scomponibile in diverse ipotesi unidimensionali (Roy, 1953). Sia θ un vettore p-dimensionale di parametri. Considero il generico sistema di ipotesi H0 : θ θ 0 H 1 : θ θ 0

7 Cap.3: Inferenza sui parametri della normale multidimensionale 7 Se a R p è un generico vettore di costanti, allora θ θ 0 a θ a θ 0, a R p mentre θ θ 0 ã R p ã θ ã θ 0 Quindi se definiamo l ipotesi nulla unidimensionale H 0 (a) : a θ a θ 0 H 0 a R p H 0 (a) Inoltre se per l ipotesi unidimensionale H 0 (a) possiamo costruire la regione critica R(a) e la regione di accettazione A(a), allora per l ipotesi multidimensionale tali regioni sono rispettivamente date da R R(a) A A(a) (3.4) a R p a R p Pertanto rigettiamo H 0 se H 0 (a) viene rigettata per almeno una determinazione di a, non la rigettiamo se H 0 (a) non viene rigettata per nessuna determinazione di a. Questo criterio esposto con riferimento alla combinazione lineare delle componenti del vettore θ vale per qualsiasi ipotesi nulla multidimensionale esprimibile come intersezione di ipotesi unidimensionali. 3.4 Verifica di ipotesi sul vettore delle medie Sulla base di n replicazioni indipendenti di X N k (µ, Σ) si voglia verificare il sistema di ipotesi multidimensionali H0 : µ µ 0 H 1 : µ µ 0 Considerando il vettore k-dimensionale di costanti a e la combinazione lineare unidimensionale a X che ha distribuzione N(a µ, a Σa) definisco il sistema di ipotesi unidimensionali H0 (a) : a µ a µ 0 H 1 (a) : a µ a µ 0 Detti X ed S gli stimatori di µ e Σ possiamo costruire il test per la verifica dell ipotesi unidimensionale basato sulla statistica t n 1(a X a µ 0 ) t(a) (3.5) a Sa

8 8 A. Pollice - Statistica Multivariata con regione di accettazione data da t (a) (n 1)a ( X µ 0 )( X µ 0 ) a a Sa < t n 1,α (3.6) Per il principio di unione-intersezione il mancato rigetto delle ipotesi univariate H 0 (a) per qualsiasi configurazione del vettore a implica che l ipotesi multivariata H 0 non venga rigettata. La regione di accettazione dell ipotesi multivariata ha quindi la forma max a t (a) < t n 1,α (3.7) Nel determinare il suddetto punto di massimo bisogna notare che la statistica t (a) è insensibile ai cambiamenti di scala degli elementi di a, in altri termini essa assume lo stesso valore per a e per ca con c R. Al fine di rimuovere questa indeterminatezza viene imposta la condizione a Sa 1. Si tratta a questo punto di risolvere il seguente problema di massimo vincolato t (a) (n 1)a ( X µ 0 )( X µ 0 ) a max a (3.8) Sa 1 La funzione lagrangiana è data da L(a, λ) (n 1)a ( X µ 0 )( X µ 0 ) a λ(a Sa 1) (3.9) La derivata della (3.9) rispetto al moltiplicatore λ restituisce il vincolo, mentre derivando la funzione lagrangiana rispetto all argomento a della funzione da massimizzare ottengo L(a, λ) a [(n 1)( X µ 0 )( X µ 0 ) λsa o (3.30) Quest ultima espressione porta in primo luogo a: λ (n 1)a ( X µ 0 )( X µ 0 ) a a Sa t (a) (3.31) La (3.30) individua un sistema lineare omogeneo con a vettore delle incognite: tale sistema ammette soluzioni diverse dalla banale per valori di λ che soddisfano la seguente equazione caratteristica: (n 1)( X µ 0 )( X µ 0 ) λs 0 (3.3) ovvero rango1 }} (n 1) S 1 ( X µ 0 )( X µ 0 ) λi 0 (3.33) }} rango1

9 Cap.3: Inferenza sui parametri della normale multidimensionale 9 Esiste dunque una sola radice non nulla dell equazione caratteristica, quindi il valore del moltiplicatore λ che massimizza la funzione lagrangiana coincide con l unico autovalore non nullo λ della matrice (n 1)S 1 ( X µ 0 )( X µ 0 ). Dalle considerazioni precedenti risulta che T max t (a) λ (3.34) a Inoltre poiché la somma degli autovalori non nulli di una matrice è pari alla traccia della stessa, T λ (n 1)tr[S 1 ( X µ 0 )( X µ 0 ) (n 1)tr[( X µ 0 ) S 1 ( X µ 0 ) (n 1)( X µ 0 ) S 1 ( X µ 0 ) (3.35) La statistica appena ricavata viene denominata test T di Hotelling: grazie all assunzione di normalità delle osservazioni e per la proprietà.10 e la (3.15) T ha distribuzione campionaria T di Hotelling k-dimensionale con n 1 gradi di libertà T T k (n 1) (3.36) La regione critica ha la forma seguente: Proprietà 3. Per la (.8) vale: (x 1,..., x n ) T > T k (n 1, α)} (3.37) F n k k(n 1) T F k,n k (3.38) Proprietà 3.3 La statistica T è invariante per trasformazioni lineari dei dati di partenza. Infatti posto Y AX + a si ha che T (n 1)(A X + a Aµ 0 a) (ASA ) 1 (A X + a Aµ 0 a) (n 1)( X µ 0 ) S 1 ( X µ 0 ) (3.39) Proprietà 3.4 Il test T di Hotelling può esser ricavato anche come test del rapporto di verosimiglianze generalizzato (Anderson, 1984; Vitali, 1995). Proprietà 3.5 Il test T è UMP (uniformemente più potente) nella classe dei test invarianti per trasformazioni lineari delle osservazioni (Anderson, 1984). Proprietà 3.6 Il test T è ammissibile: non c è altro test per la verifica della stessa ipotesi che abbia potenza superiore a quella del test di Hotelling per qualsiasi valore del livello di significatività (Anderson, 1984).

10 30 A. Pollice - Statistica Multivariata Stima per intervallo di µ Tenendo conto della (3.36) possiamo scrivere: Pr(n 1)( X µ) S 1 ( X µ) < T k (n 1, α)} 1 α (3.40) il che significa affermare che con probabilità 1 α la media µ giace all interno di un ellissoide k-dimensionale di centro X e forma e dimensioni dipendenti da S ed α. L espressione precedente viene detta ellissoide di confidenza di µ. Per indagare su quali componenti del vettore aleatorio si discostano più marcatamente dall ipotesi nulla possiamo scrivere PrT < T k (n 1, α)} Prt (a) < T k (n 1, α) a} 1 α (3.41) ovvero Pr (n 1) a ( X µ)( X µ) } a a Sa < T k (n 1, α) a 8 s s 9 < Pr : a X T k(n 1, α) a Sa n 1 < a µ < a X + T k(n 1, α) a Sa n 1 a ; 1 α (3.4) Al variare del vettore a l espressione precedente dà luogo agli intervalli di confidenza simultanei per tutte le combinazioni lineari degli elementi del vettore µ. L ellissoide di confidenza può essere esplorato tramite opportune configurazioni del vettore a quali (1, 0,..., 0) per µ 1, (1, 1, 0,..., 0) per µ 1 µ e così via. 3.5 Verifica dell uguaglianza tra due vettori di medie Il test di Hotelling viene utilizzato anche per il confronto tra le medie di due popolazioni indipendenti, ovvero per verificare H0 : µ 1 µ o (3.43) H 1 : µ 1 µ o Siano X 11,..., X n1 1 ed X 1,..., X n due campioni di osservazioni indipendenti riferiti a popolazioni indipendenti distribuite come N k (µ 1, Σ) e N k (µ, Σ). Detti X1 ed X i vettori delle medie dei due campioni, per la (3.13) abbiamo che X 1 N k (µ 1, Σ/n 1 ) e X N k (µ, Σ/n ), quindi sotto H 0 ho che, essendo i due campioni indipendenti, per la (.1) n1 n n 1 + n ( X 1 X ) N k (o, Σ) (3.44)

11 Cap.3: Inferenza sui parametri della normale multidimensionale 31 Sia inoltre S p la matrice di varianze e covarianze comune (pooled) stimata tramite i due campioni n1 S p (X i1 X 1 )(X i1 X 1 ) + n j1 (X j X )(X j X ) n 1 + n (3.45) I due addendi al numeratore dell espressione precedente sono indipendenti e per la (3.15) hanno distribuzione di Wishart k-dimensionale con matrice di scala Σ e rispettivamente n 1 1 ed n 1 gradi di libertà. Quindi per la (.7) (n 1 + n )S p W k (Σ, n 1 + n ) e complessivamente per la (.9) S 1 p (n 1 +n ) n 1n ( n 1 + n X 1 X ) n 1 + n ( X 1 X ) T k(n 1 +n ) (3.46) Il principio del rapporto di verosimiglianze generalizzato ed il principio di unione-intersezione concordano nell individuare come funzione test per la verifica dell uguaglianza tra due vettori di medie la statistica la cui regione critica è data da ovvero per la (.8) T n 1n n 1 + n ( X 1 X ) S 1 p ( X 1 X ) (3.47) T > T k(n 1 + n, α) (3.48) T > (n 1 + n )k n 1 + n k 1 F k,n 1 +n k 1(α) (3.49) Proprietà 3.7 L ellissoide di confidenza per µ 1 µ è dato dall espressione seguente: j ff n1 n Pr [ X 1 X (µ 1 µ ) Sp 1 [ X 1 X (µ 1 µ ) < T k n 1 + n (n 1 + n, α) 1 α (3.50) Proprietà 3.8 Gli intervalli di confidenza simultanei per le combinazioni lineari delle componenti del vettore µ 1 µ sono dati da: Pr a ( X 1 X ) K < a (µ 1 µ ) < a ( X 1 X ) + K } 1 α (3.51) con K (n 1 + n )T k (n 1 + n, α)a S p a/n 1 n.

12 3 A. Pollice - Statistica Multivariata Proprietà 3.9 Problema di Behrens-Fisher. Se le due popolazioni di partenza non hanno la stessa matrice di varianze e covarianze, posto per j 1, Sj n j (X ij X j )(X ij X j ) /(n j 1) ed S p S1/n 1 + S/n si può dimostrare che la statistica T ( X 1 X ) Sp 1 ( X 1 X ) ha distribuzione approssimata T k (c) con numero di gradi di libertà c dato da c [( X 1 X ) Sp 1 S1 S 1 p ( X 1 X ) n 1 (n 1 1) [( X 1 X ) S 1 p ( X 1 X ) + [( X 1 X ) Sp 1 S S 1 p ( X 1 X ) n (n 1) (3.5) 3.6 Verifica di ipotesi sulla matrice di varianze e covarianze Il punto di partenza è sempre un campione casuale semplice k-dimensionale di n osservazioni, proveniente da una popolazione normale con parametri µ e Σ incogniti. Per la costruzione delle funzioni test in questo caso useremo il principio del rapporto di verosimiglianze generalizzato Ipotesi nulla semplice Il sistema di ipotesi da verificare sia H0 : Σ Σ 0 H 1 : Σ Σ 0 (3.53) con Σ 0 matrice simmetrica, semidefinita positiva e completamente specificata. La funzione test costruita secondo il principio del rapporto di verosimiglianze generalizzato è definita da λ sup µ,σσ 0 L(µ, Σ) sup µ,σ L(µ, Σ) (3.54) Il denominatore dell espressione precedente è dato da sup L(µ, Σ) L( X, S) µ,σ (π) nk/ S n/ exp [ 1 (x i X) S 1 (x i X) (π) nk/ S n/ exp( nk/) (3.55)

13 Cap.3: Inferenza sui parametri della normale multidimensionale 33 L ultimo passaggio deriva dalla considerazione seguente (x i X) S 1 (x i X) tr[(x i X) S 1 (x i X) [ tr S 1 (x i X)(x i X) ntr[s 1 S nk (3.56) Per il numeratore della (3.54), posto Σ Σ 0, e dato che il valore di µ che minimizza n (x i µ) Σ 1 0 (x i µ) è ancora µ X sup L(µ, Σ) L( X, Σ 0 ) µ,σσ 0 [ (π) nk/ Σ 0 n/ exp 1 (x i X) Σ 1 0 (x i X) [ (π) nk/ Σ 0 n/ exp n tr(σ 1 0 S) (3.57) In conclusione la funzione test del rapporto di verosimiglianze generalizzato per la verifica dell ipotesi (3.53) è data da λ Σ 0 n S n exp n [ tr(σ 1 0 S) k } (3.58) Per la determinazione della regione critica di questa statistica è disponibile l espressione analitica della sua distribuzione campionaria esatta sotto H 0 (Anderson, 1984). Più semplice, ma meno preciso è il riferimento alla distribuzione asintotica (3.3) comune a tutti i test costruiti tramite il principio del rapporto di verosimiglianze generalizzato. In tal caso ln λ 3.6. Verifica della completa indipendenza L χ k(k+1)/ (3.59) L ipotesi nulla in questione prevede che la matrice di varianze e covarianze Σ sia diagonale, il che corrisponde, sotto l assunzione distributiva di normalità delle osservazioni, a supporre l indipendenza delle componenti del vettore aleatorio. H0 : Σ D (3.60) H 1 : Σ D

14 34 A. Pollice - Statistica Multivariata con D matrice diagonale di elementi incogniti σ 1 0 D..... (3.61) 0 σk In questo caso sotto l ipotesi nulla abbiamo [ L(µ, Σ D) (π) nk/ D n/ exp 1 (x i µ) D 1 (x i µ) ( k n/ [ (π) nk/ σh) exp 1 k (x ih µ h ) σ h1 h1 h [ k (π) n/ σ n h exp 1 (x ih µ h ) h1 k L h (µ h, σh) (3.6) h1 Sotto l ipotesi nulla la verosimiglianza è dunque esprimibile come il prodotto delle k verosimiglianze riferite alle componenti del vettore X che hanno distribuzioni marginali normali univariate di parametri rispettivamente µ h e σ h con h 1,..., k sup L(µ, Σ) µ,σd k sup L h (µ h, σh) h1 µ h,σh k L h ( X h, Sh) h1 k h1 (π) n/ S n h (π) nk/ ( k h1 In conclusione, considerando la (3.55) λ sup µ,σd L(µ, Σ) sup µ,σ L(µ, Σ) σ h exp( n/) S n h ) exp( nk/) (3.63)

15 Cap.3: Inferenza sui parametri della normale multidimensionale 35 ( k ) (π) nk/ h1 S n h exp( nk/) (π) nk/ S n/ exp( nk/) S n/ k h1 Sn h (3.64) Anche in questo caso per la determinazione della regione critica è possibile fare riferimento all espressione analitica della distribuzione campionaria esatta sotto H 0 (Bartlett, 1964). La distribuzione asintotica è ancora data da ln λ L χ k(k 1)/ (3.65) Verifica della sfericità Sotto H 0 si ipotizza ora che Σ sia una matrice scalare. Ciò equivale ad affermare che le componenti del vettore aleatorio preso a riferimento per il campionamento siano indipendenti ed abbiano la stessa varianza incognita σ. Qualora la struttura della sua matrice di varianze e covarianze sia questa, la densità normale multivariata viene detta sferica poiché assume valore costante su ipersfere in R k. H0 : Σ σ I k H 1 : Σ σ (3.66) I k Mantenendo la notazione del paragrafo precedente sup L(µ, Σ) sup µ,σσ I k µ,σ con S 1 kn sup µ,σ k L h (µ h, σ ) h1 k h1 (π) n/ σ n exp [ 1 (X ih µ h ) L( X, S I k ) (3.67) k h1 (X ih X h ) 1 k k h1 σ Sh 1 tr(s) (3.68) k Pertanto il rapporto di verosimiglianze generalizzato assume la forma λ sup µ,σσ I k L(µ, Σ) sup µ,σ L(µ, Σ)

16 36 A. Pollice - Statistica Multivariata (π) kn/ ( S ) kn/ exp ( 1kn) (π) kn/ S n/ exp ( 1kn) ( ) kn/ S 1 k 1 tr(s) (3.69) k La funzione test per la verifica della sfericità è data dalla potenza (kn/)- esima del rapporto tra la media geometrica e la media aritmetica degli autovalori di S. L espressione analitica esatta della distribuzione campionaria è disponibile in letteratura, ma la sua approssimazione asintotica è maggiormente utilizzata per la determinazione della regione critica del test Verifica dell indipendenza tra due gruppi di variabili Sia X un vettore aleatorio k-dimensionale con distribuzione N k (µ, Σ). Si consideri lo stesso suddiviso in due sottovettori X 1 e X di dimensioni rispettivamente k 1 e k con k 1 + k k. Analogamente µ e Σ hanno la forma ( ) ( ) µ1 Σ11 Σ µ Σ 1 µ Σ 1 Σ Sulla base di n realizzazioni indipendenti del vettore aleatorio X si voglia verificare l ipotesi di indipendenza tra i due sottoinsiemi di componenti ( ) H0 : Σ Σ 0 Σ11 O con Σ H 1 : Σ Σ 0 (3.70) 0 O Σ Sotto H 0 la densità N k (µ, Σ) è fattorizzabile nel prodotto delle densità di X 1 e X, rispettivamente N k1 (µ 1, Σ 11 ) e N k (µ, Σ ), quindi L(µ, Σ Σ 0 ) L(µ 1, Σ 11 )L(µ, Σ ) (3.71) di conseguenza, posti X h n 1 X h u n ed S hh n 1 n (X ih X h )(X ih X h ), con h 1, sup L(µ, Σ) L( X 1, S 11 )L( X, S ) µ,σσ 0 (π) nk 1/ S 11 n/ exp nk 1 /} (π) nk/ S n/ exp nk /} (π) nk/ exp nk/} (3.7) ( S 11 S ) n/

17 Cap.3: Inferenza sui parametri della normale multidimensionale 37 Quindi in conclusione la funzione test ottenibile tramite il criterio del rapporto di verosimiglianze generalizzato è data da λ sup µ,σσ 0 L(µ, Σ) (π) nk/ ( S 11 S ) n/ ( exp nk/} S sup µ,σ L(µ, Σ) (π) nk/ S n/ exp nk/} S 11 S (3.73) La regione critica di detta statistica viene determinata tramite la sua distribuzione asintotica data da ln λ L χ k 1k. In questo caso la generalizzazione ad un numero c > di sottoinsiemi di componenti del vettore aleatorio avviene considerando X 1 µ 1 Σ 11 Σ 1c X. µ. Σ..... (3.74) X c µ c Σ c1 Σ cc posto che X h R kh e che c h1 k h k. Sia inoltre Σ 11 O O H0 : Σ Σ 0 con Σ H 1 : Σ Σ 0 O O O O Σ cc ) n/ (3.75) In analogia con quanto appena visto, la funzione test che si ottiene applicando il criterio del rapporto di verosimiglianze generalizzato ha la forma L λ S n/ c h1 S hh n/ (3.76) con ln λ χ g, dove g 1 k(k + 1) c h1 1 k h(k h + 1). Esistono in letteratura sia le espressioni analitiche approssimate per la distribuzione esatta di questa funzione test (Box, 1949) che le tavole che riportano i valori della stessa (Mathai e Katingar, 1979; Mathai e Saxena, 1973). 3.7 Verifica dell uguaglianza tra due matrici di varianze e covarianze Siano X 11,..., X n11 ed X 1,..., X n due campioni di osservazioni indipendenti riferiti a popolazioni indipendenti e distribuite come N k (µ 1, Σ 1 ) e N k (µ, Σ ). Si voglia verificare l ipotesi H0 : Σ 1 Σ Σ H 1 : Σ 1 Σ (3.77)

18 38 A. Pollice - Statistica Multivariata La verosimiglianza complessiva ha l espressione seguente: L(µ 1, µ, Σ 1, Σ ) (π) 1 (n 1+n )k Σ 1 n 1 Σ n 8 39 < exp : 1 Xn 1 4 (X i1 µ 1 ) Σ 1 1 (X Xn i1 µ 1 ) + (X j µ ) Σ 1 (X j µ ) 5 ; (3.78) j1 Pertanto il criterio del rapporto di verosimiglianze generalizzato porta ad una funzione test della forma λ sup µ 1,µ,Σ 1Σ Σ L(µ 1, µ, Σ 1, Σ ) sup µ1,µ,σ 1,Σ L(µ 1, µ, Σ 1, Σ ) (3.79) Per il calcolo del denominatore si tratta di massimizzare le verosimiglianze di due campioni indipendenti quindi sup L(µ 1, µ, Σ 1, Σ ) L( X 1, X, S 1, S ) µ 1,µ,Σ 1,Σ (π) 1 (n1+n)k [ S 1 n1/ exp 1 S n/ (n 1 + n )k (3.80) Per il numeratore invece sup L(µ 1, µ, Σ 1, Σ ) µ 1,µ,Σ 1Σ Σ con (π) 1 (n1+n)k sup exp µ 1,µ,Σ Σ 1 (n1+n) [ 1 n h (X ih µ h ) Σ 1 (X ih µ h ) h1 L( X 1, X, S, S) (3.81) nh h1 S (X ih X h )(X ih X h ) n 1S 1 + n S (3.8) n 1 + n n 1 + n Per considerazioni analoghe alla (3.56) ne segue quindi che sup L(µ 1, µ, Σ 1, Σ ) (π) 1 (n1+n)k [ µ 1,µ,Σ 1Σ Σ S exp 1 (n1+n)/ (n 1 + n )k (3.83) Il rapporto di verosimiglianze generalizzato è dunque dato dall espressione λ S 1 n1/ S n/ S (n1+n)/ (3.84)

19 Cap.3: Inferenza sui parametri della normale multidimensionale 39 In questo caso il ricorso alla distribuzione asintotica porta a una regione critica basata su ln λ χ k(k+1)/, mentre per la distribuzione esatta si veda Box (1949). L estensione del risultato precedente al caso di c > campioni è immediata e prende il nome di test di Bartlett: H0 : Σ 1 Σ c Σ H 1 : (3.85) Σ h Σ j, h j, h, j 1,..., c In tal caso la funzione test è λ c h1 S h nh/ S n/ (3.86) con n c h1 n h ed S c h1 n hs h /n. Per la distribuzione asintotica vale ln λ χ g con g 1 (c 1)k(k + 1).

Analisi delle componenti principali

Analisi delle componenti principali Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste

Dettagli

Distribuzione normale multidimensionale

Distribuzione normale multidimensionale Capitolo 2 Distribuzione normale multidimensionale La funzione di densità normale undimensionale ha la forma seguente Anderson, 1984 fx ce 1 2 Ax b2 ce 1 2 x bax b La costante di normalizzazione c è data

Dettagli

Analisi delle componenti principali

Analisi delle componenti principali Capitolo 7 Analisi delle componenti principali Lo studio di posizione, dispersione ed interdipendenze relative a k variabili osservate su n individui richiede il calcolo di k medie, k varianze e k(k 1)/

Dettagli

Analisi della correlazione canonica

Analisi della correlazione canonica Analisi della correlazione canonica Su un collettivo di unità statistiche si osservano due gruppi di k ed m variabili L analisi della correlazione canonica ha per obiettivo lo studio delle relazioni di

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015 1 2 3 4 5 6 7 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Richiami di algebra delle matrici a valori reali

Richiami di algebra delle matrici a valori reali Richiami di algebra delle matrici a valori reali Vettore v n = v 1 v 2. v n Vettore trasposto v n = (v 1, v 2,..., v n ) v n = (v 1, v 2,..., v n ) A. Pollice - Statistica Multivariata Vettore nullo o

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Lezione 1 - Mercoledì 27 Settembre 2017 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate Introduzione Notazione Modello additivo Verifica d ipotesi Sia X una variabile q-dimensionale, a valori reali, non degenere, osservata in k tempi diversi (τ 1, τ 2,..., τ k ), sulle stesse n unità statistiche

Dettagli

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

Modelli lineari generalizzati

Modelli lineari generalizzati Modelli lineari generalizzati Estensione del modello lineare generale Servono allo studio della dipendenza in media di una variabile risposta da una o più variabili antecedenti Vengono attenuate alcune

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

I VETTORI GAUSSIANI E. DI NARDO

I VETTORI GAUSSIANI E. DI NARDO I VETTOI GAUSSIANI E. DI NADO. L importanza della distribuzione gaussiana I vettori di v.a. gaussiane sono senza dubbio uno degli strumenti più utili in statistica. Nell analisi multivariata, per esempio,

Dettagli

Variabili casuali multidimensionali

Variabili casuali multidimensionali Capitolo 1 Variabili casuali multidimensionali Definizione 1.1 Le variabili casuali multidimensionali sono k-ple ordinate di variabili casuali unidimensionali definite sullo stesso spazio di probabilità.

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA

STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA STATISTICA APPLICATA Prof.ssa Julia Mortera INTRODUZIONE al CAMPIONAMENTO e all INFERENZA STATISTICA Inferenza Statistica Nell inferenza statistica si usano le statistiche campionarie per fare previsioni

Dettagli

Analisi della correlazione canonica

Analisi della correlazione canonica Capitolo 8 Analisi della correlazione canonica Si supponga che su un collettivo di unità statistiche si siano osservati due gruppi di k ed m variabili corrispondenti ad altrettanti aspetti di un fenomeno

Dettagli

I appello di calcolo delle probabilità e statistica

I appello di calcolo delle probabilità e statistica I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 014/015 II Esonero - 15 Gennaio 015 1 3 4 5 6 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Statistica Applicata all edilizia: Stime e stimatori

Statistica Applicata all edilizia: Stime e stimatori Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello

Dettagli

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

Analisi della varianza: I contrasti e il metodo di Bonferroni

Analisi della varianza: I contrasti e il metodo di Bonferroni Analisi della varianza: I contrasti e il metodo di Bonferroni 1 Contrasti In molti problemi risulta importante stabilire, nel caso venga rifiutata l ipotesi nulla, di uguaglianza delle medie µ j delle

Dettagli

Minimi quadrati vincolati e test F

Minimi quadrati vincolati e test F Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo

Dettagli

E n 1 n. n i. n 2. n 2 ( n

E n 1 n. n i. n 2. n 2 ( n Lezione n. 7 7.1 Ancora sulle proprietà degli stimatori Esempio 7.1 [continua dall Esempio 6.1] Studiare varianza e MSE dei due stimatori e verificare se T n raggiunge il limite di Cramer- Rao. Soluzione.

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

Tecniche di sondaggio

Tecniche di sondaggio SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con

Dettagli

Università di Pavia Econometria. Richiami di teoria delle distribuzioni statistiche. Eduardo Rossi

Università di Pavia Econometria. Richiami di teoria delle distribuzioni statistiche. Eduardo Rossi Università di Pavia Econometria Richiami di teoria delle distribuzioni statistiche Eduardo Rossi Università di Pavia Distribuzione di Bernoulli La variabile casuale discreta Y f Y (y; θ) = 0 θ 1, dove

Dettagli

INFERENZA STATISTICA I (CANALE B)

INFERENZA STATISTICA I (CANALE B) INFERENZA STATISTICA I (CANALE B) FORMULE E TAVOLE PER L ESAME a.a. 2003/04 Indice A. Formule 2 B. Quantili di una distribuzione normale standard 4 C. Quantili di una distribuzione t di Student 5 D. Quantili

Dettagli

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica Costruzione di macchine Modulo di: Progettazione probabilistica e affidabilità Marco Beghini Lezione 7: Basi di statistica Campione e Popolazione Estrazione da una popolazione (virtualmente infinita) di

Dettagli

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2011/12

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2011/12 PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 0/ Esercizio Prova scritta del 7/06/0 Siano X e Y due v.a. indipendenti, con distribuzione continua Γ(, ). Si trovino la distribuzione di X Y e di (X Y ). Esercizio

Dettagli

Modelli Log-lineari Bivariati

Modelli Log-lineari Bivariati Modelli Log-lineari Bivariati Luca Stefanutti Università di Padova Dipartimento di Psicologia Applicata Via Venezia 8, 35131 Padova L.Stefanutti (Università di Padova) Modelli Log-lineari 1 / 71 Contenuti

Dettagli

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo Statistica 2 Esercitazioni Dott. L 1 1 Dipartimento di Scienze Statistiche e Matematiche S. Vianelli, Università di Palermo ricevimento: lunedì ore 15-17 mercoledì ore 15-17 e-mail: luigi.augugliaro@unipa.it

Dettagli

Teoria dei Fenomeni Aleatori AA 2012/13. Il Modello Lognormale La funzione di densità di probabilità lognormale è data:

Teoria dei Fenomeni Aleatori AA 2012/13. Il Modello Lognormale La funzione di densità di probabilità lognormale è data: Il Modello Lognormale La funzione di densità di probabilità lognormale è data: ( ln x a) 1 f ( x ) = exp x > 0 X b x b π in cui a e b sono due costanti, con b> 0. Se X è una v.a. lognormale allora Y lnx

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

Elementi di statistica per l econometria

Elementi di statistica per l econometria Indice Prefazione i 1 Teoria della probabilità 1 1.1 Definizioni di base............................. 2 1.2 Probabilità................................. 7 1.2.1 Teoria classica...........................

Dettagli

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate

Dettagli

INFERENZA STATISTICA I (CANALE B)

INFERENZA STATISTICA I (CANALE B) INFERENZA STATISTICA I (CANALE B) FORMULE E TAVOLE a.a. 2005/06 Indice A. Formule 2 B. Quantili di una distribuzione normale standard 4 C. Quantili di una distribuzione t di Student 5 D. Quantili di una

Dettagli

Algebra lineare. Laboratorio di programmazione e calcolo CdL in Chimica. Pierluigi Amodio

Algebra lineare. Laboratorio di programmazione e calcolo CdL in Chimica. Pierluigi Amodio Algebra lineare Laboratorio di programmazione e calcolo CdL in Chimica Pierluigi Amodio Dipartimento di Matematica Università di Bari pierluigi.amodio@uniba.it http://dm.uniba.it/ amodio A.A. 2016/17 P.

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

Analisi Multivariata Corso di laurea in Statistica

Analisi Multivariata Corso di laurea in Statistica Analisi Multivariata Corso di laurea in Statistica Carla Rampichini 1 Distribuzione Normale multivariata L utilizzo di computer sempre più potenti consente oggi di considerare distribuzioni campionare

Dettagli

Stima puntuale di parametri

Stima puntuale di parametri Probabilità e Statistica Esercitazioni a.a. 2009/2010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Stima puntuale di parametri Ines Campa Probabilità e Statistica -

Dettagli

II Esonero - Testo B

II Esonero - Testo B Dip. di Ingegneria, Univ. Roma Tre Prof. E. Scoppola, Dott.M. Quattropani Probabilità e Statistica, 2017-18, I semestre 29 Gennaio 2018 II Esonero - Testo B Cognome Nome Matricola Esercizio 1. (20%) Si

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Stima Puntuale Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio In ciascuno dei casi seguenti determinare quale tra i due stimatori S e T per il parametro θ è distorto

Dettagli

Stima puntuale di parametri

Stima puntuale di parametri Probabilità e Statistica Esercitazioni a.a. 006/007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A

Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A Università di Siena Teoria della Stima Lucidi del corso di A.A. 2002-2003 Università di Siena 1 Indice Approcci al problema della stima Stima parametrica Stima bayesiana Proprietà degli stimatori Stime

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 II Esonero - 10 Gennaio 2014 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Regressione lineare. Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche.

Regressione lineare. Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche. Regressione lineare Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche Siano x ed y due variabili legate tra loro da una forma funzionale del

Dettagli

Statistica 2 parte ARGOMENTI

Statistica 2 parte ARGOMENTI Statistica 2 parte ARGOMENTI Vettori gaussiani Matrice di covarianza e sua positività Marginali di un vettore normale Trasformazioni affini di vettori normali Indipendenza delle componenti scorrelate di

Dettagli

UNIVERSITÀ DEGLI STUDI DI PERUGIA

UNIVERSITÀ DEGLI STUDI DI PERUGIA SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale

Dettagli

La famiglia di distribuzioni normali asimmetriche

La famiglia di distribuzioni normali asimmetriche Università Roma Tre Facoltà Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Matematica Tesi di Laurea in Matematica La famiglia di distribuzioni normali asimmetriche Alcune proprietà Relatore:

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Intervalli di confidenza Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Verifica di ipotesi. Parte VI. Verifica di ipotesi

Verifica di ipotesi. Parte VI. Verifica di ipotesi Parte VI Verifica di ipotesi Definizione (Sistema di ipotesi) Nell ambito di un modello statistico parametrico, un sistema di ipotesi statistiche è costituito da due congetture, incompatibili, sul parametro

Dettagli

Università di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti

Università di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti Università di Siena Corso di STATISTICA Parte seconda: Teoria della stima Andrea Garulli, Antonello Giannitrapani, Simone Paoletti Master E 2 C Centro per lo Studio dei Sistemi Complessi Università di

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

ANALISI DELLE SERIE STORICHE

ANALISI DELLE SERIE STORICHE ANALISI DELLE SERIE STORICHE De Iaco S. s.deiaco@economia.unile.it UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di

Dettagli

Elementi di Probabilità e Statistica - 052AA - A.A

Elementi di Probabilità e Statistica - 052AA - A.A Elementi di Probabilità e Statistica - 05AA - A.A. 014-015 Prima prova di verifica intermedia - 9 aprile 015 Problema 1. Dati due eventi A, B, su uno spazio probabilizzato (Ω, F, P), diciamo che A è in

Dettagli

Modelli lineari generalizzati

Modelli lineari generalizzati Capitolo 5 Modelli lineari generalizzati I modelli lineari generalizzati costituiscono un estensione del modello lineare generale e servono anch essi allo studio della dipendenza in media di una variabile

Dettagli

Richiami di probabilità e statistica

Richiami di probabilità e statistica Richiami di probabilità e statistica Una variabile casuale (o aleatoria) X codifica gli eventi con entità numeriche x ed è caratterizzata dalla funzione di distribuzione di probabilità P(x) : P(x)=Pr ob[x

Dettagli

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

I modelli probabilistici

I modelli probabilistici e I modelli probabilistici Finora abbiamo visto che esistono modelli probabilistici che possiamo utilizzare per prevedere gli esiti di esperimenti aleatori. Naturalmente la previsione è di tipo probabilistico:

Dettagli

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell ' Lezione 2 Argomenti della lezione: La statistica inferenziale: concetti di base Campionamento Stima Distribuzione campionaria Popolazione (o universo) Insieme di tutti gli elementi cui si rivolge il ricercatore

Dettagli

P ( X n X > ɛ) = 0. ovvero (se come distanza consideriamo quella euclidea)

P ( X n X > ɛ) = 0. ovvero (se come distanza consideriamo quella euclidea) 10.4 Convergenze 166 10.4.3. Convergenza in Probabilità. Definizione 10.2. Data una successione X 1, X 2,...,,... di vettori aleatori e un vettore aleatorio X aventi tutti la stessa dimensione k diremo

Dettagli

25 - Funzioni di più Variabili Introduzione

25 - Funzioni di più Variabili Introduzione Università degli Studi di Palermo Facoltà di Economia CdS Statistica per l Analisi dei Dati Appunti del corso di Matematica 25 - Funzioni di più Variabili Introduzione Anno Accademico 2013/2014 M. Tumminello

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

RACCOLTA DI STATISTICHE TEST disponibili nell ambiente R

RACCOLTA DI STATISTICHE TEST disponibili nell ambiente R RACCOLTA DI STATISTICHE TEST disponibili nell ambiente R Materiale integrativo relativo al Modulo I Verifica d ipotesi e stima intervallare a cura di A.R. Brazzale 1 alessandra.brazzale@isib.cnr.it 3 aprile

Dettagli

Le derivate parziali

Le derivate parziali Sia f(x, y) una funzione definita in un insieme aperto A R 2 e sia P 0 = x 0, y 0 un punto di A. Essendo A un aperto, esiste un intorno I(P 0, δ) A. Preso un punto P(x, y) I(P 0, δ), P P 0, possiamo definire

Dettagli

Geometria analitica: rette e piani

Geometria analitica: rette e piani Geometria analitica: rette e piani parametriche Allineamento nel piano nello spazio Angoli tra rette e distanza 2 2006 Politecnico di Torino 1 Esempio 2 Sia A = (1, 2). Per l interpretazione geometrica

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

APPLICAZIONI. Im f = {b B a A tale che f (a) = b}.

APPLICAZIONI. Im f = {b B a A tale che f (a) = b}. APPLICAZIONI Diremo applicazione (o funzione) da un insieme A ad un insieme B una legge f che associa ad ogni elemento a A uno ed un solo elemento b B. Scriviamo f : A B e il corrispondente o immagine

Dettagli

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017 Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................

Dettagli

Richiami di Algebra Lineare

Richiami di Algebra Lineare Università di Pavia Richiami di Algebra Lineare Eduardo Rossi Vettori a : (n 1) b : (n 1) Prodotto interno a b = a 1 b 1 + a 2 b 2 +... + a n b n Modulo (lunghezza): a = a 2 1 +... + a2 n Vettori ortogonali:

Dettagli

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto

Dettagli

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = + ESERCIZIO 6.1 Si considerino i 0 campioni di ampiezza n = estratti da una popolazione X di N = 5 elementi distribuiti normalmente, con media µ = 13,6 e σ = 8,33. A partire dalle 0 determinazioni della

Dettagli

Richiami di Algebra Lineare

Richiami di Algebra Lineare Richiami di Algebra Lineare Eduardo Rossi Università degli Studi di Pavia Corso di Econometria Marzo 2012 Rossi Algebra Lineare 2012 1 / 59 Vettori Prodotto interno a : (n 1) b : (n 1) a b = a 1 b 1 +

Dettagli

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori. Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri

Dettagli

Esperimentazioni di Fisica 1. Prova d esame del 20 febbraio 2018 SOLUZIONI

Esperimentazioni di Fisica 1. Prova d esame del 20 febbraio 2018 SOLUZIONI Esperimentazioni di Fisica 1 Prova d esame del 20 febbraio 2018 SOLUZIONI Esp-1-Soluzioni - - Page 2 of 6 01/02/2018 1. (12 Punti) Quesito. In un esperimento è stata misurata la grandezza Y in funzione

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2017/2018. Giovanni Lafratta

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2017/2018. Giovanni Lafratta Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2017/2018 Giovanni Lafratta ii Indice 1 Spazi, Disegni e Strategie Campionarie 1 2 Campionamento casuale

Dettagli

Richiami di Algebra Lineare

Richiami di Algebra Lineare Richiami di Algebra Lineare Fabrizio Silvestri December 14, 010 Matrice Sia R il campo dei numeri reali. Si indica con R m n l insieme delle matrici ad elementi reali con m righe ed n colonne. Se A R n

Dettagli

Risposta in vibrazioni libere di un sistema lineare viscoso a più gradi di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1

Risposta in vibrazioni libere di un sistema lineare viscoso a più gradi di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1 Risposta in vibrazioni libere di un sistema lineare viscoso a più gradi di libertà Prof. Adolfo Santini - Dinamica delle Strutture 1 Vibrazioni libere non smorzate 1/6 Le equazioni del moto di un sistema

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Geometria analitica: rette e piani

Geometria analitica: rette e piani Geometria analitica: rette e piani Equazioni del piano Intersezioni di piani. Rette nello spazio Fasci di piani e rette Intersezioni fra piani e rette Piani e rette ortogonali Piani di forma parametrica

Dettagli

Analisi Multivariata Prova intermedia del 20 aprile 2011

Analisi Multivariata Prova intermedia del 20 aprile 2011 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Allora esistono δ > 0 e σ > 0 tali che. f(x, y) = 0; (2) la funzione ϕ : ]x 0 δ, x 0 + δ [ R, y = ϕ(x), è derivabile e.

Allora esistono δ > 0 e σ > 0 tali che. f(x, y) = 0; (2) la funzione ϕ : ]x 0 δ, x 0 + δ [ R, y = ϕ(x), è derivabile e. 16 42 Funzioni implicite Il seguente teorema fornisce una condizione sufficiente affinché, data un equazione della forma f(x, ) = 0, sia possibile determinare come funzione della x Teo 11 (Teorema della

Dettagli

VETTORI DI VARIABILI ALEATORIE

VETTORI DI VARIABILI ALEATORIE VETTOI DI VAIABILI ALEATOIE E. DI NADO 1. Funzioni di ripartizione congiunte e marginali Definizione 1.1. Siano X 1, X 2,..., X n v.a. definite su uno stesso spazio di probabilità (Ω, F, P ). La n-pla

Dettagli

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa L ipotesi che si vuole testare: H 0 (ipotesi nulla)

Dettagli

SCHEDA DIDATTICA N 7

SCHEDA DIDATTICA N 7 FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA CIVILE CORSO DI IDROLOGIA PROF. PASQUALE VERSACE SCHEDA DIDATTICA N 7 LA DISTRIBUZIONE NORMALE A.A. 01-13 La distribuzione NORMALE Uno dei più importanti

Dettagli

MATRICI E SISTEMI LINEARI

MATRICI E SISTEMI LINEARI MATRICI E SISTEMI LINEARI - PARTE I - Felice Iavernaro Dipartimento di Matematica Università di Bari 27 Febbraio 2006 Felice Iavernaro (Univ. Bari) Matrici e Sistemi lineari 27/02/2006 1 / 1 Definizione

Dettagli

Disuguaglianza di Cramér-Rao

Disuguaglianza di Cramér-Rao Disuguaglianza di Cramér-Rao (Appunti per gli studenti Silvano Holzer Dipartimento di Scienze Economiche, Aziendali, Matematiche e Statistiche Bruno de Finetti Università degli studi di Trieste Un esperimento

Dettagli

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017 Giovanni Lafratta ii Indice 1 Spazi, Disegni e Strategie Campionarie 1 2 Campionamento casuale

Dettagli

TEORIA DEI SISTEMI ANALISI DEI SISTEMI LTI

TEORIA DEI SISTEMI ANALISI DEI SISTEMI LTI TEORIA DEI SISTEMI Laurea Specialistica in Ingegneria Meccatronica Laurea Specialistica in Ingegneria Gestionale Indirizzo Gestione Industriale TEORIA DEI SISTEMI ANALISI DEI SISTEMI LTI Ing. Cristian

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie Le distribuzioni campionarie sono quelle che derivano dalla presenza di campioni i.i.d. a distribuzione normale. Definizione. Se X è una v.a. avente distribuzione N(0, ), allora Y = X ha distribuzione

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

FONDAMENTI DI ALGEBRA LINEARE E GEOMETRIA INGEGNERIA CHIMICA E DEI MATERIALI 27 GIUGNO 2016

FONDAMENTI DI ALGEBRA LINEARE E GEOMETRIA INGEGNERIA CHIMICA E DEI MATERIALI 27 GIUGNO 2016 FONDAMENTI DI ALGEBRA LINEARE E GEOMETRIA INGEGNERIA CHIMICA E DEI MATERIALI 7 GIUGNO 06 MATTEO LONGO Ogni versione del compito contiene solo due tra i quattro esercizi 6-7-8-9. Esercizio. Considerare

Dettagli