Documenti analoghi
E naturale chiedersi alcune cose sulla media campionaria x n

Metodi statistici per le ricerche di mercato

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Inferenza statistica. Statistica medica 1

Prova di autovalutazione Prof. Roberta Siciliano

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

VERIFICA DELLE IPOTESI

Elementi di Psicometria con Laboratorio di SPSS 1

3. Confronto tra medie di due campioni indipendenti o appaiati

Statistiche campionarie

1. Distribuzioni campionarie

Metodi statistici per le ricerche di mercato

Il confronto fra proporzioni

Statistica. Lezione 6

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Istituzioni di Statistica e Statistica Economica

DISTRIBUZIONI DI PROBABILITÀ

VERIFICA DELLE IPOTESI

Istituzioni di Statistica e Statistica Economica

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Verifica di ipotesi

Elementi di Psicometria con Laboratorio di SPSS 1

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Facoltà di Psicologia Università di Padova Anno Accademico

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Concetto di potenza statistica

Esercitazioni di Statistica

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

R - Esercitazione 5. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. Lunedì 2 Dicembre Università Roma Tre

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

La variabile casuale Binomiale

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

La distribuzione Gaussiana

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica inferenziale

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

STATISTICA IX lezione

Temi di Esame a.a Statistica - CLEF

Esercizi del Corso di Statistica. Parte I - Variabili Aleatorie Continue

LEZIONE n. 5 (a cura di Antonio Di Marco)

Esercitazione n.2 Inferenza su medie

INCERTEZZA DI MISURA

Analisi di dati di frequenza

Il concetto di valore medio in generale

Controllo Statistico della Qualità. Qualità come primo obiettivo dell azienda produttrice di beni

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Capitolo 11 Test chi-quadro

La distribuzione Normale. La distribuzione Normale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

SPC e distribuzione normale con Access

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

MINIMI QUADRATI. REGRESSIONE LINEARE

Corso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Analisi statistica degli errori

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

VARIABILI ALEATORIE CONTINUE

Finanza matematica - Lezione 01

STATISTICA INFERENZIALE

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

l insieme delle misure effettuate costituisce il campione statistico

Corso di Psicometria Progredito

Teoria della Stima. Stima della Media e di una Porzione di Popolazione. Introduzione. Corso di Laurea in Scienze Motorie AA2002/03 - Analisi dei Dati

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

4. Confronto tra medie di tre o più campioni indipendenti

Facciamo qualche precisazione

ESAME DI STATISTICA Nome: Cognome: Matricola:

Calcolo delle probabilità

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

11. Analisi statistica degli eventi idrologici estremi

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Elementi di Psicometria con Laboratorio di SPSS 1

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI

GESTIONE INDUSTRIALE DELLA QUALITÀ A

Misure della dispersione o della variabilità

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

1. la probabilità che siano tutte state uccise con pistole; 2. la probabilità che nessuna sia stata uccisa con pistole;

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

1 Modelli di variabili aleatorie continue

La statistica multivariata

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

Relazioni statistiche: regressione e correlazione

Corso di Automazione Industriale 1. Capitolo 4

Rapporto dal Questionari Insegnanti

GESTIONE DELLE TECNOLOGIE AMBIENTALI PER SCARICHI INDUSTRIALI ED EMISSIONI NOCIVE LEZIONE 10. Angelo Bonomi

Esercizi di Probabilità e Statistica

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

19txtI_BORRA_ /11/13 10:52 Pagina 449 TAVOLE STATISTICHE

Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Transcript:

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una misura dell errore commesso. Inoltre, dato il campione X 1,...,X n estratto da una distribuzione di probabilità caratterizzata da un parametro incognito θ, qualunque sia lo stimatore h(x1,...,xn) scelto per stimare θ, esso dipende dal campione, ovvero lo stimatore fornirà stime diverse in corrispondenza di campioni diversi

Stima per intervalli Queste due osservazioni fanno nascere l esigenza di considerare stime per intervalli. Infatti, sulla base dei valori di stima ottenuti considerando un campione casuale X1,...,Xn, si può definire un intervallo in cui sono compresi i valori più probabili per il parametro θ, secondo un livello di confidenza fissato.

Stima per intervalli Si può procedere indirettamente utilizzando una statistica campionaria g(x 1,...,Xn) la cui distribuzione sia nota e non dipendente da θ. Naturalmente, visto che la g è nota, fissato un livello di confidenza (1 α), è possibile determinare due valori g1 e g2, indipendenti da θ tali che, comunque scelto α (0, 1) P(g1 g g2) = 1 α..

Stima per intervalli Lo scopo è quello di tradurre una probabilità su un intervallo per g in una probabilità su intervallo per θ in modo da poter avere P(h1 θ h2) = 1 α ovvero in modo tale che h1 e h2 rappresentino gli estremi dell intervallo per θ. Le distribuzioni note alle quali si fa di solito riferimento sono la distribuzione Normale, la distribuzione t di Student e la distribuzione Chi quadro..

Stima per intervalli Lo scopo sarà quello di avere valore di α ben superiore a 0.5 in modo che la probabilità che il parametro θ appartenga all intervallo [h1, h2] sia tale da assicurare all evento h1 θ h2 (evento che si verifica nel 100(1 α)% dei casi) una caratteristica di sistematicità, mentre all evento complementare (che si verifica nel 100α% dei casi) una caratteristica di accidentalità..

Intervallo di confidenza Dato un campione X1,...,Xn, dato α (0, 1) e date le statistiche h1 = h1(x 1,,X n ) e h2 = h2(x 1,,Xn) h1 < h2, per le quali P(h1 θ h2) = 1 α, l intervallo [h1, h2] si dice intervallo di confidenza per θ con livello di confidenza pari ad (1 α).

Stima per intervalli di una MEDIA Siano date le osservazioni X1,...,Xn estratte da una distribuzione di probabilità a media µ e varianza σ 2. Assumiamo inizialmente che la media µ sia incognita mentre la varianza sia nota. Dal teorema del limite Centrale sappiamo che per n sufficientemente grande, la variabile aleatoria campionaria è distribuita approssimativamente secondo la distribuzione Normale standard indipendentemente dalla distribuzione delle Xi. Z = X / σ µ N

Stima per intervalli di una MEDIA La variabile Z è una v.a. nota di cui si conosce la densità di probabilità che si trova tabulata in tutti i libri di statistica, quindi è facile calcolare l intervallo in cui abbiamo probabilità di trovare Z.

Stima per intervalli di una MEDIA Ad esempio, per determinare un intervallo di confidenza al 95% per una media, dato un campione X1,...,Xn, si trova il punto critico z 1 a/2 = z 0.975 = 1.96 dalle tabelle della distribuzione Normale standard facilmente si ricava tale intervallo x N 1.96 σ n, x N + 1.96 σ n

Stima per intervalli La stima per intervalli consiste nel determinare in base a valori del campione, un intervallo che contenga il parametro da stimare, con un certo grado di incertezza ritenuto accettabile. Data una v.a. gaussiana N(µ,σ 2 ) con varianza nota pari a σ 2 = 9, si vogliono ottenere informazioni sul valor medio µ utilizzando un campione X di 4. Con un intervallo di confidenza del 95%

Esempio La media aritmetica del campione (media campionaria), è anch essa una v.a. gaussiana con valor medio pari a µ e varianza pari σ 2 /N dove N è la dimensione del campione. Consideriamo la variabile gaussiana standard Z espressa dalla relazione Z X µ 2 = = X σ / N 3 ( µ )

Esempio La variabile Z è una v.a. nota di cui si conosce la densità di probabilità che si trova tabulata in tutti i libri di statistica, quindi è facile ^ calcolare l intervallo in cui abbiamo il 95% di probabilità di trovare Z: { 1.96 < Z < 1.96} 0. 95 Pr = Pr 2.94 < ( X µ ) < 2.94 = { } 0. 95 { X 2.94 < µ < X + 2.94} 0. 95 Pr = Sostituendo alla media campionaria il valore ottenuto dai dati osservati si ricava l intervallo a cui appartiene µ con un incertezza pari al 5%

Esempio Se ad esempio il campione osservato ha valori (1.2, 3.4, 0.6, 5.6) la media campionaria assume valore 2.7, e con la tecnica della stima per punti avremmo detto che il valore stimato di µ è proprio 2.7. Invece con la tecnica della stima per intervalli, diciamo che µ appartiene all intervallo [-0.24, 5.6] con un livello di incertezza del 5%. Ζ µ X 2.94 X + 2. 94

Varianza non nota Se σ 2 non si conosce sono necessarie altre considerazioni. Se il numero di osservazioni è elevato, per il Teorema del Limite Centrale, è possibile approssimare la varianza con la varianza campionaria, e l approccio rimane lo stesso: Z = Per n sufficientemente elevato possiamo ancora considerare la distribuzione Normale standard X s / µ N

Varianza non nota La difficoltà nell utilizzare questo tipo di intervallo di confidenza per µ sta nel fatto che esso ha valore asintotico, ovvero per n sufficientemente grande e quindi risulta approssimato. Ovvero per valori piccoli di n si può utilizzare una definizione alternativa dell intervallo di confidenza che fa riferimento alla distribuzione t di Student a n 1 gradi di libertà.

Varianza non nota Se le Xi sono variabili Normali, la variabile T = N 1 X µ S ha distribuzione t di Student con n 1 gradi di libertà per ogni n > 1. Poiché T dipende solo da µ (parametro da stimare) e dal valore del campione può essere utilizzata per determinare l intervallo di fiducia, in particolare X µ Pr t1 < N 1 < t2 = 1 γ S

Varianza non nota t1 t2 Pr X S < µ < X + S = 1 γ N 1 N 1 Analogamente per determinare l intervallo di fiducia per la stima della varianza utilizziamo una v.a. χ2 { 2 x < χ < } = 1 γ Pr 1 x2 2 NS Pr x1 < < x2 = 1 γ 2 σ

Stime per intervalli Ricordiamo le proprietà utilizzate: Data una popolazione Normale, se si normalizza la media campionaria Xn sottraendo la sua media µ dividendo per la sua deviazione standard σ/ n, si ottiene una variabile aleatoria Normale standard; dividendo per s n / n, si ottiene una variabile aleatoria con distribuzione t di Student con n 1 gradi di libertà.

Stime per intervalli L intervallo di confidenza definito in riferimento alla distribuzione Normale standard è basato sul Teorema del Limite Centrale e la copertura dipende dalla scelta di n. L intervallo di confidenza definito in riferimento alla distribuzione t di Student è approssimato perchè influenzato dalla distribuzione delle Xi che in generale non sono Normali; tuttavia questo secondo tipo di intervallo di confidenza ha maggiore copertura dell altro.

Stime per intervalli In generale la tecnica impiegata per costruire un intervallo di fiducia consiste nel costruire una variabile aleatoria Z funzione del campione e del parametro che si vuole stimare, la cui legge di distribuzione sia però indipendente dal parametro.

Stime per intervalli La variabile normale standard può essere utilizzata soltanto quando è nota la varianza La variabile T student dipende solo dal valor atteso e dal valore del campione, quindi può essere utilizzata per determinare l intervallo di fiducia per la stima del valor atteso. La variabile χ 2 serve per determinare l intervallo di fiducia per la stima della varianza