Statistica inferenziale

Documenti analoghi
Intervallo di confidenza

Statistica Inferenziale

La media campionaria. MEDIA CAMPIONARIA Date n v.a. X 1,..., X n indipendenti e identicamente distribuite (in breve i.i.d.), la v.a.

Modelli descrittivi, statistica e simulazione

Contenuto del capitolo

Campionamento e stima di parametri

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Verifica delle ipotesi

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

Intervalli di confidenza

ESAME. 9 Gennaio 2017 COMPITO B

Laboratorio di Probabilità e Statistica

STATISTICA ESERCITAZIONE

ESAME. 9 Gennaio 2017 COMPITO A

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Il Teorema del limite Centrale (TLC)

DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34

Parametri statistici

II Esonero - Testo B

LE DISTRIBUZIONI CAMPIONARIE

Intervallo di confidenza.

Dispensa di Statistica

Metodi statistici per le ricerche di mercato

Probabilità e Statistica Esercitazioni. a.a. 2017/2018. C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica

Approssimazione normale alla distribuzione binomiale

Distribuzione normale

DISTRIBUZIONI DI CAMPIONAMENTO

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Statistica Metodologica

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Intervalli di confidenza

Probabilità e Statistica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

ELEMENTI DI STATISTICA INFERENZIALE ELEMENTI DI STATISTICA INFERENZIALE

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Esercizi. 1. Sia X una variabile aleatoria normale N(3.2, 1.44). Calcolare

LEZIONI DI STATISTICA MEDICA

lezione 4 AA Paolo Brunori

Probabilità e Statistica

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

05. Errore campionario e numerosità campionaria

Distribuzioni campionarie. Antonello Maruotti

Variabili aleatorie gaussiane

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE

Inferenza su una popolazione

Statistica Inferenziale

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

ESERCIZIO 1 Si considerino n v.c. Xi (i = 1,, n) tra loro indipendenti e somiglianti con media 10 e varianza 4. Si determini:

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica 1- parte II

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Elementi di Psicometria con Laboratorio di SPSS 1

Il campionamento e l inferenza. Il campionamento e l inferenza

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Intervallo di confidenza

Intervalli di confidenza

Esercizio 1. La variabile casuale G, somma di due V.C. normali, si distribuisce anch essa come una normale.

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

assuma valori in un determinato intervallo è data dall integrale della sua densità ( = )=

Metodi Statistici per il Marketing. #05 Elementi di statistica inferenziale e di teoria dei campioni

Metodi statistici per le ricerche di mercato

Matematica con elementi di Informatica

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

1. Quali sono i possibili campioni di numerosità 2 senza reimmissione? X 1 e X 2 sono indipendenti?

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

Corso di Statistica - Prof. Fabio Zucca IV Appello - 5 febbraio Esercizio 1

Esercitazione 3 - Statistica (parte II) Davide Passaretti 23/2/2017

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Corso in Statistica Medica

tabelle grafici misure di

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

ESERCITAZIONE 21 : VARIABILI ALEATORIE CONTINUE

Esercizi di statistica

Distribuzione Normale

LA MEDIA CAMPIONARIA 14-1

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

ESERCIZIO 1. a) Calcolare il rendimento atteso del portafoglio:

La verifica delle ipotesi

Capitolo 8. Probabilità: concetti di base

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Elementi di Psicometria con Laboratorio di SPSS 1

APPUNTI DI STATISTICA INFERENZIALE. Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

Distribuzione Normale

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati.

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 1-20/01/2010: A. Matricola: Corso:

Intervallo di confidenza

Distribuzioni campionarie

LEZIONE 2.6. corso di statistica. Francesco Lagona Università Roma Tre. LEZIONE 2.6 p. 1/15

Statistica Inferenziale

Brevi cenni all intervallo di confidenza

Dato che i risultati ottenuti tramite campioni casuali ed esperimenti comparativi sono legati al caso, non possiamo essere certi che le nostre

Esercitazione 8 maggio 2014

Elementi di Psicometria (con laboratorio software 1)

Statistica Applicata all edilizia: Stime e stimatori

Distribuzioni e inferenza statistica

Stima Puntuale e per Intervallo. Stimatore e stima. Pietro Coretto Università degli Studi di Salerno

07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

Transcript:

Statistica inferenziale

Problema Nello studio delle distribuzioni teoriche di probabilità si suppone di conoscere i principali parametri della popolazione che esaminiamo (ad esempio la media, varianza). Nelle applicazioni, i valori di questi parametri non sono noti. È troppo costoso o addirittura impossibile conoscere tutti i dati, individuo per individuo. Occorre perciò risalire a questi parametri utilizzando le informazioni contenute in un campione di osservazioni. Il processo attraverso il quale si traggono conclusioni su un intera popolazione in base ad un campione si chiama inferenza statistica.

Stima intervallare Se per esempio se fossimo intressati al peso dei maschi in una certa regione, potremmo annotarne il perso x 1,...,x n di n individui scelti a caso e utilizzare la media campionaria x = 1 n x i n i=1 come stima puntuale per la media µ della popolazione. Però, da solo, questo numero non ha alcun significato: anche nelle migliori delle condizioni x non sarà mai esattamente uguale a µ. Al più potremmo fare una stima intervallare di µ. Ovvero trovare un intervallo I, per esempio [ x ε, x +ε ], che con (buona) probabilità p contenga µ. Questo intervallo I si chiama intervallo di confidenza e la probabilità p si chiama livello di confidenza.

Stima intervallare L intervallo di confidenza ed il livello di confidenza non sono variabili indipendenti. Più alto il livello di confidenza più grande dovrà essere l intervallo di confidenza (quindi più imprecisa la misura). E viceversa. Possiamo prima fissare l ampiezza dell intervallo di confidenza e ottenere un livello di confidenza, o più comunemente fissare un livello di confidenza e ottenere la minima l ampiezza dell intervallo di confidenza.

Stimatori Vediamo ora precisamente la relazione tra intervallo di confidenza e livello di fiducia. Consideriamo x come il risultato di una variabile aleatoria. Se il campione è scelto casualmente, la media ottenuta da diversi campioni varierà con una legge che ora cercheremo di determinare. Un campione di n individui viene considerato come un insieme di n variabili aleatorie indipendenti: X 1,...,X n identicamente distribuite. La variabile aleatoria media campionaria X è X = 1 n X i n i=1 Per esempio, se siamo interessati al peso degli individui di una popolazione e consideriamo un campione di 10 individui, X 2 è il peso del secondo individuo considerato.

Stimatori La distribuzione di probabilità di X si chiama distribuzione della media campionaria con campioni di dimensione n. Si dice che X è uno stimatore del parametro µ. Il numero n si chiama dimensione o taglia del campione, in inglese size. Siamo interessati alle seguenti due questioni: Fissamo un ε vogliamo calcolare P ( X ε µ X +ε ). Ovvero fissati un intervallo di cofidenza determinare il livello di confidenza. Fissamo un s vogliamo calcolare ε tale che P ( X ε µ X +ε ) = s. Ovvero fissato un livello di confidenza determinare un intervallo di confidenza.

Digressione: la scelta del campione La scelta del campione è una procedura importante da compiere con attenzione. È un problema molto difficile di cui non ci occuperemo. Ad esempio nel campionare le intenzioni di voto potrebbe essere un errore ricavare i loro nomi da un elenco telefonico, perché verrebbero ad essere mal rappresentate le persone che non dispongono del telefono o che hanno optato per non comparire nell elenco. Per esempio, se vogliamo valutare la pressione diastolica media per una determinata popolazione non possiamo accettare volontari per comporre il nostro campione.

La distribuzione di X Supponiamo che v.a.i. X 1,...,X n abbiano la stessa distribuzione con media µ e deviazione standard σ. Allora è facile verificare che X è una v.a. con media µ e deviazione standard σ n. Quindi Var( X) 0 per n. Ovvero con buona probabilità il valore di X non è distante da µ. Un teorema che non dimostreremo: la somma di v.a. normali indipendenti ha a sua volta distribuzione normale. Segue che se X 1,...,X n hanno distribuzione N(µ,σ 2 ) allora ) X ha distribuzione N (µ, σ2. n

Teorema del Limite Centrale In generale quando X 1,...,X n sono v.a. indipendenti equidistribuite (ma non necessariamente normali) il seguente teorema ci da informazioni sulla distribuzione di X. Il Teorema del Limite Centrale afferma che quando n è abbastanza grande ) X è una v.a. con distribuzione approssimativamente N (µ, σ2. n Equivalentemente: la v.a. Z = X µ σ/ n ha approssimativamente distribuzione N(0, 1). In questo corso non è possibile introdurre le nozioni che permenttono di enunciare il teorema in maniera precisa. Una regola empirica è ritenere che l approssimazione sufficientemente buona per n 30

Esempio 1a Consideriamo la distribuzione dei livelli di colesterolo in individui di età compresa fra i 20 ei 74 anni. La media della popolazione è µ = 212mg/dL e la deviazione standard è σ = 56mg/dL. Selezioniamo campioni ripetuti di dimensione n = 49 dalla popolazione. Qual è la probabilità che la media campionaria sia superiore a 230 mg/dl? Ci interessa P( X 230). Dal teorema del limite centrale X ha distribuzione (approssimativamente) normale con media µ = 212 mg/dl ed errore standard σ/ n = 56/7 = 8. La variabile Z = ( X 212)/8 è una normale standardizzata. Dunque P( X 230) = P(Z (230 212)/8) = P(Z 2.25). Dalla tabella della distribuzione normale, l area a destra di z = 2.25 è 0.01. Quindi circa l 1% dei campioni di dimensione 49 avrà una media maggiore o uguale a 230mg/dL.

Esempio 1b Consideriamo la distribuzione dei livelli di colesterolo in individui di età compresa fra i 20 ei 74 anni. La media della popolazione è µ = 212mg/dL e la deviazione standard è σ = 56mg/dL. Selezioniamo campioni ripetuti di dimensione n = 49 dalla popolazione. Trovare il minimo ε tale che la media campionaria appartiene all intervallo [ µ ε,µ+ε ] con probabilità del 95%. Vogliamo trovare ε tale che P(µ ε X µ+ε) = 0.95 ovvero tale che P(ε/8 Z ε/8) = 0.95. Dalla tavola della distribuzione N(0,1) sappiamo che 0.95 = P ( 1.96 Z 1.96 ) quindi ε = 8 1.96 = 15.68

Esempio 1c Consideriamo la distribuzione dei livelli di colesterolo in individui di età compresa fra i 20 ei 74 anni. La media della popolazione è µ = 212mg/dL e la deviazione standard è σ = 56mg/dL. Qual è la minima dimensione del campione affinché la media campionaria sia compresa nell intervallo [ µ 5,µ+5 ] con una probabilità del 95%? Dobbiamo trovare una n per cui P(µ 5 X µ+5) = 0.95 ovvero tale che ( P 5 σ/ n Z 5 ) σ/ = 0.95 n Dalla tabella troviamo 1.96 = 5 σ/ n e risolvendo otteniamo n = 369.