Esempio (Azzalini, pp. 6-15)

Documenti analoghi
Il campionamento e l inferenza. Il campionamento e l inferenza

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

LEZIONI DI STATISTICA MEDICA

Distribuzioni campionarie. Antonello Maruotti

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Statistica Inferenziale

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Statistica Inferenziale

LE DISTRIBUZIONI CAMPIONARIE

Statistica Sociale e Criminale (12 CFU) A.A. 2015/2016

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Statistica descrittiva e statistica inferenziale

Variabili casuali. - di Massimo Cristallo -

STATISTICA ESERCITAZIONE

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

PROBABILITÀ ELEMENTARE

Campionamento La statistica media campionaria e la sua distribuzione

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Statistica Applicata all edilizia: alcune distribuzioni di probabilità

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Tipi di variabili. Indici di tendenza centrale e di dispersione

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Probabilità. Lezioni : 11, 12. Docente: Alessandra Durio

Esercitazioni di Statistica

Distribuzioni campionarie

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

Cap. 7 Distribuzioni campionarie

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

DISTRIBUZIONI DI CAMPIONAMENTO

Schema lezione 5 Intervalli di confidenza

Presentazione dell edizione italiana

1. Descrivere gli spazi campionari dei seguenti esperimenti casuali: 1. lancio di un dado 2. lancio di due dadi 3.

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo

STATISTICA ESERCITAZIONE 9

a) 36/100 b) 1/3 c)

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Distribuzioni e inferenza statistica

Elementi di statistica per l econometria

L indagine campionaria Lezione 3

La progettazione di un indagine statistica

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

LEZIONE 2.5. corso di statistica. Francesco Lagona Università Roma Tre. LEZIONE 2.5 p. 1/12

Test delle Ipotesi Parte I

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale;

Teoria e tecniche dei test

Contenuti: Capitolo 14 del libro di testo

TEST n La funzione di ripartizione di una variabile aleatoria:

Casa dello Studente. Casa dello Studente

Sperimentazioni di Fisica I mod. A Statistica - Lezione 3

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Statistica Inferenziale

Corso di Statistica. Distribuzioni di probabilità per variabili casuali discrete. Prof.ssa T. Laureti a.a

Esercizi su variabili aleatorie discrete

3.1 La probabilità: eventi e variabili casuali

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

Intervallo di confidenza

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

Ulteriori Conoscenze di Informatica e Statistica

Statistica Inferenziale

un elemento scelto a caso dello spazio degli esiti di un fenomeno aleatorio;

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Esercitazione 7 del corso di Statistica (parte 1)

05. Errore campionario e numerosità campionaria

Elementi di base su modello binomiale e modello normale

Inferenza statistica Donata Rodi 04/10/2016

Scopo del Corso: Lezione 1. La Probabilità. Organizzazione del Corso e argomenti trattati: Prerequisiti:

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

Statistica Capitolo 1 Perchè h st d u i diare la st ti a sti? ca Cap. 1-1

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Esercizi di Probabilità e Statistica

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Modelli probabilistici variabili casuali

Esercizi/domande su spazio campionario, eventi ed insiemistica. Daniela Bertacchi

standardizzazione dei punteggi di un test

Probabilità e Statistica Esercitazioni. a.a. 2009/2010. C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica.

Calcolo della probabilità

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2

Università di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti

POPOLAZIONE CAMPIONE

Statistica Inferenziale

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

Teorema del limite centrale TCL

p k q n k = p n (k) = n 12 = 1 = ,1208. q = 1 2 e si ha: p 12 (8) =

DISTRIBUZIONE NORMALE (1)

Statistica 1- parte II

Statistica Inferenziale

CALCOLO DELLE PROBABILITÀ - 9 giugno 1998 Scrivere le risposte negli appositi spazi Motivare dettagliatamente le risposte su fogli allegati

Stima diretta della domanda di trasporto

4. Si supponga che il tempo impiegato da una lettera spedita dall Italia per arrivare a destinazione segua una distribuzione normale con media

0 z < z < 2. 0 z < z 3

Esercizi di Calcolo combinatorio: disposizioni

QUINCUNX: IL TUBO DI GALTON Prof. Antonio Lanzotti

STATISTICA A D (72 ore)

Transcript:

Inferenza statistica procedimento per indurre le caratteristiche non note di un aggregato a partire dalle informazioni disponibili su una parte di esso. Obiettivo del corso presentare la teoria ed i metodi statistici che presiedono a tale procedimento. In particolare: - metodi basati sul concetto di verosimiglianza; - metodi parametrici; - metodi per la stima e la verifica di ipotesi. Un po di terminologia Unità statistiche elementi che compongono la popolazione e il campione (individui, soggetti, casi). Variabili caratteristiche (qualitative o quantitative) delle unità statistiche cui è rivolto l interesse dell inferenza statistica. Esempio (Azzalini, pp. 6-15) Popolazione partita di 5000 guarnizioni in materiale plastico Obiettivo valutare la qualità dei pezzi forniti Unità statistica la guarnizione della partita Variabile conformità delle guarnizioni alle specifiche tecniche Modalità della variabile: conforme/ non conforme (difettoso). In simboli: Conformità alle specifiche tecniche Non conforme 1 Conforme 0 θ = probabilità di produzione di una guarnizione non conforme Y Ber(θ), con 0 θ 1 Y (modello probabilistico del problema inferenziale) 1 2

Principali ragioni per il ricorso ad un campione: 1) esigenze di tempestività; 2) vincoli economici; 3) popolazioni virtuali, di dimensioni non finite; 4) campionamento distruttivo. Come deve essere il campione? - rappresentativo della popolazione (ovvero) - selezionato in base a caratteristiche indipendenti da quelle oggetto di studio (ovvero) - selezionato con un meccanismo di tipo casuale Un meccanismo casuale permette inoltre di valutare il grado di corrispondenza tra il campione e la popolazione. Esperimento aleatorio ausiliario Equivalenza ideale tra: popolazione urna unità statistiche palline (una pallina numerata per ciascuna unità) Estrazione casuale delle palline dall urna = estrazione casuale delle unità dalla popolazione. Possibili varianti del processo di estrazione (modelli di campionamento): - con o senza reinserimento di una pallina estratta - con probabilità di estrazione diversa per ciascuna pallina - con probabilità di estrazione che dipende dalla pallina estratta - con più di un urna (es.: estrazione casuale di un urna e successiva estrazione casuale di una pallina dall urna estratta) - ecc Campione casuale semplice (estrazione con reinserimento in cui gli elementi del campione provengono tutti dalla medesima popolazione) 3 4

Numero di unità da estrarre: n (Y1,, Yi,, Yn): campione PRIMA dell estrazione Yi è detta variabile casuale campionaria Il modello di campionamento determina: - la dipendenza / l indipendenza tra le Yi - il legame tra ciascuna Yi e il modello probabilistico. Nel caso di un campione casuale semplice: - le Yi sono indipendenti, - la distribuzione di ogni Yi coincide con quella specificata nel modello probabilistico per Y. Campione casuale semplice: composto da n v.c. campionarie I.I.D. Campione casuale semplice di numerosità n = 50 estratto dal lotto di 5000 guarnizioni: (y1= 1, y2= 0,, y50= 1) 50 x = y i guarnizioni sono difettose i= 1 50 x guarnizioni sono conformi. Poniamo che x = 4. k = numero di guarnizioni difettose nella partita =? θ = k/5000 =? 4 : 50 = k : 5000 = θ che risolta per θ ci dà: θ = 4/50. Campione casuale semplice di n = 50 guarnizioni (modello di campionamento) Modello statistico del problema inferenziale: - modello probabilistico: bernoulliano - modello di campionamento: casuale semplice. 5 6

Alcuni interrogativi aperti: 1) esistono altri modi ragionevoli di procedere per determinare θ? 2) qual è il grado di accuratezza del valore θ? 3) qual è un intervallo di valori plausibili per θ? 4) se n = 100 x = 8 cosa cambia? 5) il fornitore garantisce max 5% di guarnizioni difettose, il campione ne contiene l 8%; l industria che produce le pompe può contestare la partita? il campione è sfortunato? 6) esiste un criterio generale applicabile ad ogni situazione, anche più complessa? La risposta si basa su opportuni metodi di inferenza statistica, e dipende dalla relazione che sussiste tra k (ovvero θ) e x. Si tratta di una relazione regolata da leggi del calcolo delle probabilità. x è la determinazione di una variabile casuale X La distribuzione di probabilità di X è determinata: - dal modello probabilistico (bernoulliano); - dal modello di campionamento (casuale semplice): X Bin(n, θ) n x x n x P{X = x} = θ ( θ) X Bin(50, θ) 50 θ x x x P{X = x} = ( 1 θ) 1 x = 0, 1,, n 50 dove θ = k/5000, dove k = 0, 1,, 5000 x = 0, 1,, 50 (1.1) La (1.1) identifica una classe di funzioni di probabilità binomiali (uguali nella forma diverse nel parametro). Tra queste vi è anche quella da cui deriva il campione. 7 8

Cambiamento di terminologia: da inferenza sulle caratteristiche non note di un aggregato a inferenza sul valore del parametro θ della distribuzione di probabilità di una variabile casuale. La funzione di verosimiglianza Per x = 4 la (1.1) diventa: 50 4 L(θ) = θ 4 ( 1 θ) 46 con 0 θ 1 Problemi di inferenza statistica: 1) problemi di stima statistica 2) problemi di verifica di ipotesi statistiche 0,19 0,14 L(θ) 0,09 0,04-0,01-0,01 0,19 0,39 0,59 0,79 0,99 θ Esprime il grado di accordo tra i possibili valori di θ e il valore osservato di x. maxl(θ) quando θ= θˆ =4/50. θˆ = 4/50 è la stima di massima verosimiglianza di θ. 9 10

Nel caso generale: n θ x x n x L(θ) = ( ) 1 θ 0 θ 1, e la stima di θ di massima verosimiglianza è θˆ = x/n ATTENZIONE!!! La funzione di verosimiglianza non è una funzione di densità di probabilità!!! Stima intervallare Qual è un insieme di valori plausibili per θ? Verifica di ipotesi (θ1, θ2) Il problema della verifica di ipotesi e quello della stima intervallare sono legati tra loro. (θ1, θ2) = intervallo di valori plausibili per θ contenente la stima θˆ qualunque θ (θ1, θ2) è compatibile con θˆ θ0 = valore prefissato di riferimento per θ θ0 è compatibile con θˆ θ0 (θ1, θ2) L individuazione di una stima intervallare si basa sulla verosimiglianza: valori più plausibili del parametro hanno una verosimiglianza più alta. C è conformità tra l osservazione empirica (8% di guarnizioni difettose nel campione) ed un valore prefissato di riferimento per il parametro (il 5% garantito dal fornitore)? Sì, purché la discrepanza tra i due valori rientri entro i limiti attesi per la discrepanza tra il vero valore del parametro e una sua stima basata su un campione casuale. 11 12

La verosimiglianza relativa L(θ)/ L( θˆ ) = L*(θ) 0 θ 1, Esempio di criterio per la determinazione di una stima intervallare di θ: L*(θ) > 1/5 = 0,2 0,99 0,99 0,79 0,79 L*(θ) 0,59 L(θ) 0,59 0,39 0,39 0,19 0,19-0,01-0,01 0,03 0,07 0,11 0,15 0,19 0,23 0,27 0 L*(θ) 1 L*(θ) = 1 per θ = θˆ L*(θ) è la verosimiglianza divisa per una costante (di normalizzazione) θ -0,01-0,01 0,03 0,07 0,11 0,15 0,19 0,23 0,27 Se θ = 0,05 L*(θ) = 0,668 l affermazione del fornitore non è incompatibile con il risultato sperimentale θ 13 14

n = 100, x = 8, θˆ = 8/100 0,99 0,79 n = 50 n = 100 0,59 L*(θ) 0,39 0,19-0,01-0,01 0,03 0,07 0,11 0,15 0,19 0,23 0,27 θ - la nuova verosimiglianza relativa è più concentrata attorno alla stima di massima verosimiglianza - valori del parametro diversi da θˆ sono meno verosimili - la stima intervallare si restringe attorno a θˆ - la verosimiglianza relativa per θ = 0,05 diminuisce (da 0,668 a 0,446) Il principio del campionamento ripetuto θˆ è una v.c; E( θˆ ) =? Var( θˆ ) =? θˆ - θ? 15