Introduzione all Inferenza Statistica



Documenti analoghi
Inferenza statistica. Statistica medica 1

E naturale chiedersi alcune cose sulla media campionaria x n

Test statistici di verifica di ipotesi

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)


Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Elementi di Psicometria con Laboratorio di SPSS 1

Il confronto fra proporzioni

Statistiche campionarie

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Analisi di dati di frequenza

LEZIONE n. 5 (a cura di Antonio Di Marco)

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Corso di Psicometria Progredito

Statistica inferenziale

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

Calcolo delle probabilità

1. Distribuzioni campionarie

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica. Lezione 6

INDICE PREFAZIONE VII

Corso di. Dott.ssa Donatella Cocca

Facciamo qualche precisazione

Istituzioni di Statistica e Statistica Economica

Calcolo del Valore Attuale Netto (VAN)

La distribuzione Normale. La distribuzione Normale

Esercitazione n.2 Inferenza su medie

Lezione 1. Concetti Fondamentali

LA CORRELAZIONE LINEARE

Statistica descrittiva

Metodi statistici per le ricerche di mercato

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Elementi di Psicometria con Laboratorio di SPSS 1

Indici di dispersione

Istituzioni di Statistica e Statistica Economica

Il concetto di valore medio in generale

ANALISI DI CORRELAZIONE

Capitolo 12 La regressione lineare semplice

Misure della dispersione o della variabilità

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

VERIFICA DELLE IPOTESI

ELEMENTI DI STATISTICA

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Corso di Fisica generale

Corso di Automazione Industriale 1. Capitolo 4

ECONOMIA CLASSE IV prof.ssa Midolo L ASPETTO ECONOMICO DELLA GESTIONE. (lezione della prof.ssa Edi Dal Farra)

STATISTICA IX lezione

Rapporto dal Questionari Insegnanti

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

ESAME DI STATISTICA Nome: Cognome: Matricola:

Il metodo della regressione

Corso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle

La logica statistica della verifica (test) delle ipotesi

Analisi della performance temporale della rete

STATISTICA INFERENZIALE

Cosa dobbiamo già conoscere?

OSSERVAZIONI TEORICHE Lezione n. 4

Lezione 1. Concetti Fondamentali

La distribuzione Gaussiana

Un modello matematico di investimento ottimale

La variabile casuale Binomiale

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

IL FONDO DI ASSISTENZA SANITARIA INTEGRATIVA COOPERSALUTE CONOSCENZA, USO ED INTERESSE VERSO I SERVIZI, CUSTOMER SATISFACTION

Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria

4 3 4 = 4 x x x 10 0 aaa

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Concetto di potenza statistica

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Il farmaco generico. Contenuti tecnico-scientifici del farmaco generico: comunicazione a corrente alternata

VALORE DELLE MERCI SEQUESTRATE

Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 2004

Regressione logistica. Strumenti quantitativi per la gestione

DI IDROLOGIA TECNICA PARTE III

VALUTARE GLI EQUILIBRI DELL IMPRESA

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Errori di una misura e sua rappresentazione

Temi di Esame a.a Statistica - CLEF

SCELTA DELL APPROCCIO. A corredo delle linee guida per l autovalutazione e il miglioramento

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

matematica probabilmente

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

CAPITOLO 7 LE DISTRIBUZIONI CAMPIONARIE E GLI INTERVALLI DI CONFIDENZA

OpenPsy: OpenSource nella Psicologia. Presentazione del progetto in occasione dell edizione 2004 del Webbit (Padova)

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

La Concorrenza Monopolistica

Laboratorio di Pedagogia Sperimentale. Indice

Transcript:

Introduzione all Inferenza Statistica Fabrizio Cipollini Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) G. Parenti Università di Firenze Firenze, 3 Febbraio 2015

Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015

Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015

Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015

Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015

Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015

Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015

Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015

Velocità della luce Situazione pratica Variabile: misura della velocità della luce X Dati: n = 66 misurazioni espresse in km/s, (x 1 = 264286, x 2 = 336364,..., x 66 = 321739) Obiettivo: stimare la velocità della luce. Cipollini 3/21 Firenze 2015

Velocità della luce Situazione pratica Variabile: misura della velocità della luce X Dati: n = 66 misurazioni espresse in km/s, (x 1 = 264286, x 2 = 336364,..., x 66 = 321739) Obiettivo: stimare la velocità della luce. Cipollini 3/21 Firenze 2015

Velocità della luce Situazione pratica Variabile: misura della velocità della luce X Dati: n = 66 misurazioni espresse in km/s, (x 1 = 264286, x 2 = 336364,..., x 66 = 321739) = x Obiettivo: stimare la velocità della luce. Cipollini 3/21 Firenze 2015

Velocità della luce Situazione pratica Variabile: misura della velocità della luce X Dati: n = 66 misurazioni espresse in km/s, (x 1 = 264286, x 2 = 336364,..., x 66 = 321739) = x Obiettivo: stimare la velocità della luce. Cipollini 3/21 Firenze 2015

Velocità della luce Statistica esplorativa Data cleaning: due valori negativi eliminare. Calcolo di statistiche descrittive: n min max mean median sd 64 185000 462500 276234.3 269179.9 55311.5 Grafici (istogrammi): Cipollini 4/21 Firenze 2015

Velocità della luce Statistica esplorativa Data cleaning: due valori negativi eliminare. Calcolo di statistiche descrittive: n min max mean median sd 64 185000 462500 276234.3 269179.9 55311.5 Grafici (istogrammi): Cipollini 4/21 Firenze 2015

Velocità della luce Statistica esplorativa Data cleaning: due valori negativi eliminare. Calcolo di statistiche descrittive: n min max mean median sd 64 185000 462500 276234.3 269179.9 55311.5 Grafici (istogrammi): (a) Misurazione (b) ln(misurazione) Cipollini 4/21 Firenze 2015

Velocità della luce Statistica esplorativa Data cleaning: due valori negativi eliminare. Calcolo di statistiche descrittive: n min max mean median sd 64 185000 462500 276234.3 269179.9 55311.5 Grafici (istogrammi): (a) Misurazione (b) ln(misurazione) Cipollini 4/21 Firenze 2015

Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015

Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015

Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015

Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015

Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015

Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, ( ) X N µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015

Inferenza statistica Gli ingredienti dell inferenza X Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015

Inferenza statistica Gli ingredienti dell inferenza X (µ, σ) Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015

Inferenza statistica Gli ingredienti dell inferenza X N(µ, σ) Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) oppure N(µ, σ). Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015

Inferenza statistica Gli ingredienti dell inferenza X ( µ, σ ) Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) oppure N(µ, σ). Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015

Inferenza statistica Gli ingredienti dell inferenza X (µ, σ) Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) oppure N(µ, σ). Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015

Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015

Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015

Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015

Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015

Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015

Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015

Stima puntuale Statistica Un parametro è una quantità scalare; il campione x è fatto da tante osservazioni sintesi. Ogni sintesi di x è chiamata statistica. Es: min, max, media, mediana, sd, etc. Cipollini 8/21 Firenze 2015

Stima puntuale Statistica Un parametro è una quantità scalare; il campione x è fatto da tante osservazioni sintesi. Ogni sintesi di x è chiamata statistica. Es: min, max, media, mediana, sd, etc. Cipollini 8/21 Firenze 2015

Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = 276234.3 km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = 55311.5 km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015

Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = 276234.3 km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = 55311.5 km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015

Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = 276234.3 km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = 55311.5 km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015

Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = 276234.3 km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = 55311.5 km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015

Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = 276234.3 km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = 55311.5 km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015

Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = 276234.3 km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = 55311.5 km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015

Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? Cipollini 10/21 Firenze 2015

Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? Cipollini 10/21 Firenze 2015

Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? Cipollini 10/21 Firenze 2015

Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? Cipollini 10/21 Firenze 2015

Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? distribuzione campionaria Cipollini 10/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015

Distribuzione campionaria Esempi (a) X per X N(5, 8) (b) Mediana per X N(5, 8) Cipollini 12/21 Firenze 2015

Distribuzione campionaria Esempi (a) X 10 per X N(5, 8) (b) X 20 per X N(5, 8) Cipollini 12/21 Firenze 2015

Distribuzione campionaria Esempi (a) S 2 per X N(5, 8) (b) X per X Be(p = 0.75) Cipollini 12/21 Firenze 2015

Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015

Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015

Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015

Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015

Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015

Distribuzione campionaria Come si ricava Analiticamente in modo esatto, valido per n qualsiasi (pochi casi fortunati) Analiticamente in modo approssimato, valido per n + (quasi sempre; approccio molto generale) Numericamente, mediante simulazione al computer Esempio: Distribuzione campionaria di X X per X N(299792.5, 55000) Cipollini 14/21 Firenze 2015

Distribuzione campionaria Come si ricava Analiticamente in modo esatto, valido per n qualsiasi (pochi casi fortunati) Analiticamente in modo approssimato, valido per n + (quasi sempre; approccio molto generale) Numericamente, mediante simulazione al computer Esempio: Distribuzione campionaria di X X per X N(299792.5, 55000) Cipollini 14/21 Firenze 2015

Distribuzione campionaria Come si ricava Analiticamente in modo esatto, valido per n qualsiasi (pochi casi fortunati) Analiticamente in modo approssimato, valido per n + (quasi sempre; approccio molto generale) Numericamente, mediante simulazione al computer Esempio: Distribuzione campionaria di X X per X N(299792.5, 55000) Cipollini 14/21 Firenze 2015

Distribuzione campionaria Come si ricava Analiticamente in modo esatto, valido per n qualsiasi (pochi casi fortunati) Analiticamente in modo approssimato, valido per n + (quasi sempre; approccio molto generale) Numericamente, mediante simulazione al computer Esempio: Distribuzione campionaria di X X per X N(299792.5, 55000) Cipollini 14/21 Firenze 2015

Distribuzione campionaria Si dimostra che Distribuzione campionaria di X X N ( ) σ n grande µ, N (µ, se = σ ) n n La distribuzione di X è: esatta se ; approssimata (valida per n grande ) se ; per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015

Distribuzione campionaria Si dimostra che Distribuzione campionaria di X X N ( ) σ n grande µ, N (µ, se = σ ) n n La distribuzione di X è: esatta se ; approssimata (valida per n grande ) se ; per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015

Distribuzione campionaria Si dimostra che X N Distribuzione campionaria di X ( ) σ n grande µ, N (µ, se = σ ) n n La distribuzione di X è: esatta se X N(µ, σ) ; approssimata (valida per n grande ) se ; per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015

Distribuzione campionaria Si dimostra che X N Distribuzione campionaria di X ( ) σ n grande µ, N (µ, se = σ ) n n La distribuzione di X è: esatta se X N(µ, σ); approssimata (valida per n grande ) se X (µ, σ) ; per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di X Si dimostra che X N ( ) σ n grande µ, n N (µ, se = n σ ) La distribuzione di X è: esatta se X N(µ, σ); approssimata (valida per n grande ) se X (µ, σ); per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015

Distribuzione campionaria Si dimostra che Distribuzione campionaria di X ( ) ( σ n grande X N µ, N µ, se = σ ) n n La distribuzione di X è: esatta se X N(µ, σ); approssimata (valida per n grande ) se X (µ, σ); per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015

Distribuzione campionaria Distribuzione campionaria di X Si dimostra che ( X N µ, ) ) σ n grande, N (µ, se = n σ n La distribuzione di X è: esatta se X N(µ, σ); approssimata (valida per n grande ) se X (µ, σ); per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015

Stima per intervallo Stima per intervallo Poiché X N (µ, se = n σ ), in base alle caratteristiche della normale, si ha ( 95% = P 1.96 X µ 1.96 se = P ( X 1.96 se µ X + 1.96 se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x + 1.96 se] = [262683.3, 289785.4] Commento (nel 2015): Non include il vero valore di µ (299792.5 km/s). Verosimilmente, l esperimento non era ben progettato. ) Cipollini 16/21 Firenze 2015

Stima per intervallo Stima per intervallo Poiché X N (µ, se = n σ ), in base alle caratteristiche della normale, si ha ( 95% = P 1.96 X µ 1.96 se = P ( X 1.96 se µ X + 1.96 se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x + 1.96 se] = [262683.3, 289785.4] Commento (nel 2015): Non include il vero valore di µ (299792.5 km/s). Verosimilmente, l esperimento non era ben progettato. ) Cipollini 16/21 Firenze 2015

Default nel mondo del credito Situazione pratica Variabile: X = cliente finanziato è andato in default? Dati: n = 5756 casi di clienti precedentemente finanziati, x = (x 1 = No, x 2 = No, x 3 = Sì, x 4 = No,..., x 5756 = No) x include 278 Sì e 5478 No. Obiettivo: stimare la probabilità che un cliente vada in default. Cipollini 17/21 Firenze 2015

Default nel mondo del credito Situazione pratica Variabile: X = cliente finanziato è andato in default? Dati: n = 5756 casi di clienti precedentemente finanziati, x = (x 1 = No, x 2 = No, x 3 = Sì, x 4 = No,..., x 5756 = No) x include 278 Sì e 5478 No. Obiettivo: stimare la probabilità che un cliente vada in default. Cipollini 17/21 Firenze 2015

Default nel mondo del credito Situazione pratica Variabile: X = cliente finanziato è andato in default? Dati: n = 5756 casi di clienti precedentemente finanziati, x = (x 1 = No, x 2 = No, x 3 = Sì, x 4 = No,..., x 5756 = No) x include 278 Sì e 5478 No. Obiettivo: stimare la probabilità che un cliente vada in default. Cipollini 17/21 Firenze 2015

Default nel mondo del credito Gli ingredienti X Variabile casuale: X = cliente finanziato è andato in default? secondo la codifica 1 = Sì, 0 =No. Modello per X: Be(p), che significa P(X = 1) = p P(X = 0) = 1 p Parametri: p = P(X = 1) = P(default). Campione: di n = 5756 osservazioni x = (x 1 = 0, x 2 = 0, x 3 = 1, x 4 = 0,..., x 5756 = 0) In x ci sono 278 default (1) e 5478 bonis (0). Cipollini 18/21 Firenze 2015

Default nel mondo del credito Gli ingredienti X Be(p) Variabile casuale: X = cliente finanziato è andato in default? secondo la codifica 1 = Sì, 0 =No. Modello per X: Be(p), che significa P(X = 1) = p P(X = 0) = 1 p Parametri: p = P(X = 1) = P(default). Campione: di n = 5756 osservazioni x = (x 1 = 0, x 2 = 0, x 3 = 1, x 4 = 0,..., x 5756 = 0) In x ci sono 278 default (1) e 5478 bonis (0). Cipollini 18/21 Firenze 2015

Default nel mondo del credito Gli ingredienti X Be( p ) Variabile casuale: X = cliente finanziato è andato in default? secondo la codifica 1 = Sì, 0 =No. Modello per X: Be(p), che significa P(X = 1) = p P(X = 0) = 1 p Parametri: p = P(X = 1) = P(default). Campione: di n = 5756 osservazioni x = (x 1 = 0, x 2 = 0, x 3 = 1, x 4 = 0,..., x 5756 = 0) In x ci sono 278 default (1) e 5478 bonis (0). Cipollini 18/21 Firenze 2015

Default nel mondo del credito Gli ingredienti X Be(p) Variabile casuale: X = cliente finanziato è andato in default? secondo la codifica 1 = Sì, 0 =No. Modello per X: Be(p), che significa P(X = 1) = p P(X = 0) = 1 p Parametri: p = P(X = 1) = P(default). Campione: di n = 5756 osservazioni x = (x 1 = 0, x 2 = 0, x 3 = 1, x 4 = 0,..., x 5756 = 0) In x ci sono 278 default (1) e 5478 bonis (0). Cipollini 18/21 Firenze 2015

Default nel mondo del credito Statistica e distribuzione campionaria (... ) è ragionevole ritenere che la proporzione di 1 nel campione, che peraltro coincide con x = media(x), sia una buona statistica per stimare p. In effetti, si dimostra che ( ) ( ) p(1 p) p(1 p) X N p, N p, se = n n ovvero: la distribuzione di X è centrata su p la sua sd (che poi serve per il calcolo dello standard error ) va a zero per n. Cipollini 19/21 Firenze 2015

Default nel mondo del credito Statistica e distribuzione campionaria (... ) è ragionevole ritenere che la proporzione di 1 nel campione, che peraltro coincide con x = media(x), sia una buona statistica per stimare p. In effetti, si dimostra che ( ) ( ) p(1 p) p(1 p) X N p, N p, se = n n ovvero: la distribuzione di X è centrata su p la sua sd (che poi serve per il calcolo dello standard error ) va a zero per n. Cipollini 19/21 Firenze 2015

Default nel mondo del credito Statistica e distribuzione campionaria (... ) è ragionevole ritenere che la proporzione di 1 nel campione, che peraltro coincide con x = media(x), sia una buona statistica per stimare p. In effetti, si dimostra che ( ) ( ) p(1 p) p(1 p) X N p, N p, se = n n ovvero: la distribuzione di X è centrata su p la sua sd (che poi serve per il calcolo dello standard error ) va a zero per n. Cipollini 19/21 Firenze 2015

Default nel mondo del credito Statistica e distribuzione campionaria (... ) è ragionevole ritenere che la proporzione di 1 nel campione, che peraltro coincide con x = media(x), sia una buona statistica per stimare p. In effetti, si dimostra che p(1 p) X N p, N p, se = n p(1 p) n ovvero: la distribuzione di X è centrata su p la sua sd (che poi serve per il calcolo dello standard error ) va a zero per n. Cipollini 19/21 Firenze 2015

Default nel mondo del credito Stima puntuale e per intervallo Dal campione a disposizione (due slides fa) p = x = 278/5756 = 0.0483 4.83%. con uno standard error se = p(1 p)/ n = 0.00283. In base alle caratteristiche della normale, si ha ( ) 95% = P 1.96 X p 1.96 se = P ( X 1.96 se p X + 1.96 se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x + 1.96 se] = [0.0428, 0.0538] Cipollini 20/21 Firenze 2015

Default nel mondo del credito Stima puntuale e per intervallo Dal campione a disposizione (due slides fa) p = x = 278/5756 = 0.0483 4.83%. con uno standard error se = p(1 p)/ n = 0.00283. In base alle caratteristiche della normale, si ha ( ) 95% = P 1.96 X p 1.96 se = P ( X 1.96 se p X + 1.96 se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x + 1.96 se] = [0.0428, 0.0538] Cipollini 20/21 Firenze 2015

Default nel mondo del credito Stima puntuale e per intervallo Dal campione a disposizione (due slides fa) p = x = 278/5756 = 0.0483 4.83%. con uno standard error se = p(1 p)/ n = 0.00283. In base alle caratteristiche della normale, si ha ( ) 95% = P 1.96 X p 1.96 se = P ( X 1.96 se p X + 1.96 se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x + 1.96 se] = [0.0428, 0.0538] Cipollini 20/21 Firenze 2015

Epilogo Grazie per l attenzione! Cipollini 21/21 Firenze 2015