Introduzione all Inferenza Statistica
|
|
|
- Gianleone Tonelli
- 10 anni fa
- Visualizzazioni
Transcript
1 Introduzione all Inferenza Statistica Fabrizio Cipollini Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) G. Parenti Università di Firenze Firenze, 3 Febbraio 2015
2 Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015
3 Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015
4 Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015
5 Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015
6 Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015
7 Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015
8 Introduzione Casi di studio Velocità della luce Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare 7400m. Qual è il suo valore? Campione di 66 misure. Default nel mondo del credito Una società finanziaria presta denaro a un cliente (prestito personale). Qual è la probabilità che il cliente vada in default (cioè non ripaghi il prestito)? Campione di 5756 casi. Cipollini 2/21 Firenze 2015
9 Velocità della luce Situazione pratica Variabile: misura della velocità della luce X Dati: n = 66 misurazioni espresse in km/s, (x 1 = , x 2 = ,..., x 66 = ) Obiettivo: stimare la velocità della luce. Cipollini 3/21 Firenze 2015
10 Velocità della luce Situazione pratica Variabile: misura della velocità della luce X Dati: n = 66 misurazioni espresse in km/s, (x 1 = , x 2 = ,..., x 66 = ) Obiettivo: stimare la velocità della luce. Cipollini 3/21 Firenze 2015
11 Velocità della luce Situazione pratica Variabile: misura della velocità della luce X Dati: n = 66 misurazioni espresse in km/s, (x 1 = , x 2 = ,..., x 66 = ) = x Obiettivo: stimare la velocità della luce. Cipollini 3/21 Firenze 2015
12 Velocità della luce Situazione pratica Variabile: misura della velocità della luce X Dati: n = 66 misurazioni espresse in km/s, (x 1 = , x 2 = ,..., x 66 = ) = x Obiettivo: stimare la velocità della luce. Cipollini 3/21 Firenze 2015
13 Velocità della luce Statistica esplorativa Data cleaning: due valori negativi eliminare. Calcolo di statistiche descrittive: n min max mean median sd Grafici (istogrammi): Cipollini 4/21 Firenze 2015
14 Velocità della luce Statistica esplorativa Data cleaning: due valori negativi eliminare. Calcolo di statistiche descrittive: n min max mean median sd Grafici (istogrammi): Cipollini 4/21 Firenze 2015
15 Velocità della luce Statistica esplorativa Data cleaning: due valori negativi eliminare. Calcolo di statistiche descrittive: n min max mean median sd Grafici (istogrammi): (a) Misurazione (b) ln(misurazione) Cipollini 4/21 Firenze 2015
16 Velocità della luce Statistica esplorativa Data cleaning: due valori negativi eliminare. Calcolo di statistiche descrittive: n min max mean median sd Grafici (istogrammi): (a) Misurazione (b) ln(misurazione) Cipollini 4/21 Firenze 2015
17 Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015
18 Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015
19 Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015
20 Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015
21 Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, X ( ) µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015
22 Velocità della luce Dall esplorazione all inferenza Ogni misura può dare un valore diverso. X = misura della velocità della luce è una variabile casuale. Ragionevole pensare che X si distribuisca intorno ad una media µ con una certa standard deviation σ, ( ) X N µ, σ µ = velocità della luce (se l esperimento è ben progettato!) σ = grado di imprecisione dell esperimento Media e sd di X, non del campione! Potremmo anche assumere che X abbia una distribuzione Normale (vedi grafico). Cipollini 5/21 Firenze 2015
23 Inferenza statistica Gli ingredienti dell inferenza X Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015
24 Inferenza statistica Gli ingredienti dell inferenza X (µ, σ) Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015
25 Inferenza statistica Gli ingredienti dell inferenza X N(µ, σ) Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) oppure N(µ, σ). Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015
26 Inferenza statistica Gli ingredienti dell inferenza X ( µ, σ ) Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) oppure N(µ, σ). Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015
27 Inferenza statistica Gli ingredienti dell inferenza X (µ, σ) Variabile casuale: X = misura della velocità della luce Modello per X: meccanismo aleatorio che genera le osservazioni. Nel caso in esame (µ, σ) oppure N(µ, σ). Parametri: µ parametro d interesse; σ parametro di disturbo. Si fa inferenza sui parametri. Campione: x, fatto da n osservazioni (x 1,..., x n ). È l informazione per fare inferenza sui parametri. Cipollini 6/21 Firenze 2015
28 Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015
29 Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015
30 Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015
31 Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015
32 Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015
33 Inferenza statistica Tipi di inferenza Stima puntuale: Uso x per (cercare di) indovinare il vero valore del parametro Es: Cerco di indovinare µ (velocità della luce). Stima per intervallo: Uso x per ricavare un intervallo che, con alta probabilità, include il vero valore del parametro Es: Calcolo l intervallo che, col 95% di probabilità, include µ (velocità della luce). Test delle ipotesi: Uso x per accettare/rifiutare un ipotesi su valore del parametro (entro un certo margine di incertezza) Es: Confermo o respingo una certa ipotesi sul valore di µ (velocità della luce) fatta precedente da un altro studioso. Cipollini 7/21 Firenze 2015
34 Stima puntuale Statistica Un parametro è una quantità scalare; il campione x è fatto da tante osservazioni sintesi. Ogni sintesi di x è chiamata statistica. Es: min, max, media, mediana, sd, etc. Cipollini 8/21 Firenze 2015
35 Stima puntuale Statistica Un parametro è una quantità scalare; il campione x è fatto da tante osservazioni sintesi. Ogni sintesi di x è chiamata statistica. Es: min, max, media, mediana, sd, etc. Cipollini 8/21 Firenze 2015
36 Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015
37 Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015
38 Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015
39 Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015
40 Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015
41 Stima puntuale Azione (... ) è ragionevole ritenere che x = media(x) sia una buona statistica per stimare µ (la media di X). Dal campione a disposizione (vedi statistiche descrittive) µ = x = km/s. Commento (nel 2015): Sottostima dell 8.5%. (... ) è ragionevole ritenere che s = sd(x) sia una buona statistica per stimare σ (la sd di X). Dal campione a disposizione (vedi statistiche descrittive) σ = s = km/s. Commento: σ/ µ 20% dà un idea del grado di imprecisione (come errore relativo) dell esperimento. Cipollini 9/21 Firenze 2015
42 Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? Cipollini 10/21 Firenze 2015
43 Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? Cipollini 10/21 Firenze 2015
44 Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? Cipollini 10/21 Firenze 2015
45 Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? Cipollini 10/21 Firenze 2015
46 Stima puntuale Commenti L inferenza è affetta da errore. Se si cambia il campione si ottengono stime diverse. Se si cambia statistica (esempio si usa mediana(x) per stimare µ) si ottengono stime diverse. Meglio la media, la mediana o un altra statistica? Come valutare il grado di incertezza/imprecisione della stima effettuata a prescindere dal vero valore del parametro (che di solito non si conosce)? distribuzione campionaria Cipollini 10/21 Firenze 2015
47 Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015
48 Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015
49 Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015
50 Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015
51 Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015
52 Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015
53 Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015
54 Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015
55 Distribuzione campionaria Distribuzione campionaria di una statistica Definizione: Distribuzione della statistica considerando tutti i possibili campioni Capire il concetto (procedimento costruttivo): 1. Prendo una scatola, metto dentro tanti bigliettini numerati (es. 200) secondo la distribuzione di X che preferisco (es. N(µ = 5, σ = 8)). 2. Fisso la dimensione del campione (es. n = 10) 3. Prendo il primo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 7.91). 4. Prendo il secondo campione (con rimbussolamento), ne calcolo la statistica, segno il risultato (es. x = 3.72). 5. Continuo finché non mi stanco (non troppo presto!). 6. Faccio l istogramma... et voilà: quella è (una buonissima approssimazione del-) la distribuzione campionaria. 7. Potrei fare tutto con un calcolatore (numeri casuali). Cipollini 11/21 Firenze 2015
56 Distribuzione campionaria Esempi (a) X per X N(5, 8) (b) Mediana per X N(5, 8) Cipollini 12/21 Firenze 2015
57 Distribuzione campionaria Esempi (a) X 10 per X N(5, 8) (b) X 20 per X N(5, 8) Cipollini 12/21 Firenze 2015
58 Distribuzione campionaria Esempi (a) S 2 per X N(5, 8) (b) X per X Be(p = 0.75) Cipollini 12/21 Firenze 2015
59 Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015
60 Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015
61 Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015
62 Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015
63 Distribuzione campionaria Perchè è utile Indica la forma della distribuzione della statistica. Posizione (è centrata sul vero valore del parametro?) e variabilità (meno è, meglio è) della distribuzione della statistica. Comparando la distribuzione campionaria di statistiche diverse posso capire qual è migliore. Indispensabile per valutare l incertezza associata alla stima effettuata: standard error = stima della sd della statistica Indispensabile per stima per intervallo e test delle ipotesi. Cipollini 13/21 Firenze 2015
64 Distribuzione campionaria Come si ricava Analiticamente in modo esatto, valido per n qualsiasi (pochi casi fortunati) Analiticamente in modo approssimato, valido per n + (quasi sempre; approccio molto generale) Numericamente, mediante simulazione al computer Esempio: Distribuzione campionaria di X X per X N( , 55000) Cipollini 14/21 Firenze 2015
65 Distribuzione campionaria Come si ricava Analiticamente in modo esatto, valido per n qualsiasi (pochi casi fortunati) Analiticamente in modo approssimato, valido per n + (quasi sempre; approccio molto generale) Numericamente, mediante simulazione al computer Esempio: Distribuzione campionaria di X X per X N( , 55000) Cipollini 14/21 Firenze 2015
66 Distribuzione campionaria Come si ricava Analiticamente in modo esatto, valido per n qualsiasi (pochi casi fortunati) Analiticamente in modo approssimato, valido per n + (quasi sempre; approccio molto generale) Numericamente, mediante simulazione al computer Esempio: Distribuzione campionaria di X X per X N( , 55000) Cipollini 14/21 Firenze 2015
67 Distribuzione campionaria Come si ricava Analiticamente in modo esatto, valido per n qualsiasi (pochi casi fortunati) Analiticamente in modo approssimato, valido per n + (quasi sempre; approccio molto generale) Numericamente, mediante simulazione al computer Esempio: Distribuzione campionaria di X X per X N( , 55000) Cipollini 14/21 Firenze 2015
68 Distribuzione campionaria Si dimostra che Distribuzione campionaria di X X N ( ) σ n grande µ, N (µ, se = σ ) n n La distribuzione di X è: esatta se ; approssimata (valida per n grande ) se ; per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015
69 Distribuzione campionaria Si dimostra che Distribuzione campionaria di X X N ( ) σ n grande µ, N (µ, se = σ ) n n La distribuzione di X è: esatta se ; approssimata (valida per n grande ) se ; per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015
70 Distribuzione campionaria Si dimostra che X N Distribuzione campionaria di X ( ) σ n grande µ, N (µ, se = σ ) n n La distribuzione di X è: esatta se X N(µ, σ) ; approssimata (valida per n grande ) se ; per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015
71 Distribuzione campionaria Si dimostra che X N Distribuzione campionaria di X ( ) σ n grande µ, N (µ, se = σ ) n n La distribuzione di X è: esatta se X N(µ, σ); approssimata (valida per n grande ) se X (µ, σ) ; per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015
72 Distribuzione campionaria Distribuzione campionaria di X Si dimostra che X N ( ) σ n grande µ, n N (µ, se = n σ ) La distribuzione di X è: esatta se X N(µ, σ); approssimata (valida per n grande ) se X (µ, σ); per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015
73 Distribuzione campionaria Si dimostra che Distribuzione campionaria di X ( ) ( σ n grande X N µ, N µ, se = σ ) n n La distribuzione di X è: esatta se X N(µ, σ); approssimata (valida per n grande ) se X (µ, σ); per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015
74 Distribuzione campionaria Distribuzione campionaria di X Si dimostra che ( X N µ, ) ) σ n grande, N (µ, se = n σ n La distribuzione di X è: esatta se X N(µ, σ); approssimata (valida per n grande ) se X (µ, σ); per n grande non cambia se si usa σ (linea rossa nel grafico) al posto di σ (linea blu nel grafico). La distribuzione di X è centrata su µ. La sua sd e la sua stima (lo standard error ) vanno a zero per n. Cipollini 15/21 Firenze 2015
75 Stima per intervallo Stima per intervallo Poiché X N (µ, se = n σ ), in base alle caratteristiche della normale, si ha ( 95% = P 1.96 X µ 1.96 se = P ( X 1.96 se µ X se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x se] = [ , ] Commento (nel 2015): Non include il vero valore di µ ( km/s). Verosimilmente, l esperimento non era ben progettato. ) Cipollini 16/21 Firenze 2015
76 Stima per intervallo Stima per intervallo Poiché X N (µ, se = n σ ), in base alle caratteristiche della normale, si ha ( 95% = P 1.96 X µ 1.96 se = P ( X 1.96 se µ X se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x se] = [ , ] Commento (nel 2015): Non include il vero valore di µ ( km/s). Verosimilmente, l esperimento non era ben progettato. ) Cipollini 16/21 Firenze 2015
77 Default nel mondo del credito Situazione pratica Variabile: X = cliente finanziato è andato in default? Dati: n = 5756 casi di clienti precedentemente finanziati, x = (x 1 = No, x 2 = No, x 3 = Sì, x 4 = No,..., x 5756 = No) x include 278 Sì e 5478 No. Obiettivo: stimare la probabilità che un cliente vada in default. Cipollini 17/21 Firenze 2015
78 Default nel mondo del credito Situazione pratica Variabile: X = cliente finanziato è andato in default? Dati: n = 5756 casi di clienti precedentemente finanziati, x = (x 1 = No, x 2 = No, x 3 = Sì, x 4 = No,..., x 5756 = No) x include 278 Sì e 5478 No. Obiettivo: stimare la probabilità che un cliente vada in default. Cipollini 17/21 Firenze 2015
79 Default nel mondo del credito Situazione pratica Variabile: X = cliente finanziato è andato in default? Dati: n = 5756 casi di clienti precedentemente finanziati, x = (x 1 = No, x 2 = No, x 3 = Sì, x 4 = No,..., x 5756 = No) x include 278 Sì e 5478 No. Obiettivo: stimare la probabilità che un cliente vada in default. Cipollini 17/21 Firenze 2015
80 Default nel mondo del credito Gli ingredienti X Variabile casuale: X = cliente finanziato è andato in default? secondo la codifica 1 = Sì, 0 =No. Modello per X: Be(p), che significa P(X = 1) = p P(X = 0) = 1 p Parametri: p = P(X = 1) = P(default). Campione: di n = 5756 osservazioni x = (x 1 = 0, x 2 = 0, x 3 = 1, x 4 = 0,..., x 5756 = 0) In x ci sono 278 default (1) e 5478 bonis (0). Cipollini 18/21 Firenze 2015
81 Default nel mondo del credito Gli ingredienti X Be(p) Variabile casuale: X = cliente finanziato è andato in default? secondo la codifica 1 = Sì, 0 =No. Modello per X: Be(p), che significa P(X = 1) = p P(X = 0) = 1 p Parametri: p = P(X = 1) = P(default). Campione: di n = 5756 osservazioni x = (x 1 = 0, x 2 = 0, x 3 = 1, x 4 = 0,..., x 5756 = 0) In x ci sono 278 default (1) e 5478 bonis (0). Cipollini 18/21 Firenze 2015
82 Default nel mondo del credito Gli ingredienti X Be( p ) Variabile casuale: X = cliente finanziato è andato in default? secondo la codifica 1 = Sì, 0 =No. Modello per X: Be(p), che significa P(X = 1) = p P(X = 0) = 1 p Parametri: p = P(X = 1) = P(default). Campione: di n = 5756 osservazioni x = (x 1 = 0, x 2 = 0, x 3 = 1, x 4 = 0,..., x 5756 = 0) In x ci sono 278 default (1) e 5478 bonis (0). Cipollini 18/21 Firenze 2015
83 Default nel mondo del credito Gli ingredienti X Be(p) Variabile casuale: X = cliente finanziato è andato in default? secondo la codifica 1 = Sì, 0 =No. Modello per X: Be(p), che significa P(X = 1) = p P(X = 0) = 1 p Parametri: p = P(X = 1) = P(default). Campione: di n = 5756 osservazioni x = (x 1 = 0, x 2 = 0, x 3 = 1, x 4 = 0,..., x 5756 = 0) In x ci sono 278 default (1) e 5478 bonis (0). Cipollini 18/21 Firenze 2015
84 Default nel mondo del credito Statistica e distribuzione campionaria (... ) è ragionevole ritenere che la proporzione di 1 nel campione, che peraltro coincide con x = media(x), sia una buona statistica per stimare p. In effetti, si dimostra che ( ) ( ) p(1 p) p(1 p) X N p, N p, se = n n ovvero: la distribuzione di X è centrata su p la sua sd (che poi serve per il calcolo dello standard error ) va a zero per n. Cipollini 19/21 Firenze 2015
85 Default nel mondo del credito Statistica e distribuzione campionaria (... ) è ragionevole ritenere che la proporzione di 1 nel campione, che peraltro coincide con x = media(x), sia una buona statistica per stimare p. In effetti, si dimostra che ( ) ( ) p(1 p) p(1 p) X N p, N p, se = n n ovvero: la distribuzione di X è centrata su p la sua sd (che poi serve per il calcolo dello standard error ) va a zero per n. Cipollini 19/21 Firenze 2015
86 Default nel mondo del credito Statistica e distribuzione campionaria (... ) è ragionevole ritenere che la proporzione di 1 nel campione, che peraltro coincide con x = media(x), sia una buona statistica per stimare p. In effetti, si dimostra che ( ) ( ) p(1 p) p(1 p) X N p, N p, se = n n ovvero: la distribuzione di X è centrata su p la sua sd (che poi serve per il calcolo dello standard error ) va a zero per n. Cipollini 19/21 Firenze 2015
87 Default nel mondo del credito Statistica e distribuzione campionaria (... ) è ragionevole ritenere che la proporzione di 1 nel campione, che peraltro coincide con x = media(x), sia una buona statistica per stimare p. In effetti, si dimostra che p(1 p) X N p, N p, se = n p(1 p) n ovvero: la distribuzione di X è centrata su p la sua sd (che poi serve per il calcolo dello standard error ) va a zero per n. Cipollini 19/21 Firenze 2015
88 Default nel mondo del credito Stima puntuale e per intervallo Dal campione a disposizione (due slides fa) p = x = 278/5756 = %. con uno standard error se = p(1 p)/ n = In base alle caratteristiche della normale, si ha ( ) 95% = P 1.96 X p 1.96 se = P ( X 1.96 se p X se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x se] = [0.0428, ] Cipollini 20/21 Firenze 2015
89 Default nel mondo del credito Stima puntuale e per intervallo Dal campione a disposizione (due slides fa) p = x = 278/5756 = %. con uno standard error se = p(1 p)/ n = In base alle caratteristiche della normale, si ha ( ) 95% = P 1.96 X p 1.96 se = P ( X 1.96 se p X se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x se] = [0.0428, ] Cipollini 20/21 Firenze 2015
90 Default nel mondo del credito Stima puntuale e per intervallo Dal campione a disposizione (due slides fa) p = x = 278/5756 = %. con uno standard error se = p(1 p)/ n = In base alle caratteristiche della normale, si ha ( ) 95% = P 1.96 X p 1.96 se = P ( X 1.96 se p X se ) La corrispondente stima per intervallo (al 95%) è [x 1.96 se, x se] = [0.0428, ] Cipollini 20/21 Firenze 2015
91 Epilogo Grazie per l attenzione! Cipollini 21/21 Firenze 2015
Inferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
E naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
Test statistici di verifica di ipotesi
Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.
Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:
Esercizi test ipotesi. Prof. Raffaella Folgieri Email: [email protected] aa 2009/2010
Esercizi test ipotesi Prof. Raffaella Folgieri Email: [email protected] aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia,
Il confronto fra proporzioni
L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,
Statistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1
Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo
Un po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
Analisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
LEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica
Corso di Psicometria Progredito
Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014
Statistica inferenziale
Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo
Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI
Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni
2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale
BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health [email protected]
Calcolo delle probabilità
Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità
1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
Statistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
INDICE PREFAZIONE VII
INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione
Corso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
Facciamo qualche precisazione
Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione
Istituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte
Calcolo del Valore Attuale Netto (VAN)
Calcolo del Valore Attuale Netto (VAN) Il calcolo del valore attuale netto (VAN) serve per determinare la redditività di un investimento. Si tratta di utilizzare un procedimento che può consentirci di
La distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
Esercitazione n.2 Inferenza su medie
Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione
Lezione 1. Concetti Fondamentali
Lezione 1 Concetti Fondamentali 1 Sonetto di Trilussa Sai ched è la statistica? E E na cosa che serve pe fa un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa.
LA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
Statistica descrittiva
Corso di Laurea in Ingegneria per l Ambiente ed il Territorio Corso di Costruzioni Idrauliche A.A. 2004-05 www.dica.unict.it/users/costruzioni Statistica descrittiva Ing. Antonino Cancelliere Dipartimento
Metodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)
Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
Indici di dispersione
Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo
Istituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 3 A. Sia una variabile casuale che si distribuisce secondo
Il concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
ANALISI DI CORRELAZIONE
ANALISI DI CORRELAZIONE Esempio: Dati raccolti da n = 129 studenti di Pavia (A.A. 21/2) Altezza (cm) Peso (Kg) Voto Algebra e Geometria Voto Fisica I Valutare la correlazione delle seguenti coppie: Peso
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
Misure della dispersione o della variabilità
QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.
LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di
STATISTICA LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di oggetti; cerca, attraverso l uso della matematica
VERIFICA DELLE IPOTESI
VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi
ELEMENTI DI STATISTICA
Dipartimento di Ingegneria Meccanica Chimica e dei Materiali PROGETTAZIONE E GESTIONE DEGLI IMPIANTI INDUSTRIALI Esercitazione 6 ORE ELEMENTI DI STATISTICA Prof. Ing. Maria Teresa Pilloni Anno Accademico
Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che
Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x
Corso di Fisica generale
Corso di Fisica generale Liceo Scientifico Righi, Cesena Anno Scolastico 2014/15 1C Introduzione alla Incertezza della Misura Sperimentale I Riccardo Fabbri 1 (Dispense ed esercizi su www.riccardofabbri.eu)
Corso di Automazione Industriale 1. Capitolo 4
Simona Sacone - DIST 1 Corso di Automazione Corso Industriale di 1 Automazione Industriale 1 Capitolo 4 Analisi delle prestazioni tramite l approccio simulativo Aspetti statistici della simulazione: analisi
ECONOMIA CLASSE IV prof.ssa Midolo L ASPETTO ECONOMICO DELLA GESTIONE. (lezione della prof.ssa Edi Dal Farra)
ECONOMIA CLASSE IV prof.ssa Midolo L ASPETTO ECONOMICO DELLA GESTIONE (lezione della prof.ssa Edi Dal Farra) La GESTIONE (operazioni che l azienda compie per raggiungere i suoi fini) può essere: ORDINARIA
STATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
Rapporto dal Questionari Insegnanti
Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la
Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice
cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze
ESAME DI STATISTICA Nome: Cognome: Matricola:
ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli
Il metodo della regressione
Il metodo della regressione Consideriamo il coefficiente beta di una semplice regressione lineare, cosa significa? È una differenza tra valori attesi Anche nel caso classico di variabile esplicativa continua
Corso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione : Misurazione, tabelle 1 Misurazione Definizione: La misura è l attribuzione di un valore numerico
La logica statistica della verifica (test) delle ipotesi
La logica statistica della verifica (test) delle ipotesi Come posso confrontare diverse ipotesi? Nella statistica inferenziale classica vengono sempre confrontate due ipotesi: l ipotesi nulla e l ipotesi
Analisi della performance temporale della rete
Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:
STATISTICA INFERENZIALE
STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p
Cosa dobbiamo già conoscere?
Cosa dobbiamo già conoscere? Insiemistica (operazioni, diagrammi...). Insiemi finiti/numerabili/non numerabili. Perché la probabilità? In molti esperimenti l esito non è noto a priori tuttavia si sa dire
OSSERVAZIONI TEORICHE Lezione n. 4
OSSERVAZIONI TEORICHE Lezione n. 4 Finalità: Sistematizzare concetti e definizioni. Verificare l apprendimento. Metodo: Lettura delle OSSERVAZIONI e risoluzione della scheda di verifica delle conoscenze
Lezione 1. Concetti Fondamentali
Lezione 1 Concetti Fondamentali Sonetto di Trilussa Sai ched è la statistica? E na cosa che serve pe fa un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa.
La distribuzione Gaussiana
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione
Un modello matematico di investimento ottimale
Un modello matematico di investimento ottimale Tiziano Vargiolu 1 1 Università degli Studi di Padova Liceo Scientifico Benedetti Venezia, giovedì 30 marzo 2011 Outline 1 Preliminari di calcolo delle probabilità
La variabile casuale Binomiale
La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola
Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica
Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -
IL FONDO DI ASSISTENZA SANITARIA INTEGRATIVA COOPERSALUTE CONOSCENZA, USO ED INTERESSE VERSO I SERVIZI, CUSTOMER SATISFACTION
Ricerche Sociali e di Marketing IL FONDO DI ASSISTENZA SANITARIA INTEGRATIVA COOPERSALUTE CONOSCENZA, USO ED INTERESSE VERSO I SERVIZI, CUSTOMER SATISFACTION LE PRINCIPALI RISULTANZE Roma, 16 Marzo 2010
Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria
Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Christopher N. Sciamanna, Scott P. Novak, Bess H. Marcus. International Journal of
4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0
Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice
METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica
METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano
CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -
Concetto di potenza statistica
Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1 Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H
Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)
STATISTICA (2) ESERCITAZIONE 4 18.02.2013 Dott.ssa Antonella Costanzo Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni) Sia X una popolazione distribuita secondo la legge Bernoulliana
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food
PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO
PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti
L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt
L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se
Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi
In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se
Il farmaco generico. Contenuti tecnico-scientifici del farmaco generico: comunicazione a corrente alternata
Il farmaco generico Contenuti tecnico-scientifici del farmaco generico: comunicazione a corrente alternata Il farmaco generico Cos è un farmaco generico? È un medicinale EQUIVALENZA terapeuticamente equivalente
VALORE DELLE MERCI SEQUESTRATE
La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune
Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 2004
Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 200 Esercizio 1 Tre apparecchiature M 1, M 2 e M 3 in un anno si guastano, in maniera indipendente, con probabilità
Regressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare
DI IDROLOGIA TECNICA PARTE III
FACOLTA DI INGEGNERIA Laurea Specialistica in Ingegneria Civile N.O. Giuseppe T. Aronica CORSO DI IDROLOGIA TECNICA PARTE III Idrologia delle piene Lezione XII: I metodi diretti per la valutazione delle
VALUTARE GLI EQUILIBRI DELL IMPRESA
VALUTARE GLI EQUILIBRI DELL IMPRESA Quattro valori fondamentali per valutare una impresa sono: 1. Il Capitale Operativo Investito, che è dato dal Capitale Fisso (Costi pluriennali a lenta rotazione) +
1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.
Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: [email protected] web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114
Errori di una misura e sua rappresentazione
Errori di una misura e sua rappresentazione Il risultato di una qualsiasi misura sperimentale è costituito da un valore numerico (con la rispettiva unità di misura) ed un incertezza (chiamata anche errore)
Temi di Esame a.a. 2012-2013. Statistica - CLEF
Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei
SCELTA DELL APPROCCIO. A corredo delle linee guida per l autovalutazione e il miglioramento
SCELTA DELL APPROCCIO A corredo delle linee guida per l autovalutazione e il miglioramento 1 SCELTA DELL APPROCCIO l approccio all autovalutazione diffusa può essere normale o semplificato, a seconda delle
Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008
Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi
matematica probabilmente
IS science centre immaginario scientifico Laboratorio dell'immaginario Scientifico - Trieste tel. 040224424 - fax 040224439 - e-mail: [email protected] - www.immaginarioscientifico.it indice Altezze e
Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)
Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso
CAPITOLO 7 LE DISTRIBUZIONI CAMPIONARIE E GLI INTERVALLI DI CONFIDENZA
SOLUZIONI 7.1 7.2 7.3 7.4 7.5 a) X=6,3 minuti b) 3,7 minuti CAPITOLO 7 LE DISTRIBUZIONI CAMPIONARIE E GLI INTERVALLI DI CONFIDENZA a) Quantitativo,discreto b) P=502/1004=0,5 o 50% c) Età,tipo di lavoro,
OpenPsy: OpenSource nella Psicologia. Presentazione del progetto in occasione dell edizione 2004 del Webbit (Padova)
OpenPsy: OpenSource nella Psicologia Pag. 1 di 9 OpenPsy: OpenSource nella Psicologia Presentazione del progetto in occasione dell edizione 2004 del Webbit (Padova) PREMESSA Per prima cosa, appare ovvio
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
La Concorrenza Monopolistica
La Concorrenza Monopolistica Caratteristiche Molteplicità di imprese Libertà di entrata (entreranno imprese finché vi sarà possibilità di profitti positivi). L entrata di nuove imprese favorisce i consumatori
Laboratorio di Pedagogia Sperimentale. Indice
INSEGNAMENTO DI LABORATORIO DI PEDAGOGIA SPERIMENTALE LEZIONE III INTRODUZIONE ALLA RICERCA SPERIMENTALE (PARTE III) PROF. VINCENZO BONAZZA Indice 1 L ipotesi -----------------------------------------------------------
