Statistica 1 A.A. 2015/2016

Documenti analoghi
Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Variabili casuali. - di Massimo Cristallo -

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

Statistica 1 A.A. 2015/2016

PROBABILITA. Distribuzione di probabilità

ESAME. 9 Gennaio 2017 COMPITO A

Statistica 1 A.A. 2015/2016

Esercitazioni di Statistica

ESAME. 9 Gennaio 2017 COMPITO B

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Ulteriori Conoscenze di Informatica e Statistica

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Distribuzioni e inferenza statistica

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo

Capitolo 6 La distribuzione normale

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016

STATISTICA AZIENDALE Modulo Controllo di Qualità

TECNICHE DI SIMULAZIONE

Ulteriori Conoscenze di Informatica e Statistica

Capitolo 6. La distribuzione normale

tabelle grafici misure di

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

Analisi e scelta dei dati di input

C.I. di Metodologia clinica

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Intervalli di confidenza

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

DISTRIBUZIONE NORMALE (1)

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Statistica Inferenziale

DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34

Intervalli di confidenza

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

Statistica Inferenziale

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 2 Concetti di base

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Tipi di variabili. Indici di tendenza centrale e di dispersione

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Statistica Inferenziale

Intervalli di confidenza

1.1 Obiettivi della statistica Struttura del testo 2

Statistica Applicata all edilizia: alcune distribuzioni di probabilità

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

STATISTICA A K (60 ore)

DISTRIBUZIONI DI CAMPIONAMENTO

Programma della parte introduttiva: Lezione 5

Occorre trovare la distribuzione di DM

STATISTICA 1 ESERCITAZIONE 6

Verifica delle ipotesi

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

Statistica 1. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo

UNIVERSITÀ DEGLI STUDI DI PERUGIA

I modelli probabilistici

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Stima puntuale di parametri

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 2 Concetti di base

Cenni di statistica statistica

Laboratorio di Probabilità e Statistica

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

MODELLI STATISTICI, RICHIAMI

Probabilità e Statistica

Stima puntuale di parametri

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Laboratorio di Chimica Fisica. Analisi Statistica

ESERCIZIO 1. Soluzione. X =numero di passeggeri giornaliero

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Modelli probabilistici variabili casuali

ISTITUTO TECNICO INDUSTRIALE STATALE FOCACCIA DISCIPLINA : CALCOLO PROGRAMMAZIONE MODULARE ANNO SCOLASTICO 2010/2011 CLASSI : III, IV, V

Esercitazioni di Statistica Matematica A Lezione 7. Variabili aleatorie continue

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.

Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico).

Modelli di probabilità

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

PROBABILITÀ ELEMENTARE

Casa dello Studente. Casa dello Studente

Statistica descrittiva in una variabile

Campionamento e stima di parametri

Probabilità e Statistica

LEZIONI DI STATISTICA MEDICA

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Materiale didattico per il corso di Statistica I Quarta esercitazione SOLUZIONI

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

Statistica 1- parte II

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

LE VARIABILI CASUALI A 1, A 2.,..., A k., p 2.,..., p k. generati da una specifica prova sono necessari ed incompatibili:

7 - Distribuzione Poissoniana

Distribuzione esponenziale. f(x) = 0 x < 0

STATISTICA (modulo II - Inferenza Statistica) Soluzione Esercitazione I

Transcript:

Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 52

Adattamento di una distribuzione teorica ad una distribuzione empirica La valutazione della bontà di adattamento di una distribuzione teorica ad una distribuzione empirica avviene attraverso le seguenti fasi: i. in funzione della natura della variabile statistica in esame si sceglie il modello probabilistico più ideneo; ii. valutazione della bontà di adattamento mediante l indice X 2 = k (n i n i ) 2 i=1 ni a) stima dei parametri incogniti del modello probabilistico scelto; b) calcolo delle frequenze teoriche ni ; c) valutazione della bontà di adattamento mediante il confronto dell indice X 2 con il valore critico k 1, dove k è il numero di modalità/classi della distribuzione di frequenza in esame. 2 / 52

Momenti empirici I momenti empirici, i quali costituiscono la versione empirica dei momenti teorici, svolgono un ruolo centrale all interno del metodo dei momenti per la stima dei parametri di una funzione di distribuzione di probabilità o di una funzione di densità. I momenti empirici consentono inoltre di definire la versione empirica dell indice teorico di asimmetria β 1 e dell indice di curtosi β 2. 3 / 52

Sia (x 1, x 2,..., x n) un campione di numerosità n. Definiamo momento empirico di ordine r e origine m la quantità n i=1 ˆµ m,r = (x i m) r. n La precedente definizione mostra che il momento empirico di origine 0 e ordine 1 è la media artimetica n i=1 ˆµ 0,1 = x i = x n I momementi empirici di ordine r e origine la media aritmetica x vengono definiti momenti empirici centrati di ordine r, formalmente n i=1 ˆµ r = (x i x) r. n L espressione precedente mostra che il momento empirico centrato di ordine 2 è l indice varianza n i=1 ˆµ 2 = (x i x) 2. n 4 / 52

Quando si dispone di una distribuzione di frequenza, il momento empirico di ordine r e origine m viene definito nel seguente modo n i=1 ˆµ m,r = (x i m) r n i. n dove n i è la frequenza assoluta associata ad x i. Se si dispone di una distribuzione di frequenza in classi, la formula precedente si modifica utilizzando i valori centrale di ogni classe, ovvero n i=1 ˆµ m,r = (x i c m) r n i n 5 / 52

Il problema della bontà di adattamento: esempio 1 Un gruppo di 80 studenti è stato sottoposto ad un test attitudinale per l ammissione ad un corso di studi. Viene riportata la distribuzione di frequenze della variabile Numero di errori commessi: X n i 0 1 1 2 2 6 3 9 4 14 5 22 6 12 7 7 8 5 9 1 10 1 Tot. 80 Individuare il modello teorico più opportuno da adattare alla distribuzione osservata e verificarne la bontà di adattamento. 6 / 52

La variabile statistica osservata numero di errori commessi è una variabile quantitativa discreta, quindi la nostra scelta si limita ai modelli studiati per le variabili aleatorie discrete, ovvero la variabile aleatoria binomiale e la variabile aleatoria di Poisson. Osservazioni: i. la variabile in esame può assumere solamente un numero finito di valori, ovvero il numero totale n di domande riportate nel questionario. Notiamo che n non è noto; ii. la distribuzione di frequenza sembra mostrare che la variabile considerata non descrive un evento raro. Sulla base delle osservazioni precedenti si deduce che il modello probabilistico più idoneo è il modello binomiale. 7 / 52

Come visto in precedenza, la funzione di distribuzione di probabilità di una variabile aleatoria binomiale ( ) n p(x) = π x (1 π) n x x è indicizzata da due parametri: n = numero di prove; π = probabilità dell evento successo. Poiché n e π non sono noti è necessario utilizzare un metodo opportuno per la stima dei due parametri. Il metodo che utilizzeremo prende il nome di metodo dei momenti. 8 / 52

Il metodo dei momenti è uno dei più vecchi metodi di stima puntuale proposti in letteratura e venne introdotto da Karl Pearson alla fine del 1800. Il metodo consiste nell uguagliare i momenti teorici con i momenti empirici. risoluzione del sistema così ottenuto fornisce le stime dei parametri incogniti. La Consideriamo quindi il sistema { ˆnˆπ = x ˆnˆπ(1 ˆπ) = σ 2 dove x e σ 2 sono rispettivamente la media aritmetica e la varianza calcolata sui dati. 9 / 52

Sostituendo nella seconda equazione ˆnˆπ con x si ricava x(1 ˆπ) = σ 2 quindi 1 ˆπ = σ2 x Noto ˆπ, sostituendo nella prima equazione si ricava quindi ˆπ = 1 σ2 x. ˆn = xˆπ. Poiché ˆn non è un numero intero si utilizza come stima del parametro n sempre l intero successivo. 10 / 52

L esempio 1 che segue consente di chiarire perché ˆn deve sempre essere arrotondato all intero successivo. Sia X una variabile aleatoria binomiale di parametri n e π. Dalla tabella X n i x i n i xi 2 xi 2 n i 0 1 0 0 0 1 2 2 1 2 2 16 32 4 64 3 1 3 9 9 Tot. 20 37 75 si ricava che x = 37 20 = 1.85 σ2 = 75 20 1.852 = 0.3275. Applicando le formule precedenti si ricava ˆπ = 1 σ2 x = 0.82 ˆn = xˆπ = 2.26 Poiché la variabile X assume massimo valore 3, si deduce che ˆn non può essere arrotondato al valore 2 dato che ˆn è una stima del numero totale di prove compiute. 1 l autore è in debito con il Prof. Mineo e il Prof. Chiodi per l esempio suggerito. 11 / 52

Con riferimento alla variabile numero di errori commessi, dalla seguente tabella x i n i x i n i xi 2 xi 2 n i 0 1 0 0 0 1 2 2 1 2 2 6 12 4 24 3 9 27 9 81 4 14 56 16 224 5 22 110 25 550 6 12 72 36 432 7 7 49 49 343 8 5 40 64 320 9 1 9 81 81 10 1 10 100 100 Tot. 80 387 2157 si ricava che x = 4.84 e σ 2 = 3.56. Utilizzando le formule precedenti si ricava ˆπ = 1 σ2 x Utilizzando l intero successivo si ricava che ˆn = 19. = 0.26 ˆn = xˆπ = 18.62 12 / 52

Sulla base dei precedenti risultati, le probabilità teoriche sono fornite dalla seguente funzione di distribuzione di probabilità ( 19 ) ˆp(x i ) = 0.26 x i (1 0.26) (19 x i ) x i Le frequenze teoriche, denotate con ni, sono ottenute moltiplicando le probabilità teoriche, ˆp(x i ), per il totale delle osservazioni, ovvero 80. x n i ˆp(x i ) ni (n i ni ) (n i ni )2 (n i ni )2 /ni 0 1 0.0033 0.2640 0.7360 0.5417 2.0519 1 2 0.0219 1.7520 0.2480 0.0615 0.0351 2 6 0.0692 5.5360 0.4640 0.2153 0.0389 3 9 0.1377 11.0160-2.0160 4.0643 0.3689 4 14 0.1935 15.4800-1.4800 2.1904 0.1415 5 22 0.2040 16.3200 5.6800 32.2624 1.9769 6 12 0.1672 13.3760-1.3760 1.8934 0.1416 7 7 0.1091 8.7280-1.7280 2.9860 0.3421 8 5 0.0575 4.6000 0.4000 0.1600 0.0348 9 1 0.0247 1.9760-0.9760 0.9526 0.4821 10 1 0.0119 0.9520 0.0480 0.0023 0.0024 Tot, 80 1 5.6162 Poiché X 2 = 5.6162 è inferiore a k 1 = 11 1 = 10 si deduce che il modello binomiale descrive bene i dati a nostra disposizione. 13 / 52

Il problema della bontà di adattamento: esempio 2 Un gruppo di 76 studenti è stato sottoposto ad un test attitudinale per l ammissione ad un corso di studi. Viene riportata la distribuzione di frequenze della variabile Numero di errori commessi su un totale di 10 domande: x n 0 1 1 2 2 5 3 8 4 14 5 20 6 13 7 6 8 4 9 2 10 1 Tot. 76 Individuare il modello teorico più opportuno da adattare alla distribuzione osservata e verificarne l adattamento. 14 / 52

La variabile statistica osservata numero di errori commessi su un totale di 10 domande è una variabile quantitativa discreta, quindi la nostra scelta si limita ai modelli studiati per le variabili aleatorie discrete, ovvero la variabile aleatoria binomiale e la variabile aleatoria di Poisson. Osservazioni: i. la variabile in esame può assumere solamente un numero finito di valori. Notiamo che n è noto; ii. la distribuzione di frequenza mostra che la variabile considerata non sembra descrivere un evento raro. Sulla base delle osservazioni precedenti si deduce che il modello probabilistico più idoneo è il modello binomiale. 15 / 52

Come visto in precedenza, la funzione di distribuzione di probabilità di una variabile aleatoria binomiale ( ) n p(x) = π x (1 π) n x x è indicizzata da due parametri: n = numero di prove; π = probabilità dell evento successo. Dalla descrizione dell esperimento si deduce che il parametro n è noto ed uguale a 10. Il parametro π è incognito e verrà stimato con il metodo dei momenti. Uguagliando il valore atteso della variabile aleatoria binomiale alla media aritmetica si ricava che ˆπ = x n. E(X ) = n ˆπ = x 16 / 52

La seguente tabella mostra che x = 372 76 x n x n 0 1 0 1 2 2 2 5 10 3 8 24 4 14 56 5 20 100 6 13 78 7 6 42 8 4 32 9 2 18 10 1 10 Tot. 76 372 = 4.89 da cui si ricava che ˆπ = 4.89 10 = 0.489. 17 / 52

Sulla base dei precedenti risultati, le probabilità teoriche sono fornite dalla seguente funzione di distribuzione di probabilità ( 10 ) ˆp(x i ) = 0.489 x i (1 0.489) (10 x i ) x i Le frequenze teoriche, denotate con ni, sono ottenute moltiplicando le probabilità teoriche, ˆp(x i ), per il totale delle osservazioni, ovvero 76. x n i ˆp(x i ) ni (n i ni ) (n i ni )2 (n i ni )2 /ni 0 1 0.001 0.076 0.924 0.854 11.234 1 2 0.012 0.912 1.088 1.184 1.298 2 5 0.050 3.800 1.200 1.440 0.379 3 8 0.128 9.728-1.728 2.986 0.307 4 14 0.214 16.264-2.264 5.126 0.315 5 20 0.245 18.620 1.380 1.904 0.102 6 13 0.196 14.896-1.896 3.595 0.241 7 6 0.107 8.132-2.132 4.545 0.559 8 4 0.038 2.888 1.112 1.237 0.428 9 2 0.008 0.608 1.392 1.938 3.187 10 1 0.001 0.076 0.924 0.854 11.234 Tot. 76 1 29.284 18 / 52

Sulla base dei risultati precedenti si ricava che X 2 = 29.284. Poiché X 2 è più grande di k 1 = 11 1 = 10, i risultati sembrano suggerire che non vi sia un buon adattamento. L analisi della tabella utilizzata per il calcolo dell indice X 2 x n i ˆp i ni (n i ni ) (n i ni )2 (n i ni )2 /ni 0 1 0.001 0.076 0.924 0.854 11.234 1 2 0.012 0.912 1.088 1.184 1.298 2 5 0.050 3.800 1.200 1.440 0.379 3 8 0.128 9.728-1.728 2.986 0.307 4 14 0.214 16.264-2.264 5.126 0.315 5 20 0.245 18.620 1.380 1.904 0.102 6 13 0.196 14.896-1.896 3.595 0.241 7 6 0.107 8.132-2.132 4.545 0.559 8 4 0.038 2.888 1.112 1.237 0.428 9 2 0.008 0.608 1.392 1.938 3.187 10 1 0.001 0.076 0.924 0.854 11.234 29.284 mostra che il cattivo adattamento è dovuto solamente ai valori (n i ni )2 /ni delle prime due righe e delle ultime due righe. 19 / 52

Il problema della bontà di adattamento: esempio 3 Negli ultimi anni si è assistito ad un evoluzione delle modalità di accesso wireless ad Internet sia in termini di affidabilità che di prestazioni. All interno di questo nuovo settore tecnologico le femtocelle, piccole stazioni radio domestiche in grado di coprire un ufficio o un appartamento e gestite in remoto dagli operatori di telefonia mobile, consentono di eliminare i problemi di trasmissione che si verificano all interno di luoghi di ridotte dimensioni. Per valutare le prestazioni di una nuova femtocella, un gruppo di ingegneri ha rilevato per 100 giorni il numero di interferenze giornaliere, denotato con X, ottenendo la seguente distribuzione di frequenza X 0 1 2 3 4 5 6 7 8 n i 6 12 25 20 17 8 9 2 1 Sulla base della descrizione del fenomeno oggetto di studio, il candidato scelga il più adeguato modello probabilistico e ne valuti l adattamento mediante l indice più adeguato. 20 / 52

La variabile statistica osservata numero di interferenze giornaliere è una variabile quantitativa discreta, quindi la nostra scelta si limita ai modelli studiati per le variabili aleatorie discrete, ovvero la variabile aleatoria binomiale e la variabile aleatoria di Poisson. Osservazioni: i. la variabile in esame può assumere, almeno da un punto di vista teorico, un numero infinito di valori. ii. la variabile in esame sembra descrivere un evento raro. Sulla base delle osservazioni precedenti si deduce che il modello probabilistico più idoneo è il modello di Poisson. 21 / 52

La funzione di distribuzione di probabilità della variabile aleatoria di Poisson dipende da un solo parametro incognito p(x) = λx e λ x! λ = valore atteso della variabile aleatoria X. L applicazione del metodo dei momenti mostra che il parametro λ può essere stimato tramite la media aritmetica, ovvero ˆλ = x = k i=1 x i n i n 22 / 52

La tabella mostra che ˆλ = x i n i x i n i 0 6 0 1 12 12 2 25 50 3 20 60 4 17 68 5 8 40 6 9 54 7 2 14 8 1 8 Tot. 100 306 k i=1 x i n i n = 306 100 = 3.06. 23 / 52

Sulla base della stima del parametro λ, le probabilità teoriche sono fornite dalla seguente funzione p(x i ) = 3.06x i e 3.06 x i! Le frequenze teoriche, denotate con n i, sono ottenute moltiplicando le probabilità teoriche, p(x i ), per il totale delle osservazioni, ovvero 100. x i n i p(x i ) ni n i ni (n i ni )2 (n i ni )2 /ni 0 6 0.0469 4.69 1.31 1.7161 0.3659 1 12 0.1435 14.35-2.35 5.5225 0.3848 2 25 0.2195 21.95 3.05 9.3025 0.4238 3 20 0.2239 22.39-2.39 5.7121 0.2551 4 17 0.1713 17.13-0.13 0.0169 0.0010 5 8 0.1048 10.48-2.48 6.1504 0.5869 6 9 0.0535 5.35 3.65 13.3225 2.4902 7 2 0.0234 2.34-0.34 0.1156 0.0494 8 1 0.0132 1.32-0.32 0.1024 0.0776 Tot. 100 1 4.6347 Poiché l indice X 2 è inferiore a k 1 = 9 1 = 8 si può ritenere che il modello teorico di Poisson descrive bene i dati a nostra disposizione. 24 / 52

Di seguito è riportata la distribuzione di frequenza del numero di prodotti realizzati giornalmente da una data azienda e definiti difettosi. x n 0 11 1 20 2 32 3 24 4 21 5 11 6 12 7 4 8 1 Sulla base della descrizione del fenomeno oggetto di studio, il candidato scelga il più adeguato modello probabilistico e ne valuti l adattamento mediante l indice più adeguato. 25 / 52

La variabile statistica osservata numero di prodotti difettosi è una variabile quantitativa discreta, quindi la nostra scelta si limita ai modelli studiati per le variabili aleatorie discrete, ovvero la variabile aleatoria binomiale e la variabile aleatoria di Poisson. Osservazioni: i. la variabile in esame può assumere, almeno da un punto di vista teorico, un numero infinito di valori. ii. la variabile in esame sembra descrivere un evento raro. Sulla base delle osservazioni precedenti si deduce che il modello probabilistico più idoneo è il modello di Poisson. 26 / 52

La funzione di distribuzione di probabilità della variabile aleatoria di Poisson dipende da un solo parametro incognito p(x) = λx e λ x! λ = valore atteso della variabile aleatoria X. L applicazione del metodo dei momenti mostra che il parametro λ può essere stimato tramite la media aritmetica, ovvero ˆλ = x = k i=1 x i n i n 27 / 52

La tabella mostra che ˆλ = x i n i x i n i 0 11 0 1 20 20 2 32 64 3 24 72 4 21 84 5 11 55 6 12 72 7 4 28 8 1 8 Tot. 136 403 k i=1 x i n i n = 403 136 = 2.96. 28 / 52

Sulla base della stima del parametro λ, le probabilità teoriche sono fornite dalla seguente funzione p(x i ) = 2.96x i e 2.96 x i! Le frequenze teoriche, denotate con n i, sono ottenute moltiplicando le probabilità teoriche, p(x i ), per il totale delle osservazioni, ovvero 100. x i n i p(x i ) ni n i ni (n i ni )2 (n i ni )2 /ni 0 11 0.0517 7.0312 3.9688 15.7514 2.2402 1 20 0.1531 20.8216-0.8216 0.6750 0.0324 2 32 0.2268 30.8448 1.1552 1.3345 0.0433 3 24 0.2240 30.4640-6.4640 41.7833 1.3716 4 21 0.1659 22.5624-1.5624 2.4411 0.1082 5 11 0.0983 13.3688-2.3688 5.6112 0.4197 6 12 0.0486 6.6096 5.3904 29.0564 4.3961 7 4 0.0206 2.8016 1.1984 1.4362 0.5126 8 1 0.0110 1.4960-0.4960 0.2460 0.1644 Tot. 136 1 9.2885 Poiché l indice X 2 è inferiore a k 1 = 9 1 = 8 si può ritenere che il modello teorico di Poisson non descrive bene i dati a nostra disposizione. 29 / 52

Il problema della bontà di adattamento: esempio 4 Di seguito è riportata la distribuzione di frequenza in classi ottenuta mediante un campione 100 misure sperimentali rilevate in un punto di un circuito elettrico tramite voltmetro digitale. classi n i 0 5 2 5 10 16 10 15 36 15 20 32 20 25 13 25 30 1 Individuare il modello teorico più opportuno da adattare alla distribuzione osservata e verificarne l adattamento. 30 / 52

Poiché la variabile statistica osservata è una variabile quantitativa continua, l unico modello teorico di cui possiamo valutare la bontà di adattamento è il modello di Gauss. La funzione di densità dipende dai due parametri incogniti f X (x; µ, σ) = 1 σ (x µ) 2 2π e 2σ 2, µ = valore atteso della variabile aleatoria X σ = deviazione standard della variabile aleatoria X. I parametri µ e σ possono essere stimati attraverso la media aritmetica e la deviazione standard campionaria. 31 / 52

Dalla tabella classi n i x c i x c i n i (x c i )2 (x c i )2 n i 0 5 2 2.5 5.0 6.25 12.50 5 10 16 7.5 120.0 56.25 900.00 10 15 36 12.5 450.0 156.25 5625.00 15 20 32 17.5 560.0 306.25 9800.00 20 25 13 22.5 292.5 506.25 6581.25 25 30 1 27.5 27.5 756.25 756.25 Tot. 100 1455.0 23675 si ricava k i=1 ˆµ = x = x i cn i = 14.55 n k i=1 ˆσ = (x i c)2 n i x n 2 = 5.005 32 / 52

Il calcolo dell indice X 2 = k (n i n i ) 2 i=1 n si fonda sull utilizzo delle frequenze teoriche i ni definite come ni = n P(x i < X < x i+1 ) Utilizzando la relazione P(x i < X < x i+1 ) = P(z i < Z < z i+1 ) = P(Z < z i+1 ) P(Z < z i ) = F (z i+1 ) F (z i ) si ricava che per il calcolo delle frequenze teoriche è necessario calcolare i valori standardizzati z i = x i ˆµ = x i 14.55 ˆσ 5.005 ed utilizzare il prontuario delle probabilità integrali della distribuzione normale standardizzata. 33 / 52

Dallo studio della seguente tabella si ricava che x i+1 z i+1 F i+1 0 F i+1 F i n i n i (n i n i ) (n i n i ) 2 (n i n i ) 2 /n i 5-1.908 0.028 0.028 2.8 2-0.8 0.64 0.229 10-0.909 0.182 0.154 15.4 16 0.6 0.36 0.023 15 0.090 0.536 0.354 35.4 36 0.6 0.36 0.010 20 1.089 0.862 0.326 32.6 32-0.6 0.36 0.011 25 2.088 0.982 0.120 12 13 1.0 1.00 0.083 + 1 0.018 1.8 1-0.8 0.64 0.356 Tot. 0.712 X 2 = 0.712. Poiché l indice X 2 è inferiore al valore k 1 = 6 1 = 5, si deduce che la distribuzione di Gauss descrive bene la distribuzione osservata. 34 / 52

I risultati ottenuti in precedenza trovano conferma nella seguente rappresentazione grafica. 0.00 0.02 0.04 0.06 0.08 f i 0 5 10 15 20 25 30 Volt 35 / 52

Il problema della bontà di adattamento: esempio 5 Per valutare il livello di inquinamento di un dato fiume del territorio italiano, un gruppo di studiosi ha misurato il livello di nitrogeno presente in un punto fissato del fiume. Di seguito viene riportata la distribuzione di frequenza in classi ottenuta attraverso un campione di 112 rilevazioni sperimentali. Classi n i 130 135 12 135 140 28 140 145 34 145 150 19 150 155 9 155 160 5 160 165 3 165 170 2 Tot. 112 Individuare il modello teorico più opportuno da adattare alla distribuzione osservata e verificarne l adattamento. 36 / 52

Poiché la variabile statistica osservata è una variabile quantitativa continua, l unico modello teorico di cui possiamo valutare la bontà di adattamento è il modello di Gauss. 0.00 0.01 0.02 0.03 0.04 0.05 0.06 f i 130 140 150 160 170 N 2O Il grafico sembra suggerire che il modello di Gauss non descrive bene i dati a nostra disposizione. Una conferma a tale ipotesi è ottenuta mediante l indice X 2. 37 / 52

La funzione di densità dipende dai due parametri incogniti f X (x; µ, σ) = 1 σ (x µ) 2 2π e 2σ 2, µ = valore atteso della variabile aleatoria X σ = deviazione standard della variabile aleatoria X. I parametri µ e σ possono essere stimati attraverso la media aritmetica e la deviazione standard. 38 / 52

Dalla tabella si ricava classi n i x c i x c i n i (x c i )2 (x c i )2 n i 130 135 12 132.5 1590.0 17556.25 210675.00 135 140 28 137.5 3850.0 18906.25 529375.00 140 145 34 142.5 4845.0 20306.25 690412.50 145 150 19 147.5 2802.5 21756.25 413368.75 150 155 9 152.5 1372.5 23256.25 209306.25 155 160 5 157.5 787.5 24806.25 124031.25 160 165 3 162.5 487.5 26406.25 79218.75 165 170 2 167.5 335.0 28056.25 56112.50 Tot. 112 16070 2312500.00 k i=1 ˆµ = x = x i cn i = 143.482 n k i=1 ˆσ = (x i c)2 n i x n 2 = 7.761 39 / 52

Il calcolo dell indice X 2 = k (n i n i ) 2 i=1 n si fonda sull utilizzo delle frequenze teoriche i ni definite come ni = n P(x i < X < x i+1 ) Utilizzando la relazione P(x i < X < x i+1 ) = P(z i < Z < z i+1 ) = P(Z < z i+1 ) P(Z < z i ) = F (z i+1 ) F (z i ) si ricava che per il calcolo delle frequenze teoriche è necessario calcolare i valori standardizzati z i = x i ˆµ = x i 143.482 ˆσ 7.761 ed utilizzare il prontuario delle probabilità integrali della distribuzione normale standardizzata. 40 / 52

Poiché ni = n[f (z i+1 ) F (z i )], si ricava che il calcolo dell indice X 2 si basa sulla seguente tabella x i+1 z i+1 F i+1 F i+1 F i n i n i (n i n i ) (n i n i )2 (n i n i ) 2 0 135-1.093 0.137 0.137 15.344 12-3.344 11.182 0.729 140-0.449 0.327 0.190 21.280 28 6.720 45.158 2.122 145 0.196 0.578 0.251 28.112 34 5.888 34.669 1.233 150 0.840 0.800 0.222 24.864 19-5.864 34.386 1.383 155 1.484 0.931 0.131 14.672 9-5.672 32.172 2.193 160 2.128 0.983 0.052 5.824 5-0.824 0.679 0.117 165 2.773 0.997 0.014 1.568 3 1.432 2.051 1.308 + 1 0.003 0.336 2 1.664 2.769 8.241 Tot. 17.325 da cui si ricava che X 2 = 17.325. Poiché l indice X 2 è superiore a k 1 = 8 1 = 7 si deduce che la distribuzione di Gauss non descrive bene la distribuzione osservata. n i 41 / 52

I risultati ottenuti in precedenza trovano conferma nella seguente rappresentazione grafica 0.00 0.01 0.02 0.03 0.04 0.05 0.06 f i 120 130 140 150 160 170 N 2O dalla quale si evence che il modello di Gauss non descrive bene i dati a nostra disposizione. 42 / 52

Esercizi I test ADAC sono tra le più affidabili e attendibili prove sugli pneumatici. L ultimo test condotto ha avuto come obiettivo il confronto di 3 differenti prodotti, indicati con P 1, P 2 e P 3, con un prodotto di riferimento, indicato con P 0. Il test è stato ripetuto 100 volte per ogni prodotto e nella seguente tabella sono riportati i risultati ottenuti. Il test fornisce un valore reale compreso tra 0 e 100 e i valori crescenti indicano un miglioramento nella performance dei pneumatici. Tabella: Risultati del test ADAC Test 0 20 20 40 40 60 60 80 80 100 Tot. P 0 33 46 13 7 1 100 P 1 26 27 25 13 9 100 P 2 4 12 61 15 8 100 P 3 7 6 17 43 27 100 Sulla base della descrizione del fenomeno in esame scegliere il più opportuno modello probabilistico e verificarne l adattamento alle distribuzioni dei prodotti P 0, P 1, P 2 e P 3. 43 / 52

Un azienda di credito ha ripartito un campione di 140 dei propri clienti in due categorie definite solvente e insolvente. La tabella seguente riporta la distribuzione dei finanziamenti concessi dall azienda di credito in funzione delle due categorie considerate Finanziamenti concessi (dati per migliaia di euro) Cliente 1 1.5 1.5 2 2 2.5 2.5 3 3 3.5 solvente 6 25 37 21 3 insolvente 25 13 7 2 1 Sulla base dei dati riportati in tabella, si scelga il modello probabilistico più adeguato per descrivere la distribuzione di frequenze dei clienti di tipo solvente e se ne valuti la bontà di adattamento mendiante adeguato indice statistico. 44 / 52

Per valutare le prestazioni di un nuovo processore per personal computer, il direttore del reparto ricerca e sviluppo ha ripetuto, sullo stesso processore, cento volte lo stesso benchmark prestazionale. Il benchmark utilizzato fornisce un valore continuo e di seguito è riportata la distribuzione di frequenze in classi dei risultati ottenuti. Tabella: Distribuzione di frequenze in classi dei risultati del benchmark considerato Benchmark n i 0 1 4 1 2 26 2 3 47 3 4 20 4 5 3 Tot. 100 Il candidato valuti la bontà di adattamento al modello probabilistico ritenuto più adeguato per i dati riportati in tabella. Commentare adeguatamente i risultati ottenuti. 45 / 52

Di seguito è riportata la distribuzione di frequenze in classi delle sovvenzioni cambiarie concesse da una data banca ai propri clienti. Tabella: Distribuzione di frequenze in classi delle sovvenzioni cambiarie (dati in migliaia di euro) Sovvenzioni n i < 200 8 200 300 11 300 500 19 500 700 21 700 1000 17 Tot. 76 Il candidato valuti la bontà di adattamento al modello probabilistico ritenuto più adeguato per i dati riportati in tabella. 46 / 52

Per valutare la qualità del proprio processo produttivo, l addetto al controllo della qualità di un azienda produttrice di lampadine estrae con reimmisione, dal totale della produzione mensile, trenta campioni di numerosità dieci. Su ogni campione viene rilevato il numero di lampadine difettose. La tabella riporta i dati rilevati. Tabella: Numero di lampadine difettose rilevato su trenta campioni 3 3 0 2 2 2 2 2 2 0 3 2 1 3 4 3 1 2 2 0 2 2 3 3 1 3 4 3 2 2 i. Il candidato costruisca e rappresenti graficamente la distribuzione di frequenze della variabile numero di lampadine difettose. ii. Il candidato adatti alla variabile numero di lampadine difettose il modello teorico che ritiene più opportuno e ne valuti l adattamento attraverso un adeguato indice. 47 / 52

Si sono rilevati i guasti meccanici riportati da 40 autovetture FIAT e da 60 autovetture OPEL, possedute da un azienda di spedizioni, nei primi 50.000 km di percorrenza. I dati sono sintetizzati nella seguente tabella che riporta le frequenze assolute: N. Guasti Fiat Opel 0 9 33 1 13 10 2 10 6 3 5 1 4 3 0 Si adatti alla variabile osservata, distintamente per i due tipi di autovettura, la variabile casuale che si ritiene più opportuna, e si calcoli, su ciascuna delle due distribuzioni, un indice di bontà di adattamento. Su quale delle due distribuzioni l adattamento si può ritenere migliore? 48 / 52

In un impresa di soccorso stradale sono state registrate le richieste giornaliere di intervento, su un arco di 100 giorni, ottenendo la seguente distribuzione di frequenza: interventi 0 1 2 3 4 5 6 7 n 14 22 31 17 8 5 2 1 Il candidato adatti alla variabile numero di interventi giornalieri il modello teorico che ritiene più opportuno e ne valuti l adattamento attraverso un adeguato indice. 49 / 52

In un campione casuale di 130 circuiti elettronici è stato osservato il numero dei difetti presenti. La distribuzione di frequenza del numero dei difetti è riportata nella seguente tabella: n. di difetti 0 1 2 3 4 5 6 7 frequenza osservata 25 54 35 9 3 2 1 1 Il candidato adatti alla variabile numero di difetti il modello teorico che ritiene più opportuno e ne valuti l adattamento attraverso un adeguato indice. 50 / 52

La seguente distribuzione descrive il numero di particelle rilasciate durante il decadimento radioattivo del Polonio, in intervalli di 72 secondi: x 0 1 2 3 4 5 6 7 8 9 10 11 n 57 203 383 525 532 408 273 139 45 27 10 4 Il candidato adatti alla variabile considerata il modello teorico che ritiene più opportuno e ne valuti l adattamento attraverso un adeguato indice. 51 / 52

La seguente tabella mostra la distribuzione di frequenze del numero dei parti, rilevato in una clinica, nell arco di un periodo di 100 giorni: n. parti frequenze 0 17 1 32 2 29 3 15 4 3 5 2 6 1 7 1 Il candidato adatti alla variabile considerata il modello teorico che ritiene più opportuno e ne valuti l adattamento attraverso un adeguato indice. 52 / 52