Statistica 1- parte II

Documenti analoghi
STATISTICA (2) ESERCITAZIONE 1. Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

STATISTICA ESERCITAZIONE. 1) Specificare la distribuzione di probabilità della variabile e rappresentarla graficamente;

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

STATISTICA ESERCITAZIONE

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Variabili casuali. - di Massimo Cristallo -

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Esercitazione 4 del corso di Statistica (parte 2)

Statistica Applicata all edilizia: alcune distribuzioni di probabilità

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano

Statistica. Esercitazione 10. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice. V.C.

Esercizi svolti di statistica. Gianpaolo Gabutti

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

X ~ N (20, 16) Soluzione

Scanned by CamScanner

ES.2.3. è pari ad 1. Una variabile aleatoria X che assume valori su tutta la retta si dice distribuita

Il campionamento e l inferenza. Il campionamento e l inferenza

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

Statistica. Alfonso Iodice D Enza

Esercitazione: La distribuzione NORMALE

DISTRIBUZIONI DI PROBABILITA

Esercitazione 1 del corso di Statistica (parte 2)

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Probabilità. Lezioni : 11, 12. Docente: Alessandra Durio

P (0 semafori rossi) = 0,05 P (1 semaforo rosso) = 0,20 P (2 semafori rossi) = 0,25 P (3 semafori rossi) = 0,35 P (4 semafori rossi) = 0,15

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

PROBABILITÀ ELEMENTARE

a) 36/100 b) 1/3 c)

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Intervalli di confidenza

standardizzazione dei punteggi di un test

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

Esercitazione di Statistica Distribuzioni (Uniforme discreta e continua/ Binomiale/ Poisson) 18/11/2015

Statistica Metodologica

TEST n La funzione di ripartizione di una variabile aleatoria:

Tutorato 2 (21/12/2012) - Soluzioni

Esercitazione N. 1 (11 ottobre 2016)

Statistica Inferenziale

UNIVERSITÀ di ROMA TOR VERGATA

DISTRIBUZIONI DI CAMPIONAMENTO

Alcune v.a. discrete notevoli

Quanti soggetti devono essere selezionati?

V.C. RETTANGOLARE o UNIFORME

SCHEDA DIDATTICA N 7

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

Cap. 7 Distribuzioni campionarie

VARIABILI CASUALI CONTINUE

Compiti tematici capp. 5,6

Esercitazione 4 del corso di Statistica 2 Prof. Domenico Vistocco

Calcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale a.a. 2016/17

Corso di Statistica. Distribuzioni di probabilità per variabili casuali discrete. Prof.ssa T. Laureti a.a

La casualità nello spazio o nel tempo: la distribuzione di Poisson

Tipi di variabili. Indici di tendenza centrale e di dispersione

4. Si supponga che il tempo impiegato da una lettera spedita dall Italia per arrivare a destinazione segua una distribuzione normale con media

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

Regressione Lineare Semplice e Correlazione

UNIVERSITÀ DEGLI STUDI DI PERUGIA

LE DISTRIBUZIONI CAMPIONARIE

un elemento scelto a caso dello spazio degli esiti di un fenomeno aleatorio;

Esercizi di Probabilità e Statistica

DISTRIBUZIONE NORMALE (1)

STATISTICA A D (72 ore)

Distribuzione di Probabilità

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

SOLUZIONI DEL 1 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA

PROBABILITA. Distribuzione di probabilità

p k q n k = p n (k) = n 12 = 1 = ,1208. q = 1 2 e si ha: p 12 (8) =

STATISTICA ESERCITAZIONE 9

C.I. di Metodologia clinica

Teoria e tecniche dei test

Esercitazioni di Statistica

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale;

Variabilità e Concentrazione Esercitazione n 02

Compiti tematici dai capitoli 2,3,4

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Distribuzioni di probabilità

Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici

1. Descrivere gli spazi campionari dei seguenti esperimenti casuali: 1. lancio di un dado 2. lancio di due dadi 3.

Modelli probabilistici variabili casuali

Teorema del limite centrale TCL

Stima puntuale di parametri

Esercizi di Calcolo combinatorio: disposizioni

Elementi di base su modello binomiale e modello normale

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Distribuzioni campionarie. Antonello Maruotti

6) Una variabile aleatoria discreta V ha la seguente densità di probabilità:

STATISTICA AZIENDALE Modulo Controllo di Qualità

Esercitazione # 3. Trovate la probabilita che in 5 lanci di un dado non truccato il 3 si presenti

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Transcript:

Statistica 1- parte II Esercitazione 1 Dott.ssa Antonella Costanzo 11/02/2016 Esercizio 1. Modelli discreti di probabilità: le v.c. binomiale e geometrica (come caso particolare della v.c. binomiale negativa), la v.c. di Poisson In una partita di tiro a segno, per il giocatore A la probabilità di centrare un bersaglio è pari a 0.3. Sapendo che gli esiti dei tiri sono indipendenti, calcolare: a) la probabilità di fare un centro in 6 tiri; b) la probabilità di fare al più 4 centri in 6 tiri; c) la probabilità di non fare centro in tutti e 6 i tiri; d) la probabilità di fare il primo centro esattamente al sesto tiro; e) il numero medio di tiri necessari per fare centro. f) la probabilità che occorrano 4 tiri prima di fare 2 centri In base alle precedenti esperienze è noto che, durante la partita, il giocatore A realizza un centro ogni 2 minuti in media. g) Qual è il numero medio di centri che il giocatore può realizzare in un'ora? h) Qual è la probabilità di effettuare 3 centri in 5 minuti? i) Qual è la probabilità che il giocatore A non centri mai il bersaglio nell'arco di 5 minuti? a) Denotiamo con X il numero di centri in n = 6 prove indipendenti con probabilità costante pari a p = 0.3. X ha distribuzione binomiale XX~BBBBBB(nn, pp) La sua funzione di probabilità è: PP(XX = xx) = nn xx ppxx (1 pp) nn xx = PP(XX = 1) = 6 1 0.31 (1 0.3) 6 1 = nn! xx! (nn xx)! ppxx (1 pp) nn xx 6! 1! (6 1)! 0.31 0.7 5 =

PP(XX = 1) = 6 5 4 3 1 (5 4 3 ) 0.3 0.75 0.3025 b) PP(XX 4) = 1 PP(XX > 4) = 1 [PP(XX = 5) + PP(XX = 6)] Quindi: PP(XX 4) = 1 PP(XX > 4) = 1 (0.01021 + 0.000729) = 0.9890 c) PP(XX = 0) = 6 0 0.30 (1 0.3) 6 0 = 6! 0!(6 0)! 0.30 0.7 6 = 0.1176 d) indichiamo con Y il numero di prove necessarie per ottenere il primo successo. Allora: p = probabilità di successo = 0.3 y = numero di prove YY~GGGGGGGG(pp) k = numero di successi. In tal caso k=1 (la v.c. geometrica è un caso particolare della v.c. Binomiale Negativa) La distribuzione di probabilità di Yè la seguente: PP(YY = yy) = pp kk (1 pp) yy kk ossia PP(YY = yy) = pp(1 pp) yy 1 PP(YY = 6) = 0.3(1 0.3) 6 1 = 0.3 0.7 5 = 0.0504 e) Il numero medio di lanci per ottenere il primo successo è pari al valore atteso di Y EE(YY) = 1 pp = 1 0.3 3 f) Indichiamo con Z il numero di prove necessarie per ottenere i primi k successi (con k>1). Allora: Funzione di probabilità PP(ZZ = zz) = zz 1 kk 1 ppkk (1 pp) zz kk ZZ~BBBB(kk, pp) zz 1 esprime la sequenza di k-1 successi nelle prime z-1 prove. kk 1 In questo caso z=4, k=2 PP(ZZ = 4) = 4 1 2 1 0.32 (1 0.3) 4 2 = 0.1323

g) Il modello probabilistico appropriato è in tal caso il modello di Poisson, infatti la distribuzione di Poisson descrive il numero di successi/eventi in intervalli spaziali/temporali quando gli eventi si verificano indipendentemente l uno dall altro e con uguale probabilità in ogni punto del tempo o dello spazio. Distribuzione di probabilità: PP(XX = xx) = ee λλ λλ xx xx! XX~PPPPPP(λλ) Nel modello di Poisson:, inoltre, risulta che: E(X) = Var(X) = λ λ=1 (un centro in 2 minuti), allora in 60 minuti (un ora) il giocatore A realizzerà 30 centri h) La probabilità che il giocatore A realizzi 3 centri in 5 minuti può essere calcolata come segue: λ=5/2 numero medio di centri in 5 minuti (proporzione rispetto all unità temporale iniziale cioè 2 minuti) 5 5 3 PP(XX = 3) = ee 2 2 = 0.214 3! i) La probabilità di non centrare mai il bersaglio nell arco di 5 minuti è data da: j) PP(XX = 0) = ee 5 2 5 0 2 = 0.082 0!

Esercizio 2. Modelli discreti di probabilità: v.c ipergeometrica Un impresa produce pezzi per componenti hardware di calcolatori elettronici e li predispone in lotti da 10 pezzi che poi incanala alla rete di distribuzione. L addetto al controllo della qualità opera seguendo il seguente criterio: seleziona 3 pezzi casualmente, in blocco, da ogni lotto e dichiara il lotto difettoso - rimuovendolo dalla distribuzione - se tra i tre pezzi prodotti ce n è almeno uno difettoso. 1. Si calcoli la probabilità che il lotto entri comunque in distribuzione se contiene un pezzo difettoso. 2. Si calcoli la probabilità che il lotto entri comunque in distribuzione se contiene due pezzi difettosi 3. Calcolare il numero atteso di pezzi difettosi in ciascun lotto nei due scenari Indichiamo con X= numero di pezzi difettosi presenti nel lotto. Siccome l estrazione è in blocco, viene meno l ipotesi di indipendenza, dunque il modello probabilistico corretto per X è un modello ipergeometrico. n= numero di prove b=numero casi favorevoli H=numero di oggetti La corrispondente distribuzione di probabilità è: PP(XX = xx) = bb xx HH bb nn xx HH nn = bb! xx! (bb xx)! XX~IIII(nn, bb, HH) (HH bb)! (nn xx)! (HH bb nn + xx)! HH! nn! (HH nn)! H=10 pezzi presenti nel lotto b=1 casi favorevoli (se è presente almeno un pezzo difettoso il lotto viene ritirato) n=3 pezzi estratti per il controllo 1. La probabilità che il lotto entri comunque nella distribuzione se b=1 sarà pari a: PP(XX = 0 bb = 1) = 1 0 10 1 3 0 10 3 = 9 3 10 = 0.7 3

2. La probabilità che il lotto entri comunque nella distribuzione se b=2 sarà pari a: PP(XX = 0 bb = 2) = 2 0 10 2 3 0 10 3 = 0.47 3. Numero atteso di pezzi difettosi (presenza di un pezzo difettoso) EE(XX) = nn bb HH = 3 1 10 = 0.3 Numero atteso di pezzi difettosi (presenza di due pezzo difettosi) EE(XX) = nn bb HH = 3 2 10 = 0.6 Esercizio 3. La v.c. Normale La durata delle gomme per auto segue una distribuzione normale di media 70000 km e deviazione standard 8000 km. a) Qual è la proporzione delle gomme che durano meno di 60000 km? b) La pubblicità dichiara che il 90% delle nostre gomme durano più di x km. Qual è il valore di x? a) XX~NN(μμ = 70000, σσ = 8000) In termini standardizzati: PP(XX < 60000) = PP ZZ < 60000 70000 = PP(ZZ < 1.25) = 0.1056 8000 b) Occorre trovare il percentile della distribuzione standardizzata e poi applicare la trasformazione inversa alla standardizzazione, ossia: che equivale a calcolare zz 0.9 : zz 0.9 = PP(ZZ zz 0.10 ) = 0.90 1.28 + 1.29 2 per la proprietà di simmetria: zz 0.1 = 1.285, quindi = 1.285 XX 0.10 = μμ + σσ(zz 0.10 ) = 70000 + 8000( 1.285) = 59760

Esercizio 4. Proprietà della combinazione lineare di v.c. Normali Ogni giorno gli impiegati di un ministero vanno a prendere il caffè al bar vicino. Il tempo impiegato per arrivare al bar e tornare può considerarsi una variabile casuale normale con media 15 min e varianza 11. Il tempo trascorso al bar è anch'esso normale, indipendente dal tempo del tragitto, con media 15 e varianza 25. a) Calcolare la probabilità che un impiegato si assenti per più di 35 minuti. b) Calcolare la probabilità che un impiegato passi più tempo al bar che nel tragitto. c) Per un campione casuale di 5 impiegati calcolare la probabilità che più di 3 si assentino per più di 35 min. Indichiamo con X = tempo impiegato nel tragitto e Y = tempo trascorso al bar per cui: X ~ N(15,11) Y ~ N(15,25) a) Definiamo il tempo di assenza una variabile casuale del tipo A=X+Y. A è quindi una combinazione lineare di variabili casuali normali, indipendenti. Sfruttando la proprietà riproduttiva della Normale [1] ne consegue che: Quindi A ~ N(30,36) AA~NN(μμ xx + μμ yy, σσ xx 2 + σσ yy 2 ) 35 30 PP(AA > 35) = PP ZZ > = PP(ZZ > 0.83) = 1 PP(ZZ 0.83) = 1 0.7967 = 0.203 36 b) In questo caso si vuole conoscere la probabilità dell'evento: Y > X. Questo evento può essere espresso, in modo equivalente, come: Y-X > 0. La variabile B=Y-X è una combinazione lineare di variabili normali, indipendenti. Per la [1], avremo: BB~NN(μμ xx μμ yy, σσ xx 2 + σσ yy 2 ) Quindi B ~ N(0,36). Da ciò segue: PP(BB > 0) = PP ZZ > 0 0 = PP(ZZ > 0) = 1 PP(ZZ 0) = 1 0.5 = 0.5 36 c) Per un campione di n=5 impiegati si vuole determinare la probabilità che più di 3 si assentino per più di 35 minuti. Considerando i risultati ottenuti nel punto a) segue che: pp = 0.203 è la probabilità di assentarsi per più di 35 minuti n = 5

Indichiamo con CC le volte in cui gli impiegati si assentano per più di 35 minuti, CC~BBBBBB(nn = 5, pp = 0.203) PP(CC > 3) = PP(CC = 4) + PP(CC = 5) = 0.0071117 PP(CC = 4) = 5 4 0.2034 (1 0.203) 5 4 = 5! 4! (5 4)! 0.2034 0.797 1 = 0.006767 PP(CC = 5) = 5 5 0.2035 (1 0.203) 5 5 = 5! 5! (0)! 0.2035 = 0.0003447 Esercizio 5. Stima puntuale: la media campionaria Il tempo necessario per completare gli esercizi per casa di statistica segue una distribuzione normale di media 100 minuti e deviazione standard di 20 minuti. a) Calcolare la percentuale di studenti che completeranno tutti gli esercizi entro 2 ore. b) Quanto tempo è necessario affinché il 95% degli studenti completino l esercitazione? Si estrae un campione casuale di 25 studenti iscritti al corso: 1) Calcolare il valore atteso e l errore standard della v.c. tempo medio impiegato del gruppo di studenti estratto. Indicare qual è la distribuzione della v.c. tempo medio per completare gli esercizi. Motivare la risposta. 2) Calcolare la probabilità che il tempo medio impiegato dal gruppo di studenti per completare gli esercizi differisca da 100 minuti dell 11%. a) Indichiamo con X il tempo per completare gli esercizi PP(XX 120) = PP ZZ XX~NN(100, σσ = 20) 120 100 = PP(ZZ 1) = 84.13% 20 b) Il tempo necessario affinché il 95% degli studenti completino gli esercizi corrisponde a: zz 0.95 = 1.64 + 1.65 2 = 1.645 PP(ZZ zz 0.95 ) = 0.95

per cui: xx = 100 + (1.645) 20 = 132.9 1) Il tempo medio impiegato dal gruppo di studenti per completare gli esercizi è identificato dalla v.c. media campionaria: nn XX nn = 1 nn XX ii Essendo nota la distribuzione della popolazione allora anche XX nn sarà distribuita normalmente, in particolare: ii=1 XX nn ~NN μμ, σσ2 nn EE(XX nn ) = μμ = 100 ss. ee(xx nn ) = σσ2 nn = σσ nn = 20 25 = 4 2) La probabilità che il tempo medio impiegato dal gruppo di studenti per completare gli esercizi differisca da 100 minuti dell 11% corrisponde a: Osservazioni: 89 100 111 100 PP(89 < XX nn < 111) = PP ZZ = 20 20 25 25 = PP( 2.75 ZZ 2.75) = 0.994 o o Il 99.4% di tutti i possibili campioni di studenti di ampiezza n = 25 ha una media campionaria (tempo medio per il completamento degli esercizi) compresa tra gli 89 ed i 111 min. Un aumento di n comporta una minore variabilità della media campionaria