Soluzioni sercizi elementari Capitolo. carattere: itolo di Studio, carattere qualitativo ordinato modalità: Diploma, Licenza media, Laurea, Licenza elementare unità statistiche: Individui. carattere: Fatturato, carattere quantitativo continuo suddiviso in classi modalità: - - - 6 6-9 unità statistiche: Aziende. carattere: Addetti, carattere quantitativo discreto suddiviso in classi modalità: - - - - unità statistiche: Aziende. carattere: Numero cellulari, carattere quantitativo discreto modalità:,, unità statistiche: Famiglie Capitolo. Reddito n j Amp. classe densità - 6 6/6, - / - 6 / 6 - / Copyright McGraw-Hill ducation (Italy) S.r.l.
. Num. addetti n j Amp. classe densità - / - / - 6 /6 - /. densità.. 6 7 9 6 7 9 Addetti. Dato che si tratta di una coppia di caratteri quantitativi osservati sulle stesse unità statistiche, il grafico più opportuno è quello di dispersione. oto statistica Ore di studio Copyright McGraw-Hill ducation (Italy) S.r.l.
. Azienda Quota gradi elecom (/)*69 Wind (/)*67 odafone (/)*6 Altri (/)*6 Capitolo. Reddito n j N j F j - - 7 7-9 9 -, La classe dove cade il secondo decile è la - poiché la frequenza relativa cumulata supera. Utilizzando la formula.7. si può approssimare il secondo decile: Secondo decile, Copyright McGraw-Hill ducation (Italy) S.r.l.
. Reddito n j N j F j Amp. classe densità - 6 6 6/6, - 69 / - 6 9 / 6-6, / La classe modale corrisponde alla classe con più elevata densità, dunque alla classe - La classe mediana corrisponde alla classe -. Applicando la formula.. possiamo trovare la seguente approssimazione della mediana: M e 7, 7 69. Numero dipendenti n j N j F j x j n j 7 6 7 7 6 9 6 6 7 9, otale 7 7 La media è data da x a, 9 La moda è Moda La mediana è M e. Reddito n j N j F j Amp. classe - - - 9 7 -, Copyright McGraw-Hill ducation (Italy) S.r.l.
Q, 6 Q, 7 7 Q, 7. La media è data da x a 6, La moda è Moda 7 6 7 Ci sono due valori mediani, il 6 e il 7 che possiamo riassumere in un unico valore M e 6,.6 Classi di Fatturato Aziende N j F j c j c j n j - - 7 7-6 9 9 6-9, 7 7 otale Un approssimazione della media è data da x a Il primo quartile è all interno della classe -. Un approssimazione del primo quartile è data da Q 6,.7 Numero di Aziende addetti N j F j c j c j n j - - 6 6-9 9 7 -, otale Una approssimazione della media è data da x a La classe mediana corrisponde alla classe -. Applicando la formula.. possiamo trovare la seguente approssimazione della mediana: M e 6 Copyright McGraw-Hill ducation (Italy) S.r.l.
Capitolo. Si ordinano le aziende in ordine crescente rispetto al fatturato: Azienda Fatturato F i A i Q i F i - Q i 9 7 D 7 C 6 7 6 B 7 9 7 A, 7, otale,, Il rapporto di concentrazione è R, Dato che l indice R varia tra e, possiamo concludere che il fatturato è moderatamente concentrato. Qi.9..7.6...........6.7..9 Fi. quidistr. Max Conc. Famiglia Num. Cel. Num. Cel. A B C D otale Nel caso di massima concentrazione l indice R vale, mentre nel caso di equidistribuzione vale. Copyright McGraw-Hill ducation (Italy) S.r.l.
. n i n i n i Y n i Y n i Y n i 6 6 otale 97 7 Si ottengono i seguenti valori: 7 x a, y a 97 ( ), 67 Y ( ) 7 Y 7 C 9,, 7 C Y 67, Dai valori espressi dai coefficienti di variazione si deduce che nel collettivo preso in esame il carattere Y è più variabile del caratteri. Numero di addetti Aziende c i c i n i (c i -media) n i - - 6-7 - otale 6 Utilizzando la tabella si ottengono i seguenti valori: 6 x a 6 C. Si ordinano le provincie in ordine crescente rispetto al numero di abitanti: Provincia Abitanti F i A i Q i F i -Q i Rieti 6. 6..7 iterbo... Frosinone 9.6 97.7. Latina..7. Roma 9 7.., Il rapporto di concentrazione è R 7e quindi possiamo concludere che nel collettivo, considerato gli abitanti sono molto concentrati in particolare a Roma.Il grafico della curva di concentrazione è il seguente: Copyright McGraw-Hill ducation (Italy) S.r.l.
Qi.9..7.6...........6.7..9 Fi.6 Si ordinano le aziende in ordine crescente rispetto alle quote di mercato: Azienda Quota F i A i Q i F i -Q i Altri... Wind... elecom.7 6.6. odafone.. Il rapporto di concentrazione è R 7 e quindi possiamo concludere che nel collettivo, considerato vi è un basso livello di concentrazione. Il grafico della curva di concentrazione è il seguente: Copyright McGraw-Hill ducation (Italy) S.r.l.
.9..7.6...........6.7..9.7 Ore di studio () oto statistica (Y) Y Max 6 7 Johnny 9 Luisa 9 9 6 Stefania 9 Roberto 6 otale 7 99 Si ottiene: 7 x a, y a, ( ), 6, 99 Y, 7,6 Y, 7, 6 C,, C Y, Le ore di studio sono più variabili del voto. ( ) Capitolo 6 6. Nel caso di indipendenza sia i profili riga sia i profili colonna sono uguali fra loro. Pertanto sia le righe, sia le colonne della tabella devono essere proporzionale fra loro. Ad esempio, se è un quarto di anche? deve essere un quarto di, ossia. Copyright McGraw-Hill ducation (Italy) S.r.l.
Y M F A 6 B C 6 7 Si può osservare che, data l indipendenza tra i due caratteri, ogni frequenza interna alla tabella e ni. n. j ottenibile come nij n. 6. Considerando la seguente tabella otteniamo Y Y Y 7 6 9 6 6 9 6 79 x a, 6 y a, 6 ( 6),, 6 Y (, 6),, Y, Y (, 6),, ρ Y 7,, Si ottiene un valore del coefficiente di correlazione lineare pari a 7, quindi i due caratteri sono fortemente correlati positivamente. 6. Considerando la seguente tabella otteniamo Y 6 6 6 6 6 6 6 6 6 6 x a y a n i 6 6 6 xi y jnij, 7 j Y, 7 7 La covarianza è positiva e quindi prevale tra i due caratteri la concordanza. Copyright McGraw-Hill ducation (Italy) S.r.l.
6. Considerando la formula 6.. si ottiene: Y M F totale basso medio alto 6 totale Poiché uno dei due caratteri sconnesso, si può utilizzare l indice Chi-quadrato o il di Cramer che nel caso di indipendenza valgono entrambi. 6. Y 6, Dalla tabella si può notare ogni frequenza relativa congiunta è ottenibile come prodotto tra le corrispondenti frequenze relative rispettivamente di e di Y (ad esempio, 6*). Se ne deduce che tra i due caratteri sussiste indipendenza e quindi la covarianza è nulla. olendo calcolare il valore della covarianza si ha: x a 6 6 y a xi y j fij i j Y, 6 6.6 Filiale Addetti () Fatturato (Y) Y Y A 7 7 9 B 6 6 C D 9 7 otale 9 x a 6 9 a Y, Y 7, 7 ( 6) Y 6 6 ρ Y, 7, 7 siste una forte correlazione positiva tra il fatturato medio e il numero di addetti. y ( ) 667, 6 ( 6) 77 6.7 Copyright McGraw-Hill ducation (Italy) S.r.l.
Fatturato Superf. () (Y) Y Y 9 6 6 7 6 9 9 6 6 9 6 9 x a y a, 6 9 Y,9 Y, Y (, 6),, ρ Y 9 9,, ( ), 6 (, 6), 6 Il valore dell indice di correlazione è positivo e molto vicino a, pertanto il valore 9 indica una situazione di dipendenza lineare quasi perfetta tra i due caratteri. 6. La tabella doppia è quadrata (stesso numero di righe e colonne) e si può osservare che per ogni riga e colonna vi è una sola frequenza diversa da zero. È la situazione di perfetta interdipendenza tra i due caratteri. In questo caso l indice di Cramer assume il suo valore massimo pari a. 6.9 La tabella è rettangolare con un numero di righe maggiore del numero di colonne e quindi è il carattere Sesso che può dipendere perfettamente dal carattere Grado di soddisfazione ma non il contrario. Ciò si verifica se per ogni riga si ha una sola frequenza diversa da zero. enendo conto dei vincoli dati dalle distribuzioni marginali, si ottiene la seguente tabella. /Y M F basso medio alto totale 6 6. Considerando la seguente tabella: Copyright McGraw-Hill ducation (Italy) S.r.l.
Ore di studio oto statistica () (Y) Y Y Max 7 6 7 Johnny 6 9 Luisa 9 9 6 Stefania 9 Roberto 7 6 otale 7 6 99 7 x a, y a 6 ( ), 6, Y ( ), 7,6 Y, 99 Y (, ), ρ Y 7, 6, Il voto di statistica è moderatamente correlato positivamente ma con il numero di ore di studio. Capitolo. Il problema fornisce i seguenti dati: Pr(Occupato Laureato)9 Pr(Occupato Non Laureato)7 Pr(Laureato) e quindi Pr(Non Laureato)- Pr(Laureato) Applicando il teorema di Bayes si ottiene: Pr Laureato Occupato ( ) Pr( Occupato Laureato) Pr( Laureato) Pr( Occupato Laureato) Pr( Laureato) Pr( Occupato Non Laureato) Pr( Non Laureato) 9 6 9 7. Indicando con D e D i risultati dei due dadi, si vuole determinare la seguente probabilità: Pr(DDnum. pari) La somma dei due risultati viene pari se: (Dpari e Dpari) oppure se (Ddispari e Ddispari), dunque: Pr(DDnum. pari)pr(dpari Dpari)Pr(Ddispari Ddispari) poichè D e D sono indipendenti possiamo scrivere Pr(DDnum. pari) Pr(Dpari)Pr(Dpari)Pr(Ddispari)Pr(Ddispari) dunque: Pr ( D D num. pari). 6 6 6 6 Un modo alternativo di risolvere l esercizio è quello di considerare la distribuzione di probabilità della v.c. DD e quindi calcolare: Pr(DDnum.pari) Pr(DD)Pr(DD)Pr(DD6)Pr(DD)Pr(DD)Pr(DD) Copyright McGraw-Hill ducation (Italy) S.r.l.
/6/6/6/6/6/6/6/.. Il problema fornisce i seguenti dati: Pr(ince) Pr(Pareggia) Pr(Perde) Pr(Bandiera ince) Pr(Bandiera Pareggia) Pr(Bandiera Perde) Si vogliono calcolare le seguenti probabilità: Pr(ince Bandiera) Pr(Pareggia Bandiera) Pr(Perde Bandiera) Per far ciò si applica il teorema di Bayes: Pr ( ince Bandiera) Pr( Bandieraince) Pr( ince) Pr( Bandieraince) Pr( ince) Pr( Bandiera Pareggia) Pr( Pareggia) Pr( Bandiera Perde) Pr( Perde) 6 in modo analogo si ottiene, Pr ( Pareggia Bandiera) 7 Pr ( Perde Bandiera),. Se indichiamo con successo l evento che il dado mostri la faccia con il numero 6, si vuole valutare la probabilità che in lanci si osservino 6 successi. La variabile considerata è una variabile casuale Binomiale con parametri: n e πpr(successo)pr(il dado mostra il numero 6)/6.! Pr ( ;n, π 7, ) ( 7, ) ( 7, ) ( 7, ) ( ) ( 7, ) ( ) 6!! La probabilità che in lanci il numero 6 esca volte è pari a 6.. Sappiamo che: Pr( A B) Pr( A) Pr( B) Pr( A B) riscrivere: Pr( A B) Pr( A) Pr( B) Pr( A) Pr( B) da cui ( B) ma poiché A e B sono indipendenti si può ( A B) Pr( A) Pr( A) Pr 6 Pr 7 7 Copyright McGraw-Hill ducation (Italy) S.r.l.
Capitolo 9 9. f(x) f(x) f(x) 9,6,,6 otale,,, ( ), ( ), ( ) 9. \Y - -, ( ) ( Y ) ( Y ) (( ) ( ) ( ) ) (, ) Cov 9. Pr µ 9. ( < ) Pr < Pr( Z < ) Φ( ) Φ( ) 977 ( Y ) \Y - -, ( Y ) ( ) (, ) ( ) 67 9. Si lanciano volte due dadi, quindi il numero di prove è n. L evento successo è "la somma dei due dadi è ", mentre l evento insuccesso è " la somma dei due dadi è diversa da ". La probabilità dell evento successo è data dalla π Pr successo Pr primo dado 6 secondo dado 6 Pr ( ) (( ) ( )) ( primo dado 6) Pr( secondo dado 6) Copyright McGraw-Hill ducation (Italy) S.r.l. 6 6 6
Dunque si tratta di una v.c. Binomiale con parametri n e π/6. 9.6 µ 6 Pr ( < 6 ) Pr < Pr( Z < ) Φ( ) 977 µ Pr < < Pr < < Pr < Z < Φ Φ Φ ( ) ( ) Φ( ) Φ( ) ( ) [ ( )] ( ) ( ) 66 9.7 Si estraggono carte da un mazzo, quindi il numero di prove è n. L evento successo è "la carta estratta è di cuori", mentre l evento insuccesso è " la carta estratta non è di cuori". La probabilità dell evento successo è data dalla π Pr ( successo ) Pr( carta estratta è di cuori) Dunque si tratta di una v.c. Binomiale con parametri n e π/. 9. Pr µ 9 ( < ) Pr < Pr( Z < 9, ) Φ( 9, ) Φ( 9, ) 66 µ Pr 9 9 97 66 66 9 ( < < ) Pr < < Pr( 9, < Z <, 7) Φ(, 7) Φ( 9, ) Capitolo. Indichiamo con,,..., gli incassi settimanali dei supermercati e indichiamo con L l incasso medio settimanale dei supermercati. L incasso medio ha come valore atteso ( ) e varianza ar ( ). Pr n µ ( > ) Pr > Pr( Z > ). indichiamo con,,..., 9 il peso dei 9 individui e con L 9 il peso medio. La media 9 campionaria ha valore atteso ( ) 69 e Dev. Stand ( ) 9 667 Pr Φ 667 6 69 7 69 ( 6 7) Pr µ < < < < Pr(, < Z <, ) 667 (, ) Φ(, ) Φ(, ) ( 96) n Copyright McGraw-Hill ducation (Italy) S.r.l.
Copyright McGraw-Hill ducation (Italy) S.r.l.. indichiamo con,,..., 6 il peso dei 6 pacchi di zucchero e con 6 6 L il peso medio del pacco di pasta nella scatola. La media campionaria ha valore atteso ( ) e ( ) 6 6 Stand Dev,. ( ) ( ) ( ) 9 6 6 6,,,, Z Pr, n Pr Pr Φ > > µ >. Capitolo. Ricordiamo che ( ) ( ) [ ] µ µ e che le variabili e sono indipendenti e identicamente distribuite con media e varianza uguale a quella della popolazione. Allora, ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) µ µ µ µ µ µ ) ( Lo stimatore è uno stimatore corretto della varianza della popolazione: ( ).. ( ) ( ) ( ) ( ) µ µ µ µ quindi è uno stimatore corretto della media della popolazione e la sua distorsione B(). ( ) ( ) ( ) ( ) 9 9 L errore quadratico medio è ( ) ( ) ( ) ( ) ( ) µ B MS L errore quadratico medio dello stimatore media campionaria,, è: ( ) ( ) ( ) ( ) B MS poiché ( ) ( ) MS MS, la media campionaria è uno stimatore più efficiente di.. ( ) ( ) ( ) ( ) µ µ µ µ quindi è uno stimatore corretto della media della popolazione e B().
Copyright McGraw-Hill ducation (Italy) S.r.l. ( ) ( ) ( ) ( ) 6 6 6 6 6 L errore quadratico medio è: ( ) ( ) ( ) ( ) ( ) 6 µ B MS. ( ) ( ) ( ) ( ) µ µ µ a a a ( ) µ se a.. ( ) ( ) ( ) ( ) µ µ µ µ Lo stimatore è corretto..6 ( ) ( ) ( ) ( ) ( ) µ Lo stimatore è corretto. La sua varianza è: ( ) ( ) ( ) ( ) ( ) 6 6 6 6 9 6 6 6 6 9 6 L errore quadratico medio di è: ( ) ( ) ( ) ( ) ( ) 6 µ B MS.7 ( ) ( ) ( ) ( ) µ lo stimatore è corretto. ( ) ( ) ( ) ( ) 6 6 6 9 6 quindi l errore quadratico medio è ( ) ( ) 6 6 MS Capitolo. Dal problema sappiamo che: n, 9, 6 S e 99, α. Sapendo che t per una t- Student con n gradi di libertà è 797, t, e applicando la formula.. si ha:
9, 797 ; 9, 797. [ 9, 76 ; 9, 76] [, 76 ; 9, 76] Dal problema sappiamo che: n, e α 9. Sapendo che z per una Normale standardizzata è z, 96 e applicando la formula.. si ha:, ( ),, 96 ;, 96. [ 6 ; 6] [ 976 ; 66] Dal problema sappiamo che: n, 6, e α 9. Sapendo che z Normale standardizzata è z, 96 e applicando la formula.. si ha:,, 7, 7 6, 96 ; 6, 96. [ 6, 7 ; 6, 7] [ 9, ; 6, 7] Dal problema sappiamo che: n,,, 9 e α 9. Sapendo che z Normale standardizzata è z, 96 e applicando la formula.. si ha:, 99 99, 96, ;,, 96 [, 6 ;, 6, ] [, ; 6, ] per una per una. Dal problema sappiamo che: n, e α 99. Sapendo che z per una Normale standardizzata è z,, 76 e applicando la formula.. si ha:, 76 [ ; 9].6 6 ;, 76 6 [ 9 ; 9] Dal problema sappiamo che: n 6, 7, e α 9. Sapendo che z Normale standardizzata è z, 96 e applicando la formula.. si ha:, 7 96, ; 7 96,,.7 [ 7, 9 ; 7, 9] [ ; 9] Dal problema sappiamo che: n 69, 9, e α 9. Sapendo che z Normale standardizzata è z, 6 e applicando la formula.. si ha:, 9, 6 ; 9, 6 [ 9 6 ; 9 6] [, 67 ; 9, 6] per una per una Copyright McGraw-Hill ducation (Italy) S.r.l.
Capitolo. Dal problema sappiamo che: n, 7,, S e α. Il sistema di ipotesi pone come ipotesi alternativa: µ > 6. Sapendo che t per una t di Student con n gradi di libertà è t,, 69 e applicando la formula.. si ha: 7, 6,, e poichè < t Accetto l' ipotesi nulla. Dal problema sappiamo che: n, 9, e α. Il sistema di ipotesi pone come ipotesi alternativa: µ <. Sapendo che z per una Normale standardizzata è z,, 96 e applicando la formula.. si ha: 9 Z, 7 e poichè Z < z, 77. Rifiuto l' ipotesi nulla Dal problema sappiamo che: n,, S e α. Il sistema di ipotesi pone come ipotesi alternativa: µ >. Sapendo che z per una Normale standardizzata è z, 96 e applicando la formula.. si ha:, Z, 7,, 7 e poichè Z > z Rifiuto l' ipotesi nulla. Dal problema sappiamo che: n,, S e α. Il sistema di ipotesi pone come ipotesi alternativa: µ. Sapendo che t per una t di Student con n 9 gradi di libertà è t, 7 e applicando la formula.. si ha:,, 6 6, e poichè > t Rifiuto l' ipotesi nulla Capitolo 6 6. (NB: i calcoli possono differire a seconda del tipo di arrotondamento) Si consideri la seguente tabella: Fatturato N. addetti Y Y Ŷ (Y - Y) 7 6 6,7,,7, 6 6,7,7 6,7, 6,7,7 7 7 7 7 9 Calcoliamo: Copyright McGraw-Hill ducation (Italy) S.r.l.
7 7 x y 7 ( ) Y 77 7, Y 9 7 ( ) Y ρ Y 6 7, 9 Le stime dei coefficienti di regressione sono date da: ˆ β Y e β ˆ y βˆ x 6, e quindi il modello stimato è: Ŷ βˆ βˆ 6, i i i utilizzando il modello stimato si possono ricavare i valori Ŷ i e calcolare: SQ ( yi ŷi ) 9 e SQ ( yi y) ny i i ottenendo il valore dell indice di determinazione: SQ 9 R Y 6 SQ Si noti che si poteva arrivare direttamente alla stima del coefficiente di regressione e dell indice di determinazione utilizzando il valore del coefficiente di correlazione. Infatti: ˆ Y ρ 6 β ρ Y Y e RY ( ρ Y ) 6 Y 77 Y Commento: Il modello stimato indica che a una variazione unitaria del numero di addetti, il valore atteso del fatturato aumenta di milioni di euro ( mila euro). Il valore dell indice di determinazione indica un moderato livello di adattamento del modello ai dati osservati, giacché solo il 6% della variabilità del fatturato (Y) è spiegata dal modello. Il seguente grafico riporta i valori osservati e la retta di regressione stimata. Fatturato 7 6 6 7 Addetti 6. (i calcoli possono differire a seconda del tipo di arrotondamento): Si consideri la seguente tabella: fatturato Y N. addetti Y Y 6 6 6 9 Copyright McGraw-Hill ducation (Italy) S.r.l.
6 6 6 6 9 97 Calcoliamo: x 6 6 y, ( 6) 9 Y (, 6), 6 97 Y ( 6, 6), Le stime dei coefficienti di regressione sono date da: ˆ, β Y e β ˆ y βˆ x, 6 6, 7 e quindi il modello stimato è: Ŷi βˆ ˆ β i, 7 i Pertanto ad un aumento unitario degli addetti corrisponde un aumento medio del fatturato di milioni. Possiamo stimare il fatturato medio per un azienda con 7 addetti nel seguente modo: Ŷ ˆ ˆ i β β 7, 7 7, ottenendo, milioni di euro. Qui di seguito è riportato il corrispondente grafico di dispersione e la retta di regressione stimata. Fatturato 9 7 6 6 7 Addetti Copyright McGraw-Hill ducation (Italy) S.r.l.
Capitolo 7 7. Dato che il livello di confidenza è fissato a α 9, corrisponde un valore della t-student con n gradi di libertà pari a t α t,. Applicando la formula 7.. si ottiene: [ B tα s( B ) ; B tα s( B )] [ 6, ; 6, ] [ 6 7 ; 6 7] [ 6, ; 6, ] Copyright McGraw-Hill ducation (Italy) S.r.l.