STATISTICA I - CORSO DI LAUREA IN STATISTICA a.a. 2004/2005 Prova intermedia del 01 aprile 2005 Esercizio 1 La Tabella 1 contiene alcuni dati relativi a 14 aziende. Tabella 1 Dati (fittizi) su alcune aziende Fatturato Numero di Azienda Settore (migliaia sedi di euro) Livello innovazione tecnologica Numero dipendenti 1 Primario 4 2235 Medio 141 2 Primario 1 545 [missing] 35 3 Primario 2 854 Medio 49 4 Primario 1 976 Basso 64 5 Secondario 3 336 Medio 41 6 Secondario 2 402 Basso 45 7 Secondario 3 1071 Medio 68 8 Secondario 3 1197 [missing] 70 9 Secondario 2 555 Alto 32 10 Secondario 4 1526 Medio 40 11 Secondario 1 534 Basso 39 12 Terziario 3 1008 Basso 62 13 Terziario 3 2438 Medio 137 14 Terziario 2 550 Alto 39 Con riferimento ai dati della Tabella 1: a) scrivere la distribuzione delle frequenze assolute, relative e cumulate relative (ove ammissibile) dei caratteri Settore, Numero di sedi, Fatturato e Livello di innovazione tecnologica. NOTA: per il Fatturato usare classi di ampiezza pari a 500 mila euro; b) calcolare un indice di posizione (il più informativo possibile) per i caratteri Settore, Numero di sedi e Livello di innovazione tecnologica; c) rappresentare la distribuzione di frequenze e la funzione di ripartizione empirica del carattere Numero di sedi; d) disegnare l istogramma e la funzione di ripartizione dedotta dall istogramma del carattere Fatturato; e) calcolare la proporzione di aziende con fatturato compreso tra 600 mila e 1800 mila euro. Relativamente al carattere Numero di dipendenti calcolare: f) campo di variazione; g) scarto interquartile; h) varianza e scarto quadratico medio; i) coefficiente di variazione. Relativamente al carattere Fatturato calcolare: j) primo e terzo quartile, utilizzando la funzione di ripartizione dedotta dall istogramma definita al punto d).
Esercizio 2 Rispondere ai seguenti quesiti, spiegando brevemente le ragioni della risposta: (a) Quale media lascia invariato il prodotto dei valori della successione? (b) Che cos è una media aritmetica ponderata? (c) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la media aritmetica? (d) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la deviazione standard? (e) Se raddoppia ognuno dei dati di una successione, come si modifica la media aritmetica? (f) Se raddoppia ognuno dei dati di una successione, come si modifica la deviazione standard? (g) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la media aritmetica? (h) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la deviazione standard? (i) Se la deviazione standard di un insieme di valori è zero, cosa significa? (j) Se la media quadratica di un insieme di valori è zero, cosa significa? In questo caso, media aritmetica e media geometrica saranno anch esse pari a zero? (k) Se la media aritmetica di un insieme di valori è zero, quanto vale la varianza? (l) Che cosa rappresenta la derivata prima della funzione di ripartizione dedotta dall istogramma? (m) Quali sono le principali differenze tra un esperimento controllato e uno studio sul campo? (n) Quali sono i vantaggi e gli svantaggi della formulazione aperta e chiusa delle domande in un questionario postale? Esercizio 3 Enunciare e dimostrare la proprietà di baricentro e la proprietà dei minimi quadrati della media aritmetica. Perché queste due proprietà sono importanti? Esercizio 4 Un gruppo di persone ha una temperatura corporea media di 98.6 gradi Fahreneheit, con una deviazione standard di 0.3 F. Sapendo che C=(5/9)( F-32 ) calcolare media aritmetica, deviazione standard e varianza in gradi centigradi.
SOLUZIONE Esercizio 1 (soluzione parziale) Settore n f Primario 4 0.29 Secondario 7 0.50 Terziario 3 0.21 14 1.00 Indice: moda='secondario' Numero di sedi n f F 1 3 0.21 0.21 2 4 0.29 0.50 3 5 0.36 0.86 4 2 0.14 1.00 14 1.00 Indice: media aritmetica=2.4 Livello innovazione tecnologica n f F Basso 4 0.33 0.33 Medio 6 0.50 0.83 Alto 2 0.17 1.00 12 1.00 [missing] 2 Totale complessivo 14 Indice: mediana='medio' Fatturato inf sup n f N F amp dens*1000 0 500 2 0.143 2 0.143 500 0.285714 500 1000 6 0.429 8 0.571 500 0.857143 1000 1500 3 0.214 11 0.786 500 0.428571 1500 2000 1 0.071 12 0.857 500 0.142857 2000 2500 2 0.143 14 1.000 500 0.285714 prop(x<600) = 0.143 + (600-500)*0.857143/1000 = 0.229 prop(x<1800) = 0.786 + (1800-1500)*0.142857/1000 = 0.829 prop(x<1800)-prop(x<600) = 0.600 Q1 = 500 + (0.25-0.143)*1000/0.857143 = 625.000 Q3 = 1000 + (0.75-0.571)*1000/0.428571 = 1416.667
Numero dipendenti campo variazione 109 Q1 39 Q3 68 Q3-Q1 29 media 61.571 var 1145.531 sd 33.846 CV 0.550 Esercizio 2 Rispondere ai seguenti quesiti, spiegando brevemente le ragioni della risposta: a) Quale media lascia invariato il prodotto dei valori della successione? Media geometrica. b) Che cos è una media aritmetica ponderata? E una media in cui ad ogni valore viene associato un peso: n n x p / p i i i i= 1 i= 1 c) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la media aritmetica? M(X+a)=a+M(X). d) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la deviazione standard? σ(x+a)= σ(x). e) Se raddoppia ognuno dei dati di una successione, come si modifica la media aritmetica? M(2X)=2M(X). f) Se raddoppia ognuno dei dati di una successione, come si modifica la deviazione standard? σ(2x)=2σ(x) g) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la media aritmetica? M(-1*X)= -1*M(X). h) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la deviazione standard? σ(-1*x)=σ(x) i) Se la deviazione standard di un insieme di valori è zero, cosa significa? La variabile statistica è degenere (tutte le u.s. presentano la stessa modalità del carattere). j) Se la media quadratica di un insieme di valori è zero, cosa significa? La variabile è degenere in 0 (tutte le u.s. presentano la modalità 0). In questo caso, media aritmetica e media geometrica saranno anch esse pari a zero? Sì. k) Se la media aritmetica di un insieme di valori è zero, quanto vale la varianza? V(X)=M(X 2 ). l) Che cosa rappresenta la derivata prima della funzione di ripartizione dedotta dall istogramma? La derivata prima rappresenta la pendenza dei segmenti di retta che uniscono due estremi di classe successivi. m) Quali sono le principali differenze tra un esperimento controllato e uno studio sul campo? In un esperimento le unità statistiche sono assegnate casualmente al trattamento, quindi eventuali differenze nella risposta tra gruppo trattato e gruppo di controllo sono da attribuirsi al trattamento. In uno studio sul campo, in generale, le unità statistiche non sono assegnate a caso al trattamento e altri fattori (detti di disturbo), oltre al trattamento possono influire sulla risposta. n) Quali sono i vantaggi e gli svantaggi della formulazione aperta e chiusa delle domande in un questionario postale? Le domande aperte sono utili nel caso in cui le modalità di risposta non siano note a priori, ma sono più faticose per gli intervistati e più difficili da trattare in fase di analisi dei risultati.
Esercizio 3 Vedi libro di testo. Esercizio 4 Indichiamo con Y la temperatura espressa in C e con X la temperatura in F. Sappiamo che M(X)= 98.6 F e σ(x)= 0.3 F, V(X)=0.3 2 =0.09. Applicando la trasformazione C=(5/9)( F-32 ) da gradi Fahreneheit a gradi centigradi otteniamo: M(Y)= (5/9)(98.6-32)=37, V(Y)= (5/9) 2 (0.09)=0.03, σ(y)= (5/9)(0.3)=0.17.