Statistica a.a. 016-17 Autovalutazione 1 CORSO: Diritto per le Imprese e le Istituzioni ATTENZIONE: alle domande aperte è stato dato un possibile esempio di risposta, altre parole possono essere usate per esprimere gli stessi concetti 1) Nel PC della segretaria di uno studio associato di commercialisti è memorizzato un file excel nominato importi fatture emesse gennaio 010 azienda Sig. Rossi e contenente i seguenti dati: Quale variabile statistica è stata rilevata? Importo fatture Quali e quante sono le unità statistiche del collettivo? Le unità statistiche sono le fatture emesse nel mese di gennaio 010 dal Sig. Sig. Rossi, la numerosità del collettivo è pari a 5. Di che natura è il carattere che è stato rilevato? Il carattere è di tipo quantitativo Quale è l insieme delle modalità del carattere? È un sottoinsieme dei numeri reali non negativi. Volendolo chiudere anche a destra diciamo ad esempio [0;100000] euro Per due indici di posizione (sono molti gli indici di posizione che si potrebbero determinare noi scegliamo media e mediana) si indichino: nome: Media aritmetica simbolo: µ X valore: 1016.44 nome: Mediana simbolo: x 0.5 valore: 981.00 Quale formule sono state utilizzate per calcolare il due indici? Simbolo indice: µ X = formula in simboli: E[X] = n 1 formula con i dati del problema specifico: 1300.15 + 750.50 + 981.00 +117.1+ 878.35 E[X] = 5 Simbolo indice: x 0.5 formula in simboli: si è cercata la radice di F X (x) = 0.5 n α =1 x α
formula con i dati del problema specifico: dal grafico della funzione di ripartizione si è notato che non esistono soluzioni che soddisfano l equazione dunque per convenzione si è posta la mediana uguale alla terza modalità distinta perché F X (981.00) = 0.6 > 0.5 e F X (750.50) = 0.4 < 0.5 F X (x) 0.0 0. 0.4 0.6 0.8 1.0 α= 0.5 x3=981.00 600 800 1000 100 1400 importo fatture Considerando la varianza si indichino: nome: VARIANZA simbolo: σ X valore: 39160.9165 Se lo scarto quadratico medio calcolato sulla stessa variabile rilevata sul collettivo delle fatture emesse nel mese di gennaio 009 fosse 10 euro in meno di quella da voi calcolata cosa ne potreste dedurre? domanda aperta a vostro giudizio Quanto vale la funzione di ripartizione della v.s. in oggetto per x=800? simbolo: F X (800) valore: 0. se valesse 0.3 cosa si potrebbe affermare? Una possibile risposta:il 30% delle fatture emesse ha importo minore o uguale a 800 euro, poiché abbiamo invece stabilito che vale 0. possiamo affermare che la percentuale di fatture con importo superiore a 800 euro è 80% e che dunque nella realtà le fatture con importi maggiori di 800 euro sono in numero maggiore. Volendo trasformare in dollari l importo delle fatture, al cambio attuale 1 Euro = 1.3668 Dollaro USA, quali sarebbero: importo medio delle fatture valore 1389.7 scarto quadratico medio importo valore 70.4777
Se X è il nome della variabile statistica degli importi in euro quale trasformata avete utilizzato per ottenere la variabile Y degli importi in dollari? Y = a + bx =1.3668* X dunque una trasformata lineare con a=0 e b=1.3668 Quale formula avete utilizzato per il calcolo di E[Y]= a + be[x] =1.3668E[X] σ Y = V[Y ] = b V[X] = 1.3668 V[X] ) Il report mensile circa l importo delle fatture del mese di gennaio di un azienda meccanica contiene la seguente tabella : 500-700 5 700-900 4 900-1000 Cosa è rappresentato in tabella? Si tratta della rappresentazione tabellare della distribuzione di frequenze assolute con dati raccolti in classi di una variabile statistica Quale variabile statistica è stata rilevata? Importo delle fatture Quali e quante sono le unità statistiche del collettivo? Le unità statistiche sono le fatture emesse dall azienda meccanica nel mese di gennaio, la numerosità del collettivo è pari a 11. Cosa significa il numero 4 posto nella stessa riga della classe 700-900? Sono quattro le unità statistiche per cui la v.s. assume valori nell intervallo ]700;900], sono cioè quattro le fatture che presentano un importo tra i 700 euro (esclusi) e i 900 euro (compresi) Di che natura è il carattere che è stato rilevato? È un carattere di tipo quantinitavo continuo Quale è l insieme delle modalità del carattere? È un sottoinsieme dei numeri reali non negativi. Volendolo chiudere anche a destra diciamo ad esempio [0;100000] euro Per due indici di posizione (sono molti gli indici di posizione che si potrebbero determinare noi scegliamo ancora media e mediana) si indichino: nome:_media aritmetica simbolo: µ X valore: 736.36 nome: mediana simbolo: x 0.5 valore: 748.63 Vi stupireste se gli stessi parametri calcolati sull insieme dei dati individuali fornissero valori differenti? (sì, no perché) no perché nel raccogliere i dati in classi si perde l informazione dell esatto valore che la v.s. assume su ciascuna unità statistica. In altre parole, delle cinque fatture attribuite alla prima classe, per esempio, non conoscendo l esatto importo di ciascuna nel calcolo della media aritmetica abbiamo convenzionalmente attribuito a tutte l importo di 600 euro (che è il valore centrale della prima classe) tentando, in assenza di informazione, di compensare nella somma gli errori di approssimazione per
difetto con quelli di eccesso. Anche per il calcolo della mediana si è adottata una scelta convenzionale. Della reale funzione di ripartizione si conoscono in questo caso di dati raccolti in classi solo i valori da essa assunti in corrispondenza agli estremi di classe, per il calcolo della mediana abbiamo ipotizzato che in ciascuna classe la funzione di ripartizione cresca in modo lineare. In estrema sintesi possiamo rispondere alla domanda no, perché con il raggruppamento in classi si osserva uno scostamento tanto maggiore dal corrispondente indice calcolato sui dati individuali quanto ci si allontana dall ipotesi di equidistribuzione dei dati nelle classi. Considerando la varianza si indichino: nome: VARIANZA simbolo: σ X valore: 183.1405 Potreste affermare che la varianza calcolata a partire dai dati individuali coincide con quella da voi determinata? No Perché? _vedi risposta precedente_ Quale formula è stata utilizzata per calcolare la varianza? k $ k ' formula in simboli: V[X] = E[X ] (E[X]) = n 1 x i n i & n 1 x i n i ) i=1 % i=1 ( Si noti che questa è una proprietà della varianza e non la sua definizione! formula con i dati del problema specifico: V[X] = 600 5+800 4 + 950 11 # % $ 600 5+800 4 + 950 11 Quanto vale la funzione di ripartizione della v.s. in oggetto per x=900? simbolo: F X (900) valore: 9 11 = 0.818 se valesse 0.3 cosa si potrebbe affermare? Una possibile risposta:il 30% delle fatture emesse ha importo minore o uguale a 900 euro, dunque potremmo dedurre che il collettivo considerato sarebbe formato da una maggiore proporzione (o percentuale) di fatture con importi più elevati di 900 euro rispetto a quello di questo esercizio. Potrebbe essere la mediana calcolata sui dati individuali pari a 700? (sì, no perché) non potrebbe essere perché la funzione di ripartizione in corrispondenza di x=700 assume valore minore di 0.5 (ordine del quantile corrispondente alla mediana) infatti F X (700) = 0.455 & ( ' 3) Il grafico seguente rappresenta la funzione di ripartizione della variabile statistica X={n di irregolarità} riscontrate su un collettivo di 100 pratiche emesse dall ufficio paghe e contributi di una grande azienda:
Rappresentare, con il grafico che si ritiene più opportuno, la distribuzione di frequenze assolute della variabile statistica n i 0 0 40 60 80 100 0 1 3 4 5 6 7 X Per la mediana il quantile di ordine 0.85 si indichino: simbolo: x 0.5 valore: 0 simbolo: x 0.85 valore: Quanto vale la funzione di ripartizione della v.s. in oggetto per x=4? simbolo: F X (4) valore: 0.95
cosa ci induce ad affermare? Il 95% delle pratiche emesse presenta almeno 4 irregolarità, dunque il 5% ne ha almeno 4. Per la media aritmetica e lo scarto quadratico medio di questa variabile si indichino: simbolo: µ X valore:0.8 simbolo: σ X valore:1.33 4) Individuato quale dei due grafici riportati in figura può correttamente dirsi istogramma Istogramma Istogramma n i 0 5 15 5 35 45 10 0 30 60 f i w i 0.000 0.015 0.030 0.045 0.060 10 0 30 40 50 60 (a) corretto? (b) corretto? Il grafico (a) è scorretto in quanto l area di ogni rettangolo non è proporzionale alla frequenza assoluta, le classi hanno ampiezza ( w i ) variabile e l altezza in questo caso è ( h i = n i ) dunque ogni rettangolo ha area A i = w i n i non proporzionale alla frequenza assoluta. E corretto il grafico (b) secondo la definizione di istogramma. le aree dei singoli rettangoli sono proporzionali alle frequenze relative infatti l altezza in questo caso è ( h i = f i w i ) dunque ogni rettangolo ha area A i = w i f i = n i proporzionale alla frequenza assoluta con costante di w i n proporzionalità 1 n. Indicare dove presumibilmente sono situati: il quantile di ordine 0.5, la mediana e la media. Si veda il grafico seguente, nel quale sono stati indicati il quantile di
ordine 0.5 e la mediana valutando che l area sottesa alla parte di istogramma alla loro sinistra è (ad occhio) rispettivamente il 5% ed il 50% dell area totale. Mentre l indicazione della media aritmetica è segnata cercando (sempre ad occhi) di valutare il baricentro della distribuzione ( si è immaginato di porre l istogramma su una bilancia e di trovare il punto in ascissa nel quale posizionare l ago perché il grafico stesse in equilibrio). Istogramma f i w i 0.000 0.00 0.040 0.060 x 0.5 x 0.5 µ X 10 0 30 40 50 60 Rappresentare graficamente la Funzione di ripartizione della v.s. in oggetto