ESERCIZIO 1. Nella tabella seguente sono riportate alcune variabili relative ad un campione di alberghi della città di Ginevra: ALBERGO STELLE (S) PREZZO (P) VALUTAZIONE (V) 1 3 135 9.0 2 2 150 8.0 3 2 150 5.58 4 4 145 8.85 5 5 253 7.75 6 5 250 9.15 7 5 276 9.56 8 3 168 7.58 9 3 170 6.50 10 2 115 4.70 a) Ricavare la distribuzione delle frequenze percentuali della variabile S e calcolare una misura statistica di posizione della variabile b) Rappresentare graficamente la variabile P in modo da evidenziare l eventuale presenza di valori anomali c) Fornire una limitazione inferiore alla percentuale di prezzi per camera singola che si trovano entro ±1.76 volte lo scarto quadratico medio dalla media d) Si stimi la retta di regressione che serve a prevedere la valutazione attesa di un albergo in base al prezzo della camera. Si fornisca un interpretazione del coefficiente angolare ottenuto.
ESERCIZIO 2. La ditta Stickers produce figurine ed album per la raccolta ed opera nel mercato italiano ed in quello americano. Le caratteristiche degli album attualmente in produzione in Italia sono riassunte nella seguente tabella: ALBUM NUMERO PAGINE TIPO CARTA PREZZO ALBUM 1 30 2 6.0 2 10 2 3.5 3 17 1 4.5 4 15 1 5.0 5 16 1 5.0 6 16 1 5.0 7 14 1 3.0 8 20 2 6.0 9 25 2 7.0 a) Si rappresenti la distribuzione del numero di pagine mediante un diagramma ramo-foglia. Nello stesso grafico si individui il numero mediano di pagine. Quali altre rappresentazioni grafiche si possono utilizzare per questa variabile? b) Si realizzi un grafico che evidenzi l incidenza del tipo di carta utilizzato sul prezzo dell album c) La filiale americana della Stickers vende gli album ad un prezzo medio di otto dollari, con uno scarto quadratico medio di due dollari. In base a queste informazioni la variabilità del prezzo di vendita è maggiore negli USA o in Italia? d) Si confronti la percentuale di album con un prezzo maggiore di 3.5 euro e minore di 6.5 euro con la percentuale ricavabile tramite la disuguaglianza di Chebychev, commentando opportunamente la differenza e) Si calcoli la direzione e l intensità del legame lineare tra le variabili numero di pagine e costo dell album commentando il valore ottenuto.
ESERCIZIO 3. L Ospedale In Salus ha raccolto di dati relativi alle donne che partoriscono nel reparto di ostetricia. Nella seguente tabella sono contenuti i dati relativi ad un campione di donne: DONNA MODALITA PARTO DURATA DEGENZA (GG) COSTO DEGENZA (EURO) 1 Cesareo 5 500 2 Naturale 3 320 3 Cesareo 10 1200 4 Naturale 5 600 5 Cesareo 7 800 6 Naturale 1 200 7 Naturale 1 200 8 Naturale 2 450 9 Cesareo 4 650 a) Riconoscere tipo e scala di misura della variabile modalità parto e proporre un indice di tendenza centrale b) Rappresentare graficamente la variabile durata della degenza c) Per quale modalità di parto si registra il costo medio di degenza giornaliero più elevato? d) Sapendo che r costo,durata = 0.958 e che s costo = 317.76 stimare quanto varia in media il costo della degenza in corrispondenza ad una variazione unitaria nella durata della degenza ESERCIZIO 4. Nell Ospedale In Salus il 25% delle donne straniere ha scelto il parto indolore mentre la percentuale di donne italiane che ha scelto questa soluzione è del 42%. Le donne straniere sono il 20% del totale. Calcolare la probabilità che, estraendo una donna a caso dal registro dell ospedale: a) Questa risulti straniera e abbia scelto il parto indolore b) Questa abbia scelto il parto indolore c) Questa risulti straniera, sapendo che ha scelto il parto indolore
ESERCIZIO 5. In un sondaggio è stato chiesto ad un gruppo di turisti che avevano passato le vacanze in Sardegna se erano intenzionati a tornare nell isola l anno successivo o se intendevano passare un periodo di vacanza in un altra isola del Mar Mediterraneo. Nella seguente tabella sono riassunti i dati relativi alle risposte ottenute Altra isola = SI Altra isola = NO Torna = SI 20 15 Torna = NO 5 30 Torna = NON SO 5 10 a) Calcolare la probabilità che un turista selezionato casualmente non voglia tornare in Sardegna e desideri visitare un altra isola del Mar Mediterraneo b) Calcolare la probabilità che un turista selezionato casualmente voglia tornare in Sardegna oppure voglia visitare un altra isola del Mar Mediterraneo c) Sapendo che un turista non desidera visitare un altra isola del Mar Mediterraneo, calcolare la probabilità che voglia ritornare in Sardegna
ESERCIZIO 6. Un manager vuole stabilire la relazione esistente tra le vendite Y e il prezzo X di un prodotto simile venduto dalla concorrenza. I dati a sua disposizione sono i seguenti: Vendite (Y) 520 550 600 610 620 724 680 300 962 270 Prezzo (X) 13 13 15 15 16 21 21 14 40 12 a) Descrivere la relazione tra vendite e prezzo del prodotto concorrente attraverso un grafico opportuno b) Calcolare una misura opportuna dell intensità del legame lineare tra le vendite e il prezzo del prodotto concorrente c) Calcolare l equazione della retta di regressione delle vendite sul prezzo del prodotto concorrente. E possibile utilizzarla per prevedere le vendite medie in corrispondenza di X=30? (Aiuti: x i =5836 ; y i =180 ; x i y i = 117384 ; x 2 i=3866
ESERCIZIO 7. Un supermercato sta conducendo un indagine sulle abitudini d acquisto dei propri clienti. Allo scopo è stato selezionato un campione casuale di clienti, rilevando i valori delle seguenti variabili: TEMP: tempo impiegato per raggiungere il punto vendita dall abitazione (minuti) SPE: valore della spesa effettuata (euro) FED: possesso carta fedeltà (1=si; 0=no) UNITA FED TEMP SPE TEMP 2 SPE 2 TEMP*SPE 1 0 20 57.50 400 3306.25 1150.00 2 0 5 12.24 25 149.82 61.20 3 1 5 5.00 25 25.00 25.00 4 0 15 18.90 225 357.21 283.50 5 0 15 8.50 225 72.25 127.50 6 1 40 80.00 1600 6400.00 3200.00 7 1 10 35.40 100 1253.16 354.00 8 0 10 24.60 100 605.16 246.00 9 0 10 45.70 100 2088.49 457.00 Totali 3 130 287.84 2800 14257.34 5904.20 a) Rappresentate graficamente la variabile FED b) Quanto impiegano, in media, i clienti per raggiungere il punto vendita? c) Stabilite quale variabile, tra SPE e TEMP, presenta maggiore variabilità d) Misurate, attraverso un indice opportuno, l associazione lineare tra TEMP e SPE
ESERCIZIO 8. Si consideri la seguente distribuzione della superficie (in metri al quadrato) degli appartamenti in Italia Classe di superficie (metri quadri) Numero di appartamenti (milioni) [30-50) 11.16 [50-70) 13.95 [70-100) 2.79 [100-150) 1.86 [150-200) 1.24 Totale 31 a) Si rappresenti la distribuzione della superficie con un opportuna rappresentazione grafica b) Si commenti la forma della distribuzione c) In quale situazione è necessario l uso della densità di frequenza per la costruzione dell istogramma? d) Si calcoli la superficie media e mediana di un appartamento
ESERCIZIO 9. Al decimo giorno il medagliere olimpico per un campione casuale di paesi partecipanti alla XXXI-esima olimpiade si presentava come segue: PAESE NUMERO MEDAGLIE POPOLAZIONE (milioni) Stati Uniti 72 318.9 Cina 40 1357.0 Gran Bretagna 46 64.1 Germania 20 80.6 Giappone 27 127.3 Russia 32 143.5 Australia 22 23.1 Italia 22 59.4 Fiji 1 0.8 Kenia 4 44.3 TOTALE 286 2219.0 a) Riconoscere tipo e scala di misura della variabili Paese b) Rappresentare graficamente la variabile Numero di medaglie totali mediante un diagramma di Pareto. c) Stimare la retta di regressione per le variabili Numero di medaglie totali e Popolazione d) La Svezia ha una popolazione di 9.6 milioni di abitanti. Utilizzando la retta trovata al punto precedente stimare il numero di medaglie vinte dagli atleti svedesi. La stima trovata sarebbe ancora accettabile se il campione non fosse stato estratto dall insieme dei paesi partecipanti bensì dal sottoinsieme dei paesi che hanno vinto almeno una medaglia d oro?
ESERCIZIO 10. La dolci, affermata azienda dolciaria, sta analizzando i dati relativi ad un campione delle proprie pasticcerie, per le quali ha rilevato la quantità di materie prime utilizzate (chili di farina e zucchero, litri di latte) e i consumi di elettricità (in chilowatt) in una data giornata Pasticceria Farina (F) Latte (L) Zucchero Zucchero Elettricità Bianco (B) Grezzo (G) (E) Zona 1 3.7 20.0 10.8 6.4 600 Centrale 2 6.6 18.9 8.9 4.6 575 Centrale 3 6.5 19.7 10.8 6.2 475 SemiCentrale 4 5.5 19.6 12.8 3.8 575 SemiCentrale 5 3.2 19.1 9.5 4.1 575 Centrale 6 4.7 20.2 9.8 6.8 500 Periferica 7 6.1 18.8 11.7 6.3 600 Periferica 8 5.5 18.7 8.4 7.2 500 Periferica 9 4.1 19.3 8.3 3.1 550 Periferica 10 5.1 18.7 10.0 6.0 800 Periferica Totale 51 193 101 54.5 5750 Periferica a) Rappresentare graficamente la distribuzione di frequenze percentuali della variabile Zona b) Sapendo che la deviazione standard campionaria della quantità di farina utilizzata è pari a 1.16 si dica se varia di più il consumo di farina o il consumo di latte nel campione considerato c) Si rappresenti la distribuzione della variabile E mediante boxplot. Si può ritenere anomalo un consumo superiore a 700 kilowatt? d) Sapendo che gli scarti quadratici medi delle variabili B e G sono pari a 1.447 e 1.416 grammi si calcoli il coefficiente di correlazione lineare tra le due variabili e lo si interpreti.