Matematica e Statistica: Modulo di Statistica - Prof. Federico Di Palma - Appello del 1 Febbraio 014 - Esercizio 1) I ua ricerca si è iteressati a verificare le dimesioi i micrometri di u graulocita eutrofilo. A tale scopo si soo misurati N=000 campioi otteedo la distribuzioe (a classi) il cui istogramma è riportato a lato. Il cadidato a) Determii la tipologia del carattere. b) Forisca ua rappresetazioe tabellare dei dati (mettedo i risalto le frequeze assolute). c) Se possibile, calcoli la mediaa. d) Se possibile, calcoli la variaza. 0.35 0.3 0.5 0. 0.15 0.1 0.05 0 1 3 4 5 7 8 Raggio (micrometri) Esercizio ) U ricercatore vuole verificare se esista u legame fra le ore di soo ed il livello di glicemia al risveglio i u soggetto diabetico. Per far ciò ha sottoposto lo stesso soggetto ad u protocollo sperimetale che prevede il moitoraggio di otti di soo otteedo i segueti dati Notte I II III IV V VI Ore di Soo 5 7 7 8 Glicemia alle 7:30 [mg/dl] 71 75 70 75 8 80 Il cadidato, a) Idichi e forisca ua rappresetazioe grafica adeguata alla serie otteuta. b) Se possibile, idichi e calcoli u opportuo idice di variabilità c) Ipotizzado u legame di tipo lieare, 1. Calcoli l'opportua regressioe. Il legame ipotizzato è attedibile? Motivare umericamete la risposta. 3. Ipotizzi quale sarebbe il valore di glicemia se il soggetto dormisse 4 ore. Esercizio 3) Il cadidato, utilizzado i dati dell'esercizio, stimi putualmete e per itervallo il valore atteso della glicemia al risveglio evideziado le ipotesi ecessarie. Il cadidato proceda al calcolo ache se queste risultassero o verificate. Esercizio 4) Si cosiderio i segueti eveti cosiderati idipedeti: E 1 : si abbia x < 0 dove x è distribuita come ua ormale avete E[X] = e Var[X]=4 E : y = 1 dove y è distribuita come ua biomiale co = e p = 0.5. a) Il cadiato calcoli le segueti Probabilità: P(E 1 ); P(E ); P(E 1 U E ); P(E 1 E ). b) Il cadidato idichi se gli eveti E 1 ed E possoo riteersi icompatibili.
- Appello del 1 Febbraio 014 - Svolgimeto Esercizio 1) a) Determiare la tipologia del carattere. Il carattere è di tipo quatitativo (i quato espresso da umeri) cotiuo (i quato cocettualmete ua lughezza come u raggio può assumere qualsiasi valore) b) Forisca ua rappresetazioe tabellare dei dati (mettedo i risalto le frequeze assolute). Per risovere questo puto, risulta opportuo esplicitare la relazioefra le gradezze riporatate ell'istogramma e le frequeze assolute. I u istogramma le ordiate riportao la desità di frequeza (d i) delle classi metre le ascisse gli estremi delle classi che compogoo la distribuzioe.. Ricordado che d i è defiita come il rapporto fra le frequeze relative (f i) e l'ampiezza della classe cui soo riferite (sup i - if i); e che le frequeze relative so il rapporto fra le frequeze assolute ( i) ed il totale delle osservazioi (N), si ha: d i = i N sup i if i da cui si ottiee che i =N d i sup i if i Pertato i dati richiesti possoo essere ricavati applicado la formula testè ricavata. I risultati soo stati raccolti ella tabella ad etrata semplice (Tabella 1) riportata i calce. c) Se possibile, calcoli la mediaa. La mediaa è il valore che bipartisce le osservazioi ordiate, ovvero, quel valore che bipartisce l'area sottesa dell'istogramma. Cosiderado le frequeze cumulate i Tabella 1, si osserva come la mediaa cada ella quarta classe (i* = 4) cotete i valori fra 40% e 70% delle misurazioi ordiate. Per calcolare la mediaa si deve trovare la parte del rettagolo relativo alla quarta classe che sotteda solo il 10% (50 % - F i*-1) delle misurazioi. Poichè l'atezza del rettagolo è ota ( d i* = 0.3) possiamo facilmete ricavare la base (0.1 / 0.3 = 1/3). Quidi la mediaa si avrà sommado questo valore all'estremo iferiore della classe (if i* = 4.5) ricavado il valore di 4.83. Lo stesso risultato poteva essere otteuto applicado la seguete formula che riassume il procedimeto appea descritto Me = if i* + (0.5 - F i*-1) / d i*= 4.5 + (0.5-0.4)/0.3 = 4.5 + 0.1/0.3 = 4.83 d) Se possibile, si calcoli la variaza. Il carattere i esame (quatitativo cotiuo) ammette tutti gli idici di variabilità visti el corso (rage, variaza e distaza iterquartile e sqm) ache se otteuto co sola rappresetazioi per classi di osservazioi. I questo caso gli idici soo ricavabili abbiado ad ogi classe il valore cetrale della classe ( ). La variaza delle osservazioi è stata calcolata utilizzado i dati ricavati i Tabella 1 ella seguete formula x = i=1 M f i x = i=1 M M f i i=1 f i =4.7 4.8 =4.7 3.04=1. i if i sup i i f i F i * f i c i * f i 1 1.5.5 100 0.050 0.050 0.1000 4 0..5 3.5 3 00 0.100 0.150 0.3000 9 0.9 3 3.5 4.5 4 500 0.50 0.400 1.0000 1 4 4 4.5 5.5 5 00 0.300 0.700 1.5000 5 7.5 5 5.5.5 400 0.00 0.900 1.000 3 7..5 7.5 7 00 0.100 1.000 0.7000 49 4.9 Totali 1 4.8000 4.7000 Tabella 1) aalisi dati Esercizio 1 Esercizio ) a) Idicare e forire ua rappresetazioe grafica adeguata. Per serie bivariate cotiue o discrete cui le frequeze o siao particolarmete alte si usa rappresetare la serie mediate diagrammi a dispersioe. Questi diagrammi soo diagrammi cartesiai i cui le modalità dei caratteri vegoo poste sui due assi ed ogi osservazioe viee rappresetata da u puto. Il grafico otteuto dai dati ella cosega viee riportato i Figura 1 (serie "Dati Reali"). b) Se possibile, idichi e calcoli u opportuo idice di variabilità Per serie bivariate cotiue o discrete l'idice di variabilità migliore è dato dalla matrice variaza/covariaza. Questa matrice si compoe di 3 distiti valori: le variaze dei distiti caratteri e la covariaza della serie bivariata. Si seguito riportiamo i calcoli relativi alle variaze dei i sigoli caratteri:
X: Ore di soo x = 1 N i=1 Y: Glicemia al mattio x= 1 N i=1 x i = 5 7 7 8 =.5 x i x = 5.5.5 7.5 8.5 y = 1 N i=1 =.5 0.5 0.5.5 = 5.5 y= 1 y N i=1 i = 71 75 70 75 8 80 =75.5 y i y = 4.5 0.5 5.5 0.5.5.75 = 113.5 Sfruttado i coti ripostati i Tabella si ottiee la seguete covariaza: xy = 1 N i=1 x i x y i y =.75 0.5.75 0.5 3.5.75 = 19.5 Pertato la matrice variaza/covariaza risulta essere 5.5 19.5 =[ 19.5 ] 113.5 x i y i x i x y i y (y i y)(x i x) Osservazioi Totali 5 7 7 8.5000 71 75 70 75 8 80 75.5000-1.5-0.5-0.5 0.5 0.5 1.5-4.5-0.5-5.5-0.5.5 4.5.75 0.5.75-0.5 3.5.75 19.5000 Tabella ) Dati relativi Esercizio c 1) Ipotizzado u legame di tipo lieare, si calcoli l'opportua regressioe La retta di regressioe ha equazioe y= xy x x y xy x y= 19.5 x 5.5 x 75.5 19.5 5.5.5 y=3.54 x 5.45 c ) Ipotizzado u legame di tipo lieare, si verifichi il legame ipotizzato è attedibile? Motivare umericamete la risposta U buo idicatore della botà del modello di regressioe 84 è dato dall'idice di correlazioe di Pearso R = xy x =0.1 R=0.78 y Poiche l'idice risulta superiore a 0.7 si può asserire che il legame è possibile. Ovviamete il dato deve essere cofermato dalla visualizzazioe del modello. Ifatti il coefficiete di Pearso può ache dare risultati fuorviati. A lato si riportao le presevisioi effettuate dal modello lieare che descrivoo l'adameto dei dati co buoa precisioe. Glicemia mattutia 8 80 78 7 74 7 70 8 4 4.5 5 5.5.5 7 7.5 8 8.5 Ore di soo Dati Reali Modello Figura 1) Rappresetazioe dei dati dell Es
c 3) Ipotizzi quale sarebbe il valore di glicemia se il soggetto dormisse 4 ore. La risposta a questo quesito si ottiee applicado la retta el puto x = 4; si ottiee quidi ua glicemia prevista di 137.55 mg/dl. Si ricorda che il valore risulta poco attedibile poiché il modello viee applicato i ascisse (4) molto lotae da quelle usate per stimarlo (5-8). Esercizio 3) Le teciche di stima viste el corso prevedoo che: la popolazioe sia descrivibile mediate ua variabile casuale, che il campioe abbia ua umerosità tale da far covergere lo stimatore e che le prove siao idipedeti ed ideticamete distribuite (i.i.d.). Nel caso i esame descrivere l'esperimeto mediate la seguete variabile casuale X: glicemia al risveglio i u soggetto dibatico. la gradezza da stimare risulta E[X] il cui stimatore è la media campioaria la quale coverge i legge per campioi avete umerosità superiore a 30 (ipotesi o cofermata). L'ipotesi di prove i.i.d. è molto debole i quato le prove essedo estratte dallo stesso soggetto sarao fortemete correllate. Questa cosiderazioe rissume il fatto che difficilmete aalizzado u solo soggetto è possibile trarre coclusioi su tutta la popolazioe. La stima putuale si ottiee semplicemete dall'applicazioe dello stimatore, pertato ricordao quato calcolato ell'esercizio precedete E[ X]= x= 1 x i=1 i =75.5 Per effettuare ua stima per itervallo si deve come prima cosa fissare u livello di cofideza, el ostro caso 95% (α=0.05). Defiita la tipologia di stima (stima per itervallo al 95%), si ha che essa è data dalla seguete E[ X] [ 0.975 x z Var[X ] ; x z 0.975 Var[ X ] ] Dove il valore della ormale si ricava dalle tavole: z 0.975 =1.9 La variaza della popolazioe o è ota pertato essa viee stimata utilizzado la variaza campioaria. Ricordado i calcoli effettuati i precedeza si ha che: Ifie si ottiee la stima richiesta: Var[ X]=s = 1 = 113.5 5 = 113.5 5 =.7 E[ X] [ 75.5 1.9.7 ;75.5 1.9.7 ] =[75.5 3.8;75.5 3.8]=[71.7 ;79.3] Esercizio 4) a) Il cadiato calcoli le segueti Probabilità: P(E 1 ); P(E ); P(E 1 U E ) P(E 1 E ). L'eveto E 1 è dato dalla probabilità di estrarre u umero egativo da ua ormale co valore atteso due e variaza quattro. Per defiire tale probabilità ci si deve riportare alla ormale stadardizzatata, stadardizzado il valore x = 0 z 0 = x 0 E[ X] Var[X] =0 4 = 1 Ricordado che le tavole assegate riportao gli itegrali della ormale fra 0 ed u umero positivo si ha che P E 1 =P X 0 =P z 1 =0.5 P 0 z 1 =0.5 0.3413=0.1587 L'eveto E è dato dalla probabilità di avere u esito uitario egativo i ua prova di Biomiale co = e p =0.5. La prova biomiale è data dalla somma di prove di Beroulli i.i.d. dove la geerica prova b i può avere esito pari a 1 o 0.
y= i=1 b i =b 1 b Nel caso i esame l'uico modo di ottere y = 1 è co le che si verifichi uo dei due casi E ' : b 1 =0 b =1 E ' ' : b 1 =1 b =0 che fra loro soo icompatbili. Pertato P E =P E ' E ' ' =P E ' P E ' ' Essedo gli eveti legati alle varibili b idipedeti la probabilità dell'eveto itersezioe è data dal prodotto delle probabilità, pertato risulta facile calcolare la probabilità richiesta: P E =P E ' E ' ' =P E ' P E ' ' =P b 1 =0 P b =1 P b 1 =1 P b =0 =0.5 0.5 0.5 0.5=0.5 La stessa coclusioe poteva essere raggiuta più agevolmete ricordado che da distribuzioe di probabilità di ua biomiale è data dalla seguete: P y=k =! k! k! p k 1 p k Da cui k p k 1 p k = P E =P y=1 = 1 0.51 1 0.5 1 = 1 1 1 0.51 1 0.5 1 =0.5 Essedo gli eveti idipedeti la probabilità dell'eveto itersezioe è data dal prodotto delle probabilità P E 1 E =P E 1 P E =0.5 0.7=0.35 Le restati probabilità possoo essere ricavate utilizzado la defiizioe assiomatica P E 1 E =P E 1 P E P E 1 E =0.5 0.7 0.35=0.85 P E 1 E =P E 1 E P E = 0.35 0.7 =0.5=P E 1 b) Il cadiato idichi se i due eveti E 1 ed E soo icompatibili. Due eveti soo icompatibili se o possoo verificarsi cotemporaeamete e cosegue che la probabilità dell'eveto itersezioe è ulla. Nel caso i esame questa probabilità è o ulla, quidi è possibile affermare che gli eveti o soo icompatibili.