Matematica e Statistica: Modulo di Statistica - Prof. Federico Di Palma - Appello del 12 Febbraio

Documenti analoghi
Statistica 1 A.A. 2015/2016

Campionamento casuale da popolazione finita (caso senza reinserimento )

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA

Costo manutenzione (euro)

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2013

Quesito 1. I seguenti dati si riferiscono ai tempi di reazione motori a uno stimolo luminoso, espressi in decimi di secondo, di un gruppo di piloti:

Intervalli di Fiducia

n=400 X= Km; s cor =9000 Km Livello di confidenza (1-α)=0,95 z(0,05)=1,96

Esercitazioni di Statistica

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a

SUCCESSIONI DI FUNZIONI

Stima della media di una variabile X definita su una popolazione finita

Stimatori, stima puntuale e intervalli di confidenza Statistica L-33 prof. Pellegrini

Popolazione e Campione

( 4) ( ) ( ) ( ) ( ) LE DERIVATE ( ) ( ) (3) D ( x ) = 1 derivata di un monomio con a 0 1. GENERALITÀ

Confronto di due misure Campioni indipendenti

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Esercizi di econometria: serie 2

Esercizi di Analisi II

STUDIO DEL LANCIO DI 3 DADI

Quartili. Esempio Q 3 Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Argomenti trattati: Stima puntuale e stimatore Proprietà degli stimatori Stima puntuale della media della

Insiemi numerici. Sono noti l insieme dei numeri naturali: N = {1, 2, 3, }, l insieme dei numeri interi relativi:

Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

LE MISURE DI TENDENZA CENTRALE

Esercitazioni del corso: STATISTICA

Libri T ablet

Esercitazioni del corso: ANALISI MULTIVARIATA

Programma (orientativo) secondo semestre 32 ore - 16 lezioni

Stimatori corretti, stimatori efficaci e disuguaglianza di Cramer Rao

INFERENZA o STATISTICA INFERENTE

Esercitazioni di Statistica Dott.ssa Cristina Mollica

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2005/06

Prof.ssa Paola Vicard

Esame di Statistica A-Di Prof. M. Romanazzi

Intervalli di confidenza

SERIE DI POTENZE Esercizi risolti. Esercizio 1 Determinare il raggio di convergenza e l insieme di convergenza della serie di potenze. x n.

CONCETTI BASE DI STATISTICA

Tutorato di Probabilità 1, foglio I a.a. 2007/2008

Titolo della lezione. Dal campione alla popolazione: stima puntuale e per intervalli

Le successioni: intro

Traccia delle soluzioni degli esercizi del fascicolo 6

Titolo della lezione. Campionamento e Distribuzioni Campionarie

STATISTICA A K (63 ore)

Approfondimento 3.3. Calcolare gli indici di posizione con dati metrici singoli e raggruppati in classi

1. a n = n 1 a 1 = 0, a 2 = 1, a 3 = 2, a 4 = 3,... Questa successione cresce sempre piú al crescere di n e vedremo che {a n } diverge.

Teoria dei Fenomeni Aleatori AA 2012/13

Proprietà asintotiche stimatori OLS e statistiche collegate

Cosa vogliamo imparare?

VERIFICA DI IPOTESI SULLA DIFFERENZA TRA DUE MEDIE. Psicometria 1 - Lezione 12 Lucidi presentati a lezione AA 2000/2001 dott.

Lo studio della relazione lineare tra due variabili

Domande di teoria. Chiorri, C. (2014). Fondamenti di psicometria - Risposte e soluzioni Capitolo 3

La correlazione e la regressione. Antonello Maruotti

Esercizi di Calcolo delle Probabilità e Statistica Matematica

Esercizi su serie numeriche - svolgimenti

1.6 Serie di potenze - Esercizi risolti

Esercitazione parte 1 Medie e medie per dati raggruppati. Esercitazione parte 2 - Medie per dati raggruppati

Serie di Fourier / Esercizi svolti

Tracce di soluzioni di alcuni esercizi di matematica 1 - gruppo 42-57

Radici, potenze, logaritmi in campo complesso.

LA INTERPOLAZIONE Appartamenti venduti nel 2006 da un agenzia immobiliare di Treviso.

ANALISI MATEMATICA 1. Funzioni elementari

Inferenza statistica. Popolazione. Camp. Statistiche campionarie basate sulle osservazioni del campione. Estrazione casuale. Parametro e statistica

Precorso di Matematica. Parte IV : Funzioni e luoghi geometrici

STATISTICA 1 ESERCITAZIONE 4

STATISTICA 1 parte 2/2 STATISTICA INFERENZIALE

Distribuzioni per unità

3.1 Rappresentazione dello stato tensionale nel piano di Mohr: circoli di Mohr.

LEGGE DEI GRANDI NUMERI

Svolgimento degli esercizi del Capitolo 4

Approfondimento 2.1 Scaling degli stimoli mediante il metodo del confronto a coppie

ELEMENTI DI STATISTICA. Giancarlo Zancanella 2015

Lezione 5. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 5. A. Iodice.

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 5 luglio 2012

Lezione 8. Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale

Statistica 1 A.A. 2015/2016

Dispensa di STATISTICA DESCRITTIVA

Probabilità 1, laurea triennale in Matematica II prova scritta sessione estiva a.a. 2008/09

Sottospazi associati a matrici e forma implicita. Sottospazi associati a una matrice Dimensione e basi con riduzione Sottospazi e sistemi. Pag.

Lezione 4. Gruppi di permutazioni

Sviluppi di Taylor. Andrea Corli 1 settembre Notazione o 1. 3 Formula di Taylor 3. 4 Esempi ed applicazioni 5

IPSAA U. Patrizi Città di Castello (PG) Classe 5A Tecnico Agrario. Lezione di martedì 10 novembre 2015 (4 e 5 ora) Disciplina: MATEMATICA

FUNZIONI RADICE. = x dom f Im f grafici. Corso Propedeutico di Matematica. Politecnico di Torino CeTeM. 7 Funzioni Radice RICHIAMI DI TEORIA

Esame di Probabilità e Statistica del 9 luglio 2007 (Corso di Laurea Triennale in Matematica, Università degli Studi di Padova).

16 - Serie Numeriche

Corso di laurea in STATISTICA MATEMATICA E TRATTAMENTO INFORMATICO DEI DATI

Distribuzioni di probabilità

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE (Trasformazioni lineari Indici di covarianza e correlazione)

Statistica inferenziale e mercati azionari

Tavole di Contingenza Connessione

Intervalli di confidenza

(1 2 3) (1 2) Lezione 10. I gruppi diedrali.

Soluzioni. 2 2n+1 3 2n. n=1. 3 2n 9. n=1. Il numero 2 può essere raccolto fuori dal segno di sommatoria: = 2. n=1 = = 8 5.

Def. R si dice raggio di convergenza; nel caso i) R = 0, nel caso ii)

Teoremi limite classici

Transcript:

Matematica e Statistica: Modulo di Statistica - Prof. Federico Di Palma - Appello del 1 Febbraio 014 - Esercizio 1) I ua ricerca si è iteressati a verificare le dimesioi i micrometri di u graulocita eutrofilo. A tale scopo si soo misurati N=000 campioi otteedo la distribuzioe (a classi) il cui istogramma è riportato a lato. Il cadidato a) Determii la tipologia del carattere. b) Forisca ua rappresetazioe tabellare dei dati (mettedo i risalto le frequeze assolute). c) Se possibile, calcoli la mediaa. d) Se possibile, calcoli la variaza. 0.35 0.3 0.5 0. 0.15 0.1 0.05 0 1 3 4 5 7 8 Raggio (micrometri) Esercizio ) U ricercatore vuole verificare se esista u legame fra le ore di soo ed il livello di glicemia al risveglio i u soggetto diabetico. Per far ciò ha sottoposto lo stesso soggetto ad u protocollo sperimetale che prevede il moitoraggio di otti di soo otteedo i segueti dati Notte I II III IV V VI Ore di Soo 5 7 7 8 Glicemia alle 7:30 [mg/dl] 71 75 70 75 8 80 Il cadidato, a) Idichi e forisca ua rappresetazioe grafica adeguata alla serie otteuta. b) Se possibile, idichi e calcoli u opportuo idice di variabilità c) Ipotizzado u legame di tipo lieare, 1. Calcoli l'opportua regressioe. Il legame ipotizzato è attedibile? Motivare umericamete la risposta. 3. Ipotizzi quale sarebbe il valore di glicemia se il soggetto dormisse 4 ore. Esercizio 3) Il cadidato, utilizzado i dati dell'esercizio, stimi putualmete e per itervallo il valore atteso della glicemia al risveglio evideziado le ipotesi ecessarie. Il cadidato proceda al calcolo ache se queste risultassero o verificate. Esercizio 4) Si cosiderio i segueti eveti cosiderati idipedeti: E 1 : si abbia x < 0 dove x è distribuita come ua ormale avete E[X] = e Var[X]=4 E : y = 1 dove y è distribuita come ua biomiale co = e p = 0.5. a) Il cadiato calcoli le segueti Probabilità: P(E 1 ); P(E ); P(E 1 U E ); P(E 1 E ). b) Il cadidato idichi se gli eveti E 1 ed E possoo riteersi icompatibili.

- Appello del 1 Febbraio 014 - Svolgimeto Esercizio 1) a) Determiare la tipologia del carattere. Il carattere è di tipo quatitativo (i quato espresso da umeri) cotiuo (i quato cocettualmete ua lughezza come u raggio può assumere qualsiasi valore) b) Forisca ua rappresetazioe tabellare dei dati (mettedo i risalto le frequeze assolute). Per risovere questo puto, risulta opportuo esplicitare la relazioefra le gradezze riporatate ell'istogramma e le frequeze assolute. I u istogramma le ordiate riportao la desità di frequeza (d i) delle classi metre le ascisse gli estremi delle classi che compogoo la distribuzioe.. Ricordado che d i è defiita come il rapporto fra le frequeze relative (f i) e l'ampiezza della classe cui soo riferite (sup i - if i); e che le frequeze relative so il rapporto fra le frequeze assolute ( i) ed il totale delle osservazioi (N), si ha: d i = i N sup i if i da cui si ottiee che i =N d i sup i if i Pertato i dati richiesti possoo essere ricavati applicado la formula testè ricavata. I risultati soo stati raccolti ella tabella ad etrata semplice (Tabella 1) riportata i calce. c) Se possibile, calcoli la mediaa. La mediaa è il valore che bipartisce le osservazioi ordiate, ovvero, quel valore che bipartisce l'area sottesa dell'istogramma. Cosiderado le frequeze cumulate i Tabella 1, si osserva come la mediaa cada ella quarta classe (i* = 4) cotete i valori fra 40% e 70% delle misurazioi ordiate. Per calcolare la mediaa si deve trovare la parte del rettagolo relativo alla quarta classe che sotteda solo il 10% (50 % - F i*-1) delle misurazioi. Poichè l'atezza del rettagolo è ota ( d i* = 0.3) possiamo facilmete ricavare la base (0.1 / 0.3 = 1/3). Quidi la mediaa si avrà sommado questo valore all'estremo iferiore della classe (if i* = 4.5) ricavado il valore di 4.83. Lo stesso risultato poteva essere otteuto applicado la seguete formula che riassume il procedimeto appea descritto Me = if i* + (0.5 - F i*-1) / d i*= 4.5 + (0.5-0.4)/0.3 = 4.5 + 0.1/0.3 = 4.83 d) Se possibile, si calcoli la variaza. Il carattere i esame (quatitativo cotiuo) ammette tutti gli idici di variabilità visti el corso (rage, variaza e distaza iterquartile e sqm) ache se otteuto co sola rappresetazioi per classi di osservazioi. I questo caso gli idici soo ricavabili abbiado ad ogi classe il valore cetrale della classe ( ). La variaza delle osservazioi è stata calcolata utilizzado i dati ricavati i Tabella 1 ella seguete formula x = i=1 M f i x = i=1 M M f i i=1 f i =4.7 4.8 =4.7 3.04=1. i if i sup i i f i F i * f i c i * f i 1 1.5.5 100 0.050 0.050 0.1000 4 0..5 3.5 3 00 0.100 0.150 0.3000 9 0.9 3 3.5 4.5 4 500 0.50 0.400 1.0000 1 4 4 4.5 5.5 5 00 0.300 0.700 1.5000 5 7.5 5 5.5.5 400 0.00 0.900 1.000 3 7..5 7.5 7 00 0.100 1.000 0.7000 49 4.9 Totali 1 4.8000 4.7000 Tabella 1) aalisi dati Esercizio 1 Esercizio ) a) Idicare e forire ua rappresetazioe grafica adeguata. Per serie bivariate cotiue o discrete cui le frequeze o siao particolarmete alte si usa rappresetare la serie mediate diagrammi a dispersioe. Questi diagrammi soo diagrammi cartesiai i cui le modalità dei caratteri vegoo poste sui due assi ed ogi osservazioe viee rappresetata da u puto. Il grafico otteuto dai dati ella cosega viee riportato i Figura 1 (serie "Dati Reali"). b) Se possibile, idichi e calcoli u opportuo idice di variabilità Per serie bivariate cotiue o discrete l'idice di variabilità migliore è dato dalla matrice variaza/covariaza. Questa matrice si compoe di 3 distiti valori: le variaze dei distiti caratteri e la covariaza della serie bivariata. Si seguito riportiamo i calcoli relativi alle variaze dei i sigoli caratteri:

X: Ore di soo x = 1 N i=1 Y: Glicemia al mattio x= 1 N i=1 x i = 5 7 7 8 =.5 x i x = 5.5.5 7.5 8.5 y = 1 N i=1 =.5 0.5 0.5.5 = 5.5 y= 1 y N i=1 i = 71 75 70 75 8 80 =75.5 y i y = 4.5 0.5 5.5 0.5.5.75 = 113.5 Sfruttado i coti ripostati i Tabella si ottiee la seguete covariaza: xy = 1 N i=1 x i x y i y =.75 0.5.75 0.5 3.5.75 = 19.5 Pertato la matrice variaza/covariaza risulta essere 5.5 19.5 =[ 19.5 ] 113.5 x i y i x i x y i y (y i y)(x i x) Osservazioi Totali 5 7 7 8.5000 71 75 70 75 8 80 75.5000-1.5-0.5-0.5 0.5 0.5 1.5-4.5-0.5-5.5-0.5.5 4.5.75 0.5.75-0.5 3.5.75 19.5000 Tabella ) Dati relativi Esercizio c 1) Ipotizzado u legame di tipo lieare, si calcoli l'opportua regressioe La retta di regressioe ha equazioe y= xy x x y xy x y= 19.5 x 5.5 x 75.5 19.5 5.5.5 y=3.54 x 5.45 c ) Ipotizzado u legame di tipo lieare, si verifichi il legame ipotizzato è attedibile? Motivare umericamete la risposta U buo idicatore della botà del modello di regressioe 84 è dato dall'idice di correlazioe di Pearso R = xy x =0.1 R=0.78 y Poiche l'idice risulta superiore a 0.7 si può asserire che il legame è possibile. Ovviamete il dato deve essere cofermato dalla visualizzazioe del modello. Ifatti il coefficiete di Pearso può ache dare risultati fuorviati. A lato si riportao le presevisioi effettuate dal modello lieare che descrivoo l'adameto dei dati co buoa precisioe. Glicemia mattutia 8 80 78 7 74 7 70 8 4 4.5 5 5.5.5 7 7.5 8 8.5 Ore di soo Dati Reali Modello Figura 1) Rappresetazioe dei dati dell Es

c 3) Ipotizzi quale sarebbe il valore di glicemia se il soggetto dormisse 4 ore. La risposta a questo quesito si ottiee applicado la retta el puto x = 4; si ottiee quidi ua glicemia prevista di 137.55 mg/dl. Si ricorda che il valore risulta poco attedibile poiché il modello viee applicato i ascisse (4) molto lotae da quelle usate per stimarlo (5-8). Esercizio 3) Le teciche di stima viste el corso prevedoo che: la popolazioe sia descrivibile mediate ua variabile casuale, che il campioe abbia ua umerosità tale da far covergere lo stimatore e che le prove siao idipedeti ed ideticamete distribuite (i.i.d.). Nel caso i esame descrivere l'esperimeto mediate la seguete variabile casuale X: glicemia al risveglio i u soggetto dibatico. la gradezza da stimare risulta E[X] il cui stimatore è la media campioaria la quale coverge i legge per campioi avete umerosità superiore a 30 (ipotesi o cofermata). L'ipotesi di prove i.i.d. è molto debole i quato le prove essedo estratte dallo stesso soggetto sarao fortemete correllate. Questa cosiderazioe rissume il fatto che difficilmete aalizzado u solo soggetto è possibile trarre coclusioi su tutta la popolazioe. La stima putuale si ottiee semplicemete dall'applicazioe dello stimatore, pertato ricordao quato calcolato ell'esercizio precedete E[ X]= x= 1 x i=1 i =75.5 Per effettuare ua stima per itervallo si deve come prima cosa fissare u livello di cofideza, el ostro caso 95% (α=0.05). Defiita la tipologia di stima (stima per itervallo al 95%), si ha che essa è data dalla seguete E[ X] [ 0.975 x z Var[X ] ; x z 0.975 Var[ X ] ] Dove il valore della ormale si ricava dalle tavole: z 0.975 =1.9 La variaza della popolazioe o è ota pertato essa viee stimata utilizzado la variaza campioaria. Ricordado i calcoli effettuati i precedeza si ha che: Ifie si ottiee la stima richiesta: Var[ X]=s = 1 = 113.5 5 = 113.5 5 =.7 E[ X] [ 75.5 1.9.7 ;75.5 1.9.7 ] =[75.5 3.8;75.5 3.8]=[71.7 ;79.3] Esercizio 4) a) Il cadiato calcoli le segueti Probabilità: P(E 1 ); P(E ); P(E 1 U E ) P(E 1 E ). L'eveto E 1 è dato dalla probabilità di estrarre u umero egativo da ua ormale co valore atteso due e variaza quattro. Per defiire tale probabilità ci si deve riportare alla ormale stadardizzatata, stadardizzado il valore x = 0 z 0 = x 0 E[ X] Var[X] =0 4 = 1 Ricordado che le tavole assegate riportao gli itegrali della ormale fra 0 ed u umero positivo si ha che P E 1 =P X 0 =P z 1 =0.5 P 0 z 1 =0.5 0.3413=0.1587 L'eveto E è dato dalla probabilità di avere u esito uitario egativo i ua prova di Biomiale co = e p =0.5. La prova biomiale è data dalla somma di prove di Beroulli i.i.d. dove la geerica prova b i può avere esito pari a 1 o 0.

y= i=1 b i =b 1 b Nel caso i esame l'uico modo di ottere y = 1 è co le che si verifichi uo dei due casi E ' : b 1 =0 b =1 E ' ' : b 1 =1 b =0 che fra loro soo icompatbili. Pertato P E =P E ' E ' ' =P E ' P E ' ' Essedo gli eveti legati alle varibili b idipedeti la probabilità dell'eveto itersezioe è data dal prodotto delle probabilità, pertato risulta facile calcolare la probabilità richiesta: P E =P E ' E ' ' =P E ' P E ' ' =P b 1 =0 P b =1 P b 1 =1 P b =0 =0.5 0.5 0.5 0.5=0.5 La stessa coclusioe poteva essere raggiuta più agevolmete ricordado che da distribuzioe di probabilità di ua biomiale è data dalla seguete: P y=k =! k! k! p k 1 p k Da cui k p k 1 p k = P E =P y=1 = 1 0.51 1 0.5 1 = 1 1 1 0.51 1 0.5 1 =0.5 Essedo gli eveti idipedeti la probabilità dell'eveto itersezioe è data dal prodotto delle probabilità P E 1 E =P E 1 P E =0.5 0.7=0.35 Le restati probabilità possoo essere ricavate utilizzado la defiizioe assiomatica P E 1 E =P E 1 P E P E 1 E =0.5 0.7 0.35=0.85 P E 1 E =P E 1 E P E = 0.35 0.7 =0.5=P E 1 b) Il cadiato idichi se i due eveti E 1 ed E soo icompatibili. Due eveti soo icompatibili se o possoo verificarsi cotemporaeamete e cosegue che la probabilità dell'eveto itersezioe è ulla. Nel caso i esame questa probabilità è o ulla, quidi è possibile affermare che gli eveti o soo icompatibili.