Esame di Statistica del 9 gennaio 2008 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola



Documenti analoghi
Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Inferenza statistica. Statistica medica 1

Metodi Matematici e Informatici per la Biologia Maggio 2010

Istituzioni di Statistica e Statistica Economica

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

E naturale chiedersi alcune cose sulla media campionaria x n

1. la probabilità che siano tutte state uccise con pistole; 2. la probabilità che nessuna sia stata uccisa con pistole;

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Statistica. Lezione 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Lezione n. 2 (a cura di Chiara Rossi)

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercizi sulle variabili aleatorie Corso di Probabilità e Inferenza Statistica, anno , Prof. Mortera

Metodi statistici per le ricerche di mercato

Statistiche campionarie

Esercitazione n.2 Inferenza su medie

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

ELEMENTI DI STATISTICA


T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente:

STATISTICA (I MODULO INFERENZA STATISTICA) Esercitazione I 27/4/2007

LEZIONE n. 5 (a cura di Antonio Di Marco)

8 Elementi di Statistica

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Un modello matematico di investimento ottimale

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Test statistici di verifica di ipotesi

Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007

Perché il logaritmo è così importante?

Matematica e statistica 10 febbraio 2012

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

ESAME DI STATISTICA Nome: Cognome: Matricola:

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

STATISTICA INFERENZIALE

Introduzione al MATLAB c Parte 2

Esercizi di Calcolo delle Probabilità con Elementi di Statistica Matematica

Temi di Esame a.a Statistica - CLEF

Esercitazione n.4 Inferenza su varianza

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 7

TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST

1 Serie di Taylor di una funzione

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

RELAZIONE SUL TEST GENERALE D ACCESSO AL CORSO DI LAUREA IN LINGUE E CULTURE STRANIERE

Analisi di dati di frequenza

MINIMI QUADRATI. REGRESSIONE LINEARE

SPC e distribuzione normale con Access

Relazioni tra variabili

Statistical Process Control

Matematica generale CTF

Capitolo 12 La regressione lineare semplice

Esercitazioni di Calcolo Numerico 23-30/03/2009, Laboratorio 2

VERIFICA DELLE IPOTESI

Errori di una misura e sua rappresentazione

3. Confronto tra medie di due campioni indipendenti o appaiati

Tesina di Identificazione dei Modelli e Analisi dei Dati

Si considerino gli eventi A = nessuno studente ha superato l esame e B = nessuno studente maschio ha superato l esame. Allora A c B è uguale a:

Metodologia epidemiologica

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

STATISTICA IX lezione

MATEMATICA E STATISTICA CORSO A SCIENZE BIOLOGICHE MOLECOLARI ESERCIZI PER LA PRIMA PROVA IN ITINERE DI RECUPERO

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

Il modello media-varianza con N titoli rischiosi. Una derivazione formale. Enrico Saltari

REGOLE PER L ESAME (agg.te settembre 2015)

Lineamenti di econometria 2

Principi generali. Vercelli 9-10 dicembre G. Bartolozzi - Firenze. Il Pediatra di famiglia e gli esami di laboratorio ASL Vercelli

l insieme Y è detto codominio (è l insieme di tutti i valori che la funzione può assumere)

L espressione torna invece sempre vera (quindi la soluzione originale) se cambiamo contemporaneamente il verso: 1 < 0.

Kangourou della Matematica 2014 finale nazionale italiana Mirabilandia, 12 maggio 2014

Rapporto dal Questionari Insegnanti

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

5. La teoria astratta della misura.

a) Quanti soggetti obesi dovrebbero complessivamente esserci in questa popolazione;

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

DATABASE. nozioni di base

Pertanto la formula per una prima approssimazione del tasso di rendimento a scadenza fornisce

LA CORRELAZIONE LINEARE

Indici di dispersione

Calcolo del Valore Attuale Netto (VAN)

Seconda Parte Specifica di scuola - Statistica sanitaria e Biometria - 31/07/2015

Corso di Laurea in Matematica Prova di orientamento. Questionario 3

(liberamente interpretato da SCHEDA ALUNNI. Descrizione dell attività:

Sui concetti di definizione, teorema e dimostrazione in didattica della matematica

L analisi dei dati. Capitolo Il foglio elettronico

Servizi di consulenza specialistica per IGRUE

15 febbraio Soluzione esame di geometria - 12 crediti Ingegneria gestionale - a.a COGNOME... NOME... N. MATRICOLA...

Elementi di Psicometria con Laboratorio di SPSS 1

Capitolo 11 Test chi-quadro

Esercitazioni del corso di Statistica Prof. Mortera a.a. 2010/2011. Esercizi di stima puntuale, intervalli di confidenza e test T 2 = 1 2 X

Carta del rischio di Tumore al polmone

QUANTIZZAZIONE diverse fasi del processo di conversione da analogico a digitale quantizzazione

Edited by Foxit PDF Editor Copyright (c) by Foxit Software Company, 2004 For Evaluation Only.

Transcript:

Esame di Statistica del 9 gennaio 2008 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano SOLO i fogli di questo fascicolo.

Esercizio. Supponi che vi sia un test per diagnosticare un certo tipo di tumore con affidabilità che è pari al 95% sia per le persone malate, sia per quelle sane, e supponiamo che lo 0.4% della popolazione soffra di questa forma di tumore. Calcolare la probabilità:. di risultare positivi al test; 2. di essere veramente malati se si è risultati positivi al test. 3. Supponiamo ora che questo test venga migliorato e che la probabilità di risultare negativi al test se si è sani aumenti al 99%. Rispondere di nuovo alle prime 2 domande. Esercizio 2. Vogliamo verificare se due campioni di soluzioni possono provenire dalla stessa sorgente. Vengono quindi fatte 0 misurazioni di ph per campione.. Supponendo che la deviazione standard sia uguale a 0.03 per entrambe le soluzioni e di voler effettuare un test di livello 5%, se il loro ph differisce per più di 0.05 vorremmo evidenziarlo con il 95% di probabilità. Quante misurazioni sono necessarie perchè succeda questo? 2. Vengono comunque fatte 0 misurazioni per campione, con i seguenti risultati: X = 6.267, Ȳ = 6.285, s X = 0.0295, s Y = 0.0327 Si può affermare che le due soluzioni provengono da sorgenti diverse? Riportare limitazioni al valore P. 3. Calcolare l intervallo di confidenza al 95% dei ph di entrambe le soluzioni. Esercizio 3. La tabella seguente riporta la mortalità infantile in funzione del peso del neonato alla nascita, per 72730 nati vivi a New York nel 974. vivi dopo un anno deceduti entro un anno Neonati fino a 2.5 kg 4597 68 Neonati oltre i 2.5 kg 67093 422 Vogliamo studiare la dipendenza tra mortalità e peso alla nascita.. Calcolare l intervallo di confidenza al 99% dei tassi di mortalità dei due gruppi di peso. 2. Calcolare l intervallo di confidenza al 99% della differenza tra i tassi di mortalità dei due gruppi di peso. 3. Eseguire un test per stabilire se i due gruppi di peso possono avere lo stesso tasso di mortalità, riportando limitazioni al valore P. 4. Confrontare il risultato del punto 3. con i risultati dei primi 2 punti. Esercizio 4. È stato dimostrato che la probabilità che un quarantenne che abbia fumato per 0 anni si ammali di tumore ai polmoni entro i 20 anni successivi è una funzione del numero giornaliero di sigarette. Un modello approssimato consiste nel supporre che questa funzione sia lineare. Supponiamo che uno studio estensivo (fatto sui topi ed estrapolato agli esseri umani) dia i seguenti risultati: n. giornaliero sigarette 5 0 20 30 40 50 60 80 probabilità di ammalarsi 0.06 0.3 0.92 0.259 0.339 0.40 0.46 0.55. Calcolare la retta di regressione che lega la probabilità di contrarre un tumore con il numero giornaliero di sigarette. 2. Eseguire un test per verificare se ci può essere una relazione lineare; riportare limitazioni al valore P. 3. Stimare la probabilità di contrarre il tumore per una persona che consumi 35 sigarette al giorno.

Soluzioni Esercizio. Definiamo gli eventi M := { essere malati }, P := { risultare positivi al test }, allora abbiamo che P(M) = 0.004, P(P M) = 0.95, P(P c M c ) = 0.95. Poichè Ω è unione disgiunta degli eventi M ed M c e questi sono tutti non trascurabili, possiamo applicare la formula della probabilità totale: P(P ) = P(P M)P(M) + P(P M c )P(M c ) = 0.95 0.004 + 0.05 0.996 = 268 5000 = 0.0536 2. Dato che sia M che P sono non trascurabili, possiamo usare la formula di Bayes: P(M P ) = P(P M)P(M) P(P ) = 0.95 0.004 0.536 = 9 268 = 0.0709 3. Con il nuovo test si ha che P(P c M c ) = 0.99, mentre le altre probabilità rimangono immutate. Si ha quindi che e P(P ) = P(P M)P(M) + P(P M c )P(M c ) = 0.95 0.004 + 0.0 0.996 = 344 25000 = 0.0376 P(M P ) = P(P M)P(M) P(P ) = 0.95 0.004 0.0376 = 95 344 = 0.2766 Esercizio 2.. Se vogliamo un livello α = 0.05 e una potenza di β = 0.95 e σ = 0.03, δ = 0.05, allora bisognerà effettuare ( σ ) ( ) 2 2 0.03 n n = 2 (q α/2 + q β ) 2 = 2 (.96 +.64) 2 = 9.33 δ 0.05 e quindi saranno necessarie almeno 0 misurazioni. 2. Bisogna fare un test sulla differenza di medie di ipotesi H 0 : µ X = µ Y e alternativa H : µ X µ Y. Calcoliamo t = X Ȳ 6.267 6.285 = =.29 s X Ȳ 0.039 Se vogliamo fare un test di livello α = 0.05 come nel punto., il valore critico è dato da t α/2 (ν) = t 0.975 (8) = 2.00. Siccome t < t α/2 (ν), accettiamo H 0 : non ci sono quindi abbastanza elementi per affermare che le due sorgenti sono diverse. Siccome poi t 0.95 (8) =.734 > t, possiamo riportare P > 0., che in effetti è un valore abbastanza elevato da indurci ad accettare l ipotesi H 0 anche se non ci fosse stato fornito un livello α. 3. Per entrambi gli intervalli di confidenza ci serve il quantile t α/2 (ν) = t 0.975 (9) = 2.262. Allora gli estremi dell intervallo di confidenza per µ X sono dati da X ± s Xt α/2 (ν) = 6.267 ± 0.0295 0 2.262 e risulta uguale a [6.246; 6.288]. Gli estremi dell intervallo di confidenza per µ Y sono dati da Ȳ ± s Ȳ t α/2 (ν) = 6.285 ± 0.0327 0 2.262 e risulta uguale a [6.262; 6.308].

Esercizio 3.. Gli intervalli di confidenza cercati sono ˆp i ± q 0.995 sˆpi, con i =, 2. Abbiamo che ˆp = 68 525 = 0.85, ˆp 2 = 422 6755 = 0.0063, e ˆp ( ˆp ) ˆp 2 ( ˆp 2 ) sˆp = = 0.0045, sˆp2 = = 0.0003 n n 2 Allora l intervallo di confidenza per p ha estremi 0.85 ± 2.57 0.0045, ed è quindi uguale a [0.070; 0.300]. L intervallo di confidenza per p 2 ha estremi 0.0063 ± 2.57 0.0003, ed è quindi uguale a [0.0055; 0.007]. 2. L intervallo di confidenza cercato è ˆp ˆp 2 ± q 0.995 sˆp. Abbiamo che ˆp = ( 68 + 422 525 + 6755 = 0.043, sˆp = ˆp( ˆp) + ) = 0.007 n n 2 Allora l intervallo di confidenza ha estremi 0.22 ± 2.57 0.007, ed è quindi uguale a [0.079; 0.65]. 3. Vogliamo fare un test di ipotesi H 0 : p = p 2 contro l alternativa H : p p 2. Per effettuare il test possiamo utilizzare il test Z oppure il test χ 2, che producono gli stessi risultati. Siccome n 2 ˆp > n ˆp = 6755 0.043 = 965 > 5, si puó usare il metodo del test Z: Z = ˆp ˆp 2 = 65.78 ˆp( ˆp)( n + n 2 ) L ultimo quantile nelle tavole è 2.99 = q 0.9986, e si ha Z > q 0.9986, quindi P < 0.00278 (in realtà P è diversi ordini di grandezza più basso), quindi rifiutiamo H 0 in favore di H : sembra che il peso alla nascita induca tassi di mortalità diversi. 4. Nel punto 2. avevamo visto che 0 non era compreso nell intervallo di confidenza al 99%, e questo significa che sicuramente nel test del punto 3. doveva risultare P < 0.0, come effettivamente è stato.

Esercizio 4. Partiamo calcolando le quantità: x i = 295, y i = 2.377, x 2 i = 5525, yi 2 = 0.923, x i y i = 8.395 e quindi X = n s 2 X = s 2 Y = s XY = n X i = 36.875, Ȳ = n n Y i = 0.297, ( n ) Xi 2 n X 2 = 663.84, ( n Y 2 i nȳ 2 ) = 0.0294, ( n ) X i Y i n XȲ = 4.399. Calcoliamo i coefficienti della retta di regressione: b = s XY s 2 = 0.0066 X b 0 = Ȳ b X = 0.053 La retta di regressione è quindi y = 0.0066x + 0.053. 2. Bisogna effettuare un test di ipotesi H 0 : β = 0 e alternativa H : β 0. Bisogna prima calcolare s Y X = s b = n 2 (s2 Y b2 s2 X ) = 0.0209 s Y X = 0.000306 () s 2 X Abbiamo allora t = b 0 s b = 2.62 Bisogna confrontare t con una legge di Student a ν = 8 2 = 6 gradi di libertà. Abbiamo che t 0.999 (6) = 5.208 < t, quindi P < 0.002. Con una P così bassa siamo portati a rifiutare H 0 e ad accettare H, il che significa che sembra esserci una relazione lineare significativa tra la probabilità di sviluppare un tumore e il consumo giornaliero di sigarette. 3. Se la regressione lineare è un modello valido, la probabilità di contrarre un tumore per una persona che consumi 35 sigarette al giorno è y = b x + b 0 = 0.2847.

Esame di Statistica del 9 gennaio 2008 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova) (docente: Tiziano Vargiolu) Hanno superato la prova: Alessio Enrico 23.5 + 3 Begolo Daniela 3.5 Bellini Stefano 8 + 2 Bergamo Giorgia 24 Bortolotto Alberto 9.5 Cesarato Fabio 30.5 + 3 + Cusinato Giulia 25 Dal Bello Simonetta 9.5 + 3 Dal Lago Marco 7 + 3 Duso Enrico 9.5 Ferro Giulia 20.5 + 2 + Finotti Giulia 8 + 3 + Francescato Federica 20.5 + 3 + Genovesi Elisa 8 Gris Barbara 23.5 Leone Kevin 9.5 + 3 Magaraggia Mattia 7 Mosole Simone 26.5 Passoni Gabriella 2 + 3 Perin Giorgio 29.5 + 3 + Polato Marco 28.5 + 3 Poles Lara 7.5 Ramponi Martina 29.5 + + Sciortino Marianna 8 Sudiro Cristina 2.5 Venturato Andrea 26 Vigolo Michele 20 + 3 + Visione compiti corretti, registrazione voto e/o orali: lunedì 4 gennaio ore 7.00 aula 2BC/60 torre Archimede., oppure giovedí 7 gennaio ore 0 aula 2AB/45 torre Archimede. Verrà data precedenza alla registrazione voti a chi accetta il voto dello scritto e ha il bonus di + 3.