Esposte (>0,4mGy) 10 (3,333) 190 (196,667) ,667

Documenti analoghi
Esercizi di statistica

Esercizi di statistica inferenziale

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

Verifica delle ipotesi

Statistica Inferenziale

Statistica inferenziale per variabili quantitative

Distribuzione normale

Distribuzione Normale

Cognome e nome Tempo disponibile: 75 minuti

5. Nei grafici, l asse orizzontale è chiamato a). e l asse verticale è chiamato b)..

Metodi statistici per le ricerche di mercato

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato

Parametri statistici

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

METODI STATISTICI PER LA BIOLOGIA. Paolo Dai Pra e Francesco Caravenna

Statistica (parte II) Esercitazione 4

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof.

1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati. Media = 172,8 Deviazione standard= 24,25

Teorema del Limite Centrale

Cognome e nome. 1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati.

Cognome e nome. 2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 129; 134; 142; 128; 146

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Misure di dispersione (o di variabilità)

Esercitazione: La distribuzione NORMALE

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

Metodi Matematici e Informatici per la biologia. Esercizi

tabelle grafici misure di

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

COGNOME.NOME...MATR..

Elaborazione statistica di dati

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

STATISTICA ESERCITAZIONE 13

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Esercizi di Probabilità e Statistica

Elementi di Psicometria (con laboratorio software 1)

SCHEDA DIDATTICA N 7

INDICE PARTE METODOLOGICA

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

Introduzione alla statistica per la ricerca in sanità

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Test d ipotesi: confronto fra medie

= = 28,3333 C. x =

Biostatistica Laurea Magistrale in Biologia

7. STATISTICA DESCRITTIVA

Tempo disponibile: 60 minuti

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Campionamento 21/1/2005

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Argomenti della lezione:

Statistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tecniche di sondaggio

Distribuzioni di frequenza di due variabili

ESAME. 9 Gennaio 2017 COMPITO B

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE

Teorema del Limite Centrale

Compiti tematici dai capitoli 2,3,4

DISTRIBUZIONE NORMALE (1)

Distribuzione Normale

Laboratorio di Probabilità e Statistica

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

OD TEST DI IPOTESI 50

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

Intervalli di confidenza

Teoria e tecniche dei test. Concetti di base

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016

Test per la correlazione lineare

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Cognome e nome Tempo disponibile: 60 minuti

Probabilità e Statistica

STATISTICA. Regressione-4 ovvero Macron!

Metodi Matematici ed Informatici per la Biologia Esame Finale, II appello 2 Luglio Matricola: Codice

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

Seconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Simulazione di esercizi su test di significatività e 95%CI

Distribuzione Normale

ESAME. 9 Gennaio 2017 COMPITO A

STATISTICA. Esercitazione 5

Metodi statistici per le ricerche di mercato

Variabilità e Concentrazione Esercitazione n 02

LEZIONI DI STATISTICA MEDICA

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Test d Ipotesi Introduzione

Matematica Lezione 22

Transcript:

COMPITO 1 1. La radiografia dentale durante la gravidanza sembra possa essere connessa alla presenza di basso peso neonatale a termine. In uno studio si mettono a confronto 00 donne che avevano ricevuto una dose > 0,4mGy con una radiografia dentale in gravidanza con 1000 donne (controlli) che non avevano fatto alcuna radiografia. I bambini sottopeso alla nascita sono stati 10 fra le esposte a radiazioni e 10 fra i controlli. Si può ritenere plausibile un associazione fra radiografia a basso peso alla nascita? (utilizzare un livello di significatività α0,01). SOLUZIONE sottopeso normopeso Esposte (>0,4mGy) 10 (3,333) 190 (196,667) 00 Controlli (nessuna radiografia) 10 (16,667) 990 (983,333) 1000 0 1180 100 ( 10 3,333 0,5 ) ( 190 196,667 0,5 ) ( 10 16,667 0,5 ) ( 990 983,333 0,5 ) χ 3,333 196,667 16,667 983,333 38,03 38,03 38,03 38,03 11,411 0,193,8 0,039 13,95 3,333 196,667 16,667 983,333 Il valore critico per 1 gdl e α0,01 è 6,635; poiché 13,95>6,635 rifiutiamo l ipotesi nulla di indipendenza fra esposizione a radiazioni e basso peso neonatale. Nell affermare che esiste un associazione fra radiografia e basso peso alla nascita ci assumiamo un rischio di errore (di tipo I) inferiore a 0,01.. Nel caso di malattie croniche inguaribili la stima della durata media di una malattia corrisponde al rapporto tra: prevalenza e incidenza incidenza e mortalità mortalità e prevalenza prevalenza e mortalità 3. La standardizzazione dei tassi serve per: Confrontare i tassi di popolazioni non omogenee per determinate variabili Calcolare il rischio relativo Stimare la durata media di una malattia nessuna delle precedenti risposte 4. Considerare la seguente tabella che mostra la distribuzione dei punteggi totali di una scala di valutazione per gli attacchi di panico rilevati su un campione di 100 soggetti sofferenti di questo disturbo e completarla indicando le frequenze relative, le frequenze assolute comulative e le frequenze relative comulative. Punteggi o Freq. Ass. Freq. Rel. Freq. Ass. Cumulat. Freq. Rel. Cumul. 50-59 10 0,10 10 0,10 60-69 1 0,1 31 0,31 70-79 35 0,35 66 0,66 80-89 18 0,18 84 0,84 90-99 1 0,1 96 0,96 100-109 4 0,04 100 1,00 5. In relazione al quesito n.4 indicare qual è la percentuale di soggetti che hanno un punteggio maggiore di 69? 31% 66% 69% 41% 1

µ σ 6. Nella seguente tabella è riportata la distribuzione di frequenza di tumore mammario in un campione di 100 donne in età compresa tra i 30 e i 65 anni. Qual è l età media? (per il calcolo utilizzare i valori centrali delle classi). Età 30-33 34-37 38-41 4-45 46-49 50-53 54-57 58-61 6-65 totale Frequenz a 3 9 19 9 17 10 7 4 100 11,1 47,5 48,3 46,5 7. Una serie di misurazioni ha media 4 e varianza 100. Determinare il valore di una misurazione il cui valore standardizzato è -0,7. 11 35 0,58 41,3 8. I perimetri toracici della popolazione maschile italiana di età compresa fra i 18 e i 74 anni sono distribuiti approssimativamente in modo normale con media 75 cm e deviazione standard 19 cm. Determinare la percentuale di persone con perimetro toracico inferiore a 36, cm. SOLUZIONE Il valore standardizzato corrispondente a 36, cm è: x 36, 75 z,04 19 L area a sinistra di z-,04 è (0,5-0,4793), cioè 0,007. Ciò significa che il,07% dei soggetti ha un perimetro toracico inferiore a 36, cm. 9. Un docente di statistica in un corso con 6 alunni decide di effettuare una verifica a campione interrogando 5 studenti, uno ogni 3, secondo l ordine alfabetico a partire dal secondo iscritto nel registro (secondo, quinto, ottavo, undicesimo, ecc.). Di che tipo di campionamento si tratta? a grappoli sistematico a presentazione casuale semplice 10. Un campione costituito da 60 misurazioni sperimentali presenta una media campionaria pari a 33. Sapendo che la popolazione da cui è estratto il campione è distribuita normalmente con varianza pari a 115, qual è l intervallo di confidenza al 90%? [8,54;37,46] [30,7;35,8] [8,58;57,4] [31,6;34,38] 11. In uno studio sui tempi di recupero della tossicodipendenza si esaminano due campioni di maschi e di femmine e si ottengono i seguenti dati per i tempi medi di recupero (espressi in settimane): Obj10 Maschi: Obj103 Femmine: Quale test dobbiamo utilizzare per verificare se esiste una differenza significativa fra le medie delle due popolazioni? (H 0 : µ 1 -µ 0; H 1 :µ 1 -µ 0)

test del Chi-Quadrato test t di Student per campioni indipendenti test di MCNemar test z della differenza di due medie 1. In riferimento all esercizio n.11, se il valore della statistica utilizzata è 1,775, quali delle seguenti affermazioni sono corrette? la probabilità di errore di tipo I è minore di 0,0 la probabilità di errore di tipo I minore di 0,05 la probabilità di errore nel rifiutare H 0 è > del 5% la probabilità di errore nel rifiutare H 0 è < del 10% 3

COMPITO 1. Per valutare il livello di conoscenza di Internet degli studenti, un campione di 10 studenti del corso di laurea in informatica viene confrontato con un campione di 360 studenti di altri corsi di laurea. Fra gli studenti di informatica 8 risultano avere una buona conoscenza e 9 una scarsa conoscenza. Fra gli studenti di altre lauree 0 risultano avere una buona conoscenza e 340 una scarsa conoscenza. Con un α0,01 si può affermare che c è indipendenza fra tipo di laurea e grado di conoscenza di internet? SOLUZIONE Conoscenza buona Conoscenza scarsa Corso di laurea in Informatica 8 (1) 9 (108) 10 Altri corsi di laurea 0 (36) 340 (34) 360 48 43 480 ( 8 1 0,5 ) ( 9 108 0,5 ) ( 0 36 0,5 ) ( 340 34 0,5 ) χ 1 108 36 34 40,5 40,5 40,5 40,5 0,01,5 6,674 0,74 9,66 1 108 36 34 Il valore critico per 1 gdl e α0,01 è 6,635; poiché 9,66>6,635 rifiutiamo l ipotesi nulla di indipendenza fra grado di conoscenza di internet e il tipo di corso frequentato dagli studenti. Nell affermare che esiste un associazione fra corso di laurea e livello di conoscenza ci assumiamo un rischio di errore (di tipo I) inferiore a 0,01.. In uno studio sulla relazione esistente fra due variabili parametriche continue X ed Y il coefficiente di correlazione di Pearson risulta pari a 0,75. Quanto è la percentuale di variabilità di Y spiegata dalla variabilità di X? 75% 0% 56,5% nessuno delle altre risposte è corretta 3. In uno studio di coorte al termine del periodo di follow-up durato 0 anni si osserva che l incidenza negli esposti è doppia rispetto a quella nei non esposti ad un particolare fattore di rischio ambientale. Supponendo che l incidenza nei non esposti sia di 50/100000, quanto è il rischio attribuibile? 0,05% 5% 50% 0,10% 4. Considerare la seguente tabella che mostra la distribuzione dei punteggi totali di una scala di valutazione per gli attacchi di panico rilevati su un campione di 100 soggetti sofferenti di questo disturbo e completarla indicando anche le frequenze assolute comulative. Punteggi o Freq. Ass. Freq. Ass. Cumulat. 50-59 10 10 60-69 1 31 70-79 35 66 80-89 18 84 90-99 1 96 4

µ σ 100-109 4 100 5. In relazione al quesito n.4 indicare qual è la percentuale di soggetti che hanno un punteggio minore di 70? 31% 66% 69% 41% 6. Qual è la media aritmetica della seguente distribuzione di dati?. X 1 3 5 6 9 Frequenza 3 7 8 4,80 1,09 5,09,40 7. Una serie di misurazioni ha media 4 e varianza 100. Determinare il valore standardizzato z corrispondente a una misurazione il cui valore è 35. 0,7 0,07-0,07-0,7 8. I perimetri toracici della popolazione maschile italiana di età compresa fra i 18 e i 74 anni sono distribuiti approssimativamente in modo normale con media 75 cm e deviazione standard 19 cm. Determinare la percentuale di persone con perimetro toracico maggiore a 36, cm. SOLUZIONE Il valore standardizzato corrispondente a 36, cm è: x 36, 75 z,04 19 L area a destra di z-,04 è (0,50,4793), cioè 0,9793. Ciò significa che il 97,93% dei soggetti ha un perimetro toracico maggiore di 36, cm. 9. La distribuzione di età di una popolazione è di tipo campanulare unimodale con media 36 e moda 18. Che valore ha la mediana? 90 30 18 36 10.Un campione costituito da 900 misurazioni sperimentali presenta una media campionaria pari a 33. Sapendo che la popolazione da cui è estratto il campione è distribuita normalmente con varianza pari a 16, qual è l intervallo di confidenza al 99%? [33-1,96 x 4/30 ; 33 1,96 x 4/30] [33,58 x 16/30 ; 33,58 x 16/30] [33,58 x 4/30 ; 33,58 x 4/30] [16,58 x 33/30 ; 16,58 x 33/30] [33,58 x 16/900 ; 33,58 x 16/900] [33,58 x 4/900 ; 33,58 x 4/900] 11.Per verificare l efficacia di un nuovo metodo di apprendimento, 15 pazienti con disturbi neurologici in età evolutiva vengono sottoposti a un test valutativo. Se le differenze dei punteggi totali del test somministrato prima e dopo un mese l applicazione del nuovo metodo seguono una distribuzione normale, quale test utilizzereste per verificare se il nuovo metodo cambia significativamente la capacità di apprendimento? (H 0 : µ d 0; H 1 :µ d 0) test del Chi-Quadrato test t di Student per campioni indipendenti test t di Student per dati appaiati 5

test z della differenza di due medie 1.In riferimento all esercizio n.11, se il valore della statistica utilizzata è,70, quali delle seguenti affermazioni sono corrette? la probabilità di errore di tipo I è minore di 0,0 la probabilità di errore di tipo I è minore di 0,01 la probabilità di errore nel rifiutare H 0 è > del 1% la probabilità di errore nel rifiutare H 0 è < del 5% 6

COMPITO3 1. In riferimento alla seguente serie numerica: 7; 9; 4; 4; 5; 7; 7; 10; 9; quali affermazioni sono corrette? il campo di variazione è 6 il 1 terzile è 5 la moda è 7 la mediana è 7 nessuna risposta precedente è giusta. In uno studio sulla relazione esistente fra due variabili parametriche continue X (variabile indipendente) ed Y (variabile dipendente) viene calcolato il coefficiente di correlazione di Pearson che risulta uguale a 0,60. Quali di queste affermazioni sono corrette? mediamente y decresce al crescere di x. il coefficiente di determinazione è pari a 36 la variabilità di y è spiegata per il 36% dalla variabilità di x nessuna delle affermazioni precedenti è corretta 3. Il rischio assoluto è una misura epidemiologica che si utilizza per valutare: la forza dell associazione fra il fattore di rischio e la malattia l incidenza della malattia negli esposti ad un fattore di rischio l incidenza della malattia nei non esposti ad un fattore di rischio la prevalenza della malattia negli esposti ad un fattore di rischio 4. Viene condotto uno studio su 15 studenti per verificare se il consumo di una certa quantità di alcol può influire sull esito di un esercizio manuale. I tempi (rilevati prima e dopo aver assunto una certa quantità di vino) impiegati dagli studenti per completare il compito assegnato, sono riportati nella seguente tabella assieme ai valori delle differenze. Poiché la distribuzione delle differenze non risulta gaussiana, in tabella sono anche indicati i ranghi associati alle differenze per facilitare il calcolo dell appropriato test statistico non parametrico. Soggett o Prima del consumo Dopo il consumo Differenza dopo-prima Rango 1 15,1 1, 6,1 1 14,5 17,8 3,3 10 3 16,5 17,8 1,3 5 4 19, 18,8-0,4-5 16,9 19,,3 6,5 6 14,3 17,1,8 9 7 16,4 16, -0, -1 8,5 7,0 4,5 11 9 0,4,8,4 8 10 19,5 18,5-1,0-3 11 14, 1,8 7,6 13 1 16,9 16,9 0-7

13 0,5 1,7 1, 4 14 6, 37,5 11,3 14 15 1, 14,5,3 6,5 Partendo dall ipotesi nulla H 0 che non c è differenza tra i tempi medi delle due serie di dati, quale delle seguenti affermazioni è corretta? il valore della statistica W, uguale a 6, non ci autorizza a rifiutare H 0 il valore della statistica W, uguale a 93, ci autorizza a rifiutare H 0 con un rischio di errore di tipo I inferiore al % si può rifiutare H 0 con un rischio di errore di tipo I maggiore del % e minore del 5% non si può rifiutare H 0 perché il rischio di errore di tipo I sarebbe troppo alto 5. Un odds ratio inferiore a 1 indica presumibilmente che: il supposto fattore di rischio non ha influenza sulla malattia l incidenza negli esposti è superiore a quella nei non esposti il supposto fattore di rischio è protettivo nei confronti dello sviluppo della malattia considerata il fattore di rischio ha influenza sullo sviluppo della malattia considerata 6. Si vuole stimare il perimetro toracico medio di una certa popolazione utilizzando un campione rappresentativo di 900 soggetti. La media campionaria del perimetro toracico risulta pari a 90 cm. Se la popolazione si considera distribuita in modo normale con scarto quadratico medio pari a 10 cm, determinare l intervallo di confidenza al 95,45%. (90 1,96x10/30; 90 1,96x10/30) (90 10/30; 90 10/30) (30 1,645x10/900; 30 1,645x10/900) (90 x10/30; 90 x10/30) 7. Alcuni ricercatori hanno ipotizzato una possibile relazione tra il sesso e l incidenza dell epatite C. A tale scopo essi considerano un campione di 488 soggetti. I dati relativi ai casi di epatite e al sesso dei pazienti sono riportati nella seguente tabella. Sesso HCV HCV- Tot. Maschi 31 05 36 Femmin e 48 04 5 Tot. 79 409 488 Quale test statistico utilizzereste per stabilire se c è relazione fra il sesso e l incidenza dell epatite C? test t di Student per dati appaiati test di McNemar t-test per campioni indipendenti test del Chi-Quadrato 8. Il valore della statistica utilizzata nell esercizio precedente è 3,95; quali delle seguenti affermazioni sono corrette? Con un α0,10 si può affermare che non c è indipendenza statistica fra sesso ed epatite (p<0,10) 8

La probabilità di errore di tipo I nel rifiutare l ipotesi di indipendenza è p<0,05 La probabilità di errore di tipo I nel rifiutare l ipotesi di indipendenza è p>0,01 Nessuna delle risposte precedenti è corretta 9

COMPITO4 1. In quali dei seguenti casi viene effettuata una randomizzazione? campionamento semplice campionamento stratificato campionamento sistematico campionamento a grappoli scelta del campione con criteri personali nessuno dei precedenti. Se in un articolo scientifico viene riportato che il rischio relativo è 1,5 e l intervallo di confidenza al 95% è (0,8 ;,), quale è l interpretazione giusta dei risultati? il fattore di rschio in studio aumenta significativamente il rischio di malattia il fattore di rischio in studio non aumenta né diminuisce in modo significativo il rischio di malattia l incidenza negli esposti è minore di quella nei non esposti nessuna delle precedenti risposte 3. Se il tasso di incidenza di una malattia è 5 volte maggiore negli uomini rispetto alle donne mentre la prevalenza non mostra alcuna differenza per sesso, la spiegazione più plausibile è che: la letalità della malattia sia maggiore nelle donne la durata della malattia sia maggiore nelle donne la mortalità della malattia sia maggiore nelle donne la diagnosi venga non effettuata correttamente nelle donne 4. Completare la seguente tabella che mostra la distribuzione di frequenza dell età di insorgenza di patologie tiroidee in 31 maschi assistiti presso un centro endocrinologico. Età Frequenze Frequenze cumulative 10-19 0-9 30-39 40-49 50-59 60-69 70-79 80-89 15 15 16 31 3 63 53 116 61 177 94 71 44 315 6 31 5. In riferimento alla distribuzione di frequenza della tabella dell esercizio n.4, quali delle seguenti affermazioni sono corrette? 58 soggetti hanno un età maggiore di 39 anni la classe modale è la classe (60-69) la classe mediana è la classe (40-49) la classe mediana è la classe (50-59) 6. In riferimento all esercizio n.4 qual è l età media? (nel calcolo considera i valori centrali delle classi) 54,50 49,50 56,79 53,7 7. In uno studio sulla relazione fra il livello medio di LH nelle 4 ore e il grasso corporeo totale in 8 ragazze adolescenti con sindrome di Turner l equazione della retta di regressione è risultata Y -3,40X 79,5 dove Y rappresenta il livello medio di LH (mlu/ml) ed X il grasso corporeo totale (kg). Quali di queste affermazioni sono corrette? esiste una tendenziale relazione inversa tra le due variabili 10

all aumentare del grasso corporeo corrisponde mediamente un aumento della produzione dell ormone LH se si calcola il coefficiente di correlazione di Pearson, risulterà negativo se si calcola il coefficiente di correlazione di Pearson, risulterà positivo x 48,4 n 16 s 46,49 8. Determinare l intervallo di confidenza al 95% avendo i seguenti valori di azotemia: (48,4-1,96 x 15,7/4 ; 48,4 1,96 x 15,7/4 ) (48,4,13 x 15,7/16 ; 48,4,13 x 15,7/16 ) (48,4,13 x 46,49/4 ; 48,4,13 x 46,49/4 ) (48,4,13 x 15,7/4 ; 48,4,13 x 15,7/4 ) 11

9. Supponiamo che i punteggi dell esame di guida di una certa popolazione si distribuiscano in modo normale con scarto quadratico medio pari a 15. Per un campione di 64 persone estratto in modo casuale da questa popolazione si riscontra un valore medio del punteggio di 10. Verificare, ad un livello di significatività α 0,05, che la media della popolazione sia uguale a 100. SOLUZIONE Ipotesi a confronto: H 0 : µ100 ; H 1 : µ 100 Utilizziamo un test Z a due code, ed il valore critico d Z per α0,05 è 1,96. Il valore empirico di Z è: Obj107 Poiché 10,67 > 1,96 rifiutiamo l ipotesi nulla H 0. 10. La tabella seguente mostra i dati di uno studio condotto per verificare se esistono differenze tra i livelli di PO nei soggetti con differenti abitudini al fumo. Livello di PO Fumatori Non fumatori Ex fumatori Totale < 85 mmhg 8 11 31 50 85 100 mmhg 9 1 43 >100 mmhg 46 9 1 56 Totale 76 9 44 149 Si può affermare che c è differenza tra i livelli di PO nei soggetti con differenti abitudini al fumo con una p di errore (tipoi): p>0,10 0,05<p<0,10 0,0<p<0,05 p<0,01 1

COMPITO5 1. La tabella seguente mostra la distribuzione per classi di età di 189 soggetti che hanno partecipato ad uno studio sul cerotto di nicotina per smettere di fumare. Completarla inserendo i valori mancanti. Età 30-39 40-50- 60-69 70-80-89 49 59 79 Frequenza 11 46 70 45 16 1 Frequenza cumulativa 11 57 17 17 188 189. In riferimento alla seguente distribuzione di frequenza; quali affermazioni sono corrette? valore 1 4 6 7 9 10 18 frequenz a 1 1 1 3 1 1 il campo di variazione (o Range) è 17 la media è 7 la moda è 4 la deviazione standard è 19,818 3. Il risultato di un test statistico viene dichiarato significativo quando: l'evento è impossibile l'ipotesi alternativa è sicuramente vera non sono vere né l'ipotesi nulla né quella alternativa se l'ipotesi nulla fosse vera, il risultato ha una probabilità di verificarsi inferiore al 5%. 4. L equazione della retta dei minimi quadrati che descrive la relazione lineare fra la variabile indipendente circonferenza vita (espressa in cm) e la variabile dipendente tessuto adiposo addominale profondo (cm ) è risultata, sulla base di un campione di 109 uomini, y-15,983,46x. Quali delle seguenti affermazioni sono corrette? Le due variabili sono legate da una relazione inversa Le due variabili sono legate da una relazione diretta ad ogni incremento di x di 1 cm y aumenta di 3,46 cm ad ogni incremento di x di 1 cm y diminuisce di 3,46 cm 5. In riferimento all esercizio n.4, se la somma dei quadrati delle devianze residue è 11698 e la somma dei quadrati delle devianze totali è 354531, qual è il valore del coefficiente di determinazione? 100% 50% 33% 67% 6. In riferimento all esercizio n. quali delle seguenti affermazioni sono vere? il 100% dei valori è 18 il 5% dei valori è 7 il 41,7% dei valori è 7 il 16,7% dei valori è >7 x 48,4 n 5 s 46,49 7. Determinare l intervallo di confidenza al 90% avendo i seguenti valori di azotemia: (48,4-1,96 x 15,7/5 ; 48,4 1,96 x 15,7/5 ) (48,4,13 x 15,7/5 ; 48,4,13 x 15,7/5 ) (48,4 1,71 x 15,7/5 ; 48,4 1,71 x 15,7/5 ) (48,4,06 x 15,7/5 ; 48,4,06 x 15,7/5 ) 8. La tabella seguente mostra i dati di uno studio condotto per verificare se in soggetti sopravvissuti alla poliomielite esiste un associazione fra le cadute e i cambiamenti nello stile di vita. Cambiamento stile di vita Non cambiamento stile di vita Totale Caduti 131 5 183 Non caduti 14 36 50 Totale 145 88 33 Valutare per α0,01 se si può affermare che esiste una relazione fra cadute e cambiamento di stile di vita a causa della paura di cadere. SOLUZIONE: Cambiamento stile di vita Non cambiamento stile di vita Totale Caduti 131 (113,884) 5 (69,116) 183 13

Non caduti 14 (31,116) 36 (18,884) 50 Totale 145 88 33 ( O A 0,5 ) χ A 9,91 Il valore critico associato a 1 gdl e α0,01 è 6,635. Poiché 9,91>6,635 rifiutiamo H 0 e affermiamo che la paura di cadere causa cambiamenti nello stile di vita. 14

t ( 1 1 1 1 1 1 1 ( 9. Viene condotta una ricerca per studiare gli effetti della terapia della reminescenza in donne anziane depresse. Le partecipanti hanno ricevuto una terapia della reminescenza utilizzando un album di fotografie di familiari e ricordi personali e conversazioni di gruppo. Per valutare la gravità della depressione si è considerato il punteggio totale della Scala di Depressione Geriatria (GDS) prima e dopo il trattamento. Se le differenze nei punteggi totali seguono una distribuzione normale, quale test utilizzereste per sapere se la terapia ha effetto? t-test di Student per campioni indipendenti Test del chi-quadrato t-test di Student per dati appaiati test di McNemar x,4 s 1,5 n 15 x 4,5 s 1 n 1 1 3 10. In una ricerca si confrontano i livelli medi di acido urico sierico nei soggetti normali con quelli nei soggetti con sindrome di Down. Questi i dati nei due campioni: Possiamo affermare che le medie delle due popolazioni non sono uguali per un α0,05? (H 0 : µ 1 µ 0; H 1 : µ 1 µ 0) SOLUZIONE: s x n s n 1) s x n s n n n 4,5 1,8 1 1) s 3,4 1,8 15 14 15 1,5 1 1,1 0,438 11 1,511 1,8 Per 5 gdl il valore critico è,06. Poiché,511>,06 si rifiuta H 0. 15

COMPITO6 1. La tabella seguente mostra la distribuzione per classi di età di 9000 pazienti che ad una visita medica hanno dato il loro consenso alla donazione di organi. Completarla inserendo i valori mancanti. Età 5-7 8-30 31-33 34-36 Frequenza relativa 8,9 6,7 8,9 35,5 percentuale Frequenza assoluta 801 403 601 3195 Frequenza cumulativa 801 304 5805 9000. In riferimento alla distribuzione di età dell esercizio n.1, qual è l età media arrotondata all intero più vicino? (calcolarla considerando i valori centrali delle classi) 3 45 31 7 3. Il livello di significatività è: il rischio massimo accettabile di rifiutare l ipotesi nulla quando essa è vera chiamato errore di tipo II il rischio di accettare l ipotesi nulla quando essa è vera la probabilità di un falso negativo 4. Quali delle seguenti affermazioni sono corrette? Un campionamento effettuato con criteri personali è necessariamente un campionamento casuale semplice In un campionamento sistematico la selezione prende in considerazione una unità ogni tanto in base al passo di campionamento a partire dalla prima unità scelta casualmente Un campione casuale stratificato rappresentativo della popolazione dovrebbe essere costruito in modo che la dimensione di ogni strato fosse proporzionale alla dimensione del corrispondente strato della popolazione Generalmente, in un campionamento casuale semplice, dopo aver diviso la popolazione in sottogruppi, si procede selezionandoli casualmente 5. In uno studio sulla relazione fra il livello medio di LH (ormone luteinizzante) nelle 4 ore e il grasso corporeo totale (da considerarsi variabile indipendente) in ragazze adolescenti con sindrome di Turner il coefficiente di correlazione di Pearson è risultato r - 0,88. Quali delle seguenti affermazioni sono corrette? la percentuale di variabilità di LH spiegata dalla relazione col grasso corporeo totale è 88,00% esiste una tendenziale relazione diretta tra il grasso corporeo totale ed il livello di LH esiste una tendenziale relazione inversa tra il grasso corporeo totale ed il livello di LH la percentuale di variabilità di LH spiegata dalla relazione col grasso corporeo totale è 77,44% 6. Viene condotto uno studio sulla sopravvivenza a 5 anni di malati al di sotto di 40 anni ai quali è stato diagnosticato un cancro del polmone utilizzando un campione di 5 pazienti; di questi solo 6 sopravvivono. Individuare l intervallo di confidenza approssimato al 95% che includa la reale proporzione di pazienti che sopravvivono. (,8% ; 0,%) (11,5% ; 100,0%) (6,0% ; 5,0%) (,0% ; 4,0%) x 48,4 n 81 σ 7. Determinare l intervallo di confidenza al 90% avendo i seguenti valori di azotemia (nota che la varianza della popolazione è conosciuta): (48,4,58 x 15,7/9 ; 48,4,58x 15,7/9 ) (48,4,13 x 15,7/81 ; 48,4,13 x 15,7/81 ) (48,4 1,645 x 15,7/9 ; 48,4 1,645 x 15,7/9 ) (48,4 46,49/9 ; 48,4 46,49/9 ) 46,49 8. Viene condotto uno studio sull efficacia dei caschi protettivi per bicicletta nella prevenzione di traumi cranici analizzando i dati di un campione casuale di 793 soggetti coinvolti in incidenti nel periodo di un anno: i traumi cranici che richiesero assistenza sanitaria furono 17 tra 147 soggetti che indossavano il casco e 18 tra i 646 soggetti che non indossavano il casco. Esiste un associazione tra traumi cranici e non uso del casco? Consideraree un livello di significatività α 0,01. SOLUZIONE: 16

Con casco protettivo Senza casco protettivo Totale Presenza trauma cranico 17 (43,6) 18 (191,4) 35 Assenza trauma cranico 130 (103,4) 48 (454,6) 558 Totale 147 646 793 Obj113 Il valore critico associato a 1 gdl e α0,01 è 6,635. Poiché 7,7>6,635 rifiutiamo l ipotesi nulla e concludiamo che le proporzioni di soggetti che hanno riportato traumi cranici non sono uguali nelle due popolazioni. 9. Viene condotta una ricerca per studiare gli effetti della terapia della reminescenza in donne anziane depresse. 14 partecipanti sono state seguite per 3 mesi in una casa di cura. Per valutare la gravità della depressione si è considerato il punteggio totale della Scala di Depressione Geriatria (GDS) prima e dopo il trattamento. I risultati sono illustrati nella tabella sotto. E possibile concludere che la terapia ha abbassato significativamente (per α0,05) il punteggio GDS? H 0 : µ d 0 ; H 1 : µ d >0. Differenze (d) Pre-Post GDS 1 0 5-1 3 5 3 0 0-1 0 6 SOLUZIONE Obj114 Per ν n-113gradi di libertà il valore critico associato ad α0,05 è 1,771 (test a una coda); pertanto rifiuto l ipotesi nulla. 10. In riferimento all esercizio n.1, qual è la classe mediana di età? 5-7 8-30 31-33 34-36 17

COMPITO7 1. In riferimento alla seguente distribuzione di dati quali affermazioni sono corrette? X 1 3 5 6 9 i fi 3 7 6 la deviazione standard è 4,1 la moda è 6 il valore medio è 5 la varianza è 4,1. Ancora in riferimento alla distribuzione dell esercizio n.1, quali altre affermazioni sono corrette? la percentuale di valori 5 è 60% la percentuale di valori 3 è 5% il campo di variazione (range) è 9 la mediana è 5 3. Da una popolazione distribuita normalmente con varianza pari a 115 viene estratto un campione casuale di ampiezza n60. Se la media campionaria è 33, qual è l intervallo di confidenza al 90% per la media incognita della popolazione? [73,5 ; 96,48] [30,7 ; 35,8] [8,60 ; 50,10] [7,00 ; 39,00] 4. Data le seguenti serie di misure, verificare quale delle due ha maggiore dispersione relativa: prima serie: Kg. 5 4 7 3 6 seconda serie: cm. 500 501 499 510 490 hanno pari dispersione relativa la seconda serie la prima serie non c è modo di verificarlo 5. L equazione della retta di regressione che descrive la relazione fra la circonferenza della vita (cm), X, ed il tessuto adiposo addominale profondo TA (cm ), Y, di 109 uomini è: Y -15,98 3,46X. Quali delle seguenti affermazioni sono corrette? per ogni unità di incremento di X, Y diminuisce per un ammontare pari a 15,98 al crescere della circonferenza della vita cresce mediamente il tessuto adiposo addominale profondo per ogni unità di incremento di X, Y aumenta per un ammontare pari a 3,46 per una circonferenza di vita di 70 cm stimiamo un TA pari a 6, cm. 6. Per verificare l efficacia di un nuovo farmaco anti-ipertensivo viene confrontata la pressione sistolica media di un gruppo di 10 soggetti trattati col nuovo farmaco con quella di un gruppo altrettanto numeroso di soggetti trattati con un farmaco antiipertensivo già in commercio. Quale test utilizzereste? test del Chi-Quadrato test di McNemar t-test per campioni indipendenti t-test di student per dati appaiati 7. Considerando il problema precedente, se il valore della statistica è risultato,13, quanto è il rischio di errore nel rifiutare l ipotesi nulla di equivalenza fra i due farmaci? <0,0 <0,01 <0,05 >0,10 8. Nella seguente tabella sono riportati i dati clinici relativi a 65 pazienti affetti da parapsoriasi, raggruppati in base alla terapia (uso e non uso di steroidi topici) e all esito (miglioramento o no) di questa terapia. In base a questi dati è possibile dire che non vi è associazione significativa tra la terapia usata e la risposta dei pazienti? (α0,05) Esito Steroidi Non steroidi Totale Miglioramento 30 6 36 NO Miglioramento 17 1 9 Totale 47 18 65 18

SOLUZIONE Esito Steroidi Non steroidi Totale Miglioramento 30 (6,03) 6 (9,97) 36 NO Miglioramento 17 (0,97) 1 8,03) 9 Totale 47 18 65 Obj115 Il valore critico associato a 1 gdl e α0,05 è.71. Poiché 3,74>,71 rifiutiamo l ipotesi nulla di indipendenza statistica e affermiamo che il trattamento con steroidi topici dà risultati migliori rispetto ad altre terapie. 9. In un campione di 15 persone viene riscontrato un valore medio di PaO a riposo pari a 79,86 e una deviazione standard s9,71. Determinare un intervallo di confidenza al 95% per la media della popolazione. SOLUZIONE Obj116 10. Un docente con una classe di 5 alunni, decide di interrogare otto studenti, uno ogni tre, secondo l ordine alfabetico, dopo aver estratto casualmente il primo. Di che tipo di campionamento si tratta? campionamento casuale semplice campionamento casuale stratificato campionamento sistematico campionamento a presentazione 19

COMPITO8 1. Considerati i seguenti numeri primi minori di 100: 1,, 3, 5, 7, 11, 13, 17, 19, 3, 9, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97. Quali delle seguenti affermazioni sono vere? la media è 40,81 la mediana è 37 la mediana è 39 la mediana è 50,5. In relazione alla retta di regressione, quali affermazioni sono corrette? la retta di regressione è anche detta dei minimi quadrati in riferimento al metodo matematico utilizzato per la sua determinazione se il coefficiente di regressione è positivo esiste una correlazione negativa tra la variabile indipendente e la variabile dipendente il coefficiente di regressione indica di quanto varia la variabile dipendente al variare di una unità della variabile indipendente nessuna delle affermazioni precedenti è corretta 3. In relazione all indice di Skewness, quali affermazioni sono corrette? misura la concentrazione dei dati rispetto al valore medio è una misura di tendenza centrale misura la asimmetria dei dati rispetto al valore medio nel caso di una distribuzione normale è 0 4. La seguente tabella mostra la media e la deviazione standard di alcuni caratteri fisici delle popolazioni maschili dell Africa Occidentale. Inserire nell ultima colonna della tabella i coefficienti di variazione. media Dev. standard V Statura (cm) 166,73 5,70 3,4 Peso (Kg) 51,48 6,45 1,5 Diam. biacromiale (cm) 37,75 1,6 4,3 Diam. torac. A-P (cm) 16,40 0,9 5,6 5. In riferimento all esercizio n.4 quale affermazione è corretta? Considerate le medie e le diverse unità di misura delle distribuzioni: la distribuzione della statura presenta una maggiore variabilità relativa della distribuzione del Diam. biacromiale la distribuzione della statura presenta una maggiore variabilità relativa della distribuzione del Diam. torac. A-P la distribuzione del peso presenta la massima variabilità relativa nessuna delle affermazioni precedenti è corretta 6. Per una data popolazione distribuita normalmente si sa che lo scarto quadratico medio vale 14. Che dimensione deve avere un campione casuale da essa estratto affinchè l intervallo di confidenza al 95% abbia ampiezza pari a 10? Nota: ovviamente arrotondare il risultato all intero più vicino SOLUZIONE Ricordando che l intervallo di confidenza è centrato intorno alla media campionaria e che Z95%1,96 ho: 1,9614n5 da cui: n1,96 14530,118 30 7. Viene somministrato un presunto antipiretico a 6 pazienti. La temperatura viene misurata al momento della somministrazione e tre ore dopo. Per ogni paziente viene calcolata la differenza fra la temperatura prima e dopo la somministrazione del farmaco. Per verificare se l antipiretico è efficace quale test di confronto utilizzereste? T-test di Student per campioni indipendenti Test del Chi-Quadrato 0

Test Z per la differenza delle proporzioni T-Test di Student per dati appaiati 8. Se il valore della statistica nel confronto dell esercizio n.7 è 3,61, quale delle seguenti affermazioni è corretta? C è una riduzione significativa della temperatura (α0,01) Per un livello di significatività α0,05 l antipiretico non ha effetto La probabilità di errore nell affermare che l antipiretico è efficace è >0,05 La probabilità di errore nell affermare che l antipiretico è efficace è <0,0 9. La più piccola di 100 misurazioni è,83. Se il campo di variazione è 0,66 quanto vale la più grande delle misurazioni? 3,49,17 0,3 4,9 10. Il numero di morti cinque anni dopo bypass coronarico di un certo tipo fu 494 su 4000 malati, mentre in 133 controlli, paragonabili per gravità dei sintomi, che rifiutarono l operazione fu 309. Controllare se la differenza è significativa (α0,05) ovvero se l intervento riduce significativamente la mortalità. SOLUZIONE Morti Vivi Totale Pazienti 494 (53,7) 3505 (3476,8) 4000 Controlli 309 (79,8) 184 (1853,7) 133 Totale 803 5330 6133 χ494-53,7-0,553,73506-3476,8-0,53476,8309-79,8-0,579,8184-1853,7-0,51853,75,4 Poiché 5,4>3,841 il valore critico associato a 1 g.d.l. ed a un livello di significatività α0,05, rifiutiamo l ipotesi nulla di non differenza e affermiamo che l intervento di bypass coronarico riduce significativamente il numero di morti. 1