4. Statistical analysis. 2. Sample size calculation. 1. Epidemiologic study design. 3. Data quality and coding. Metropolitana del corso

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "4. Statistical analysis. 2. Sample size calculation. 1. Epidemiologic study design. 3. Data quality and coding. Metropolitana del corso"

Transcript

1 4. Statistical analysis 2. Sample size calculation l 1. Epidemiologic study design 3. Data quality and coding 5. Sounding interpretation it tti Metropolitana del corso

2 Argomenti trattati Statistica descrittiva Test statistici Stima per intervalli Misure epidemiologiche La regressione lineare Cenni introduttivi all analisi multivariata

3 Test statistici ed intervalli di confidenza Fabrizio Stracci

4 Il test statistico E uno strumento per valutare se vi è un effetto sistematico Non fornisce una risposta certa L ld dll f La validità delle risposte fornite dipende da alcuni assunti o condizioni che variano dal tipo di test adottato

5 Ingredienti del test Variabile bl di risposta misurata operativamente Variabile esplicativa (di cui vogliamo indagare l effetto) Ipotesi alternativa (H a ) Ipotesi nulla ( H 0 ) Errore alfa Stima dell effetto sistematico Stima della variabilità casuale Distribuzione teorica di probabilità

6 Ingredienti del test Variabile bl di risposta Variabile di risposta: e la quantità che misuriamo Variabile esplicativa per tutte le unità sperimentali. Variabile di risposta Variabile esplicativa Ipotesi alternativa (H a ) Ipotesi nulla ( H 0 ) Errore alfa Variabile esplicativa: determina la formazione dei Stima dell effetto gruppi da confrontare sistematico Stima della variabilità casuale Distribuzione ib i La natura dll della variabile ibil di risposta (quantitativa, i teorica di probabilità categoriale, dicotomica ) e quella della variabile di risposta influiscono sulla scelta del tipo di test

7 Ingredienti del test Variabile bl di risposta L i Lipotesi i alternativa o di lavoro afferma che la variabile ibil Variabile esplicativa esplicativa è associata, influenza direttamente o Ipotesi alternativa indirettamente, la variabile di risposta Variabile di risposta Variabile esplicativa Ipotesi alternativa (H a ) Ipotesi nulla ( H 0 ) Errore alfa L ipotesi nulla o di non effetto, all opposto, afferma che i Stima dell effetto valori assunti dalla variabile di risposta nelle sperimentali non differiscono tra i gruppi a confronto unità sistematico Stima della variabilità casuale Distribuzione ib i teorica di Il test statistico consiste in una valutazione della probabilità b probabilità di osservare i valori del campione* posto che l ipotesi nulla è vera *in realtà i valori osservati e i valori più improbabili rispetto all ipotesi nulla

8 Ingredienti del test V bl d L errore alfa, α, o di I tipo, consiste nel respingere l ipotesi nulla quando essa è vera Variabile di risposta Variabile esplicativa Ipotesi alternativa (Ha) Ipotesi nulla ( H 0 ) Errore alfa Stima dell effetto sistematico Stima della variabilità casuale E un tasso di errore che fissiamo arbitrariamente prima di effettuare il testt Distribuzione ib i teorica La definizione di errore di I tipo implica che esista di probabilità almeno un altro tipo di errore che potremmo definire di II tipo o beta (β)

9 Types of Errors Study's Conclusion True Effect (reject null hyp.) Reality True Effect Truth No Effect Type I or Alpha Error No Effect (don't reject null hyp.) Type II or Beta Error Truth

10 Ingredienti del test V bl d Il valore sperimentale del test di solito si basa sul rapporto tra queste due quantità, una misura (Ha) che esprime la dff differenza tra i gruppi a confronto e una misura che esprime la variabilità delle unità Stima dell effetto sistematico sperimentali indipendente d dal trattamento : Variabile di risposta Variabile esplicativa Ipotesi alternativa Ipotesi nulla ( H 0 ) Errore alfa Stima dell effetto Stima della variabilità casuale Distribuzione ib i teorica di probabilità segnale effetto _ sistematico disturbo errore

11 Ingredienti del test Variabile bl di risposta Variabile esplicativa Ipotesi alternativa (H a ) Ipotesi nulla ( H 0 ) Errore alfa Stima dell effetto sistematico Stima della variabilità casuale Distribuzione ib i teorica di probabilità

12 Assumere una distribuzione teorica di probabilità: implica una approssimazione ci consente di assegnare una probabilità al nostro risultato [la probabilità di osservare un risultato come il nostro* per effetto del caso su una serie infinita di ripetizioni] la distribuzione teorica assegna probabilità non nulla che qualsiasi risultato si verifichi per caso d l l h l quindi se vogliamo trarre una qualche conclusione dobbiamo stabilire arbitrariamente un valore limite (il tasso di errore alfa)

13 Risultato del test Punti critici. Utilizzando apposite tabelle o software, possiamo confrontare il valore sperimentale del test con il valore tabulare corrispondente all errore alfa prescelto Valore p. Possiamo ottenere direttamente da un programma la probabilità del nostro risultato sotto l ipotesi nulla: se tale probabilità p < α il test è significativo

14 il test t di Student: Si applica quando la variabile di risposta è quantitativa continua e Ne assume, tra l altro, la normalità della distribuzione Serve a confrontare due gruppi caratterizzati dalla variabile esplicativa, quella di cui vogliamo valutare l effetto (ad esempio trattamento A vs trattamento B)

15 FORMULAZIONE DELLE IPOTESI IPOTESI ALTERNATIVA = H a La media delle due popolazioni a confronto è diversa H a : µ A µ B TEST A DUE CODE La media della popolazione A è maggiore di quella della popolazione B H a : µ A >µ B TEST A UNA CODA La media della popolazione A è minore di quella della popolazione p B H a : µ A <µ B TEST A UNA CODA IPOTESI NULLA = H 0 La media delle due popolazioni è uguale H 0 : µ M = µ nm

16 Possibilities: Actual Situation H O is True H O is False Decision Reject H O Type I Error Correct decision II Do not reject H O Correct decision II Type II Error

17 Un esempio: il test t di Student per il confronto di due gruppi t = s p x A x B n n A B Effetto sistematico Variabilità casuale Se alcuni assunti sono verificati, possiamo calcolare s p come: s p = deva + dev n + n 2 A B B

18 Ignoriamo quale sia il valore effettivo del parametro =µ A µ B

19 Ignoriamo quale sia la variabilità σ A, σ B

20 Distribuzione t

21 Al crescere del numero dei casi la distribuzione t di Student tende a convergere con la distribuzione normale

22 Il valore p A differenza di alfa, il valore p dipende dai dati p corrisponde alla probabilità di osservare un valore sperimentale del test come quello osservato o più improbabile bil sotto l i ipotesi i nulla Quindi se l errore alfa è quello consueto, valori p<0.05 indicano un test significativo

23 Stimatore intervallare per (µ x -µ y ): Vl Valore t tabulare 1 1 ( x y) ± t α s + 2 ; 2 df p n x n y Errore standard della differenza tra le medie

24 Il test del chi-quadrato Si applica quando i dati in studio sono costituiti da frequenze o conteggi E un test non parametrico, non richiede l assunto della normalità

25 Variabile bl Risposta L1 Risposta L2 esplicativa* L1 f 11 f 12 R 1 L2 f 21 f 22 R 2 L3 f 31 f 32 R 3 L4 f 41 f 42 R 4 C 1 C 2 F Variabile di cui si vuole testare la relazione Totali marginali

26 I valori attesi H a µ Lj µ R H 0 µ R è indipendente dai livelli della variabile esplicativa Se H 0 è vera, allora i diversi i strati della variabile esplicativa differirebbero solo per effetto del caso. E la stessa distribuzione delle medie marginali è attesa sotto l ipotesi nulla entro ogni strato: e ij =R i *(C j / F)

27 Variabile Risposta L1 Risposta L2 esplicativa* L1 e 11 = R 1 *(C 1 / F) e 12 = R 1 *(C 2 / F) R 1 L2 e 21 e 22 R 2 L3 e 31 e 32 R 3 L4 e 41 e 42 = R 4 *(C 2 / F) R 4 C 1 C 2 F Mi aspetto la stessa quota (C 1 / F) entro ciascuna riga della Mi aspetto la stessa quota (C 1 / F) entro ciascuna riga della prima colonna e (C 2 / F) per la seconda colonna

28 Il valore sperimentale del chi-quadrato si calcola in base alla formula: cioè: ( f e ) 2 r c 2 ij ij Χ = e i= 1 j= 1 ij Effetto sistematico Variabilità casuale (Poisson) Χ 2 = (e f 11 ) /e 11 + (e 21 f 21 ) /e (e 42 f 42 ) 2 /e 42

29 La distribuzione chi-quadrato

30 Distribuzione chi Distribuzione chiquadrato

31 La formula per tabelle 2x2 e la correzione S di Yates A a b N A B c d N B N S N F N F

32 ANOVA Gruppo A Gruppo B Gruppo C X11 X12 X13 X21 X22 X23 X31 X32 X33 X41 X42 X43 Un generico elemento si indica come xij, dove i indica l elemento o la riga e j il gruppo o la colonna

33 ANOVA 2 Dev tot ( z k ( ) 2 x x ij = j= 1 i= 1 Dobbiamo suddividere l intera variabilità presente nei dati nelle due componenti che corrispondono all appartenenza ai gruppi e alla variabilità casuale

34 ANOVA 3 z k 2 = ( ) Dev x x entro j= 1 i= 1 La variabilità all interno di ciascun gruppo riflette la variabilità casuale Possiamo ricavare la Devianza tra gruppi come differenza tra la Devianza totale e quella entro gruppi ij j

35 La tabella ANOVA Fonti di variabilità Somma dei quadrati Gradi di libertà Totale N-1 Entro gruppi N-Z Tra gruppi Z-1 Medie dei quadrati Test F = Media dei quadrati tra gruppi / Media dei quadrati entro gruppi Confronto con F tabulare

36 Applicazione Studio trasversale dei volumi ecografici tiroidei nell eugubino

37 Obiettivo Studiare la distribuzione dei volumi tiroidei in una popolazione pp originariamente affetta da carenza di iodio recentemente sottoposta ad un intervento per la promozione dell uso di sale iodato Studiare la relazione tra volumi tiroidei e variabili come la familiarità, l uso riferito di sale iodato e la residenza in zona urbana (intervento+) o rurale (intervento-)

38 Journal of Endocrinological Investigation Vol. 29, November 2006 nr. 10 Evaluation of goiter using ultrasound criteria: A survey in a middle schoolchildren population of a mountain area in Central Italy C. Marino1, M. Martinelli2, G. Monacelli1, F. Stracci3, D. Stalteri4, V. Mastrandrea3, E. Puxeddu2, and F. Santeusanio2 1Centro Salute di Gubbio, U.S.L. no. 1 dell Umbria, Gubbio; 2Dipartimento di Medicina Interna; 3Dipartimenti di Specialità Medico Chirurgiche e Sanità Pubblica, Università degli Studi di Perugia, Perugia; 4Direzione Generale U.S.L. no. 1 dell Umbria, Città di Castello, Italy Iodine deficiency is still an important health care problem in the world. In Italy, as in most European countries, it is responsible for the development of mild to moderate endemic goiter. In 1995 we conducted a goiter survey vyin the Gubbio township, an area of Umbria region in Italy, close to the Appenine mountain chain. This study demonstrated a high prevalence of goiter in the middle schoolchildren population, indicating the presence of moderate endemic goiter. Soon after, a goiter prevention campaign aimed at implementing the consumption of iodinated salt was started. In 2001, a second survey was conducted in the middle schoolchildren hld (age yr old) of Gbb Gubbio and neighbour townships. Eight hundred d thirteen subjects were studied. Data obtained in 240 age-matched children, studied in the same area in 1995, were used for comparison to monitor changes 5 yr after the beginning of iodine prophylaxis. Thyroid volume was measured by ultrasonography. Gland volume was expressed in ml. A large population pp living in a iodine-sufficient area, previously reported by others, was used as control. Urinary iodine excretion was measured randomly in 20% of the children. The overall prevalence of goiter decreased between 1995 and 2001 from 29 to 8%. Goiter odds ratio (OR), corrected for age, was 4.0 (95% CI ) for 1995 compared to 2001 (p<0.000). Mean thyroid volume in the matched populations was 7.6±2.5 ml in 1995 and 5.7±2.1 ml in Mdi Median idi iodine urinary excretion increased from 72.6 to 93.5 microg/l, atthe limiti of statistical significance. Living in a rural area, no consumption of iodized salt and familiarity for goiter represented independent risk factors for goiter development. This study was the first conducted in Umbria region and confirmed that an implementation campaign for iodized salt consumption is a simple and useful instrument to prevent endemic goiter and related diseases. A new survey to evaluate goiter prevalence in the same area 10 yr after the beginning of iodine prophylaxis is already planned. (J. Endocrinol. Invest. 29: , 2006)

39 Ecco come appaiono le prime osservazioni nel nostro database

40 Std. Dev = 1.63 Mean = 5 0 N = volume tiroideo (ml) Distribuzione dei volumi tiroidei in un campione rappresentativo costituito da 323 individui di età compresa tra 11 e 14 anni con curva normale sovrapposta

41

42

43 Da un precedente studio apprendiamo che il volume tiroideo medio per una popolazione simile a quella in studio ma caratterizzata da un apporto adeguato di iodio è 5.19 ml (µ 0 ). La stima campionaria del parametro µ eu, volume tiroideo medio nell area precedentemente gozzigena, ottenuta nel nostro studio è m eu = 5.09 ml. Costruiamo un test t fissando il tasso di errore α=0.05.

44 H a : Il volume tiroideo nell area già ad endemia gozzigena è diverso rispetto all area di controllo H 0 : Il volume tiroideo medio è lo stesso nell area già ad endemia gozzigena e nell area di controllo o la differenza tra le medie dei volumi è pari a 0. Il valore sperimentale del test è x µ 0 x µ t = = = = s SE x n 307

45 t tabulare per 321 gl e α =0.05 è pari a 1.960; poiché <1.96 non abbiamo evidenza sufficiente per respingere l i lipotesi i nulla che il volume tiroideo id medio è lo stesso nelle due zone (test non significativo) alternativamente possiamo riportare il valore p = o 66.5% di osservare un risultato come quello attuale o più estremo sotto l assunto che l ipotesi nulla sia vera.

46 Alcuni problemi dei test di ipotesi Il test è incentrato sull ipotesi nulla e quindi non fornisce alcuna informazione sulla probabilità del risultato osservato. In altre parole il test non ci informa sulla probabilità bili che il parametro diff differenza tra volume medio della tiroide nelle due popolazioni sia pari a 0.4 ml rispetto ad altre differenze possibili come 0.1, 0.5 e così via. Il risultato del test tiene conto del valore osservato e di valori più estremi (non osservati) rispetto al valore di riferimento dell ipotesi nulla. Il risultato del test non fornisce alcuna informazione sulla entità dell effetto del fattore di confronto. Un test può risultare significativo solo per il gran numero di osservazioni (ad esempio per individui anziché 323, la stessa differenza di volume di soli 0.4 ml ha un p<0.0000). Quindi il test non ci consente di distinguere effetti rilevanti da effetti quantitativamente irrilevanti.

47 Area Controllo Studio Volume tiroideo medio (ml) Intervallo di confidenza al 95% costruito attorno alla media dei volumi tiroidei

48 Consideriamo ora il confronto tra volumi tiroidei per i residenti in aree urbane e i residenti in aree rurali Volume tiroide eo (ml) N= rurale urbana Residenza Scatola con baffi che illustra la distribuzione ib i dei volumi tiroidei id i in base alla residenza. La scatola è suddivisa dai tre quartili e i baffi contengono 15 1,5 volte lintervallo l i ll interquartile. il I punti rappresentano osservazioni i estreme o outliers.

49 Il volume tiroideo medio per i residenti in aree urbane è 4.8 (DS 1.5) con 187 gl, e, per i residenti in aree rurali, 5.4 (DS 1.8) con 134 gl. Il valore sperimentale del test t risulta pari a assumendo varianze eguali. Quindi per 321 gl e α=0.05, test a due code, il risultato è significativo p<0.05. Precisamente p =

50 Lo stimatore puntuale è: x rurale x urbano = 0.55 ml L intervallo di confidenza ad un livello ll arbitrariamente stabilito (convenzionalmente 95%)per il parametro di interesse, differenza tra le medie dei volumi tiroidei nei residenti urbani e rurali, si calcola come segue: I. calcolo di una stima congiunta della variabilità nei due gruppi: s = pool = 2 ( n 1) s + ( n 1) urbano urbano 187 * * n urbano rurale + n 2 rurale = s 2 rurale =

51 II. calcolo l l errore standard d del parametro: ES x urb x rur = s pool n 1 urbana + n 1 rurale = * = III. trovo il valore t tabulare per un errore 1-α/2 e 321 gl = 1.96 IV. calcolo il fattore di errore: FE = t [0.025, 321] * ES= =1.960*0.182= V il f di d l (0 6 l) V. sommo e sottraggo il fattore di errore dal parametro (0.6 ml) trovando un intervallo al 95% che va da 0.2 ml a 0.9 ml.

52 Alcuni vantaggi dell impiego degli stimatori intervallari L intervallo di confidenza conserva l informazione contenuta nel test di significatività: se l intervallo contiene il valore nullo del parametro, allora un test di ipotesi sarebbe risultato non significativo e viceversa. L intervallo di confidenza è espresso in ml come la differenza tra i volumi laddove il risultato del test non ha dimensione; questo ci consente di osservare che la differenza media in base ai dati è compatibile con una differenza molto piccola (0.2 ml) ma anche con una sensibile (0.9 ml). Quindi l intervallo di confidenza ci consente di valutare se la differenza osservata è biologicamente rilevante oltreché valutarne la significatività statistica. L attenzione non è incentrata sulla significatività statistica e ciò aiuta ad evitare di trarre conclusioni dicotomiche (positivo/negativo).

53 Sono possibili le seguenti situazioni: L intervallo di confidenza contiene il valore nullo ed entrambi gli estremi non sono clinicamente i rilevanti: lo studio esclude un effetto rilevante della variabile considerata (conclusiivo). L intervallo di confidenza contiene il valore nullo ma almeno un estremo include valori clinicamente importanti: i risultati dello studio non ci consentono di trarre conclusioni; si evidenzia l opportunità di ripetere lo studio con un campione di maggiori dimensioni. (non conclusiivo).. L intervallo di confidenza non include il valore nullo del parametro ma l estremo superiore non include effetti clinicamente importanti: sebbene statisticamente significativo, lo studio esclude un effetto rilevante del fattore in studio (non conclusiivo).. L intervallo di confidenza non include il valore nullo del parametro e gli effetti compatibili con i risultati (valori interni all intervallo) sono rilevanti: lo studio indica un effetto importante del fattore in studio (conclusiivo)..

54 Consideriamo la prevalenza di gozzo registrata nello studio p gozzo =8/323=2.48 Possiamo ricavare un intervallo di confidenza per questa proporzione utilizzando l approssimazione normale. Nella formula per l errore standard sostituiamo la varianza binomiale p(1-p): ES = p (1 n p ) = ( ) 323 = L intervallo approssimato al 95% va da *0.0086=0.008 a , cioè da circa 0.8% a 4,2%. Per campioni piccoli e per valori p lontani da 0.5, come in questo caso, l approssimazione normale non è accurata ed è preferibile utilizzare metodi cosiddetti esatti (utilizzando l intervallo di Fisher da 1.1% a 4.8%).

55 Gozzo Tiroidi normali e patologiche Residenza Urbana Rurale Totale Presente Assente Totale Test di indipendenza. Chi quadrato p Chi-quadrato correzione di Yates p Esatto di Fisher 0.022

56 In termini di Rischio relativo Al denominatore abbiamo gli individui id i presenti e non gli anni-persona P(gozzo residenza rurale)=r rur = casi rur / n rur = =7/135 = R urb = 1/188 = Il rapporto tra i rischi esprime quante volte sia più probabile essere affetto da gozzo per uno studente residente in area rurale rispetto all area area urbana RR = R rur / R urb = / = 9.75

57 Residenza Gozzo Presente Assente Rurale a b Urbana c d In termini di Odds Ratio Gli odds sono i rapporti tra una proporzione p e il suo complemento a 1 (1-p). Per i rurales: Odds rur = p gozzo rur /1- p gozzo rur = a/c=7/128= l odds di gozzo tra i residenti rurali è 1 a 18 Un analogo calcolo per i residenti urbani fornisce Odds urb = Il rapporto tra gli odds è Odds rur /Odds urb =0.055/0.0054=10.23 OR è una misura di effetto, di associazione autonoma e uno stimatore del RR la cui validità dipende dalla rarità dell e evento ento in studio

58 Rischio relativo Odds ratio

59 Intervalli di confidenza per RR Calcoliamo l errore standard per il rischio relativo per il logaritmo ln(rr)=2.28 per rendere maggiormente simmetrica la distribuzione: ES ln( RR) c d a n + b n = = urb L intervallo consueto al 95% si ottiene esponenziando gli estremi: rur ( ) IC inf = exp = 1.21 L intervallo al 95% va da 1.2 a Utilizzando una formula alternativa basata sul chi-quadrato otteniamo un intervallo da 1.8 a 57.1

60 Intervalli di confidenza per OR Anche per OR è preferibile calcolare l un intervallo su scala logaritmica, ln(or)=2.325: ES ln( OR) a + b + c + d = = Come per RR è necessario esponenziare gli estremi dell intervallo IC inf =exp[2.325-(1.96*1.075)]= e IC sup =exp[2.325+(1.96*1.075)]=84.13 Quindi l intervallo ll di confidenza al 95% per OR va da 1.2 a 84.1 Per questo evento raro i due intervalli (OR e RR) sono in buon accordo

61

62 re] p[goit Iodized salt use never sometimes always Residence urban rural urban rural Familiarity no no yes yes

63

64 3. Statistical analysis Statistiche i descrittive i e intervallo di confidenza Test statistici Misure epidemiologiche Test diagnostici i Regressione lineare Analisi di sopravvivenza Modelli per dati longitudinali Dati mancanti Regressione logistica Riduzione i dei dati Modelli gerarchici

65 IC esatto per SIR/SMR Assumo distribuzione di Poisson Trovo i limiti inferiore I e superiore S per i casi C o i decessi D osservati Calcolo l i rapporti I/E e S/E dove E sono i casi o i decessi attesi

66 Obiettivi del corso Convenire una base di conoscenze omogenea per la formazione di un gruppo di professionisti che a vario titolo contribuirà allo sviluppo dell epidemiologia regionale Individuare bisogni formativi specifici da soddisfare Verificare gli interessi attuali in campo epidemiologico- statistico e prospettare strategie

67 Misure di frequenza Proporzioni i (proportion): frazioni i in cui il numeratore è contenuto nel denominatore Rapporti (ratio): frazioni in cui il numeratore non è contenuto nel denominatore Tassi (rate): velocità di comparsa di un fenomeno in un tempo determinato che si misura come rapporto tra numero di eventi e anni persona di esposizione

68 Intervalli di confidenza per RR Calcoliamo l errore standard per il rischio relativo per il logaritmo ln(rr)=2.28 per rendere maggiormente simmetrica la distribuzione: ES ln( RR) c d ln ln a n + b n = = urb L intervallo consueto al 95% si ottiene esponenziando gli estremi: rur ( ) IC inf = exp = 8.7 L intervallo al 95% va da 8.7 a 11.0

69 Intervalli di confidenza per OR Anche per OR è preferibile calcolare l un intervallo su scala logaritmica, ln(or)=2.325: ES ln( OR) ln ln a + b + c + d = = Come per RR è necessario esponenziare gli estremi dell intervallo IC inf =exp[2.325-(1.96*0.072)]= )] 9 e IC sup =exp[2.325+(1.96*0.072)]=11.8 Quindi l intervallo ll di confidenza al 95% per OR va da 8.9 a 11.8 Per questo evento raro i due intervalli (OR e RR) sono in buon accordo

70 La prevalenza (unità sperimentali che hanno una caratteristica sul totale delle unità esaminate) è una proporzione

71 Misure di associazione Rischio relativo (Risk ratio or Relative risk) Rapporto tra odds (Odds ratio). Differenza tra rischi Rischio attribuibile e rischio attribuibile di popolazione

72

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza Università del Piemonte Orientale Corsi di laurea triennale di area tecnica Corso di Statistica Medica Analisi dei dati in tabelle di contingenza Corsi di laurea triennale di area tecnica - Corso di Statistica

Dettagli

è decidere sulla verità o falsità

è decidere sulla verità o falsità I test di ipotesi I test di ipotesi Il test delle ipotesi consente di verificare se, e in quale misura, una determinata ipotesi (di carattere sociale, biologico, medico, economico, ecc.) è supportata dall

Dettagli

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano

Dettagli

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica Università del Piemonte Orientale Corso di Laurea in Igiene Dentale Corso di Statistica per la ricerca sperimentale e tecnologica Analisi dei dati in tabelle di contingenza Corso di laurea triennale di

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione in base ad informazioni ricavate da un campione. Inferenza statistica: indurre

Dettagli

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie Università del Piemonte Orientale Corso di dottorato in medicina molecolare aa 2002 2003 Corso di Statistica Medica Inferenza sulle medie Statistica U Test z Test t campioni indipendenti con uguale varianza

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corsi di Specialità Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea in biotecnologie

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Elaborazione dati in Analisi Sensoriale

Elaborazione dati in Analisi Sensoriale Elaborazione dati in Analisi Sensoriale Si è parlato di interpretazione corretta dei risultati ottenuti; a questo concorrono due fattori: affidabilità e validità. Se i test fossero stati ripetuti con lo

Dettagli

Igiene. Dott. Pamela Di Giovanni. Definizione

Igiene. Dott. Pamela Di Giovanni. Definizione Igiene Dott. Pamela Di Giovanni Definizione Disciplina medica che ha come obiettivo la tutela e la promozione della salute umana, intendendo per salute umana un completo stato di benessere psichico, fisico

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Statistica Medica. Verranno presi in esame:

Statistica Medica. Verranno presi in esame: Statistica Medica Premessa: il seguente testo cerca di riassumere e rendere in forma comprensibile ai non esperti in matematica e statistica le nozioni e le procedure necessarie a svolgere gli esercizi

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Corso di Statistica Medica 2004-2005 Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Sono previste 30 ore di lezione di statistica e 12 di

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

4. Confronto tra medie di tre o più campioni indipendenti

4. Confronto tra medie di tre o più campioni indipendenti BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

ANALISI DEI DATI EPIDEMIOLOGICI

ANALISI DEI DATI EPIDEMIOLOGICI ANALISI DEI DATI EPIDEMIOLOGICI Cenni di statistica Che cosa è la statistica Statistica descrittiva e statistica inferenziale Test statistici di ipotesi Intervalli di confidenza Analisi stratificata TEST

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Corso di Statistica Medica Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Sono previste 40 ore complessive, di cui almeno 16 di lezione frontale e le restanti

Dettagli

Concetto di potenza statistica

Concetto di potenza statistica Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1 Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

Relazioni tra variabili

Relazioni tra variabili Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina

Dettagli

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per categoriali. Alessandro Valbonesi

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per categoriali. Alessandro Valbonesi LEZIONI DI STATISTCA APPLICATA Parte 2 Statistica inferenziale Variabili continue per categoriali Alessandro Valbonesi SARRF di Scienze ambientali Anno accademico 2010-11 CAPITOLO 4 - TEST STATISTICI CHE

Dettagli

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente:

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente: T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente: t = X i X j s 2 i (n i 1) + s 2 j (n j 1) n i + n j - 2 1

Dettagli

Misure di Associazione

Misure di Associazione Misure di Associazione Prof. Tommaso Staniscia Introduzione Esposizione e Malattia Esposizione (E) = variabile esplicativa Qualsiasi agente, ospite, o fattore ambientale che può avere un effetto sulla

Dettagli

Natura dei dati e della statistica

Natura dei dati e della statistica INDICE SEZIONE PRIMA Natura dei dati e della statistica 1 Le basi 2 Statistica: ma a che serve? 2 Statistica descrittiva e statistica inferenziale 2 Variabili 3 Tipi di dati 3 Dati discreti e dati continui

Dettagli

Gli studi caso. controlli. Obiettivi. Stime del rischio. Ne deriva la Tabella 2x2

Gli studi caso. controlli. Obiettivi. Stime del rischio. Ne deriva la Tabella 2x2 Gli studi caso controllo Obiettivi Negli ultimi decenni questo modello di indagine è stato applicato soprattutto per lo studio delle malattie cronicodegenerative (le più frequenti cause di morte in tutti

Dettagli

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA)

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) 4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) L analisi della varianza è un metodo sviluppato da Fisher, che è fondamentale per l interpretazione statistica di molti dati biologici ed è alla

Dettagli

Elementi di Psicometria

Elementi di Psicometria Elementi di Psicometria E2-Riepilogo finale vers. 1.2 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia) ElemPsico 2010-2011

Dettagli

Teoria della Stima. Stima della Media e di una Porzione di Popolazione. Introduzione. Corso di Laurea in Scienze Motorie AA2002/03 - Analisi dei Dati

Teoria della Stima. Stima della Media e di una Porzione di Popolazione. Introduzione. Corso di Laurea in Scienze Motorie AA2002/03 - Analisi dei Dati Teoria della Stima. Stima della Media e di una Porzione di Popolazione Introduzione La proceduta in base alla quale ad uno o più parametri di popolazione si assegna il valore numerico calcolato dalle informazioni

Dettagli

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO Pasquale Iandolo Laboratorio analisi ASL 4 Chiavarese, Lavagna (GE) 42 Congresso Nazionale SIBioC Roma

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Analisi statistica di dati biomedici Analysis of biologicalsignals II Parte Verifica delle ipotesi (a) Agostino Accardo (accardo@units.it) Master in Ingegneria Clinica LM in Neuroscienze 2013-2014 e segg.

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

Diaz - Appunti di Statistica - AA 2001/2002 - edizione 29/11/01 Cap. 3 - Pag. 1 = 1

Diaz - Appunti di Statistica - AA 2001/2002 - edizione 29/11/01 Cap. 3 - Pag. 1 = 1 Diaz - Appunti di Statistica - AA 2001/2002 - edizione 29/11/01 Cap. 3 - Pag. 1 Capitolo 3. L'analisi della varianza. Il problema dei confronti multipli. La soluzione drastica di Bonferroni ed il test

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

Test di Ipotesi Intervallo di confidenza Rossella Baldini

Test di Ipotesi Intervallo di confidenza Rossella Baldini Inferenza Statistica Test di Ipotesi Intervallo di confidenza Rossella Baldini 1 Statistiche o Statistica? Le statistiche mediche sono affermazioni numeriche di contenuto medico: Quante persone ogni anno

Dettagli

3) ANALISI DEI RESIDUI

3) ANALISI DEI RESIDUI 3) ANALISI DEI RESIDUI Dopo l analisi di regressione si eseguono alcuni test sui residui per avere una ulteriore conferma della validità del modello e delle assunzioni (distribuzione normale degli errori,

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

Classificazione degli studi epidemiologici

Classificazione degli studi epidemiologici Classificazione degli studi epidemiologici STUDI DESCRITTIVI - DI CORRELAZIONE O ECOLOGICI - CASE REPORT/SERIES - DI PREVALENZA O TRASVERSALI STUDI ANALITICI O OSSERVAZIONALI - A COORTE - CASO-CONTROLLO

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

22.03.07 In alcuni casi è possibile applicare sia l analisi log lineare che la regressione logistica. Analisi log lineare e regressione logistica:

22.03.07 In alcuni casi è possibile applicare sia l analisi log lineare che la regressione logistica. Analisi log lineare e regressione logistica: .03.07 In alcuni casi è possibile applicare sia l analisi log lineare che la regressione logistica. Analisi log lineare e regressione logistica: differenze Nella regressione logistica le variabili vengono

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Il controllo delle prestazioni del provider. IL CONTROLLO DELLE PRESTAZIONI DEL PROVIDER (riferimenti)

Il controllo delle prestazioni del provider. IL CONTROLLO DELLE PRESTAZIONI DEL PROVIDER (riferimenti) del provider IL CONTROLLO DELLE PRESTAZIONI DEL PROVIDER (riferimenti) 1 del provider - premessa (1) in merito alla fase di gestione ordinaria dell outsourcing sono state richiamate le prassi di miglioramento

Dettagli

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui

Dettagli

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione

Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Microeconometria (Silvia Tiezzi) 01 aprile2011 Esercitazione Esercizio 1 Si consideri il seguente modello ad effetti fissi con variabili binarie: + 1 2 a) supponete che N=3. Si mostri che i regressori

Dettagli

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. I valori stimati sono variabili aleatorie. Teorema del limite centrale

Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. I valori stimati sono variabili aleatorie. Teorema del limite centrale I risultati di un esperimento sono variabili aleatorie. Un esperimento non consente di esaminare ogni elemento di una popolazione o di effettuare tutte le misure possibili. campione , sx Stime Popolazion

Dettagli

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza Titolo della lezione Analisi dell associazione tra due caratteri: indipendenza e dipendenza Introduzione Analisi univariata, bivariata, multivariata Analizzare le relazioni tra i caratteri, per cercare

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

Sinossi dei disegni di studio

Sinossi dei disegni di studio Sinossi dei disegni di studio di intervento osservazionali serie di casi trasversale ecologici individuali quasisperimentali sperimentali (RCT) coorte caso-controllo Studi caso-controllo Il punto di partenza

Dettagli

La statistica nella ricerca scientifica

La statistica nella ricerca scientifica La statistica nella ricerca scientifica Pubblicazione dei risultati Presentazione dei dati e la loro elaborazione devono seguire criteri universalmente validi Impossibile verifica dei risultati da parte

Dettagli

In una tabella 2 x 2 il valore del chiquadrato, che quantifica la differenza fra i numero osservati e quelli attesi, è la somma delle quattro celle

In una tabella 2 x 2 il valore del chiquadrato, che quantifica la differenza fra i numero osservati e quelli attesi, è la somma delle quattro celle Test statistici il chi quadrato Valutare la differenza tra due percentuali o proporzioni L'ipotesi zero (o ipotesi nulla) afferma che la differenza osservata - di qualsiasi entità essa sia - è dovuta al

Dettagli

Regressione Logistica: un Modello per Variabili Risposta Categoriali

Regressione Logistica: un Modello per Variabili Risposta Categoriali : un Modello per Variabili Risposta Categoriali Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 1 / 54 Introduzione Premessa I modelli di regressione

Dettagli

Prelazione. Lista delle Figure. Lista delle Tabelle

Prelazione. Lista delle Figure. Lista delle Tabelle Indice Prelazione Indice Lista delle Figure Lista delle Tabelle VI IX XV XVI 1 Nozioni Introduttive 1 1.1 Inferenza Statistica 1 1.2 Campionamento 5 1.3 Statistica e Probabilità 7 1.4 Alcuni Problemi e

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Elementi di Epidemiologia

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Elementi di Epidemiologia Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Elementi di Epidemiologia Corsi di Laurea Triennale Corso di Statistica e Biometria: Elementi di epidemiologia

Dettagli

Elaborazione dei dati su PC Regressione Multipla

Elaborazione dei dati su PC Regressione Multipla 21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione

Dettagli

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di

Dettagli

Metodologia epidemiologica

Metodologia epidemiologica Metodologia epidemiologica Verifica di ipotesi Quale test utilizzare? Statistica medica Alla fine di questa lezione dovreste essere in grado di: riconoscere i principali test utilizzati nel confronto di

Dettagli

Statistica nelle applicazioni sanitarie

Statistica nelle applicazioni sanitarie Dipartimento di Fisica Scuola di Specializzazione in Fisica Medica A.A. 0/03 Statistica nelle applicazioni sanitarie Maria Roberta Monge: Roberta.Monge@ge.infn.it Epidemiologia Classica: studia le origini

Dettagli

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107 t-test test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie Calcola medie e altre statistiche

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p

Dettagli

Matlab per applicazioni statistiche

Matlab per applicazioni statistiche Matlab per applicazioni statistiche Marco J. Lombardi 19 aprile 2005 1 Introduzione Il sistema Matlab è ormai uno standard per quanto riguarda le applicazioni ingegneristiche e scientifiche, ma non ha

Dettagli

Analisi statistica degli errori

Analisi statistica degli errori Analisi statistica degli errori I valori numerici di misure ripetute risultano ogni volta diversi l operazione di misura può essere considerata un evento casuale a cui è associata una variabile casuale

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

Problema pratico: Test statistico = regola di decisione

Problema pratico: Test statistico = regola di decisione La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stima puntuale per la proporzione Da un lotto di arance se ne estraggono 400, e di queste 180

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

Protocollo dello studio

Protocollo dello studio Protocollo dello studio Indagine su disturbi e malattie respiratorie e fattori ad essi correlati nella popolazione infantile residente nell area di S. Polo e nel resto del comune di Brescia Premessa A

Dettagli

INTRODUZIONE ALL ANALISI DEI DATI DI SOPRAVVIVENZA

INTRODUZIONE ALL ANALISI DEI DATI DI SOPRAVVIVENZA INTRODUZIONE ALL ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona DISEGNO DI COORTE ESPOSTI (D 1 OUTCOME NON ESPOSTI

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Introduzione Livelli di significatività Verifica di ipotesi sulla media di una popolazione normale Verifica di ipotesi sulla varianza di una popolazione normale Verifica di ipotesi

Dettagli

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Politecnico di Milano - Anno Accademico 2010-2011 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Politecnico di Milano - Anno Accademico 200-20 Statistica 086449 Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo Esercitazione 9 2 Giugno 20 Esercizio. In un laboratorio per il test dei materiali,

Dettagli

La misurazione multidimensionale della povertà di conoscenza. Un applicazione al caso italiano.

La misurazione multidimensionale della povertà di conoscenza. Un applicazione al caso italiano. «Concorso di Idee Invalsi» Roma, 9-10 Dicembre 2014 La misurazione multidimensionale della povertà di conoscenza. Un applicazione al caso italiano. Larysa Minzyuk Ifel - Istituto per la Finanza e le Economie

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525.

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525. UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 15 dicembre 2014 7 LEZIONE PROBABILITA L incertezza Nella misura di una qualsiasi

Dettagli

Appunti: Teoria Dei Test

Appunti: Teoria Dei Test Appunti: Teoria Dei Test Fulvio De Santis, Luca Tardella e Isabella Verdinelli Corsi di Laurea A + E + D + G + R 1. Introduzione. Il test d ipotesi è un area dell inferenza statistica in cui si valuta

Dettagli

GUIDA PER LA VALUTAZIONE E LA ESPRESSIONE DELL INCERTEZZA NELLE MISURAZIONI

GUIDA PER LA VALUTAZIONE E LA ESPRESSIONE DELL INCERTEZZA NELLE MISURAZIONI SISTEMA NAZIONALE PER L'ACCREDITAMENTO DI LABORATORI DT-000 GUIDA PER LA VALUTAZIONE E LA ESPRESSIONE DELL INCERTEZZA NELLE MISURAZIONI INDICE parte sezione pagina 1. INTRODUZIONE. FONDAMENTI.1. Misurando,

Dettagli

Indice Prefazione xiii 1 Probabilità

Indice Prefazione xiii 1 Probabilità Prefazione xiii 1 Probabilità 1 1.1 Origini del Calcolo delle Probabilità e della Statistica 1 1.2 Eventi, stato di conoscenza, probabilità 4 1.3 Calcolo Combinatorio 11 1.3.1 Disposizioni di n elementi

Dettagli

METODOLOGIA DELLA RICERCA 4 Scelta del disegno

METODOLOGIA DELLA RICERCA 4 Scelta del disegno METODOLOGIA DELLA RICERCA 4 Scelta del disegno Prof. Paolo Chiari Dipartimento di Scienze Mediche e Chirurgiche Università di Bologna STUDIO CLINICO STUDIO CLINICO: esperimento rigorosamente controllato

Dettagli

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni Statistica Economica Materiale didattico a cura del docente Analisi dei residui Test Esatto di Fisher Differenza fra proporzioni 1 Analisi dei residui Il test statistico ed il suo p-valore riassumono la

Dettagli

A.A. 2014-2015. Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE

A.A. 2014-2015. Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE A.A. 2014-2015 Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE Utilizzare gli strumenti epidemiologici e statistici appropriati per ridurre l'area dell'incertezza nella rilevazione

Dettagli

1 BREVE RIPASSO DEI TEST STATISTICI 2 I TEST STATISTICI NEI SOFTWARE ECONOMETRICI E IL P-VALUE 3 ESERCIZI DI ALLENAMENTO

1 BREVE RIPASSO DEI TEST STATISTICI 2 I TEST STATISTICI NEI SOFTWARE ECONOMETRICI E IL P-VALUE 3 ESERCIZI DI ALLENAMENTO I TEST STATISTICI E IL P-VALUE Obiettivo di questo Learning Object è ripassare la teoria ma soprattutto la pratica dei test statistici, con un attenzione particolare ai test che si usano in Econometria.

Dettagli

ESAME DI STATISTICA Nome: Cognome: Matricola:

ESAME DI STATISTICA Nome: Cognome: Matricola: ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli

Dettagli

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL

Dettagli

LE META-ANALISI. Graziella D Arrigo, Fabio Provenzano, Claudia Torino, Carmine Zoccali, Giovanni Tripepi

LE META-ANALISI. Graziella D Arrigo, Fabio Provenzano, Claudia Torino, Carmine Zoccali, Giovanni Tripepi G Ital Nefrol 2011; 28 (5): 531-536 MASTER IN EPIDEMIOLOGIA CLINICA LE META-ANALISI Graziella D Arrigo, Fabio Provenzano, Claudia Torino, Carmine Zoccali, Giovanni Tripepi CNR-IBIM, Unità di Ricerca di

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli