Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva

Documenti analoghi
Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica e Biometria

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. a.a Corso di Statistica Medica. Statistica Descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

Statistica. Lezione 1

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

Distribuzioni di frequenza di due variabili

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche

Principi di Statistica Descrittiva (2)

INTRODUZIONE ALLA STATISTICA

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Matematica Lezione 21

CORSO DI STATISTICA MEDICA Prof. Enzo Ballone

d) Disegnare l istogramma del numero di neonati per classe di peso alla nascita

-Validità di un test diagnostico: Sensibilità e Specificità

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

Dott.ssa Marta Di Nicola

Le rappresentazioni grafiche

STATISTICA 1 ESERCITAZIONE 2

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

ESPLORAZIONE DEI DATI (parte 1) 1 / 21

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Distribuzioni e rappresentazioni grafiche

Esercitazioni di statistica

Prof.ssa M. Di Nicola

Laboratorio di matematica: processamento, interpretazione ed elaborazione dei dati

08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA

LA STATISTICA

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Distribuzione di frequenza e rappresentazioni grafiche

Statistica. Lezioni: 5, 6. Statistica Descrittiva Univariata 2

Rappresentazioni grafiche

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Matematica ed elementi di statistica Corso di laurea in Scienze e tecnologie per i beni culturali - a.a Esercizi 12: Statistica Descrittiva

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

Statistica. Statistica descrittiva. GRAFICI e INDICI

Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie

Statistica. Alfonso Iodice D Enza

LA STATISTICA. Dott.ssa Marta Di Nicola 1.

Dott.ssa Marta Di Nicola 1

Statistica. Campione

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.

Esercitazioni di Statistica: ES.1.1

La statistica descrittiva prima parte. a cura della prof.ssa Anna Rita Valente

Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli

María Eugenia Castellanos. Cagliari, Marzo 2010

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di osservazioni.

Concetti base - Classificazione dei caratteri. Antonello Maruotti

3) In una distribuzione di frequenza si può ottenere più di una moda Vero Falso

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

Elementi di Statistica

Lezione I: Introduzione. La statistica. Nell analisi statistica si può individuare una: Prof. Enzo Ballone

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano.

ESERCITAZIONI N. 1 Corso di Statistica

Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli. Esercizio 1

CONCETTI CHIAVE DELLA STATISTICA

Statistica Descrittiva - Lezione 1

ESERCIZI DI STATISTICA SOCIALE

Prof. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di frequenza e rappresentazione grafica

Unità Carattere Modalità

Distribuzione di Frequenza: Esempio

Esercizi. Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1,

Scale di Misurazione Lezione 2

Titolo della lezione. Introduzione

Capitolo 2. Organizzazione dei dati in forma tabellare e grafica. Statistica. Levine, Krehbiel, Berenson

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Rilevazione (Raccolta) Dati: Raccolta Campionaria e Raccolta Globale

Le rappresentazioni grafiche

Statistica Medica ed Epidemiologia

STATISTICA NOZIONI DI BASE

1.1 CLASSIFICAZIONE DI VARIABILI

Cognome e nome. 2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 129; 134; 142; 128; 146

Elementi di statistica medica

Lezione n. 1 _Complementi di matematica

Nota dell editore Presentazione

I principali tipi di grafici

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

materiale didattico II incontro

Statistica e informatica

13/04/2015. x k (X + Y) Il numeratore non è necessariamente incluso nel denominatore. Tassi standardizzati

Teoria e tecniche dei test. Concetti di base

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

LEZIONI DI STATISTICA MEDICA

Elementi di statistica medica

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

Lo scarto quadratico medio è s = s 2 2,15. c) Le confezioni con peso inferiore a 500g sono 18, quindi in percentuale sono 18 = 0,72 = 72%.

Distribuzioni statistiche

Statistica del turismo. Indice. 1. Premessa La compilazione di un grafico La rappresentazione di mutabili... 5

Statistica descrittiva Statistica inferenziale

RICHIESTA DI RICOVERO IN HOSPICE

Transcript:

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Statistica Descrittiva Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 1

I dati costituiscono la materia prima su cui lavora lo statistico. I dati vengono forniti dai soggetti che sono coinvolti nella ricerca. I dati vengono raccolti, elaborati e sintetizzati al fine di ottenere: - un messaggio sintetico (statistica descrittiva) - leggi generali ottenute da un numero limitato di osservazioni ma valide per tutti i soggetti con caratteristiche analoghe (statistica inferenziale). Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 2

Tipi di dati - Categorici Binari Nominali Ordinali - Quantitativi o numerici Attenzione: Il tipo di dato condiziona la scelta del metodo statistico! Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 3

Dati categorici Binari presentano due soli valori: presente (codificato di regola come 1) ed assente (codificato di regola come 0). [P&G, Tab.2.1] Nominali Ordinali Solo classificazione, senza ordinamento Es sesso, specie, area geografica, scuola, tipo istologico, tipo di neoplasia, codice di malattia, immunofenotipo di leucemia.. Classificazione con ordinamento, ma distanza tra i valori non misurabile o ignota Es. Punteggio scolastico, valutazione clinica di gravità di un sintomo, codice TNM, punteggio APGAR. Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 4

Esempio di dati ordinali: Graduazione del performance status proposto dall Eastern Cooperative Oncology Group / ECOG. Grado Descrizione 0 Paziente fisicamente attivo, in grado di svolgere senza restrizioni la normale attività preterapia. 1 Paziente limitato nell attività fisica massima; può essere seguito in ambulatorio e svolgere un lavoro di entità leggera o di tipo sedentario. 2 Paziente in grado di accudire se stesso, ma incapace di svolgere ogni attività lavorativa. Resta alzato per più del 50% delle ore di veglia. 3 Paziente in grado di accudire se stesso solo parzialmente e costretto a letto o seduto per più del 50% delle ore di veglia 4 Paziente inabile, costretto permanentemente a letto o seduto e non più in grado di accudire a se stesso. 5 Paziente morto Fonte: Oken MM et al. Toxicity and response criteria of the Eastern Cooperative Oncology Group. Am J Clin Oncol 5: 649-655; 1982. Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 5

Esempio di dati ordinali: Graduazione del performance status secondo Karnofsky Capace di esplicare attività 100 Normale. Non ha sintomi o segni di malattia normale e di lavorare. Non è 90 Capace di attività normale. Lievi sintomi o segni di malattia necessaria alcuna particolare 80 Attività normale con sforzo. Alcuni sintomi o segni di malattia assistenza. Incapace di lavorare. In grado 70 Può accudire se stesso. Incapace di condurre attività normale o di vivere a casa e di occuparsi lavoro attivo. delle proprie necessità 60 Richiede assistenza occasionalmente, ma è in grado di personali. E richiesto un certo provvedere alla maggior parte delle proprie necessità. grado di assistenza 50 Richiede notevole assistenza e frequenti prestazioni mediche. Incapace di accudire a se 40 Costretto a letto. Richiede assistenza e cure speciali. stesso. E richiesto il ricovero 30 In condizioni serie. E indicata l ospedalizzazione. ospedaliero. Progressione 20 In condizioni gravi. Sono necessari l ospedalizzazione ed un rapida della malattia. intenso trattamento generale di supporto. 10 In condizioni gravissime. Progressione rapida della malattia. 0 Paziente morto Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 6

Dati Quantitativi o Numerici Continui: possono assumere tutti i valori in un intervallo, di regola sono prodotti da operazioni di misura (altezza, peso, valori di laboratorio. Discreti: quando solo alcuni valori sono possibili, esempi: - i valori corrispondenti a numeri reali interi come l età in anni compiuti - il risultato di un conteggio. In pratica, i dati numerici discreti e quelli continui vengono trattati in modo analogo Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 7

Obiettivo della statistica descrittiva: Sintetizzare ed organizzare le informazioni contenute in una serie di dati, al fine di: o presentazione o esame preliminare ad analisi più complesse Requisiti o Mirare agli aspetti essenziali o Sintesi o Facilità di comprensione Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 8

Nel linguaggio statistico alla parola DATO viene spesso sostituita con la parola VARIABILE I dati di interesse vengono raccolti (misurati) per tutti i soggetti inclusi nella popolazione o nel campione. Il termine variabile sottolinea che il valore cambia da un soggetto all altro. I dati che non cambiano di valore sono denominati costanti. Alcune definizioni di variabile : - una caratteristica che varia da un entità biologica ad un altra (J.H.Zar) - qualunque genere di misura di cui si eseguano rilievi individuali è detta variabile (P.Armitage) Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 9

In modo analogo a quanto detto per i tipi di dati parliamo di tipo delle variabili. Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 10

Distribuzione di frequenza La distribuzione di frequenza può essere calcolata per - dati / variabili nominali - dati / variabili ordinali - dati / variabili numeriche Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 11

Tabella con distribuzione di frequenza univariata. Tipo di dato/variabile: nominale Distribuzione di frequenza per immunofenotipo dei casi di leucemia linfoblastica acuta infantile diagnosticati in Piemonte (1979-98). Immunofenotipo Non specificato T B B precursor N % 35 54 12 397 7.0 10.8 2.4 79.7 Totale 498 100 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 12

Tabella con distribuzione di frequenza univariata. Tipo di dato/variabile: numerica continua Esempio Numero di globuli bianchi (G.B.) alla diagnosi G.B. ( / ml) N (%) Non noto 5 (1.0) <=9.999 235 (47.2) 10.000 - <50.000 167 (33.5) >=50.000 91 (18.3) Totale 498 (100) Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 13

Costruzione di una distribuzione di frequenza: procedure Variabili categoriche: 1. definire i possibili valori della variabile 2. predisporre l elenco dei possibili valori 3. contare quante osservazioni per ciascun valore (frequenza) 4. calcolare le corrispondenti proporzioni / percentuali) (frequenza relativa) Pr oporzione = numero _ osservazioni _ Totale nella _ categoria Percentual e = proporzione *100 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 14

1. e 2. Risultato scolastico Frequenza Insufficiente Sufficiente Buono Distinto Ottimo Totale Proporzione (frequenza relativa) % n: numero di soggetti in ciascuna categoria della variabile Proporzione: n / numero totale di soggetti % = proporzione * 100 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 15

3 e 4. Risultato Frequenza Proporzione % scolastico (frequenza relativa) Insufficiente 4 0.14 14 % Sufficiente 8 0.28 28 % Buono 7 0.25 25 % Distinto 4 0.14 14 % Ottimo 5 0.19 19 % Totale 28 1.0 100 % Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 16

www.man.deakin.edu.au/rodneyc/xlstats.htm Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 17

http://cast.massey.ac.nz Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 18

Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 19

Lettura di una tabella Prestare attenzione a: - Valori mancanti N (%) Immunophenotype Not specified T B B precursor 35 (7.0) 54 (10.8) 12 (2.4) 397 (79.7) Total 498 (100) Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 20

- Intervalli aperti GLOBULI BIANCHI G.B. ( / ml) N (%) missing 5 (1.0) <=9999 235 (47.2) 10 000-49 999 167 (33.5) >=50 000 91 (18.3) Total 498 (100) Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 21

- Indicazione del totale Immunophenotype Not specified T B B precursor N (%) 35 (7.0) 54 (10.8) 12 (2.4) 397 (79.7) Total 498 (100) Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 22

- Intestazioni (della tabella, delle righe, delle colonne) Distribuzione di frequenza per immunofenotipo dei casi di leucemia linfoblastica acuta infantile diagnosticati in Piemonte (1979-98). GLOBULI BIANCHI G.B. ( / ml) N (%) missing 5 (1.0) <=9999 235 (47.2) 10 000-49 999 167 (33.5) >=50 000 91 (18.3) Total 498 (100) Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 23

La rappresentazione grafica di una distribuzione di frequenza è un valido aiuto per migliorarne la leggibilità. Rappresentazione grafica della distribuzione di frequenza di una variabile nominale Dato / Variabile: diagnosi di dimissione, tipo nominale. diagnosi di dimissione N % Colelitiasi 12 25 Ernia inguinale 9 19 Tumore del colon 9 19 Ulcera duodenale 4 8 Tumore del pancreas 4 8 Tumore del retto 3 6 Ulcera gastrica 2 4 Tumore dello stomaco 2 4 Tumore dell esofago 2 4 Stenosi esofagea 1 2 Totale 48 100 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 24

Diagramma a barre, corrispondente alla distribuzione di frequenza Attività operatoria 14 12 10 Numero interventi 8 6 4 2 0 Colelitiasi Ernia inguinale Tumore del colon Ulcera duodenale Tumore del pancreas Tumore del retto Ulcera gastrica Tumore dello stomaco Tumore dell esofago Stenosi esofagea Diagnosi Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 25

Diagramma a torta, corrispondente alla distribuzione di frequenza Attività operatoria 2 2 1 2 12 4 3 4 9 Colelitiasi Ernia inguinale Tumore del colon Ulcera duodenale Tumore del pancreas Tumore del retto Ulcera gastrica Tumore dello stomaco Tumore dell esofago Stenosi esofagea 9 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 26

Evitate un numero eccessivo di decimali: - nelle proporzioni usate 2 decimali - nelle percentuali usate 1 decimale o l intero Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 27

Distribuzione di frequenza cumulativa La frequenza cumulativa è somma della frequenza delle osservazioni con valore della variabile inferiore od uguale al valore considerato. Può essere calcolata per - dati / variabili ordinali - dati / variabili numeriche Calcolata la frequenza cumulativa si può calcolare la corrispondente proporzione o percentuale cumulativa. Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 28

Risultato scolastico Frequenza Frequenza cumulativa Ottimo 5 Distinto 4 Buono 7 Sufficiente 8 Insufficiente 4 Frequenza relativa cumulativa (in %) Totale 28 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 29

Risultato scolastico Frequenza Frequenza cumulativa Ottimo 5 5 Distinto 4 9 Buono 7 16 Sufficiente 8 24 Insufficiente 4 28 Frequenza relativa cumulativa (in %) Totale 28 28 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 30

Risultato scolastico Frequenza Frequenza cumulativa Frequenza relativa cumulativa (in %) Ottimo 5 5 19% Distinto 4 9 33 % Buono 7 16 58 % Sufficiente 8 24 86 % Insufficiente 4 28 100 % Totale 28 28 100 % Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 31

Risultato scolastico 9 8 7 6 Frequenza (assoluta) 5 4 3 2 1 0 Ottimo Distinto Buono Sufficiente Insufficiente Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 32

Risultato scolastico 30 25 20 frequenza (assoluta) 15 10 5 0 Ottimo Distinto Buono Sufficiente Insufficiente Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 33

100% 90% 80% Risultato scolastico Frequenza relativa (percentuale) 70% 60% 50% 40% 30% 20% 10% 0% Ottimo Distinto Buono Sufficiente Insufficiente Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 34

Distribuzione di frequenza di dati (variabili) numerici Se le variabili sono numeriche (continue o discrete con molti valori) occorre definire gli intervalli dei valori della variabile (classi di valori) 1. gli intervalli debbono essere definiti in modo che tutte le possibili osservazioni cadano in uno ed uno solo di essi. 2. è opportuno che gli intervalli siano di uguale ampiezza Esempio: ETA (variabile indicata con il simbolo x ) ƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 00<= x <10 10<= x <20 20<= x <30 30<= x <40 40<= x <50 50<= x <60 60<= x <70 70<= x <80 80<= x <90 90<= x <100 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 35

3. calcolare le corrispondenti distribuzioni di frequenza e proporzioni semplici e cumulative Cumulative Cumulative ETA Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 00<= x <10 0 0.0 0 0.0 10<= x <20 0 0.0 0 0.0 20<= x <30 0 0.0 0 0.0 30<= x <40 2 0.5 2 0.5 40<= x <50 38 8.8 40 9.3 50<= x <60 70 16.3 110 25.6 60<= x <70 212 49.3 322 74.9 70<= x <80 104 24.2 426 99.1 80<= x <90 2 0.5 428 99.5 90<= x <100 2 0.5 430 100.0 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 36

I segni per definire un intervallo sono: = es x=1 include solo i soggetti con variabile X di valore 1 >= x>=1 include i soggetti con variabile X di valore 1 (incluso) o superiore ad 1 > x>1 include solo i soggetti con variabile X di valore superiore ad 1 < <= Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 37

Istogrammi : rappresentazione grafica di distribuzioni di frequenza di variabili numeriche. Vengono disegnati su un grafico dei rettangoli contigui, uno per ciascun valore o intervallo (classe) di valori della variabile. L area dei rettangoli è proporzionale alla frequenza di osservazioni, E opportuno che gli intervalli siano della stessa ampiezza e quindi che i rettangoli corrispondenti abbiano tutti base uguale: semplifica sia la preparazione sia la lettura. Come disporre i valori Ascisse: valori della variabile Ordinate: Frequenza (assoluta o percentuale, semplice o cumulativa, a scelta). Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 38

100,0% 90,0% 80,0% 70,0% Frequenza relativa % 60,0% 50,0% % 40,0% 30,0% 20,0% 10,0% 00<=eta<10 10<=eta<20 20<=eta<30 30<=eta<40 40<=eta<50 50<=eta<60 60<=eta<70 70<=eta<80 80<=eta<90 90<=eta<100 0,0% classe di età Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 39

100% 90% 80% 70% Frequenza cumulativa relativa 60% 50% % 40% 30% 20% 10% 0% 00<=eta<10 10<=eta<20 20<=eta<30 30<=eta<40 40<=eta<50 50<=eta<60 60<=eta<70 70<=eta<80 80<=eta<90 90<=eta<100 classe di età Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 40

Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 41

Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 42

Rappresentazioni alternative di distribuzioni di frequenza: o Diagrammi a torta (pie chart, vedi esempio seguente) o Poligoni di frequenza o Diagrammi di dispersione (a punti) ad una dimensione o Istogrammi a barre orizzontali o Figure con area proporzionale alla frequenza (attenzione, la lettura può essere poco immediata). Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 43

I diagrammi a punti sono adatti solo quando il numero di osservazioni è limitato n Hb 1 111 2 107 3 124 4 141 5 131 6 105 7 96 8 125 9 135 10 140 11 151 12 139 13 162 14 163 15 168 16 171 17 166 18 169 19 157 20 165 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 44

Il risultato non è particolarmente soddisfacente, soprattutto quando le osservazioni sono molte ed i punti si sovrappongono! Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 45

Diagrammi a torta (pie chart). La frequenza è proporzionale all angolo al centro, quindi all area dello spicchio Esempio di diagramma a torta o Pie chart Distribuzione di frequenza del numero di globuli bianchi tra i casi di leucemia linfoblastica acuta (LLA) rilevati dal RTI Piemonte, 1979-98 missing <=9999.103/l 10 000-49 999.103/l >=50 000.103/l Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 46

Statistica descrittiva - metodi per analisi bivariata (2 variabili contemporaneamente). Analizziamo separatamente i seguenti casi: o Due variabili nominali o Una variabile nominale e l altra ordinale o Due variabili ordinali o Una variabile quantitativa (discreta o continua) e l altra nominale / ordinale o Due variabili quantitative (discrete o continue) Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 47

Statistica descrittiva - bivariata Due variabili nominali Una variabile nominale e l altra ordinale Due variabili ordinali -> Distribuzione di frequenza Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 48

Distribuzione di frequenza di 2 variabili Il procedimento è analogo a quanto descritto per una sola variabile, complicato solo dalla necessità di classificare ciascun soggetto per due variabili contemporaneamente. 1. definire i possibili valori di ciascuna delle due variabili 2. scrivere una tabella con le due variabili a definire le righe e le colonne 3. scrivere i valori delle variabili in ordine crescente 4. contare quante osservazioni per ciascuna combinazione di valori 5. calcolare i totali di riga, colonna e tabella 6. calcolare le corrispondenti proporzioni (eventualmente come percentuali) riferite a: totale generale, totale di riga, tot. di colonna Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 49

Problema: descrivere l associazione tra arteriopatia ed abitudine al fumo (due variabili categoriche) in uno studio su 200 pazienti: 1. identifico le variabili ed i valori possibili Var. A (arteriopatia), nominale, valori possibili = 2 (malato, sano). Var. B (fumo), nominale, valori possibili = 3 (mai fumatore, ex fumatore, attuale fumatore). 2. preparo una tabella con le due variabili a definire le righe e le colonne Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 50

Fumo Totale Mai Ex Attuale Malato Arteriopatia Sano Totale Queste tabelle sono anche chiamate: tabelle di contingenza tabelle crociate (o crosstabs) tabelle a doppia entrata Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 51

Fumo Arteriopatia Totale Malato Sano Mai 8 43 51 Ex 26 45 71 Attuale 30 48 78 Totale 64 136 200 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 52

Percentuali sul totale delle osservazioni Arteriopatia % totale Malati Sani Totale Malati Sani % % F Mai 8 43 4,0 21,5 U Ex 26 45 13,0 22,5 M attuale 30 48 15,0 24,0 O Totale 200 100,0 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 53

Istogrammi da tabella con 2 variabili Percentuali sul totale delle osservazioni Malati Sani 30,0 25,0 20,0 % 15,0 10,0 5,0 0,0 Mai Ex attuale Malati 4,0 13,0 15,0 Sani 21,5 22,5 24,0 Fumo Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 54

Istogrammi da tabella con 2 variabili Percentuali sul totale delle osservazioni 25,0 20,0 15,0 % 10,0 5,0 Malati Sani 0,0 Sani Mai Fumo Ex attuale Malati Mai Ex attuale Malati 4,0 13,0 15,0 Sani 21,5 22,5 24,0 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 55

Percentuali sul totale di riga Arteriopatia %riga Malati Sani Totale Malati Sani % % % F Mai 8 43 51 15,7 84,3 100,0 U Ex 26 45 71 36,6 63,4 100,0 M O attuale Totale 30 48 78 200 38,5 61,5 100,0 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 56

Istogrammi da tabella con 2 variabili Percentuali di malati per ciascuna categoria di fumo 90,0 80,0 70,0 60,0 50,0 % Malati 40,0 Sani 30,0 20,0 10,0 0,0 Mai Ex attuale Totale Malati 15,7 36,6 38,5 32,0 Sani 84,3 63,4 61,5 68,0 Fumo Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 57

Percentuali sul totale di colonna Arteriopatia %colonna Malati Sani Totale Malati Sani F Mai 8 43 12,5 31,6 U Ex 26 45 40,6 33,1 M Attuale 30 48 46,9 35,3 O Totale 64 136 200 100,0 100,0 Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 58

Istogrammi da tabella con 2 variabili Percentuali di fumatori tra malati e sani 50,0 45,0 40,0 35,0 % 30,0 25,0 20,0 Malati Sani 15,0 10,0 5,0 0,0 Mai Ex attuale Malati 12,5 40,6 46,9 Sani 31,6 33,1 35,3 Fumo Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 59

Esercizi consigliati, tratti da: M.Pagano & K.Gauvreau. Biostatistica (II edizione italiana). ed. Idelson Gnocchi, Napoli 2003. 1. Partendo dai dati presentati nella tabella 2.10: a) Indicare di quale tipo di variabili si tratta. b) Qual è la percentuale di nati di peso inferiore a 2 kg? c) Calcolare la frequenza relativa del numero di neonati per classe di peso alla nascita d) Disegnare l istogramma del numero di neonati per classe di peso alla nascita e) Calcolare la frequenza cumulativa (assoluta e relativa) del numero di neonati per classe di peso alla nascita f) Disegnare l istogramma della frequenza cumulativa relativa del numero di neonati per classe di peso alla nascita. g) Accorpare i dati della tabella 2.10 in classi di 1000 g e ripetere gli esercizi da c a f. 2. Svolgere i seguenti esercizi tratti dalle pag.26-27: 1, 2, 3, 4, 5, 6, 7. 3. Svolgere i seguenti esercizi tratti dalle pag.26-27: 8, 16 (nel caso sia richiesto un poligono di frequenza, disegnate un istogramma). 4. Svolgere i seguenti esercizi tratti dalle pag.26-27: 12, 13, 14 (id.). Gli esercizi saranno corretti in classe Corso di laurea in medicina e chirurgia - Statistica Medica Statistica descrittiva 60