LEZIONI DI STATISTICA MEDICA

Documenti analoghi
3) In una distribuzione di frequenza si può ottenere più di una moda Vero Falso

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Statistica. Lezione 1

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Distribuzione di frequenza e rappresentazioni grafiche

Statistica Medica ed Epidemiologia

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

14/12/2016 IL SOFTWARE EXCEL 4 I GRAFICI I GRAFICI. E se questi dati volessimo trasformarli in grafico?

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA

ANALISI STATISTICHE BIVARIATE. Tabelle di contingenza

Statistica. Alfonso Iodice D Enza

STATISTICA 1 ESERCITAZIONE 6

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Che tipo di variabile è il peso del bambino e qual è la sua scala di misura?

SCOPO DELL ANALISI DI CORRELAZIONE

Tra i non fumatori qual è la percentuale di non utilizzatori di sostanze stupefacenti? Scegli un'alternativa: a. 86% b. 10% c. 50% d. 25% e.

Esercizio 1. Si rilevano le variabili età, altezza e peso di 18 pazienti:

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Statistica dei consumi alimentari e delle tendenze nutrizionali Lezione 6-16/10/2015

Misure di dispersione (o di variabilità)

Regressione lineare semplice

Test d ipotesi: confronto fra medie

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Distribuzioni e rappresentazioni grafiche

La seguente tabella riporta la distribuzione del peso di 400 studentesse. (Kg)

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Prof. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di frequenza e rappresentazione grafica

Inferenza statistica

Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

STATISTICA. Utilizzo della statistica in campo infermieristico UNITA STATISTICA POPOLAZIONE STATISTICA

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Statistica. Esplicazione integrato con Appunti. Marco D Epifano

Esercitazioni di statistica

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi

Università degli Studi di Verona

Corso di Psicometria Progredito

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Elementi di Psicometria con Laboratorio di SPSS 1

Le rappresentazioni grafiche

I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di osservazioni.

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

Statistica descrittiva in due variabili

Rappresentazioni grafiche per variabili qualitative

Statistica Sociale - modulo A

tabelle grafici misure di

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Statistica e informatica

REGRESSIONE E CORRELAZIONE

Esercitazioni di Statistica Metodologica

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Statistica Analisi bidimensionale La dipendenza in media. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

ANALISI MULTIVARIATA

STATISTICA 1 ESERCITAZIONE 2

Costruire il grafico di una distribuzione di frequenza

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

LA STATISTICA

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

L equazione generica della funzione costante è y=k, il grafico è una retta parallela all asse x (asse delle ascisse). retta parallela all'asse x y

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

Esercitazioni di Metodi Statistici per la Biologia

Distribuzioni di due variabili aleatorie

MISURE DI SINTESI 54

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Rilevazione (Raccolta) Dati: Raccolta Campionaria e Raccolta Globale

Test per la correlazione lineare

LABORATORIO-MINITAB N. 2-3 VARIABILI QUANTITATIVE

Teoria e tecniche dei test. Concetti di base

ESERCIZI SULLE TABELLE DI CONTINGENZA

Corso di Psicometria Progredito

Gli oggetti della ricerca osservazionale

Variabilità. ..senza variabilità non ci sarebbe la statistica

LEZIONE 1.1. corso di statistica. Francesco Lagona Università Roma Tre. LEZIONE 1.1 p. 1/18

LEZIONI DI STATISTICA MEDICA

Esplorazione grafica di dati multivariati. N. Del Buono

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

E = P(A) N. Teoria della probabilità. E = = 160 (numero atteso di soggetti con l influenza) E = = 390

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

Stesso valore medio per distribuzioni diverse

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Statistica. Alfonso Iodice D Enza

LABORATORIO EXCEL XLSTAT 2008 SCHEDA 1 VARIABILI QUALITATIVE

Esercizi di Probabilità e Statistica

Misure di dispersione (o di variabilità)

Università degli Studi di Padova Facoltà di Scienze Politiche. Laurea: Scienze Sociologiche Laurea: Vecchio Ordinamento

Carta del rischio di Broncopneumopatia Cronica Ostruttiva (BPCO)

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica. Relazioni tra variabili. Francesco Pauli A.A. 2015/2016

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica e Biometria

Transcript:

LEZIONI DI STATISTICA MEDICA A.A. 2010/2011 Lezione n.6 - Distribuzione bivariata Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Esempio: distribuzione dell abitudine al fumo e della broncopneumopatia cronico-ostruttiva (BPCO) in adulti italiani di età 20-44 anni (indagine ISAYA). Fumo n i p i non fumatore 9667 51.9% ex fumatore 2743 14.7% fumatore 6228 33.4% Totale 18638 100.0% BPCO n i p i (%) assente 16622 89.2% presente 2016 10.8% Totale 18638 100.0%

distribuzione bivariata: DISTRIBUZIONE CONGIUNTA ASSOLUTA: TAVOLE DI CONTINGENZA distribuzione congiunta del fumo e della BPCO (n ij ) BPCO FUMO assente presente TOTALE non fumatore 9042 625 9667 ex fumatore 2472 271 2743 fumatore 5108 1120 6228 TOTALE 16622 2016 18638 distribuzione marginale della BPCO (n j ) distribuzione marginale del fumo (n i ) dimensione campionaria (n)

DISTRIBUZIONE BIVARIATA (CROSS-TABULATION) Permette la rappresentazione congiunta della distribuzione di frequenza di due variabili qualitative Permette di capire la relazione tra le due variabili

DISTRIBUZIONE CONGIUNTA RELATIVA (%) BPCO FUMO assente presente TOTALE non fumatore 9042 625 9667 ex fumatore 2472 271 2743 fumatore 5108 1120 6228 TOTALE 16622 2016 18638 non fumatori con BPCO (n 12 ) dimensione campionaria (n) BPCO (625 / 18638) * 100 FUMO assente presente TOTALE (n ij / n) * 100 non fumatore 48.5% 3.4% 51.9% ex fumatore 13.3% 1.4% 14.7% fumatore 27.4% 6.0% 33.4% TOTALE 89.2% 10.8% 100.0%

distribuzione bivariata: DISTRIBUZIONI CONDIZIONALI Rappresentano la distribuzione di una variabile all interno delle modalità dell altra variabile N.B. Se le distribuzioni condizionali sono differenti, si può supporre che esista una relazione tra le due variabili

DISTRIBUZIONI CONDIZIONALI AI MARGINALI DI RIGA: (distribuzione della BPCO per livello di fumo) BPCO FUMO assente presente TOTALE non fumatore 9042 625 9667 ex fumatore 2472 271 2743 fumatore 5108 1120 6228 marginali di riga (n i ) TOTALE 16622 2016 18638 BPCO (625 / 9667) * 100 FUMO assente presente TOTALE (n ij / n i ) * 100 non fumatore 93.5% 6.5% 100.0% ex fumatore 90.1% 9.9% 100.0% fumatore 82.0% 18.0% 100.0% TOTALE 89.2% 10.8% 100.0%

distribuzioni condizionali ai marginali di riga: Distribuzione della BPCO in gruppi di soggetti esposti a vari livelli di fumo attivo 100 freq. relativa (%) 80 60 40 20 non BPCO BPCO 0 non fumatori ex fumatori fumatori

DISTRIBUZIONI CONDIZIONALI AI MARGINALI DI COLONNA: (distribuzione del fumo per livello della BPCO) BPCO FUMO assente presente TOTALE non fumatore 9042 625 9667 ex fumatore 2472 271 2743 fumatore 5108 1120 6228 TOTALE 16622 2016 18638 marginali di colonna (n j ) (n ij / n j ) * 100 BPCO (625 / 2016) * 100 FUMO assente presente TOTALE non fumatore 54.4% 31.0% 51.9% ex fumatore 14.9% 13.4% 14.7% fumatore 30.7% 55.6% 33.4% TOTALE 100.0% 100.0% 100.0%

distribuzioni condizionali ai marginali di colonna: Distribuzione dell abitudine al fumo in soggetti sani e in soggetti affetti da BPCO 60 freq. relativa (%) 50 40 30 20 10 non fumatori ex fumatori fumatori 0 non BPCO BPCO

ESERCIZIO In un indagine è stato chiesto ad un gruppo di 101 consumatori e ad un gruppo di 124 dentisti se erano favorevoli alla pubblicità fatta dai dentisti per attrarre nuovi pazienti. Si sono ottenuti i seguenti risultati: GIUDIZIO CATEGORIA molto favorevole abbastanza favorevole indifferente abbastanza sfavorevole molto sfavorevole TOTALE consumatore 34 49 9 4 5 101 dentista 9 18 23 28 46 124 TOTALE 43 67 32 32 51 225 1. C è differenza tra il giudizio espresso dai consumatori e dai dentisti? C è relazione tra la categoria e il giudizio? 2. Risolvete l esercizio calcolando le opportune distribuzioni condizionali e rappresentatele graficamente

SOLUZIONE - I confrontare le distribuzioni condizionali della variabile giudizio tra i consumatori e i dentisti: (34 / 101) * 100 GIUDIZIO CATEGORIA molto favorevole abbastanza favorevole indifferente abbastanza sfavorevole molto sfavorevole TOTALE consumatore 33.7% 48.5% 8.9% 4.0% 4.9% 100.0% dentista 7.3% 14.5% 18.5% 22.6% 37.1% 100.0% TOTALE 19.1% 29.8% 14.2% 14.2% 22.7% 100.0% (9 / 124) * 100

SOLUZIONE - II freq. relativa (%) 60 50 40 30 20 10 consumatore dentista 0 molto favorevole abbastanza favorevole indifferente abbastanza sfavo revo le molto sfavo revo le 1. il giudizio sembra dipendere dalla categoria di appartenenza (le distribuzioni condizionali sono differenti) 2. i consumatori sembrano essere favorevoli, mentre i dentisti no

DISTRIBUZIONE CONGIUNTA di due VARIABILI QUANTITATIVE

Peso Pressione arteriosa sistolica 55 100 58 90 60 98 61 95 61 108 61 89 61 90 62 97 62 96 62 110 64 95 64 97 65 105 65 104 65 113 66 98 66 101 66 91 67 107 67 112 67 94 68 119 69 102 69 102 69 118 69 109 70 114 70 106 71 100 Peso Pressione Arteriosa sistolica 72 121 74 120 75 104 75 102 75 109 75 107 76 115 77 111 78 108 78 107 79 112 81 110 82 100 83 105 83 118 85 114 87 105 87 110 90 110 90 120 95 121 95 119 99 110 102 117 104 131 104 132 111 127 118 133 Esempio: Consideriamo i dati relativi alla pressione sistolica arteriosa e al peso di 59 soggetti: Quale relazione tra i dati?

DIAGRAMMA DI DISPERSIONE (scatterplot) Riportiamo su un diagramma cartesiano in ascissa (X) i valori del peso e in ordinata (Y) i valori della pressione arteriosa 140 130 Pressione arteriosa sistolica (mmhg) 120 110 100 90 80 50 60 70 80 90 100 110 120 130 Peso (kg)

DIAGRAMMA DI DISPERSIONE (scatterplot) 140 Pressione arteriosa sistolica (mmhg) 130 120 110 100 127mmHg 90 80 111 Kg 50 60 70 80 90 100 110 120 130 Peso (kg)

All aumentare di x, y aumenta (associazione positiva)? Diminuisce (associazione negativa)? Oppure tra x e y non sembra esserci alcuna relazione? 140 130 Pressione arteriosa sistolica (mmhg) 120 110 100 y medio 108.0 mmhg 90 80 x medio 75.6 Kg 50 60 70 80 90 100 110 120 130 Peso (kg)

La maggior parte dei punti è concentrata nel I e nel III quadrante: l associazione tra le due variabili è positiva. 140 IV IV I I 130 Pressione arteriosa sistolica (mmhg) 120 110 100 y medio 108.0 mmhg 90 80 III III x medio 75.6 Kg 50 60 70 80 90 100 110 120 130 Peso (kg) II II

DIAGRAMMA DI DISPERSIONE (scatterplot) 140 130 2. 2. individuare outlier Pressione arteriosa sistolica (mmhg) 120 110 100 90 1. 1. esplorare relazioni 80 50 60 70 80 90 100 110 120 130 Peso (kg)

commenti Il grafico precedente ci mostra che: Peso e pressione sistolica arteriosa sono positivamente associate: i soggetti che hanno peso più elevato, hanno anche valori della pressione arteriosa maggiori La relazione tra le due variabili, ad una prima osservazione, sembra essere lineare