Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012



Documenti analoghi
Università degli Studi di Cassino. Facoltà di Scienze Motorie Corso di Laurea in Scienze Motorie Anno accademico 2009/2010

Corso di. Dott.ssa Donatella Cocca

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

Informatica. Anno Accademico 2009/2010. Dr. Bruno Federico Facoltà di Scienze Motorie Università di Cassino -

Università degli Studi di Cassino Università Sapienza di Roma

Elementi di Statistica descrittiva Parte I

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Statistica. Le rappresentazioni grafiche

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

A.A. 2015/2016. Statistica Medica. Corso di. CdL in Fisioterapia CdL in Podologia

Come archiviare i dati per le scienze sociali

Elementi di statistica descrittiva I 31 Marzo 2009

Lezione 1. Concetti Fondamentali

RAPPRESENTAZIONE DEI DATI

Modelli descrittivi, statistica e simulazione

Lezione 1- Introduzione. Statistica medica e Biometria. Statistica medica-biostatistica. Prof. Enzo Ballone

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

STATISTICA IX lezione

Strumenti informatici Realizzare grafici e tabelle con Excel e SPSS

STATISTICA DESCRITTIVA UNIVARIATA

Statistica inferenziale

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

ESERCIZI DI STATISTICA DESCRITTIVA

DELLA RIABILITAZIONE. Indicatori sanitari

IL TEST DI ACCESSO AI CORSI DI STUDIO TRIENNALI DI PSICOLOGIA

Indice Statistiche Univariate Statistiche Bivariate

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI

Il concetto di valore medio in generale

REGOLAMENTO DI VALUTAZIONE DEL PERSONALE DIPENDENTE

Esempio di introduzione. della statistica a scuola

ANALISI DEI QUESTIONARI PER LA RILEVAZIONE DELLE OPINIONI DEGLI STUDENTI SUI SINGOLI INSEGNAMENTI

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

ANALISI DELLE FREQUENZE: IL TEST CHI 2

matematica probabilmente

Università degli Studi di Torino

Slide Cerbara parte1 5. Le distribuzioni teoriche

Progettaz. e sviluppo Data Base

RAPPRESENTAZIONI GRAFICHE

ANALISI DEI QUESTIONARI PER LA RILEVAZIONE DELLE OPINIONI DEGLI STUDENTI SUI SINGOLI INSEGNAMENTI

Obiettivi dell esercitazione. Requisiti (cont.) Requisiti. Università di Roma La Sapienza A.A Facoltà di Ingegneria Sede di Latina

Inferenza statistica. Statistica medica 1

Statistica. Lezione 6

Capitolo 2 Distribuzioni di frequenza

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Come valutare le caratteristiche aerobiche di ogni singolo atleta sul campo

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ

Premesse alla statistica

CLASSIFICAZIONE DEI CARATTERI

Associazione di Sanità solidale e Iniziative di Utilità Sociale ASIUS

UNITÀ DI APPRENDIMENTO

COSTRUIRE UN TEAM VINCENTE DENTRO E FUORI DAL CAMPO

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Elementi di Epidemiologia

Analisi di dati di frequenza

SPC e distribuzione normale con Access

C.I. Analisi dei dati motori e sportivi Modulo: Metodi epidemiologici

ANALISI DEI QUESTIONARI PER LA RILEVAZIONE DELLE OPINIONI DEGLI STUDENTI SULLA GENERALITÀ DELLE PRESTAZIONI DIDATTICHE, AMMINISTRATIVE E DI SERVIZI

Lezione 1. Concetti Fondamentali

Chi non risolve esercizi non impara la matematica.

Dr. Marco Vicentini Anno Accademico Rev 30/03/2011

Caratteristiche di TechnoTrain

Ricerca di outlier. Ricerca di Anomalie/Outlier

Igiene. Dott. Pamela Di Giovanni. Definizione

Corso di Psicometria Progredito

Elementi di statistica. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 1

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno.

Grafici delle distribuzioni di frequenza

Analisi e diagramma di Pareto

Statistica descrittiva

Prof.ssa Paola Vicard

LA STATISTICA AZIENDALE

Esercizio 1. Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli.

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

Durata 6 ore OBIETTIVI DESTINATARI. ARTICOLAZIONE DEL CORSO Il corso e learning è articolato in tre moduli.

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

Draft sulla lettura dei risultati italiani dell indagine ALL (Adult literacy and Life skills) Aree geografiche a confronto

I registri per le protesi mammarie e i registri dei dispositivi impiantabili

Calcolo delle probabilità

Il Ministro dellistruzione, dell Università e della Ricerca

5. IL PC E INTERNET NELLE DIVERSE TIPOLOGIE FAMILIARI

PROGETTAZIONE FORMATIVA ANNUALE PROGETTAZIONE ANNUALE DIDATTICA:

ESERCIZIO N 4. Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240

Assessment Center: tecniche di valutazione del potenziale

Lezione Introduzione

Il calcolo dell IRPEF 2003: verifica della clausola di salvaguardia

Alternanza scuola lavoro: a che punto siamo?

FACOLTÀ SCIENZE DELLA FORMAZIONE

Simulazione della Prova Nazionale. Matematica

Gestione ed Analisi Statistica dei dati (per costruire il report: step by step con SPSS)

MODELLO E/R. Prof. Francesco Accarino IIS Altiero Spinelli Sesto San Giovanni

Introduzione alla statistica descrittiva

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa.

GESTIONE DELLA PROGRAMMAZIONE UNITARIA OB. C5 STAGE IN ITALIA GESTIONE DELLO STAGE

Corso di Laurea Magistrale in Scienze Infermieristiche Esempi di quiz di Epidemiologia utilizzati all esame

Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a INTRODUZIONE ALLA STATISTICA DESCRITTIVA

MANUALE ESPERTI PON 2007/2013

Le Basi di Dati. Le Basi di Dati

Statistica descrittiva univariata

Transcript:

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012 Bruno Federico b.federico@unicas.it Cattedra di Igiene - Università degli Studi di Cassino Le lezioni sono parte del corso integrato di Analisi dei dati motori e sportivi (Biostatistica e Metodi Epidemiologici). Per gli studenti LT33 l insegnamento Biostatistica sostituisce il precedente Principi di Statistica Descrittiva Docenti Daniela Anastasi Metodi Epidemiologici Bruno Federico Biostatistica Lezioni Il corso (6 lezioni da 4 ore ciascuna) è articolato in lezioni frontali ed esercitazioni, che saranno svolte sia con carta e penna che al computer in aula informatica. È consigliabile portare con sé una calcolatrice Esami L esame integrato prevede una prova scritta con domande aperte ed una orale Programma del corso Introduzione alla statistica. Statistica descrittiva. Tabelle di frequenza. Rappresentazioni grafiche dei dati. Indici di tendenza centrale, indici di variabilità. Bibliografia Fowler, Jarvis, Chevannes. STATISTICA PER LE PROFESSIONI SANITARIE. EdiSES Napoli 2006 Pagano, Gavreau, BIOSTATISTICA, Idelson-Gnocchi, Napoli, 2003 Il materiale del corso è disponibile su www.docente.unicas.it/bruno_federico/didattica 1

Introduzione La Statistica è uno strumento essenziale per la scoperta di leggi e relazioni tra fenomeni Svolge un ruolo fondamentale nella ricerca scientifica La Statistica riguarda la raccolta, l organizzazione, la presentazione, l analisi e l interpretazione dei dati numerici allo scopo di fornire un supporto per la realizzazione di decisioni più efficaci Quando l interesse è rivolto alle scienze biologiche e mediche, si usa il termine biostatistica Alcuni esempi Trattamento dell obesità da parte di medici di medicina generale 2

Attività fisica e mortalità 3

La match analysis È il processo di osservazione e valutazione di un insieme di comportamenti adottati dagli atleti durante una partita al fine di: 1. Raccogliere ed elaborare i dati relativi ai diversi aspetti di gioco 2. Presentare i dati a tutti gli interessati (allenatori, atleti, dirigenti, giudici, ) 3. Fornire un interpretazione dei dati utile a definire meglio le caratteristiche specifiche della prestazione studiata 4

Origini della disciplina Il termine statistica deriva dalla parola Stato Originariamente con questo termine si indicava la raccolta dei dati demografici ed economici di interesse per gli stati Con la nascita dei grandi Stati europei, l interesse ad approfondire i fenomeni legati alle popolazioni diventa sempre più forte Gli Stati si dotano di Istituti centrali di statistica deputati per legge alla raccolta, organizzazione e diffusione dei dati sulla popolazione, sulle abitazioni, sulle risorse economiche e su tutti gli aspetti rilevanti della vita di una Nazione In Italia, l ente centrale è l ISTAT (Istituto nazionale di statistica) La disciplina si è poi sviluppata in un metodo scientifico di analisi applicato alle scienze sociali, naturali, biomediche La Statistica nello Sport Una delle caratteristiche peculiari dello sport moderno è la misurazione. Punteggi, graduatorie, prestazioni degli atleti La valutazione della performance di un atleta o di una squadra può essere: Descrittiva: utile nell elaborazione di graduatorie Predittiva: utile per valutare la probabilità di vittoria della squadra o dell atleta Il baseball ed il basket sono esempi di discipline sportive in cui la statistica gioca un ruolo importante A partire dal 1993, la FIFA ha sviluppato un sistema di ranking delle squadre nazionali che si basa su diversi parametri (Risultato finale, Numero di goal, Se la partita è giocata in casa o fuori, L'importanza del 5

match, La forza della squadra avversaria, Le differenze geografiche tra i continenti) La Statistica nelle scienze bio-mediche Metodi statistici sono largamente utilizzati in campo bio-medico per: Valutare l efficacia di un trattamento valutare la relazione di causalità di un fenomeno (es. le cause di una malattia) Definizioni di Statistica È una metodologia generale per lo studio dei fenomeni collettivi e della variabilità di tali fenomeni attraverso L osservazione dei fenomeni La traduzione in simboli L evidenza di irregolarità La verifica di ipotesi È l insieme di principi, procedure logiche e metodi utili a comprendere, controllare e prevedere determinati fenomeni Obiettivi della statistica Descrivere i dati condensare anche un gran numero di dati rilevati in pochi valori riassuntivi, capaci di indicare importanti proprietà della popolazione o del campione oggetto di indagine Esplorare le relazioni Valutare l esistenza e la grandezza delle relazioni tra le variabili rilevate Fare previsioni utilizzare i dati raccolti per prevedere i valori che ci si aspetta di trovare nella popolazione oggetto di indagine in particolari condizioni 6

Obiettivi della statistica - esempi Descrivere i dati Qual è il numero di vittorie della squadra? Qual è la performance dell atleta? Esplorare le relazioni Che relazione c è tra adiposità in eccesso, forza e velocità? Fare previsioni Qual è la probabilità di vittoria dell atleta o della squadra note le seguenti condizioni (stato di forma, morale, forza dell avversario, )? Nomenclatura Popolazione: Insieme o collezione di oggetti, numeri, misure o osservazioni. Le popolazioni possono essere finite o infinite Campione: Un sottoinsieme della popolazione su cui vengono raccolti i dati Unità statistica: Minima unità da cui si raccolgono i dati in una indagine (Individuo, Famiglia, Regione, Gara) Variabile: Caratteristica che può assumere valori diversi nelle diverse unità statistiche Altezza dei bambini di una classe Peso degli atleti Tipo di sport praticato Modalità Valore assunto da una variabile in una determinata unità statistica Individuo Giorgio Mario Roberto Peso 80 kg 75 kg 77 kg 7

Natura della Statistica Statistica descrittiva: ha a che fare con la presentazione, organizzazione e sintesi dei dati Tabelle, grafici, indici di sintesi Statistica Inferenziale: ci permette di generalizzare i risultati ottenuti dai dati raccolti in un piccolo campione ad una popolazione più ampia Stima di parametri Test di ipotesi Perché studiare un campione? Risorse limitate Pochi dati disponibili Impossibilità a compiere determinati test 8

Tipo di variabili Variabile ciò che viene osservato o misurato Variabili numeriche discrete I modi di essere possibili sono limitati Variabili numeriche continue I modi di essere possibili sono infiniti Variabile categorica binomiale i valori sono due categorie distinte Variabile categorica nominale i valori sono categorie con nomi distinti, tra le quali non è possibile stabilire un criterio di ordinamento logico Variabile categorica ordinale i valori sono una serie ordinata di categorie, ma la differenza tra una categoria e la successiva non può essere considerata costante Esercitazione Di che tipo di variabili si tratta? Come è in generale la tua salute? Eccellente, molto buona, buona, così così, scadente Che tipo di attività pratichi nel tempo libero? Pratichi sport? Quanti esami hai superato finora? Qual è la tua circonferenza addominale? Qual è la tua età? 9

Dati grezzi e matrice dei dati Quando si raccolgono dati su una popolazione o un campione, i valori ottenuti si presentano all inizio come un insieme di dati disordinati (dati grezzi) I dati vanno organizzati in righe e colonne in una matrice. La matrice dei dati però è poco informativa, a meno che il campione in esame non sia molto piccolo Ogni riga rappresenta un unità statistica Ogni colonna rappresenta una variabile id V1 V2 V3 V4 V5 V6 1 2 3 4 5 6 È importante avere un codice identificativo univoco per ogni osservazione (variabile id) Il codice identificativo è la chiave che permette di collegare le informazioni raccolte con i dati personali dell individuo. È univoco, ovvero ne esiste solo uno per ogni soggetto Il codice identificativo deve essere inserito sia sul modulo di raccolta dati (es. sulla prima pagina del questionario) che nell archivio dei dati Qualche consiglio utile Evitare l inserimento di testo Per le variabili categoriche, è spesso conveniente utilizzare dei codici numerici Es. Maschio=1, Femmina=2 Questi codici vanno definiti prima dell inserimento dei dati, attraverso una legenda 10

Un esempio di archivio di dati: Football Due identici palloni da football, uno riempito di aria ed uno di elio, sono stati utilizzati in un campo da gioco all esterno dell Università dell Ohio in una giornata priva di vento. Ogni pallone è stato calciato 39 volte, alternando i due palloni. È stata misurata la distanza percorsa per ogni calcio. Variabili Trial: Trial Number Air: distance in yards for air-filled football Helium: distance in yards for helium-filled football. use football, clear. list, noobs clean trial air helium 1 25 25 2 23 16 3 18 25 4 16 14 5 35 23 6 15 29 7 26 25 8 24 26 9 24 22 10 28 26 11 25 12 12 19 28 13 27 28 14 25 31 15 34 22 16 26 29 17 20 23 18 22 26 19 33 35 20 29 24 21 31 31 22 27 34 23 22 39 24 29 32 25 28 14 26 29 28 27 22 30 28 31 27 29 25 33 30 20 11 31 27 26 32 26 32 33 28 30 34 32 29 35 28 30 36 25 29 37 31 29 38 28 30 39 28 26 11

Un esempio di archivio di dati: Step An experiment was conducted by students at The Ohio State University in the fall of 1993 to explore the nature of the relationship between a person's heart rate and the frequency at which that person stepped up and down on steps of various heights. The response variable, heart rate, was measured in beats per minute. There were two different step heights: 5.75 inches (coded as 0), and 11.5 inches (coded as 1). There were three rates of stepping: 14 steps/min. (coded as 0), 21 steps/min. (coded as 1), and 28 steps/min. (coded as 2). This resulted in six possible height/frequency combinations. Each subject performed the activity for three minutes. Subjects were kept on pace by the beat of an electric metronome. One experimenter counted the subject's pulse for 20 seconds before and after each trial. The subject always rested between trials until her or his heart rate returned to close to the beginning rate. Another experimenter kept track of the time spent stepping. Each subject was always measured and timed by the same pair of experimenters to reduce variability in the experiment. Each pair of experimenters was treated as a block. Variabili Order: the overall performance order of the trial Block: the subject and experimenters' block number Height: 0 if step at the low (5.75") height, 1 if at the high (11.5") height Frequency: the rate of stepping. 0 if slow (14 steps/min), 1 if medium (21 steps/min), 2 if high (28 steps/min) RestHR: the resting heart rate of the subject before a trial, in beats per minute HR: the final heart rate of the subject after a trial, in beats per minute 12

La frequenza Il concetto di frequenza è uno dei più importanti nella statistica Frequenza assoluta: conta quanto spesso si presenta un determinato valore o intervallo di valori? Frequenza relativa: proporzione quanto spesso si presenta un determinato valore o intervallo di valori, rispetto al totale delle osservazioni? Frequenza relativa = freq. assoluta/n totale di unità statistiche Frequenza percentuale quanto spesso si presenta un determinato valore o intervallo di valori rispetto a 100 osservazioni? Frequenza percentuale = Freq relativa * 100. sort air. list air, clean noobs air 15 16 18 19 20 20 22 22 22 23 24 24 25 25 25 25 25 26 26 26 27 27 27 28 28 28 28 28 28 29 29 29 31 31 31 32 33 34 35 In 2 calci, la distanza percorsa dal pallone riempito di aria è stata uguale a 24 yds f(24)=2 13

p(24)=2/39=0.051 %(24)=0.051*100=5.1% Frequenza cumulativa assoluta Somma delle frequenze corrispondenti alle osservazioni più piccole rispetto all osservazione data più la frequenza dell osservazione stessa Frequenza cumulativa relativa Proporzione delle frequenze corrispondenti alle osservazioni più piccole rispetto all osservazione data più la frequenza dell osservazione stessa Freq cum rel = Freq. cum ass/n totale di unità statistiche Frequenza cumulativa percentuale Proporzione delle frequenze corrispondenti alle osservazioni più piccole rispetto all osservazione data più la frequenza dell osservazione stessa Freq cum perc = Freq cum rel * 100 In 12 calci, la distanza percorsa dal pallone riempito di aria è inferiore o uguale a 24 yds fc(24)=12 pc(24)=12/39=0.307 %c(24)=0.307*100=30.7% 14

Tabelle di frequenza L elaborazione di tabelle di frequenza è fondamentale per comprendere come si presentano le variabili prese in esame Le Tabelle di frequenza presentano i dati in forma sintetica, organizzati secondo righe e colonne Sono utili per ogni tipo di variabili, sia per quelle categoriche che per quelle numeriche Tabelle a singola entrata è presentata la distribuzione di frequenza di UN SOLO carattere statistico Tabelle a doppia entrata è presentata la distribuzione di frequenza di DUE caratteri statistici Tabelle a n entrate è presentata la distribuzione di frequenza di n caratteri statistici Nel caso di variabili categoriche (binomiali, nominali ed ordinali) vengono rappresentate tutte le modalità possibili e la frequenza di ciascuna modalità Nel caso di variabili numeriche (discrete e continue) i valori sono aggregati per classi. Per ciascuna classe (intervallo) di valori è rappresentata la frequenza 15

. use infortuni_sport, clear. li soggetto-infortuni, clean noobs soggetto peso altezza sport infort~i AA 63 170 Basket 3 BB 75 180 Basket 2 CC 65 170 Basket 1 DD 75 175 Nuoto 0 EE 75 170 Atletica 0 FF 80 185 Basket 3 GG 70 170 Atletica 0 HH 65 165 Pallavolo 2 LL 79 180 Nuoto 2 MM 80 175 Basket 0 NN 73 173 Basket 0 PP 66 163 Nuoto 0 QQ 65 170 Pallavolo 3 RR 70 178 Pallavolo 2 SS 60 172 Atletica 1 TT 77 177 Basket 1 VV 74 169 Pallavolo 1 ZZ 75 181 Atletica 2 Tabelle a singola entrata. tab sport Sport Freq. Percent Cum. Atletica 4 22.22 22.22 Basket 7 38.89 61.11 Nuoto 3 16.67 77.78 Pallavolo 4 22.22 100.00 Total 18 100.00. tab infortuni N di infortuni Freq. Percent Cum. 0 6 33.33 33.33 1 4 22.22 55.56 2 5 27.78 83.33 3 3 16.67 100.00 Total 18 100.00. tab altezzacat altezza Freq. Percent Cum. <170 cm 3 16.67 16.67 170-174 cm 7 38.89 55.56 175-179 cm 4 22.22 77.78 >=180 cm 4 22.22 100.00 Total 18 100.00 16

Tabelle a doppia entrata. tab sport dueinfortuni N infortuni Sport meno di 2 2 o più Total Atletica 3 1 4 Basket 4 3 7 Nuoto 2 1 3 Pallavolo 1 3 4 Total 10 8 18. tab sport dueinfortuni, row +----------------+ Key ---------------- frequency row percentage +----------------+ N infortuni Sport meno di 2 2 o più Total Atletica 3 1 4 75.00 25.00 100.00 Basket 4 3 7 57.14 42.86 100.00 Nuoto 2 1 3 66.67 33.33 100.00 Pallavolo 1 3 4 25.00 75.00 100.00 Total 10 8 18 55.56 44.44 100.00 17

Attività fisica e mortalità follow-up dell indagine ISTAT sulla salute del 2000. tab1 sex eta3 edu4 region smokeint poorhealth bmicat pa dead -> tabulation of sex sex Freq. Percent Cum. male 35,394 48.64 48.64 female 37,368 51.36 100.00 Total 72,762 100.00 -> tabulation of eta3 eta3 Freq. Percent Cum. 30-44 27,903 38.35 38.35 45-59 24,371 33.49 71.84 60-74 20,488 28.16 100.00 Total 72,762 100.00 -> tabulation of edu4 edu4 Freq. Percent Cum. high 5,503 7.56 7.56 midhigh 19,313 26.54 34.11 midlow 20,927 28.76 62.87 low 27,019 37.13 100.00 Total 72,762 100.00 -> tabulation of region region Freq. Percent Cum. north 28,053 38.55 38.55 centre 13,744 18.89 57.44 south 30,965 42.56 100.00 Total 72,762 100.00 -> tabulation of smokeint smokeint Freq. Percent Cum. ---- never 41,371 56.86 56.86 quit>9yrs 8,263 11.36 68.21 quit2-9yrs 3,824 5.26 73.47 current<=15 cig 10,015 13.76 87.23 current>15 cig 9,289 12.77 100.00 ---- Total 72,762 100.00 18

-> tabulation of poorhealth poorhealth Freq. Percent Cum. fair/good 67,067 92.17 92.17 poor 5,695 7.83 100.00 Total 72,762 100.00 -> tabulation of bmicat bmicat Freq. Percent Cum. underweight 2,121 2.91 2.91 normal 34,914 47.98 50.90 overweight 27,552 37.87 88.76 obese 8,175 11.24 100.00 Total 72,762 100.00 -> tabulation of pa pa Freq. Percent Cum. vigorous 6,485 8.91 8.91 regular 11,477 15.77 24.69 light 31,762 43.65 68.34 inactive 23,038 31.66 100.00 Total 72,762 100.00 -> tabulation of dead dead Freq. Percent Cum. 0 68,670 94.38 94.38 1 4,092 5.62 100.00 Total 72,762 100.00 Quali sono i fattori associati ad una più alta mortalità?. tab sex dead, row nokey dead sex 0 1 Total male 32,863 2,531 35,394 92.85 7.15 100.00 female 35,807 1,561 37,368 95.82 4.18 100.00 Total 68,670 4,092 72,762 94.38 5.62 100.00 19

. tab eta3 dead, row nokey dead eta3 0 1 Total 30-44 27,647 256 27,903 99.08 0.92 100.00 45-59 23,506 865 24,371 96.45 3.55 100.00 60-74 17,517 2,971 20,488 85.50 14.50 100.00 Total 68,670 4,092 72,762 94.38 5.62 100.00. tab edu4 dead, row nokey dead edu4 0 1 Total high 5,365 138 5,503 97.49 2.51 100.00 midhigh 18,809 504 19,313 97.39 2.61 100.00 midlow 20,226 701 20,927 96.65 3.35 100.00 low 24,270 2,749 27,019 89.83 10.17 100.00 Total 68,670 4,092 72,762 94.38 5.62 100.00. tab region dead, row nokey dead region 0 1 Total north 26,459 1,594 28,053 94.32 5.68 100.00 centre 12,997 747 13,744 94.56 5.44 100.00 south 29,214 1,751 30,965 94.35 5.65 100.00 Total 68,670 4,092 72,762 94.38 5.62 100.00 20

. tab poorhealth dead, row nokey dead poorhealth 0 1 Total fair/good 64,092 2,975 67,067 95.56 4.44 100.00 poor 4,578 1,117 5,695 80.39 19.61 100.00 Total 68,670 4,092 72,762 94.38 5.62 100.00. tab bmicat dead, row nokey dead bmicat 0 1 Total - underweight 1,995 126 2,121 94.06 5.94 100.00 - normal 33,304 1,610 34,914 95.39 4.61 100.00 - overweight 25,819 1,733 27,552 93.71 6.29 100.00 - obese 7,552 623 8,175 92.38 7.62 100.00 - Total 68,670 4,092 72,762 94.38 5.62 100.00. tab pa dead, row nokey dead pa 0 1 Total vigorous 6,383 102 6,485 98.43 1.57 100.00 regular 10,905 572 11,477 95.02 4.98 100.00 light 30,137 1,625 31,762 94.88 5.12 100.00 inactive 21,245 1,793 23,038 92.22 7.78 100.00 Total 68,670 4,092 72,762 94.38 5.62 100.00 21

Esercitazione La tabella seguente riporta la distribuzione di frequenza del numero di figli in un campione di famiglie Qual è l unità statistica? Quante sono le unità statistiche? Qual è la variabile in esame? Che tipo di variabile è? Quante sono le famiglie che hanno 5 figli? Quante sono in percentuale le famiglie che hanno 5 figli? Quante sono le famiglie che hanno al massimo 5 figli? Quante sono in percentuale le famiglie che hanno al massimo 5 figli? N figli frequenza 0 10 1 3 2 6 3 8 4 31 5 15 6 2 Tot 75 Esercitazione I dati seguenti rappresentano le età di 48 soggetti che frequentano un centro di riabilitazione fisica. Utilizza una tabella di frequenza per rappresentare in modo sintetico i dati 32 63 33 57 35 54 38 53 42 51 42 48 43 46 61 53 12 13 16 31 30 28 28 25 23 23 22 21 17 13 30 14 29 16 28 17 27 21 24 22 23 61 55 34 42 13 26 22 22

Rappresentazioni grafiche Oltre alle rappresentazioni tabellari, per descrivere la frequenza delle variabili in esame sono molto utili le rappresentazioni grafiche Rispetto alle tabelle di frequenza, i grafici hanno il vantaggio dell immediatezza: riescono cioè a fornire rapidamente ed in maniera efficace l informazione Le tabelle permettono d altra parte di poter effettuare confronti molteplici tra diversi sottogruppi del campione Esistono molti tipi di grafici, ognuno dei quali è utilizzato in determinate circostanze. Grafici utili a rappresentare variabili categoriche Grafico a torta Grafico a barre Grafici utili a rappresentare variabili numeriche Istogramma Poligono di frequenza Poligono di frequenza cumulativa Diagramma ramo-foglia Diagramma a scatola Diagramma a dispersione Grafico a torta Può essere rappresentato un solo carattere (qualitativo) Le modalità sono rappresentate da spicchi della torta L area della torta è proporzionale alla frequenza relativa della modalità 23

. tab sport Sport Freq. Percent Cum. Atletica 4 22.22 22.22 Basket 7 38.89 61.11 Nuoto 3 16.67 77.78 Pallavolo 4 22.22 100.00 Total 18 100.00 Atletica Nuoto Basket Pallavolo. tab due N infortuni Freq. Percent Cum. meno di 2 10 55.56 55.56 2 o più 8 44.44 100.00 Total 18 100.00 24

meno di 2 2 o più. tab sport due, row nokey nofreq N infortuni Sport meno di 2 2 o più Total Atletica 75.00 25.00 100.00 Basket 57.14 42.86 100.00 Nuoto 66.67 33.33 100.00 Pallavolo 25.00 75.00 100.00 Total 55.56 44.44 100.00 25

Atletica Basket Nuoto Pallavolo meno di 2 2 o più Graphs by Sport Grafico a barre Le modalità qualitative sono riportate in ascissa. L asse delle x è qualitativo Sull asse delle ordinate si può riportare la frequenza assoluta (numero) oppure la frequenza relativa (percentuale) Per ogni gruppo si costruisce un rettangolo la posizione della base del rettangolo (di larghezza costante) è centrata sul nome della modalità l area del rettangolo è proporzionale alla frequenza rilevata per il gruppo La scala utilizzata per gli assi deve consentire la visualizzazione dei rettangoli interi 26

0 2 4 6 8. graph bar (count) sportcat, over(sport) Atletica Basket Nuoto Pallavolo. graph bar (count) sportcat, over(sport) horiz Atletica Basket Nuoto Pallavolo 0 2 4 6 8 count of sportcat 27

0 1 2 3 4. graph bar (count) sportcat, over(due) over(sport) meno di 2 2 o più meno di 2 2 o più meno di 2 2 o più meno di 2 2 o più Atletica Basket Nuoto Pallavolo 28