ELEMENTI DI STATISTICA MEDICA ED EPIDEMIOLOGIA PER LE PROFESSIONI SANITARIE-TECNICHE

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "ELEMENTI DI STATISTICA MEDICA ED EPIDEMIOLOGIA PER LE PROFESSIONI SANITARIE-TECNICHE"

Transcript

1 ELEMENTI DI STATISTICA MEDICA ED EPIDEMIOLOGIA PER LE PROFESSIONI SANITARIE-TECNICHE Alessandra Marinoni Simona Villani Università degli Studi di Pavia 1

2 Quanto presentato è liberamente tratto dalla Dispensa n 15 - Unità didattica STATSAN SA dei Percorsi formativi per il personale dipendente del Ministero della Salute Prof.ssa Alessandra Marinoni e Dr.ssa Simona Villani Finito di stampare: Pavia, aprile 00

3 CAPITOLO I 1.1 Le caratteristiche dei fenomeni sanitari: variabilità e multidimensionalità Chiunque sia interessato allo studio delle problematiche legate alla salute dell uomo si rende conto della complessità del problema e della necessità di possedere strumenti adeguati di conoscenza. Quando l oggetto di studio è l uomo i principali problemi metodologici sono: 1. variabilità: i fenomeni biologici sono caratterizzati da una estrema variabilità sia entro lo stesso soggetto che tra soggetti. Se replico più volte la misura della pressione arteriosa sistolica su uno stesso soggetto potrò trovare valori diversi e le motivazioni di tale variabilità sono molteplici: variabilità nelle misurazioni, ritmi circadiani, stato emozionale del soggetto, diversa posizione (coricato o seduto) farmaci assunti, e così via (variabilità entro soggetto). Le rilevazioni della pressione arteriosa sistolica in soggetti diversi possono avere valori variabili per diverse motivazioni: età, sesso, razza, stato di salute per citare solo alcuni aspetti (variabilità tra soggetti).. la multidimensionalità, per cui è necessario indagare su diversi aspetti del soggetto, anche se l interesse è una specifica malattia (es. le possibilità di cura, riabilitazione o prevenzione della cardiopatia ischemica dipendono non solo della gravità della malattia, ma dalla presenza o meno di altre patologie (comorbidità) dell età del soggetto, dal sesso, dalle attività professionali, dalle condizioni socioeconomiche, dal suo livello di educazione, dalla sua personalità, etc.). Tutto ciò implica che gli aspetti da indagare non possono limitarsi alla rilevazione della presenza-assenza della patologia in studio, ma anche di una serie di altre dimensioni ad essa associate che potrebbero condizionare la corretta conoscenza del fenomeno. 3. Il soggetto oggetto di studio è condizionato dal contesto in cui vive, per cui le manifestazioni della malattia possono dipendere dall ambiente fisico, sociale e famigliare in cui si trova e dalle conseguenti interazioni uomo-ambiente. Tutto 3

4 ciò complica il processo di conoscenza dei fenomeni biologici e sanitari in particolare e rende indispensabile un metodo di approccio rigoroso. Da quanto detto, lo scenario in cui operiamo si presenta così: - unità statistica complessa: l individuo che è unico, ma deve essere analizzato nelle sue varie dimensioni e quindi ricomposto - la variabilità: ogni osservazione può essere diversa da un altra (variabilità intra individuale, tra individui, di misura, di fluttuazioni biologiche. 1. Il ruolo della statistica e del metodo scientifico in Sanità La statistica medica può essere considerata il momento empirico della scienza, fornendoci la metodologia per lo studio del vivente. La statistica medica è intesa come metodologia generale per lo studio dei fenomeni collettivi e quindi della variabilità, attraverso le seguenti modalità: a. osservazione dei fenomeni. La statistica medica insegna come occorre osservare la realtà, come raccogliere i dati, con quali strumenti, su chi, su quanti, etc. b. traduzione in simboli. La statistica medica insegna come riassumere in modo corretto i dati raccolti, cioè come esprimerli e rappresentarli in modo sintetico e appropriato in funzione del tipo di variabile e della sua distribuzione. La media e la deviazione standard, la moda, la mediana, la percentuale, i tassi, i rischi relativi, gli istogrammi, etc. rappresentano alcune delle misure di sintesi di variabili raccolte, ciascuna rispondente ad uno specifico obiettivo come vedremo più avanti. c. evidenza delle irregolarità. Una appropriata analisi statistica di variabili raccolte, consente di evidenziare quei fenomeni che si scostano dalla normalità cioè dai valori più frequenti in un set di dati: spesso l approfondimento su tali irregolarità è molto informativo e può generare nuove ipotesi. d. verifica di ipotesi. È l aspetto più interessante della metodologia statistica: la possibilità di verificare se un ipotesi posta sia o no sia confutata dalla osservazione della realtà, come sarà sviluppato nel capitolo sulla inferenza statistica. 4

5 Uno dei principali contributi della statistica medica alla conoscenza dei fenomeni biologici è quello di fornirci i metodi per analizzare la variabilità, scomponendola nelle sue componenti di tipo: - sistematico ossia quella parte di variabilità che possiamo attribuire ad una causa (età, sesso, comorbidità, etc.), detta anche variabilità spiegata o prevedibile; - casuale ossia quella parte di variabilità che non riusciamo ad attribuire ad una causa (è detta anche variabilità non spiegata, imprevedibile, e genericamente biologica ). Il fatto che due fratelli gemelli, apparentemente uguali possano avere valori di altezza diversi, o che rilevazioni successive della pressione arteriosa sistolica sullo stesso soggetto in tempi ravvicinati diano valori diversi, etc. sembra logicamente inspiegabile. In base alle sue funzioni, la statistica si può distinguere in: a) statistica descrittiva il cui obiettivo è quello di riassumere i dati sanitari raccolti calcolando le opportune statistiche descrittive e/o indicatori che in modo sintetico descrivano il fenomeno studiato. La statistica descrittiva rappresenta sempre la prima fase di qualsiasi ricerca, o può essere lo scopo di uno studio conoscitivo esplorativo; b) statistica inferenziale il cui obiettivo è quello di ricavare dallo studio condotto leggi generali che si intendono estendere alla popolazione e/o ad altre situazioni simili. I due momenti fondamentali sono: - la stima dei parametri. Ad esempio lo studio antropometrico di un campione di bambini maschi dai 6 ai 14 anni può consentire di stimare gli intervalli di altezza entro cui dovrebbero collocarsi le altezze dei bambini della stessa fascia di età e della stessa popolazione con un certo livello di probabilità (intervallo di confidenza attorno alla media); - la verifica di ipotesi. Lo scopo della statistica inferenziale è quello di stimare la probabilità che le differenze osservate nei dati di gruppi diversi siano interamente dovute a variabilità casuale piuttosto che a differenze della sottostante popolazione di riferimento. Per capire la statistica inferenziale è necessario introdurre il concetto di popolazione e campione. 5

6 CAPITOLO II.1 Popolazione e campione Spesso non è possibile studiare l intera popolazione che interessa. La statistica ci offre la possibilità di selezionare un sottoinsieme di tale popolazione (un campione), analizzando il quale si possono trarre conclusioni sull intera popolazione. Perché ciò sia possibile è necessario che la metodologia adottata sia corretta e rigorosa. Lo schema logico di tale processo è illustrato nella seguente figura:.1.1 Popolazione target o popolazione obiettivo È l insieme di tutti gli ipotetici elementi oggetto del nostro interesse. La popolazione obiettivo può essere: - finita se è possibile produrre l elenco di tutti gli elementi oggetto di interesse. Ad esempio: desidero conoscere le anomalie di comportamento (droghe, alcool, etc.) 6

7 dei giovani adolescenti frequentanti le scuole medie superiori ed inferiori dell area sanitaria di mia competenza (ASL) ai fini di organizzare un programma di educazione sanitaria nelle scuole. In tal caso la popolazione oggetto di studio è finita, in quanto mi interessa quella specifica popolazione di studenti residenti in quella zona specifica in cui voglio attuare gli interventi di prevenzione. - Infinita quando si tratta di una popolazione ideale, di cui non è possibile produrre un elenco, in quanto spesso deve ancora verificarsi. Se ad esempio, l obiettivo del mio studio è quello di valutare l efficacia di un trattamento di disintossicazione dalla tossicodipendenza in giovani adolescenti, la popolazione obiettivo è costituita da tutti quei giovani adolescenti che sono tossicodipendenti, ma anche che potranno diventarlo in futuro, che risiedono ove io conduco lo studio, ma anche in altre parti del paese e del mondo. In tal caso la popolazione di interesse e che potrà beneficiare dei risultati dello studio è infinita..1. Popolazione campionata (o base di campionamento) Rappresenta l aspetto operativo della popolazione obiettivo. Nel caso in cui la popolazione sia finita (utenti di un servizio, residenti di una città, di un ASL, etc.) è possibile ottenere la lista dei soggetti della popolazione stessa. Se la popolazione obiettivo è infinita non è possibile ottenere la lista di soggetti. In tal caso si sceglie una definizione operativa della popolazione. Ad esempio per valutare l efficacia di un intervento terapeutico per tossicodipendenti se si opera a Pavia, si potrà scegliere di effettuare la sperimentazione sugli utenti dei servizi dei SERT della provincia di Pavia, per motivi pratici e di fattibilità (si hanno buoni rapporti con i responsabili dei servizi, sono conosciuta dalla popolazione, le distanze sono limitate, etc.). L assunto è che i tossicodipendenti frequentanti i SERT di Pavia non siano diversi da quelli che potrebbero frequentare altri SERT italiani o di altre parti del mondo, e che se dimostrerà l efficacia di un trattamento per tale gruppo di soggetti ci si aspetta che ciò sarà valido anche per altri. Tale assunto è molto ambizioso e non sempre è verificato e la generalizzazione alla fine dello studio dovrà essere molto prudente e verificata con le opportune analisi. Tuttavia è l unico approccio che rende fattibile lo studio! 7

8 .1.3 Il campione Non potendo per ragioni pratiche condurre uno studio su tutti i soggetti della base di campionamento (per ragioni di costi, di tempi ed anche etici), la statistica offre i metodi per selezionare un sottoinsieme di tale popolazione, di numerosità limitata, ma adeguata su cui si condurrà in pratica lo studio. Il processo di selezione si chiama campionamento. Selezionato il campione, ed effettuata la raccolta dei dati, prima di sottoporli alla analisi occorre controllarne la qualità con gli opportuni metodi e quindi i dati validati vengono sottoposti alle usuali elaborazioni di statistica descrittiva. La fase successiva di stima dei parametri ed inferenza sulla popolazione sono molto più ambiziose in quanto dall analisi di un gruppo limitato di soggetti si ha la pretesa di trarre conclusioni su tutta la popolazione. Tale processo è corretto solo se vengono rispettate in modo rigoroso le regole di campionamento che la metodologia statistica indica, e che si basano sulle leggi della probabilità (teoria del campionamento), la cui trattazione esula dal livello di questo corso ma di cui è bene essere consapevoli. Il processo si conclude con la estensione dei risultati trovati alla popolazione campionata e da questa alla popolazione obiettivo. In ciascuno di questi processi inferenziali si possono condurre errori di tipo logico (bias) e pertanto occorre procedere con estrema prudenza e senso critico. Se ad esempio i SERT di Pavia non offrissero alcune prestazioni (metadone, etc.) alcuni tossicodipendenti potrebbero recarsi in altri servizi e quindi alcune tipologie di soggetti sarebbero assenti dal nostro campione (errore di selezione o bias di selezione).. Tipi di campionamento La metodologia con cui si selezionano i soggetti (o le unità statistiche) dalla popolazione si chiama campionamento. Distinguiamo diversi metodi di campionamento non alternativi, ma ciascuno indicato in specifici contesti, che solo l esperienza di ricerca in campo clinico ed epidemiologo consente di verificare. Una prima distinzione è la seguente: 8

9 I) campionamenti probabilistici: la scelta delle unità statistiche da sottoporre allo studio è regolata dalle leggi della probabilità; II) campionamenti non probabilistici: la scelta delle unità statistiche da sottoporre allo studio non è di tipo probabilistico...1 Campionamenti probabilistici A. Casuale semplice. Per la scelta dei soggetti (o unità statistiche) si segue un criterio che garantisca la stessa probabilità a tutti i componenti della base di campionamento di entrare a far parte del campione. Occorre quindi affidarsi ad un metodo che garantisca la casualità, così che la differenza tra popolazione e campione sia solo di tipo numerico: Sistematicità. Si introduce una regola fissa di selezione che sia indipendente dalle caratteristiche che poi si vanno a misurare (esempio: 1 soggetto ogni 10 partendo da un numero a caso; il primo nato di ogni mese; il paziente che sta nel letto di ogni stanza, etc.). Randomizzazione. Si ricorre ad un criterio di generazione di numeri casuali (lancio di dadi, tabelle dei numeri casuali, programmi per PC che generino numeri casuali, etc.). Il campione sarà costituito da quegli elementi della base 9

10 di campionamento (opportunamente numerati) che corrispondono ai numeri selezionati. B. Casuale stratificato. In campo clinico ed epidemiologico è difficile che non siano disponibili informazioni su caratteristiche della popolazione, che potrebbero essere associate alle variabili in studio la cui presenza potrebbe confondere i risultati finali (fattori confondenti). Per tener conto di tali fattori occorre non solo che siano raccolti, ma anche eliminati. Uno dei metodi utilizzati è quello della stratificazione, cioè la suddivisione della base di campionamento in strati omogenei per quelle caratteristiche. Il campione è scelto in modo casuale da ciascuno degli strati. Campionamento stratificato a numero proporzionale. In tal caso il campione riproduce la stessa proporzione della popolazione generale di elementi nei singoli strati, cioè la distribuzione dei fattori di stratificazione nel campione è la stessa di quella della popolazione. Si ricorre a tale tipo di campionamento, quando la popolazione obiettivo coincide con la popolazione campionata e quindi si è interessati ad ottenere un campione che risponda il più fedelmente possibile alla popolazione. Se ad esempio si è interessati a studiare la prevalenza di asma nella popolazione adulta di Pavia (0-69 anni) ai fini di dimensionare i servizi per 10

11 le patologie allergiche e respiratorie, essendo il sesso e l età due caratteristiche associate alla malattia, si eseguirà un campionamento stratificato proporzionale. Campionamento stratificato a numero fisso. In tal caso la scelta casuale dai singoli strati sarà effettuata prelevando uno stesso numero di soggetti dagli starti, così da ottenere un campione bilanciato per i fattori confondenti. Ad esempio, in uno studio europeo (ECRHS) per conoscere la prevalenza dell asma nei vari paesi e identificare i fattori di rischio, si è deciso di scegliere per ogni area un campione di 3000 soggetti stratificando la popolazione generale adulta per età e sesso, ma a numero fisso (1500 maschi e 1500 femmine, con numerosità fissa per età) non essendo la popolazione dell area il vero obiettivo dello studio, ma solo operazionale. C. A grappolo. In tal caso il campionamento è effettuato in due momenti successivi: campionamento di unità aggregate; campionamento di unità individuali. Tale tecnica di campionamento è utilizzata quando la ricerca deve essere svolta in aree ampie e dove è possibile utilizzare aggregati di soggetti. Se ad esempio l obiettivo dello studio è di conoscere la diffusione della carie dentaria, tra i ragazzi in età scolare e identificarne i fattori di rischio l approccio più ovvio è quello di condurre un indagine nelle scuole. Non essendo realistico effettuare una visita odontoiatrica a tutti i ragazzi frequentanti la scuola dell obbligo della nostra area, si può scegliere: un campione di plessi scolastici distribuiti nelle varie zone geografiche o socioeconomiche dell ASL e per tipo di scuola(unità aggregate); un campione di sezioni all interno di ogni plesso (unità aggregate); tutti gli alunni delle sezioni così scelte. Ciò consentirebbe di concentrare le risorse salvaguardando la necessità di rappresentatività delle diverse tipologie di scuole e quindi di alunni, in modo realizzabile praticamente. D. Multistadi. 11

12 Si tratta di un campionamento che si svolge a stadi successivi con numerosità decrescente e a progressivo livello di approfondimento. Se ad esempio si vuole conoscere la diffusione di asma in una popolazione generale, si può procedere a stadi successivi, come di seguito esemplificato. I stadio: campione casuale di 3000 soggetti sottoposto a indagine postale mediante un questionario di sintomi standardizzato. Sulla base di tale indagine è possibile individuare un gruppo di soggetti con sintomi riferibili ad asma, un gruppo di soggetti senza sintomi e ad un gruppo borderline. II stadio: da ciascuno dei gruppi precedenti vengono campionati soggetti da sottoporre a indagine più approfondita (con esame clinico, esami strumentali ed ematologici, etc.). Tale procedura, se condotta in modo corretto con la numerosità necessaria, consente di ottenere risultati di ottima qualità con bassi costi. Tutti i tipi di campionamento, ad eccezione di quello casuale semplice, richiedono particolari metodi di analisi per effettuare le stime dei parametri di interesse... Campionamenti non probabilistici Quando è possibile definire la popolazione obiettivo e non si dispone di una base di campionamento, si ricorre a tecniche di campionamento non probabilistico. a) Campionamento a quote. Si decide di arruolare nel campione un certo numero di soggetti con le caratteristiche di interesse e si esaminano (esempio volendo conoscere l opinione di alcuni utenti di un servizio sul comportamento degli operatori, si intervistano 0 maschi e 0 femmine tra gli utenti di giorni diversi della settimana). b) Campionamento a valanga. Si tratta di una metodologia di campionamento che coinvolge inizialmente pochi soggetti a cui si chiede di coinvolgerne altri (amici, conoscenti con le caratteristiche di nostro interesse). Ad esempio, se si desidera conoscere quali siano i problemi di accesso ai servizi degli immigrati extracomunitari di una certa città: si inizia con l intervistare i gruppi che stazionano agli ingressi dei supermercati, e si chiede loro di coinvolgere amici o compaesani. c) Campionamento a scelta ragionata (judgement). 1

13 Per alcuni studi interessa conoscere l opinione dei personaggi chiave, che si ritiene in grado di fornirmi informazioni interessanti sull argomento. La scelta del campione è allora ragionata nel senso che è il gruppo di ricercatori che decide chi scegliere per lo studio. A tale approccio si ricorre spesso negli studi valutativi e di accreditamento dei servizi. d) Campionamento accidentale. Per studi esplorativi si ricorre a campioni occasionali su pochi casi: l obiettivo è spesso quello di messa a punto di metodologie di indagine. Va sottolineato che i campioni non probabilistici non consentono la generalizzazione come indicato nella figura a pagina 9. 13

14 CAPITOLO III 3.1 I disegni degli studi epidemiologici Le indagini epidemiologiche, cioè gli studi sulle condizioni di salute della popolazione generale, possono essere classificati in studi osservazionali o studi sperimentali, come schematizzato in tabella 1 riporta i tipi di studio epidemiologico. Gli studi osservazionali sono quegli studi in cui il ricercatore si limita ad osservare ciò che accade, rilevando le caratteristiche di interesse (presenza di malattie, di fattori di rischio o causali, etc.) senza intervenire. Gli studi sperimentali sono quegli studi in cui il ricercatore interviene attivamente per modificare un determinante della malattia (come un esposizione o il comportamento) o il suo progredire (come un trattamento). Gli studi sperimentali implicano quindi che il ricercatore somministri (o tolga) il fattore di cui vuole studiare l effetto. Per ragioni etiche gli studi, sperimentali sull uomo sono limitati a quelli di tipo terapeutico o preventivo: se l obiettivo è quello di trovare fattori di rischio o causali di patologie, il tipo di studio non può essere sperimentale ma osservazionale! 3. Studi osservazionali e studi sperimentali 1. Gli studi osservazionali, in base allo scopo, si dividono in: a) studi descrittivi. L obiettivo è quello di descrivere lo stato di salute di una popolazione, attraverso l uso di dati routinari: rappresentano in genere il primo approccio alla conoscenza di un problema epidemiologico. Si tratta di studi semplici, il livello informativo è limitato. b) studi analitici. L obiettivo è quello di studiare le relazioni tra malattia e altre variabili supposte fattori di rischio o causali. La maggior parte degli studi epidemiologici sono di tipo analitico. In base al disegno della ricerca gli studi analitici si distinguono in: 14

15 b 1 - studi ecologici; l obiettivo è quello di esplorare la plausibilità di relazioni tra fattori di rischio (determinanti) e patologie (outcome). Le unità di analisi sono popolazioni di soggetti e non individui: inoltre il fattore e l effetto non sono raccolti sullo stesso individuo. Ad esempio, ipotizzando che esista una relazione tra fumo di sigaretta e tumore del polmone, un primo approccio è quello di verificare se la mortalità per tumore al polmone di diversi paesi è associata alle vendite di tabacco in quei paesi. L associazione così evidenziata (correlazione ecologica) rappresenta una evidenza a favore dell ipotesi anche se non conclusiva, in quanto il rischio di bias in tali studi è molto elevato. b - studi trasversali o di prevalenza; l obiettivo di tali studi è quello di misurare la diffusione di una patologia (o stato morboso) in una popolazione generale e in gruppi di popolazione a rischio. Si effettuano su campioni casuali della popolazione obiettivo (studi campionari) o su intere popolazioni (studi esaustivi). La misura di malattia prodotta è il N di persone con la malattia in un momento specificato Tasso di prevalenza = 1000 N di persone nella popolazione a rischio in un momento specificato Se i dati sono stati raccolti in un preciso momento temporale, si ottiene il tasso di prevalenza puntuale. Più frequentemente, il tasso è calcolato in un periodo (mese o anno) e si chiama tasso di prevalenza periodale, inteso come numero di persone che presentano la situazione morbosa in un definito periodo, nella popolazione a rischio nello stesso periodo. Indipendentemente dalla durata dello studio, il fatto importante è che lo stato di salute del soggetto è valutato in un definito momento contemporaneamente alla rilevazione degli eventuali fattori di rischio e confondenti. In altre parole, tutte le rilevazioni sul soggetto vengono effettuate una sola volta. 15

16 Se si valuta il tasso di prevalenza in gruppi a diversa esposizione al fattore di rischio, si può calcolare una misura di associazione nota come Rischio Relativo. Ad esempio, è stato calcolato il tasso di prevalenza di asma in un area a basso livello di inquinamento ambientale (A) e in un area ad alto inquinamento ambientale (B): Il Rischio Relativo è: Area A: tasso di prevalenza 0,3% Area B: tasso di prevalenza 0,8% 0,8 RR = = 0,3 Ciò significa che chi risiede nell area B ha,7 volte più rischio di essere,7 malato di asma rispetto a chi vive nell area A. b 3 - studi longitudinali o di incidenza o di coorte; l obiettivo di tali studi è quello di valutare l insorgenza della patologia di interesse nella popolazione e in gruppi a rischio. Tali studi prevedono sempre almeno due rilevazioni successive sui soggetti: nella prima fase si sceglie un campione di popolazione senza la malattia in studio (coorte) si raccolgono le variabili di interesse (fattori di rischio, protettivi, etc.) e si segue nel tempo stabilito (follow-up) tale coorte, rilevando l insorgenza dei casi della malattia, che ovviamente saranno nuovi casi 16

17 Le misure di malattia sono il: a) tasso di incidenza (I): N di persone che si ammalano nel periodo scelto Tasso di incidenza tempo - persona = 1000 Somma dei tempi durante i quali ogni soggetto della coorte è a rischio Tale tasso tiene cioè conto del periodo di osservazione specifico per ogni individuo della coorte. Va sempre specificato il periodo di follow-up (anno, mese, etc.). b) tasso di incidenza cumulato (IC): è una misura più semplice, che valuta i nuovi casi di malattia sulla popolazione a rischio all inizio dello studio: N di persone che si ammalano nel periodo IC = 1000 N di soggetti liberi dalla malattia all'inizio dello studio Anche questo tasso va riferito al periodo in studio. Esso rappresenta la probabilità che un soggetto della coorte libero da malattia ha di sviluppare la malattia nel periodo di follow-up. Le misure di associazione. Dagli studi longitudinali si ricava anche il Rischio Relativo: RR = IC IC negli esposti nei non esposti Esempio: si consideri una coorte di 1000 soggetti di cui 300 fumatori e 700 non fumatori. Alla fine del periodo di follow-up (di 5 anni) si 17

18 valutano quanti soggetti si sono ammalati di tumore al polmone nei due gruppi e si ottengono i seguenti risultati: MALATTIA Sì No FUMO Sì No Le Incidenze Comulative (IC) sono pertanto: 0 IC totali = 1000 in 5 anni = 0% IC fumatori = 1000 in 5 anni = 50% IC non fumatori = 1000 in 5 anni = 5,7% 700 IC RR = IC fumatori non fumatori = 50 5,7 = 8,8 I fumatori hanno un rischio di 8,8 volte più elevato di ammalarsi in 5 anni di tumore al polmone rispetto ai non fumatori. Vale la pena di ricordare la diversa capacità informativa dei due tipi di studio ed i legami tra le misure fornite. Prevalenza e Incidenza La prevalenza è legata all incidenza da P IC d dove P = Prevalenza, IC = Incidenza, d = durata della malattia. La prevalenza comprende infatti sia i nuovi casi (IC) ma anche i vecchi casi di malattia condizionatamente alla sua durata. Nel caso di patologie acute i due tassi sono quasi coincidenti, nel caso di patologie croniche a lunga sopravvivenza i due tassi sono molto diversi. 18

19 b 4 - studi caso-controllo; l obiettivo è quello di individuare i fattori di rischio o protettivi per una patologia. Si identificano due gruppi di soggetti da una stessa popolazione casi = soggetti con la patologia in esame controlli = soggetti senza la patologia in esame Si ricerca quindi la presenza attuale o passata dei supposti fattori di rischio nei due gruppi come illustrato nella seguente figura Ad esempio, è stato condotto uno studio per valutare il rischio di morire se non si indossa il casco in gravi incidenti che coinvolgono motociclisti: si sono scelti come casi 100 soggetti morti in incidenti e 100 soggetti sopravvissuti. I risultati ottenuti sono i seguenti: CASCO Casi Controlli Sì No Si nota che su 00 incidenti gravi, il 45% era senza casco, ma la distribuzione dei soggetti senza casco è diversa tra casi e controlli. Infatti, 19

20 tra i casi i soggetti senza casco sono il 70% mentre tra i sopravvissuti sono solo il 0%. La misura di associazione appropriata è l Odds Ratio (OR) cioè il rapporto delle probabilità di esposizione tra i casi e la probabilità di esposizione tra i controlli. Nell esempio considerato l esposizione è il non usare il casco : OR = = = 9, cioè il rischio di morire in un grave incidente è 9,3 volte più elevato in chi non ha il casco rispetto a chi lo porta. L Odds Ratio è una buona stima del Rischio Relativo, soprattutto se la patologia è rara, perché i casi ed i controlli siano tratti dalla stessa popolazione.. Gli studi sperimentali. L obiettivo di tali studi è quello di evidenziare l associazione tra un fattore (trattamento) e un effetto (modificazione dello stato di malattia): si possono quindi considerare studi analitici, in cui il fattore è somministrato, ad un certo momento, dal ricercatore. Rispetto alla valutazione di una relazione, gli studi sperimentali consentono di conoscere la precedenza temporale del fattore rispetto all effetto. Inoltre, essendo il fattore somministrato secondo criteri casuali ai soggetti selezionati, si garantisce un equa distribuzione dei fattori confondenti tra i gruppi in studio. Pur rappresentando quindi un disegno di studio vantaggioso, non è sempre attuabile quando l oggetto di studio è l uomo. Per ovvi motivi etici possiamo, infatti, condurre studi sperimentali solo quando l intervento previsto è positivo per il soggetto (trattamento terapeutico o preventivo) e non per l identificazione di fattori casuali o supposti di rischio per lo sviluppo della malattia. Schematicamente distinguiamo diversi tipi di studi sperimentali sull uomo: - sperimentazioni cliniche controllate randomizzate. L obiettivo è quello di valutare l efficacia di un intervento terapeutico o riabilitativo e quindi riguarda pazienti affetti da malattia. - sperimentazioni sul campo (field trials). 0

21 L obiettivo è quello di valutare l efficacia di interventi di prevenzione sui soggetti esposti a rischio, ma non ancora malati. Rientrano in questo tipo di studi le sperimentazioni di nuovi vaccini, le sperimentazioni di farmaci o diete per soggetti con ipercolesterolemia o sovrappeso, e così via; Si tratta di studi piuttosto complessi poiché implicano dapprima uno studio sul campo per individuarne i soggetti a rischio, da sottoporre poi ad una sperimentazione. - sperimentazioni di comunità (community trial). L obiettivo è quello di verificare l efficacia di interventi preventivi effettuati su comunità, anziché sui singoli individui. È utilizzato soprattutto nel caso di patologie che riconoscono fattori di rischio sociali e ambientali, per cui è possibile agire direttamente su tali fattori. 1

22 Denominazione Unità epidemiologica Tabella 1 Tipi di studio epidemiologico Misure di malattia Misure di associazione Possibili applicazioni Rischio di bias Capacità di evidenziare relazioni causali 1) Osservazionali a) descrittivi soggetti comunità statistiche descrittive mortalità morbosità indici correlazioni etc. - studi pilota - studi esplorativi altissimo nessuna (talora generazione di ipotesi) b) analitici b 1 ) ecologici popolazioni gruppi correlazione ecologica - patologie rare - rend alto generazione di ipotesi b ) trasversali soggetti prevalenza ~ RR - diffusione patologie - fattori di rischio b 3 ) coorte o longitudinali soggetti incidenza RR - comparsa di nuovi casi di malattia - fattori di rischio - effetto di interventi medio medio-basso (rischio di perdite al follow-up) b 4 ) caso-controllo soggetti OR - fattori di rischio medio media ) Sperimentali 1) RCT (sperimentazioni soggetti trattamento-esito - valutazione efficacia trattamenti basso buona cliniche controllate) ) Trial sul campo soggetti intervento-comparsa di - valutazione efficacia interventi basso buona malattia preventivi 3) Trial in comunità comunità intervento-comparsa di malattia - valutazione efficacia interventi preventivi medio medio bassa media

23 CAPITOLO IV 4.1 Metodi di analisi dei dati e loro interpretazione Prima di vedere i metodi di analisi dei dati e la loro interpretazione, è opportuno introdurre alcuni termini fondamentali. Un esempio pratico consentirà di comprendere meglio i concetti che saranno esposti. Il direttore generale di una certa ASL vorrebbe sapere qual è il grado di diffusione delle patologie cronicodegenerative nella popolazione residente sul territorio dell Azienda Sanitaria da lui diretta, al fine di meglio orientare le risorse disponibili. Pertanto è condotto uno studio su un campione di 500 persone dai 0 ai 59 anni di età estratte in modo casuale dalle liste dei medici di famiglia. Ogni individuo costituisce la minima unità da cui si raccolgono le informazioni ed è detta unità statistica. Le informazioni su ogni soggetto sono raccolte mediante un intervista effettuata a domicilio da personale opportunamente addestrato utilizzando un questionario semistrutturato, contenente oltre che le caratteristiche anagrafiche (sesso, età, stato civile, scolarità) diverse domande indaganti lo stato di salute di ogni rispondente rispetto alla presenza e assenza di cardiopatia ischemica, vasculopatie periferiche o cerebrali, ipertensione, diabete, oltre che valori di pressione (sistolica o PAS e diastolica o PAD), la concentrazione all eventuale ultimo prelievo effettuato negli ultimi 1 mesi di colesterolo, HDL, LDL, glicemia. Ciascuna informazione raccolta con il questionario è detta variabile. La natura delle variabili è varia entro uno studio, nel senso che alcune misurano la presenza di determinati stati con cui la caratteristica si può presentare (basti pensare al colore dei capelli, che può essere nero, marrone, rosso, biondo), altre misurano in termini quantitativi come una determinata caratteristica si presenta e la esprimono per mezzo di un numero (si pensi alla pressione sistolica). Formalmente le variabili si dicono: 1) qualitative e si suddividono in nominali e ordinali. Una variabile si dice nominale dicotomica o politomica quando assume rispettivamente due o più stati tra loro non ordinabili. A titolo di esempio si ricordino per le variabili nominali dicotomiche il sesso (maschio/femmina) e la cardiopatia ischemica 3

24 (assente/presente); per quelle nominali politomiche il gruppo sanguigno (A, B, AB, 0). Quando è possibile individuare un ordine tra gli stati assumibili, la variabile si dice ordinale: e il grado di istruzione (analfabeta, licenza elementare, licenza media inferiore, diploma superiore, laurea) o la gravità di un sintomo (lieve, medio, forte) ne sono un esempio; ) quantitative o numeriche quando specificano il valore assumibile mediante un conteggio (come può essere il numero di attacchi anginosi e di gravidanze) o una misurazione (il peso, l altezza, il livello di colesterolo). Nel primo caso la variabile si dice discreta perché può assumere solo valori interi, nel secondo continua perché potrebbe assumere qualsiasi valore compreso in un intervallo se il grado di precisione dello strumento di misurazione impiegato fosse sufficientemente elevato. L informazione contenuta in ogni questionario è stato utilmente informatizzata (in un foglio elettronico Excel) così da ottenere una matrice dei dati, costituita da tante righe quanti erano i soggetti intervistati (500) e da tante colonne quante erano le informazioni o variabili raccolte con il questionario. In generale, leggendo una riga della matrice si ha l informazione di un soggetto per tutte le variabili, leggendo una colonna si ha per una stessa variabile l informazione su tutti i soggetti. Dopo un accurato controllo di qualità è iniziata la descrizione dei dati. 4. La statistica descrittiva La statistica descrittiva comprende (come già detto) quelle tecniche che consentono di sintetizzare i dati o variabili raccolte in una ricerca. Secondo la natura delle variabili indagate sarà corretto l impiego di una o diverse misure di sintesi Le frequenze e i grafici Per poter rispondere alla domanda: quanti sono gli ipertesi e quanti i normotesi, è necessario scegliere la colonna della matrice nella quale l informazione sulla ipertensione è stata inserita, e andare a contare quante volte compare la parola presente e quante volte quella assente. Ovviamente la somma dei due conteggi sarà uguale al totale delle osservazioni effettuate. 4

25 Così facendo altro non si determina che la distribuzione di frequenza assoluta di una variabile, da cui si può ricavare quella relativa rapportando il conteggio di ogni modalità al totale delle osservazioni fatte, e moltiplicando quest ultima per 100 si ottiene quella percentuale: IPERTENSIONE Frequenza Frequenza Frequenza assoluta Relativa percentuale Presente 01 01/500=0,40 40% Assente 99 99/500=0,60 60% Totale /500=1,00 100% Leggendo la colonna relativa alla distribuzione di frequenza percentuale (Frequenza percentuale) si sa che per la variabile ipertensione la frequenza percentuale della modalità presente è del 40 % ossia che l ipertensione è presente nel 40% dei soggetti campionati. Le distribuzioni di frequenza sono il primo modo con cui vanno sintetizzate le informazioni, siano esse variabili qualitative come il sesso oppure quantitative come la PAS. In tal caso sarebbe auspicabile prima raggruppare in classi i valori osservati e calcolarne la distribuzione di frequenza. Poi sulla base di questa distribuzione, costruire un grafico Dalla tabella riportata a lato, si deduce che la frequenza percentuale per la classe [ ) mg/100 ml è 11%, ossia si ricava che l 11% dei soggetti campionati presentano un valore di colesterolo compreso tra 160 e 180 mg/100ml. o istogramma a canne d organo del tipo: 40% 30% 0% 10% 0% [110-10) PRESSIONE SISTOLICA [10-130) [ ) [ ) [ ) intervallo di classe di 10 mmhg Colesterolo (mg/100ml) Frequenza % [ ) 4 [ ) 11 [180-00) [00-0) 4 [0-40) 19 [40-60) 10 [60-80) 7 [80-300) [ ) 5

26 Per le variabili quantitative è possibile determinare la distribuzione di frequenza cumulata partendo da quella assoluta, oppure relativa o percentuale, come esemplificato nella tabella sottostante per la distribuzione di frequenza percentuale del colesterolo raggruppato in classi: Colesterolo (mg/100ml) Frequenza % Freq. Cumulata % [ ) 4 4 [ ) =15 [180-00) 4+11+=37 [00-0) =61 [0-40) =80 [40-60) =90 [60-80) =97 [80-300) = La frequenza cumulata percentuale alla classe [ ) è pari al 15% e ci dice qual è la percentuale di soggetti che presentano un valore di colesterolo ematico fino a 180 mg/100ml : infatti, si determina sommando la frequenza percentuale per la classe [ ) con la frequenza percentuale per la classe [ ). 4.. Le misure di sintesi Nel caso di variabili quantitative sono però calcolabili altre importanti misure di sintesi che vanno sotto il nome di misure o statistiche descrittive: la media, la mediana, i percentili, la moda, sono tra le misure di posizione; il range, la varianza, la deviazione standard, sono alcune misure di dispersione o variabilità. Tali misure sintetizzano in un unico valore numerico l informazione raccolta e ciò è particolarmente vantaggioso nel caso di campioni numerosi, dove è possibile trovare differenti e svariati valori assunti dalla variabile quantitativa esaminata. La media aritmetica è la somma dei valori che una variabile assume per ogni unità statistica osservata divisa per il numero di unità statistiche e si indica con x (si legge ics sopra segnato) o M quando si tratta di un campione: x n i= = 1 n x i 6

27 e con la lettera greca µ (si legge mi) quando si tratta di una popolazione e in tal caso si parla di parametro. La mediana è il valore della variabile che divide esattamente a metà la serie ordinata (in senso crescente o decrescente) delle osservazioni. I percentili dividono la serie ordinata delle osservazioni in 100 parti, contenenti ciascuna l 1% delle osservazioni. I più noti sono: il 5 percentile che lascia prima di sé il 5% delle osservazioni e il 75% dopo, il 50 percentile che lascia il 50% prima e il 50% dopo, il 75 percentile che lascia il 75% prima e il 5% dopo. Come si può facilmente dedurre da quanto sopra detto il 50 percentile coincide con la mediana. La moda è il valore che la variabile assume con maggior frequenza. Può esserci più di una moda. Il range è la differenza tra il valori massimo e il valore minimo osservati per una certa variabile. Tale misura di variabilità tende però a diventare più grande aumentando il numero di osservazioni e comunque non ci dice quanto siano dispersi tra il massimo e il minimo i valori della variabile esaminata. Più utile sarebbe allora determinare la distanza o scarto di ogni (i-esima) osservazione dalla media e poi fare la media di queste distanze, così da determinare la distanza media: ( x) x i n Purtroppo però il numeratore di questo rapporto, cioè la somma degli scarti delle osservazioni dalla media, è 0. Per ovviare a questo problema una delle possibilità è l elevamento a quadrato di ogni scarto, che porta sempre a valori positivi. La somma di tali scarti elevati al quadrato è detta anche devianza. A questo punto sarà possibile calcolare la media dei quadrati degli scarti intorno alla media che è la misura di sintesi nota come Varianza = ( x i x) ( n 1) indicata solitamente con s, nel caso di un campione, o con σ (si legge sigma), se si tratta di popolazione. Al denominatore anziché n si può mettere (n 1) ossia i gradi libertà, ricordando così un solo modo per calcolare la varianza. I gradi di libertà è il numero di quantità indipendenti tra tutte quelle osservate, dove per quantità si 7

28 intendono gli scarti dalla media di tutte le n osservazioni : tenuto conto il vincolo che la somma degli scarti delle osservazioni dalla media è uguale a zero, noti (n 1) scarti si trova per differenza l nsimo valore. Come si deduce dalla stessa definizione, la varianza esprime i valori della dispersione elevati al quadrato. Il modo per ritornare ad esprimere la dispersione nella stessa unità di misura della media è estrarre la radice quadrata della varianza, ossia: s = n ( xi x) ( 1) Così facendo si determina la cosiddetta deviazione standard, indicata con s o DS per un campione, o σ se si tratta di popolazione. Per meglio capire quanto sopra spiegato, consideriamo il seguente esempio: si supponga avere un campione di 8 studenti di medicina da cui è raccolta l informazione sull altezza 171, 168, 174, 17, 180, 175, 176, 177 (in cm). La media dell altezza è pari a 174,15 cm. Calcolando gli scarti di ogni osservazione dalla media e sommandoli (seconda colonna), si otterrebbe zero. x i x ( x i x) ( x i x) ,15 = 6,15 37, ,15 = 3,15 9, ,15 =,15 4, ,15 = 0,15 0, ,15 = +0,875 0, ,15 = +1,875 3, ,15 = +,875 8, ,15 = +5,875 34,516 0,000 98,878 Elevando al quadrato gli scarti tale problema si elimina (terza colonna), quindi la varianza è ( x) x i 98,878 = = 14,1549 cm n 1 7 e la deviazione standard sarà la sua radice quadrata pari a 3,76 cm. Tornando al caso dell esempio iniziale, nel campione esaminato di 500 individui per la variabile colesterolo si avrebbe: x = 03,56 µg/100ml; mediana=175 µg/100ml; 8

29 min=145 µg/100ml; max=390 µg/100ml; s=80,66 µg/100ml; R=45 µg/100ml Nel caso di variabili quantitative i cui valori sono osservati più di una volta, ossia con frequenza ripetuta, o riclassificati in classi, allora sarà necessario pesare per tale frequenza tanto nella stima della media quanto in quella della varianza e della deviazione standard. Precisamente il numeratore della media, della varianza e della deviazione standard va moltiplicato per la frequenza f i (o f k ) con cui il valore x i (o x k ) si osserva: Variabile con frequenza ripetuta Variabile con dati in classi Media Varianza Deviazione Standard x n x n i k f f i k [( x i [( x x) n 1 k x) n 1 f f i k ] ] [( x [( x i x) n 1 k x) n 1 f f i k ] ] dove x k è il valore centrale della classe, ottenuto facendo la media aritmetica dell estremo superiore e inferiore di ogni classe ([estremo inferiore+estremo superiore]/). Immaginiamo di aver selezionato in modo casuale dalla popolazione delle matricole della classe delle Professioni Sanitarie tecniche di una data Università Italiana un campione di 57 studenti, e di averne misurata la statura. Poiché i valori di tale variabile erano molto diversi tra loro, sono stati riclassificati in classi, ottenendo la seguente distribuzione di frequenza: Statura cm f k [ ) 10 [ ) 1 [ ) 19 [ ) 10 [ )

30 Volendo determinare la statura media e la deviazione standard, si dovrà procedere prima a calcolare il valore centrale di ciascuna classe (x k ) (a titolo esemplificativo riportiamo il calcolo del valore centrale della prima classe: x k=1 =( )/=173) e quindi alla stima delle misure di sintesi pesando per la frequenza: [x j x j+1 ) f k x k x k f k ( x k x) ( x k x) ( xk x) fk [ ) [ ) [ ) [ ) [ ) Σ x = = = 18.1 cm s [( xk x) = n 1 f k ] = = cm 56 [( xk x) s = n 1 f k ] = cm Risulta quindi una statura media di 18.1 cm, con una variabilità di 6.13 cm. La distribuzione di frequenza di una variabile quantitativa è spesso una distribuzione normale, che graficamente si presenta come una curva a campana simmetrica. Tale distribuzione normale gode di alcune proprietà: la mediana e la moda coincidono con la media. Inoltre, tra il valore medio e una deviazione standard è contenuto il 68% circa delle osservazioni, tra il valore medio e due volte la deviazione standard è contenuto (circa) il 95% delle osservazioni e tra il valore medio e tre volte la deviazione standard è contenuto il 99,7% delle osservazioni: 30

31 µ ± σ = 68% µ ± σ = 95% µ ± 3σ = 99,7% Ciò significa che se in una ricerca si sono raccolti 100 valori di peso per un gruppo di soggetti maschi di 18 anni di età, e la media è 71 Kg con una deviazione standard di 6 Kg, ho l informazione che circa il 68% dei soggetti del campione ha un peso compreso tra 65 e 77 chilogrammi, il 95% circa ha un peso compreso tra 59 e 83 chilogrammi, dato che la variabile peso è distribuita normalmente quando raccolta su gruppi omogenei. In Appendice A sono riportate le tavole della distribuzione o Curva Normale Standardizzata. 4.3 La statistica inferenziale La statistica inferenziale è quella parte della statistica con cui, si cerca di trarre delle conclusioni sulla popolazione basandosi sulle informazioni osservate in un campione. Precisamente, la statistica inferenziale è un insieme di tecniche con le quali si cerca: di verificare se i risultati ottenuti in una certa indagine sono conformi o meno con le congetture o le supposizioni (il quesito scientifico) che hanno motivato la ricerca stessa; 31

32 di stimare un parametro della popolazione, partendo dai dati relativi ad un campione che si suppone appartenere ad essa La verifica d ipotesi e il test statistico La verifica dell ipotesi è un metodo per valutare se le differenze osservate tra gruppi diversi siano dovute alla variabilità biologica e quindi al caso o a differenze delle sottostanti popolazioni di riferimento. Per verificare l ipotesi si ricorre ad una statistica: la statistica test, che è diversa secondo il tipo di variabili e del problema in esame. Il test statistico è costruito per verificare l ipotesi di uguaglianza (o nulla) H 0 tra i gruppi, ovvero che le differenze osservate sono solo dovute al caso. Per ogni statistica test è stata formulata una distribuzione che rappresenta le probabilità di trovare i diversi valori della statistica test quando l ipotesi zero o nulla è vera, cioè quando le differenze sono casuali, sotto H 0 vera. Di seguito è riportata la distribuzione per la statistica test χ (caso specifico per 1 grado di libertà). 5% 95% 3,84 Dalla figura sopra riportata si evince che, sotto l ipotesi nulla vera, la statistica χ può assumere tutti i valori da 0 a +, ma la probabilità di trovare valori elevati è più piccola che quella di trovarne di piccoli. È necessaria allora una regola di decisione, che consenta di rendere operativo l uso del test. La comunità scientifica è d accordo nel ritenere che valori del χ che hanno complessivamente una probabilità di verificarsi di almeno il 95%, sono più compatibili con H 0 vera e quindi portano ad accettare H 0. Valori del test che hanno 3

33 solo una probabilità di verificarsi del 5% o inferiore sono considerati troppo rari e quindi meno compatibili con H 0 vera: tali valori porteranno a rifiutare H 0. È chiaro che la decisione di rifiutare H 0 non è scevra di rischi di errore, ma si è in grado di quantificarlo in un p-value o P<0,05: pertanto la probabilità di errore che noi commettiamo rifiutando H 0 è inferiore al 5%. L errore commesso quando si rifiuta H 0 è comunemente chiamato errore α o di I tipo. Ed ora qualche esempio Esempio di applicazione del test χ È stato condotto un trial clinico controllato randomizzato per valutare se il nuovo farmaco potesse essere efficacemente utilizzato per ridurre il rischio di morte nei pazienti affetti da HIV. Ventidue soggetti sottoposti a terapia con il nuovo farmaco e trattati con placebo furono seguiti per 15 anni. Al termine del periodo di osservazione si trovò che 11 soggetti erano morti nel gruppo trattato con il nuovo farmaco e 16 in quello trattato con placebo. Apparentemente sembrerebbe che il nuovo farmaco sia efficace, data la minor frequenza di morti nel gruppo di soggetti trattati (11/) rispetto a quella del gruppo di coloro che ricevettero placebo (16/): Nuovo farmaco Placebo Vivo Morto Supposto corretto il metodo di campionamento si deve oggettivamente verificare se quanto osservato su un campione di pazienti affetti da HIV sia generalizzabile a tutta la popolazione (campionata) di pazienti interessati dalla stessa patologia. Pertanto si formula l ipotesi statistica: H 0 non esiste associazione tra trattamento ed esito Quindi si individua il test statistico da utilizzare. Essendo l outcome di interesse (morte) una variabile di tipo binario (sì/no), utilizziamo allora il test χ per le tavole di contingenza χ ( O = E E ) 33

34 dove O sono le frequenze osservate ed E quelle attese sotto H 0 vera. Queste ultime si ottengono semplicemente moltiplicando il totale di riga per quello di colonna e dividendo per il totale generale. La frequenza dei pazienti vivi in trattamento sarà: E 17 = 44 1 = per differenza si possono facilmente ricavare tutte le altre frequenze attese e si costruisce la tabella degli attesi: 8,5 Nuovo farmaco Placebo Vivo 8,5 8,5 17 Morto 13,5 13, Con i dati rilevati nel campione esaminato, risulterebbe: χ = ( 11 8,5) ( 6 8,5) ( 11 13,5) ( 16 13,5) 8,5 + 8,5 + 13,5 = 0,74 + 0,74 + 0,46 + 0,46 =,4 + 13,5 = Controllando sulla tavola della distribuzione χ (in Appendice B) in corrispondenza della riga 1 grado di libertà (essendo una tabella ) il valore calcolato non cade nella colonna 0,05, dove si trova 3,84: ciò significa che il valore calcolato è minore di quello tabulato (ossia cade nella regione di non rifiuto dell ipotesi nulla) quindi non si deve rifiutare l ipotesi nulla di uguaglianza, e concludere che la differenza riscontrata tra la frequenza di morte dei pazienti trattati con il nuovo farmaco e quella dei pazienti trattati con placebo potrebbe essere casuale, e non dovuta all efficacia del nuovo terapico Esempio di applicazione del test t di Student per confrontare due campioni (test t per dati indipendenti) Alcuni ricercatori sono interessati a conoscere se il livello medio di acido urico serico di soggetti con Sindrome di Prader-Willi (gruppo 1) sia diverso da quello di individui normali. Sono stati esaminati 1 soggetti con la sindrome e 15 senza ottenendo i seguenti dati: 34

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Elementi di Epidemiologia

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Elementi di Epidemiologia Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Elementi di Epidemiologia Corsi di Laurea Triennale Corso di Statistica e Biometria: Elementi di epidemiologia

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -

Dettagli

Trials clinici. Disegni di studio

Trials clinici. Disegni di studio Trials Clinici Dott.ssa Pamela Di Giovanni Studi descrittivi Disegni di studio Popolazioni Individui Studi analitici Osservazionali Sperimentali Studi di correlazione o ecologici Case report - Case series

Dettagli

Gli studi epidemiologici

Gli studi epidemiologici Gli studi epidemiologici STUDI OSSERVAZIONALI descrittivi STUDI OSSERVAZIONALI analitici: Ecologici Trasversali Caso-controllo Di coorte STUDI SPERIMENTALI : Trial controllati randomizzati Trial sul campo

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

Corso: Statistica e Metodologia Epidemiologica 1

Corso: Statistica e Metodologia Epidemiologica 1 Università degli Studi di Padova Scuola di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 2014-15 Corso: Statistica e Metodologia Epidemiologica 1 Docenti: prof.ssa Anna Chiara Frigo

Dettagli

Igiene. Dott. Pamela Di Giovanni. Definizione

Igiene. Dott. Pamela Di Giovanni. Definizione Igiene Dott. Pamela Di Giovanni Definizione Disciplina medica che ha come obiettivo la tutela e la promozione della salute umana, intendendo per salute umana un completo stato di benessere psichico, fisico

Dettagli

Seconda Parte Specifica di scuola - Statistica sanitaria e Biometria - 31/07/2015

Seconda Parte Specifica di scuola - Statistica sanitaria e Biometria - 31/07/2015 Domande relative alla specializzazione in: Statistica sanitaria e Biometria Domanda #1 (codice domanda: n.641) : In epidemiologia, una variabile di confondimento è una variabile: A: associata sia alla

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 1 RAPPRESENTARE I DATI: TABELLE E GRAFICI Un insieme di misure è detto serie statistica o serie dei dati 1) Una sua prima elementare elaborazione può

Dettagli

Calcolo delle probabilità

Calcolo delle probabilità Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

Principi generali. Vercelli 9-10 dicembre 2005. G. Bartolozzi - Firenze. Il Pediatra di famiglia e gli esami di laboratorio ASL Vercelli

Principi generali. Vercelli 9-10 dicembre 2005. G. Bartolozzi - Firenze. Il Pediatra di famiglia e gli esami di laboratorio ASL Vercelli Il Pediatra di famiglia e gli esami di laboratorio ASL Vercelli Principi generali Carlo Federico Gauss Matematico tedesco 1777-1855 G. Bartolozzi - Firenze Vercelli 9-10 dicembre 2005 Oggi il nostro lavoro

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

Laboratorio di Pedagogia Sperimentale. Indice

Laboratorio di Pedagogia Sperimentale. Indice INSEGNAMENTO DI LABORATORIO DI PEDAGOGIA SPERIMENTALE LEZIONE III INTRODUZIONE ALLA RICERCA SPERIMENTALE (PARTE III) PROF. VINCENZO BONAZZA Indice 1 L ipotesi -----------------------------------------------------------

Dettagli

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL

Dettagli

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Indici (Statistiche) che esprimono le caratteristiche di simmetria e Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica

Dettagli

A.A. 2014-2015. Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE

A.A. 2014-2015. Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE A.A. 2014-2015 Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE Utilizzare gli strumenti epidemiologici e statistici appropriati per ridurre l'area dell'incertezza nella rilevazione

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

Epidemiologia generale

Epidemiologia generale Epidemiologia Da un punto di vista etimologico, epidemiologia è una parola di origine greca, che letteralmente significa «discorso riguardo alla popolazione» Epidemiologia generale Disciplina che ha come

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

ELEMENTI DI DEMOGRAFIA

ELEMENTI DI DEMOGRAFIA ELEMENTI DI DEMOGRAFIA 2. Caratteristiche strutturali della popolazione Posa Donato k posa@economia.unisalento.it Maggio Sabrina k s.maggio@economia.unisalento.it UNIVERSITÀ DEL SALENTO DIP.TO DI SCIENZE

Dettagli

Slide Cerbara parte1 5. Le distribuzioni teoriche

Slide Cerbara parte1 5. Le distribuzioni teoriche Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

CORSO DI STATISTICA La Misurazione, Scale di Misura, Errori di Misura

CORSO DI STATISTICA La Misurazione, Scale di Misura, Errori di Misura CORSO DI STATISTICA La Misurazione, Scale di Misura, Errori di Misura Bruno Mario Cesana Bruno M. Cesana 1 MISURAZIONE La figura 1.1 è tratta da: Bossi A. et al.: Introduzione alla Statistica Medica A

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971

Dettagli

Analisi e diagramma di Pareto

Analisi e diagramma di Pareto Analisi e diagramma di Pareto L'analisi di Pareto è una metodologia statistica utilizzata per individuare i problemi più rilevanti nella situazione in esame e quindi le priorità di intervento. L'obiettivo

Dettagli

Rapporto dal Questionari Insegnanti

Rapporto dal Questionari Insegnanti Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

La distribuzione Gaussiana

La distribuzione Gaussiana Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Documento di accompagnamento: mediane dei settori bibliometrici

Documento di accompagnamento: mediane dei settori bibliometrici Documento di accompagnamento: mediane dei settori bibliometrici 1. Introduzione Vengono oggi pubblicate sul sito dell ANVUR e del MIUR 3 tabelle, deliberate nel CD dell ANVUR del 13 agosto 2012, relative

Dettagli

risulta (x) = 1 se x < 0.

risulta (x) = 1 se x < 0. Questo file si pone come obiettivo quello di mostrarvi come lo studio di una funzione reale di una variabile reale, nella cui espressione compare un qualche valore assoluto, possa essere svolto senza necessariamente

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a. 2003-2004 INTRODUZIONE ALLA STATISTICA DESCRITTIVA

Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a. 2003-2004 INTRODUZIONE ALLA STATISTICA DESCRITTIVA Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a. 2003-2004 INTRODUZIONE ALLA STATISTICA DESCRITTIVA Prof. Stefania Funari Parte I TERMINOLOGIA STATISTICA e CONCETTI INTRODUTTIVI

Dettagli

Misure della relazione di occorrenza

Misure della relazione di occorrenza Misure della relazione di occorrenza (associazione tra un determinante e l outcome) Misure di effetto (teoriche) Misure di associazione (stime empiriche delle precedenti) EFFETTO: quantità di cambiamento

Dettagli

Indice. 1 Il monitoraggio del progetto formativo --------------------------------------------------------------- 3. 2 di 6

Indice. 1 Il monitoraggio del progetto formativo --------------------------------------------------------------- 3. 2 di 6 LEZIONE MONITORARE UN PROGETTO FORMATIVO. UNA TABELLA PROF. NICOLA PAPARELLA Indice 1 Il monitoraggio del progetto formativo --------------------------------------------------------------- 3 2 di 6 1 Il

Dettagli

ESERCITAZIONE 2. TRATTO E MODIFICATO DA: Esercizi di epidemiologia - MORO, DAVOLI, PIRASTU Il pensiero scientifico editore

ESERCITAZIONE 2. TRATTO E MODIFICATO DA: Esercizi di epidemiologia - MORO, DAVOLI, PIRASTU Il pensiero scientifico editore ESERCITAZIONE 2 TRATTO E MODIFICATO DA: Esercizi di epidemiologia - MORO, DAVOLI, PIRASTU Il pensiero scientifico editore Modalità di lettura della tabella di contingenza 2x2 sull associazione tra l esposizione

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale di Area Tecnica Corso di Statistica e Biometria Statistica descrittiva 1 Statistica Funzioni Descrittiva Induttiva (inferenziale) Statistica

Dettagli

Concetto di potenza statistica

Concetto di potenza statistica Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1 Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H

Dettagli

ESAMI DI QUALIFICA PROFESSIONALE

ESAMI DI QUALIFICA PROFESSIONALE ESAMI DI QUALIFICA PROFESSIONALE La procedura per lo svolgimento degli esami di qualifica professionale, per le classi terze inizia nel primo Consiglio di classe successivo agli scrutini di febbraio, con

Dettagli

ESERCIZI DI STATISTICA DESCRITTIVA

ESERCIZI DI STATISTICA DESCRITTIVA ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,

Dettagli

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

LA STATISTICA NEI TEST INVALSI

LA STATISTICA NEI TEST INVALSI LA STATISTICA NEI TEST INVALSI 1 Prova Nazionale 2011 Osserva il grafico seguente che rappresenta la distribuzione percentuale di famiglie per numero di componenti, in base al censimento 2001. Qual è la

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Igiene nelle Scienze motorie

Igiene nelle Scienze motorie Igiene nelle Scienze motorie Epidemiologia generale Epidemiologia Da un punto di vista etimologico, epidemiologia è una parola di origine greca, che letteralmente significa «discorso riguardo alla popolazione»

Dettagli

1. L analisi statistica

1. L analisi statistica 1. L analisi statistica Di cosa parleremo La statistica è una scienza, strumentale ad altre, concernente la determinazione dei metodi scientifici da seguire per raccogliere, elaborare e valutare i dati

Dettagli

Indici di dispersione

Indici di dispersione Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI) COMUNE DI RAVENNA Il sistema di valutazione delle posizioni del personale dirigente GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI) Ravenna, Settembre 2004 SCHEMA DI SINTESI PER LA

Dettagli

SISTEMA di GESTIONE QUALITÀ Non Conformità ed Efficacia delle Azioni Correttive Preventive

SISTEMA di GESTIONE QUALITÀ Non Conformità ed Efficacia delle Azioni Correttive Preventive SISTEMA di GESTIONE QUALITÀ Non Conformità ed Efficacia delle Azioni Correttive Preventive Il sistema di gestione della qualità a cui mi riferisco è quello relativo alla norma ISO-9001:2000. Prima di entrare

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Ufficio Scolastico Regionale per l Abruzzo. Rapporto dal Questionari Studenti

Ufficio Scolastico Regionale per l Abruzzo. Rapporto dal Questionari Studenti Rapporto dal Questionari Studenti SCUOLA xxxxxxxxx Anno Scolastico 2014/15 Le Aree Indagate Il questionario studenti ha lo scopo di indagare alcuni aspetti considerati rilevanti per assicurare il benessere

Dettagli

CAPACITÀ DI PROCESSO (PROCESS CAPABILITY)

CAPACITÀ DI PROCESSO (PROCESS CAPABILITY) CICLO DI LEZIONI per Progetto e Gestione della Qualità Facoltà di Ingegneria CAPACITÀ DI PROCESSO (PROCESS CAPABILITY) Carlo Noè Università Carlo Cattaneo e-mail: cnoe@liuc.it 1 CAPACITÀ DI PROCESSO Il

Dettagli

Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria

Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Christopher N. Sciamanna, Scott P. Novak, Bess H. Marcus. International Journal of

Dettagli

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Esercitazione n.2 Inferenza su medie

Esercitazione n.2 Inferenza su medie Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Capitolo 4 Probabilità

Capitolo 4 Probabilità Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 4 Probabilità Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Gli attributi di STUDENTE saranno: Matricola (chiave primaria), Cognome, Nome.

Gli attributi di STUDENTE saranno: Matricola (chiave primaria), Cognome, Nome. Prof. Francesco Accarino Raccolta di esercizi modello ER Esercizio 1 Un università vuole raccogliere ed organizzare in un database le informazioni sui propri studenti in relazione ai corsi che essi frequentano

Dettagli

età sesso luogo-abitazione scuola superiore esperienza insegnamento 1 2 2 2 1 2 2 2 2 2 1 2 3 2 2 2 1 2 4 2 2 2 1 2 5 3 2 2 1 2 6 2 2 2 1 2 7 3 2 1 1

età sesso luogo-abitazione scuola superiore esperienza insegnamento 1 2 2 2 1 2 2 2 2 2 1 2 3 2 2 2 1 2 4 2 2 2 1 2 5 3 2 2 1 2 6 2 2 2 1 2 7 3 2 1 1 età sesso luogo-abitazione scuola superiore esperienza insegnamento 1 1 1 3 1 4 1 5 3 1 6 1 7 3 1 1 8 3 1 9 3 1 10 3 1 11 3 1 1 1 13 4 1 1 14 3 1 15 1 16 1 17 1 18 1 19 1 0 1 1 1 1 3 3 1 4 1 Come analizzare

Dettagli

Statistica descrittiva

Statistica descrittiva Corso di Laurea in Ingegneria per l Ambiente ed il Territorio Corso di Costruzioni Idrauliche A.A. 2004-05 www.dica.unict.it/users/costruzioni Statistica descrittiva Ing. Antonino Cancelliere Dipartimento

Dettagli

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI 1.1 La Statistica La Statistica è la scienza che raccoglie, elabora ed interpreta i dati (informazioni) relativi ad un dato fenomeno oggetto di osservazione.

Dettagli

Un gioco con tre dadi

Un gioco con tre dadi Un gioco con tre dadi Livello scolare: biennio Abilità interessate Costruire lo spazio degli eventi in casi semplici e determinarne la cardinalità. Valutare la probabilità in diversi contesti problematici.

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

La manutenzione come elemento di garanzia della sicurezza di macchine e impianti

La manutenzione come elemento di garanzia della sicurezza di macchine e impianti La manutenzione come elemento di garanzia della sicurezza di macchine e impianti Alessandro Mazzeranghi, Rossano Rossetti MECQ S.r.l. Quanto è importante la manutenzione negli ambienti di lavoro? E cosa

Dettagli

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo. DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti

Dettagli

VALORE DELLE MERCI SEQUESTRATE

VALORE DELLE MERCI SEQUESTRATE La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune

Dettagli

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Tassi di incidenza 9/2/2005

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Tassi di incidenza 9/2/2005 SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Tassi di incidenza 9/2/2005 Ricerca epidemiologica Gli epidemiologi sono interessati a conoscere l incidenza delle malattie per prevedere i

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Appendice III. Competenza e definizione della competenza

Appendice III. Competenza e definizione della competenza Appendice III. Competenza e definizione della competenza Competenze degli psicologi Lo scopo complessivo dell esercizio della professione di psicologo è di sviluppare e applicare i principi, le conoscenze,

Dettagli