Interpretare i modelli prognostici multivariati: il modello logistico
|
|
|
- Giuditta Poggi
- 9 anni fa
- Просмотров:
Транскрипт
1 Interpretare GIAC i modelli Volume prognostici 5 Numero multivariati: 4 Dicembre il modello 2002logistico L ANGOLO DELLA STATISTICA Interpretare i modelli prognostici multivariati: il modello logistico Catherine Klersy, Luigia Scudeller G Ital Aritmol Cardiostim 2002;4: Servizio di Biometria ed Epidemiologia Clinica, Direzione Scientifica, IRCCS Policlinico San Matteo, Pavia egli ultimi anni i modelli prognostici sono stati Npubblicati con frequenza crescente nella letteratura medica internazionale. Parallelamente lo sviluppo dei software statistici, con interfaccia sempre più intuitiva, ha reso appetibile la definizione di propri modelli prognostici. Tuttavia il percorso accademico di ognuno non sempre ha incluso una formazione in campo statistico ed epidemiologico, rendendo da una parte difficile e magari incompleta l interpretazione di tali modelli, dall altra pericoloso l utilizzo indiscriminato del software. Scopo di questa nota è di illustrare il significato e l interpretazione dei modelli logistici utilizzati per definire la prognosi. Perché utilizzare un modello prognostico multivariato? Una ricerca scientifica ben pianificata dovrebbe porsi come obiettivo la dimostrazione che una certa caratteristica della nostra coorte sia effettivamente un fattore di rischio non identificato prima. Ciò implica, da una parte, la necessità di dimostrare che la presenza di questo fattore di rischio effettivamente si associ con la malattia/l evento che stiamo studiando e, dall altra, che sia un fattore di rischio addizionale rispetto a quelli già noti dalla letteratura, anche alla luce delle caratteristiche della popolazione. I modelli prognostici multivariati permettono di rispondere a questi quesiti: sarà possibile calcolare una misura dell associazione fra fattore di rischio e outcome e verificare che questa associazione si mantenga anche dopo avere tenuto conto delle altre caratteristiche del paziente. Inoltre, da un modello di regressione logistica è possibile costruire un indice prognostico sintetico che permetta di classificare i pazienti in base alle caratteristiche di presentazione, in categorie di rischio crescenti, con probabilità crescenti note di realizzarsi dell evento. Infine, alcune (rare) volte ci si può trovare a valutare una malattia per cui non sono noti dei fattori di rischio, ma esiste una serie di diverse ipotesi. In questo caso, i modelli prognostici multivariati permettono di identificare possibili fattori prognostici indipendenti. Sono fattori che si associano con la malattia in studio, anche dopo avere tenuto conto (indipendentemente/a pari- 205
2 GIAC Volume 5 Numero 4 Dicembre 2002 tà) di tutte le altre caratteristiche del paziente. È necessario essere consapevoli che, non partendo da un ipotesi scientifica specifica, si tratta di un analisi esplorativa e non conclusiva, che può essere fonte di ipotesi per studi successivi. Che cos è un modello logistico? Il modello logistico appartiene alla famiglia dei modelli di regressione per un outcome (o variabile dipendente) binario. Una variabile dipendente binaria può avere 2 valori, generalmente codificati come 0 per un outcome negativo (evento assente) e come 1 per un outcome positivo (evento presente). Essere/non essere affetti da fibrillazione atriale, essere/non essere in vita 5 anni dopo la diagnosi di tumore (dove tutti i pazienti sopravvissuti hanno un follow-up di almeno 5 anni) sono esempi di variabili dipendenti binarie in medicina. I modelli per variabili dipendenti binarie permettono di esplorare come ogni variabile esplicativa (o indipendente) influenzi la probabilità che l evento in studio si verifichi. Sono modelli non lineari, nel senso che l associazione fra probabilità dell evento e variabili esplicative non è lineare. La probabilità che l evento si verifichi è data da: Dove x 1, x 2 e x 3 sono le caratteristiche del paziente (covariate) inserite nel modello. Questa formulazione è equivalente alla seguente, in cui l effetto delle covariate viene associato non con la probabilità dell evento, ma con l odd, cioè con il rapporto fra probabilità di evento e probabilità di non evento. Il primo termine dell uguaglianza, il logaritmo dell odd, è detto logit, da cui il termine modello logistico. L associazione fra il logit e le variabili esplicative è lineare, contrariamente alla formulazione precedente, ed è più facile da modellare. Questo spiega la diffusione di tali modelli. Probabilità e odd sono legati dalla relazione seguente: Come valutare se il modello è applicato correttamente? Applicare un modello statistico a un set di dati richiede che siano soddisfatte determinate condizioni. Nel caso del modello logistico, queste sono: la variabile di outcome deve essere binaria; il disegno dello studio deve essere appropriato: studio trasversale; studio caso-controllo; studio longitudinale con tempi di follow-up uguali per tutti i soggetti; la relazione della variabile con il logit deve essere lineare (nel caso contrario vanno utilizzate trasformate della variabile originale); se necessario, sono stati inseriti termini di interazione (per tenere conto che l effetto di una variabile non è lo stesso nelle categorie di una seconda: per esempio l effetto dell età sulla probabilità di comparsa dell evento è diverso nei maschi e nelle femmine). Dopo avere costruito il modello va verificato: che le variabili inserite nel modello effettivamente spieghino i dati (p-value globale del modello <0,05); che il modello sia efficace nel descrivere la variabile di outcome (bontà di adattamento del modello): esistono diverse statistiche che permettono di quantizzare tale fenomeno e che andrebbero valutate e riportate (varianza spiegata, pseudo R2, criterio di informazione di Akaike, criterio di informazione bayesiano, ecc.); se esistono outlier e/o osservazioni influenzanti, attraverso l esame dei residui. I residui sono le differenze fra gli outcome predetti dal modello e gli outcome osservati nello studio. Gli outlier sono quei casi con ampi residui, cioè i casi in cui il modello predice male l outcome; le osservazioni influenzanti sono quelle che hanno un effetto importante sugli effetti stimati. 206
3 Interpretare i modelli prognostici multivariati: il modello logistico Quali e quante variabili in un modello logistico? La scelta delle variabili da includere nel modello, oltre a quella su cui si basa l ipotesi scientifica da dimostrare, deve essere guidata dalla conoscenza del problema studiato; è consuetudine includere età e sesso, nonché i fattori di rischio già noti dalla letteratura e che potrebbero influenzare la relazione fra il nuovo fattore prognostico e la probabilità dell evento. Esistono due limiti principali che riducono l efficienza del modello: la presenza di collinearità (variabili correlate fra di loro) e l eccessivo numero di covariate (causa del fenomeno di overfitting ). Nel primo caso si può scegliere una delle due variabili correlate, o inserire alternativamente una loro combinazione; nel secondo caso si può utilizzare una regola pragmatica che limita il rapporto fra covariate e casi a 1:10. Una nota merita anche il problema dei dati mancanti: in un modello multivariato, è sufficiente che una delle variabili del modello abbia un dato mancante perché il caso venga eliminato dall analisi, con conseguente perdita di potenza dello studio, anche importante se i dati mancanti sono numerosi. Come interpretare i coefficienti di un modello di regressione logistica? Generalmente i risultati derivanti dall applicazione di un modello logistico vengono presentati sotto forma di odds ratio (OR) e del relativo intervallo di confidenza al 95%. L OR rappresenta il rapporto fra quoziente delle probabilità di evento/non evento nei pazienti con il fattore di rischio e lo stesso quoziente nei pazienti senza il fattore di rischio. Per eventi rari (<5-10%), l OR rappresenta un approssimazione del rischio relativo. Il valore dell OR risponde alla domanda: Di quanto moltiplico il rischio (espresso come odd), quando aumento di 1 unità il valore della mia variabile di interesse?. L intervallo di confidenza dell OR permette da una parte di capire con quanta precisione l OR è stato stimato (ampiezza dell intervallo), dall altra di valutare l entità minima dell effetto (limite inferiore dell intervallo di confidenza per fattori che aumentano il rischio; limite superiore dell intervallo di confidenza per fattori protettivi). Infine, permette di valutare indirettamente se il test statistico effettuato sulla variabile, per saggiare l ipotesi nulla di effetto assente, è significativo al livello del 5% (OR = 1 non incluso nell intervallo). Un OR >1 corrisponde a un aumentato rischio; un OR <1 corrisponde a un rischio ridotto (effetto protettivo). Gli studi clinici controllati tipicamente indagano trattamenti che riducono la proporzione di eventi, si avranno quindi OR <1. Gli studi epidemiologici cercano invece di identificare fattori di rischio, e quindi quelli con un OR >1. Esemplifichiamo con uno studio fittizio, dove l ipotesi scientifica di interesse sarà di verificare l associazione fra età (anni) ed evento, oppure fra sesso (maschi vs femmine 0/1) ed evento, o alternativamente fra classe funzionale (3 categorie 0/1/2) ed evento (Tabella I). L interpretazione dell OR sarà leggermente diversa per ognuna delle 3 variabili, che sono rispettivamente di tipo continuo, categorico 2 categorie e categorico-ordinale 3 categorie: per ogni incremento di un anno di età, il rischio di evento viene moltiplicato per un fattore 1,04 e l aumento minimo sarà di 1,00 (con una fiducia del 95%, a parità di sesso e classe funzionale); i maschi hanno un rischio di evento 3,2 superiore a quello delle femmine; l aumento minimo (con una fiducia del 95%) sarà di 2,1, a parità di età e classe funzionale. Alternativamente le femmine hanno un rischio di evento pari a 1/3,2 = 0,31 quello dei maschi; la classe funzionale rappresenta un fattore di rischio (p globale <0,05), a parità di età e sesso: il rischio di evento per i pazienti in classe 1 è 1,4 volte il rischio dei pazienti in classe 0 (riferimento), mentre i pazienti in classe 2 hanno un rischio 2,9 maggiore di quelli in classe 0. Il rischio verrà moltiplicato per un minimo di 1,1 per i pazienti di classe 1 e di 2,1 per i pazienti di classe 2 (con una fiducia del 95%). Invece di usare un fattore moltiplicativo per esprimere un aumento del rischio, è possibile utilizzare la variazione percentuale, che può essere calcolata dalla precedente come % = 100*[OR-1] 207
4 GIAC Volume 5 Numero 4 Dicembre 2002 e quindi riportare le descrizioni corrispondenti alle precedenti (sempre a parità di sesso e classe funzionale, età e classe funzionale, età e sesso rispettivamente): per ogni incremento di un anno di età, il rischio di evento cresce del 4%; i maschi hanno un rischio di evento del 220% superiore a quello delle femmine o, alternativamente, le femmine hanno una riduzione di rischio del 69% rispetto ai maschi; la classe funzionale rappresenta un fattore di rischio (p globale <0,05): il rischio di evento per i pazienti in classe 1 è superiore del 40% al rischio dei pazienti in classe 0 (riferimento), mentre i pazienti in classe 2 hanno un rischio superiore del 190% rispetto a quelli in classe 0. Dobbiamo tuttavia ricordare che la definizione di modello logistico partiva dall esigenza di verificare come la variabile in studio influenzasse la probabilità che l evento si verificasse. Sarà quindi possibile calcolare e mettere in grafico la probabilità di evento predetta dal modello, per range di valori della variabile di interesse, fissati i valori delle altre covariate. Per esempio, ponendo a 0 sesso e classe funzionale, quindi considerando la popolazione di femmine in classe 0, potremo valutare come varia la proba- TABELLA I Modello logistico multivariato (Model p = 0,001) Evento 1/0 OR Intervallo confidenza 95% Note Età in anni 1,04 1,00-1,08 Sesso (M vs F) 3,2 2,1-6,5 Classe p globale per classe = 0,023 1/0 1,4 1,1-2,6 2/0 2,9 2,1-5,3 0,4 Probabilità di evento 0,3 0,2 0, Età FIGURA 1 Andamento della probabilità di evento in base all età, calcolata dal modello logistico. 208
5 Interpretare i modelli prognostici multivariati: il modello logistico bilità di evento per ogni 5 anni di età per età fra 20 e 60 anni (Figura 1). Validazione del modello logistico La capacità di ottenere un modello che spieghi i dati raccolti non esaurisce il problema della ricerca; infatti uno degli scopi dello sviluppo di un modello prognostico è la possibilità di fornire previsioni attendibili per individui futuri. È noto dalla letteratura che modelli prognostici tendono a dare delle stime eccessivamente ottimistiche dell effetto di un fattore di rischio. Diventa quindi necessario valutare l accuratezza predittiva (validità) di un modello per poterlo applicare a casi futuri. Questa viene stimata mediante 2 indici: una misura di calibrazione del modello; una misura di discriminazione del modello. La calibrazione del modello fornisce un indicazione di quanto la predizione legata al modello sia attendibile e di quanto sia il rumore dovuto a una cattiva specificazione del modello stesso; in particolare si osserverà più rumore se è stato inserito un numero eccessivo di covariate nel modello (overfitting). Per calibrare il modello viene calcolata una misura chiamata coefficiente di shrinkage γ, che permette di quantificare il rumore (=1 γ) e ricalibrare il modello per predizioni future (moltiplicando i coefficienti di regressione per γ). La discriminazione del modello è la sua capacità di separare pazienti con risposte diverse. Viene misurata mediante indici che valutano la correlazione fra outcome predetti e outcome osservati (o proporzione di concordanti), l indice di concordanza c, l indice D di Somer e altri. Conclusioni Il modello logistico rappresenta uno strumento potente per la definizione di modelli prognostici. Permette di quantizzare la forza di associazione fra un fattore di rischio e un outcome, ma anche la probabilità di realizzarsi dell evento. Come tutti i modelli statistici, le risposte che vengono fornite saranno attendibili solo se il modello è applicato avvedutamente. Infine, la capacità predittiva di un modello per casi futuri può e deve essere calcolata mediante apposite misure di accuratezza. Bibliografia 1. Harrell FE, Lee KL, Mark DB. Multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics in Medicine 1996:15: Bland J, Altman DG. The odds ratio. BMJ 2000;320: Hosmer DW, Lemeshow S. Applied logistic regression, 2d ed. New York: John Wiley & Sons, Long JS, Freese J. Regression models for categorical dependent variables using Stata. College Station, TX. A Stata press Publication, Stata Corporation, Bender R, Grouven U. Logistic regression models used in medical research are poorly presented. BMJ 1996;313: Klersy C. Effetto statisticamente rilevante ed effetto clinicamente rilevante. G Ital Aritmol Cardiostim 2001;4: Klersy C. I test multipli. G Ital Aritmol Cardiostim 2001;1: Indirizzo per la corrispondenza Catherine Klersy Servizio di Biometria ed Epidemiologia Clinica Direzione Scientifica IRCCS Policlinico San Matteo Pavia [email protected] 209
ANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
I metodi per la misura della prognosi
C.I. di Metodologia clinica I metodi per la misura della prognosi Obiettivo Conoscere ed utilizzare i principali strumenti per identificare i fattori di rischio e i fattori prognostici 1 Gallo C. Gallo_
Luigi Santoro. Hyperphar Group S.p.A., MIlano
Come modellare il rischio Luigi Santoro Hyperphar Group S.p.A., MIlano Gli argomenti discussi Le definizioni del termine rischio L utilità di un modello predittivo di rischio Come costruire modelli predittivi
Disegni di studio nella ricerca epidemiologica
Disegni di studio nella ricerca epidemiologica Dott. Pamela Di Giovanni Disegni epidemiologici La ricerca epidemiologica utilizza, per i suoi scopi, diverse strategie di studio che vengono distinte in
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Funzioni di regressione non lineari
Funzioni di regressione non lineari Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Regressione nonlineare Econometria - 2013 1 / 25 Sommario Funzioni di regressione non lineari - note
Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
Cognome e nome. 2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 129; 134; 142; 128; 146
Statistica medica. Biotecnologie mediche A.a. 2004-2005 1 Febbraio 2005 Tempo previsto 60 minuti Cognome e nome 1 Indicate a quale categoria appartengono le seguenti variabili: Nominale Ordinale Numerica
Elementi di Epidemiologia per la Valutazione Comparativa di Esito
Elementi di Epidemiologia per la Valutazione Comparativa di Esito La valutazione della qualità dell assistenza: quali domande? L incidenza di alcuni esiti negativi dell assistenza ospedaliera (come la
Statistica multivariata 27/09/2016. D.Rodi, 2016
Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
viii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
Statistica multivariata
Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire le relazioni
Statistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
IL DISEGNO DELLO STUDIO
IL DISEGNO DELLO STUDIO Studi epidemiologici Per identificare delle cause di malattia, abbiamo bisogno di metodi e strategie che ci consentano di evidenziare delle relazioni e stabilire l esistenza di
Quanti soggetti devono essere selezionati?
Quanti soggetti devono essere selezionati? Determinare una appropriata numerosità campionaria già in fase di disegno dello studio molto importante è molto Studi basati su campioni troppo piccoli non hanno
Statistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
CAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
Errori (o bias) negli studi epidemiologici
Errori (o bias) negli studi epidemiologici Errore casuale o random: sono i più pericolosi perché i più difficili da individuare e per questo motivo non è possibile tenerne conto in fase di analisi Variazione
Analisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
Indice. Prefazione all edizione italiana. Gli Autori e i Curatori dell edizione italiana PARTE PRIMA ASPETTI GENERALI
Indice Prefazione all edizione italiana Gli Autori e i Curatori dell edizione italiana XI XII PARTE PRIMA ASPETTI GENERALI Capitolo 1. Introduzione 1 1.1 La psicologia scientifica 1 1.2 I contesti della
L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
LETTURA CRITICA DELLA LETTERATURA SCIENTIFICA
LA STATISTICA NELLA RICERCA Raccolta dei dati Elaborazione Descrizione Una raccolta di dati non corretta, una loro presentazione inadeguata o un analisi statistica non appropriata rendono impossibile la
METODI E TECNICHE DELLA RICERCA IN PSICOLOGIA CLINICA E LABORATORIO MEDIAZIONE
METODI E TECNICHE DELLA RICERCA IN PSICOLOGIA CLINICA E LABORATORIO AA 2016/2017 PROF. V.P. SENESE http://psiclab.altervista.org/mettecpsicclinica2016/2016_2017.html https://goo.gl/iuaiqx Seconda Università
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici 1 Metodi non parametrici Statistica classica La misurazione avviene con
LEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Prognosi clinica 28/2/2005
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Prognosi clinica 28/2/2005 Formulazione La prognosi non è altro che la stima della probabilità di un certo esito Quando il medico fa una previsione
STATISTICA. Regressione-2
STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante
Quantificare la variabilità dei processi ecologici
Scopo ecologia Quantificare la variabilità dei processi ecologici Comprensione dei meccanismi fondamentale per identificare gli effetti del disturbo antropico e per prevenire alterazioni su scala globale
Statistica descrittiva: misure di associazione
Statistica descrittiva: misure di associazione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003
Compito di Statistica del 7/1/2003 I giovani addetti all agricoltura in due diverse regioni sono stati classificati per età; la distribuzione di frequenze congiunta è data dalla tabella seguente Età in
Modificazione d effetto (interazione) Confounding (confusione)
Modificazione d effetto (interazione) e Confounding (confusione) Lorenzo Monasta Servizio di Epidemiologia e Biostatistica IRCCS Burlo Garofolo, Trieste COMBINAZIONE DI TABELLE DI CONTINGENZA 2X2 Per studiare
ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.
ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks
Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1
Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa
Tecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.0, 3 dicembre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2015-16
Metodologie Quantitative
Metodologie Quantitative Regressione Logistica II M Q Marco Perugini Milano-Bicocca 1 La regressione logistica La regressione logistica si propone di studiare e quantificare le relazioni tra una o più
Introduzione alla Regressione Logistica
Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti
La distribuzione del rischio di ricovero per Tumore maligno della Tiroide nella Provincia di Taranto
La distribuzione del rischio di ricovero per Tumore maligno della Tiroide nella Provincia di Taranto A. Mincuzzi, N. Bartolomeo*, P.Trerotoli*, S. Minerba S.C. Statistica Epidemiologia ASL Taranto *Dipartimento
La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.
Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3
Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
Dispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
Il ruolo dello statistico nel disegno dello studio e nell analisi del dato clinico. L. Boni
nel disegno dello studio e nell analisi del dato clinico L. Boni ricerca clinica Raccolta ed elaborazione di informazioni finalizzata ad ottenere una migliore comprensione delle cause, dell evoluzione
DOMANDA DI RICERCA TIPI DI RICERCA
DOMANDA DI conoscenza esistente del problema: letteratura, esperienze relative al problema oggetto di studio, teorie già note, osservazione dirette di fenomeni/comportamenti nelle organizzazioni TIPI DI
