ANALISI MULTIVARIATA
|
|
|
- Giacinto Pisano
- 9 anni fa
- Просмотров:
Транскрипт
1 ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la forza della relazione lineare tra la VD e la VI ES: influenza dell et età sulla pressione sistolica VD = pressione sistolica VI = età
2 ES: influenza dell et età sulla pressione sistolica VD = pressione sistolica VI = età PS media eta Per riassumere questa relazione si può utilizzare una retta (RETTA( DI REGRESSIONE) PS media eta PS media rettareg
3 Come si costruisce la retta La pressione varia in funzione dell et età (all aumentare aumentare dell et età aumenta la pressione) Pressione ~ età Come quantifico questa relazione? Con un coefficiente che rappresenti la pendenza della retta (che indichiamo con β) L equazione della retta Pressione ~ β X età Manca un termine costante (α) che funzioni da punto di partenza per la retta Pressione ~ α + β X età La pressione adesso è espressa in funzione dell et età,, ma non è ancora una formula matematica
4 Per poter passare da ~ a = inseriamo un errore: : la pressione non è determinata solamente dall et età! L equazione diventa: Pressione = α + β X età + errore Gli errori rappresentano quella parte di pressione che non è spiegata dall et età e vengono detti RESIDUI Nel nostro esempio α = 90.9 β = 0.8 Risultato Pressione = X età + errore
5 Metodo dei minimi quadrati I parametri α e β vengono calcolati in modo che rendano minimo l errore l di approssimazione Si minimizza il quadrato della somma degli scarti dalla retta, ovvero il quadrato della distanza di ogni osservazione dalla retta: metodo dei minimi quadrati. Alcuni dati età PS misurata PS stimata x46 46= x x x x x x x x x Differenza
6 Alcune domande Che direzione ha la relazione età pressione? La relazione tra pressione ed età è significativa? La variabile età fino a che punto spiega la variabilità della pressione? β: : coefficiente angolare β>0 : relazione diretta, al crescere dell et età cresce la pressione β<0: relazione inversa, al crescere dell et età diminuisce la pressione β=0: indipendenza Es.
7 R 2 = coefficiente di determinazione β Significatività di β Coefficiente di determinazione R 2 Proporzione di varianza spiegata dalla regressione Più si avvicina a 1, migliore è il modello
8 Generalizzando: VD = α + β X VI + errore y= α + βx + ε Dove siamo Come verificare se l associazione l tra due variabili non è dovuta al caso (test e IC) Altre variabili possono influire su questa associazione Come misurare la forza di una relazione tra due variabili indipendentemente da potenziali variabili confondenti??
9 ANALISI MULTIVARIATA Insieme di metodi per considerare diverse variabili indipendenti simultaneamente Descrive la relazione tra una variabile di outcome (VD) e i suoi diversi determinanti, con lo scopo di valutare la forza delle associazioni o di predire l outcomel in condizioni diverse L analisi bivariata fornisce una visione parziale, l analisi multivariata una visione più complessa e che si avvicina di più alla realtà Il principale vantaggio dell analisi multivariata consiste nel poter apprezzare, simultaneamente ed indipendentemente, gli effetti di tutte le variabili considerate, depurandoli delle reciproche interferenze
10 Spiegazione non matematica ES: vogliamo fare uno studio sulla prognosi di 1 determinata malattia che non ha ancora una cura. La lunghezza della sopravvivenza di un paziente potrebbe dipendere da: Età del paziente Stadio della malattia Presenza di altre malattie (comorbilit( comorbilità) Sintomi (es( es: : dimagrimento) prognosi comorbilità stadio età sintomi
11 Un po di matematica Prognosi ~ età + stadio + comorbidità + sintomi Queste 4 variabili non hanno tutte necessariamente la stessa importanza, miglioriamo l espressione l dando un peso ad ognuna Prognosi ~ p1xet età + p2xstadio + p3xcomorbidit comorbidità + p4xsintomi Per passare dal circa all uguale inseriamo un termine di errore e una costante che ci serve da ancoraggio Prognosi = costante +p1 x età + p2 x stadio + p3 x comorbidità + p4 x sintomi + errore
12 Ricorda la regressione lineare, ma non è più semplice, è multipla VD = α + β 1 X VI 1 + β 2 X VI errore y= α + β 1 x 1 + β 2 x 2 + β 3 x ε Modelli L equazione rappresenta un modello lineare (generalizzato) A seconda del tipo di variabili, dipendente/i e indipendenti cambia l analisi l regressione lineare multipla Anova Ancova Regressione logistica Regressione di cox Ecc.
13 Esempio: pressione sistolica Possibili variabili influenzanti: Età (significativa) BMI (body mass index) Sesso (M o F) PS media eta 0 50 bmi
14 Relazione PS - bmi α = 90.5 β = 1.5 p<0.001 R 2 = 0.13 Relazione bmi - età α = 21.8 β = 0.1 p<0.001
15 Regressione lineare multipla risultati PS = f(età) Età PS = f(bmi) BMI PS = f(età,, BMI) Età BMI β R
16 ..inseriamo.inseriamo anche il sesso (1=F 2=M) PS = f(età,, BMI, sesso) Età BMI Sesso β R 2 PS = età + 0.6BMI sesso + errore Interpretazione La PS aumenta di 0.7 per ogni anno di età in più (indipendentemente da BMI e sesso) La PS aumenta di 0.6 per ogni punto di BMI in più (indipendentemente da età e sesso) La PS aumenta di 2.7 per i maschi rispetto alle femmine (indipendentemente da età e BMI)
17 Scopi dell analisi multivariata Spiegare le relazioni tra variabili (indipendentemente dalle altre) Prevedere in base alle variabili indipendenti (esplicative) come sarà la variabile dipendente Controllare l effetto di alcune variabili per verificare l effetto l di altre sulla VD Previsione Date le variabili dipendenti, si prevede il valore che ha la variabile dipendente Es: : età +0.6 BMI sesso=? età bmi sesso PS STIMATA 119,7 128,9 120,8
18 Esempio: previsione della probabilità di evento cardiovascolare in funzione di sesso, età,, diabete, fumo, pressione arteriosa, colesterolemia
19 Controllo Si vuole verificare qual è la differenza di pressione tra maschi e femmine Maschi e femmine del campione sono però diversi per età e BMI Ho fatto l analisi l multivariata ma vorrei quantificare la differenza tra maschi e femmine Calcolo i valori corretti (o aggiustati) per sesso ed età M F Pressione media aggiustata* P-value *per età e bmi
Statistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
I metodi per la misura della prognosi
C.I. di Metodologia clinica I metodi per la misura della prognosi Obiettivo Conoscere ed utilizzare i principali strumenti per identificare i fattori di rischio e i fattori prognostici 1 Gallo C. Gallo_
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
Inferenza statistica II parte
Inferenza statistica II parte Marcella Montico Servizio di epidemiologia e biostatistica Test statistici II parte Variabili quantitative Caso 1 Variabile Dipendente = quantitativa Variabile Indipendente
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Indipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
Analisi Multivariata dei Dati. Regressione Multipla
Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
Errori (o bias) negli studi epidemiologici
Errori (o bias) negli studi epidemiologici Errore casuale o random: sono i più pericolosi perché i più difficili da individuare e per questo motivo non è possibile tenerne conto in fase di analisi Variazione
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
Analisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
Statistica. Esercitazione 16. Alfonso Iodice D Enza [email protected]. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
Introduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) Marcello Gallucci P S I C O M E T R I A [email protected] Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa
Regressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
Argomenti della lezione:
Lezione 9 Argomenti della lezione: La regressione multipla: Approcci analitici Regressione standard Regressione gerarchica Regressione statistica Strategie Analitiche per la regressione Tre principali
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
Esercizi su Regressione e Connessione
Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis [email protected] www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
Introduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci [email protected] Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Regressione di Cox 7/3/2005
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Regressione di Cox 7/3/2005 Procedura di Mantel-Haenszel Dati relativi a pazienti maschi nel primo anno di follow-up stratificati per età e
Esercitazioni di statistica
Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II [email protected] 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina
Tecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.0, 3 dicembre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2015-16
Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
Il modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
Interpolazione e metodo dei minimi quadrati
A. A. 017-018 Interpolazione e metodo dei minimi quadrati prof. ing. Antonio Comi Department of Enterprise Engineering Tor Vergata University of Rome Relazioni tra variabili Molto spesso si verifica che
7. STATISTICA DESCRITTIVA
7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole
LA REGRESSIONE LINEARE NELLA RICERCA CLINICA
G Ital Nefrol 2011; 28 (1): 80-84 MASTER in epidemiologia clinica LA REGRESSIONE LINEARE NELLA RICERCA CLINICA Fabio Provenzano, Carmine Zoccali, Giovanni Tripepi CNR-IBIM, Unità di Ricerca di Epidemiologia
Analisi della varianza
1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della
Calcolo di una Regressione lineare semplice con Excel
Calcolo di una Regressione lineare semplice con Excel Inserire i dati In un tabellone vuoto di Excel, inserire i dati di X e di Y. Ad esempio i dati della Tabella 0.1 dovrebbero essere inseriti in Excel
Tecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.2, 20 marzo 2017) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2016-17
Correlazione e regressione
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Correlazione e regressione 28/1/2005 Relazioni Che rapporto c'è tra la pressione arteriosa e il peso corporeo? relazione tra due variabili
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria [email protected] Il concetto di interpolazione In matematica, e in particolare in
L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
RELAZIONE TRA DUE VARIABILI QUANTITATIVE
Lezione IX: Regressione e Correlazione Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone RELAZIONE TRA DUE VARIABILI
Il modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
viii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DISTRIBUZIONE CAMPIONARIA CONGIUNTA
DISTRIBUZIONE CAMPIONARIA CONGIUNTA Finora ci siamo occupati di medie e scarti ma dobbiamo anche affrontare il problema di studiare le relazioni tra insiemi di dati. La media e la deviazione standard possono
Strumenti di indagine per la valutazione psicologica
Strumenti di indagine per la valutazione psicologica 1.5 Correlazione e causazione Davide Massidda [email protected] Metodi simmetrici vs asimmetrici Relazioni tra variabili Nei metodi di studio
Il modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
UNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
9.3 Il metodo dei minimi quadrati in formalismo matriciale
9.3. IL METODO DEI MINIMI QUADRATI IN FORMALISMO MATRICIALE 121 9.3 Il metodo dei minimi quadrati in formalismo matriciale Per applicare il MMQ a funzioni polinomiali, ovvero a dipendenze di una grandezza
