ANALISI MULTIVARIATA

Размер: px
Начинать показ со страницы:

Download "ANALISI MULTIVARIATA"

Транскрипт

1 ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la forza della relazione lineare tra la VD e la VI ES: influenza dell et età sulla pressione sistolica VD = pressione sistolica VI = età

2 ES: influenza dell et età sulla pressione sistolica VD = pressione sistolica VI = età PS media eta Per riassumere questa relazione si può utilizzare una retta (RETTA( DI REGRESSIONE) PS media eta PS media rettareg

3 Come si costruisce la retta La pressione varia in funzione dell et età (all aumentare aumentare dell et età aumenta la pressione) Pressione ~ età Come quantifico questa relazione? Con un coefficiente che rappresenti la pendenza della retta (che indichiamo con β) L equazione della retta Pressione ~ β X età Manca un termine costante (α) che funzioni da punto di partenza per la retta Pressione ~ α + β X età La pressione adesso è espressa in funzione dell et età,, ma non è ancora una formula matematica

4 Per poter passare da ~ a = inseriamo un errore: : la pressione non è determinata solamente dall et età! L equazione diventa: Pressione = α + β X età + errore Gli errori rappresentano quella parte di pressione che non è spiegata dall et età e vengono detti RESIDUI Nel nostro esempio α = 90.9 β = 0.8 Risultato Pressione = X età + errore

5 Metodo dei minimi quadrati I parametri α e β vengono calcolati in modo che rendano minimo l errore l di approssimazione Si minimizza il quadrato della somma degli scarti dalla retta, ovvero il quadrato della distanza di ogni osservazione dalla retta: metodo dei minimi quadrati. Alcuni dati età PS misurata PS stimata x46 46= x x x x x x x x x Differenza

6 Alcune domande Che direzione ha la relazione età pressione? La relazione tra pressione ed età è significativa? La variabile età fino a che punto spiega la variabilità della pressione? β: : coefficiente angolare β>0 : relazione diretta, al crescere dell et età cresce la pressione β<0: relazione inversa, al crescere dell et età diminuisce la pressione β=0: indipendenza Es.

7 R 2 = coefficiente di determinazione β Significatività di β Coefficiente di determinazione R 2 Proporzione di varianza spiegata dalla regressione Più si avvicina a 1, migliore è il modello

8 Generalizzando: VD = α + β X VI + errore y= α + βx + ε Dove siamo Come verificare se l associazione l tra due variabili non è dovuta al caso (test e IC) Altre variabili possono influire su questa associazione Come misurare la forza di una relazione tra due variabili indipendentemente da potenziali variabili confondenti??

9 ANALISI MULTIVARIATA Insieme di metodi per considerare diverse variabili indipendenti simultaneamente Descrive la relazione tra una variabile di outcome (VD) e i suoi diversi determinanti, con lo scopo di valutare la forza delle associazioni o di predire l outcomel in condizioni diverse L analisi bivariata fornisce una visione parziale, l analisi multivariata una visione più complessa e che si avvicina di più alla realtà Il principale vantaggio dell analisi multivariata consiste nel poter apprezzare, simultaneamente ed indipendentemente, gli effetti di tutte le variabili considerate, depurandoli delle reciproche interferenze

10 Spiegazione non matematica ES: vogliamo fare uno studio sulla prognosi di 1 determinata malattia che non ha ancora una cura. La lunghezza della sopravvivenza di un paziente potrebbe dipendere da: Età del paziente Stadio della malattia Presenza di altre malattie (comorbilit( comorbilità) Sintomi (es( es: : dimagrimento) prognosi comorbilità stadio età sintomi

11 Un po di matematica Prognosi ~ età + stadio + comorbidità + sintomi Queste 4 variabili non hanno tutte necessariamente la stessa importanza, miglioriamo l espressione l dando un peso ad ognuna Prognosi ~ p1xet età + p2xstadio + p3xcomorbidit comorbidità + p4xsintomi Per passare dal circa all uguale inseriamo un termine di errore e una costante che ci serve da ancoraggio Prognosi = costante +p1 x età + p2 x stadio + p3 x comorbidità + p4 x sintomi + errore

12 Ricorda la regressione lineare, ma non è più semplice, è multipla VD = α + β 1 X VI 1 + β 2 X VI errore y= α + β 1 x 1 + β 2 x 2 + β 3 x ε Modelli L equazione rappresenta un modello lineare (generalizzato) A seconda del tipo di variabili, dipendente/i e indipendenti cambia l analisi l regressione lineare multipla Anova Ancova Regressione logistica Regressione di cox Ecc.

13 Esempio: pressione sistolica Possibili variabili influenzanti: Età (significativa) BMI (body mass index) Sesso (M o F) PS media eta 0 50 bmi

14 Relazione PS - bmi α = 90.5 β = 1.5 p<0.001 R 2 = 0.13 Relazione bmi - età α = 21.8 β = 0.1 p<0.001

15 Regressione lineare multipla risultati PS = f(età) Età PS = f(bmi) BMI PS = f(età,, BMI) Età BMI β R

16 ..inseriamo.inseriamo anche il sesso (1=F 2=M) PS = f(età,, BMI, sesso) Età BMI Sesso β R 2 PS = età + 0.6BMI sesso + errore Interpretazione La PS aumenta di 0.7 per ogni anno di età in più (indipendentemente da BMI e sesso) La PS aumenta di 0.6 per ogni punto di BMI in più (indipendentemente da età e sesso) La PS aumenta di 2.7 per i maschi rispetto alle femmine (indipendentemente da età e BMI)

17 Scopi dell analisi multivariata Spiegare le relazioni tra variabili (indipendentemente dalle altre) Prevedere in base alle variabili indipendenti (esplicative) come sarà la variabile dipendente Controllare l effetto di alcune variabili per verificare l effetto l di altre sulla VD Previsione Date le variabili dipendenti, si prevede il valore che ha la variabile dipendente Es: : età +0.6 BMI sesso=? età bmi sesso PS STIMATA 119,7 128,9 120,8

18 Esempio: previsione della probabilità di evento cardiovascolare in funzione di sesso, età,, diabete, fumo, pressione arteriosa, colesterolemia

19 Controllo Si vuole verificare qual è la differenza di pressione tra maschi e femmine Maschi e femmine del campione sono però diversi per età e BMI Ho fatto l analisi l multivariata ma vorrei quantificare la differenza tra maschi e femmine Calcolo i valori corretti (o aggiustati) per sesso ed età M F Pressione media aggiustata* P-value *per età e bmi

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Подробнее

I metodi per la misura della prognosi

I metodi per la misura della prognosi C.I. di Metodologia clinica I metodi per la misura della prognosi Obiettivo Conoscere ed utilizzare i principali strumenti per identificare i fattori di rischio e i fattori prognostici 1 Gallo C. Gallo_

Подробнее

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Подробнее

Inferenza statistica II parte

Inferenza statistica II parte Inferenza statistica II parte Marcella Montico Servizio di epidemiologia e biostatistica Test statistici II parte Variabili quantitative Caso 1 Variabile Dipendente = quantitativa Variabile Indipendente

Подробнее

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni

Подробнее

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Подробнее

Indipendenza, Dipendenza e interdipendenza

Indipendenza, Dipendenza e interdipendenza Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili

Подробнее

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Подробнее

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Подробнее

Analisi Multivariata dei Dati. Regressione Multipla

Analisi Multivariata dei Dati. Regressione Multipla Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da

Подробнее

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Подробнее

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Подробнее

Errori (o bias) negli studi epidemiologici

Errori (o bias) negli studi epidemiologici Errori (o bias) negli studi epidemiologici Errore casuale o random: sono i più pericolosi perché i più difficili da individuare e per questo motivo non è possibile tenerne conto in fase di analisi Variazione

Подробнее

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Подробнее

Analisi della varianza a una via

Analisi della varianza a una via Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici

Подробнее

Statistica. Esercitazione 16. Alfonso Iodice D Enza [email protected]. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 16 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa

Подробнее

Introduzione all Analisi della Varianza (ANOVA)

Introduzione all Analisi della Varianza (ANOVA) Introduzione all Analisi della Varianza (ANOVA) Marcello Gallucci P S I C O M E T R I A [email protected] Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa

Подробнее

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Подробнее

Argomenti della lezione:

Argomenti della lezione: Lezione 9 Argomenti della lezione: La regressione multipla: Approcci analitici Regressione standard Regressione gerarchica Regressione statistica Strategie Analitiche per la regressione Tre principali

Подробнее

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Подробнее

Esercizi su Regressione e Connessione

Esercizi su Regressione e Connessione Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni

Подробнее

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Подробнее

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis [email protected] www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Подробнее

Introduzione all Analisi della Varianza (ANOVA)

Introduzione all Analisi della Varianza (ANOVA) Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci [email protected] Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello

Подробнее

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Подробнее

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Regressione di Cox 7/3/2005

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Regressione di Cox 7/3/2005 SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Regressione di Cox 7/3/2005 Procedura di Mantel-Haenszel Dati relativi a pazienti maschi nel primo anno di follow-up stratificati per età e

Подробнее

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II [email protected] 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Подробнее

Tecniche statistiche di analisi del cambiamento

Tecniche statistiche di analisi del cambiamento Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.0, 3 dicembre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2015-16

Подробнее

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Подробнее

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Подробнее

Interpolazione e metodo dei minimi quadrati

Interpolazione e metodo dei minimi quadrati A. A. 017-018 Interpolazione e metodo dei minimi quadrati prof. ing. Antonio Comi Department of Enterprise Engineering Tor Vergata University of Rome Relazioni tra variabili Molto spesso si verifica che

Подробнее

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Подробнее

LA REGRESSIONE LINEARE NELLA RICERCA CLINICA

LA REGRESSIONE LINEARE NELLA RICERCA CLINICA G Ital Nefrol 2011; 28 (1): 80-84 MASTER in epidemiologia clinica LA REGRESSIONE LINEARE NELLA RICERCA CLINICA Fabio Provenzano, Carmine Zoccali, Giovanni Tripepi CNR-IBIM, Unità di Ricerca di Epidemiologia

Подробнее

Analisi della varianza

Analisi della varianza 1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della

Подробнее

Calcolo di una Regressione lineare semplice con Excel

Calcolo di una Regressione lineare semplice con Excel Calcolo di una Regressione lineare semplice con Excel Inserire i dati In un tabellone vuoto di Excel, inserire i dati di X e di Y. Ad esempio i dati della Tabella 0.1 dovrebbero essere inseriti in Excel

Подробнее

Tecniche statistiche di analisi del cambiamento

Tecniche statistiche di analisi del cambiamento Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.2, 20 marzo 2017) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2016-17

Подробнее

Correlazione e regressione

Correlazione e regressione SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Correlazione e regressione 28/1/2005 Relazioni Che rapporto c'è tra la pressione arteriosa e il peso corporeo? relazione tra due variabili

Подробнее

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria [email protected] Il concetto di interpolazione In matematica, e in particolare in

Подробнее

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Подробнее

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE Lezione IX: Regressione e Correlazione Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone RELAZIONE TRA DUE VARIABILI

Подробнее

Il modello di regressione

Il modello di regressione Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti

Подробнее

viii Indice generale

viii Indice generale Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi

Подробнее

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Подробнее

DISTRIBUZIONE CAMPIONARIA CONGIUNTA

DISTRIBUZIONE CAMPIONARIA CONGIUNTA DISTRIBUZIONE CAMPIONARIA CONGIUNTA Finora ci siamo occupati di medie e scarti ma dobbiamo anche affrontare il problema di studiare le relazioni tra insiemi di dati. La media e la deviazione standard possono

Подробнее

Strumenti di indagine per la valutazione psicologica

Strumenti di indagine per la valutazione psicologica Strumenti di indagine per la valutazione psicologica 1.5 Correlazione e causazione Davide Massidda [email protected] Metodi simmetrici vs asimmetrici Relazioni tra variabili Nei metodi di studio

Подробнее

Il modello di regressione

Il modello di regressione Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti

Подробнее

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2

Подробнее

9.3 Il metodo dei minimi quadrati in formalismo matriciale

9.3 Il metodo dei minimi quadrati in formalismo matriciale 9.3. IL METODO DEI MINIMI QUADRATI IN FORMALISMO MATRICIALE 121 9.3 Il metodo dei minimi quadrati in formalismo matriciale Per applicare il MMQ a funzioni polinomiali, ovvero a dipendenze di una grandezza

Подробнее