Modelli di regressione. M.Bozzolan a.acc

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Modelli di regressione. M.Bozzolan a.acc"

Transcript

1 Modelli di regressione M.Bozzolan a.acc

2 Variabilità osservata nell outcome??? Ci sono fattori che spiegano il diverso outcome di queste persone? Valori di outcome nella coorte Può aver avuto un influenza l età, la comordibità, il genere?

3 Per prima cosa Esisterà una (cor)relazione tra due variabili? ovvero si muoveranno insieme?

4 La correlazione

5 Il coefficiente di correlazionerpuò assumere valori compresi fra -1 e 1. I valori positivi indicano l'esistenza di una correlazione lineare positiva; i valori negativi indicano una correlazione negativa; il valore 0 indica assenza di correlazione. Non possono essere date regole fisse per l'interpretazione del coefficiente di correlazione, che dipende da una serie di considerazioni. Possiamo dire che in genere, nel settore biomedico ed in epidemiologia, vengono considerati "buoni" valori attorno a 0.7 (nel caso di una correlazione positiva) oppure a -0.7 (per una correlazione negativa).

6 Il coefficiente di determinazione (r 2 ) Una volta ottenuto r, possiamo calcolare r 2 (r-quadrato), semplicemente elevando r al quadrato. r 2 viene detto anche coefficiente di determinazione ed è un indice ricco di significato, in quanto esprime la variabilità nella variabile dipendente spiegata dalla variabile indipendente. In parole più semplici, r 2 rappresenta la variazione nei valori di y che può essere giustificata dalla variazione di x. il coefficiente di correlazione r descrive soltanto l'esistenza di una correlazione, ma non dimostra nulla riguardo alla causalità di tale associazione. Lo stesso dicasi per r 2.

7 La retta di regressione Il calcolatore permette di individuare la retta di regressione Una volta trovata la retta di regressione, si può trovare l'equazione della retta medesima. X e y sono le variabili da correlare Y=α+βx Y = β 0 + β 1 X 1

8 In questo esempio si può dedurre che esiste una correlazione fra la dose del farmaco e l'innalzamento della pressione diastolica nel ratto; la correlazione è positiva (ad un aumento del farmaco corrisponde un aumento della pressione) come dimostrato dal fatto che il coefficiente di correlazione r è >0; la correlazione è abbastanza forte, come dimostrato (a) dal valore piuttosto elevato (0.862) raggiunto da r e (b) dal valore piuttosto elevato (1.63) del parametro che determina la pendenza della retta; il 74% circa dell'innalzamento della pressione può essere spiegato dal farmaco; in assenza del farmaco, la variazione di pressione è prossima a zero, come dimostrato dal valore dell'intercetta. Sarebbe opportuno, prima di concludere per un rapporto dose-effetto, controllare la presenza di eventuali fattori di confondimento e poi verificare i criteri di causalità

9 Perché fare regressioni (lineari) semplici può essere pericoloso Non ci permette di verificare la presenza di variabili di confondimento Le correlazioni e le regressioni lineari semplici sono perciò per lo più usate in fase di elaborazione/esplorazione e per costruire modelli di regressione multipla Costruendo questi modelli con più variabili indipendenti si possono eliminare perciò le variabili che non contribuiscono realmente alla variabilità outcome e lasciare quelle variabili che contribuiscono a spiegare la variabilità degli outcome osservati

10 Regressione lineare semplice Regressione lineare semplice Il termine regressione venne coniato dallo statistico Francis Galton nel 19 secolo. Egli lo utilizzò per descrivere la sua osservazione che i figli di padri di bassa statura tendevano ad essere più alti ed i figli di padri alti tendevano ad essere più bassi dei loro padri, così che i figli tendevano a regredire verso l altezza media degli uomini. Karl Pearson, amico di Galton, sviluppò le basi matematiche per quella che poi è stata chiamata analisi di regressione, una tecnica statistica usata per descrivere e quantificare la relazione tra due o più variabili.

11 Regressione lineare semplice Nella regressione lineare, il termine semplice si riferisce al fatto che vengono messe in relazione solo due variabili. La tecnica viene perciò detta bivariata. Il termine lineare indica che la relazione può essere descritta con una linea retta. La relazione tra le due variabili è tale che quando l una aumenta o diminuisce in dimensione, anche l altra cambia la propria dimensione.

12 La forza della relazione tra le varibili dipendente e indipendente è data dal coefficiente di relazione, di solito denominato R. R varia da -1 (una perfetta relazione inversa), attraverso lo 0 (nessuna relazione), a +1 (una perfetta relazione diretta). R 2 o R-squared coefficiente di determinazione, è la proporzione o percentuale della variazione totale dei valori della variabile dipendente che viene spiegata dalla regressione.

13 Regressione linerare multivariata La regressione lineare multivariata è una generalizzazione della regressione lineare semplice. Descrive la relazione tra due o più variabili indendenti ed una singola variabile dipendente. Gli output dei programmi statistici forniscono: un coefficiente di regressione, che corrisponde al valore di y in cui la retta intercetta l asse delle ordinate e coefficienti di regressione per ciascuna delle variabili indipendenti. Il coefficiente di regressione di ciascuna variabile indipendente rappresenta il cambiamento della variabile dipendente per il cambiamento pari ad un unità della variabile indipendente, con le altre variabili mantenute costanti.

14 Regressione linerare multivariata La forza della relazione tra la variabile dipendente e tutte le variabili indipendenti è dato dal coefficiente di determinazione R2. Come nella regressione semplice, R2 misura la percentuale di variazione della variabile dipendente che viene spiegata dalla regressione (la restante parte dovrà essere evidentemente spiegata da altri fattori, non inclusi nella regressione). L output del computer fornisce anche un valore denominato R2 aggiustato ("adjusted R2 ). L aggiunta di multiple variabili indipendenti aumenta R2 indipendentemente dall influenza sulla variabile dipendente delle ulteriori variabili. L aggiustamento è il prezzo da pagare per le variabili ulteriori e corregge producendo una miglior stima complessiva. Come per la regressione semplice, vengono generate statistiche t, p values e intervalli di confidenza per i coefficienti di regressione per testare se essi differiscono significativamente dallo 0.

15 Regressione logistica La regressione logistica multivariata è la tecnica statistica usata quando si voglia stimare la probabilità di un outcome dicotomico (es la presenza/assenza di una malattia oppure la morte). La probabilità del verificarsi dell outcome è la variabile dipendente ed i vari fattori che la influenzano sono le variabili indipendenti, talora denominatee fattori di rischio. Vengono stimati gli odds.

16 Inoltre Tipologie di modelli di regressione Modelli di regressione 1 sola variabile esplicativa 2 o più variabili esplicative semplice multipla lineare non lineare lineare non lineare

17 Interpretiamo le analisi univariate nella tabella che segue: la variabile dipendente è il punteggio allo SPADI (un indice di dolore e disabilità della spalla) Cosa significa R2? Cosa significa β? Quali sono statisticamente significativi?

18

19 Interpretiamo ora questa regressione multipla (aggiustata) I modelli di regressione multipla generano equazioni Y = β 0 + β 1 X β m X m + ε

20 I modelli di regressione multipla generano equazioni Y = β 0 + β 1 X β m X m + ε Cosa vuol dire? Y = β 0 + β 1 X β m X m + ε Disabilità prevista per il sign.mario= β 0 + (-14) valore educazione di Mario + 11 valore dolore spalla mario valorebaseline SPADI di Mario + ε Attraverso questa equazione, ed avendo i valori del vostro specifico paziente (Mario) potete stimare, per es, la sua prognosi!

21 Background. Although fear-avoidance beliefs (FABs) have been explored in younger adults and Spanish older adults, their relationships to measures of low back pain (LBP) related disability, overall physical health, and falling have not been investigated in older American adults. Objective. The purpose of this study was to examine the association of FABs with self-reported disability, physical health, and falling among community-dwelling older adults with LBP in the United States. Design. This was a cross-sectional study. Methods. Ninety-three community-dwelling men and women with current LBP were included in this analysis. Participants completed the Fear-Avoidance Beliefs Questionnaire physical activity subscale (FABQ-PA). The modified Oswestry Disability Questionnaire (mosw) and the Quebec Back Pain Disability Scale (QUE) were used to measure self-reported disability, and the Medical Outcomes Study 36-Item Short-Form Health Survey questionnaire (SF-36) physical component summary (PCS) score was used to assess physical health. Participants provided demographic information and information regarding LBP duration and intensity. Linear regression models were developed using the following dependent variables: mosw, QUE, and SF-36 PCS scores. Logistic regression was used to determine the association between high FABs and falling. Results. For each analysis, the FABQ-PA score independently explained 3% to 6% of the variance in the LBP-related disability score and 3% of the variance in the SF-36 PCS score. For all dependent variables, the strongest contributors to explained variance were pain intensity, assistive device use, and FABQ-PA score. High FABs were associated with falling.

22 Rispetto al punteggio alla scala Oswestry modificata per la disabilità per la lombalgia: MODELLO 1 (età, sesso, peso, educazione e uso di un ausilio) spiega il 33% della varianza (P<.0001) nella disabilità legata alla lombalgia. L aggiunta, nel MODELLO 2, dell intensità e durata del dolore, ha spiegato un ulteriore 30% della varianza (P<.0001). Dopo aver tenuto conto dei fattori demografici e le caratteristiche del dolore, l inclusione del punteggio al questionario di fear avoidance believe (MODELLO 3) ha spiegato un ulteriore 3% della varianza dei punteggio alla moswestry (P=.007). 66% 33% 30% 3% R2 values and R2 change statistics for each model are shown in Table 2.

23 Cosa abbiamo imparato oggi? Come interpretare Il coefficiente di correlazione Il coefficiente di determinazione Il significato dei modelli di regressione (multipla)

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

ANALISI MULTIVARIATA

ANALISI MULTIVARIATA ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Indipendenza, Dipendenza e interdipendenza

Indipendenza, Dipendenza e interdipendenza Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta.

Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta. Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad Noviembre de

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Regressione logistica

Regressione logistica SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Regressione logistica 31/1/2005 Regressione categoriale Una delle applicazioni più utili della regressione multipla potrebbe essere quella

Dettagli

La regressione lineare semplice

La regressione lineare semplice La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

CAPITOLO 11 ANALISI DI REGRESSIONE

CAPITOLO 11 ANALISI DI REGRESSIONE VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle

Dettagli

Psicometria con Laboratorio di SPSS 2

Psicometria con Laboratorio di SPSS 2 Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18

Dettagli

Correlazione tra due variabili

Correlazione tra due variabili Correlazione tra due variabili Federico Plazzi 26 Novembre 2015 Correlazione tra due variabili Correlazione tra due variabili Variabili dipendenti e variabili indipendenti La variabile indipendente è quella

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili?

Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili? Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili? Quale tipo di legame? Quanto forte? Siamo sicuri che non sia dovuto al caso? Tutti i modelli

Dettagli

Esercitazione. 24 Aprile 2012

Esercitazione. 24 Aprile 2012 Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Metodi Matematici e Informatici per la biologia. Esercizi

Metodi Matematici e Informatici per la biologia. Esercizi Metodi Matematici e Informatici per la biologia Esercizi Esercizio 1 Il modo migliore per isolare gli effetti delle variabili nascoste sulla variabile di risposta è di effettuare uno studio di osservazione

Dettagli

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche Corso di Statistica Medica Correlazione Regressione Lineare Statistica Medica Correlazione e Regressione lineare

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,

Dettagli

LA REGRESSIONE LINEARE SEMPLICE

LA REGRESSIONE LINEARE SEMPLICE LA REGRESSIONE LINEARE SEMPLICE Se due variabili X e Y sono tra loro correlate, e sono entrambe su scala a intervalli o rapporti equivalenti, la tecnica statistica della regressione lineare consente di

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Psicometria con Laboratorio di SPSS 1

Psicometria con Laboratorio di SPSS 1 Psicometria con Laboratorio di SPSS 1 1-Panoramica delle tecniche: Spiegazione intuitiva vers. 1.1 (vers. 1.1, 14 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),

Dettagli

L'ultima lezione Marcello Gallucci Milano-Bicocca

L'ultima lezione Marcello Gallucci Milano-Bicocca L'ultima lezione A M D Marcello Gallucci Milano-Bicocca Come (si potrebbe) studiare Si consiglia di studiare partendo dalle slide del corso (vedi cartella Lezioni ), cercando di individuare la logica degli

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

Testi del Syllabus. Resp. Did. STRACCI FABRIZIO Matricola:

Testi del Syllabus. Resp. Did. STRACCI FABRIZIO Matricola: Testi del Syllabus Resp. Did. STRACCI FABRIZIO Matricola: 006234 Docente STRACCI FABRIZIO Anno offerta: 2017/2018 Insegnamento: GP003917 - STATISTICA MEDICA Corso di studio: L056 - LOGOPEDIA (ABILITANTE

Dettagli

Introduzione all Analisi della Varianza (ANOVA)

Introduzione all Analisi della Varianza (ANOVA) Introduzione all Analisi della Varianza (ANOVA) Marcello Gallucci P S I C O M E T R I A marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente

Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 01 dicembre 2014 8 LEZIONE Statistica inferenziale Probabilità Campione Popolazione

Dettagli

LA REGRESSIONE LINEARE NELLA RICERCA CLINICA

LA REGRESSIONE LINEARE NELLA RICERCA CLINICA G Ital Nefrol 2011; 28 (1): 80-84 MASTER in epidemiologia clinica LA REGRESSIONE LINEARE NELLA RICERCA CLINICA Fabio Provenzano, Carmine Zoccali, Giovanni Tripepi CNR-IBIM, Unità di Ricerca di Epidemiologia

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 02 dicembre 2014 11 LEZIONE LA REGRESSIONE LINEARE SEMPLICE E LA CORRELAZIONE Regressione

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

ESERCITAZIONE ANCOVA

ESERCITAZIONE ANCOVA ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

Modelli e procedure per l educazione degli adulti

Modelli e procedure per l educazione degli adulti CdL SEAFC a.a. 2016-2017 II semestre Pedagogia sperimentale. Modelli e procedure per l educazione degli adulti francesco.agrusti@uniroma3.it T6. Modelli e procedure di valutazione Ultimo appuntamento con

Dettagli

Statistica multivariata Donata Rodi 21/11/2016

Statistica multivariata Donata Rodi 21/11/2016 Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di

Dettagli

Test d ipotesi. Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona. Ipotesi alternativa (H 1 )

Test d ipotesi. Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona. Ipotesi alternativa (H 1 ) Test d ipotesi Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Nel 900 falsificazione di ipotesi (Karl Popper) TEST D IPOTESI Nell 800 dimostrazione di ipotesi

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Test d ipotesi. Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona. Ipotesi alternativa (H 1 )

Test d ipotesi. Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona. Ipotesi alternativa (H 1 ) Test d ipotesi Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Nel 900 falsificazione di ipotesi (Karl Popper) TEST D IPOTESI Nell 800 dimostrazione di ipotesi

Dettagli

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in

Dettagli

Valutazione dei modelli matematici

Valutazione dei modelli matematici Valutazione dei modelli matematici Andrea Onofri 30 aprile 2013 Indice 1 Introduzione 2 2 Metodi grafici di valutazione 2 3 Metodi numerici 3 3.1 Il coefficiente di determinazione................... 5

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZION 13 Analisi della interdipendenza e della dipendenza : overview Docente:

Dettagli

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero:

Dettagli

LABORATORI DI STATISTICA SOCIALE

LABORATORI DI STATISTICA SOCIALE Università degli Studi di Bergamo Dipartimento di Scienze Umane e Sociali Corso di Laurea in Scienze Psicologiche LABORATORI DI STATISTICA SOCIALE Lezione V Prof. Andrea Greco Dott.ssa Roberta Adorni Dott.

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

Metodologie Quantitative

Metodologie Quantitative Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione

Dettagli

Statistica multivariata Donata Rodi 08/11/2016

Statistica multivariata Donata Rodi 08/11/2016 Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Università di Pavia Econometria Esercizi 5

Università di Pavia Econometria Esercizi 5 Università di Pavia Econometria 2007-2008 Esercizi 5 Maggio, 2008 1. Una regressione lineare multipla di y su una costante, x 2 e x 3 produce i seguenti risultati: ŷ t = 4 + 0.4x t2 + 0.9x t3 con X X =

Dettagli

Correlazione e regressione

Correlazione e regressione SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Correlazione e regressione 28/1/2005 Relazioni Che rapporto c'è tra la pressione arteriosa e il peso corporeo? relazione tra due variabili

Dettagli

Qualche principio generale dell analisi statistica

Qualche principio generale dell analisi statistica Statistica medica Alla fine di questa lezione dovreste essere in grado di: riconoscere i principali metodi utilizzati nel confronto di due gruppi riconoscere i principali metodi utilizzati nel confronto

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le

Dettagli

ESERCITAZIONE REGRESSIONE MULTIPLA

ESERCITAZIONE REGRESSIONE MULTIPLA ESERCITAZIONE REGRESSIONE MULTIPLA Dati delle Nazioni Unite del 2005 riferiti, per diverse nazioni, al tasso di feconditá (bambini per donna) (variabile Fert), alla percentuale di donne che usa contraccettivi

Dettagli

Psicometria. 9-Analisi fattoriale confermativa vers. 1.0

Psicometria. 9-Analisi fattoriale confermativa vers. 1.0 Psicometria 9-Analisi fattoriale confermativa vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it Giovanni Battista Flebus 1 giovannibattista.flebus@unimib.it 1 Dipartimento di Psicologia, Università di

Dettagli

viii Indice generale

viii Indice generale Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi

Dettagli

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice

Dettagli

Tecniche statistiche di analisi del cambiamento

Tecniche statistiche di analisi del cambiamento Tecniche statistiche di analisi del cambiamento 11-Anova con covariata (v. 1.3, 5 dicembre 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2018-19

Dettagli

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare

Dettagli

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi: DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme

Dettagli

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte) Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1 Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande,

Dettagli

Relazioni tra variabili (fenomeni) aziendali

Relazioni tra variabili (fenomeni) aziendali Relazioni tra variabili (fenomeni) aziendali - giornate di assenza dal lavoro è collegato a qualifica professionale, anzianità, sesso, dei dipendenti? - incidenti sul lavoro sono collegati a orario di

Dettagli

Le caratteristiche della ricerca correlazionale

Le caratteristiche della ricerca correlazionale Le caratteristiche della ricerca correlazionale Ricerche correlazionali: studi che valutano l esistenza di relazioni tra le caratteristiche rilevate sui soggetti -Differenze individuali -Predire una variabile

Dettagli

Esercitazione 9 del corso di Statistica (parte seconda)

Esercitazione 9 del corso di Statistica (parte seconda) Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

lezione 10 AA Paolo Brunori

lezione 10 AA Paolo Brunori AA 2016-2017 Paolo Brunori Redditi svedesi - il dataset contiene i dati di reddito di 838 individui - il dataset contiene le variabili: sex = sesso age = età edu = anni di istruzione y_gross = reddito

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di

Dettagli

B il suo coe ciente si interpreta come la variazione di Y dovuta alla variazione unitaria di X (0! 1)

B il suo coe ciente si interpreta come la variazione di Y dovuta alla variazione unitaria di X (0! 1) Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 01/02/2017 Matricola Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso per passare

Dettagli