LA REGRESSIONE LINEARE NELLA RICERCA CLINICA
|
|
|
- Giuditta Ranieri
- 9 anni fa
- Просмотров:
Транскрипт
1 G Ital Nefrol 2011; 28 (1): MASTER in epidemiologia clinica LA REGRESSIONE LINEARE NELLA RICERCA CLINICA Fabio Provenzano, Carmine Zoccali, Giovanni Tripepi CNR-IBIM, Unità di Ricerca di Epidemiologia Clinica e Fisiopatologia delle Malattie Renali e dell Ipertensione Arteriosa, Reggio Calabria Introduzione I trials clinici controllati e randomizzati sono studi sperimentali disegnati per analizzare l efficacia di uno specifico trattamento in termini quantitativi. I pazienti randomizzati ai due bracci di trattamento di un trial clinico risultano simili per fattori di rischio noti e non noti (1, 2) e, pertanto, alla fine del trial, ogni differenza osservata tra i due gruppi di pazienti può essere attribuita al solo trattamento. A differenza di quanto accade nei trials clinici, negli studi osservazionali gli individui esposti a un determinato fattore di rischio (per esempio, il fumo) generalmente differiscono da quelli non esposti per una serie di importanti caratteristiche (confonditori) (3) che possono alterare il rapporto tra l esposizione oggetto dell indagine e una determinata malattia o esito clinico. Nell ambito della ricerca eziologica, gli epidemiologi utilizzano due principali tecniche statistiche per controllare per il confondimento: l analisi stratificata (3) e la regressione multipla. La regressione multipla, rispetto all analisi stratificata, ha il vantaggio di poter controllare simultaneamente per più fattori di confondimento. In questo articolo, descriveremo la regressione lineare semplice e multipla e, in un articolo successivo, la regressione logistica. KEY WORDS: Confounding, Multiple linear regression analysis, Simple linear regression analysis PAROLE CHIAVE: Confondimento, Regressione lineare multipla, Regressione lineare semplice La Correlazione Lineare La correlazione lineare analizza la forza dell associazione tra due variabili continue e fornisce una stima di quanto la variabilità dell una è spiegata dalla variabilità dell altra. La regressione lineare descrive, invece, la dipendenza lineare della variabile dipendente da una o più variabili indipendenti. Consideriamo uno studio nel quale gli Autori hanno analizzato il rapporto tra i livelli circolanti di albumina e quelli di triodotironina libera (free triiodothyronine, ft3) in 41 pazienti in dialisi peritoneale (4). Dal momento che vi è l evidenza sperimentale che la malnutrizione e l infiammazione influenzano la funzione tiroidea, i ricercatori hanno considerato i livelli plasmatici di ft3 come variabile dipendente e l albuminemia (un indicatore di malnutrizione/infiammazione) come variabile indipendente. Nell analisi di regressione, la variabile indipendente viene sempre riportata sull asse orizzontale (asse X), mentre la variabile dipendente sull asse verticale (asse Y). Nella Figura 1, ogni punto rappresenta un individuo che è identificato da una coppia di valori: il valore dell albumina sull asse delle X e il corrispondente valore di ft3 sull asse delle Y. Dal grafico nella Figura 1 risulta evidente come, all aumentare dei livelli di albumina, aumentano parallelamente anche i livelli di ft3 e il rapporto tra le due variabili è descritto in maniera adeguata da una linea retta (modello lineare). In questo caso, il coefficiente di correlazione (r) tra i livelli di albumina e di ft3 è Il quadrato del coefficiente di correlazione (0.52²=0.27, cioè il 27%) indica che circa ¼ della variabilità nei livelli plasmatici di ft3 è spiegato dalle concomitanti variazioni dei livelli di albumina. Inoltre, sia l albuminemia che i livelli di ft3 sono inversamente correlati all età (Fig. 2) Società Italiana di Nefrologia - ISSN
2 Provenzano et al Fig. 1 - Rapporto tra i livelli di albumina e di ft3 in 41 pazienti in dialisi peritoneale (4). Nel riquadro di destra è descritta graficamente l analisi dei residui. Le linee tratteggiate indicano l intervallo di confidenza al 95% della retta di regressione (vedi testo per maggiori dettagli). Fig. 2 - Rapporto tra età e livelli circolanti di ft3 e di albumina in 41 pazienti in dialisi peritoneale (4). La regressione lineare semplice La dipendenza lineare tra i livelli circolanti di ft3 e quelli dell albumina può essere analizzata calcolando di quanto aumenta in media l ft3 per ogni incremento unitario di albumina. Questa informazione può essere ottenuta tracciando la retta di regressione che descrive il rapporto ft3-albumina nei 41 pazienti dello studio. In termini generali, la retta di regressione tra due variabili è un equazione del tipo: E(y)=b 0 +b 1 x dove E(y) è la stima (cioè il valore predetto) della variabile dipendente Y, b 0 è l intercetta, b 1 è il coefficiente di regressione e x è un determinato valore della variabile indipendente. L intercetta (b 0 ) è il valore teorico che assume la Y quando la X è uguale a 0 (Fig. 1). Il coefficiente di regressione (b 1 o slope) indica di quanto aumenta in media la variabile dipendente (Y) per ogni incremento unitario della variabile indipendente (X). In termini geometrici, il coefficiente di regressione è la tangente dell angolo che la retta di regressione forma con l asse delle X (Fig. 1). Il metodo utilizzato per stimare l intercetta e il coefficiente di regressione è il metodo dei minimi quadrati. Questo metodo consiste nell identificare i parametri (b 0 e b 1 ) che minimizzano la distanza (residui) tra i valori osservati e quelli stimati dalla retta (vedi grafico di destra nella Fig. 1). L equazione matematica che descrive la retta di regressione del rapporto 2011 Società Italiana di Nefrologia - ISSN
3 La regressione lineare nella ricerca clinica ft3-albumina nei 41 pazienti in dialisi peritoneale è la seguente: ft3= x albumina (g/dl) Un coefficiente di regressione di 1.36 indica che, a un aumento di 1 g/ dl di albumina, corrisponde un incremento medio di 1.36 pg/ml di ft3 [ciò implica che, a un aumento di 2 g/dl di albumina, corrisponde un aumento medio di 2.72 pg/ml di ft3 (cioè 1.36x2)]. Un coefficiente di regressione positivo indica l esistenza di un rapporto diretto tra fattore di rischio (variabile indipendente) e variabile di risultato (variabile dipendente), mentre un coefficiente di regressione negativo indica un rapporto inverso. Il valore dell intercetta (-1.84 pg/ml) corrisponde al valore teorico di ft3 quando l albumina è uguale a 0 (Fig. 1). Risulta evidente che un valore negativo di ft3 (-1.84 pg/ml) e un livello di albumina pari a zero sono dei valori puramente teorici. L intercetta è utile perché può essere utilizzata, insieme al coefficiente di regressione, per predire il valore di ft3 per un dato paziente del quale conosciamo solo i livelli di albumina. Per esempio, il valore stimato di ft3 per un paziente in dialisi peritoneale con un albuminemia di 3.4 g/dl (vedi il punto indicato dalla freccia nella Fig. 1) può essere facilmente calcolato con l equazione: ft3= x3.4=2.78 pg/ml Pertanto, utilizzando la retta di regressione costruita in 41 pazienti in dialisi peritoneale, è possibile predire un valore di ft3 pari a 2.78 pg/ml per un paziente di cui è nota l albuminemia (3.4 g/dl). Per tale paziente, il residuo (-1.48 pg/ml) è calcolato come differenza tra il valore osservato di ft3 (1.30 pg/ml) e quello stimato dalla retta di regressione (2.78 pg/ml). Ripetendo questo calcolo per tutti i valori osservati e predetti di ft3 nei 41 pazienti in dialisi peritoneale, si ottiene la distribuzione dei residui. L analisi dei residui è fondamentale per la verifica degli assunti sottostanti all uso della regressione lineare: 1) ad ogni valore della variabile indipendente (asse X) deve corrispondere un set di valori normalmente distribuiti della variabile dipendente (asse delle Y), 2) la deviazione standard di questo set di valori deve essere identica per ogni valore della variabile indipendente e 3) il rapporto tra le due variabili considerate deve essere di tipo lineare. Se si verificano tutte queste ipotesi, i residui avranno una distribuzione normale. Nel nostro esempio, i residui hanno una distribuzione normale, il che implica che gli assunti sottostanti all uso della regressione lineare sono soddisfatti. Intervallo di confidenza al 95% della retta di regressione La retta di regressione del rapporto ft3-albumina tracciata nei 41 pazienti in dialisi peritoneale è una stima della vera retta di regressione tra le due variabili, cioè della retta di regressione che descrive il rapporto ft3- albumina nell insieme teorico di tutti i pazienti in dialisi peritoneale (universo campionario). Perciò, è necessario stimare il grado di incertezza della retta di regressione calcolando l intervallo di confidenza al 95% (vedi linee tratteggiate nella Fig. 1). Il concetto di intervallo di confidenza può essere spiegato in maniera semplice: se analizziamo 100 campioni di pazienti in dialisi peritoneale, ciascuno dei quali ha la stessa dimensione del campione sotto esame (n=41), e tracciamo per ogni campione la retta di regressione Società Italiana di Nefrologia - ISSN
4 Provenzano et al del rapporto ft3-albumina otteniamo una serie di 100 (lievemente differenti) rette di regressione. L intervallo di confidenza al 95% è l intervallo che include il 95% delle rette di regressione dei 100 campioni analizzati. Nel nostro esempio, l intervallo di confidenza al 95% è abbastanza stretto (Fig. 1), il che implica che il modello lineare descrive in maniera adeguata il rapporto ft3-albumina. La regressione lineare multipla La regressione lineare multipla permette di stimare l effetto di una determinata variabile indipendente (per esempio, x 1 ) su livelli di una specifica variabile dipendente (Y), controllando per l effetto confondente di altri fattori, o covariate (per esempio, x 2, x n ). In termini generali, la regressione lineare multipla ha un equazione del tipo: E(y)=b 0 +b 1 xb 1 +b 2 xb 2 +b 3 xb 3 + +b n x n dove E(y) è la stima o valore predetto di Y, b 0 è l intercetta (cioè il valore di Y quando x 1, x 2 sono uguali a 0) e b 1, b 2, b 3 e b n sono i coefficienti di regressione di x 1, x 2 e x n. Nell esempio precedente, abbiamo descritto il rapporto tra ft3 e albumina in 41 pazienti in dialisi peritoneale e abbiamo trovato che le due variabili erano strettamente associate. L obiettivo che gli Autori del lavoro si sono posti (4) è stato anche quello di analizzare il rapporto ft3-albumina correggendo per l effetto confondente dell età, una variabile che risulta linearmente correlata sia ai livelli di ft3 (r=-0.61, P<0.001) che a quelli dell albumina (r=-0.38, P=0.001) (Fig. 2). L età può essere considerata un potenziale fattore di confondimento, in quanto soddisfa tutti i criteri della definizione di confonditore (3). Infatti, l età influenza sia i livelli di ft3 (la variabile dipendente) sia quelli dell albumina (la variabile indipendente) (Fig. 2): non è un effetto dell esposizione (l età non è una conseguenza dei livelli di albumina) e non vi sono evidenze che dimostrino che l età si trovi nella catena patogenetica tra l esposizione (albumina) e la variabile di risultato (ft3). Introducendo l età nel modello lineare multiplo, la retta di regressione ha la seguente equazione: ft3= x albumina (g/dl) x età (anni) Un coefficiente di regressione di 0.87 indica che, per ogni aumento di 1 g/dl di albumina, si ha un corrispondente aumento di 0.87 pg/ml di ft3. Il coefficiente di regressione aggiustato per l effetto confondente dell età (0.87) differisce in misura importante da quello non corretto (1.36), il che indica che l età è un confonditore di cui tenere conto nell analisi del rapporto tra ft3 e albumina nei pazienti in dialisi peritoneale. In un modello di regressione multipla, il numero delle variabili da testare deve essere in rapporto con il numero dei pazienti inclusi nello studio. Una regola pratica è quella di includere una covariata ogni 10 osservazioni. Pertanto, in un campione di 41 pazienti, è possibile inserire nel modello al massimo 4 covariate Società Italiana di Nefrologia - ISSN
5 La regressione lineare nella ricerca clinica Conclusione La regressione lineare è un importante strumento per testare ipotesi negli studi epidemiologici. L uso della regressione lineare dipende criticamente dalla verifica di specifici assunti: 1) ad ogni valore della variabile indipendente (asse X) deve corrispondere un set di valori normalmente distribuiti della variabile dipendente (asse delle Y), 2) la deviazione standard di questo set di valori deve essere identica per ogni valore della variabile indipendente e 3) il rapporto tra le due variabili considerate deve essere di tipo lineare. Se si verificano tutte queste ipotesi, i residui avranno una distribuzione normale. Indirizzo degli Autori: Dr. Giovanni Tripepi, Statistician, MSc (Epidemiology) CNR-IBIM, Istituto di Biomedicina Epidemiologia Clinica e Fisiopatologia delle Malattie Renali e dell Ipertensione Arteriosa Via Vallone Petrara 55/ Reggio Calabria [email protected] Dichiarazione di conflitto di interessi Gli Autori dichiarano di non avere conflitto di interessi. Bibliografia 1. Provenzano F, Tripepi G, Zoccali C. [Clinical trials (Part I)]. G Ital Nefrol 2010; 27 (4): Provenzano F, Tripepi G, Zoccali C. [Clinical trials (Part II)]. G Ital Nefrol 2010; 27 (5): Provenzano F, Versace MC, Tripepi R, Zoccali C, Tripepi G. [Confounding in epidemiology.]. G Ital Nefrol 2010; 27 (6): Enia G, Panuccio V, Cutrupi S, et al. Subclinical hypothyroidism is linked to micro-inflammation and predicts death in continuous ambulatory peritoneal dialysis. Nephrol Dial Transplant 2007; 22 (2): Società Italiana di Nefrologia - ISSN
L INTERAZIONE NEGLI STUDI EPIDEMIOLOGICI
G Ital Nefrol 2011; 28 (4): 431-435 MASTER IN EPIDEMIOLOGIA CLINICA L INTERAZIONE NEGLI STUDI EPIDEMIOLOGICI Graziella D Arrigo, Fabio Provenzano, Carmine Zoccali, Giovanni Tripepi CNR-IBIM, Unità di Ricerca
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Statistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
ANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis [email protected] www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
Errori (o bias) negli studi epidemiologici
Errori (o bias) negli studi epidemiologici Errore casuale o random: sono i più pericolosi perché i più difficili da individuare e per questo motivo non è possibile tenerne conto in fase di analisi Variazione
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
CAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente
Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione
1. Introduzione ai disegni sperimentali. 5. Analisi della regressione lineare. 6. Confronto tra proporzioni di due o più campioni indipendenti
BIOSTATISTICA 1. Introduzione ai disegni sperimentali 2. Un carattere quantitativo misurato in un campione: elementi di statistica descrittiva e inferenziale 3. Confronto tra medie di due campioni indipendenti
R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo [email protected] Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
LE META-ANALISI. Graziella D Arrigo, Fabio Provenzano, Claudia Torino, Carmine Zoccali, Giovanni Tripepi
G Ital Nefrol 2011; 28 (5): 531-536 MASTER IN EPIDEMIOLOGIA CLINICA LE META-ANALISI Graziella D Arrigo, Fabio Provenzano, Claudia Torino, Carmine Zoccali, Giovanni Tripepi CNR-IBIM, Unità di Ricerca di
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
Verifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
Indipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
La regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
I TEST DIAGNOSTICI E L ANALISI DELLA CURVA ROC
G Ital Nefrol 2011; 28 (6): 642-647 MASTER IN EPIDEMIOLOGIA CLINICA I TEST DIAGNOSTICI E L ANALISI DELLA CURVA ROC Graziella D Arrigo, Fabio Provenzano, Claudia Torino, Carmine Zoccali, Giovanni Tripepi
LEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di
BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria [email protected] Il concetto di interpolazione In matematica, e in particolare in
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo [email protected] Definizioni di base Una popolazione è l insieme
Distribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
STATISTICA. Regressione-2
STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante
Correlazione e regressione
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Correlazione e regressione 28/1/2005 Relazioni Che rapporto c'è tra la pressione arteriosa e il peso corporeo? relazione tra due variabili
i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
Determinazione dell azoto totale e ammoniacale in spettrofotometria: modalità di calibrazione e confrontabilità nel tempo
UNIVERSITÀ DEGLI STUDI DI PAVIA CORSO DI LAUREA INTERFACOLTÀ IN BIOTECNOLOGIE Determinazione dell azoto totale e ammoniacale in spettrofotometria: modalità di calibrazione e confrontabilità nel tempo Relatore:
11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici
CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57
5. Per determinare il miglior grado del polinomio di una regressione polimoniale
Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 16/01/2017 Matricola versione A Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso
Quantificare la forza dell evidenza scientifica (quando i resoconti aneddotici valgono più di uno studio controllato randomizzato)
Quantificare la forza dell evidenza scientifica (quando i resoconti aneddotici valgono più di uno studio controllato randomizzato) Rubrica con metodo Epidemiol Prev Settembre- dicembre 2011 Elena Farina
viii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
Dispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
Metodo dei Minimi Quadrati. Dott. Claudio Verona
Metodo dei Minimi Quadrati Dott. Claudio Verona E in generale interessante studiare l andamento di una variabile in funzione di un altra e capire se c è una funzione matematica che le lega. Viceversa è
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
Test per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
