Gestione ed Analisi Statistica dei dati
|
|
|
- Costanza Sorrentino
- 10 anni fa
- Visualizzazioni
Transcript
1 Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 13 giugno 2014
2 Argomenti Parte teorica Relazioni tra variabili Analisi univariata Regressione lineare Correlazione Analisi multivariata Regressione lineare multivariata Regressione logistica
3 Le fasi dell analisi statistica 1 step Descrizione del campione frequenze descrittive delle variabili d interesse per lo studio 2 step Inferenza dal campione alla popolazione :Stima Intervalli di confidenza 3 step Analisi Univariata Significatività delle differenze delle caratteristiche tra i gruppi a confronto Test di ipotesi (p-value) misure di associazione tra variabili quantitative (correlazione e regressione) che esprimono la relazione lineare tra due variabili misurabili 4 step Analisi multivariata che esprime la relazione tra l outcome oggetto dello studio e più variabili considerate contemporaneamente
4 Misure di associazione tra variabili quantitative Con il Test di ipotesi si mettono a confronto due misure per valutare la significatività della loro differenza ma il test d ipotesi non ci dice nulla riguardo il tipo di relazione che esiste tra 2 variabili Il passo successivo è trovare una funzione matematica che esprime la relazione tra le variabili
5 Misure di associazione tra variabili quantitative ID pazienti Età Urea mmol/l , , , , , , , , , , , , , , , , , ,9 Partiamo con un esempio : Su un campione di 20 pazienti abbiamo rilevato l età e la concentrazione di urea per misurare l associazione tra queste due variabili. Ovvero vogliamo valutare se al crescere dell età la concentrazione di urea aumenta oppure diminuisce
6 Misure di associazione tra variabili quantitative ID pazienti Età Urea mmol/l , , , , , , , , , , , , , , , , , ,9 Dal grafico sembra che ci sia una relazione. Verifichiamo se questa relazione è lineare e se può essere espressa mediante l equazione di una retta Riportiamo i valori della tabella in un grafico ID Paz 1 ID Paz 2
7 Misure di associazione tra variabili quantitative la RETTA di REGRESSIONE Tra questi punti possono passare diverse rette. Dobbiamo trovare la retta che sia il più possibile vicina alla maggior parte dei punti indicati sul grafico, e per individuare la retta che interpola meglio i dati utilizziamo il metodo dei minimi quadrati La retta che si ottiene mediante il metodo dei minimi quadrati, è quella che minimizza la somma dei quadrati delle differenze tra ciascun punto osservato e i punti della retta. y Retta ottenuta con il metodo dei minimi quadrati xx
8 RETTA di REGRESSIONE METODO DEI MINIMI QUADRATI Indichiamo con x= età y= Urea ŷ= valori di urea stimati dalla retta per ogni valore di x La retta che si ottiene mediante il metodo dei minimi quadrati, è quella che minimizza la seguente somma y Retta ottenuta con il metodo dei minimi quadrati (y- ŷ) Σ (y- ŷ) 2 x
9 RETTA di REGRESSIONE ID pazienti x y ŷ (Valori di urea stimati dalla retta) (y-ŷ) (y-ŷ) ,3-3,3 10, ,6 8,2-2,6 6, ,8 8,8-1,0 1, ,6 9,8-0,2 0, ,4 4,3 1,1 1, ,3 6,0 1,3 1, ,1 5,7-2,6 6, ,8 8,0-1,2 1, ,7 4,5 0,2 0, ,1-3,1 9, ,69 7,7 6,0 35, ,89 10,0 4,9 23, ,8 8,2-0,4 0, ,6 3,7 0,9 0, ,4 7,6-0,2 0, ,6 5,8-1,2 1, ,2 8,3-2,1 4, ,2 3,5 0,7 0, ,7 6,7 5,0 24, ,9 9,2-2,3 5,1 Mediante la retta di regressione sono stati stimati dei valori di urea corrispondenti all età. La differenza tra i valori stimati e i valori osservati si indicano come residui La somma dei quadrati delle differenze (residui) è: Σ (y- ŷ) 2 = 135,4 E poiché abbiamo usato il metodo dei minimi quadrati per individuare la retta che meglio interpola i dati, questo è il più piccolo valore che si poteva ottenere tra tutte le possibili rette ALMA MATER STUDIORUM Università di Bologna
10 RETTA di REGRESSIONE La retta di regressione viene espressa mediante l equazione: ŷ=a+bx a = intercetta (ovvero il valore in cui la retta interseca l asse delle Y b = Pendenza della retta indica di quante volte cresce o diminuisce la Y al crescere di 1 unità della X La retta che abbiamo stimato sui nostri dati ha la seguente equazione: ŷ=-0,963+0,12*x Quindi poiché b=0,12 possiamo concludere che al crescere di 1 anno di età la concentrazione di urea nel sangue cresce di 0, 12 mmol/l
11 RETTA di REGRESSIONE ID pazienti x y ŷ (Valori di urea stimati dalla retta) (y-ŷ) (y-ŷ) ,3-3,3 10, ,6 8,2-2,6 6, ,8 8,8-1,0 1, ,6 9,8-0,2 0, ,4 4,3 1,1 1, ,3 6,0 1,3 1, ,1 5,7-2,6 6, ,8 8,0-1,2 1, ,7 4,5 0,2 0, ,1-3,1 9, ,69 7,7 6,0 35, ,89 10,0 4,9 23, ,8 8,2-0,4 0, ,6 3,7 0,9 0, ,4 7,6-0,2 0, ,6 5,8-1,2 1, ,2 8,3-2,1 4, ,2 3,5 0,7 0, ,7 6,7 5,0 24, ,9 9,2-2,3 5,1 Da questa equazione ŷ=-0,963+0,12*x Sostituendo ai valori della x l età, si ottengono i valori stimati di urea Ad esempio per x=60 ŷ=-0,963+0,12*60= 6,3 ALMA MATER STUDIORUM Università di Bologna
12 Coefficienti non standardizzati Coefficienti standardizzati Intervallo di confidenza 95,0% per B Modello B Deviazion e sta nd ard Err ore Beta t Sig. Limite inf eri ore Limite su per ior e 1 (Costante) -,963 2,633 -,366,719-6,496 4,569 età,120,039,589 3,096,006,039,202 Riepilogo del modello R-quadrato corretto Deviazione standard Errore della stima Modello R R-quadrato 1,589 a,347,311 2,74346 a. Predittori: (Costante), età ALMA MATER STUDIORUM Università di Bologna
13 Nel valutare la relazione tra variabili quantitative (cioè misurabili) ci poniamo le seguenti domande 1. Esiste una associazione lineare tra due variabili? 2. Che verso ha tale relazione? 3. Qual è la forza di tale relazione?
14 1. Esiste una associazione lineare tra due variabili? Verifica grafica: La relazione è di tipo lineare se, rappresentata su assi cartesiani, si avvicina alla forma di una retta. Y In questo caso, all aumentare di X aumenta Y. Ad esempio, all aumentare dell altezza (X) di una persona aumenta anche il suo peso (Y). X ALMA MATER STUDIORUM Università di Bologna
15 1. Esiste una associazione lineare tra due variabili? Verifica grafica: La relazione è di tipo non lineare, se rappresentata su assi cartesiani, ha un andamento curvilineo (parabola o iperbole). Y In questo caso a livelli bassi e alti di X corrispondono livelli bassi di Y; mentre a livelli intermedi di X corrispondono livelli alti di Y. X
16 2. Che verso ha tale relazione? Il verso (o direzione) può essere: positivo, se all aumentare di una variabile aumenta anche l altra. Y Il verso (o direzione) può essere: negativo, se all aumentare di una variabile l altra diminuisce. Y X X
17 Relazione lineare: retta di regressione Se esiste una relazione lineare allora Y può essere espressa in funzione di X mediante l equazione : Variabile dipendente Variabile indipendente ovvero Esiste una funzione matematica che esprime la relazione tra la Y (variabile dipendente) e la X (variabile indipendente) a = intercetta (ovvero il valore in cui la retta interseca l asse delle Y b = Pendenza della retta indica di quante volte cresce o diminuisce la Y al crescere di 1 unità della X Y Y X X
18 La regressione lineare con SPSS Dal dataset Completo che abbiamo creato ieri verificare se tra Età emodialitica (in mesi) e l Età BH c è una relazione lineare La variabile dipendente è l Età emodialitica SPSS Click Analizza Regressione lineare SPSS Click Analizza Regressione Stima di curve Click lineare, includi costante nell equazione, equazione, visualizza grafici
19 Esempio con SPSS: risultato Modello Coefficienti non standardizzati B Deviazione standard Errore Coefficienti a Coefficienti standardizz ati Beta t Sig. Intervallo di confidenza 95,0% per B Limite inferiore Limite superiore 1 (Costante) 23,337 1,551 15,048,000 20,286 26,388 Età_emodialitica(m esi) a. Variabile dipendente: Età_BH(mesi) Il risultato ci dice che l età BH dipende linearmente dall età emodialitica in modo significativo. Al crescere di un unità dell età emodialitica l età BH cresce di 0,12 mesi Quindi l equazione della retta di regressione è:,120,016,390 7,723,000,090,151 Y=23,34+0,12X Mediante questa equazione possiamo stimare l etl età BH per ogni età emodialitica p-value ALMA MATER STUDIORUM Università di Bologna
20 Esempio con SPSS: risultato Graficamente: Scarti positivi Scarti negativi Quindi non tutta la variabilità dell Età BH è spiegata dall età emodialitica. Il rapporto tra la varianza della Y stimata e la varianza osservata della Y, indicata anche come: Varianza spiegata Varianza totale = R 2 Coefficiente di determinazione Riepilogo del modello e stime dei parametri Variabile dipendente: Età_BH(mesi) Equazion e Riepilogo del modello Stime di parametri R- quadrato F df1 df2 Sig. Costant e Lineare,152 59, ,000 23,337,120 La variabile indipendente è Età_emodialitica(mesi). b1
21 Coefficiente di determinazione Varianza spiegata Varianza totale = R 2 Varianza spiegata è la varianza attribuibile alla relazione che sussiste tra X ed Y. Ed è calcolata come differenza della retta di regressione dal valore medio Varianza spiegata(y) = Σ (Ŷ-media di y) 2 n y stimato dalla retta di regressione Varianza totale è la varianza di Y: varianza(y) = Σ (y-media di y) 2 n Quindi il coefficiente di determinazione R 2 fornisce la proporzione della varianza di Y determinata dalla sua relazione con X. Nel nostro esempio R 2 =0,152, significa che l età emodialitica spiega il 15,8% della variabilità dell Età BH ovvero che il rimanente 85% è spiegato da altri fattori che non sono stati considerati ALMA MATER STUDIORUM Università di Bologna
22 Retta di regressione La retta di regressione ha la proprietà di minimizzare la somma dei quadrati delle differenze tra i valori osservati e quelli stimati mediante la retta Scarti (differenze) di ciascun valore rispetto al valore stimato dalla retta
23 3. Qual è la forza di tale relazione? Quanto più i punti sono raggruppati attorno ad una retta, tanto più forte è la relazione tra due variabili. Y Y X X
24 Se i punti sono dispersi in maniera uniforme, invece, tra le due variabili non esiste alcuna relazione.
25 misure di associazione tra variabili quantitative Correlazione La retta di regressione esprime la relazione funzionale tra Y ed X, quindi dopo aver stimato l intercetta a e la pendenza b, mediante l equazione della retta possiamo ottenere i valori di Y corrispondenti a ciascun valore di X La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare e quindi indica la forza o l intensità del loro legame.
26 Coefficiente di correlazione Può assumere valori compresi tra -1 e 1 Y Se assume valori positivi allora tra le 2 variabili c è una correlazione positiva: al crescere di una variabile anche l altra cresce X Se assume valori negativi allora tra le 2 variabili c è una correlazione negativa : al crescere di una variabile l altra decresce Y X Se assume valore 0 significa che non esiste relazione lineare tra le due variabili
27 Coefficiente di correlazione di Pearson ALMA MATER STUDIORUM Università di Bologna Si usa per variabili Quantitative Indicando con X e Y le due variabili di cui vogliamo calcolare la correlazione R = Covarianza(X, Y) varianza(x) * varianza(y) Dove la sommatoria Covarianza(X, Y) = Σ (x-media di x)*(y-media di y) n Numerosità del campione varianza(x) = Σ (x-media di x) 2 n varianza(y) = Σ (y-media di y) 2 n
28 La Correlazione con SPSS Nel dataset Completo calcolate la correlazione tra l Età BH e l Età emodialitica utilizzando SPSS SPSS Click Correlazione bivariata
29 La Correlazione con SPSS Correlazioni Correlazione di Pearson Età_BH(m esi) Età_emod ialitica(m esi) 1,390 ** Età_BH(mesi) Età_emodialitica (mesi) Sig. (2-code),000 N Correlazione di Pearson Sig. (2-code),000,390 ** 1 N **. La correlazione è significativa al livello 0,01 (2-code). Il coefficiente di correlazione è 0,39 ed è significativo p-value=0,000, è positivo e quindi tra l Età BH e l età emodialitica esiste una correlazione positiva. Il quadrato dell indice di correlazione fornisce il coefficiente di determinazione: 0,39x0,39=0,152
30 Coefficiente di correlazione Per calcolare il coefficiente di correlazione è necessario che le variabili siano quantitative o ordinali: Quantitative coefficiente di correlazione di Pearson Ordinali coefficienti di correlazione di Spearman (per ranghi)
31 Coefficiente di correlazione di Spearman Si usa per variabili Ordinali ed è un coefficiente di correlazione tra ranghi Ad es. dai dati rilevati su 357 pazienti, il coefficiente di correlazione tra VAS ed età si ottiene nel modo seguente: VAS N rango ADL N pazienti rango rango Vas rango ADL n pazienti differenza tra ranghi
32 Coefficiente di correlazione di Spearman rango Vas rango ADL n pazienti differenza tra ranghi Si calcola il coefficiente di correlazione di Spearman Σ D Rs = 2 1- n*(n 2-1) Dove D 2 è la differenza al quadrato tra i ranghi
33 Correlazione di Spearman tra VAS e ADL: risultato di SPSS Questo è il risultato della correlazione tra la VAS e l ADL Misure simmetriche Ordinale per ordinale Tau-b di Kendall Tau-c di Kendall Correlazione di Spearman Valore E.S. asint. a T appross. b Sig. appross c Intervallo per intervallo R di Pearson c N. di casi validi 355 Correlazione -0,93: è negativa quindi al crescere dell ADL la VAS decresce ma questa correlazione non è significativa (p-value=0.081),
34 Coefficiente di correlazione di Spearman in SPSS SPSS Click Analizza Statistiche descrittive Tavole di contingenza Statistiche Click Correlazioni, Tau-b di Kendall, Tau-c di Kendall SPSS Click Analizza Correlazione bivariata
35 Esercizio Utilizzando il dataset Completo Calcolate: Retta di regressione e correlazione tra le seguenti variabili: VAS ed età VAS e v_difficoltà_inserimento VAS e a_difficoltà_inserimento VAS e effetto trampolino VAS e a_calibro Ematocrito ed età Ematocrito ed età emodialitica Ematocrito ed età BH Età emodialitica e BMI
36 Analisi Statistica multivariata E la parte più importante dello studio L Analisi multivariata permette di stimare un modello matematico di associazione tra l endpoint di interesse (variabile dipendente) e più variabili considerate contemporaneamente (variabili indipendenti) Variabile dipendente Y=a+b 1 X 1 +b 2 X 2 Variabili indipendenti
37 Analisi di regressione Esempio Regressione lineare semplice: vogliamo stimare la relazione tra la pressione sistolica arteriosa e il peso corporeo Dati su 10 soggetti Diagramma di dispersione N soggetti Pressione sistolica arteriosa (PAS) (mm Hg) Peso corporeo (Kg) Totale media PAS (mm Hg) Peso (Kg) C è una tendenza della PAS ad aumentare al crescere del peso
38 Analisi di regressione: esempio regressione lineare semplice PAS (mm Hg) Peso (Kg) Questi punti sono dispersi intorno ad una possibile retta di regressione L equazione di questa possibile retta è: PAS (variabile dipendente) Y=a+bX Peso (variabile indipendente) Mediante il metodo dei minimi quadrati che minimizza gli scarti tra la retta e i vari punti Si ottiene: Y=19,5+1,65X che significa che per ogni valore del Peso (X) moltiplicandolo per 1,65 e sommandogli 19,5 si ottiene il valore stimato di PAS, a cui va associato un intervallo di confidenza Per il peso x=80 si ha la PAS stimata y=19,5+1,65*80=151,5
39 Perché è necessaria l analisi multivariata? Ma la relazione trovata tra PAS e Peso corporeo può risentire dell effetto di altre variabili confondenti che è necessario tenere in considerazione N soggetti Pressione sistolica arteriosa (PAS) (mm Hg) Y Peso corporeo (Kg) X 1 Età (anni) X 2 Sesso (F=1, M=0) X Totale media ,6 0,5 1. E ragionevole pensare che la relazione tra pressione arteriosa e peso sia diversa a seconda dell et età dei pazienti 2. E ragionevole pensare che la relazione tra pressione arteriosa e peso sia diversa anche in base al sesso
40 esempio regressione multipla Quindi all equazione della retta aggiungiamo 2 ulteriori variabili l etl età e il sesso: PAS (variabile dipendente) Y=a+b 1 X 1 + b 2 X 2 +b 3 X 3 Peso Età Sesso N soggetti Pressione sistolica arteriosa (PAS) (mm Hg) Y Peso corporeo (Kg) X 1 Età (anni) X 2 Sesso (F=1, M=0) X 3 Vogliamo stimare Y in base ai valori di X 1 X 2 e X Totale media ,6 0,5 Il modello di regressione multivariato Y =a+ b 1 X 1 + b + b 2 X 2 + b 3 X 3 Dai dati si ottiene : Y =-17,48+ 1,92 X 1 + 0,37 X 2 + 6,5 X 3
41 Costante di regressione Coefficienti parziali di regressione Y=a+b 1 X 1 + b 2 X 2 +b 3 X 3 Dai dati si ottiene : Y =-17,48+ 1,92 X 1 + 0,37 X + 6,5 X 2 3 Interpretazione La PAS (Y) cresce di 1,92 unità al crescere di 1 kg di peso (X1), di 0,37 unità al crescere di 1 anno di età e di 6,5 unità se il paziente è femmina
42 Come è cambiata la stima di Y passando dalla regressione univariata a quella multivariata La relazione tra PAS e peso senza considerare l influenza di altri fattori di rischio, è stimata dalla retta di regressione Y=19,5+1,65 X1 Aggiungendo altre 2 variabili la relazione stimata tra PAS e peso cambia Y = -17,48+ 1,92 X1 + 0,37 X2 + 6,5 X3
43 Regressione univariata Y=19,5+1,65 X1 output SPSS Il 65% del valore di PAS È spiegato dalla sua relazione con l età Riepilogo del modello Modello R R-quadrato R-quadrato corretto Deviazione standard Errore della stima 1,805 a,648,604 9,610 a. Predittori: (Costante), Peso corporeo (Kg) X1 Coefficienti a Modello Coefficienti non standardizzati Coefficienti t Sig. standardizzati B Deviazione standard Errore Beta 1 (Costante) 19,500 30,236,645,537 Peso corporeo (Kg) X1 1,650,430,805 3,839,005 a. Variabile dipendente: Pressione sistolica arteriosa (PAS) (mm Hg) Y Il peso è in relazione significativa con la pressione sistolica arteriosa(pas): al crescere di 1 kg di peso la PAS cresce di 1,65 unità
44 Regressione multivariata Y = -17,48+ 1,92 X1 + 0,37 X2 + 6,5 X3 output SPSS Riepilogo del modello Modello R R-quadrato R-quadrato corretto Deviazione standard Errore della stima 1,946 a,895,842 6,075 a. Predittori: (Costante), Sesso (F=1 M=0) X3, Età (anni) X2, Peso corporeo (Kg) X1 L 89,5% della variabilità della PAS è spiegata dal modello multivariato L unico coefficiente significativo Coefficienti a Modello Coefficienti non standardizzati Coefficienti t Sig. standardizzati B Deviazione standard Errore Beta (Costante) -17,478 46,367 -,377,719 1 Peso corporeo (Kg) X1 1,920,652,937 2,947,026 Età (anni) X2,374,154,417 2,425,052 Sesso (F=1 M=0) X3 6,499 9,332,224,696,512 a. Variabile dipendente: Pressione sistolica arteriosa (PAS) (mm Hg) Y
45 La regressione lineare multivariata con SPSS Dal dataset Completo verificare se c è una relazione lineare tra la VAS e l età Randomizzazione v_difficoltà_inserimento v_effetto_trampilino La variabile dipendente è la VAS SPSS Click Analizza Regressione lineare
46 Modello Modell o a. Predittori: (Costante), Età, Randomizzazione, V_effetto_trampolino, V_difficoltà_inserimento Coefficienti a Coefficienti non standardizzati B Deviazione standard Errore Riepilogo del modello R R- quadrato Coefficienti standardizzati Beta R-quadrato corretto Deviazione standard Errore della stima 1,276 a,076,065 1,543 t Sig. Intervallo di confidenza 95,0% per B Limite inferiore Limite superiore 1 (Costante) 3,366 1,181 Randomizzazione,084,171,026 V_difficoltà_inseri mento V_effetto_trampoli no,117,343,021 2,558,595,260 Età,000,007 -,004 a. Variabile dipendente: VAS 2,8 50,49 1,34 2 4,3 02 -,07 4,005 1,043 5,690,624 -,253,421,732 -,557,792,000 1,388 3,728,941 -,014,013 Quindi il modello trovato per la VAS è: Y=-3,36+0,08X 1 +-0,117X 2 +2,56X 3 +0X 4
47 Alcune considerazioni sull Indice di determinazione R 2 l Indice di determinazione R 2 misura la frazione della variabilità di Y dovuta alla sua dipendenza lineare dai regressori. Presenta però degli inconvenienti: Assume valori elevati anche quando la relazione non è di tipo lineare Cresce sempre al crescere del numero di regressori Per ovviare a questi inconvenienti si considera R 2 corretto =1-(1-R 2 )*(n-1)/(n-m) dove n è la numerosità del campione ed m è il numero dei regressori
48 Modello Modell o a. Predittori: (Costante), Età, Randomizzazione, V_effetto_trampolino, V_difficoltà_inserimento Coefficienti a Coefficienti non standardizzati B Deviazione standard Errore Riepilogo del modello R R- quadrato Coefficienti standardizzati Beta R-quadrato corretto Deviazione standard Errore della stima 1,276 a,076,065 1,543 t Sig. Intervallo di confidenza 95,0% per B Limite inferiore Limite superiore 1 (Costante) 3,366 1,181 Randomizzazione,084,171,026 V_difficoltà_inseri mento V_effetto_trampoli no,117,343,021 2,558,595,260 Età,000,007 -,004 a. Variabile dipendente: VAS 2,8 50,49 1,34 2 4,3 02 -,07 4,005 1,043 5,690,624 -,253,421,732 -,557,792,000 1,388 3,728,941 -,014,013 Quindi il modello trovato per la VAS è: Y=-3,36+0,08X 1 +-0,117X 2 +2,56X 3 +0X 4
49 Analisi Statistica multivariata per endpoints dicotomici Nella maggior parte degli studi clinici la variabile dipendente può assumere solo due valori: sì, di solito codificato come 1 no codificato come 0. Queste variabili sono definite variabili dicotomiche Esempi di variabili dipendenti dicotomiche nella ricerca clinica: presenza/assenza di una patologia (es. BPCO, Scompenso cardiaco, Diabete ecc) Evento sì/no (es. morte, complicanza, riospedalizzazione ecc.)
50 Analisi statistica multivariata per endpoints dicotomici il modello di regressione logistica Il modello di regressione logistica è il modello per l analisi multivariata che viene usato quando la variabile dipendente Y è una variabile dicotomica. La Y viene espressa come logit di p ovvero il logaritmo del rapporto p tra la probabilità di avere l evento e la probabilità di non averlo E espresso come: Logit(p) =α+ β 1 X 1 + β 2 X + β 2 3 X E un modello particolarmente utile perché l esponenziale dei coefficienti β Sono gli odds ratio delle corrispondenti variabili indipendenti X: e β1 =OR(X 1 ), e β 2 =OR(X 2 ),. Viene utilizzato soprattutto negli studi caso-controllo, in cui i casi sono usualmente definiti come nuovi eventi nella popolazione in studio e i controlli sono i non casi
51 il modello di regressione logistica il logit Logit(p) =α+ β1 X1 + β2 X2 + β3 X3+.. dove Logit(p) è il ln p/(1-p) p) ovvero il logit è il logaritmo naturale (ln( ln) ) dell odds p/(1-p) p) Ad esempio se l outcomel in studio è la morte il logit è il logaritmo naturale del rapporto tra la probabilità di morire p e la probabilità di sopravvivere (1-p). Da cui p=probabilit probabilità di morire= e 1- e (α+ β1 X1 + β2 X2 2 + β3 X ) (α+ β1 X1 + β2 X2 2 + β3 X )
52 Analisi statistica multivariata per endpoints dicotomici il modello di regressione logistica ESEMPIO ALMA MATER STUDIORUM Università di Bologna Es. Studio sugli esiti intra-ricovero dei pazienti con età >=80 anni sottoposti ad intervento cardiochirurgico nei centri dell Emilia-Romagna. Obiettivo individuazione dei fattori di rischio associati alla mortalità intra-ricovero analisi statistiche effettuate: 1. Analisi univariata per verificare quali caratteristiche pre-operatorie prese singolarmente erano associate alla mortalità intra-ricovero 1. Analisi multivariata con modello di regressione logistica per valutare l associazione di ciascuna delle caratteristiche risultate significative dall analisi univariata, al netto di tutte le altre
53 Analisi univariata Mortalit Mortalità intra-ricovero ricovero, ULTRA 80 enni: : 1822 interventi Odds Ratio per ciascun fattore di rischio Caratteristiche pre-operatorie significativamente associate alla mortalità Caratteristiche pre-operatorie %morti Odds Ratio Intervallo di confidenza p-value Procedura in emergenza 28,4 7,2 4,1 12,8 <0,0001 Infarto miocardico recente 8,9 1,8 1,2 2,7 0,008 Scompenso cardiaco 14,9 3,2 2 5,2 <0,0001 Angina instabile 8,9 1,7 1,1 2,7 0,03 Instabilità emodinamica 25,5 5,9 3,1 11,4 <0,0001 Rianimazione cuore-polmone 40 10,6 1,7 63,8 0,0014 Shock cardiogeno 28 6,4 2,6 15,7 <0,0001 FE 30%-50% 9 1,8 1,2 2,8 0,003 NYHA 3 e 4 8,2 1,9 1,3 2,7 0,0015 Creatinina>=2mg/dl 13 2,4 1,1 5,5 0,0301 BPCO severa 10,3 1,9 1,1 3,6 0,044 Reintervento 14 2,6 1,2 6 0,017 Intervento di Bypass + Valvole 8,2 1,6 1 2,4 0,037
54 Risultati analisi multivariata ALMA MATER STUDIORUM Università di Bologna Fattori di rischio risultati significativamente associati alla mortalità intra-ricovero da un Modello di regressione logistica multivariato Odds Ratio aggiustati per ciascun fattore di rischio Fattori di rischio OR 95% Wald Confidence Limits p value Procedura in emergenza <.0001 NYHA IV EF 30% - 50% BPCO severa Reintervento Inyervento di Bypass + Valvole
55 Risultati dell analisi univariata e dell analisi multivariata: Odds ratio dei fattori di rischio significativamente associati alla mortalità Con l analisi l multivariata 6 caratteristiche pre-operatorie, che erano risultate significativamente associate alla mortalità nell analisi univariata, perdono la loro significatività statistica Caratteristiche pre-operatorie %morti Analasi univariata Analisi multivariata Odds Ratio p-value Odds Ratio p-value Procedura in emergenza 28,4 7,2 <0,0001 6,5 <0,0001 Infarto miocardico recente 8,9 1,8 0,008 Scompenso cardiaco 14,9 3,2 <0,0001 Angina instabile 8,9 1,7 0,03 Instabilità emodinamica 25,5 5,9 <0,0001 Rianimazione cuore-polmone 40 10,6 0,0014 Shock cardiogeno 28 6,4 <0,0001 FE 30%-50% 9 1,8 0,003 1,6 0,031 NYHA 3 e 4 8,2 1,9 0,0015 2,3 0,002 Creatinina>=2mg/dl 13 2,4 0,0301 BPCO severa 10,3 1,9 0,044 2,1 0,024 Reintervento 14 2,6 0,017 2, Intervento di Bypass + Valvole 8,2 1,6 0,037 1,7 0,02
56 Interpretazione dei risultati dell analisi multivariata 1. Come interpretare il fatto che 6 caratteristiche pre-operatorie, che erano risultate significativamente associate alla mortalità nell analisi univariata, perdono la loro significatività statistica nell analisi multivariata Il motivo è che ciascun paziente può avere più di una caratteristica pre- operatoria contemporaneamente e con l analisi l multivariata si stima l associazione con la mortalità di ciascuna caratteristica al netto dell influenza delle altre Ad esempio: lo scompenso cardiaco che dall analisi univariata risultava essere fortemente associata alla mortalità (OR=3,2) ha perso la sua significatività statistica nell analisi multivariata perché i pazienti con scompenso cardiaco deceduti avevano anche altre caratteristiche maggiormente associate alla mortalità come ad esempio NYHA 3 o 4, precedente intervento di cardiochirurgia ecc. Quindi lo scompenso cardiaco da solo non risulta essere un fattore di rischio di mortalità dopo intervento cardiochirurgico nei pazienti con più di 80 anni.
57 Interpretazione dei risultati dell analisi multivariata (segue ) 2. Come interpretare gli odds ratio stimati dall analisi analisi multivariata Analisi multivariata Fattori di rischio %morti Odds Ratio p-value Procedura in emergenza 28,4 6,5 <0,0001 FE 30%-50% 9 1,6 0,031 NYHA 3 e 4 8,2 2,3 0,002 BPCO severa 10,3 2,1 0,024 Reintervento 14 2, Intervento di Bypass + Valvole 8,2 1,7 0,02 Interpretazione: I pazienti ultra 80enni sottoposti ad intervento cardiochirurgico in emergenza sia che abbiano o non abbiano altri fattori di rischio associati risultati significativi dall analisi analisi multivariata (come FE 30%-50%, NYHA 3 o 4, BPCO severa, reintervento o intervento di Bypass + valvole) hanno un rischio di morte intra-ricovero ricovero 6 volte e mezzo superiore a quelli che vengono operati in elezione o in urgenza. Analoga interpretazione può essere data per gli altri fattori di rischio.
58 Analisi multivariata: proprietà della regressione logistica Il modello di regressione logistica permette: 1. Di effettuare l analisi multivariata per outcome dicotomici (nel nostro esempio la morte intra-ricovero) 2. Fornisce direttamente gli odds ratio dei fattori di rischio 3. Fornisce per ciascun paziente la probabilità di avere l outcome in studio in base alle sue caratteristiche
59 Analisi multivariata: regressione logistica con SPSS SPSS Click Regressione Logistica binaria
Relazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
LA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.
Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni
Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla
Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
Gestione ed Analisi Statistica dei dati (per costruire il report: step by step con SPSS)
Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati (per costruire il report: step by step con ) Daniela Fortuna 12
Il concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
Regressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: [email protected] web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114
Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali [email protected]
Dip. di Scienze Umane e Sociali [email protected] Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
La distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
Lineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia,
Capitolo 13: L offerta dell impresa e il surplus del produttore
Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:
Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate
Introduzione alle relazioni multivariate Associazione e causalità Associazione e causalità Nell analisi dei dati notevole importanza è rivestita dalle relazioni causali tra variabili Date due variabili
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale
I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che
La categoria «ES» presenta (di solito) gli stessi comandi
Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna [email protected] ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:
Indici di dispersione
Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo
Il metodo della regressione
Il metodo della regressione Consideriamo il coefficiente beta di una semplice regressione lineare, cosa significa? È una differenza tra valori attesi Anche nel caso classico di variabile esplicativa continua
LA CRESCITA DELLE POPOLAZIONI ANIMALI
LA CRESCITA DELLE POPOLAZIONI ANIMALI Riccardo Scipioni Generalmente, con il termine crescita di una popolazione si intende l aumento, nel tempo, del numero di individui appartenenti ad una stessa popolazione.
Metodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
SOLUZIONI D = (-1,+ ).
SOLUZIONI. Data la funzione f() ( ) ln( ) a) trova il dominio di f b) indica quali sono gli intervalli in cui f() risulta positiva e quelli in cui risulta negativa c) determina le eventuali intersezioni
RISCHIO E CAPITAL BUDGETING
RISCHIO E CAPITAL BUDGETING Costo opportunità del capitale Molte aziende, una volta stimato il loro costo opportunità del capitale, lo utilizzano per scontare i flussi di cassa attesi dei nuovi progetti
Regressione Logistica: un Modello per Variabili Risposta Categoriali
: un Modello per Variabili Risposta Categoriali Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 1 / 54 Introduzione Premessa I modelli di regressione
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS
Per utilizzare SPSS sui PC dell aula informatica occorre accedere come: ID: SPSS Password: winidams Testo rapido di consultazione: Fideli R. Come analizzare i dati al computer. ed. Carocci, Urbino, 2002.
Excel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
Statistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
Inferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
I metodi di analisi statistica per la valutazione degli effetti a breve termine dell inquinamento atmosferico nel progetto EpiAir
I metodi di analisi statistica per la valutazione degli effetti a breve termine dell inquinamento atmosferico nel progetto EpiAir Massimo Stafoggia, per il gruppo collaborativo EpiAir Obiettivi del progetto
STATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
Elaborazione dei dati su PC Regressione Multipla
21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione
1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE
STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.
SOLUZIONE DEL PROBLEMA 1 TEMA DI MATEMATICA ESAME DI STATO 2015
SOLUZIONE DEL PROBLEMA 1 TEMA DI MATEMATICA ESAME DI STATO 015 1. Indicando con i minuti di conversazione effettuati nel mese considerato, la spesa totale mensile in euro è espressa dalla funzione f()
Basi di matematica per il corso di micro
Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione
Dott.ssa Caterina Gurrieri
Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo
STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE
STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza
Misure della dispersione o della variabilità
QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.
Statistica inferenziale
Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo
Concetto di potenza statistica
Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1 Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H
FUNZIONE. Si scrive: A B f: A B x y=f(x) (si legge: f funzione da A in B) x f y= f(x)
1 FUNZIONE Dati gli insiemi A e B, si definisce funzione da A in B una relazione o legge o corrispondenza che ad ogni elemento di A associa uno ed un solo elemento di B. Si scrive: A B f: A B f() (si legge:
Anno 4 Grafico di funzione
Anno 4 Grafico di funzione Introduzione In questa lezione impareremo a disegnare il grafico di una funzione reale. Per fare ciò è necessario studiare alcune caratteristiche salienti della funzione che
Il coefficiente di correlazione di Spearman per ranghi
Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili
LE FUNZIONI A DUE VARIABILI
Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre
Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R
Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.
Pro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
LEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
Statistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : = y
Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : ' = y y' = Consideriamo il punto P(,5) se eseguiamo tra trasformazione
3) ANALISI DEI RESIDUI
3) ANALISI DEI RESIDUI Dopo l analisi di regressione si eseguono alcuni test sui residui per avere una ulteriore conferma della validità del modello e delle assunzioni (distribuzione normale degli errori,
Verifica di ipotesi e intervalli di confidenza nella regressione multipla
Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo
LE CARTE DI CONTROLLO (4)
LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale
Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).
ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione
Il confronto fra proporzioni
L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,
FUNZIONE REALE DI UNA VARIABILE
FUNZIONE REALE DI UNA VARIABILE Funzione: legge che ad ogni elemento di un insieme D (Dominio) tale che D R, fa corrispondere un elemento y R ( R = Codominio ). f : D R : f () = y ; La funzione f(): A
Corso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
Capitolo 5. Funzioni. Grafici.
Capitolo 5 Funzioni. Grafici. Definizione: Una funzione f di una variabile reale,, è una corrispondenza che associa ad ogni numero reale appartenente ad un insieme D f R un unico numero reale, y R, denotato
Funzioni. Funzioni /2
Funzioni Una funzione f è una corrispondenza tra due insiemi A e B che a ciascun elemento di A associa un unico elemento di B. Si scrive: f : A B l'insieme A si chiama il dominio della funzione f, l'insieme
CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
MATEMATICA 2001. p = 4/6 = 2/3; q = 1-2/3 = 1/3. La risposta corretta è quindi la E).
MATEMATICA 2001 66. Quale fra le seguenti affermazioni è sbagliata? A) Tutte le funzioni ammettono la funzione inversa B) Una funzione dispari è simmetrica rispetto all origine C) Una funzione pari è simmetrica
Corrispondenze e funzioni
Corrispondenze e funzioni L attività fondamentale della mente umana consiste nello stabilire corrispondenze e relazioni tra oggetti; è anche per questo motivo che il concetto di corrispondenza è uno dei
Lineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) La Regressione Multipla La Regressione Multipla La regressione multipla
0 < a < 1 a > 1. In entrambi i casi la funzione y = log a (x) si può studiare per punti e constatare che essa presenta i seguenti andamenti y
INTRODUZIONE Osserviamo, in primo luogo, che le funzioni logaritmiche sono della forma y = log a () con a costante positiva diversa da (il caso a = è banale per cui non sarà oggetto del nostro studio).
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Tassi di incidenza 9/2/2005
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Tassi di incidenza 9/2/2005 Ricerca epidemiologica Gli epidemiologi sono interessati a conoscere l incidenza delle malattie per prevedere i
4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0
Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice
Indici (Statistiche) che esprimono le caratteristiche di simmetria e
Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica
Rapporto dal Questionari Insegnanti
Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la
Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica
MINIMI QUADRATI. REGRESSIONE LINEARE
MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione
Matematica e Statistica
Matematica e Statistica Prova d esame (0/07/03) Università di Verona - Laurea in Biotecnologie - A.A. 0/3 Matematica e Statistica Prova di MATEMATICA (0/07/03) Università di Verona - Laurea in Biotecnologie
Slide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo [email protected] A.Studio dell interdipendenza tra variabili: riepilogo Concetto relativo allo studio delle relazioni tra
LEZIONE 7. Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x 3 3 + x2. 2, x3 +2x +3.
7 LEZIONE 7 Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x 3 3 + x2 2 6x, x3 +2x 2 6x, 3x + x2 2, x3 +2x +3. Le derivate sono rispettivamente,
Un po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano
Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria
Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Christopher N. Sciamanna, Scott P. Novak, Bess H. Marcus. International Journal of
Definisci il Campo di Esistenza ( Dominio) di una funzione reale di variabile reale e, quindi, determinalo per la funzione:
Verso l'esame di Stato Definisci il Campo di Esistenza ( Dominio) di una funzione reale di variabile reale e, quindi, determinalo per la funzione: y ln 5 6 7 8 9 0 Rappresenta il campo di esistenza determinato
FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA
FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello
Statistica. Esercitazione 15. Alfonso Iodice D Enza [email protected]. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 15 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo
LA RETTA. Retta per l'origine, rette orizzontali e verticali
Retta per l'origine, rette orizzontali e verticali LA RETTA Abbiamo visto che l'equazione generica di una retta è del tipo Y = mx + q, dove m ne rappresenta la pendenza e q il punto in cui la retta incrocia
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare.
Appunti di Statistica DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare. PROCESSO STATISTICO L indagine statistica comprende
2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale
BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health [email protected]
Relazioni tra variabili
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina
VALORE DELLE MERCI SEQUESTRATE
La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune
Analisi delle relazioni tra due caratteri
Analisi delle relazioni tra due caratteri Le misure di connessione misurano il grado di associazione tra due caratteri qualsiasi sotto il profilo statistico (e non causale in quanto non è compito della
LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010
LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno
lezione 18 AA 2015-2016 Paolo Brunori
AA 2015-2016 Paolo Brunori Previsioni - spesso come economisti siamo interessati a prevedere quale sarà il valore di una certa variabile nel futuro - quando osserviamo una variabile nel tempo possiamo
Prova di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
ANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
Limited Dependent Variable Models
Limited Dependent Variable Models Logit Tobit Probit Modelli Logit e Probit Latent variable models for binary choice Models for descrete dependent variable Traducendo Spesso vogliamo studiare (le determinanti
2. Leggi finanziarie di capitalizzazione
2. Leggi finanziarie di capitalizzazione Si chiama legge finanziaria di capitalizzazione una funzione atta a definire il montante M(t accumulato al tempo generico t da un capitale C: M(t = F(C, t C t M
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Indici di Affidabilità L Attendibilità È il livello in cui una misura è libera da errore di misura È la proporzione di variabilità della misurazione
FONDAMENTI DI PSICOMETRIA - 8 CFU
Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso
