Gestione ed Analisi Statistica dei dati

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Gestione ed Analisi Statistica dei dati"

Transcript

1 Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 13 giugno 2014

2 Argomenti Parte teorica Relazioni tra variabili Analisi univariata Regressione lineare Correlazione Analisi multivariata Regressione lineare multivariata Regressione logistica

3 Le fasi dell analisi statistica 1 step Descrizione del campione frequenze descrittive delle variabili d interesse per lo studio 2 step Inferenza dal campione alla popolazione :Stima Intervalli di confidenza 3 step Analisi Univariata Significatività delle differenze delle caratteristiche tra i gruppi a confronto Test di ipotesi (p-value) misure di associazione tra variabili quantitative (correlazione e regressione) che esprimono la relazione lineare tra due variabili misurabili 4 step Analisi multivariata che esprime la relazione tra l outcome oggetto dello studio e più variabili considerate contemporaneamente

4 Misure di associazione tra variabili quantitative Con il Test di ipotesi si mettono a confronto due misure per valutare la significatività della loro differenza ma il test d ipotesi non ci dice nulla riguardo il tipo di relazione che esiste tra 2 variabili Il passo successivo è trovare una funzione matematica che esprime la relazione tra le variabili

5 Misure di associazione tra variabili quantitative ID pazienti Età Urea mmol/l , , , , , , , , , , , , , , , , , ,9 Partiamo con un esempio : Su un campione di 20 pazienti abbiamo rilevato l età e la concentrazione di urea per misurare l associazione tra queste due variabili. Ovvero vogliamo valutare se al crescere dell età la concentrazione di urea aumenta oppure diminuisce

6 Misure di associazione tra variabili quantitative ID pazienti Età Urea mmol/l , , , , , , , , , , , , , , , , , ,9 Dal grafico sembra che ci sia una relazione. Verifichiamo se questa relazione è lineare e se può essere espressa mediante l equazione di una retta Riportiamo i valori della tabella in un grafico ID Paz 1 ID Paz 2

7 Misure di associazione tra variabili quantitative la RETTA di REGRESSIONE Tra questi punti possono passare diverse rette. Dobbiamo trovare la retta che sia il più possibile vicina alla maggior parte dei punti indicati sul grafico, e per individuare la retta che interpola meglio i dati utilizziamo il metodo dei minimi quadrati La retta che si ottiene mediante il metodo dei minimi quadrati, è quella che minimizza la somma dei quadrati delle differenze tra ciascun punto osservato e i punti della retta. y Retta ottenuta con il metodo dei minimi quadrati xx

8 RETTA di REGRESSIONE METODO DEI MINIMI QUADRATI Indichiamo con x= età y= Urea ŷ= valori di urea stimati dalla retta per ogni valore di x La retta che si ottiene mediante il metodo dei minimi quadrati, è quella che minimizza la seguente somma y Retta ottenuta con il metodo dei minimi quadrati (y- ŷ) Σ (y- ŷ) 2 x

9 RETTA di REGRESSIONE ID pazienti x y ŷ (Valori di urea stimati dalla retta) (y-ŷ) (y-ŷ) ,3-3,3 10, ,6 8,2-2,6 6, ,8 8,8-1,0 1, ,6 9,8-0,2 0, ,4 4,3 1,1 1, ,3 6,0 1,3 1, ,1 5,7-2,6 6, ,8 8,0-1,2 1, ,7 4,5 0,2 0, ,1-3,1 9, ,69 7,7 6,0 35, ,89 10,0 4,9 23, ,8 8,2-0,4 0, ,6 3,7 0,9 0, ,4 7,6-0,2 0, ,6 5,8-1,2 1, ,2 8,3-2,1 4, ,2 3,5 0,7 0, ,7 6,7 5,0 24, ,9 9,2-2,3 5,1 Mediante la retta di regressione sono stati stimati dei valori di urea corrispondenti all età. La differenza tra i valori stimati e i valori osservati si indicano come residui La somma dei quadrati delle differenze (residui) è: Σ (y- ŷ) 2 = 135,4 E poiché abbiamo usato il metodo dei minimi quadrati per individuare la retta che meglio interpola i dati, questo è il più piccolo valore che si poteva ottenere tra tutte le possibili rette ALMA MATER STUDIORUM Università di Bologna

10 RETTA di REGRESSIONE La retta di regressione viene espressa mediante l equazione: ŷ=a+bx a = intercetta (ovvero il valore in cui la retta interseca l asse delle Y b = Pendenza della retta indica di quante volte cresce o diminuisce la Y al crescere di 1 unità della X La retta che abbiamo stimato sui nostri dati ha la seguente equazione: ŷ=-0,963+0,12*x Quindi poiché b=0,12 possiamo concludere che al crescere di 1 anno di età la concentrazione di urea nel sangue cresce di 0, 12 mmol/l

11 RETTA di REGRESSIONE ID pazienti x y ŷ (Valori di urea stimati dalla retta) (y-ŷ) (y-ŷ) ,3-3,3 10, ,6 8,2-2,6 6, ,8 8,8-1,0 1, ,6 9,8-0,2 0, ,4 4,3 1,1 1, ,3 6,0 1,3 1, ,1 5,7-2,6 6, ,8 8,0-1,2 1, ,7 4,5 0,2 0, ,1-3,1 9, ,69 7,7 6,0 35, ,89 10,0 4,9 23, ,8 8,2-0,4 0, ,6 3,7 0,9 0, ,4 7,6-0,2 0, ,6 5,8-1,2 1, ,2 8,3-2,1 4, ,2 3,5 0,7 0, ,7 6,7 5,0 24, ,9 9,2-2,3 5,1 Da questa equazione ŷ=-0,963+0,12*x Sostituendo ai valori della x l età, si ottengono i valori stimati di urea Ad esempio per x=60 ŷ=-0,963+0,12*60= 6,3 ALMA MATER STUDIORUM Università di Bologna

12 Coefficienti non standardizzati Coefficienti standardizzati Intervallo di confidenza 95,0% per B Modello B Deviazion e sta nd ard Err ore Beta t Sig. Limite inf eri ore Limite su per ior e 1 (Costante) -,963 2,633 -,366,719-6,496 4,569 età,120,039,589 3,096,006,039,202 Riepilogo del modello R-quadrato corretto Deviazione standard Errore della stima Modello R R-quadrato 1,589 a,347,311 2,74346 a. Predittori: (Costante), età ALMA MATER STUDIORUM Università di Bologna

13 Nel valutare la relazione tra variabili quantitative (cioè misurabili) ci poniamo le seguenti domande 1. Esiste una associazione lineare tra due variabili? 2. Che verso ha tale relazione? 3. Qual è la forza di tale relazione?

14 1. Esiste una associazione lineare tra due variabili? Verifica grafica: La relazione è di tipo lineare se, rappresentata su assi cartesiani, si avvicina alla forma di una retta. Y In questo caso, all aumentare di X aumenta Y. Ad esempio, all aumentare dell altezza (X) di una persona aumenta anche il suo peso (Y). X ALMA MATER STUDIORUM Università di Bologna

15 1. Esiste una associazione lineare tra due variabili? Verifica grafica: La relazione è di tipo non lineare, se rappresentata su assi cartesiani, ha un andamento curvilineo (parabola o iperbole). Y In questo caso a livelli bassi e alti di X corrispondono livelli bassi di Y; mentre a livelli intermedi di X corrispondono livelli alti di Y. X

16 2. Che verso ha tale relazione? Il verso (o direzione) può essere: positivo, se all aumentare di una variabile aumenta anche l altra. Y Il verso (o direzione) può essere: negativo, se all aumentare di una variabile l altra diminuisce. Y X X

17 Relazione lineare: retta di regressione Se esiste una relazione lineare allora Y può essere espressa in funzione di X mediante l equazione : Variabile dipendente Variabile indipendente ovvero Esiste una funzione matematica che esprime la relazione tra la Y (variabile dipendente) e la X (variabile indipendente) a = intercetta (ovvero il valore in cui la retta interseca l asse delle Y b = Pendenza della retta indica di quante volte cresce o diminuisce la Y al crescere di 1 unità della X Y Y X X

18 La regressione lineare con SPSS Dal dataset Completo che abbiamo creato ieri verificare se tra Età emodialitica (in mesi) e l Età BH c è una relazione lineare La variabile dipendente è l Età emodialitica SPSS Click Analizza Regressione lineare SPSS Click Analizza Regressione Stima di curve Click lineare, includi costante nell equazione, equazione, visualizza grafici

19 Esempio con SPSS: risultato Modello Coefficienti non standardizzati B Deviazione standard Errore Coefficienti a Coefficienti standardizz ati Beta t Sig. Intervallo di confidenza 95,0% per B Limite inferiore Limite superiore 1 (Costante) 23,337 1,551 15,048,000 20,286 26,388 Età_emodialitica(m esi) a. Variabile dipendente: Età_BH(mesi) Il risultato ci dice che l età BH dipende linearmente dall età emodialitica in modo significativo. Al crescere di un unità dell età emodialitica l età BH cresce di 0,12 mesi Quindi l equazione della retta di regressione è:,120,016,390 7,723,000,090,151 Y=23,34+0,12X Mediante questa equazione possiamo stimare l etl età BH per ogni età emodialitica p-value ALMA MATER STUDIORUM Università di Bologna

20 Esempio con SPSS: risultato Graficamente: Scarti positivi Scarti negativi Quindi non tutta la variabilità dell Età BH è spiegata dall età emodialitica. Il rapporto tra la varianza della Y stimata e la varianza osservata della Y, indicata anche come: Varianza spiegata Varianza totale = R 2 Coefficiente di determinazione Riepilogo del modello e stime dei parametri Variabile dipendente: Età_BH(mesi) Equazion e Riepilogo del modello Stime di parametri R- quadrato F df1 df2 Sig. Costant e Lineare,152 59, ,000 23,337,120 La variabile indipendente è Età_emodialitica(mesi). b1

21 Coefficiente di determinazione Varianza spiegata Varianza totale = R 2 Varianza spiegata è la varianza attribuibile alla relazione che sussiste tra X ed Y. Ed è calcolata come differenza della retta di regressione dal valore medio Varianza spiegata(y) = Σ (Ŷ-media di y) 2 n y stimato dalla retta di regressione Varianza totale è la varianza di Y: varianza(y) = Σ (y-media di y) 2 n Quindi il coefficiente di determinazione R 2 fornisce la proporzione della varianza di Y determinata dalla sua relazione con X. Nel nostro esempio R 2 =0,152, significa che l età emodialitica spiega il 15,8% della variabilità dell Età BH ovvero che il rimanente 85% è spiegato da altri fattori che non sono stati considerati ALMA MATER STUDIORUM Università di Bologna

22 Retta di regressione La retta di regressione ha la proprietà di minimizzare la somma dei quadrati delle differenze tra i valori osservati e quelli stimati mediante la retta Scarti (differenze) di ciascun valore rispetto al valore stimato dalla retta

23 3. Qual è la forza di tale relazione? Quanto più i punti sono raggruppati attorno ad una retta, tanto più forte è la relazione tra due variabili. Y Y X X

24 Se i punti sono dispersi in maniera uniforme, invece, tra le due variabili non esiste alcuna relazione.

25 misure di associazione tra variabili quantitative Correlazione La retta di regressione esprime la relazione funzionale tra Y ed X, quindi dopo aver stimato l intercetta a e la pendenza b, mediante l equazione della retta possiamo ottenere i valori di Y corrispondenti a ciascun valore di X La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare e quindi indica la forza o l intensità del loro legame.

26 Coefficiente di correlazione Può assumere valori compresi tra -1 e 1 Y Se assume valori positivi allora tra le 2 variabili c è una correlazione positiva: al crescere di una variabile anche l altra cresce X Se assume valori negativi allora tra le 2 variabili c è una correlazione negativa : al crescere di una variabile l altra decresce Y X Se assume valore 0 significa che non esiste relazione lineare tra le due variabili

27 Coefficiente di correlazione di Pearson ALMA MATER STUDIORUM Università di Bologna Si usa per variabili Quantitative Indicando con X e Y le due variabili di cui vogliamo calcolare la correlazione R = Covarianza(X, Y) varianza(x) * varianza(y) Dove la sommatoria Covarianza(X, Y) = Σ (x-media di x)*(y-media di y) n Numerosità del campione varianza(x) = Σ (x-media di x) 2 n varianza(y) = Σ (y-media di y) 2 n

28 La Correlazione con SPSS Nel dataset Completo calcolate la correlazione tra l Età BH e l Età emodialitica utilizzando SPSS SPSS Click Correlazione bivariata

29 La Correlazione con SPSS Correlazioni Correlazione di Pearson Età_BH(m esi) Età_emod ialitica(m esi) 1,390 ** Età_BH(mesi) Età_emodialitica (mesi) Sig. (2-code),000 N Correlazione di Pearson Sig. (2-code),000,390 ** 1 N **. La correlazione è significativa al livello 0,01 (2-code). Il coefficiente di correlazione è 0,39 ed è significativo p-value=0,000, è positivo e quindi tra l Età BH e l età emodialitica esiste una correlazione positiva. Il quadrato dell indice di correlazione fornisce il coefficiente di determinazione: 0,39x0,39=0,152

30 Coefficiente di correlazione Per calcolare il coefficiente di correlazione è necessario che le variabili siano quantitative o ordinali: Quantitative coefficiente di correlazione di Pearson Ordinali coefficienti di correlazione di Spearman (per ranghi)

31 Coefficiente di correlazione di Spearman Si usa per variabili Ordinali ed è un coefficiente di correlazione tra ranghi Ad es. dai dati rilevati su 357 pazienti, il coefficiente di correlazione tra VAS ed età si ottiene nel modo seguente: VAS N rango ADL N pazienti rango rango Vas rango ADL n pazienti differenza tra ranghi

32 Coefficiente di correlazione di Spearman rango Vas rango ADL n pazienti differenza tra ranghi Si calcola il coefficiente di correlazione di Spearman Σ D Rs = 2 1- n*(n 2-1) Dove D 2 è la differenza al quadrato tra i ranghi

33 Correlazione di Spearman tra VAS e ADL: risultato di SPSS Questo è il risultato della correlazione tra la VAS e l ADL Misure simmetriche Ordinale per ordinale Tau-b di Kendall Tau-c di Kendall Correlazione di Spearman Valore E.S. asint. a T appross. b Sig. appross c Intervallo per intervallo R di Pearson c N. di casi validi 355 Correlazione -0,93: è negativa quindi al crescere dell ADL la VAS decresce ma questa correlazione non è significativa (p-value=0.081),

34 Coefficiente di correlazione di Spearman in SPSS SPSS Click Analizza Statistiche descrittive Tavole di contingenza Statistiche Click Correlazioni, Tau-b di Kendall, Tau-c di Kendall SPSS Click Analizza Correlazione bivariata

35 Esercizio Utilizzando il dataset Completo Calcolate: Retta di regressione e correlazione tra le seguenti variabili: VAS ed età VAS e v_difficoltà_inserimento VAS e a_difficoltà_inserimento VAS e effetto trampolino VAS e a_calibro Ematocrito ed età Ematocrito ed età emodialitica Ematocrito ed età BH Età emodialitica e BMI

36 Analisi Statistica multivariata E la parte più importante dello studio L Analisi multivariata permette di stimare un modello matematico di associazione tra l endpoint di interesse (variabile dipendente) e più variabili considerate contemporaneamente (variabili indipendenti) Variabile dipendente Y=a+b 1 X 1 +b 2 X 2 Variabili indipendenti

37 Analisi di regressione Esempio Regressione lineare semplice: vogliamo stimare la relazione tra la pressione sistolica arteriosa e il peso corporeo Dati su 10 soggetti Diagramma di dispersione N soggetti Pressione sistolica arteriosa (PAS) (mm Hg) Peso corporeo (Kg) Totale media PAS (mm Hg) Peso (Kg) C è una tendenza della PAS ad aumentare al crescere del peso

38 Analisi di regressione: esempio regressione lineare semplice PAS (mm Hg) Peso (Kg) Questi punti sono dispersi intorno ad una possibile retta di regressione L equazione di questa possibile retta è: PAS (variabile dipendente) Y=a+bX Peso (variabile indipendente) Mediante il metodo dei minimi quadrati che minimizza gli scarti tra la retta e i vari punti Si ottiene: Y=19,5+1,65X che significa che per ogni valore del Peso (X) moltiplicandolo per 1,65 e sommandogli 19,5 si ottiene il valore stimato di PAS, a cui va associato un intervallo di confidenza Per il peso x=80 si ha la PAS stimata y=19,5+1,65*80=151,5

39 Perché è necessaria l analisi multivariata? Ma la relazione trovata tra PAS e Peso corporeo può risentire dell effetto di altre variabili confondenti che è necessario tenere in considerazione N soggetti Pressione sistolica arteriosa (PAS) (mm Hg) Y Peso corporeo (Kg) X 1 Età (anni) X 2 Sesso (F=1, M=0) X Totale media ,6 0,5 1. E ragionevole pensare che la relazione tra pressione arteriosa e peso sia diversa a seconda dell et età dei pazienti 2. E ragionevole pensare che la relazione tra pressione arteriosa e peso sia diversa anche in base al sesso

40 esempio regressione multipla Quindi all equazione della retta aggiungiamo 2 ulteriori variabili l etl età e il sesso: PAS (variabile dipendente) Y=a+b 1 X 1 + b 2 X 2 +b 3 X 3 Peso Età Sesso N soggetti Pressione sistolica arteriosa (PAS) (mm Hg) Y Peso corporeo (Kg) X 1 Età (anni) X 2 Sesso (F=1, M=0) X 3 Vogliamo stimare Y in base ai valori di X 1 X 2 e X Totale media ,6 0,5 Il modello di regressione multivariato Y =a+ b 1 X 1 + b + b 2 X 2 + b 3 X 3 Dai dati si ottiene : Y =-17,48+ 1,92 X 1 + 0,37 X 2 + 6,5 X 3

41 Costante di regressione Coefficienti parziali di regressione Y=a+b 1 X 1 + b 2 X 2 +b 3 X 3 Dai dati si ottiene : Y =-17,48+ 1,92 X 1 + 0,37 X + 6,5 X 2 3 Interpretazione La PAS (Y) cresce di 1,92 unità al crescere di 1 kg di peso (X1), di 0,37 unità al crescere di 1 anno di età e di 6,5 unità se il paziente è femmina

42 Come è cambiata la stima di Y passando dalla regressione univariata a quella multivariata La relazione tra PAS e peso senza considerare l influenza di altri fattori di rischio, è stimata dalla retta di regressione Y=19,5+1,65 X1 Aggiungendo altre 2 variabili la relazione stimata tra PAS e peso cambia Y = -17,48+ 1,92 X1 + 0,37 X2 + 6,5 X3

43 Regressione univariata Y=19,5+1,65 X1 output SPSS Il 65% del valore di PAS È spiegato dalla sua relazione con l età Riepilogo del modello Modello R R-quadrato R-quadrato corretto Deviazione standard Errore della stima 1,805 a,648,604 9,610 a. Predittori: (Costante), Peso corporeo (Kg) X1 Coefficienti a Modello Coefficienti non standardizzati Coefficienti t Sig. standardizzati B Deviazione standard Errore Beta 1 (Costante) 19,500 30,236,645,537 Peso corporeo (Kg) X1 1,650,430,805 3,839,005 a. Variabile dipendente: Pressione sistolica arteriosa (PAS) (mm Hg) Y Il peso è in relazione significativa con la pressione sistolica arteriosa(pas): al crescere di 1 kg di peso la PAS cresce di 1,65 unità

44 Regressione multivariata Y = -17,48+ 1,92 X1 + 0,37 X2 + 6,5 X3 output SPSS Riepilogo del modello Modello R R-quadrato R-quadrato corretto Deviazione standard Errore della stima 1,946 a,895,842 6,075 a. Predittori: (Costante), Sesso (F=1 M=0) X3, Età (anni) X2, Peso corporeo (Kg) X1 L 89,5% della variabilità della PAS è spiegata dal modello multivariato L unico coefficiente significativo Coefficienti a Modello Coefficienti non standardizzati Coefficienti t Sig. standardizzati B Deviazione standard Errore Beta (Costante) -17,478 46,367 -,377,719 1 Peso corporeo (Kg) X1 1,920,652,937 2,947,026 Età (anni) X2,374,154,417 2,425,052 Sesso (F=1 M=0) X3 6,499 9,332,224,696,512 a. Variabile dipendente: Pressione sistolica arteriosa (PAS) (mm Hg) Y

45 La regressione lineare multivariata con SPSS Dal dataset Completo verificare se c è una relazione lineare tra la VAS e l età Randomizzazione v_difficoltà_inserimento v_effetto_trampilino La variabile dipendente è la VAS SPSS Click Analizza Regressione lineare

46 Modello Modell o a. Predittori: (Costante), Età, Randomizzazione, V_effetto_trampolino, V_difficoltà_inserimento Coefficienti a Coefficienti non standardizzati B Deviazione standard Errore Riepilogo del modello R R- quadrato Coefficienti standardizzati Beta R-quadrato corretto Deviazione standard Errore della stima 1,276 a,076,065 1,543 t Sig. Intervallo di confidenza 95,0% per B Limite inferiore Limite superiore 1 (Costante) 3,366 1,181 Randomizzazione,084,171,026 V_difficoltà_inseri mento V_effetto_trampoli no,117,343,021 2,558,595,260 Età,000,007 -,004 a. Variabile dipendente: VAS 2,8 50,49 1,34 2 4,3 02 -,07 4,005 1,043 5,690,624 -,253,421,732 -,557,792,000 1,388 3,728,941 -,014,013 Quindi il modello trovato per la VAS è: Y=-3,36+0,08X 1 +-0,117X 2 +2,56X 3 +0X 4

47 Alcune considerazioni sull Indice di determinazione R 2 l Indice di determinazione R 2 misura la frazione della variabilità di Y dovuta alla sua dipendenza lineare dai regressori. Presenta però degli inconvenienti: Assume valori elevati anche quando la relazione non è di tipo lineare Cresce sempre al crescere del numero di regressori Per ovviare a questi inconvenienti si considera R 2 corretto =1-(1-R 2 )*(n-1)/(n-m) dove n è la numerosità del campione ed m è il numero dei regressori

48 Modello Modell o a. Predittori: (Costante), Età, Randomizzazione, V_effetto_trampolino, V_difficoltà_inserimento Coefficienti a Coefficienti non standardizzati B Deviazione standard Errore Riepilogo del modello R R- quadrato Coefficienti standardizzati Beta R-quadrato corretto Deviazione standard Errore della stima 1,276 a,076,065 1,543 t Sig. Intervallo di confidenza 95,0% per B Limite inferiore Limite superiore 1 (Costante) 3,366 1,181 Randomizzazione,084,171,026 V_difficoltà_inseri mento V_effetto_trampoli no,117,343,021 2,558,595,260 Età,000,007 -,004 a. Variabile dipendente: VAS 2,8 50,49 1,34 2 4,3 02 -,07 4,005 1,043 5,690,624 -,253,421,732 -,557,792,000 1,388 3,728,941 -,014,013 Quindi il modello trovato per la VAS è: Y=-3,36+0,08X 1 +-0,117X 2 +2,56X 3 +0X 4

49 Analisi Statistica multivariata per endpoints dicotomici Nella maggior parte degli studi clinici la variabile dipendente può assumere solo due valori: sì, di solito codificato come 1 no codificato come 0. Queste variabili sono definite variabili dicotomiche Esempi di variabili dipendenti dicotomiche nella ricerca clinica: presenza/assenza di una patologia (es. BPCO, Scompenso cardiaco, Diabete ecc) Evento sì/no (es. morte, complicanza, riospedalizzazione ecc.)

50 Analisi statistica multivariata per endpoints dicotomici il modello di regressione logistica Il modello di regressione logistica è il modello per l analisi multivariata che viene usato quando la variabile dipendente Y è una variabile dicotomica. La Y viene espressa come logit di p ovvero il logaritmo del rapporto p tra la probabilità di avere l evento e la probabilità di non averlo E espresso come: Logit(p) =α+ β 1 X 1 + β 2 X + β 2 3 X E un modello particolarmente utile perché l esponenziale dei coefficienti β Sono gli odds ratio delle corrispondenti variabili indipendenti X: e β1 =OR(X 1 ), e β 2 =OR(X 2 ),. Viene utilizzato soprattutto negli studi caso-controllo, in cui i casi sono usualmente definiti come nuovi eventi nella popolazione in studio e i controlli sono i non casi

51 il modello di regressione logistica il logit Logit(p) =α+ β1 X1 + β2 X2 + β3 X3+.. dove Logit(p) è il ln p/(1-p) p) ovvero il logit è il logaritmo naturale (ln( ln) ) dell odds p/(1-p) p) Ad esempio se l outcomel in studio è la morte il logit è il logaritmo naturale del rapporto tra la probabilità di morire p e la probabilità di sopravvivere (1-p). Da cui p=probabilit probabilità di morire= e 1- e (α+ β1 X1 + β2 X2 2 + β3 X ) (α+ β1 X1 + β2 X2 2 + β3 X )

52 Analisi statistica multivariata per endpoints dicotomici il modello di regressione logistica ESEMPIO ALMA MATER STUDIORUM Università di Bologna Es. Studio sugli esiti intra-ricovero dei pazienti con età >=80 anni sottoposti ad intervento cardiochirurgico nei centri dell Emilia-Romagna. Obiettivo individuazione dei fattori di rischio associati alla mortalità intra-ricovero analisi statistiche effettuate: 1. Analisi univariata per verificare quali caratteristiche pre-operatorie prese singolarmente erano associate alla mortalità intra-ricovero 1. Analisi multivariata con modello di regressione logistica per valutare l associazione di ciascuna delle caratteristiche risultate significative dall analisi univariata, al netto di tutte le altre

53 Analisi univariata Mortalit Mortalità intra-ricovero ricovero, ULTRA 80 enni: : 1822 interventi Odds Ratio per ciascun fattore di rischio Caratteristiche pre-operatorie significativamente associate alla mortalità Caratteristiche pre-operatorie %morti Odds Ratio Intervallo di confidenza p-value Procedura in emergenza 28,4 7,2 4,1 12,8 <0,0001 Infarto miocardico recente 8,9 1,8 1,2 2,7 0,008 Scompenso cardiaco 14,9 3,2 2 5,2 <0,0001 Angina instabile 8,9 1,7 1,1 2,7 0,03 Instabilità emodinamica 25,5 5,9 3,1 11,4 <0,0001 Rianimazione cuore-polmone 40 10,6 1,7 63,8 0,0014 Shock cardiogeno 28 6,4 2,6 15,7 <0,0001 FE 30%-50% 9 1,8 1,2 2,8 0,003 NYHA 3 e 4 8,2 1,9 1,3 2,7 0,0015 Creatinina>=2mg/dl 13 2,4 1,1 5,5 0,0301 BPCO severa 10,3 1,9 1,1 3,6 0,044 Reintervento 14 2,6 1,2 6 0,017 Intervento di Bypass + Valvole 8,2 1,6 1 2,4 0,037

54 Risultati analisi multivariata ALMA MATER STUDIORUM Università di Bologna Fattori di rischio risultati significativamente associati alla mortalità intra-ricovero da un Modello di regressione logistica multivariato Odds Ratio aggiustati per ciascun fattore di rischio Fattori di rischio OR 95% Wald Confidence Limits p value Procedura in emergenza <.0001 NYHA IV EF 30% - 50% BPCO severa Reintervento Inyervento di Bypass + Valvole

55 Risultati dell analisi univariata e dell analisi multivariata: Odds ratio dei fattori di rischio significativamente associati alla mortalità Con l analisi l multivariata 6 caratteristiche pre-operatorie, che erano risultate significativamente associate alla mortalità nell analisi univariata, perdono la loro significatività statistica Caratteristiche pre-operatorie %morti Analasi univariata Analisi multivariata Odds Ratio p-value Odds Ratio p-value Procedura in emergenza 28,4 7,2 <0,0001 6,5 <0,0001 Infarto miocardico recente 8,9 1,8 0,008 Scompenso cardiaco 14,9 3,2 <0,0001 Angina instabile 8,9 1,7 0,03 Instabilità emodinamica 25,5 5,9 <0,0001 Rianimazione cuore-polmone 40 10,6 0,0014 Shock cardiogeno 28 6,4 <0,0001 FE 30%-50% 9 1,8 0,003 1,6 0,031 NYHA 3 e 4 8,2 1,9 0,0015 2,3 0,002 Creatinina>=2mg/dl 13 2,4 0,0301 BPCO severa 10,3 1,9 0,044 2,1 0,024 Reintervento 14 2,6 0,017 2, Intervento di Bypass + Valvole 8,2 1,6 0,037 1,7 0,02

56 Interpretazione dei risultati dell analisi multivariata 1. Come interpretare il fatto che 6 caratteristiche pre-operatorie, che erano risultate significativamente associate alla mortalità nell analisi univariata, perdono la loro significatività statistica nell analisi multivariata Il motivo è che ciascun paziente può avere più di una caratteristica pre- operatoria contemporaneamente e con l analisi l multivariata si stima l associazione con la mortalità di ciascuna caratteristica al netto dell influenza delle altre Ad esempio: lo scompenso cardiaco che dall analisi univariata risultava essere fortemente associata alla mortalità (OR=3,2) ha perso la sua significatività statistica nell analisi multivariata perché i pazienti con scompenso cardiaco deceduti avevano anche altre caratteristiche maggiormente associate alla mortalità come ad esempio NYHA 3 o 4, precedente intervento di cardiochirurgia ecc. Quindi lo scompenso cardiaco da solo non risulta essere un fattore di rischio di mortalità dopo intervento cardiochirurgico nei pazienti con più di 80 anni.

57 Interpretazione dei risultati dell analisi multivariata (segue ) 2. Come interpretare gli odds ratio stimati dall analisi analisi multivariata Analisi multivariata Fattori di rischio %morti Odds Ratio p-value Procedura in emergenza 28,4 6,5 <0,0001 FE 30%-50% 9 1,6 0,031 NYHA 3 e 4 8,2 2,3 0,002 BPCO severa 10,3 2,1 0,024 Reintervento 14 2, Intervento di Bypass + Valvole 8,2 1,7 0,02 Interpretazione: I pazienti ultra 80enni sottoposti ad intervento cardiochirurgico in emergenza sia che abbiano o non abbiano altri fattori di rischio associati risultati significativi dall analisi analisi multivariata (come FE 30%-50%, NYHA 3 o 4, BPCO severa, reintervento o intervento di Bypass + valvole) hanno un rischio di morte intra-ricovero ricovero 6 volte e mezzo superiore a quelli che vengono operati in elezione o in urgenza. Analoga interpretazione può essere data per gli altri fattori di rischio.

58 Analisi multivariata: proprietà della regressione logistica Il modello di regressione logistica permette: 1. Di effettuare l analisi multivariata per outcome dicotomici (nel nostro esempio la morte intra-ricovero) 2. Fornisce direttamente gli odds ratio dei fattori di rischio 3. Fornisce per ciascun paziente la probabilità di avere l outcome in studio in base alle sue caratteristiche

59 Analisi multivariata: regressione logistica con SPSS SPSS Click Regressione Logistica binaria

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

Gestione ed Analisi Statistica dei dati (per costruire il report: step by step con SPSS)

Gestione ed Analisi Statistica dei dati (per costruire il report: step by step con SPSS) Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati (per costruire il report: step by step con ) Daniela Fortuna 12

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: [email protected] web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali [email protected]

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali [email protected] Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia,

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate Introduzione alle relazioni multivariate Associazione e causalità Associazione e causalità Nell analisi dei dati notevole importanza è rivestita dalle relazioni causali tra variabili Date due variabili

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che

Dettagli

La categoria «ES» presenta (di solito) gli stessi comandi

La categoria «ES» presenta (di solito) gli stessi comandi Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna [email protected] ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:

Dettagli

Indici di dispersione

Indici di dispersione Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo

Dettagli

Il metodo della regressione

Il metodo della regressione Il metodo della regressione Consideriamo il coefficiente beta di una semplice regressione lineare, cosa significa? È una differenza tra valori attesi Anche nel caso classico di variabile esplicativa continua

Dettagli

LA CRESCITA DELLE POPOLAZIONI ANIMALI

LA CRESCITA DELLE POPOLAZIONI ANIMALI LA CRESCITA DELLE POPOLAZIONI ANIMALI Riccardo Scipioni Generalmente, con il termine crescita di una popolazione si intende l aumento, nel tempo, del numero di individui appartenenti ad una stessa popolazione.

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

SOLUZIONI D = (-1,+ ).

SOLUZIONI D = (-1,+ ). SOLUZIONI. Data la funzione f() ( ) ln( ) a) trova il dominio di f b) indica quali sono gli intervalli in cui f() risulta positiva e quelli in cui risulta negativa c) determina le eventuali intersezioni

Dettagli

RISCHIO E CAPITAL BUDGETING

RISCHIO E CAPITAL BUDGETING RISCHIO E CAPITAL BUDGETING Costo opportunità del capitale Molte aziende, una volta stimato il loro costo opportunità del capitale, lo utilizzano per scontare i flussi di cassa attesi dei nuovi progetti

Dettagli

Regressione Logistica: un Modello per Variabili Risposta Categoriali

Regressione Logistica: un Modello per Variabili Risposta Categoriali : un Modello per Variabili Risposta Categoriali Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 1 / 54 Introduzione Premessa I modelli di regressione

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS

3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS Per utilizzare SPSS sui PC dell aula informatica occorre accedere come: ID: SPSS Password: winidams Testo rapido di consultazione: Fideli R. Come analizzare i dati al computer. ed. Carocci, Urbino, 2002.

Dettagli

Excel Terza parte. Excel 2003

Excel Terza parte. Excel 2003 Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

I metodi di analisi statistica per la valutazione degli effetti a breve termine dell inquinamento atmosferico nel progetto EpiAir

I metodi di analisi statistica per la valutazione degli effetti a breve termine dell inquinamento atmosferico nel progetto EpiAir I metodi di analisi statistica per la valutazione degli effetti a breve termine dell inquinamento atmosferico nel progetto EpiAir Massimo Stafoggia, per il gruppo collaborativo EpiAir Obiettivi del progetto

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Elaborazione dei dati su PC Regressione Multipla

Elaborazione dei dati su PC Regressione Multipla 21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.

Dettagli

SOLUZIONE DEL PROBLEMA 1 TEMA DI MATEMATICA ESAME DI STATO 2015

SOLUZIONE DEL PROBLEMA 1 TEMA DI MATEMATICA ESAME DI STATO 2015 SOLUZIONE DEL PROBLEMA 1 TEMA DI MATEMATICA ESAME DI STATO 015 1. Indicando con i minuti di conversazione effettuati nel mese considerato, la spesa totale mensile in euro è espressa dalla funzione f()

Dettagli

Basi di matematica per il corso di micro

Basi di matematica per il corso di micro Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo

Dettagli

Concetto di potenza statistica

Concetto di potenza statistica Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1 Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H

Dettagli

FUNZIONE. Si scrive: A B f: A B x y=f(x) (si legge: f funzione da A in B) x f y= f(x)

FUNZIONE. Si scrive: A B f: A B x y=f(x) (si legge: f funzione da A in B) x f y= f(x) 1 FUNZIONE Dati gli insiemi A e B, si definisce funzione da A in B una relazione o legge o corrispondenza che ad ogni elemento di A associa uno ed un solo elemento di B. Si scrive: A B f: A B f() (si legge:

Dettagli

Anno 4 Grafico di funzione

Anno 4 Grafico di funzione Anno 4 Grafico di funzione Introduzione In questa lezione impareremo a disegnare il grafico di una funzione reale. Per fare ciò è necessario studiare alcune caratteristiche salienti della funzione che

Dettagli

Il coefficiente di correlazione di Spearman per ranghi

Il coefficiente di correlazione di Spearman per ranghi Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.

Dettagli

Pro e contro delle RNA

Pro e contro delle RNA Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : = y

Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : = y Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : ' = y y' = Consideriamo il punto P(,5) se eseguiamo tra trasformazione

Dettagli

3) ANALISI DEI RESIDUI

3) ANALISI DEI RESIDUI 3) ANALISI DEI RESIDUI Dopo l analisi di regressione si eseguono alcuni test sui residui per avere una ulteriore conferma della validità del modello e delle assunzioni (distribuzione normale degli errori,

Dettagli

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Verifica di ipotesi e intervalli di confidenza nella regressione multipla Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo

Dettagli

LE CARTE DI CONTROLLO (4)

LE CARTE DI CONTROLLO (4) LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale

Dettagli

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

FUNZIONE REALE DI UNA VARIABILE

FUNZIONE REALE DI UNA VARIABILE FUNZIONE REALE DI UNA VARIABILE Funzione: legge che ad ogni elemento di un insieme D (Dominio) tale che D R, fa corrispondere un elemento y R ( R = Codominio ). f : D R : f () = y ; La funzione f(): A

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

Capitolo 5. Funzioni. Grafici.

Capitolo 5. Funzioni. Grafici. Capitolo 5 Funzioni. Grafici. Definizione: Una funzione f di una variabile reale,, è una corrispondenza che associa ad ogni numero reale appartenente ad un insieme D f R un unico numero reale, y R, denotato

Dettagli

Funzioni. Funzioni /2

Funzioni. Funzioni /2 Funzioni Una funzione f è una corrispondenza tra due insiemi A e B che a ciascun elemento di A associa un unico elemento di B. Si scrive: f : A B l'insieme A si chiama il dominio della funzione f, l'insieme

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

MATEMATICA 2001. p = 4/6 = 2/3; q = 1-2/3 = 1/3. La risposta corretta è quindi la E).

MATEMATICA 2001. p = 4/6 = 2/3; q = 1-2/3 = 1/3. La risposta corretta è quindi la E). MATEMATICA 2001 66. Quale fra le seguenti affermazioni è sbagliata? A) Tutte le funzioni ammettono la funzione inversa B) Una funzione dispari è simmetrica rispetto all origine C) Una funzione pari è simmetrica

Dettagli

Corrispondenze e funzioni

Corrispondenze e funzioni Corrispondenze e funzioni L attività fondamentale della mente umana consiste nello stabilire corrispondenze e relazioni tra oggetti; è anche per questo motivo che il concetto di corrispondenza è uno dei

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) La Regressione Multipla La Regressione Multipla La regressione multipla

Dettagli

0 < a < 1 a > 1. In entrambi i casi la funzione y = log a (x) si può studiare per punti e constatare che essa presenta i seguenti andamenti y

0 < a < 1 a > 1. In entrambi i casi la funzione y = log a (x) si può studiare per punti e constatare che essa presenta i seguenti andamenti y INTRODUZIONE Osserviamo, in primo luogo, che le funzioni logaritmiche sono della forma y = log a () con a costante positiva diversa da (il caso a = è banale per cui non sarà oggetto del nostro studio).

Dettagli

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Tassi di incidenza 9/2/2005

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Tassi di incidenza 9/2/2005 SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Tassi di incidenza 9/2/2005 Ricerca epidemiologica Gli epidemiologi sono interessati a conoscere l incidenza delle malattie per prevedere i

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Indici (Statistiche) che esprimono le caratteristiche di simmetria e Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica

Dettagli

Rapporto dal Questionari Insegnanti

Rapporto dal Questionari Insegnanti Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica

Dettagli

MINIMI QUADRATI. REGRESSIONE LINEARE

MINIMI QUADRATI. REGRESSIONE LINEARE MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione

Dettagli

Matematica e Statistica

Matematica e Statistica Matematica e Statistica Prova d esame (0/07/03) Università di Verona - Laurea in Biotecnologie - A.A. 0/3 Matematica e Statistica Prova di MATEMATICA (0/07/03) Università di Verona - Laurea in Biotecnologie

Dettagli

Slide Cerbara parte1 5. Le distribuzioni teoriche

Slide Cerbara parte1 5. Le distribuzioni teoriche Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo [email protected] A.Studio dell interdipendenza tra variabili: riepilogo Concetto relativo allo studio delle relazioni tra

Dettagli

LEZIONE 7. Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x 3 3 + x2. 2, x3 +2x +3.

LEZIONE 7. Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x 3 3 + x2. 2, x3 +2x +3. 7 LEZIONE 7 Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x 3 3 + x2 2 6x, x3 +2x 2 6x, 3x + x2 2, x3 +2x +3. Le derivate sono rispettivamente,

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano

Dettagli

Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria

Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Christopher N. Sciamanna, Scott P. Novak, Bess H. Marcus. International Journal of

Dettagli

Definisci il Campo di Esistenza ( Dominio) di una funzione reale di variabile reale e, quindi, determinalo per la funzione:

Definisci il Campo di Esistenza ( Dominio) di una funzione reale di variabile reale e, quindi, determinalo per la funzione: Verso l'esame di Stato Definisci il Campo di Esistenza ( Dominio) di una funzione reale di variabile reale e, quindi, determinalo per la funzione: y ln 5 6 7 8 9 0 Rappresenta il campo di esistenza determinato

Dettagli

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza [email protected]. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

LA RETTA. Retta per l'origine, rette orizzontali e verticali

LA RETTA. Retta per l'origine, rette orizzontali e verticali Retta per l'origine, rette orizzontali e verticali LA RETTA Abbiamo visto che l'equazione generica di una retta è del tipo Y = mx + q, dove m ne rappresenta la pendenza e q il punto in cui la retta incrocia

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare.

DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare. Appunti di Statistica DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare. PROCESSO STATISTICO L indagine statistica comprende

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health [email protected]

Dettagli

Relazioni tra variabili

Relazioni tra variabili Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina

Dettagli

VALORE DELLE MERCI SEQUESTRATE

VALORE DELLE MERCI SEQUESTRATE La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune

Dettagli

Analisi delle relazioni tra due caratteri

Analisi delle relazioni tra due caratteri Analisi delle relazioni tra due caratteri Le misure di connessione misurano il grado di associazione tra due caratteri qualsiasi sotto il profilo statistico (e non causale in quanto non è compito della

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

lezione 18 AA 2015-2016 Paolo Brunori

lezione 18 AA 2015-2016 Paolo Brunori AA 2015-2016 Paolo Brunori Previsioni - spesso come economisti siamo interessati a prevedere quale sarà il valore di una certa variabile nel futuro - quando osserviamo una variabile nel tempo possiamo

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

Limited Dependent Variable Models

Limited Dependent Variable Models Limited Dependent Variable Models Logit Tobit Probit Modelli Logit e Probit Latent variable models for binary choice Models for descrete dependent variable Traducendo Spesso vogliamo studiare (le determinanti

Dettagli

2. Leggi finanziarie di capitalizzazione

2. Leggi finanziarie di capitalizzazione 2. Leggi finanziarie di capitalizzazione Si chiama legge finanziaria di capitalizzazione una funzione atta a definire il montante M(t accumulato al tempo generico t da un capitale C: M(t = F(C, t C t M

Dettagli

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Indici di Affidabilità L Attendibilità È il livello in cui una misura è libera da errore di misura È la proporzione di variabilità della misurazione

Dettagli

FONDAMENTI DI PSICOMETRIA - 8 CFU

FONDAMENTI DI PSICOMETRIA - 8 CFU Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso

Dettagli