Relazione tra le variabili: regressione lineare e coefficienti di correlazione

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Relazione tra le variabili: regressione lineare e coefficienti di correlazione"

Transcript

1 Relazione tra le variabili: regressione lineare e coefficienti di correlazione 1

2 Indice Stima della relazione tra le variabili di un campione Migliore retta che può essere tracciata a partire dai dati Errori standard dei coefficienti di regressione IC retta di regressione IC per singola osservazione Confronto di due rette di regressione test globale Correlazione e coefficienti di correlazione Coefficiente dei ranghi di Spearman Metodo di Bland-Altman per il confronto tra due misure diverse di una grandezza

3 Obiettivo 1. Stimare in quale misura una variabile MEDIAMENTE cresce/decresce al variare di un altra variabile RETTA DI REGRESSIONE Procedimento parametrico I campioni sono tratti da popolazioni caratterizzate da una risposta media che varia in modo continuo al variare dell entità del trattamento (test precedenti: valutare l efficacia di un trattamento discreto). Quantificare la FORZA dell associazione tra due variabili COEFFICIENTE DI CORRELAZIONE 3

4 Statura / Peso Tutta la popolazione (00 us) è accessibile all osservazione, misuriamo: variabile dipendente peso (kg) OSSERVAZIONI: pesof(statura) Statura (cm) yf(x) Statura ~ N(40,5) Peso ~ N(1,.5) 1. Il peso cresce LINEARMENTE con l altezza. Non si può predire il peso di una singola us essendo nota l altezza perché c è VARIABILITA yx 1 nei pesi di us con uguale statura variabile indipendente 4 DS dei pesi di us FISSATA certa statura

5 Variabile dipendente/indipendente 1 CASO, associazione tra variabili: Osservare la variabile indipendente e Predire la variabile dipendente CASO, legame casuale: Agire sulla variabile indipendente e Stimare, anche se con incertezza, la variabile dipendente (esperimenti controllati) 5

6 La retta delle medie Fissato x, calcolo la MEDIA di tutti i possibili valori di y, µ y.x Queste medie si dispongono lungo una linea retta di eq: µ y.x + x nel nostro caso intercetta coefficiente angolare il peso medio aumenta di 0.5Kg quando la statura aumenta di 1cm: µ y.x 8Kg + (0.5Kg/ cm)x Esiste una VARIABILITA intorno alla retta delle medie: y 1Kg.x y.x valuta quanto la RETTA delle MEDIE sia utile a predire i valori della variabile dipendente 6

7 La retta delle medie peso (kg) µ y.x + x Statura (cm) µ y.x 8Kg + (0.5Kg/ cm)x Esiste una VARIABILITA intorno alla retta delle medie: y.x 1Kg 7

8 Ipotesi per la retta di regressione La media della popolazione della variabile DIPENDENTE corrispondente ad un certo valore della variabile indipendente CRESCE/DECRESCE linearmente al crescere della variabile indipendente Fissato un valore della variabile INDIPENDENTE, i possibili valori della variabile dipendente si distribuiscono NORMALMENTE La deviazione standard della popolazione della variabile dipendente intorno alla sua media NON VARIA al variare della variabile indipendente 8

9 Statura / Peso Ho accesso solo a 10 campioni dell intera popolazione: peso (kg) Statura (cm) Il peso aumenta all aumentare della statura Problema: Il campione è significativo di ciò che accade nella popolazione? Risoluzione: Stimare i parametri della popolazione: (intercetta) e (coeff. angolare) della retta delle medie 9

10 Retta di regressione per statura / peso peso (kg) I: non passa tra i dati I II III II: passa tra i dati, IV ma ha coefficiente angolare più elevato Statura (cm) III e IV: ok! Qual è la migliore? Migliore è quella retta che rende minima la variabilità totale tra i dati osservati e la retta stessa si misura con la varianza o DS Metodo dei minimi quadrati: La somma dei quadrati degli scarti tra i valori della variabile dipendente osservati e quelli individuati dalla retta deve essere MINIMA 10

11 Retta dei minimi quadrati L equazione della retta detta RETTA DI REGRESSIONE è: ŷ a + bx l intercetta (a) e il coefficiente angolare (b) sono: a ( Y)( n( X X ) ( ) ( X)( X) XY) dove X e Y sono le coordinate dei punti b n( n( XY) ( X ) ( X)( X) Y) 11

12 s X 5cm Statura / Peso s Y.4Kg Statura osserv.(cm) TOT369 Peso osserv.(kg) TOT103.8 X (cm ) XY(Kg.cm) X XY (103.8kg)(13841cm 10(13841cm ) (369cm)(3930.1Kg a 10(3930.1Kg 10(13841cm ) (369cm) cm) (369cm)(103.8Kg) b ) (369cm) La retta di regressione: cm) 0.44Kg ŷ 6Kg + 6Kg cm stima di stima di (0.44Kg/ cm) x 1

13 Stima della variabilità della popolazione y.x Si calcola la radice quadrata degli scarti tra i dati e la retta di regressione: s y x [ ] Y Ŷ [ Y (a bx) ] n n 1 (s Y b s X ) n n Per rendere più piccolo il denominatore e compensare la tendenza alla sottostima della variabilità della popolazione Nell ES: s X 5cm s Y.4Kg 9 sy X ( ) 0.96Kg 8 è una stima della variabilità della popolazione y.x 1Kg 13

14 Errori standard dei coefficienti a, b Al variare dei campioni, VARIA la retta di regressione ovvero variano i coefficienti a e b Le distribuzioni di tutti i possibili valori a (rispettivamente b) hanno MEDIA (rispettivamente ), e DS (rispettivamente ) e si distribuiscono normalmente e sono utilizzati per la verifica delle ipotesi e per il calcolo di IC relativamente ai coefficienti di regressione e alla stessa retta deviazione standard dell intercetta deviazione standard del coefficiente angolare PROBLEMA: come si stimano? 14

15 Errori standard dei coefficienti a, b Dai campioni si stima la deviazione standard di tutti i possibili valori assunti dall intercetta: s a s y x 1 n + (n X 1)s X e la deviazione standard di tutti i possibili coefficienti angolari: s b 1 n 1 s y x s X ES: 1 (36.9cm) s (0.96Kg) + 10 (10 1)(5cm) a Kg s b 0.06Kg/cm cm.4Kg 15

16 Verifica di ipotesi Verificare che il COEFFICIENTE ANGOLARE0 equivale stimare la probabilità di osservare una relazione di forza uguale o maggiore a quella mostrata dai dati sotto ipotesi che NON C E RELAZIONE LINEARE tra la variabile indipendente e dipendente H 0 : non c è relazione lineare tra la variabile indipendente e dipendente t-test: test: t stima del parametro - valore reale del parame.nella popol. errore standard della stima del parametro Affinchè non esista relazione lineare: 0 t b s b b Questo t-empirico si confronta col t-teorico a n- GL che individua nella distribuzione i valori corrispondenti al 100% di errore nel caso di assenza di relazione 16 s b

17 Esempio: statura / peso Abbiamo calcolato b0.44kg/cm e s b 0.06Kg/cm 0.44 t Fissato 0.1%, t poichè 10-8 t > t c Conclusione: RIFIUTO H 0, ovvero questo campione è estratto da una popolazione nella quale vi è una relazione lineare tra variabile indipendente e dipendente 17

18 Esempio: statura / peso con IC Utilizzando la definizione di t, si definisce IC al 100(1-)% per il COEFFICIENTE ANGOLARE della retta delle medie: b t sb < < b + ts b Nell ES: essendo t , poichè 10-8, IC al 95% è: Kg/ cm < < < < Kg/ cm Conclusione: 0.06 Questo IC contiene il valore reale 0.5Kg/cm 0IC RIFIUTO H 0, ovvero questo campione è estratto da una popolazione nella quale vi è una relazione lineare tra variabile indipendente e dipendente 18

19 Analogamente per l INTERCETTA con la relazione: t-test: test: t Verifica di ipotesi e IC stima del parametro - valore reale del parame.nella popol. errore standard della stima del parametro a che segue la distribuzione normale con n- GL e IC è: Nell ES: 6.0 a t.306 sa < < a + ts a essendo t , poichè 10-8, IC al 95% è:.4 < < ,5 < < -0,5 Conclusione:.4 s a Questo IC contiene il valore reale -8Kg 0IC RIFIUTO H 0 19

20 IC per la retta di regressione Il grado di incertezza nella stima di COEFFICIENTE ANGOLARE e INTERCETTA della retta delle medie è quantificata da: s a.4kg, s b 0.06Kg peso (kg) La retta delle medie può trovarsi sopra/sotto la retta di regressione, oppure avere un coefficiente angolare leggermente diverso: in ogni caso si trova in un INTERVALLO che INCLUDE la Retta di Regressione Statura (cm) La regione è più ampia agli estremi perché la retta di regressione deve essere tracciata in linea retta e passare per la media delle due variabili 0

21 IC per la retta di regressione Fissata la variabile indipendente esiste la distribuzione di tutti i possibili valori della retta di regressione. E una distribuzione normale ERRORE STANDARD della RETTA DI REGRESSIONE (dipende dalla variabile indipendente) s ŷ s y x 1 n (x + (n X) 1)s E una distribuzione normale IC al 100(1-)%: ŷ t dove t ha n- GL e X s < y < ŷ + t s ŷ ŷ ŷ a + bx 1

22 ATTENZIONE! Errore frequente IC retta regressione IC della popolazione E analogo a quando per descrivere la VARIABILITA della popolazione si utilizza l ERRORE STANDARD DELLA MEDIA anzicchè la DEVIAZIONE STANDARD peso (kg) Statura (cm) IC retta di regressione: al 95% il peso medio per un altezza di 40cm è compreso in [11,1.5] NON è vero che al 95% il peso di ciascuna us con altezza 40cm è compreso in [11,1.5]

23 IC per una nuova osservazione COSA OCCORRE: Variabilità derivante dalla dispersione della popolazione intorno alla RETTA delle MEDIE, Variabilità derivante dall incertezza sulla posizione della retta delle medie, s ŷ La deviazione del valore predetto di una nuova osservazione è: 1 (x X) IC al 100(1-)%: sy sy x + s s ŷ y x 1 + nuovo n (n 1)s s ŷ s y x 1 n (x + (n X) 1)s X X ŷ t s y x sy < y < ŷ + t s nuovo Y nuovo A COSA SERVE? E l IC da usare quando si stima un nuovo valore della v.d. a partire dalla v.i. con una confidenza del 95% che il range 3 includa il valore reale

24 Confronto tra due rette di regressione TIPI DI TEST: 1. per cercare una differenza dei coefficienti angolari. per cercare una differenza delle intercette 3. test globale di coincidenza nel quale si chiede se le rette sono diverse i coefficienti angolari e le intercette seguono la distribuzione t 4

25 Confronto per i coefficienti angolari Ipotesi: i due campioni sono tratti da popolazioni con uguale coefficiente angolare della retta delle medie t-test: test: t differenza tra i coefficienti angolari errore standard della differenza tra i coefficienti angolari b 1 s b b 1 b dove s s + s b1 b b1 b (n n 1 n n 1 n (n s y x p 1 s y x p 1)s 1 x 1 + )s n y x 1 (n s y x p 1)s x + (n )s 1 + n 4 Si confronta questo valore con t c per n 1 +n -4 GL y x Ipotesi: i due campioni sono tratti da popolazioni con uguali intercette della retta delle medie t-test: test: t a 1 s a a 1 a con s s + s a1 a a1 a 5

26 Test globale Significato di metodo dei minimi quadrati Capire se approssimare i dati con DUE rette di regressione diverse produce RESIDUI minori rispetto all approssimazione con UNA sola retta METODO: 1. adattare ciascun insieme di dati ad una propria retta di regressione. calcolare la variabilità globale, s y x p, intorno a due rette di regressione differenti 3. adattare tutti i dati ad un unica retta di regressione e calcolare la variabilità globale, s, y x c COMUNE intorno ad essa 6

27 METODO: s Test globale 4. calcolare il miglioramento : y x migl (n 1 + n )s y x c (n 1 + n 4)s y x p Riduzione della somma totale dei quadrati delle differenze tra le osservazioni e la retta di regressione res SS c resp sotto l ipotesi che le due rette abbiano coefficienti ed intercette differenti con SS res somme dei quadrati dei residui intorno alle rette di regressione 5. quantificare i miglioramenti utilizzando il test s y x statistico F: migl F s y x 6. confrontare p F-empirico con F-teorico per n e d n 1 +n -4 GL 7. F>F c approssimazione migliore con DUE rette RIFIUTO H 0 ovvero i due insiemi di dati sono tratti da popolazioni con rette delle medie differenti SS 7

28 Esempio: relazione tra debolezza e riduzione massa muscolare in artrite reumatoide POBLEMA: La riduzione della forza con cui i pazienti affetti da artrite riescono a stringere oggetti fosse dovuto alle articolazioni artritiche o semplicemente fosse un riflesso della riduzione della massa muscolare. Forza di presa (N) senza artrite 400 con artrite Area della sezione trasversa del muscolo (cm ) Tesi: C è una relazione tra l area della sezione trasversa del muscolo e le diverse forze di presa per individui normali e quelli affetti da artrite? 8

29 Esempio: relazione tra debolezza e riduzione massa muscolare in artrite reumatoide Ampiezza del campione Intercetta a, (s a ) (N) Coefficiente angolare b, (s b ) (N/cm ) Errore standard della stima (N) Dati: Senza artrite (5.3) (00.789) 45.7 Con artrite (.4).41 (0.70) 40.5 Totale (50.5) 6.39(1.579) 19.1 Calcolo la stima combinata della varianza (n 1 )s n y x 1 + n + (n 4 )s y x (5 )45.7 (5 ) sy x p 1864N Approssimiamo tutti i dati ad una sola retta di regressione s y x migl (n 1 + n )s y x c (n 1 + n 4)s y x p (5 + 5 )16667 (5 + 5 ) N 9

30 Esempio: relazione tra debolezza e riduzione massa muscolare in artrite reumatoide Test F: s y x F sy x migl p Fissato 1%, F poichè n e d F < F c Conclusione: La relazione tra forza di presa e area della sezione trasversale è diversa per persone con e senza artrite Cosa determina la differenza? Cosa determina la differenza? Sono diverse le intercette o i coefficienti angolari? 30

31 Esempio: relazione tra debolezza e riduzione massa muscolare in artrite reumatoide Intercette: sa a sa sa (5.3) (.4) senza con senza con 33.8N t a s senza a a senza a con con ( 7.3) Fissato 5%, t poichè n 1 +n -446 t < t c le intercette NON sono significativamente differenti Coefficiente angolare: t Fissato 5%, t poichè 46 t > t c i coefficienti angolari sono significativamente differenti Conclusione: L aumento della forza di presa è minore nelle persone con artrite rispetto a quelle senza. 31

32 REGRESSIONE: Correlazione stima di come la v.d. varia al variare della v.i. stima della variabilità delle medie della v.d. intorno alla retta Quando due variabili pur variando CONGIUNTAMENTE non sono tali da individuare la v.d. e v.i. si cerca solo di descrivere LA FORZA della RELAZIONE tra le due variabili: COEFFICIENTE di CORRELAZIONE (CC) [-1,1] Pearson per variabili distribuite normalmente Spearman per variabili misurate su scala ordinale Stretta relazionecc1 Debole relazionecc 0 3

33 OSSERVAZIONE: Coefficiente di Pearson Invertendo il ruolo della v.i. con quello della v.d. si ottengono rette di regressione differenti (cambiano il coefficiente angolare e l intercetta). E necessario un indicatore indipendente da questa scelta: coefficiente di Pearson (X X)(Y Y) r (X X) (Y Y) SIGNIFICATO: Indica la FORZA dell associazione tra le due variabili r+1 le due variabili variano nello stesso senso r+1 le due variabili variano in senso opposto (una cresce, l altra decresce) 33

34 Coefficiente di Pearson (CP) r+1 r-1 r+0.8 r0 34

35 Stat.osserv. (cm) TOT369 Peso osserv. (Kg) TOT103.8 Statura / Peso X X (cm) TOT0 Y Y ( X )( ) (Kg) TOT0 ( ) X Y Y cmkg TOT99.9 ( ) X X Y Y cm TOT4.9 Kg TOT51.8 r 99.9Kg 4.9cm cm 51.8Kg 0.95 numero puro 35

36 r Regressione e correlazione 1. Legame con il significato di retta di regressione: Per definizione, la retta di regressione è quella che rende minima la somma dei quadrati degli scarti tra i punti sulla retta di regressione e il valore della v.d. in corrispondenza di ogni valore della v.i. osservato. Quindi si può definire 1 somma dei quadrati degli scarti dalla retta di regr. somma dei quadrati degli scarti dalla media SS res 0 r±1 la v.d. può essere definita senza incertezza dalla v.i. SS res SS tot r0 la v.d. NON può essere definita senza incertezza dalla v.i. (non esiste trend tra i dati) 1 36 SS SS res tot

37 Regressione e correlazione 1.1 Legame con il significato di retta di regressione: Calcolo il quadrato r DETERMINAZIONE Significato: 1 SS SS è il COEFFICIENTE di fornisce indicazione su quanto una retta sia adatta a descrivere la relazione tra le due variabili res tot 37

38 Regressione e correlazione. Legame con i risultati dell analisi di regressione: r Riprendendo le definizioni estese di SS res e SS tot 1 n n 1 s y x s y Maggiore è r, maggiore è la precisione con cui si può predire la v.d. dalla v.i. IC è più completo nella misura dell incertezza nella previsione di un fenomeno clinico 3. Legame con il coefficiente angolare della retta di regressione: s r b s X Y Quando la DS dei residui intorno alla retta di regresione s y x diminuisce diminuisce la variabilità totale della v.d. misurata da s s y y.x diminuisce r aumenta s y per la verifica delle ipotesi r0 (coeff. angolare retta di regressione0) 38

39 Verifica di ipotesi e correlazione t-test: test: t (1 r r con n- GL )/(n ) Questa formula deriva dall espressione del t-test per b coefficienti angolari, t Dimostrazione: n sy x r 1 s n 1 s Y y x n n s b 1 (1 r ) sy s b 1 s n 1 s s b y x x s s Y X 1 r n Ricordando che s b r s Y X sostituiamo in t b s b t r(s / s ) Y X c.v.d. (sy / sx ) (1 r )/(n ) (1 r )/(n ) r 39

40 Esempio: grassi nella dieta e tumore alla mammella PROBLEMA: La dieta influisce sull insorgenza di alcuni tumori (cancro alla mammella) in animali da esperimento. Per verificare un analoga tendenza nell uomo, sono stati raccolti dati relativi al tasso di mortalità per tumore alla mammella in funzione di ingestione quotidiana di GRASSI ANIMALI e VEGETALI in 39 nazioni. r+0.90 r

41 Esempio: grassi nella dieta e tumore alla mammella H 0 : Non c è relazione lineare tra tasso di mortalità per cancro e grassi alimentari animali t-test: test: t 1 (1 r r )/(n ) (1 0.90) /(39 ) Fissato 0.1%, t poichè 39-7 t > t c RIFIUTO H 0 ovvero c è correlazione tra grassi animali e cancro. H 0 : Non c è relazione lineare tra tasso di mortalità per cancro e grassi alimentari vegetali. 41

42 Esempio: grassi nella dieta e tumore alla mammella 0.14 t-test: test: t 0. 9 (1 r r )/(n ) (1 0.15) /(39 ) Fissato 0.1%, t poichè 39-7 t < t c ACCETTO H 0 ovvero non c è correlazione tra grassi animali e cancro. Conclusione: I grassi animali contribuiscono ad aumentare la probabilità di tumore alla mammella rispetto ai grassi vegetali. Ciò prova che un alimentazione ricca di grassi animali è causa del cancro? NO!!!! 4

43 Esempio: grassi nella dieta e tumore alla mammella Spiegazione: Il ricercatore non aveva modo di modificare le diete delle donne osservate studio di tipo osservazionale e non sperimentale CASI: AGIRE sulla v.i. e OSSERVARE come si modifica la v.d. OSSERVARE la contemporanea variazione delle variabili Trarre conclusioni su quanto tali MODIFICAZIONI nella v.d. sono CAUSATE da quelle verificatesi nella v.i. Si può definire solo un ASSOCIAZIONE tra le variabili evidenziata dalla loro contemporanea modifica 43

44 Coefficiente di Spearman IPOTESI per l applicazione del coefficiente di PEARSON: Dati con distribuzione gaussiana su scala ad intervalli Campione tratto da popolazione nella quale le variabili hanno entrambe una distribuzione normale Le due variabili devono essere legate da relazione lineare se queste ipotesi NON sono soddisfatte: COEFFICIENTE di CORRELAZIONE dei RANGHI di SPEARMAN Cos è? 44

45 Coefficiente di Spearman Indicatore NON PARAMETRICO dell associazione tra due variabili a partire dai RANGHI piuttosto che dai valori delle osservazioni. DEF: COME UTILIZZARLO? 1. Si ordinano i valori delle Numero variabili d ordine indi un modo valore in una serie crescente/decrescente ordinata di valori (ordine di arrivo di una corsa). Si assegna il rango (1, n). A valori uguali si assegna la media dei ranghi che sarebbero stati loro assegnati se fosse stato possibile distinguerli 3. Si calcola il coefficiente di correlazione 6d 1 n n r 3 dove d è la differenza tra i due ranghi corrispondenti a ciascuna osservazione 4. Fissato il valore di significatività, se r > r c le osservazioni sono compatibili con l ipotesi che non esiste associazione tra le variabili. 45

46 Pearson OK! RANGO statura Statura / Peso Stat.osserv. (cm) Peso osserv. (Kg) RANGO peso Differenza Ranghi (d) TOT369 TOT [( 1 ) + ( 1 ) ( 0.5 r ) Fissato 0.1%, r poichè n10 r > r c esiste un associazione tra peso e statura con una significatività dello 0.1%

47 Esempio: esami di laboratorio e qualità dell assistenza PROBLEMA: Il medico che fa largo uso di esami di laboratorio è un medico attento e meticoloso oppure uno che spreca il denaro del paziente? Medico migliore rango 1 Medico peggiore rango 1 (totale medici1) Costo più basso di esami rango 1 Costo più alto di esami rango 1 r-0.13 Fissato 5%, r poichè n1 r > r c non c è relazione tra competenza del medico e denaro speso per esami di laboratorio 47

48 Esempio: esami di laboratorio e qualità dell assistenza Osserviamo meglio il grafico: dati grezzi I medici meno capaci si trovano agli estremi dello spettro dei costi: richiedono molti/meno esami dei medici migliori c è RELAZIONE!!!!! Dov è l ERRORE? La curva ha forma ad U analisi della correlazione non può essere in grado di individuare l associazione! Pearson e Spearman si utilizzano quando l ASSOCIAZIONE tra le due variabili è crescente o decrescente 48

49 Potenza per regressione e correlazione Verificare che significativamente il coeff. angolare 0 coeff. di correlazione 0 Trasformiamo il coefficiente di correlazione: Z 1 1 ln 1 + r r distribuita normalmente con Z n 1 3 z Z ~N(0,1) z 49

50 PROBLEMA: Esempio Calcolare la POTENZA di un analisi di regressione per trovare una correlazione di 0.9 con un livello di confidenza del 95%, utilizzando un campione di 10 osservazioni. Risoluzione: Z ln ln 1.47 e Z n 3 Fissato 5%, z poichè n. 50

51 Potenza per regressione e correlazione H 0 VERA (non c è correlazione) H 0 FALSA (c è correlazione) La POTENZA del test è l area sottesa alla distribuzione di z a destra del valore critico z necessario per concludere che la correlazione è significativamente diversa da zero. La POTENZA è l area sotto la distribuzione reale della statistica z oltre z Z Se 0.9 la distribuzione di z sarà centrata su: z z valore inferiore al Ma Z z z POTENZA97% valore centrale della distribuzione Z 51

52 Esempio La potenza di un analisi della correlazione di 0.9 con livello di confidenza del 95% e ampiezza campionaria 10 è pari al 97% Grandezza campionaria per la retta di regressione e correlazione La grandezza campionaria necessaria per ottenere una correlazione prefissata con una potenza prefissata a un prefissato livello di confidenza è data da : n z z Z

53 Confronto tra due misure diverse della STESSA grandezza OBIETTIVO: Confrontare due modi diversi di misurare la stessa grandezza quando entrambi sono imprecisi (tecniche meno invasive ma altrettanto precise come le tradizionali?) OSSERVAZIONE 1. Confronto di due misure cliniche (non esistono valori standard di riferimento) Problema della taratura di laboratorio nel quale si confrontano valori misurati con valori standard 53

54 Confronto tra due misure diverse della grandezza OSSERVAZIONE. Confronto di due misure cliniche SOTTOINTENDE una relazione fra le due misure non ha senso verificare l ipotesi nulla che non ci sia relazione utilizzando l analisi di correlazione OSSERVAZIONE 3. La correlazione dipende dalla variabilità dei dati: più variano le osservazioni più alta sarà la correlazione non ha senso usare la correlazione per il confronto tra due misure diverse della grandezza 54

55 Metodo di Bland e Altman La DIFFERENZA è la misura più diretta della NON CONCORDANZA fra due osservazioni 1. Si calcola la differenza fra tutte le coppie di osservazioni.. Della differenza si calcola Media Deviazione Standard misura la DISTORSIONE fra le due osservazioni misura la VARIABILTA fra le due osservazioni 55

56 Metodo di Bland e Altman 3. La media delle due osservazioni (che sono ugualmente buone/cattive) è la MIGLIORE stima del valore vero della variabile 4. Rappresentare in un grafico differenzaf(media) in modo da evidenziare eventuali differenze sistematiche fra le due tecniche di misurazione 56

57 Esempio: valutazione del rigurgito mitralico mediante ecocardiografia PROBLEMA: Funzionamento della circolazione sanguigna! La valvola mitralica impedisce al sangue di rifluire nei polmoni quando la parte sinistra del cuore si contrae per spingere il sangue verso il corpo. Se la valvola è mal funzionante si verifica il rigurgito mitralico. La quantità di rigurgito si calcola con: fraz. di rigurgito flux mitralico(parte sinistra cuore) - flux aortico(verso il corpo) flux mitralico Valvola funzionante flux mitralico flux aortico fraz. rigurgito 0 Valvola NON funzionante fraz. rigurgito ~ 1 57

58 Esempio: valutazione del rigurgito mitralico mediante ecocardiografia I due metodi per la valutazione del rigurgito mitralico: 1. cateterizzazione cardiaca. ecocardiografia doppler Osservazioni Dati Doppler Cateterizzaz. Differenza Media

59 Dati continuazione Osservazioni Doppler Cateterizzaz Differenza Media Media della differenza-0.03! Non c è differenza sistematica fra i due diversi metodi DS della differenza ! È piccola se confrontata con i livelli di rigurgito osservati

60 Esempio: valutazione del rigurgito mitralico mediante ecocardiografia Fraz.rigurgito Doppler 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 0-0,1 0 0,1 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Fraz.rigurgito cateterismo r0.89 e dimostra concordanza tra i metodi Differenza misure CONCLUSIONE: L ecocardiografia Doppler produce una misura del rigurgito mitralico altrettanto corretta del più invasivo metodo della cateterizzazione cardiaca 0,3 0,1-0,1-0,3 Media+DS Media-DS 0 0, 0,4 0,6 0,8 1 Media misure Doppler/Catet. 60 Media ICMedia±DS dà misura del grado di disaccordo tra i due metodi

61 Conclusione Metodi per QUANTIFICARE le relazioni tra due variabili. Approccio analogo ai metodi precedenti: descrizione della popolazione con riferimento alla determinazione dei parametri caratteristici sviluppo dei metodi per la valutazione di tali parametri e loro errori standard in uno o più campioni. ATTENZIONE: Regressione SI ma solo quando la relazione attesa tra i dati è lineare (curva ad U ), in modo che le ipotesi alla base del metodo statistico siano 61 soddisfatte dai dati osservati.

62 Percentili della distribuzione normale standardizzata Es: Se si vuole ottenere una potenza dell 80% si trova z z

63 Tabella t-test 63

64 Tabella F-test 64

65 Tabella F-test 65

66 Tabella F-test 66

67 Tabella Spearman 67

68 Percentili della distribuzione normale standardizzata Es: Se si vuole ottenere una potenza dell 80% si trova z z

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI. Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

ISTOGRAMMI E DISTRIBUZIONI:

ISTOGRAMMI E DISTRIBUZIONI: ISTOGRAMMI E DISTRIBUZIONI: i 3 4 5 6 7 8 9 0 i 0. 8.5 3 0 9.5 7 9.8 8.6 8. bin (=.) 5-7. 7.-9.4 n k 3 n k 6 5 n=0 =. 9.4-.6 5 4.6-3.8 3 Numero di misure nell intervallo 0 0 4 6 8 0 4 6 8 30 ISTOGRAMMI

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

CAPITOLO 11 ANALISI DI REGRESSIONE

CAPITOLO 11 ANALISI DI REGRESSIONE VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire

Dettagli

Prefazione. Presentazione dell edizione italiana

Prefazione. Presentazione dell edizione italiana Glantz_2007.book Page VII Monday, February 5, 2007 12:53 PM Indice Prefazione Presentazione dell edizione italiana XV XIX Capitolo 1 Biostatistica e pratica clinica 1 Medicina scientifica 1 Cosa rivelano

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

METODO DEI MINIMI QUADRATI

METODO DEI MINIMI QUADRATI METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità

Dettagli

Esercitazione: La distribuzione NORMALE

Esercitazione: La distribuzione NORMALE Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle

Dettagli

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi: DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme

Dettagli

TEST NON PARAMETRICO DI MANN-WHITNEY

TEST NON PARAMETRICO DI MANN-WHITNEY TEST NON PARAMETRICO DI MANN-WHITNEY Questo test viene può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice

Dettagli

Statistica4-29/09/2015

Statistica4-29/09/2015 Statistica4-29/09/2015 Raccogliere i dati con il maggior numero di cifre significative ed arrotondare eventualmente solo al momento dei calcoli (min. 3); nella grande maggioranza delle ricerche biologiche

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Concetti principale della lezione precedente

Concetti principale della lezione precedente Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale

Dettagli

standardizzazione dei punteggi di un test

standardizzazione dei punteggi di un test DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la

Dettagli

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Teoria e tecniche dei test

Teoria e tecniche dei test Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

Applicazioni statistiche e utilizzo del package statistico Spss - 7

Applicazioni statistiche e utilizzo del package statistico Spss - 7 Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno

Dettagli

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

Test d Ipotesi Introduzione

Test d Ipotesi Introduzione Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

GENETICA QUANTITATIVA

GENETICA QUANTITATIVA GENETICA QUANTITATIVA Caratteri quantitativi e qualitativi I caratteri discontinui o qualitativi esibiscono un numero ridotto di fenotipi e mostrano una relazione genotipo-fenotipo semplice I caratteri

Dettagli

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Test di ipotesi su due campioni

Test di ipotesi su due campioni 2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:

Dettagli

Seconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016

Seconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016 Domande relative alla specializzazione in: Statistica sanitaria e Biometria Scenario 1: In uno studio prospettivo condotto per valutare la relazione tra l'uso di estrogeni e rischio di cancro alla mammella,

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Capitolo 3 Sintesi e descrizione dei dati quantitativi Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità

Dettagli

Premessa: la dipendenza in media

Premessa: la dipendenza in media Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densità), si può far ricorso nell analisi statistica alla

Dettagli

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione Consentono di descrivere la variabilità all interno della distribuzione di requenza tramite un unico valore che ne sintetizza le caratteristiche CAMPO DI VARIAZIONE DIFFERENZA INTERQUARTILE SCOSTAMENTO

Dettagli

MISURE DI DISPERSIONE

MISURE DI DISPERSIONE MISURE DI DISPERSIONE 78 MISURE DI DISPERSIONE Un insieme di dati numerici può essere sintetizzato da alcuni valori tipici, che indicano il grado di variabilità dei dati stessi. Grado di Variabilità o

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

ANALISI MULTIVARIATA

ANALISI MULTIVARIATA ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la

Dettagli

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Analisi degli Errori di Misura. 08/04/2009 G.Sirri Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

Statistica Un Esempio

Statistica Un Esempio Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Test per la correlazione lineare

Test per la correlazione lineare 10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Analisi della varianza

Analisi della varianza 1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della

Dettagli

Statistica descrittiva II

Statistica descrittiva II Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni

Dettagli

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica. Matematica con Elementi di Statistica a.a. 2015/16 Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Significatività ed analisi degli errori

Significatività ed analisi degli errori Significatività ed analisi degli errori Quanto il valore sperimentale è vicino al valore vero? Campioni replicati: si esclude a priori che venga eseguita una sola misurazione Quanto il valore sperimentale

Dettagli

Misure di dispersione (o di variabilità)

Misure di dispersione (o di variabilità) 14/1/01 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x = 9 range=31-7=4 x = 9 range=50-9=41

Dettagli

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n

Dettagli

Risoluzione di problemi ingegneristici con Excel

Risoluzione di problemi ingegneristici con Excel Risoluzione di problemi ingegneristici con Excel Problemi Ingegneristici Calcolare per via numerica le radici di un equazione Trovare l equazione che lega un set di dati ottenuti empiricamente (fitting

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2 Statistica N. Crediti: Cognome: Laurea Triennale in Biologia Nome: 4 settembre 2012 Matricola: 1. Parte A 1.1. Siano x 1, x 2,..., x 10 i dati relativi al peso di 10 neonati espressi in chilogrammi e y

Dettagli

MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013

MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013 MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013 Soluzioni 1. Due sperimentatori hanno rilevato rispettivamente 25 e 5 misure di una certa grandezza lineare e calcolato le medie che sono risultate

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Esercizio 1 Efficacia di un disinfettante I dati della Tabella 1 mostrano i conteggi relativi alla presenza o meno

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Lezione 4 a - Misure di dispersione o di variabilità

Lezione 4 a - Misure di dispersione o di variabilità Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono

Dettagli

STATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a

STATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a STATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a VARIABILI CASUALI VARIABILE Qualunque fenomeno espri mibile numericamente

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

ESERCIZI DI RIEPILOGO 1

ESERCIZI DI RIEPILOGO 1 ESERCIZI DI RIEPILOGO 1 ESERCIZIO 1 La tabella seguente contiene la distribuzione di frequenza della variabile X = età (misurata in anni) per un campione casuale di bambini: x i 4.6 8 3.2 3 5.4 6 2.6 2

Dettagli

Proprietà della varianza

Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione

Dettagli

FENOMENI CASUALI. fenomeni casuali

FENOMENI CASUALI. fenomeni casuali PROBABILITÀ 94 FENOMENI CASUALI La probabilità si occupa di fenomeni casuali fenomeni di cui, a priori, non si sa quale esito si verificherà. Esempio Lancio di una moneta Testa o Croce? 95 DEFINIZIONI

Dettagli

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta): ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva

Dettagli